相関係数とは?わかりやすく解説します

相関係数(correlation coefficient)は、2つの変数の関係の強さと方向を示す指標です。特に、最も一般的に使われるピアソンの相関係数(Pearson’s correlation coefficient)は、-1 から 1 の範囲を取り、以下のような意味を持ちます。

  • 1:完全な正の相関(片方が増えるともう片方も増える)
  • 0:相関なし(変数間に線形関係がない)
  • -1:完全な負の相関(片方が増えるともう片方が減る)

ピアソンの相関係数の計算式

ピアソンの相関係数 rは、以下の式で計算されます。

ここで:

  • xiおよび は、yiそれぞれの変数のデータ点
  • xおよびy は、それぞれの変数の平均値

この式は、共分散を標準偏差で割ったものと考えることもできます。


相関係数の解釈

相関係数の値によって、以下のように解釈されます。

相関係数関係の強さ
0.7 ~ 1.0強い正の相関
0.3 ~ 0.7中程度の正の相関
0.0 ~ 0.3弱い正の相関
-0.3 ~ 0.0弱い負の相関
-0.7 ~ -0.3中程度の負の相関
-1.0 ~ -0.7強い負の相関

ただし、相関が高いからといって因果関係があるとは限りません。


スピアマンの順位相関係数

ピアソンの相関係数は線形関係を測定しますが、非線形関係がある場合にはスピアマンの順位相関係数(Spearman’s rank correlation coefficient)を使うこともあります。

スピアマンの相関係数 は、各データの順位に対するピアソンの相関係数として計算され、以下の式を用います。

ここで:

  • diは対応するデータ点の順位の差
  • nはデータ点の数

まとめ

  • 相関係数 は2つの変数の関係の強さと方向を示す指標。
  • ピアソンの相関係数 は線形関係の強さを測る。
  • スピアマンの順位相関係数 は非線形関係にも対応可能。
  • 相関が高くても因果関係があるとは限らない ため、解釈には注意が必要。

統計分析を行う際には、適切な相関係数を選択し、データの関係を正しく理解することが重要です。

上部へスクロール