【データサイエンティスト検定】ピアソンの積率相関とスピアマンの順位相関の違いをやさしく解説

相関係数を勉強していると、必ず出てくるのが

  • ピアソンの積率相関係数
  • スピアマンの順位相関係数

という2つの指標です。

教科書では
「ピアソンは線形」「スピアマンは順位」
と書かれていますが、それだけでは正直わかりにくい

そこでこの記事では、
具体的なデータ例を使いながら
この2つの違いを説明します。


1. 相関係数とは「一緒に動いているか」を見る指標

まず前提として、相関係数は

2つの数値が、同じ方向に動いているかどうか

を表します。

具体例①:勉強時間とテスト得点

勉強時間(時間)得点
140
250
360
470
580

勉強時間が増えると、得点も増えています。

このような関係を
「相関がありそう」と感じるのは自然です。


2. ピアソンの積率相関係数を具体例で見る

ピアソン相関が得意な例(直線的な関係)

上の「勉強時間と得点」の例を散布図にすると、
点はほぼ一直線に並びます。

このような場合、

  • 勉強時間が1時間増える
  • 得点もだいたい同じだけ増える

という 直線的な関係 があります。

👉 このときに使うのが
ピアソンの積率相関係数です。

ピアソン相関は、

「この直線関係はどれくらいきれいか?」

を数値で表しています。


ピアソン相関がうまくいかない例

次のデータを見てください。

具体例②:学習時間と理解度(曲線的)

勉強時間理解度
120
235
355
480
595

最初はゆっくり伸び、
途中から一気に理解度が上がっています。

散布図にすると、
カーブを描く形になります。

この場合、

  • 明らかに関係はある
  • でも直線ではない

ため、
ピアソン相関は思ったより低い値になることがあります。


3. スピアマンの順位相関係数を具体例で見る

スピアマン相関の考え方

スピアマン相関では、
数値をそのまま使いません

代わりに、順位に変換します。


具体例③:順位に直してみる

先ほどの「学習時間と理解度」を
順位で書き直します。

勉強時間理解度勉強時間の順位理解度の順位
12011
23522
35533
48044
59555

順位を見ると、

  • 勉強時間が長い人ほど
  • 理解度の順位も高い

という関係は完全に一致しています。

👉 このようなとき、
スピアマンの順位相関係数は高くなります。


4. 外れ値があるときの違い(重要な例)

具体例④:外れ値が混じるケース

勉強時間得点
140
250
360
470
5150

最後の1人だけ、極端に高得点です。

ピアソン相関の場合

  • 数値の大きさを使う
  • 150点が強く影響する

→ 相関係数が大きく歪みます。


スピアマン相関の場合

順位にすると:

勉強時間順位得点順位
11
22
33
44
55

外れ値でも
順位は「1つ上がるだけ」。

👉 そのため、
スピアマン相関は外れ値の影響を受けにくい。


5. ピアソンとスピアマンの違いを整理

観点ピアソンスピアマン
使う値数値そのもの順位
得意な関係直線的増え続ける/減り続ける
曲線的関係苦手得意
外れ値影響大影響小

6. どちらを使えばいいか(具体例ベース)

  • 勉強時間と得点がほぼ直線的
     → ピアソン相関
  • 努力量と成長度合い(途中で伸びが変わる)
     → スピアマン相関
  • 順位・ランキング・評価点
     → スピアマン相関

7. まとめ(初心者向け結論)

  • ピアソン相関は「直線のきれいさ」を見る
  • スピアマン相関は「順番が合っているか」を見る
  • 同じデータでも、結果が変わることがある
  • 大切なのは「何を知りたいか」

相関係数は、
公式よりも具体例で理解するほうが早い指標です。

ここまでの例を思い出せれば、
ピアソンとスピアマンで迷うことはほぼなくなります。

上部へスクロール