平均値、中央値、最頻値とは?-計算方法と使い分けを解説

データを分析する際には、集めたデータを要約して理解しやすくする必要があります。その中でよく使われるのが 平均値中央値最頻値 です。それぞれの特徴や計算方法を理解することで、データの性質をより正確に把握することができます。


1. 平均値(Mean)

平均値 は、データの総和をデータ数で割った値です。最も一般的な指標であり、データの中心的な傾向を表します。

計算方法

  1. データを全て足し合わせる。
  2. データの個数で割る。

データ: 5, 10, 15, 20, 25
計算:平均値=(5+10+15+20+25)÷5=15

特徴

  • 外れ値(極端に大きいまたは小さい値)の影響を受けやすい。

2. 中央値(Median)

中央値 は、データを小さい順に並べたときの真ん中の値です。データ数が偶数の場合は、中央の2つの値の平均を取ります。

計算方法

  1. データを昇順に並べる。
  2. データの中央に位置する値を取る。

データ: 5, 10, 15, 20, 25
並び替え後: 5, 10, 15, 20, 25
中央の値: 15

データ: 5, 10, 15, 20
並び替え後: 5, 10, 15, 20
中央の値:中央値=(10+15)÷2=12.5

特徴

  • 外れ値の影響を受けにくい。
  • データの偏りに強い。

3. 最頻値(Mode)

最頻値 は、データの中で最も頻繁に出現する値です。同じ値が複数回出現する場合、その値が最頻値となります。

計算方法

  1. 各データの出現回数を数える。
  2. 最も多く出現した値を取る。

データ: 5, 10, 15, 10, 20
最頻値: 10(2回出現)

データ: 5, 10, 15, 20, 25
最頻値: なし(全て1回ずつ出現)

特徴

  • 複数の最頻値が存在する場合もある。
  • 主にカテゴリデータの分析に利用されることが多い。

これらの指標の違いと使い分け

指標特徴使用例
平均値データ全体のバランスを反映。外れ値の影響を受けやすい。テストの平均点、株価の平均値など
中央値外れ値の影響を受けにくく、データの中心的傾向を示す。住宅価格、所得分布など偏りがあるデータの分析
最頻値データで最も多く現れる値を示す。商品の売れ筋、アンケートでの最頻回答など

まとめ

平均値、中央値、最頻値は、それぞれ異なる特性を持つ指標です。データの性質や分析目的に応じて、適切な指標を選ぶことが重要です。例えば、外れ値が多い場合には中央値が適しており、頻度分析では最頻値が役立ちます。一方で、平均値は全体的な傾向を掴むのに適しています。これらを組み合わせて使うことで、データの理解が深まります。

上部へスクロール