範囲(レンジ)は、データセット内の「最大値」と「最小値」の差を表します。これは、データがどれだけ広がっているかを簡単に示す指標です。
公式:範囲=最大値−最小値
例えば、データセットが {5,8,10,12,15} の場合、
最大値は 15、最小値は 5 なので範囲は次のようになります:範囲=15−5=10
範囲の特徴
- 単純な計算
範囲は、データセットの最大値と最小値さえ分かれば計算できます。 - ばらつきを示す指標
範囲はデータの分散度合いを簡単に示しますが、詳細なばらつきやデータの分布形状については把握できません。 - 外れ値の影響を受けやすい
範囲は極端な値(外れ値)に大きく左右されるため、データのばらつきを過大評価または過小評価する可能性があります。
範囲の利用例
- データの初期分析
データのばらつき具合をざっくりと把握するために、範囲を利用します。 - 品質管理
工場で製品のサイズや重さを測定する場合、範囲を確認することで、許容範囲外の製品があるかどうかを判断します。 - 教育現場での成績分析
テストの得点分布を簡単に把握するために、範囲を計算することがあります。
範囲の短所を補う方法
範囲の短所を補うために、以下の統計指標を併用することが推奨されます:
- 四分位範囲(IQR:Interquartile Range)
四分位範囲は、データの中央 50% のばらつきを示し、外れ値の影響を受けにくい指標です。
計算方法は次の通り:四分位範囲=Q3−Q1(ここで Q1 は第1四分位数、Q3 は第3四分位数) - 分散と標準偏差
データ全体のばらつきを詳細に把握するために、分散や標準偏差を使います。
範囲を使う際の注意点
- 範囲はデータの全体的な分布を示す指標ではないため、平均や分散、標準偏差などの指標と併用することが重要です。
- 外れ値が含まれる場合、範囲は誤解を招く可能性があるため、外れ値の検出や四分位範囲の活用を検討してください。
まとめ
範囲(レンジ)は、データの最大値と最小値の差を計算することで得られる、非常にシンプルな統計指標です。データの初期分析やざっくりとした分布把握に有用ですが、外れ値の影響を受けやすいため、他の指標と組み合わせて利用することが重要です。
統計分析を行う際には、範囲を出発点として、より詳細な分析に進むことが効果的です!