ポアソン分布 vs. 正規分布:違いと使い分けを徹底解説

1. はじめに

統計学やデータ分析を学ぶと、必ず登場する「ポアソン分布」と「正規分布」。
どちらも確率分布の一種ですが、適用される場面や特徴が異なります。

この記事では、ポアソン分布と正規分布の違いを具体的な例とともに解説し、
「どちらを使うべきか?」の判断基準についても紹介します。

  • ポアソン分布: ある期間内や一定の空間内で起こる稀な事象を扱う
  • 正規分布: 多くのデータが平均値付近に集中するデータ分布を表す

これらの違いを理解することで、データ分析や統計的検定を適切に行うことができます。
では、まずポアソン分布から見ていきましょう。


2. ポアソン分布とは?

2.1 ポアソン分布の定義

ポアソン分布は、一定の時間・空間内で発生する稀な事象の回数を表す確率分布です。
たとえば、以下のような状況でポアソン分布が使われます。

  • 1時間あたりの交通事故の発生回数
  • 1週間で受信するクレームの件数
  • 1平方メートルあたりの植物の発生数
  • 病院で1日あたりに発生する救急搬送の回数

2.2 ポアソン分布の確率質量関数(PMF)

ポアソン分布の確率質量関数(PMF)は次の式で表されます。

  • k:発生回数(0, 1, 2, …)
  • λ(ラムダ):一定期間・空間内で期待される平均発生回数
  • e:自然対数の底(約2.718)

この式からわかるように、λ\lambdaλ の値が大きくなると、発生回数が増える確率が高くなります

2.3 ポアソン分布の特徴

  • 非負の整数値(0,1,2,3…)をとる
  • 平均と分散がともに λ\lambdaλ に等しい
  • 事象の発生は独立している
  • 時間・空間内での発生確率が一定である

3. 正規分布とは?

3.1 正規分布の定義

正規分布は、平均値を中心にデータが左右対称に分布する確率分布です。
例えば、以下のようなデータは正規分布に従うことが多いです。

  • テストの点数
  • 身長や体重
  • 製品の品質測定値(誤差)
  • 金融市場のリターン

3.2 正規分布の確率密度関数(PDF)

  • μ(ミュー):平均値(データの中心)
  • σ(シグマ):標準偏差(データのばらつき)

3.3 正規分布の特徴

  • 平均値 μ\muμ を中心とする左右対称な形状
  • データが中央に集中し、両端にいくほど頻度が低くなる
  • 平均値と中央値、最頻値が一致する
  • 中心極限定理により、多くのデータが正規分布に近づく

4. ポアソン分布と正規分布の違い

ポアソン分布と正規分布の違いを表にまとめます。

項目ポアソン分布正規分布
適用範囲稀な事象の発生回数自然界の多くのデータ
データの範囲0以上の整数連続的な値
パラメータλ\lambdaλ(平均発生回数)μ\muμ(平均), σ\sigmaσ(標準偏差)
分布の形状右に裾が広がる左右対称の釣鐘型
応用例事故、病気の発生、顧客クレーム数身長、テストの点数、製造誤差

5. ポアソン分布と正規分布の使い分け

ポアソン分布を使うべきか、正規分布を使うべきかはデータの性質によります。

ポアソン分布を使うべきケース

  • ある期間・空間内での発生回数を知りたい場合
  • 整数(0,1,2…)で表されるデータを扱う
  • 例:1日に来店する顧客数、1時間あたりの故障回数

正規分布を使うべきケース

  • 連続的な数値データ(例:身長、体重)を扱う
  • 平均値を中心とした左右対称な分布になる
  • 例:テストの点数、製品の品質データ

6. 実例で学ぶ!Pythonを使った分布の可視化

Pythonを使って、ポアソン分布と正規分布の違いを視覚的に確認してみましょう。

import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats

# ポアソン分布
lambda_ = 5
x_poisson = np.arange(0, 20)
y_poisson = stats.poisson.pmf(x_poisson, lambda_)

# 正規分布
mu, sigma = 10, 2
x_normal = np.linspace(0, 20, 100)
y_normal = stats.norm.pdf(x_normal, mu, sigma)

# グラフの描画
plt.figure(figsize=(10, 5))
plt.bar(x_poisson, y_poisson, alpha=0.6, label="ポアソン分布 (λ=5)")
plt.plot(x_normal, y_normal, label="正規分布 (μ=10, σ=2)", color="red")
plt.legend()
plt.title("ポアソン分布 vs 正規分布")
plt.show()

このように、ポアソン分布は右に裾が広がるのに対し、正規分布は左右対称の形をしていることがわかります。


7. まとめ

  • ポアソン分布一定の時間や空間内での発生回数を表す分布
  • 正規分布データが平均を中心に左右対称に分布する場合に適用
  • ポアソン分布の λ が大きくなると、正規分布に近づく

適切な分布を選ぶことで、より正確な分析ができるようになります!

上部へスクロール