1. はじめに
統計学やデータ分析を学ぶと、必ず登場する「ポアソン分布」と「正規分布」。
どちらも確率分布の一種ですが、適用される場面や特徴が異なります。
この記事では、ポアソン分布と正規分布の違いを具体的な例とともに解説し、
「どちらを使うべきか?」の判断基準についても紹介します。
- ポアソン分布: ある期間内や一定の空間内で起こる稀な事象を扱う
- 正規分布: 多くのデータが平均値付近に集中するデータ分布を表す
これらの違いを理解することで、データ分析や統計的検定を適切に行うことができます。
では、まずポアソン分布から見ていきましょう。
2. ポアソン分布とは?
2.1 ポアソン分布の定義
ポアソン分布は、一定の時間・空間内で発生する稀な事象の回数を表す確率分布です。
たとえば、以下のような状況でポアソン分布が使われます。
- 1時間あたりの交通事故の発生回数
- 1週間で受信するクレームの件数
- 1平方メートルあたりの植物の発生数
- 病院で1日あたりに発生する救急搬送の回数
2.2 ポアソン分布の確率質量関数(PMF)
ポアソン分布の確率質量関数(PMF)は次の式で表されます。

- k:発生回数(0, 1, 2, …)
- λ(ラムダ):一定期間・空間内で期待される平均発生回数
- e:自然対数の底(約2.718)
この式からわかるように、λ\lambdaλ の値が大きくなると、発生回数が増える確率が高くなります。
2.3 ポアソン分布の特徴
- 非負の整数値(0,1,2,3…)をとる
- 平均と分散がともに λ\lambdaλ に等しい
- 事象の発生は独立している
- 時間・空間内での発生確率が一定である
3. 正規分布とは?
3.1 正規分布の定義
正規分布は、平均値を中心にデータが左右対称に分布する確率分布です。
例えば、以下のようなデータは正規分布に従うことが多いです。
- テストの点数
- 身長や体重
- 製品の品質測定値(誤差)
- 金融市場のリターン
3.2 正規分布の確率密度関数(PDF)

- μ(ミュー):平均値(データの中心)
- σ(シグマ):標準偏差(データのばらつき)
3.3 正規分布の特徴
- 平均値 μ\muμ を中心とする左右対称な形状
- データが中央に集中し、両端にいくほど頻度が低くなる
- 平均値と中央値、最頻値が一致する
- 中心極限定理により、多くのデータが正規分布に近づく
4. ポアソン分布と正規分布の違い
ポアソン分布と正規分布の違いを表にまとめます。
項目 | ポアソン分布 | 正規分布 |
---|---|---|
適用範囲 | 稀な事象の発生回数 | 自然界の多くのデータ |
データの範囲 | 0以上の整数 | 連続的な値 |
パラメータ | λ\lambdaλ(平均発生回数) | μ\muμ(平均), σ\sigmaσ(標準偏差) |
分布の形状 | 右に裾が広がる | 左右対称の釣鐘型 |
応用例 | 事故、病気の発生、顧客クレーム数 | 身長、テストの点数、製造誤差 |
5. ポアソン分布と正規分布の使い分け
ポアソン分布を使うべきか、正規分布を使うべきかはデータの性質によります。
ポアソン分布を使うべきケース
- ある期間・空間内での発生回数を知りたい場合
- 整数(0,1,2…)で表されるデータを扱う
- 例:1日に来店する顧客数、1時間あたりの故障回数
正規分布を使うべきケース
- 連続的な数値データ(例:身長、体重)を扱う
- 平均値を中心とした左右対称な分布になる
- 例:テストの点数、製品の品質データ
6. 実例で学ぶ!Pythonを使った分布の可視化
Pythonを使って、ポアソン分布と正規分布の違いを視覚的に確認してみましょう。
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats
# ポアソン分布
lambda_ = 5
x_poisson = np.arange(0, 20)
y_poisson = stats.poisson.pmf(x_poisson, lambda_)
# 正規分布
mu, sigma = 10, 2
x_normal = np.linspace(0, 20, 100)
y_normal = stats.norm.pdf(x_normal, mu, sigma)
# グラフの描画
plt.figure(figsize=(10, 5))
plt.bar(x_poisson, y_poisson, alpha=0.6, label="ポアソン分布 (λ=5)")
plt.plot(x_normal, y_normal, label="正規分布 (μ=10, σ=2)", color="red")
plt.legend()
plt.title("ポアソン分布 vs 正規分布")
plt.show()
このように、ポアソン分布は右に裾が広がるのに対し、正規分布は左右対称の形をしていることがわかります。
7. まとめ
- ポアソン分布は一定の時間や空間内での発生回数を表す分布
- 正規分布はデータが平均を中心に左右対称に分布する場合に適用
- ポアソン分布の λ が大きくなると、正規分布に近づく
適切な分布を選ぶことで、より正確な分析ができるようになります!