ボンフェローニ補正(Bonferroni correction)は、複数回の統計検定を行う際に、全体の誤検定率(Type I エラー)を抑えるための方法です。多重比較問題を解決するために、比較回数に基づいて有意水準を調整する単純かつ一般的なアプローチです。
ボンフェローニ補正の基本概念
標準的な統計検定では、有意水準(α)は通常0.05や0.01に設定されます。しかし、同じデータセットで複数回の検定を行うと、偶然に有意と判定される確率が累積して増加します。
ボンフェローニ補正では、有意水準を検定の回数で割ることで、全体のエラー率を制御します。
補正後の有意水準の計算式
α′′=α/m
- α′: 補正後の有意水準
- α: 元の有意水準(通常0.05)
- m: 比較の回数(検定の数)
ボンフェローニ補正の実際の例
例1: 新薬の効果を比較
新薬A, B, Cの3つの薬を比較する場合、以下のようなペアの比較が必要です:
- AとB
- AとC
- BとC
この場合、比較の回数 m=3 となり、有意水準 α=0.05 を使うと補正後の有意水準は:α′=0.05/3=0.0167
各比較で得られるp値が0.0167未満であれば有意とみなされます。
例2: 広告キャンペーンの効果測定
4つの異なる広告(A, B, C, D)のクリック率を比較する場合、すべての組み合わせを検定すると合計で6通り(m=6)の比較が必要です。
この場合:α′=0.05/6=0.0083
各ペアでのp値が0.0083未満であれば有意と判定されます。
ボンフェローニ補正の利点と欠点
利点
- 簡単で計算しやすい: 複雑なモデルや追加のデータ処理が不要です。
- 非常に保守的: Type Iエラー(誤検定)のリスクを確実に抑えられます。
欠点
- 検出力が低下する: 有意水準が厳しくなるため、実際に存在する差を見逃す可能性が高まります(Type IIエラー)。
- 比較回数が多い場合には不向き: 比較回数が増えると補正後の有意水準が非常に小さくなり、ほとんどの差を「有意でない」と判定するリスクがあります。
ボンフェローニ補正が適している場合
- 比較回数が少ない場合(例えば2〜5回)。
- 結果の信頼性を最優先する場合(誤判定を避けたい場合)。
- 検定が独立していると仮定できる場合。
ボンフェローニ補正以外の多重比較補正方法
ボンフェローニ補正の欠点を克服するため、以下のような代替手法も広く利用されています:
- ホルム法(Holm’s Method): ボンフェローニ補正より検出力が高い。
- False Discovery Rate(FDR): 大規模データでの多重比較に適している。
- TukeyのHSD検定: グループ間比較で利用。
まとめ
ボンフェローニ補正は、多重比較問題に対するシンプルで信頼性の高い方法です。ただし、比較回数が増えると検出力が大幅に低下するため、他の手法と比較しながら適切な方法を選ぶことが重要です。
最後に
統計学や機械学習は、データサイエンスやAIエンジニアリングの基盤となる分野です。
こうした知識を深め、実践的なスキルを身につければ、需要の高いAI関連職種でのキャリア形成も目指せます。
未経験からでも安心して学べるおすすめのキャリア支援サービスについて、こちらの記事で詳しく解説していますので、ぜひチェックしてみてください。
