サンプルサイズの決め方：統計的に有意な結果を得るために

1. はじめに

統計分析において、サンプルサイズは結果の信頼性を左右する重要な要素です。本記事では、サンプルサイズの決定方法について解説し、統計的に有意な結果を得るために必要な『サンプルサイズ』について概念や計算方法について解説します！

定義: サンプルサイズとは、調査や実験で収集するデータの数のことです。サンプルサイズが適切でない場合、結果が統計的に有意でない、またはバイアスがかかるリスクがあります。
重要性: サンプルサイズが小さすぎると、結果が偶然に左右されやすく、誤差が大きくなります。一方、大きすぎると、調査コストが増大し、無駄が生じる可能性があります。

有意水準（α）: 一般的に5%（0.05）や1%（0.01）が使われ、これは「帰無仮説が正しいときに、データが観察される確率」を示します。統計的に有意であるとは、この確率が有意水準を下回ることを意味します。

効果量（Effect Size）:

効果量については下記の記事を参照ください。

サンプルサイズの計算で使われる『効果量』とは

検出力（Power）: 検出力とは、実際に効果があるときに、それを検出できる確率です。通常、80%以上の検出力が求められます。この検出力が先ほどの検証の際の確からしさに繋がってきます。第二種の過誤を犯さない確率のことを言います。

第二種の過誤とは何か？については下記の記事で解説しております。

統計学における第1種の過誤と第2種の過誤についてわかりやすく解説

事前検定と事後検定:
- 事前検定: サンプルサイズを決定する前に、効果の大きさ、α、検出力を基に必要なサンプルサイズを計算します。
- 事後検定: 実験後に結果が有意かどうかを確認し、そのサンプルサイズが適切だったかを評価します。
サンプルサイズの計算方法:
- こちらにサンプルサイズを簡単に計算できるツールを作成したので、ぜひ使ってみてください！

サンプルサイズ計算ツール

例1: 平均の比較:
- ある新薬の効果を検証するために、50人の被験者を2つのグループに分け、効果量を0.5、αを0.05、検出力を0.8とした場合のサンプルサイズを計算します。
例2: 相関の検証:
- あるマーケティング施策が売上に与える影響を相関分析で検証する際に、必要なサンプルサイズを求めます。