【データサイエンティスト検定】統計学の基礎 場合の数・確率・期待値を体系的に理解する

統計学のさまざまな法則を理解するためには、その前提として
事象が何通り起こり得るのか(場合の数) を正しく数えられることが重要です。

本記事では、

  • 順列と組み合わせ
  • 確率と条件付き確率
  • 期待値
  • 独立

という、統計学の土台となる概念を順番に解説します。


1. 場合の数とは何か

場合の数とは、

ある条件のもとで起こり得る事象の総数

を数えることです。

確率は「起こり得るすべての事象のうち、どれがどの割合で起こるか」を考えるため、
まずは 全体が何通りあるのか を把握する必要があります。


2. 順列(Permutation)

定義

順列とは、

複数の異なるものを並べる並べ方

のことです。

n 個の異なるものの中から r 個を選んで並べる順列の数は、

  • nPr

と表します。


順列の公式

nPr=n×(n1)×(n2)××(nr+1)nPr = n \times (n-1) \times (n-2) \times \cdots \times (n-r+1)nPr=n×(n−1)×(n−2)×⋯×(n−r+1)


具体例

「1, 2, 3, 4, 5」の5枚のカードから、
3枚を選んで 横一列に並べる 場合を考えます。

  • n = 5
  • r = 3

5P3=5×4×3=605P3 = 5 \times 4 \times 3 = 605P3=5×4×3=60

これは、並び順が異なれば別の結果として数える ためです。


3. 組み合わせ(Combination)

定義

組み合わせとは、

複数の異なるものから一定数を選ぶ選び方

のことです。

順列とは異なり、並び順を考慮しません

n 個の中から r 個を選ぶ組み合わせの数は、

  • nCr

と表します。


組み合わせの公式

nCr=nPrr!nCr = \frac{nPr}{r!}nCr=r!nPr​

r! で割る理由は、
同じ要素の並び替えを すべて同一とみなす ためです。


具体例

「1, 2, 3, 4, 5」の5枚のカードから
3枚を選ぶ組み合わせの数は、

  • n = 5
  • r = 3

5C3=5P33!=606=105C3 = \frac{5P3}{3!} = \frac{60}{6} = 105C3=3!5P3​=660​=10


4. 確率とは何か

定義

確率とは、

ある事象が、すべての事象に対して起こる割合

を表す数値です。

確率は「どの程度の頻度で起こるか」を
定量的に評価 するための統計学の基本概念です。


5. 条件付き確率

定義

条件付き確率とは、

ある事象が起こったという条件の下で、別の事象が起こる確率

を指します。

「B が起こったときに、A が起こる確率」は、P(AB)P(A \mid B)P(A∣B)

と表します。


条件付き確率の定義式

P(AB)=P(AB)P(B)P(A \mid B) = \frac{P(A \cap B)}{P(B)}P(A∣B)=P(B)P(A∩B)​

  • P(AB)P(A \cap B)P(A∩B):A と B が同時に起こる確率(同時確率)
  • P(B)P(B)P(B):B が起こる確率(周辺確率)

具体例:遺伝子と病気

例として、

  • 病気Aに「かかる人」「かからない人」がそれぞれ1000人
  • 遺伝子Bを「持つ人」「持たない人」もそれぞれ半数

とします。P(A1)=P(A2)=12,P(B1)=P(B2)=12P(A_1) = P(A_2) = \frac{1}{2}, \quad P(B_1) = P(B_2) = \frac{1}{2}P(A1​)=P(A2​)=21​,P(B1​)=P(B2​)=21​

このとき、

遺伝子Bを持つときに、病気Aにかかる確率

を条件付き確率で計算すると、P(A1B1)=34P(A_1 \mid B_1) = \frac{3}{4}P(A1​∣B1​)=43​

となり、
遺伝子Bを持つ場合、病気Aにかかる確率が高いことが分かります。

このように、条件付き確率は
特定の条件下でのリスク評価 に非常に有効です。


6. 期待値

定義

期待値とは、

得られるすべての事象の値と、それが起こる確率の積を足し合わせたもの

です。

「長期的に見た平均的な値」を表します。


サイコロの例

公平なサイコロでは、
1~6 の目がそれぞれ 1/6 の確率で出ます。E(X)=1×16+2×16+3×16+4×16+5×16+6×16=3.5E(X) = 1\times\frac{1}{6} + 2\times\frac{1}{6} + 3\times\frac{1}{6} + 4\times\frac{1}{6} + 5\times\frac{1}{6} + 6\times\frac{1}{6} = 3.5E(X)=1×61​+2×61​+3×61​+4×61​+5×61​+6×61​=3.5

したがって、サイコロの目の期待値は 3.5 です。

https://mammothmemory.net/images/user/base/Maths/Statistics%20and%20probability/Outcomes%20and%20Expected%20Frequency/probability-of-throwing-a-dice-and-tossing-a-coin.e07ece2.jpg
https://www.mathwords.com/e/e_assets/e41.gif

7. 独立とは何か

定義

2つの事象が 独立 であるとは、

同時に起こる確率が、それぞれの確率の積で表される

ことを意味します。P(AB)=P(A)×P(B)P(A \cap B) = P(A) \times P(B)P(A∩B)=P(A)×P(B)


サイコロの例

A のサイコロと B のサイコロを同時に振る場合、

  • A の出目は B に影響しない
  • B の出目も A に影響しない

このとき、2つの事象は 独立 であり、P(AB)=P(A)×P(B)P(A \cap B) = P(A)\times P(B)P(A∩B)=P(A)×P(B)

が成り立ちます。


まとめ

  • 順列:並び順を考慮する
  • 組み合わせ:並び順を考慮しない
  • 確率:起こる割合
  • 条件付き確率:条件の下での確率
  • 期待値:長期的な平均
  • 独立:互いに影響しない事象

これらはすべて、

統計的に「不確実な現象」を扱うための共通言語

です。

上部へスクロール