Wilcoxon-Mann-Whitney検定についてわかりやすく解説

マンホイットニーのU検定では『比較するデータに差があると言えるのか?』という問いに答えてくれます。

本記事では、検定の手法から例題までを解説しています。

WMW検定の目的

2つの母集団を想定します。それぞれ母集団Aと母集団Bと名付けておきます。

母集団Aは「何らかの確率分布に従っている」と仮定し、母集団BもAと同じ形状をした何らかの確率分布に従っていると仮定します。

WMW検定ではそれぞれの母集団A、Bから標本を単純無作為に抽出し、それぞれの標本を比較したのち「A,Bの母集団は同じ確率分布に従うか、異なっているか」を判断することが当検定の目的となります。

また、比較時に統計検定量(U)をもって検定を行っていきます。

WMW検定の手順

帰無仮説と対立仮設を立てます。

 帰無仮説=比べるものが等しい
 対立仮設=比べるものが等しくない

Step1.標本サイズと順位和を計算する

それぞれのデータを見て標本サイズを下記のように記載しておきます。

nA=〇 nB=△

順位和

A、Bのそれぞれのデータの順位を求め全て足し上げる。

Step2.統計検定量(U)を計算する

Aのグループの統計検定量をU1、BをUとしたとき

U1 = nA・nB+1/2・nA・(nA+1) – RA

U2 = nA・nB+1/2・nB・(nB+1) – RB

と求めて、より小さい値をUとする

Step3.計算して得たUと臨界値U0.05を比較する

Step2で得たUと、臨界値U0.05を比較します。

臨界値U0.05とは下記の図で得られる値のことで、例えばデータ数がAが4つ、Bが4つの場合は下記のグラフで指し示すとU0.05=0になります。

上の表で得た臨界値U0.05とStep2で得たUを比較し

U < U0.05 の場合は「統計的に優位な差が認められた」

U > U0.05 の場合は統計的に優位な差は認められなかった」

結論付けます。

例題

ある学校において男女それぞれ6人の身長に関するデータを得ました。

この男女それぞれの身長のデータに差があると言えるのか、検定を行っていきます。

・Step1.標本サイズと順位和を計算する

https://www.gen-info.osaka-u.ac.jp/MEPHAS/wilc1.html

こちらのサイト使うと計算が楽なので活用していきます。

標本サイズはそれぞれ6人ずつなので、

nA=6 nB=6 となり、サンプルサイズに入力します。

そしてそれぞれのサンプルデータを入力します。

すると結果は下記のようになります。

実は添付画像の下に答えが出てしまっているのですが、

一旦はstep通りに例題を解いていきます。

・Step2.統計検定量(U)を計算する

出てきた数字を整理します。

nA=6 nB=6

RA=11+7+5+12+8+10=53

RB=1+6+2+3+9+4=25

これらを下の数式に代入します。

U1 = nA・nB+1/2・nA・(nA+1) – RA

U2 = nA・nB+1/2・nB・(nB+1) – RB

すると、

U1 = nA・nB+1/2・nA・(nA+1) – RA=4

U2 = nA・nB+1/2・nB・(nB+1) – RB=32

となり、より小さいほうをUとして採用するので、U=4となります。

Step3.計算して得たUと臨界値U0.05を比較する

Step2で得たUと、臨界値U0.05を比較します。

nA=6 nB=6のため、今回の臨界値U0.05は5となります。

Step2で得たように、U=4なので

U < U0.05 となり「統計的に優位な差が認められた」が結論になります。

参考書や転職サイトの紹介

z検定やt検定をはじめとする統計学の知識は、データ分析やビジネスにおいてますます重要性が高まっています。これらの知識を深めるために役立つ参考書や、キャリアアップを目指す方におすすめの転職サイトをいくつかご紹介します。

統計学の参考書

『統計学が最強の学問である』西内啓 著

『統計学が最強の学問である』は、統計学が現代社会でいかに強力なツールであるかを解説した一冊です。

データを扱う際に不可欠な考え方を実例とともに学べるため、ビジネスや日常生活に統計学を応用したい人にとって理想的な入門書です。特に、難解な数式を避け、具体的な事例や比喩を用いて説明するため、初学者でも「統計学の力」を体感できる内容になっています。

『世界一やさしい統計学の教科書 1年生』


文系の方が統計学に取り組む際に直面するハードルを意識し、難しい数式や理論を極力排除しながら、統計学の基本概念を丁寧に解説しています。

さらに、各章ごとに理解度を確認するための演習問題が用意されており、自分のペースで着実に学びを深めることができます。

データサイエンティストへの転職サポート/資格取得

テックゲート転職

  • 特徴
    • 未経験者歓迎: ITの基礎から学べる研修などが用意されており、未経験者でもスタートが可能
    • 30代転職実績: 年齢を重ねても転職が成功しており、30代の転職実績が豊富にあり
    • 転職支援実績: 5000名を超える転職者がこのサービスを利用して新しいキャリアをスタート
    • 転職定着率97%: 転職後の定着率が97%と非常に高く、長期的なキャリア形成

オンスク.JP

  • 特徴
    • 独学での勉強: 様々な資格に関する内容が用意されており、独学でも資格取得が可能
    • 月額1,000円台で始められる: 費用の心配も少なくスタートすることが出来ます
    • 毎日コツコツ: 1動画5分から視聴でき、ちょっとしたスキマ時間での学習に最適!

統計学の知識を深めつつ、キャリアの新たなステージに進みたい方は、これらの参考書や転職サイトをぜひ活用してください。

上部へスクロール