[統計]Mann-WhitneyのU検定と”Efronのサイコロ”
2個体のどちらが強いのかに比べると、2つのグループのどちらが強いのかははるかに複雑な問題である。2つのグループのどちらが強いかを決めたい時、総当たりで対戦してその勝率で決めるというのは決しておかしくないだろう。第1のグループが(A,B,C)の3人、第2のグループが(E,F,G)の3人なら、3×3で9つの対戦をしてその勝敗で決めるわけである。たとえば、Aは相手のグループの3人(E,F,G)のそれぞれと対戦することになる。「一番強い個体同士の対戦」とか「真ん中の強さの個体同士の対戦」とか「それぞれのグループで順番(先鋒、副将、大将)を決めて3試合の出場成績」よりも全体を見ているだけよいような印象がある(最後の例に似たものは孫子[後の方]に出てくる)。
広く使われているMann-WhitneyのU検定は、ちょうど総当たり対戦の考え方で、2つのサンプルのどちらの方が平均的には大きな値かを見る。第1のサンプルが(1、2、5)の3つのデータ、第2のグループが(3、6)の2つのデータなら、比較して大きい方が”勝ち”とすると、第1のサンプルは、1が0勝2敗、2も0勝2敗、5は1勝1敗だから、1勝5敗となる。第2のサンプルから見れば5勝1敗となる。この5と1がUである。U検定では通常の場合である両側検定の時は、サンプル数が決まっていれば片方のUの値がわかればもう片方もわかるので、Uのうち小さい方を検定統計量として使う。
サンプルサイズをn1,n2として、”勝ち数”がn1・n2/2より大きい方を、平均的には大きいと考えることは理にかなっているように思える。だが、以下のような例を考えると、(場合によっては狭い)ある条件を満たしたときしかその印象は正しくないことがわかる。
サンプルA:4.0、3.9、1.5
サンプルB:3.2、3.0、2.8
サンプルC:5.5、2.2、2.1
AはBに対して6勝3敗、BはCに対して6勝3敗、AはCに対して4勝5敗だから、(推移的ではなく)循環的になってしまい大小関係にはふさわしくない。
これは”Efronのサイコロ”の例でもあり、U検定の仮定とも対応している。
| 固定リンク
トラックバック
この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/35623/17727261
この記事へのトラックバック一覧です: [統計]Mann-WhitneyのU検定と”Efronのサイコロ”:

コメント