« [その他]札幌へ | トップページ | [その他]サッカー 日本代表対アルゼンチン代表 »

2010.10.06

[統計]Mann-WhitneyのU検定と不等分散:甘くなったりきびしくなったり

 ノンパラメトリック検定を”分布によらない”と形容することがよくある。その形容の意味は、”分布は全然関係ないから気にしなくていいよ”ということとはだいぶ異なる。代表的なノンパラメトリック検定(と呼んでもまず異論はないだろう)であるMann-WhitneyのU検定を例にとると、2つのサンプルが分散の異なる母集団からきているときには、すでに気にしなくていい範囲から外れてしまっており、有意確率に影響する。ということは詳しい教科書でもふれられており(たとえば、Siegel&Castellanの有名な教科書"Nonparametric Statistics for The Behavioral Sciences"ー初版から通算しての引用数は多すぎてよくわからない.。ある程度多くなってくると、引用の際の誤記の数が増え、別の[ときに同じとは気付きにくい]文献として登録されていることがあるため)、私もだいぶ前に文章を書いたことがある。
 この夏(福岡はまだけっこう昼間は暑い)、”不等分散のとき、U検定はあまくなるんだよね”と何度か聞かれた。確かにそういうことも起こるのだが、標本数と分散の関係によっては、逆にきびしくもなる。不等分散のときには、5%水準で検定したとしても、実は10%水準とかになっている(甘い)ときもあれば、実は2%水準とか(過剰にきびしい)になっていることもあるのである(上記の文章にはこのことも書いた)。考えようにもよるが、甘くなるだけの方がまだましな気がする。甘くも過剰にきびしくもなると、有意確率(いわゆるP値)がそもそも何かの判断基準にならなくなる(しつこいかもしれないが検定で扱うのが適切な問題であることは大前提として)。
 この、標本数と分散の関係によって甘くもなり逆にきびしくもなるということは、Studentのt検定を不等分散状況で(強行して)使った場合とよく似ている。

|

« [その他]札幌へ | トップページ | [その他]サッカー 日本代表対アルゼンチン代表 »

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: [統計]Mann-WhitneyのU検定と不等分散:甘くなったりきびしくなったり:

« [その他]札幌へ | トップページ | [その他]サッカー 日本代表対アルゼンチン代表 »