« [機材]夢の自動車 | トップページ | [その他]スーパーボウル »

2005.02.06

[統計]ノンパラメトリクスと分散

 統計的方法にノンパラメトリクスと呼ばれる一群がある。多くの人に好まれている4文字略語では、「ノンパラ」となる。統計的方法には、”こういうときに使うために考えました”という、取扱説明書にある正しい使い方みたいなものがほとんど必ずあって、仮定と呼ばれている。そこから、外れても、わりと大丈夫なことをrobustとよぶわけである。
 20年ほど前(大学によってはもっと後でも)までは、正規分布&等分散という仮定をしている方法(t検定とか分散分析とか直線回帰とか)を中心に教えるのが普通だった。だが、世の中そんなデータばかりではないーどころかそうではない方がたぶんずっと多い。そこで、分布の形についてとくに仮定しないノンパラメトリクスがよく使われるようになったのだろう。
 分布の形についてとくに仮定しないのだから、ノンパラメトリクスならくらべるものの分散がちがってもいいのだろう、というようなことを言っている人が意外に多いことに気づいたのは、かなり前になる。ノンパラメトリクスの検定の理屈そのものは驚くほどシンプルで、統計の入門書にも載っていることが少なくない。それを理解していれば、ノンパラメトリクスのかなりの部分(U検定とか)は、不等分散のときはうまくないということがあまりに明白だ。
 数理統計学の本ではなく、ユーザー向けの統計の本でも、不等分散がまずいということは書いてあることが少なくない。Siegelと言う統計学者の、行動科学向けの統計の本は、やや古典的なベストセラーである。この本には、1節使って書いてある。
 いまでもときどき新しい論文で”分散がちがうので、ノンパラメトリクスにしました”というような記述を見ると、ギャグとは言え論文にこの手のまちがいを書くのはよくないと感じる。Siegelの本のような、入門的代表的教科書にもあることで、逆のことを論文に書くのは普通ではないから、そこに暗い情念を感じてしまう。著者はきっと、この論文の結果は信じてはいけませんよ、といっているのだろう。あるいは、著者はeditorのうらみを買っているのかもしれない。論文に”なんだこりゃ”という記述を見つけても、著者が誰かを気にすることはあっても、editorが誰かを気に留める人は少ないからだ。
 U検定の理屈を理解している人にとっては蛇足だが、同じように考えるとランダマイゼーション検定にも不等分散の時にはまずいものがかなりあることがわかるーこれについてはまた別の機会に。

|

« [機材]夢の自動車 | トップページ | [その他]スーパーボウル »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック


この記事へのトラックバック一覧です: [統計]ノンパラメトリクスと分散:

« [機材]夢の自動車 | トップページ | [その他]スーパーボウル »