« [統計]ecological fallacy | トップページ | [その他]福岡市の教員採用試験問題漏洩 »

2007.01.14

[統計]なんでもノンパラメトリクス

 一時期、ノンパラメトリックな検定に凝っていたとしかいえない時期があった。動物の行動や生態では、多くの量は正規分布とはかなりちがった分布だし、等分散ということは少ない。20-30年ほど前には、連続量は正規分布&等分散を仮定した方法で、離散量はいわゆるカイ2乗検定で、それぞれ分析されるのが普通だった(いまでもその残影は意外に濃い)。等分散ではない量がでてきたときには、角度変換や平方根変換などの変数変換するのが普通で、しかも、変数変換で等分散化されないデータはよくあった。
 分布に仮定を置かないノンパラメトリックな検定(その代表はなんと言ってもMann-WhitneyのU検定[Wilcoxonの順位和検定と同値]である)を使い始めたときには、順位にしているのだからデータの情報量をかなり失っているのだろうと思っていた。すぐにMann-WhitneyのU検定の効率はt検定に対して約95%(3/π)と書いてある本を見て、意外にわずかなロスなのだと思ったのをかすかにおぼえている。数年後、(たぶんLehmannの本か論文を見て)この値は母集団が正規分布のときのもので、母集団が正規分布でなければt検定よりも効率の高いノンパラメトリックな検定があることを知った。
 ノンパラメトリックな検定を使うのがむしろ普通になると、単純な2サンプルの比較などではなくもっと複雑な状況の検定にも使いたくなるのはいわば人情だろう。すると、ノンパラメトリックな検定には不得意なことがあるのに次第に気づいていく。たとえば、交互作用である。
 私自身が何でもノンパラメトリックな検定を使うというのに近い状態ではなくなってかなり経つが、分布がよくわからないときなど(そのノンパラメトリックな検定の仮定は当然満たしている場合に)いまでもその有効性は変わらないと思う。
 そして、尤度になじんでみると、ノンパラメトリクスで使われている考え方や方法の使える範囲(わかりにくく言えば射程)は思っていたよりもだいぶ広い。

|

« [統計]ecological fallacy | トップページ | [その他]福岡市の教員採用試験問題漏洩 »

コメント

粕谷さんのノンパラメトリック検定の特徴と考えているところ,とくに最後の一文で示唆されてることをもっと知りたい気がします.
私の偏った見かたでは,順位統計量や中央値を使った検定あれこれは,「苦しまぎれの奇策」というか,統計学的な方法の「系統樹」の中で「これから先どこにも合流しない袋小路」のような印象をもっていまして……

投稿: 久保 | 2007.01.17 16:04

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: [統計]なんでもノンパラメトリクス:

« [統計]ecological fallacy | トップページ | [その他]福岡市の教員採用試験問題漏洩 »