[統計]2つの帰無仮説
計量的なデータでは、2つの変数の間に相関がないときを帰無仮説とすることが多い。だから、xとy/xの相関を調べたりすると、あほかと言われたりすることになる。xとyという2つの無相関の変数があったときに、xとy/xの相関を見れば、ほとんどxとxの逆数の関係を見ているようなもので、負の相関があって当たり前だからだ。これはx+yとx/(x+y)とかでも同様である。
一方、計数的なデータでは2つの変数が比例しているのが帰無仮説ということがよくある(むしろ、普通かも)。比例しているのだから(もっとも期待値の話だが)、強い正の相関があるわけで、それを帰無仮説にしている。たとえば、生存数と死亡数だ。生存数と死亡数の比が一定という場合を帰無仮説にするのはごく普通である。生存数と死亡数が無相関のとき、つまり死亡数がいくら多くても少なくても生存数が(平均的には)あまり変わらないなら、それはかなり変わったことが起こっていると考えるのが普通である。だから、生存率を総個体数に対してプロットしてみたりするのは(それの相関係数rをそのまま検定というわけにはいかないが)、計量的なデータの場合とはちがってすごくおかしいということはない。逆に、計数的なデータ、たとえば、生存数を横軸に、死亡数を縦軸にプロットして、右上がりの傾向があり、有意な正の相関が・・・とか言い出すと、周囲はおかしさを指摘してくれはずだ(指摘してくれないときは、周囲が言い出した人に対してよほど冷たいか、そのデータに極度に関心がないかであろう)。
ここまでは、教科書的な知識で多くの人はいまさらと思うだろう。「計数的なデータと計量的なデータでの帰無仮説のちがい? 呼び方はちがうけど、そんなものは頭の中のROMに焼いてある。知らないやつなんているのか」とか言われそうだ。”もぐりでも知っている”という部類かもしれない。
さて、ときたま、計数的なデータのくせに計量的なデータの帰無仮説とそっくりの仮説が登場することがある。性比の例などがそうだ。そういうときにはどういう誤差分布を考えるのか、とか思うと頭がくらくらしたことがある。
| 固定リンク | コメント (0) | トラックバック (0)
最近のコメント