« [本][統計]Crawleyの「The R Book」 | トップページ | [香椎・千早]紀伊国屋書店ゆめタウン博多店 »

2007.05.21

[統計]2×2分割表で考える

 2×2分割表は、統計の教科書と言えばのっていないことはまれな、基本中の基本のなかのさらに基本ともいえそうなものである。単純だがよく使われる2×2分割表は、議論の穴や誤りをさがすときにも鋭くしかも重い刃物でもある。
 2×2分割表は、テストされるものは2つの反応のどちらか(生か死、メスかオス、表か裏など)しか示さず、説明変数(処理)側もAかAでないかといった単純なものである。実験群の反応と対照群の反応を比べているだけだから、ある処理が効果があるかどうかを示すにはどういうデータが最低限あればいいかを考える教育的な目的でもよく使われてきた。
 しかし、2×2分割表を理解していれば陥りそうもない誤りに出会ってしまうことは多い。教科書にも載っている”高級なもの”(Simpsonのパラドックスなど)ではなく、もっと激しいものについてここでは書く(決してまれではない)。
 2×2分割表は4つの数字からなるわけだが、そのうち2つしか数字がないことがある。たとえば、ある要因があるときとないときの性比を比べたいのだが、要因があるときの性比だけがわかっている場合である。いわば対照群のデータがないときである。それでも高い(あるいは低い)といわれると、なんとなく高い(低い)ような気がしてきて、問題の要因の有無によってちがいがあるかのような雰囲気になっている文章や話は少なくない。
 さらに意外にひっかかりやすいのが、4つの数字のうちたった1つだけしかわかっていないときである。要因があるときの片方の反応が見られた数しかわからないという場合である。個人的にこのような場合を『自称超能力者の時計修理』と呼んでいる。超能力者と名乗る人物がTVに出演して、視聴者に動かない古い時計があったら「いまから私が念(気)を送って時計を修理するので、時計を手で持って念をうけとめ、動き出したらTV局に電話してくれ」と言ったとする。するとTV局に相当数の「直った! 動き出した!」という趣旨の電話がかかってきたとする。これは、この超能力者と名乗る人物が気を送る/送られない、と、動かなかった時計が動き出す率に関係があることを示すと言っていいだろうか。2×2分割表で考えれば、4つ必要な数字のうちたった1つしかないので、だめに決まっている。気を送ったときにも動き出さなかった数もわからなければ、気が送られなかったときの動き出した数と動き出さなかった数もわからないのである。実は気を送ったときにも動き出さなかった数はぼう大だったのかもしれないし、気が送られなかったときにも古い時計は結構な率で動きだしたのかもしれない(機械式時計は手で持って温まると動き出すことがあるそうである)。2×2分割表的状況のとき、数字が4つそろっているかみるだけでも、いくらかは、あまりの大胆にジャンプした主張に『そうかもしれない』と思ったりすることが少なくなるだろう。

 2×2分割表関連で、統計の教科書などにとりあげられる誤りはもっと入り組んだものである。統計的ごまかしについては、本にリストを作って載せたことがあるし、ここでもブロックや層別因子(あるいは共変量)をないことにする件について書いたことがある。 2×2分割表に関係する、もっと入り組んだあやまりの例については別に書く。

|

« [本][統計]Crawleyの「The R Book」 | トップページ | [香椎・千早]紀伊国屋書店ゆめタウン博多店 »

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: [統計]2×2分割表で考える:

« [本][統計]Crawleyの「The R Book」 | トップページ | [香椎・千早]紀伊国屋書店ゆめタウン博多店 »