[本][統計]『「ニセ医学」に騙されないために』と2×2分割表
『「ニセ医学」に騙されないために』(NATROM著、メタモル出版)を読んだ。知らないことも多く勉強になった。
(本自体の主な趣旨からは少し外れるかもしれないが)「ニセ医学」には、2×2分割表でみると、問題のものの効果を示すにはデータが欠落しているものが少なくないと感じた。
2×2分割表は、統計的なデータの解析ではよく登場する、最も基礎的かつシンプルなデータの構造の1つである。”ある”と”ない”のような2つの場合しかとらない要因があると、4つの場合があることになる。この4つの場合のそれぞれに該当する”もの”の数(一番よく出てくるのは、ヒトの人数はじめ生物の個体数だが、生物の数でなくてもよい)を2×2の行列の形にまとめたもので、以下のようなものである、
上の例では2つの要因は、1つが”Xである/Xでない”で、もう1つが”Yである/Yでない”である。たとえばXでありYでもある”もの”の数がAである。
2×2分割表は、効果が定性的に測られるときに、ある実験処理と対照区を比較するような場合によく登場する。この場合には、以下のようになる
たとえば、ある実験処理をしたらYである割合が高くなることを調べたいなら、その実験処理を行わない対照でのYである割合と比べる必要がある。上の表だと、A/(A+B)とC/(C+D)を比べる必要がある。実験処理をしたときの数であるAとBがわかっただけではその実験処理に効果があるかどうかはわからない。対照でも同じくらいの割合でYであるかもしれないからである。また、実験処理をしたらYであった例がたくさんあっても、実験処理の効果を示すことにはならない。対照での割合がわからないことに加えて、Aが大きくてもBも大きければYである割合は高くはないかもしれないからである。
2×2分割表での4つの数がそろわないと実験処理の効果は示せないというのは、おそらく自然科学をはじめとする分野で実験や調査のデータの解析をする際には、ごくごく常識的なことだろう。
「ニセ医学」の場合には、以下のような2×2分割表を考えるといいだろう、
病気に効果があると主張されるもの(方法でも同じである)Zがあると症状が改善された人がたくさんいるというのは、2×2分割表の4つの数のうち1つだけ(上の表だとAだけ)しかわからない場合にあたる。Zありでも症状が改善されなかった人数(B)やZなしの対照でのそれぞれの人数(CおよびD)がわかることが、Zが症状改善に効果があることをいうためには必要であり、Aだけでは効果について何も言えない。
Zがあると高い率で症状が改善した、すなわちZありで症状が改善した人が改善しなかった人に比べてかなり多かったというのは、2×2分割表では4つの数のうち2つだけ(AとB)しかわかっていないことにあたる。CとDが必要であり、それは対照との比較が必要であることにあたる。
Aだけしかわかっていない場合にZの効果があるという誤解はしそうもないと思うかもしれない。だが、おそらく、よく注意していないと意外に誤った印象ができやすいと思う。たとえば、テレビで視聴者に何かの動作をしてもらいその動作後に体が軽く感じたら指定の電話番号に電話してくださいと呼びかけたとする。たくさんの電話がかかってきたらその動作に体を軽く感じさせる効果があるような印象を持つ人は少なくないだろう。非常に多数の電話がかかってきたとしてもそれは、上記のAだけがわかったにすぎない。あと3つの数がわかる必要がある。その動作後に体が軽く感じなかった人数(上記のB)、その動作をしなかった人で体が軽くなったと感じた人数と感じなかった人数(上記のCおよびD)がわかる必要があるのである。
2×2分割表は統計的なデータ解析ではもっとも基礎的なものの1つで、シンプルであるけれども、結構役に立つと思った。ただ、『「ニセ医学」に騙されないために』に出てくる例に立ち向かうためには、それだけでは充分ではなく、対照の取り方(盲検と二重盲検をはじめ)などの他の知識も必須になるだろう。
2×2分割表の分析についてはよくわかっており、統計的なデータの解析の教科書を見ればよい。予備知識を要求されるが、『離散多変量データの解析』(柳川尭著、共立)や『カテゴリカル・データ解析入門』(アグレスティ著、サイエンティスト社)は、2×2分割表の分析について詳しいだけでなく、そこからの発展も扱われている。
| 固定リンク | コメント (0) | トラックバック (0)
最近のコメント