« 2005年10月 | トップページ | 2005年12月 »

2005.11.30

[統計]ばらつきの他にも

 統計的方法にまつわる、まちがいには、「ばらつきを忘れた」という共通の性質を持っているものが多い。実際のデータにはばらつきがあり、理論でもばらつきがある場合を考える。たとえば、y=bx+aという回帰式を考えるとき、まったくくるいも見せることなくこの式通り(つまり正確に一直線上)などということは実際のデータでもないし回帰の理論でも考えない。その周りにばらつきが実際にはあるし、また、理論的にもばらつきがある場合(正規分布&等分散のばらつき、とか)を考える。
 ところが、ばらつきがあることはよく忘れられ、まちがいの源になる。

 と思っていた。そういうまちがいが多いことはその通りなのだが、少し前から、「y=bx+a」という類のところにも少なくない誤りが埋まっていることに気づいた。だいぶよく使われるようになった一般化線形モデルなら、リンク関数を決めるところでまちがうということである。ばらつきではなく、期待値との関係、決定論的な部分は、それぞれの分野ごとの知識によるのが当然で、いわば、それぞれの分野の魂の表出だと言っても(やや大げさではあるが)、多くの方は認めてくれると思うのだが。そっちでまちがってどうする、と思う。前に書いた交互作用の話はこの例でもある。

| | コメント (0) | トラックバック (0)

« 2005年10月 | トップページ | 2005年12月 »