« [香椎・千早]西鉄宮地岳線-廃止予定区間 | トップページ | [統計][本]Applied Smoothing Techniques for Data Analysis »

2007.02.13

[統計]比(割合)が一定と交互作用と

 2つの要因や変量(説明変数)が目的変数に影響しているとき、よく交互作用が問題になる。片方の説明変数の効果は、もう片方の説明変数の値によらないかどうか、である(よらないことを交互作用がないと言うわけだが)。この”効果”はなかなか曲者であるー時と場合により姿がちがうから。
 もちろん扱うデータによるが、重さ、長さといった比(率)尺度のデータは多くの分野で普通に登場する。比(率)尺度の特徴は2つのデータの比が意味を持っていることである。たとえば、重さが2倍とか長さが1.69倍とか財布の中のお金が(私の)100倍とか。そこで、「効果が同じ」も比尺度のデータでは、「比が同じ」を意味することが少なくない(むしろそれが普通なこともある)。「品種Aと品種Bである薬をかけたときに対照区に比べて体重に与える効果が異なるか」といたとき、品種Aでも品種Bでも10kg増えることが効果が同じということもあるだろうし、どちらでも10%増えることが効果が同じである、ということもあるだろう。後者がここで言う「比が同じ」である。
 交互作用と言うと分散分析をまっさきに連想する人は少なくないだろうが、前にも書いたように、分散分析はこの「比が同じ」を調べるのが得意ではない(というより、調べるためのものではない)。分散分析の交互作用がないはもちろん「差が同じ」である。目的変数を対数変換して正規線形モデル(その代表的な1つが分散分析)を使えばいいのではないかと思った人は、甘い(これは少し前にも書いた)。「誤差分散」「もとのスケール」という2つの”壁”がたちはだかっている。最初の”壁”だけでもかなりのもので、「比が同じ」を調べたいからといって誤差分散は対数変換向きに変化してくれるとは限らない(自分の経験を言えば、「比が同じ」を調べたいときには誤差分散は対数変換向きに変化しないという印象である)。これを考えると一般化線形モデル(GLM)の威力を実感する。
 だいぶ(20年以上)前になるが、データが等分散の正規分布でしかも「比が同じ」を調べたいときにはどうしたらいいのだろうかと考えざるをえなくなったことがある。目的変数を対数変換すれば等分散ではなくなる。このときは変数変換せず分散分析を変形したが、一般化線形モデル(GLM)がそのとき使えればずっと楽で時間もかからなかったはずである。
 どうも「比が同じ」を効果が同じと考えたほうがよさそうなのに(少しおとなしく書いてみた。考えたほうがよさそうではなく、考えるべきだということも結構ある)、分散分析して(しまって)いる研究例は決して少なくない(おそらく、”今でも少なくない、10年以上前なら普通”であろう)。『こんなのはわかりきった問題、対策は簡単』という人はかなり幸福であり、別項は読んでいただいてもおもしろくないだろう。
 この、「効果が同じ」とは何?という話(「比が同じ」か「差が同じ」かそれとも他か)についてはときどき質問されたことがある。それほど稀でもない、個人的には奇怪と思えるやりとりはまた別項で。
 

|

« [香椎・千早]西鉄宮地岳線-廃止予定区間 | トップページ | [統計][本]Applied Smoothing Techniques for Data Analysis »

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: [統計]比(割合)が一定と交互作用と:

« [香椎・千早]西鉄宮地岳線-廃止予定区間 | トップページ | [統計][本]Applied Smoothing Techniques for Data Analysis »