« [その他]デブキャンプ | トップページ | [統計]生態学会にて »

2010.03.12

[統計]交互作用項があるときの主効果の意味

 一般化線形モデル(GLMなどで)、説明変数として変数そのもの以外に交互作用も入っている場合をよく見かける。たとえば、説明変数が2つあってx1とx2だとすると、さらにx1とx2の交互作用も説明変数として入っているといったケースである。こういうとき、交互作用に対して、x1やx2そのもののことを主効果と呼ぶことがよくみられる。
 では交互作用の項と主効果の両方が説明変数に入っている時に、主効果の回帰係数の意味はいったいどんなものだろうか。昨年の生態学会の続きで少しまとめてみた(今回の生態学会では、自由集会と一般講演(口頭)で、両方とも別の話題について発表する)。
 たとえば、説明変数がx1とx2と2つあって、x1が連続量の変数、x2がカテゴリカルな2値の変数である場合を取り上げてみる。x2には、よく見られる取り扱いのように、ダミー変数を割り当てて、0か1という値になる。説明変数として、x1,x2,x1とx2の交互作用の3つで分析したときの、x1の回帰係数は、x2=0であるデータだけを使って説明変数をx1だけにして(x2=0のデータだけなので、x2の入れようもないが)分析したときのx1の回帰係数と同じである。つまり、データの一部(x2=0であるデータだけ)だけ使ってx1の効果を見たときと同じになるー言い換えると、他の説明変数が名義変数であるとき、交互作用と主効果を入れて分析したときの主効果とは、データの一部だけについて問題の説明変数の効果を見て意味する、ということになる。
 本体はウェブサイトにおいてある。

|

« [その他]デブキャンプ | トップページ | [統計]生態学会にて »

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: [統計]交互作用項があるときの主効果の意味:

« [その他]デブキャンプ | トップページ | [統計]生態学会にて »