« [統計]GLMの交互作用-余 | トップページ | [統計]GLMの交互作用-続々 »

2007.12.23

[統計]GLMの交互作用-続

 昨日書いたように、交互作用が2つの説明変数の値の積という新しい説明変数の効果だと、回帰の性質としてよく知られていることからみると変なことが起こるのではないかとはすぐ考えられる。2つの説明変数が両方とも負の値の場合に積は正の値になったりもする。
 たとえば、簡単な直線回帰(正規線形モデルを念頭におく)を考えてみる。簡単といっても交互作用を考えるので2つの説明変数は最低必要で(直線回帰ではなく)重回帰になる。説明変数はx1とx2とし、目的変数をyとする。まず交互作用の項がない場合、決定論的な式は以下のように書ける、

(y-my)=b1(x1-m1)+b2(x2-m2)

ここで、m1はx1の、m2はx2の、myはyの、平均である。すべてのデータ点でx1が同じ値だけ変化しても、回帰係数つまり傾きb1,b2には影響がない。x2についても同じである。x1=w1+c1、x2=w2+c2と、すると、上の式は、w1の平均をa1、w2の平均をa2として、

(y-my)=b1(w1-a1)+b2(w2-a2)

と書き直せて、(y-yの平均)={偏回帰係数(説明変数-説明変数の平均)}の和というかっこうになっている。
これは直線回帰などについてはよく知られた性質である。
 次に交互作用として積の項が入った場合、

(y-my)=d1(x1-m1)+d2(x2-m2)+d3(x1x2-m12)

となる。m12は(x1かけるx2)の平均である。交互作用がない場合と同様にすると、

(y-my)=d1(w1-a1)+d2(w2-a2)+d3{(w1+c1)(w2+c2)-(w1+c1)(w2+c2)の平均}

となる。(w1かけるw2)の平均をa12とすると、

(y-my)=d1(w1-a1)+d2(w2-a2)+d3{w1w2-a12+c2(w1-a1)+c1(w2-a2)}

となって、(y-yの平均)={もとと同じ値の偏回帰係数(新しい説明変数-新しい説明変数の平均)}の和、というかっこうにならない。

 つまり、説明変数の測定値の単位のとり方が変わるなどで、値が定数だけ増える(減る)と、回帰係数(偏回帰係数)の値は保存されないことがわかる。積の項が入ってない重回帰とはだいぶちがうわけである。(上の式の比較からうかがえることは他にもあるがそれは別項で) 説明変数が日付(適当な基点日からの日数)などのときに、基点となる日をを変えると結果が変わって、あれと思った経験のある人も少なくないだろう。
(12月25日に加筆しました)

|

« [統計]GLMの交互作用-余 | トップページ | [統計]GLMの交互作用-続々 »

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: [統計]GLMの交互作用-続:

« [統計]GLMの交互作用-余 | トップページ | [統計]GLMの交互作用-続々 »