« [統計][R]一般化線形モデルの本・余談(その1の1) | トップページ | [その他]Project X »

2012.09.17

[統計][R]一般化線形モデルの本・余談(その1の2)

 先の例をもう少しちがった角度から見てみる。x1とx2の1と0をそれぞれ入れ替えた変数を準備する。ただ、同じ変数でどちらを0どちらを1にするかが変わるだけで内容的な変化はない。以下のx1rとx2rである、
> x1r
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[37] 0 0 0 0
> x2r
[1] 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0
[37] 0 0 0 0

 まず、交互作用がないモデルで、分析してみる。x1を使うかx1rを使うか、x2を使うかx2rを使うかで、2×2の4通りやってみる。
> summary(glm(y3~x1+x2,family=gaussian))

Call:
glm(formula = y3 ~ x1 + x2, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-11.408 -3.396 0.145 2.216 10.438

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.957 1.559 7.030 2.58e-08 ***
x1 8.205 1.800 4.559 5.46e-05 ***
x2 3.245 1.800 1.803 0.0795 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 32.38911)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1198.4 on 37 degrees of freedom
AIC: 257.51

Number of Fisher Scoring iterations: 2

> summary(glm(y3~x1+x2r,family=gaussian))

Call:
glm(formula = y3 ~ x1 + x2r, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-11.408 -3.396 0.145 2.216 10.438

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 14.203 1.559 9.112 5.43e-11 ***
x1 8.205 1.800 4.559 5.46e-05 ***
x2r -3.245 1.800 -1.803 0.0795 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 32.38911)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1198.4 on 37 degrees of freedom
AIC: 257.51

Number of Fisher Scoring iterations: 2

> summary(glm(y3~x1r+x2,family=gaussian))

Call:
glm(formula = y3 ~ x1r + x2, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-11.408 -3.396 0.145 2.216 10.438

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 19.163 1.559 12.295 1.24e-14 ***
x1r -8.205 1.800 -4.559 5.46e-05 ***
x2 3.245 1.800 1.803 0.0795 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 32.38911)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1198.4 on 37 degrees of freedom
AIC: 257.51

Number of Fisher Scoring iterations: 2

> summary(glm(y3~x1r+x2r,family=gaussian))

Call:
glm(formula = y3 ~ x1r + x2r, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-11.408 -3.396 0.145 2.216 10.438

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 22.408 1.559 14.377 < 2e-16 ***
x1r -8.205 1.800 -4.559 5.46e-05 ***
x2r -3.245 1.800 -1.803 0.0795 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 32.38911)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1198.4 on 37 degrees of freedom
AIC: 257.51

Number of Fisher Scoring iterations: 2

1と0を入れ替えると、係数の絶対値が同じで符号が変わり、有意確率の値は変わらない。データに内容的な変化はないし、回帰だから当然と言えば当然である。

 次に主効果と交互作用がある場合である。やはり、4通りやってみる。
> resg3<-glm(y3~x1*x2,family=gaussian)
> summary(resg3)

Call:
glm(formula = y3 ~ x1 * x2, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-10.500 -3.598 -0.180 2.840 9.340

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8.860 1.685 5.257 6.83e-06 ***
x1 12.400 2.383 5.203 8.07e-06 ***
x2 7.440 2.383 3.122 0.00354 **
x1:x2 -8.390 3.370 -2.489 0.01756 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 28.40047)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1022.4 on 36 degrees of freedom
AIC: 253.16

Number of Fisher Scoring iterations: 2

> summary(glm(y3~x1r*x2,family=gaussian))

Call:
glm(formula = y3 ~ x1r * x2, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-10.500 -3.598 -0.180 2.840 9.340

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 21.260 1.685 12.615 8.90e-15 ***
x1r -12.400 2.383 -5.203 8.07e-06 ***
x2 -0.950 2.383 -0.399 0.6925
x1r:x2 8.390 3.370 2.489 0.0176 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 28.40047)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1022.4 on 36 degrees of freedom
AIC: 253.16

Number of Fisher Scoring iterations: 2

> summary(glm(y3~x1*x2r,family=gaussian))

Call:
glm(formula = y3 ~ x1 * x2r, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-10.500 -3.598 -0.180 2.840 9.340

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 16.300 1.685 9.672 1.5e-11 ***
x1 4.010 2.383 1.683 0.10112
x2r -7.440 2.383 -3.122 0.00354 **
x1:x2r 8.390 3.370 2.489 0.01756 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 28.40047)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1022.4 on 36 degrees of freedom
AIC: 253.16

Number of Fisher Scoring iterations: 2

> summary(glm(y3~x1r*x2r,family=gaussian))

Call:
glm(formula = y3 ~ x1r * x2r, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-10.500 -3.598 -0.180 2.840 9.340

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 20.310 1.685 12.052 3.39e-14 ***
x1r -4.010 2.383 -1.683 0.1011
x2r 0.950 2.383 0.399 0.6925
x1r:x2r -8.390 3.370 -2.489 0.0176 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 28.40047)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1022.4 on 36 degrees of freedom
AIC: 253.16

Number of Fisher Scoring iterations: 2

主効果は、係数の値も有意確率も異なることがわかる。一方、交互作用の方はあたかも交互作用がないときのように係数の符号がひっくり返るだけで、係数の絶対値や有意確率の値は変わらない。
 2水準の名義変数では、どちらを0どちらを1とするかによって、主効果の係数の値もその有意確率も異なるのである(そうなる理由は、一般化線形モデルの本で述べた)。

 これは、交互作用があるときの主効果の意味がよくわかっていない相手のとき(たとえば、”その説明変数が目的変数に与える全体的効果を表す”といった漠然とした理解をしている場合など)には、きわめて強力なごまかしの方法となるかもしれない。「相手」ではなく、自分が意味をつかんでいないときは、自分がごまかされてしまうこともありそうだ。

 また、教訓めいたことも思いつく。1つはグラフを描くことの大切さである。もう1つは、本質的には二元配置分散分析で、すでに明らかにされていることからすぐに導ける内容(ただし、分散分析をたとえば授業で聴いたり本で読んだりしたときに、必ずそこに含まれているという内容でもない。私が気がついたのは、研究を始め英語の文献を読むようになってからしばらくたってのことだった)だという点だ。

|

« [統計][R]一般化線形モデルの本・余談(その1の1) | トップページ | [その他]Project X »

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: [統計][R]一般化線形モデルの本・余談(その1の2):

« [統計][R]一般化線形モデルの本・余談(その1の1) | トップページ | [その他]Project X »