« 2012年8月 | トップページ | 2012年10月 »

2012.09.30

[千早・香椎]国道3号線香椎浜団地入口交差点の角

 国道3号線の香椎浜団地入口交差点の北側の角(香椎スポーツガーデンの一角で、前はペペチーノという店だった)は、アル カシーノ(al casyno)というレストランになっている。ハルフードシステムという会社で、庄屋のグループの1つだそうだ。

| | コメント (0) | トラックバック (0)

2012.09.23

[その他]ラクロス

 1週間ほど前、ラクロスでは、男女で、1チームの人数がちがうのを知った(男子10人、女子12人とのこと)。
バスケットボール、バレーボール、サッカー・・・・・・と男女両方で競技しているのを見聞きしたことのあるスポーツを考えてみたが、他に人数がちがうものをなかなか思いつかない。

| | コメント (0) | トラックバック (0)

[NBA]移籍

 もう1月ほどでNBAも開幕だが、今季の何と言っても、ナッシュとドワイト・ハワードという、PGとCのスターを獲得したロサンゼルス・レイカーズが気になってしまう。ナッシュは優勝の最後のチャンスだろう。

| | コメント (0) | トラックバック (0)

[その他]Project X

 NHKの番組にそういうのがあったが、アメリカの映画にもあるそうだ。

| | コメント (0) | トラックバック (0)

2012.09.17

[統計][R]一般化線形モデルの本・余談(その1の2)

 先の例をもう少しちがった角度から見てみる。x1とx2の1と0をそれぞれ入れ替えた変数を準備する。ただ、同じ変数でどちらを0どちらを1にするかが変わるだけで内容的な変化はない。以下のx1rとx2rである、
> x1r
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[37] 0 0 0 0
> x2r
[1] 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0
[37] 0 0 0 0

 まず、交互作用がないモデルで、分析してみる。x1を使うかx1rを使うか、x2を使うかx2rを使うかで、2×2の4通りやってみる。
> summary(glm(y3~x1+x2,family=gaussian))

Call:
glm(formula = y3 ~ x1 + x2, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-11.408 -3.396 0.145 2.216 10.438

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.957 1.559 7.030 2.58e-08 ***
x1 8.205 1.800 4.559 5.46e-05 ***
x2 3.245 1.800 1.803 0.0795 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 32.38911)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1198.4 on 37 degrees of freedom
AIC: 257.51

Number of Fisher Scoring iterations: 2

> summary(glm(y3~x1+x2r,family=gaussian))

Call:
glm(formula = y3 ~ x1 + x2r, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-11.408 -3.396 0.145 2.216 10.438

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 14.203 1.559 9.112 5.43e-11 ***
x1 8.205 1.800 4.559 5.46e-05 ***
x2r -3.245 1.800 -1.803 0.0795 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 32.38911)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1198.4 on 37 degrees of freedom
AIC: 257.51

Number of Fisher Scoring iterations: 2

> summary(glm(y3~x1r+x2,family=gaussian))

Call:
glm(formula = y3 ~ x1r + x2, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-11.408 -3.396 0.145 2.216 10.438

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 19.163 1.559 12.295 1.24e-14 ***
x1r -8.205 1.800 -4.559 5.46e-05 ***
x2 3.245 1.800 1.803 0.0795 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 32.38911)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1198.4 on 37 degrees of freedom
AIC: 257.51

Number of Fisher Scoring iterations: 2

> summary(glm(y3~x1r+x2r,family=gaussian))

Call:
glm(formula = y3 ~ x1r + x2r, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-11.408 -3.396 0.145 2.216 10.438

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 22.408 1.559 14.377 < 2e-16 ***
x1r -8.205 1.800 -4.559 5.46e-05 ***
x2r -3.245 1.800 -1.803 0.0795 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 32.38911)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1198.4 on 37 degrees of freedom
AIC: 257.51

Number of Fisher Scoring iterations: 2

1と0を入れ替えると、係数の絶対値が同じで符号が変わり、有意確率の値は変わらない。データに内容的な変化はないし、回帰だから当然と言えば当然である。

 次に主効果と交互作用がある場合である。やはり、4通りやってみる。
> resg3<-glm(y3~x1*x2,family=gaussian)
> summary(resg3)

Call:
glm(formula = y3 ~ x1 * x2, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-10.500 -3.598 -0.180 2.840 9.340

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8.860 1.685 5.257 6.83e-06 ***
x1 12.400 2.383 5.203 8.07e-06 ***
x2 7.440 2.383 3.122 0.00354 **
x1:x2 -8.390 3.370 -2.489 0.01756 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 28.40047)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1022.4 on 36 degrees of freedom
AIC: 253.16

Number of Fisher Scoring iterations: 2

> summary(glm(y3~x1r*x2,family=gaussian))

Call:
glm(formula = y3 ~ x1r * x2, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-10.500 -3.598 -0.180 2.840 9.340

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 21.260 1.685 12.615 8.90e-15 ***
x1r -12.400 2.383 -5.203 8.07e-06 ***
x2 -0.950 2.383 -0.399 0.6925
x1r:x2 8.390 3.370 2.489 0.0176 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 28.40047)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1022.4 on 36 degrees of freedom
AIC: 253.16

Number of Fisher Scoring iterations: 2

> summary(glm(y3~x1*x2r,family=gaussian))

Call:
glm(formula = y3 ~ x1 * x2r, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-10.500 -3.598 -0.180 2.840 9.340

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 16.300 1.685 9.672 1.5e-11 ***
x1 4.010 2.383 1.683 0.10112
x2r -7.440 2.383 -3.122 0.00354 **
x1:x2r 8.390 3.370 2.489 0.01756 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 28.40047)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1022.4 on 36 degrees of freedom
AIC: 253.16

Number of Fisher Scoring iterations: 2

> summary(glm(y3~x1r*x2r,family=gaussian))

Call:
glm(formula = y3 ~ x1r * x2r, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-10.500 -3.598 -0.180 2.840 9.340

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 20.310 1.685 12.052 3.39e-14 ***
x1r -4.010 2.383 -1.683 0.1011
x2r 0.950 2.383 0.399 0.6925
x1r:x2r -8.390 3.370 -2.489 0.0176 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 28.40047)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1022.4 on 36 degrees of freedom
AIC: 253.16

Number of Fisher Scoring iterations: 2

主効果は、係数の値も有意確率も異なることがわかる。一方、交互作用の方はあたかも交互作用がないときのように係数の符号がひっくり返るだけで、係数の絶対値や有意確率の値は変わらない。
 2水準の名義変数では、どちらを0どちらを1とするかによって、主効果の係数の値もその有意確率も異なるのである(そうなる理由は、一般化線形モデルの本で述べた)。

 これは、交互作用があるときの主効果の意味がよくわかっていない相手のとき(たとえば、”その説明変数が目的変数に与える全体的効果を表す”といった漠然とした理解をしている場合など)には、きわめて強力なごまかしの方法となるかもしれない。「相手」ではなく、自分が意味をつかんでいないときは、自分がごまかされてしまうこともありそうだ。

 また、教訓めいたことも思いつく。1つはグラフを描くことの大切さである。もう1つは、本質的には二元配置分散分析で、すでに明らかにされていることからすぐに導ける内容(ただし、分散分析をたとえば授業で聴いたり本で読んだりしたときに、必ずそこに含まれているという内容でもない。私が気がついたのは、研究を始め英語の文献を読むようになってからしばらくたってのことだった)だという点だ。

| | コメント (0) | トラックバック (0)

2012.09.16

[統計][R]一般化線形モデルの本・余談(その1の1)

 まずデータである。x1とx2が説明変数、y3が目的変数である(以下、計算はRによる)、
> x1
[1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[37] 1 1 1 1
> x2
[1] 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1
[37] 1 1 1 1
> y3
[1] 11.7 18.2 10.5 8.7 6.6 13.0 4.7 10.1 4.2 0.9 7.8 14.5 16.1 24.2
[15] 23.8 24.5 15.9 15.0 5.8 15.4 29.6 23.6 18.7 14.9 21.9 24.1 25.8 19.0
[29] 17.3 17.7 14.0 28.5 19.3 23.6 22.0 11.0 22.4 22.9 16.6 22.8

交互作用プロット(説明変数の値の組み合わせごとの目的変数の値の平均)を描くと、
Web2012091601

となる。説明変数x2の目的変数への効果は、もう1つの説明変数であるx1が0であるか1であるかにより、プラスマイナスが逆になっていることがグラフからは見てとれる。
 これをglm関数で分析する(誤差構造はgaussianとした)、
> resg3<-glm(y3~x1*x2,family=gaussian)
> summary(resg3)

Call:
glm(formula = y3 ~ x1 * x2, family = gaussian)

Deviance Residuals:
Min 1Q Median 3Q Max
-10.500 -3.598 -0.180 2.840 9.340

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8.860 1.685 5.257 6.83e-06 ***
x1 12.400 2.383 5.203 8.07e-06 ***
x2 7.440 2.383 3.122 0.00354 **
x1:x2 -8.390 3.370 -2.489 0.01756 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for gaussian family taken to be 28.40047)

Null deviance: 1976.9 on 39 degrees of freedom
Residual deviance: 1022.4 on 36 degrees of freedom
AIC: 253.16

Number of Fisher Scoring iterations: 2

有意確率は先に書いた状況になっていることがわかる。しかし、グラフからも読みとれるように、主効果が有意(1%水準で)な説明変数x2の目的変数への効果は、もう1つの説明変数(x1)が0か1かにより、符号が逆で、定性的にも異なる。

| | コメント (0) | トラックバック (0)

[統計]一般化線形モデルの本・余談

 一般化線形モデルの本が出て、いくつか関係する質問を頂いた。交互作用と主効果について、とくに検定との関係(本では、検定だけにかかわるわけではなく、もっと一般性のある問題なので、検定との関係では説明は簡単になっている)について述べておく。
 以下の疑問について考えてみる

 「交互作用も主効果も有意であり、主効果の有意確率(いわゆるP値)が交互作用の有意確率よりも小さい」ならば、ある説明変数が目的変数に与える効果は、量的には他の説明変数の値に依存するものの、定性的(たとえばプラスかマイナスか)は他の説明変数の値が変わっても同じであり、その説明変数の主効果の検定結果で表される、となるか。

 たとえば、2つの説明変数があって、どちらも2値(2水準)の名義変数だとする(値は0と1とする)。この2つの説明変数自体とその間の交互作用も入れたモデルで検定すると、主効果はどちらの変数も有意で、交互作用も有意であり、有意確率がたとえば両主効果がP=0.0012とP=0.00022、交互作用がP=0.015のように、交互作用の方が大きいといった場合である。このとき、説明変数の効果は、量的には変化するが、定性的には他の説明変数が0か1かによらず目的変数にプラスの効果(あるいはマイナスの効果)を持つと言っていいのか、という問題である。さらにその目的変数への効果は、その変数の主効果の検定が示すのか、である。
 
 結論は、そのように解釈してはいけないということである。以降、2回の予定で、反例を示して見る。交互作用があるときの主効果とは何者なのかの説明は、一般化線形モデルの本をご覧ください。

| | コメント (0) | トラックバック (0)

[千早・香椎]城浜団地入口交差点角のローソン

 国道3号線の城浜団地入口交差点の南側角で工事をしていたコンビニはローソンで、少し前に開店している。「福岡名島三丁目」という店名だそうだ。国道3号線を少し香椎側に行った、香椎浜団地入口交差点の角にもローソンがある。距離は道沿いで500mか600mだろう。

| | コメント (0) | トラックバック (0)

2012.09.13

[千早・香椎] 香椎フェスティバルガーデン隣の新築マンション

 国道3号線沿いの香椎フェスティバルガーデン(住所でいうと香椎団地)の隣のマンションは、スポデポの南側、国道3号線から見るとサイゼリヤなどの奥に姿を見せてきている。

| | コメント (0) | トラックバック (0)

« 2012年8月 | トップページ | 2012年10月 »