« [大学]寒い教室 | トップページ | [大学]大掃除2 »

2005.12.21

[統計]交互作用(その3)

 差でなく比が同じであることが、効果が同じであることを意味するとき、データの対数をとったものを使って分散分析すればいいと思った人は、年配の方々には少なくないだろう。対数をとった後の値が正規分布するような分布を対数正規分布と呼ぶ(初めて聞いたときには逆ではないかと思った)が、平均が大きくなると標準偏差もそれに比例して大きくなる(変動係数が一定だということになる)分布の1つなので(ここで、他の分布をすぐ連想するかどうかは年齢で分かれてしまうかもしれない、ある程度若いと”ガンマ分布だ”とすぐに反応がありそうだ)、「差でなく比に注目」+「対数正規分布」なら、データの対数をとったものを分散分析すれば一挙解決する、いわば”黄金の組み合わせ”に見える。
 だが、対数をとる操作と平均をとる操作は前にも書いたが交換可能ではない。だから、そんなうまい話は陥穽の上のしならない細い棒(綱より渡りにくいらしい)というところである可能性が大きい(あるいは、私が経験したように陥穽そのものか)。さて、データが対数正規分布しているとして、対数をとった後(当然、正規分布)の平均をμ、分散をσ^2としよう。では、もとの、対数をとる前のデータの平均はどうなるだろうか。対数の逆だから指数関数でexp(μ)とは、いかない。平均を取る操作と対数は交換可能ではなかった。対数をとる前のデータの平均はexp(μ+0.5σ^2)である。
 『でも、対数をとったあとの平均がcだけずれていたとすると・・・』とまだ未練が残る人はいるだろう:
対数をとる前のデータの平均はexp(μ+0.5σ^2)と、exp(μ+c+0.5σ^2)だから、その比はexp(c)で一定
→対数をとったあとでの一定の差は、もとのデータの平均の一定の比になる
→「差でなく比に注目」+「対数正規分布」なら、対数をとって解決
というわけである。
 これは、もちろん、実際に、比に注目している場面で対数変換&分散分析はどうかと悩んだ人にとっては、もう少しましな冗談を探せ、といったものだろう。分散分析での悩みの種の1つは不等分散だが、実際には検定して分散に有意な差がなければそれでよしとしているのが普通であろう。1.4倍くらいのちがいなら『分散は似たようなものだった』という反応はごく普通だろうし、2倍(標準偏差なら1.4倍くらい)のちがいでも『大きなちがいはなかった』とほっとしたことのある人もいることだろう。だが、対数正規分布+対数変換の場合、分散分析のときの1.4倍のちがいは、

 exp(μ+0.5σ^2)と、exp(μ+c+0.5σ^2)だから、その比はexp(c)で一定

ではなくて、

 exp(μ+0.5σ^2)と、exp(μ+c+0.5×1.4×σ^2)だから、その比はexp(c+0.2σ^2)で分散に依存して一定ではない

となる。ちがいが有意でなくても、”黄金の組み合わせ”を崩すのには充分である(これには何度はまったことか・・・おかげで自分で確かめるまでは他人の言うことを信じない度合が大きくなった)。

 分散が同じではなくても、比が等しいということは起こるので、まだまだ未練が残る人もいるだろう。私も実際には、もう少し考えてみた(だいぶ、前のことであるが)。条件1のときの処理1と処理2の平均の比と、条件2のときの処理1と処理2の平均の比を、データの対数を取ったものの分散分析の交互作用の検定でみることの妥当性を、対数正規分布という条件で考えてみるわけである。
条件1のときの処理1の場合の対数正規分布が、μ(11)とσ^2(11)
条件1のときの処理2の場合の対数正規分布が、μ(12)とσ^2(12)
条件2のときの処理1の場合の対数正規分布が、μ(21)とσ^2(21)
条件2のときの処理2の場合の対数正規分布が、μ(22)とσ^2(22)

でそれぞれ特徴付けられるとする。もとのデータの平均は、

条件1のときの処理1の場合:exp[μ(11)+0.5σ^2(11)]
条件1のときの処理2の場合:exp[μ(12)+0.5σ^2(12)]
条件2のときの処理1の場合:exp[μ(21)+0.5σ^2(21)]
条件2のときの処理2の場合:exp[μ(22)+0.5σ^2(22)]

だから、条件1と2で、処理1と処理2の平均が等しいとは、

μ(11)+0.5σ^2(11)-μ(12)-0.5σ^2(12)=μ(21)+0.5σ^2(21)-μ(22)-0.5σ^2(22)
ということである。対数変換した後の分散分析の交互作用がないとは、
μ(11)-μ(12)=μ(21)-μ(22)
だから、もう1つ、
σ^2(11)-σ^2(12)=σ^2(21)-σ^2(22)
も成り立たないと、2条件で2つの処理の平均値の比がどうしたとは言えない。分散がこんな関係になっていることもみた仕事というのは見た記憶がない(あったら、教えてください)。

 対数変換については前にも書いた。

|

« [大学]寒い教室 | トップページ | [大学]大掃除2 »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック


この記事へのトラックバック一覧です: [統計]交互作用(その3):

« [大学]寒い教室 | トップページ | [大学]大掃除2 »