« [九大]九大を舞台にした小説 | トップページ | [香椎・千早]西鉄宮地岳線-廃止予定区間 »

2007.02.11

[統計]対数正規分布しかし平均値・・・

 データが対数正規分布(あるいはそれに近い)と来れば、対数変換して変換した後の値をデータと見て分析する、というのが伝統的な常套手段だった。ある程度複雑なモデルを扱う道具には事実上、ほとんど正規線形モデルしかなかったことを考えると、対数正規分布を対数変換した後の値は(当たり前だが)正規分布するから、その点でも調子がよさそうである。
 しかし、元のデータ(対数変換する前)と対数変換した後では、平均値の大小は一致するとは限らない(このことは以前にも書いた)。もとの値での平均値を問題にしたいのなら、対数変換が不都合であることは生態学でのデータ解析にたずさわってきた人々が経験してきたところだろう(比較的新しいところでは生物科学の久保拓弥さんの解説を参照)。
 では、データが対数正規分布で、もとの値での平均値を問題にしたいときには手も足も出ないのかと言うと、そんなことは別にない。たとえば、あまりに単純と言われそうだが、対数正規分布のパラメーターを取り直して最尤法を使えば、尤度に基づく、推定、検定、モデル選択が使える。
 正規分布の確率密度関数は
1/{√(2πσ^2)}・exp{-(x-μ)^2/(2σ^2)}
だから、対数正規分布の確率密度関数は、
1/{x√(2πσ^2)}・exp{-(logx-μ)^2/(2σ^2)}
で、平均値(期待値)はexp(μ+σ^2/2)、分散は、(平均値)^2・{exp(σ^2)-1}
である。そこで、平均値(期待値)を仮にγ、分散を仮にδとでもして、対数正規分布の確率密度関数をμとσではなくγとδの式に書き直せばよいわけである。
 この項には続編があります。

|

« [九大]九大を舞台にした小説 | トップページ | [香椎・千早]西鉄宮地岳線-廃止予定区間 »

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: [統計]対数正規分布しかし平均値・・・:

« [九大]九大を舞台にした小説 | トップページ | [香椎・千早]西鉄宮地岳線-廃止予定区間 »