« [鳥だの森だの]虫の目レンズ | トップページ | [統計]二項分布のベイズ推定-続 »

2007.12.18

[統計]二項分布のベイズ推定

 ベイズ統計の入門的な教科書などには、たいてい出てくる例として、二項分布のベイズ推定がある。二項分布は生存と死亡とか、メスであるかオスであるかといった、二つの結果のどちらかになる現象を扱うときに基礎になる分布で(ここでは、成功と失敗という2つの結果にした)、分布を決めるパラメーターは確率が1つだけである。n回のトライのうちx回成功する確率は、1回の成功確率をθとすると、
 n!/x!/(n-x)!・θ^x・(1-θ)^(n-x)
である。
 データが二項分布の場合、事前分布(prior)をベータ分布にすると事後分布もベータ分布になる。ベータ分布を2つの母数を使って、Be(α、β)とあらわすとすると、平均(期待値)はα/(α+β)、分散はαβ/(α+β)^2/(α+β+1)となる。モード(最頻値)は、α,β>1のとき(α-1)/(α+β-2)である。

 事前分布がBe(α、β)で、データはn回うち成功x回で失敗(n-x)回とすると、事後分布はBe(α+x、β+(n-x))となる。
 点推定値を事後平均とすると、(α+x)/(α+β+n)となるわけである。たとえば、フラットな事前分布(一様分布)はBe(1、1)だが、このとき、点推定値は(1+x)/(2+n)となる。事前分布をBe(0.5、0.5)とすると、0.5をはさんで対称で両端(0と1)が高いものになるが、このとき、点推定値は(0.5+x)/(2+n)となる。nが大きくないときには、このどちらも最尤推定値(当然のようにx/n)とは異なっている。事後平均がx/n(最尤推定値と同じ)となるのは、Be(0、0)に相当する場合で、1/{φ(1-φ)}のような形になる(0と1という両端がそびえたった形)。フラットな事前分布だと点推定値は最尤推定値と言われていることもあるが、この場合にはちがっている
  事後モードだと、(α+x-1)/(α+β+n+2)で、事前分布がフラットなBe(1、1)ならx/n、事前分布をBe(0.5、0.5)とすると(x-0.5)/(n-1)である。
 もっとも、どの場合でもnがすごく大きければx/nみたいなものなので(分散を計算するときにn-1で割って不偏分散を計算するといった話題のように)、細かいことといえば細かいことではある。

 さて、n回の全部が失敗(ないし全部が成功でも同じ、その場合には、フリースローかPATの連続成功でも想定してください)という場合を考えてみよう。nが5回(つまり5連続失敗)と50回の場合を比べてみると最尤推定値ではどちらの場合もθは0である。シーズン当初から5打席連続凡退のバッターよりも50打席連続凡退の打者の方が打てなそうな気がするのだが。ベイズ推定だと、Be(0,01)にあたるような事前分布を考えない限り、事後平均は1回の失敗ごとにしだいに左つまり0方向に寄ってくる。この方が直感(私の場合)に近いような気がしている。

|

« [鳥だの森だの]虫の目レンズ | トップページ | [統計]二項分布のベイズ推定-続 »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック


この記事へのトラックバック一覧です: [統計]二項分布のベイズ推定:

« [鳥だの森だの]虫の目レンズ | トップページ | [統計]二項分布のベイズ推定-続 »