« [九大]学長 | トップページ | [その他]4分しかもたない »

2008.07.19

[統計]標準偏差の推定

 標準偏差が分散の平方根であることは、サンプルについても母集団についてもその通りである。だが、(母集団の)標準偏差を推定するとなると、平方根はかなりの厄介者である。

 分散の平方根は標準偏差なのに、不偏分散の平方根は標準偏差の不偏な推定量ではない。

 ある量(Aとする)の2乗である量(Bとする)の不偏推定量(D)が得られているとする。不偏推定量は、何度も何度もサンプリング・推定を繰り返したとき平均(期待値)が、推定されるべき母集団の値と等しくなることだから、Dの平均はBである、ということになる。では、このときに、Dの平方根(Cとしよう)はAの不偏推定値なのだろうか。そんなことはいかにも成り立たなさそうである2乗(やその逆である平方根)と平均を計算するという操作は順番を逆にすると答が。異なるからだ。たとえば、B=10で、ある推定量では半分の確率で4残りの半分の確率で16と推定されるとしよう。平均は4×0.5+16×0.5だから10であり、Bの値と同じである。この推定量は不偏ということになる。ところが、Bの平方根であるAは10の平方根だから3.16であるのに、この推定量の平方根の平均(期待値)は2×0.5+4×0.5だから3であり、等しくならない。

 よく考えてみると(計算が頭の中でするするとできる人にとっては、わずかに考えてみれば)、期待値を計算することと平方根をとることは交換可能ではないから、不偏分散の平方根は標準偏差の不偏な推定量だというのは変だ。期待値をとるという操作は多くのものの平均を計算するだけのことなのだが意外にイメージしにくいようである。

 私自身は、線形でないときには平均をとることと順番を入れ替えるとちがったものになるよ、というのは、大学院のごく最初のころに、井上民二さん(事故でなくなられた)に教わった記憶がある。

 さて、母集団分布がわかっていれば、標準偏差の不偏推定量も求められる。比較的有名なのは、正規分布の場合で、ガンマ関数がはいったちょっとややこしげな式である(柴田義貞『正規分布』東大出版会の第4章など)。

|

« [九大]学長 | トップページ | [その他]4分しかもたない »

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: [統計]標準偏差の推定:

« [九大]学長 | トップページ | [その他]4分しかもたない »