« [統計]交互作用(その2) | トップページ | [九大]郵便局と銀行 »

2005.08.24

[統計]ばらつきを比べる

 データの大小ではなく”ちらばり具合”とか”ばらつき”とか呼ばれるものを比べたいことがある。そういうものを比べるのは、比較的よく出会う場面であり、珍しくはない。だが、”ばらつき”の比較は難物であることも多い。どういう量を使って、”ばらつき”なるものを比較するか、ということは、何も考えなくても決まっているわけでは(全然)ない。よく出てくるのは、分散(つまり平均との差の2乗をすべてのデータで平均したもの、”ばらつき”が大きければ平均から遠くにあるデータが多いだろうというわけだ)、分散の平方根である標準偏差だろう。他にも、標準偏差を平均で割った変動係数を使ったことのある人もいるだろうし、ある程度年齢のいった生態学者なら分散を平均値で割ったもの(index of dispersion、空間分布でおなじみ)が使われているのを見ているだろう。分散と標準偏差の関係はいいとしても、分散と変動係数では、大小が逆になるような2セットのデータを考えるのは容易である。分散と変動係数とindex of dispersionのどれを使って”ばらつき”を評価するかで、いくつかのデータセットのあいだの”ばらつき”の大きさの順番が変わってしまうような例に遭遇することは(扱うデータによっては)珍しくも何ともないーそのうちごまかし集に収録しようと思っていた。この3つのどれを使っても、同じになるようなデータしか憶えていない者は幸せである。
 もちろん、”ばらつき”の意味が量的にはっきりしていれば、どれを使うか(あるいは別の何を使うのか)は明白だろう。意外なことかもしれないが、誰かがきちんと詰めていない限り、ある分野でのある量でどういうものが”ばらつき”の指標としてなぜ適切か、あいまいなことはよくある。データの取り扱いを相談されたときに、この、”ばらつき”の意味が相談する側の本人にもはっきりしないことは、しばしば、沈黙、気まずさ、問題が解決されないままの状態、感謝されない相談された側、をもたらす。人の世に落ちた、増殖する不幸の種子のようだ。
 さて、”ばらつき”の意味が量的にはあいまいなままになっていることが少なくないことにいったん気づいてしまうと、”ばらつき”と口に出すたびに、相手の表情が気になるようになる。相談されて、(私が)あなたの言う”ばらつき”の意味は式やグラフで書けるとしたらどんな感じでしょうか、という意味のことを聞くと、相談者は私が必要な知識を持っていないと判定して話を打ち切ることがよくある。これは私にとっては時間の有効利用かつ新しい小さなテーマの供給なので、長く続く沈黙などに比べるとはるかに大きな利益となる。数年前になるが、”ばらつき”の意味が何なのかが直接問題になる仕事をさせてもらい(reproductive skewというものである)、AmericanNaturalist(変わった名前だが、伝統ある、しかも割合、理屈っぽい雑誌であるー私は大昔の表紙が好きだった)の論文に結実したので、”ばらつき”の意味があいまいなままでそれが研究上現実的な問題にふくらむかすかなにおいは見逃しがたい(あのテーマを私に教えて一緒に取り組んでくれたTさん[沖縄にいる]には感謝の言葉しかない)。

|

« [統計]交互作用(その2) | トップページ | [九大]郵便局と銀行 »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック


この記事へのトラックバック一覧です: [統計]ばらつきを比べる:

« [統計]交互作用(その2) | トップページ | [九大]郵便局と銀行 »