« 2005年7月 | トップページ | 2005年9月 »

2005.08.30

[その他]仕事の途中

 調査地で調査(私の場合、観察といった方が近いかもしれない)していて、『そうか、こいつらはそういうことをしているのか』(こいつらとは対象生物を指す)とわかった(気になった)とき、目を疑うようなスペクタクルな行動が見られたときなど、”今がほんまじゃ”と感じることがある。
 データを解析しているときの感覚は漱石の「夢十夜」の運慶の回にも似ているが、やはり、”今がほんまじゃ”、”うちの仕事じゃ”と感じることがある。昨夜、その状態が来た。
 ”今やりたいんじゃ”、”うちが選んでやりよる仕事じゃ”ということだけをやらせておけば、私などはもっと時間当たり生産性が高いと思うのだが。

””内は引用なのでこのようなことばになっています[残念ながら自分ではうまく話せません]。

| | コメント (0) | トラックバック (0)

2005.08.26

[九大]郵便局と銀行

 しばらく前に、いわゆる郵政民営化法案が参議院にかかっているころ、法案で提案されているような民営化をすると、過疎地では郵便局は維持できず、日常的に使える実際上唯一の金融機関である郵便局を失って、金融機関なし状態になる(無金融機関村か)という内容を述べて質問しているところをテレビで見た記憶がある。
 そう言えば、私がいま働いている大学にやってきたころには、銀行の支店はだいぶ近くにあった。少ししてこの支店はあっさりなくなり、窓口に行かなければいけないとき(とくに振込みや引き落としなどがカードも含めて増えてくると通帳切り替えも以前よりははるかに頻繁だし、これが意外に多い)は地下鉄で1駅のところにある支店に行くことになった。精神的には5倍以上遠くなった。拓殖銀行がなくなったとき、なぜかある支払いで受け取ってしまった拓殖銀行の小切手を換金するために、ここに2回(たしか一度は有給休暇で行った)行かざるをえなかったのは悪夢だったー窓口で相手をしてくれた人も破綻したとテレビで散々言っていた拓殖銀行の小切手を換金してくれという客の相手は悪夢だったのではないかと思う。
 郵便局は、かつて近くにあった銀行の支店よりももっと近くにある(最近流行らしいATMのあるコンビニよりもだいぶ近い)。

| | コメント (0) | トラックバック (0)

2005.08.24

[統計]ばらつきを比べる

 データの大小ではなく”ちらばり具合”とか”ばらつき”とか呼ばれるものを比べたいことがある。そういうものを比べるのは、比較的よく出会う場面であり、珍しくはない。だが、”ばらつき”の比較は難物であることも多い。どういう量を使って、”ばらつき”なるものを比較するか、ということは、何も考えなくても決まっているわけでは(全然)ない。よく出てくるのは、分散(つまり平均との差の2乗をすべてのデータで平均したもの、”ばらつき”が大きければ平均から遠くにあるデータが多いだろうというわけだ)、分散の平方根である標準偏差だろう。他にも、標準偏差を平均で割った変動係数を使ったことのある人もいるだろうし、ある程度年齢のいった生態学者なら分散を平均値で割ったもの(index of dispersion、空間分布でおなじみ)が使われているのを見ているだろう。分散と標準偏差の関係はいいとしても、分散と変動係数では、大小が逆になるような2セットのデータを考えるのは容易である。分散と変動係数とindex of dispersionのどれを使って”ばらつき”を評価するかで、いくつかのデータセットのあいだの”ばらつき”の大きさの順番が変わってしまうような例に遭遇することは(扱うデータによっては)珍しくも何ともないーそのうちごまかし集に収録しようと思っていた。この3つのどれを使っても、同じになるようなデータしか憶えていない者は幸せである。
 もちろん、”ばらつき”の意味が量的にはっきりしていれば、どれを使うか(あるいは別の何を使うのか)は明白だろう。意外なことかもしれないが、誰かがきちんと詰めていない限り、ある分野でのある量でどういうものが”ばらつき”の指標としてなぜ適切か、あいまいなことはよくある。データの取り扱いを相談されたときに、この、”ばらつき”の意味が相談する側の本人にもはっきりしないことは、しばしば、沈黙、気まずさ、問題が解決されないままの状態、感謝されない相談された側、をもたらす。人の世に落ちた、増殖する不幸の種子のようだ。
 さて、”ばらつき”の意味が量的にはあいまいなままになっていることが少なくないことにいったん気づいてしまうと、”ばらつき”と口に出すたびに、相手の表情が気になるようになる。相談されて、(私が)あなたの言う”ばらつき”の意味は式やグラフで書けるとしたらどんな感じでしょうか、という意味のことを聞くと、相談者は私が必要な知識を持っていないと判定して話を打ち切ることがよくある。これは私にとっては時間の有効利用かつ新しい小さなテーマの供給なので、長く続く沈黙などに比べるとはるかに大きな利益となる。数年前になるが、”ばらつき”の意味が何なのかが直接問題になる仕事をさせてもらい(reproductive skewというものである)、AmericanNaturalist(変わった名前だが、伝統ある、しかも割合、理屈っぽい雑誌であるー私は大昔の表紙が好きだった)の論文に結実したので、”ばらつき”の意味があいまいなままでそれが研究上現実的な問題にふくらむかすかなにおいは見逃しがたい(あのテーマを私に教えて一緒に取り組んでくれたTさん[沖縄にいる]には感謝の言葉しかない)。

| | コメント (0) | トラックバック (0)

2005.08.02

[統計]交互作用(その2)

 交互作用の続きである。差でなく割合が同じであることが、効果が同じであることを意味することがそこそこ多いのは、尺度水準が比率(比)であるデータが多いということにもよるだろう。重さ(質量)、長さ、体積などはみな比率尺度だ。その特徴は、定量的でありしかも真のゼロがあって、比が意味を持つ(これが比率尺度の語源だろう)ことである。2つの重さを比べて何倍とか、2つの体積を比べて何分の一とかが、ここで言う比である。
 体重の例で言えば、問題の薬をかけたとき、体重50kgの個体が60kgになり体重200kgの個体が210kgになるのを体重によらず効果が同じ(これは差に注目)と見なすか、体重50kgの個体が20%体重が増えて60kgになり体重200kgの個体も20%増えて240kgになるのを体重によらず効果が同じと見なすか、というのがここでいう、交互作用を差に基づいて定義するか割合により定義するかという問題である。50kgの個体が20%体重が増えて60kgになり200kgの個体も20%増えて240kgになるのを体重によらず効果が同じとするなら、分散分析の交互作用の検定は関係がないのである。
 この項はもう1回続く予定です。

 

| | コメント (0) | トラックバック (0)

[統計]交互作用

 交互作用(interactionーここで述べるようなときは相互作用と言わないのが普通)の検定はいろいろなところであらわれる。たとえば、ある薬をかけると体が重くなるとしよう。薬の効果は、その薬をかけたとき(実験区ないしは処理区)とかけないとき(対照区)の体重を比べればよい。では、他の条件がちがっても薬の効果は同じだろうかーというのが、交互作用の説明でもよく出てくる(たぶん)もっとも単純な場合である。たとえば、餌をたくさん与えているときと、餌を少ししか与えていないときでは、薬の効果は同じだろうか、といった問題である。この例での餌の多い少ないのような、薬以外の条件が異なると、薬の効果が異なることを交互作用があると言っている。交互作用は、ある要因の効果が、他の要因によってことなるかどうかを、問題にしているので、最低でも4通りの実験処理の組み合わせが出てくるのが普通である、上の例だと、餌が多くて薬あり、餌が多くて薬なし、餌が少なくて薬あり、餌が少なくて薬なし、である。
 交互作用の検定といえば、分散分析(ANOVA)を連想する人も多いだろう。他のは知らないという人も結構いるかもしれない。実際、交互作用の検定の大部分は(分野とテーマにもよるが)分散分析で行われてきた。分散分析の、説明変数と目的変数の期待値のあいだの関係式(回帰式だと思ってもらってもよい)は一次式で(だから)、交互作用がないとは、実験区と対照区のが他の要因によって変わらないことである。薬と体重の例なら、(薬ありの体重マイナス薬なしの体重)が餌が多いときも少ないときも同じだということである。分散が等しいかとか正規分布しているかといった問題は実際検定しようとすればいろいろあるが、分散分析での交互作用がないことの定義についてはとくに難しいこともなく、入門的教科書にもよく読むと書いてあることが多い。
 ところで、研究者が”○○の効果が同じである”というときには、差ではなくて割合が等しいことを意味していることも多い。体重の例なら、餌条件によらず、体重を対照区に比べて同じ割合(たとえば10%)増やすことを、”効果が同じ”と考えていることも多い。当たり前だが、そんなときには、分散分析の交互作用の検定は関係がない。
 ”処理の効果が同じ”というのが差ではなくて割合が同じであることを意味していることが多いのは、あまり意外ではないだろう。分散分析で交互作用がないとは差が同じであることもよく知られたといってもよさそうな知識である。だが、両者を掛け合わせると意外にもあまり当たり前ではなくなるようだ。ちょっと(1週間くらい)前からふと、過去(とくに一般化線形モデルがほとんどつかわれない、”正規分布帝国時代”)の論文を見ると、割合を問題にすべきだろうと思えるのに分散分析の交互作用の検定をしている例がごろごろ見つかった。
 差が等しいのと割合が等しいのが同じことを意味するためには、たとえば処理区の体重がまったく同じでなければいけない。少しの差ならあまりたいしたことはないように思えるかもしれないが、実際に計算してみると(もちろん個々の実例によってちがうが)、割合で行くか差で行くかではけっこうちがうことが多い。自分の分野や研究テーマの論文でもチェックしてみると、おおっ、と思うような例に行き当たる可能性は決して小さくない。ご自分では発表ないし指摘できない(しにくい)という方は、私に教えてください。
 この話題はたぶんあと2回くらい続きます。

| | コメント (0) | トラックバック (0)

« 2005年7月 | トップページ | 2005年9月 »