« 2006年11月 | トップページ | 2007年1月 »

2006.12.29

[統計]多重検定?

 多重検定や多重比較は、統計的方法の誤用の宝庫(の1つ)である。26日にようやく冬休みになって(もちろん授業が休みになったという意味。九大の冬休みは12/26から1/4である)、会議に出たり(休みといえば会議がよくある)、統計的方法についての相談についてメールで返事を書いていたりしていて、ふと、同じタイプの多重検定の誤用に、思っていたよりもよく遭遇していることに気が付いた。
 それは”ブロックごとに検定し多重検定だとして有意確率の補正をする”ことである。たとえば、幼期に餌をたくさん与えた個体と少ししか与えなかった個体が成体になったとき、ある行動の頻度がちがうかどうか調べたいというケースを考えてみる。成体は1頭ずつ隔離して飼育するのがむずかしいとする。両餌条件の個体を何頭か(普通はそれぞれ一定頭数に決めておくだろう)飼育容器に入れて、その行動を調べてみる。行動の頻度は飼育容器によってもある程度のちがいがあることが多いだろう。この場合、容器によるちがいを考慮するのはFisher3原則や混合効果モデルを持ち出すまでもなく基本である。ここでの容器はよく使われる統計用語ではブロックということになる。ブロックは、実験ではあちこちに顔を出すし、野外でも生息場所をいくつかに分けた部分だったり時間だったりといろいろと出てくる。調べたいことは、餌条件のちがい(これは実験計画法あるいは分散分析的用語だと処理ということになる)が行動の頻度に影響を与えるかどうかであり、容器をブロックとすることにより、容器による影響(いわばノイズ)を分離してデータが分析できる。ブロックはある種の繰り返し(反復)であり、他の条件が同じならブロックが増えればより確かなことがいえるのは当然だろう。
 10個の容器(もちろんちゃんと書けば、その中の個体)についてデータを取ったとすると、”ブロックごとに検定し多重検定だとして有意確率の補正をする”では、各容器について検定をして容器の個数をfamilyを構成する検定の個数として、多重検定用の有意確率補正(たとえばHolmとか)をして”個々の容器が有意かどうか”を提示してくる。ここから先はバリエーションがあって、”すべての容器が同方向に有意なときのみ、餌条件は行動の頻度に影響しないという帰無仮説を棄てる”というのもあるし”ある方向に有意な容器数が反対方向に有意な容器数よりも1つでも大きければ、帰無仮説を棄てる”というのもある。いままでもっともよく遭遇したのは、”客観的基準なく適当に”である。そのうち、”ある方向に有意な容器数と反対方向に有意な容器数をさらに検定する”というのも登場するような気がする。容器が500個くらいあると、この”ブロックごとに検定し多重検定だとして有意確率の補正をする”では、よほど処理の効果が激しくでもない限り、通常の有意水準では何も言えなくなるのが普通である。
 有意かどうかに関係なく、どちらの餌条件の個体の方が行動の頻度が高かったかで容器を2グループに分けて、400個と100個にわかれたら、餌条件は行動の頻度に影響しないという帰無仮説が正しければそんなに極端なことが起こる確率はたとえば5%よりかなり低い。だから、”ブロックごとに検定し多重検定だとして有意確率の補正をする”はおかしいのではないかと説明を試みても、効果があることは意外に少ないようだ。
 理由はだいたい想像がつく。多重比較や多重検定のときに有意確率の補正がなぜ必要になるのか、補正するならどういう状況ではどのように補正すべきなのかといったことには関係なく、”複数の似たような検定ができるなら多重検定の補正をするものだ”という思い込みの方に重きを置く人はけっこう多いということであろう。葬式のときに黒いネクタイをしていかずにいろいろ言われた人(あるいは言われているの見聞きした人)がどこでも黒いネクタイで大威張りみたいなものだろうと思うのだが。
 1元配置分散分析やブロック、対応といった話は、これまでのところ、”ブロックごとに検定し多重検定だとして有意確率の補正をする”症状にはあまり効果がない。1つ気が付くのは、ブロックや対応といった概念(用語は別にして)を理解していない人が予想外に多いことである。それにしても、多重比較や多重検定向けの方法は不遇だと思う。使用者に対する理解者の割合がとても低い。
 このタイプについては以前に生態学会の自由集会で話した。そのときはこれほどいくつも実例に遭遇するとは思っていなかった。さて、ここからは、統計的方法の誤用を指摘されたときの人の反応という興味深い別の話題に対するいくらかの洞察が可能だがこれは別項目にする。
(若干の加筆をするつもりです)

| | コメント (0) | トラックバック (0)

2006.12.26

[九大]またコンビニが・・・

 バス停の九大前(昔の言い方で言うとバス通り)から少しのところ(馬出方向)のローソンは営業は昨日までで今日から休業らしい。すでにローソンのウェブでの店舗検索ではかかってこないようだ。ローソンは九大の箱崎地区周辺にはなくなってしまった。一番近いのは、箱崎埠頭か吉塚駅近くか松島の流通センター通り沿いかだろう。

| | コメント (0) | トラックバック (0)

2006.12.22

[九大など]今年は・・・

 まだ終わっていないが、今年は、狭い範囲でもかなり多事かつ多難な年だった。初めて遭遇するようなこともあった。引っ越して住居環境がよくなったなど、よいこともあったが。
 九大といったスケールで見ると、来年以降、予算や人事はじめ、さらにさらにきびしくなりそうである。そのうち全体的に”悲鳴”も出なくなるのではないかと思う。教員の人数や可動時間、資金が減る中、それでも現場は頑張れと指示が出るあたり、第二次世界大戦末期の行き詰った日本軍(もちろん大日本帝国)の雰囲気も漂い始めている。そのうち、『もっと働け』『人が足りなくても時間が無くても物資も資金も無くても頑張れないのは精神がたるんでいるから』とバンザイ・アタックを賞賛するようになるのだろうか・・・(ここでのバンザイは少年ジャンプのドイツ語版?とは関係ありません。リンクを追加しておきました)

| | コメント (0) | トラックバック (0)

2006.12.21

[その他]年末

 年内の講義は昨日ですべて終わり(まだ研究室のセミナーは来週にあるが)、年が明けると・・・予定を確認すると次の授業は1月5日である。これは例外的かもしれないが、冬休みは次第に短くなってきている(九大では例外的ではなかった。調べてみたら、九大の今年度の冬休みは、12/26から1/4までの10日間だった。ちなみに福岡の小学校は12/23-1/8が休みというのが普通のようだ。12/25と26および1/5のように1日ないし2日だけ飛び出しているのが九大の特徴と言えよう)。さらに冬休み期間中の集中講義でもあったりすれば、実質的な冬休みはさらに短くなる。
 とりあえず、後期の授業(セミナーはもちろん別)の80%くらいは終えた(今年は事情があって例年の何倍かしている)ので、来週にかけては山積した仕事(その中にはあちこちまわって書類を書いてもらったり申請したりするものが複数あるのがきびしい)を片付けて、その後やっと一段落である(かりに一段落したとしても年は変わっているだろう)。

| | コメント (0) | トラックバック (0)

2006.12.15

[その他]教壇から落ちそうになる

 授業(講義)をしていて、教壇から落ちそうになったことが何回かある。普段使っていない講義室でどこまで教壇があるのかよくわかっていなくてうっかり落ちそうになるということもあるが、教壇に人がたくさん乗ってきて落ちそうになるというのも1つのパターンである。今までの経験では、授業の終わりごろに、その講義室が次の授業でも使われる場合に起こりやすい。典型的には以下のように起こる。授業が終わる5分から7,8分前といったあたりで、講義室に人が次々入ってくる(もちろん私はまだ授業をしている)。入ってきた人々は教壇にあがり、黒板(当然、教室前方の、である)になにかを書いていく。教壇の上は過密状態になり、私(その授業をしている講師[ここでの講師は職階ではなく授業者の意味で使っている])は落ちそうになる。
 このとき、教壇にあがってきた人々が、黒板に何かを書くことについて私に許可を求めることは(少なくとも今までは)ない。ただ、私が授業で説明するために黒板に書いていたものを「消していいか」と許可を求められたことはある(私の授業はまだ終わってはいないのだが)。また、私が授業で説明するために黒板に書いていたものを「消してくれませんか」と要求されたことはあるー私の授業はまだ終わってはいないのだが。
 ここまで書くと何が起こっているのかわかったという方も少なくないだろう。同じ講義室の次の時間の授業では何か課題が出ていてその答を授業開始時には黒板に書いていることが求められているのである。その課題を出した、おそらくは次の授業の講師は少し早く教室に来られるとよい。課題が、前の授業中に講師を教壇から落としそうな勢いで熱心に遂行されているのを見て、深く満足されるであろう。
 少し前にもそのようなことがあったので、うるさがる人(学生と思われる)に聞いたところ、やはり、次の授業では課題が出ていて、しかも1つの問題は一番最初に黒板に書いた一人だけが答える権利があるらしい(過密状態の立ち話なので厳密には少しちがうかもしれない)。
 大学で授業をしていると学生が講師に一定の敬意を払ってくれるように見えることがあるが、これは単位の認定権がその講師にあるからである、とはよく言われる仮説である。教壇から落ちそうになる経験はこの仮設を支持していると言っていいだろう。

 ところで、古い校舎などでは教壇が高いことがある。そういうところでは落ちると足を痛めるかもしれないから、授業の終わりごろに教壇に人がぞろぞろ上がってきたら、すかさず避難した方がいいかもしれない。なお、私が所属している学科自体の授業では、学生諸君と顔なじみで私を落としてはかわいそうだと思ってくれているのか、そういうことはまだ起こっていない。

| | コメント (3) | トラックバック (0)

2006.12.10

[鳥だの森だの]写真の撮影場所を記録する

 写真の撮影時刻を記録するのは以前からわりに普通のことである。フィルムカメラでも日時などをうつし込むというのはあったし、デジタルカメラ(「デジカメ」は登録商標なのだそうだ)では記録されているのが普通である。撮影時刻だけでなく、撮影場所も記録できたら便利だと思うことは多い。
 exifにGPS情報が書けるようになっているという話を聞いたり、地図上に撮影位置を表示できるらしいとは聞いていたが、具体的にどうするとできるのか経費は手が届くくらいなのかよくわからないままだった(GPS携帯電話ならすぐできるのだろうとは思ったが)。少し前に、ソニーのGPS-CS1Kという製品で撮影場所の記録もできると聞いて、早速購入して使っている。いったいどうやって記録するのだろうと最初不思議に思った。説明を見ていると原理的には単純なことで、この機械(GPS-CS1K)はGPSを使ってただ自分がいつどこにいたかを記録しているだけなのである。デジタルカメラでは、その写真がいつ撮られたか記録しているから、後で照合すれば撮影場所がわかるというわけである。そこで、デジタルカメラの時計はきちんと合わせておく必要がある。
 いつどこにいたかが記録されていれば、時刻から場所がわかるわけである。この手は他にも使えそうだ。exifのバージョンが新しめなら他社のデジタルカメラでも使えそうということなので、いま、キャノンのデジタル1眼レフで試している。

| | コメント (0) | トラックバック (0)

2006.12.09

[統計]欠測値

 実際のデータ解析で使われる統計モデルは以前に比べるとだいぶ複雑なものになっている(もちろん単純な2標本の比較の場合のような単純なモデルも依然としてよく使われはするが)。すると、起こりやすい誤りもちがってくるだろう。欠測値のために、実はちがったデータの尤度を比べて(喜んで)しまうというのも増えた誤りだという気がする。同じデータについて、複数の統計モデルの尤度などを比べるということは、AICのようなモデル選択にせよ尤度比検定にせよ今では普通の操作である。欠測値があることが珍しくないデータを多く扱っていると、欠測値の取り扱いに端を発するかんちがいで泡をふくことは何度か経験しているだろう。たとえば、「目的変数とすべての説明変数の値がそろっているものだけ計算に使え」という設定(とくに珍しくはないと思うが)だと、説明変数の数が多いモデルほど使っているデータ点の数が減っても何の不思議もない。もちろん同じデータについて異なるモデルの尤度(やそこから計算される量)をくらべるべきときに、ちがうデータの尤度を比べてもただただ意味がない。
 私の経験(私だけかもしれないが)では、比べている統計モデルのうち簡単なものが複雑になるにつれて、この手の、欠測値の取り扱いのためちがったデータの尤度を計算しているのに同じデータを使っているつもりになっているという状態は発見(発覚?)しにくくなっているように思える。データの個数を書き出してみればすぐ気づきそうなものだが、結果が喜ばしいとなかなか発見できない。また、いわゆる締め切りが迫っていると、どうしても基本的な確認の手を抜くのでさらに発見しにくくなる。
 何度か泡をふいて次第にこの種の問題で泡を吹く回数が減ってきた。他人のデータ解析の結果を見ているとき、気が付くと、自由度やデータの個数などのつじつまがあっているのか一通りチェックを終えている自分がいる。 

| | コメント (0) | トラックバック (0)

2006.12.08

[統計]同じ略語

 かなり意味のちがうものが同じ略語だということがある。一般化加法モデル(generalized additive models)は略すとすればGAMだと思うが、これはGeographical Analysis Machineの略としてすでに使われている。

| | コメント (0) | トラックバック (0)

2006.12.02

[香椎・千早]3号線バイパスとラビリンス

 3号線バイパスの先が千早付近で3号線につながってしばらく経つ。千早駅の東あたりでそのまま北(あるいは北北東くらい)に行くルートの工事が続いているのには気づいていたが(今は3号線バイパスを北上すると千早駅の東あたりで西にぐっとカーブして3号線との交差点に至る)、久しぶりに用があって水谷に行ってみると、大きな陸橋工事をしていた。水谷2丁目の信号付近で町川原線を文字通り越えることになるようだ。
 その先はいったいどこを通す計画なのだろうと思って、見てみると、香椎参道踏切付近で宇美線と香椎参道をまとめて越え、オークタウン入口よりも香椎駅よりでもう一度町川原線を越えるらしい。香椎参道の南側も急坂を上ると急に行き止りになったりして(小型の長崎だと思えばいいだろうか)、町川原線から香椎参道に車で行くにはどうすればいいのだ(もちろん、勅使社道踏切のところまでは来ずに)という感じであるが、香椎参道の北側で香椎駅の東側(町川原線より南東)の一帯も『地元の人以外は通行止め』と標識を出した方がよさそうな迷宮さながらの道になっている(個人的には、香椎東迷宮と呼んでいる)。香椎参道踏切のところのコンビニ駐車場から見える比較的広い道ーこのあたりでは香椎参道と町川原線を除けばおそらくもっとも広いのだがこの道で香椎参道に出るところが一見行き止まり風味であり、また細くよく渋滞しているーを奥へ進んでいくと少しの間はいいのだがどこかそれなりに広い道につながるということなくとても細くなったり先へはいけなくなったりする。迷ったかもしれないとかどうも道がよくわからないとか思ったらすぐにもと来た道を引き返すという登山の知恵にしたがうのが妥当であるーそうできるならば、であるが。私は道が細く車を転回するスペースも見つからずに進退窮まったことがある。
 知人にこの迷宮の住人が何人かいる(一部は過去の住人)。興味深いことに、みな、迷宮内では自分が住んでいるところは他のところよりはわかりやすく、ましであると主張する。私はしばらく住んでいると慣れるので他よりもわかりやすく思えるのではないかと思ったのだが、聞いてみたところ(私が知る住人のすべてではないが質問した相手のすべてから)そうではないと否定された。あるいは、それぞれの人がわかりやすいと思うところを住処に選んでいるということなのかもしれない(現時点では、私は、しばらく住んで慣れた場所はわかりやすいように感じるという仮説が一番ありそうだと思う)。
 迷宮地図などのグッズをそろえて町おこし、というのはないだろうかとときどき考えるのだが、うまく行ってひとがぞろぞろ来たら非常にまずいかもしれない。香椎川沿いの鹿児島本線下のガード(?)の通行制限などは”迷宮の門”たる資格充分だと思うのだが。

| | コメント (0) | トラックバック (0)

[その他]鬼畜米英

 戦前・戦中のキャッチコピーとして有名なものに、”鬼畜米英”がある。4文字熟語は今でも愛され、外来語などをカタカナで略すときも4文字が多い。さて、これが当時ほぼ文字通りの意味で相当数の人に受け取られていたとは、何人もの年長の人から聞いてきたので、改めて聞いても驚くことはなくなった。よく考えてみると、いまでもさんざん使われている考え方である。生物らしいのだが、人間ではない何者かが敵役で、主人公サイドがさんざんやられるというのは、アニメーションとかまんがとかライトノベルによくある設定であろう。
 ところで、”鬼畜米英”は誰が考えたのだろうか。

| | コメント (2) | トラックバック (0)

« 2006年11月 | トップページ | 2007年1月 »