« 2007年1月 | トップページ | 2007年3月 »

2007.02.19

[鳥だの森だの]ホチキス

 数年前にホチキス(ステープラー)を、綴じたときの裏が平らになるもの(針は同じである)に変えてみた。同じ針で綴じられる厚さと裏がひっかかりにくい点で具合がいいので、手元で紙を綴じるのに使うのは今ではみなそれになっている。パワーフラットという名前らしいと思っていたら、これは通称のようなもので、裏が平らになるのはフラットクリンチというそうだ(I氏とのやりとりで刺激を受け、検索してみた、ここなどにまとまった説明がある)。

| | コメント (1) | トラックバック (0)

2007.02.16

[統計]比(割合)が一定と交互作用とー余談

 広い意味での同業者から統計的なデータ解析の相談を受けると、思わぬ視点に気づくと言うこともあるが、統計的方法に対する考え方のいわば世論調査という意味で勉強(したいかどうかは別)させられることが多い。後者は、ときに、相談を受ける側の「削られる感じ」や「隠された憤り」をもたらす。私の経験では、そういうときに職人もののまんがを読むと少しはおさまることが多い(最近だとやはり”王様の仕立て屋”だろうか)。

 数日前に書いた、比(割合)が一定かどうか調べたくて交互作用を検定するというケースは、この相談の中で比較的多く顔を出し、しかもしばしば驚くような(私が、であるが)”世論調査”の結果を垣間見せる。以下は単一の例によるものではなく、語句は実際とは変えてある。

 私「ということは2つの処理の平均の比がどちらの条件でも変わらないことを調べたいわけですね」
相手「そうです。処理Aが処理Bの一定の倍率になっているという仮説なんです、どちらの条件でも」
私「すると、積ってことになるから和が一定を交互作用がないとしている分散分析はまずいですね」
相手「いや分散分析をしたいんだけど」
私「分散分析では交互作用がないときそれぞれの要因の効果は足し算で効くと想定しているから、あなたの仮説とは別のものだよ」
相手「でも、いや分散分析で交互作用を見れば、それぞれの要因が独立に作用しているかどうかわかるんでしょう?」
私「あなたが調べたいといってる独立と言うものと分散分析での独立はちがうんだけど」

このあたりでループになることが多く

私「自分が調べたいことと同じだろうがちがおうが分散分析がしたいってことですか?」
というようなことを言うと、結局、結構多くの人が分散分析をするので、最初のうちは驚いた。やはり”分散分析フェチ”が結構いて、夜毎、うめいていたりするのだろうか。あるいは人によっては分散分析ということばが”ぶん”の韻で覚えやすいのだろうか。それとも仮面ライダーみたいなことかと連想したこともある。たぶん、分散分析はリクルートスーツのようなものなのだろう。
 次に上記のような場面に遭遇したら何を言おうかと考えることがある(さすがに今年度の後期は忙しくて、考えることもない)が、何だか怖い気もする。おとなしめに教訓的に書くと、複数の説明変数がはいっている分析は要注意ということである(片方がブロックのときに意外に気が付きにくい)。

| | コメント (0) | トラックバック (0)

[統計]対数正規分布しかし平均値・・・続

 少し前に【対数正規分布しかし平均値・・・】というタイトルで、対数正規分布する場合にもとのスケールの平均値などをパラメーターにして書き直して最尤法を使うということを書いた。いったん最尤法を使うことにしてしまえば、他にもおまけの利点がくっついてくる(こっちの方が大きいと言う人はたぶん多いだろう)。最尤法なの(誤差分布の部分ではなく)期待値にかかわる決定論的な部分(たとえば回帰式も期待値にかかわるものだから、ここでいう決定論的な部分)がかなり複雑でもすぐ対応できる。別に足し算でも掛け算もはっきりしてさえいればかまわないわけである。目的変数の変数変換+正規線形モデルという伝統的な常套手段がもたらしてしまう、回帰式のような期待値にかかわる決定論的な部分が特定のものに決まってしまうという”くびき”から解き放たれる。それほど大規模データとはいえないものを扱っている”現場”でのデータ解析もコンピューターの高速化による向上した計算速度のご利益をうけているとつくづく感じる。

| | コメント (0) | トラックバック (0)

2007.02.14

[統計][本]Applied Smoothing Techniques for Data Analysis

 手にとって見たらS-plus本(ということはRにもかなり使える)だったということがある。『Applied Smoothing Techniques for Data Analysis』もそうなのだが、この本は副題がThe Kernel Approach with S-Plus Illustrationsなので、中をぱらぱらとみて「おっ」というのとはちがう。引用文献を除けば170ページあまりの本で、数式はそれほどややこしくはない。題名からわかるように、おもに、density estimationやノンパラメトリック回帰を扱っている。
 
 書誌情報は以下の通り、
Applied Smoothing Techniques for Data Analysis:The Kernel Approach with S-Plus Illustrations
著者Adrian, W Bowman,& Adelchi Azzalini
出版社Oxford University Press(1997)
ISBN-10: 0198523963
ISBN-13: 978-0198523963

| | コメント (0) | トラックバック (0)

2007.02.13

[統計]比(割合)が一定と交互作用と

 2つの要因や変量(説明変数)が目的変数に影響しているとき、よく交互作用が問題になる。片方の説明変数の効果は、もう片方の説明変数の値によらないかどうか、である(よらないことを交互作用がないと言うわけだが)。この”効果”はなかなか曲者であるー時と場合により姿がちがうから。
 もちろん扱うデータによるが、重さ、長さといった比(率)尺度のデータは多くの分野で普通に登場する。比(率)尺度の特徴は2つのデータの比が意味を持っていることである。たとえば、重さが2倍とか長さが1.69倍とか財布の中のお金が(私の)100倍とか。そこで、「効果が同じ」も比尺度のデータでは、「比が同じ」を意味することが少なくない(むしろそれが普通なこともある)。「品種Aと品種Bである薬をかけたときに対照区に比べて体重に与える効果が異なるか」といたとき、品種Aでも品種Bでも10kg増えることが効果が同じということもあるだろうし、どちらでも10%増えることが効果が同じである、ということもあるだろう。後者がここで言う「比が同じ」である。
 交互作用と言うと分散分析をまっさきに連想する人は少なくないだろうが、前にも書いたように、分散分析はこの「比が同じ」を調べるのが得意ではない(というより、調べるためのものではない)。分散分析の交互作用がないはもちろん「差が同じ」である。目的変数を対数変換して正規線形モデル(その代表的な1つが分散分析)を使えばいいのではないかと思った人は、甘い(これは少し前にも書いた)。「誤差分散」「もとのスケール」という2つの”壁”がたちはだかっている。最初の”壁”だけでもかなりのもので、「比が同じ」を調べたいからといって誤差分散は対数変換向きに変化してくれるとは限らない(自分の経験を言えば、「比が同じ」を調べたいときには誤差分散は対数変換向きに変化しないという印象である)。これを考えると一般化線形モデル(GLM)の威力を実感する。
 だいぶ(20年以上)前になるが、データが等分散の正規分布でしかも「比が同じ」を調べたいときにはどうしたらいいのだろうかと考えざるをえなくなったことがある。目的変数を対数変換すれば等分散ではなくなる。このときは変数変換せず分散分析を変形したが、一般化線形モデル(GLM)がそのとき使えればずっと楽で時間もかからなかったはずである。
 どうも「比が同じ」を効果が同じと考えたほうがよさそうなのに(少しおとなしく書いてみた。考えたほうがよさそうではなく、考えるべきだということも結構ある)、分散分析して(しまって)いる研究例は決して少なくない(おそらく、”今でも少なくない、10年以上前なら普通”であろう)。『こんなのはわかりきった問題、対策は簡単』という人はかなり幸福であり、別項は読んでいただいてもおもしろくないだろう。
 この、「効果が同じ」とは何?という話(「比が同じ」か「差が同じ」かそれとも他か)についてはときどき質問されたことがある。それほど稀でもない、個人的には奇怪と思えるやりとりはまた別項で。
 

| | コメント (0) | トラックバック (0)

2007.02.12

[香椎・千早]西鉄宮地岳線-廃止予定区間

 西鉄宮地岳線の新宮(西鉄新宮)と津屋崎の間は、もうしばらくで廃止になるが、先日、用があってその区間に乗った。2両のワンマンだった。
 ほぼ並行するJR鹿児島本線の筑前新宮と古賀の間には、駅が2つできる計画だそうだ。1つは古賀市の新宮との境に近いところ、もう1つは新宮の町役場に近いあたり(495号線だと福岡養護学校付近から入ることになるようだ)、とのことで、筑前新宮と古賀の間は1kmあまりの距離で駅が並ぶことになる。筑前新宮は場所としては福岡市にあるので、JRの駅としては新宮町には初めてである。

| | コメント (0) | トラックバック (2)

2007.02.11

[統計]対数正規分布しかし平均値・・・

 データが対数正規分布(あるいはそれに近い)と来れば、対数変換して変換した後の値をデータと見て分析する、というのが伝統的な常套手段だった。ある程度複雑なモデルを扱う道具には事実上、ほとんど正規線形モデルしかなかったことを考えると、対数正規分布を対数変換した後の値は(当たり前だが)正規分布するから、その点でも調子がよさそうである。
 しかし、元のデータ(対数変換する前)と対数変換した後では、平均値の大小は一致するとは限らない(このことは以前にも書いた)。もとの値での平均値を問題にしたいのなら、対数変換が不都合であることは生態学でのデータ解析にたずさわってきた人々が経験してきたところだろう(比較的新しいところでは生物科学の久保拓弥さんの解説を参照)。
 では、データが対数正規分布で、もとの値での平均値を問題にしたいときには手も足も出ないのかと言うと、そんなことは別にない。たとえば、あまりに単純と言われそうだが、対数正規分布のパラメーターを取り直して最尤法を使えば、尤度に基づく、推定、検定、モデル選択が使える。
 正規分布の確率密度関数は
1/{√(2πσ^2)}・exp{-(x-μ)^2/(2σ^2)}
だから、対数正規分布の確率密度関数は、
1/{x√(2πσ^2)}・exp{-(logx-μ)^2/(2σ^2)}
で、平均値(期待値)はexp(μ+σ^2/2)、分散は、(平均値)^2・{exp(σ^2)-1}
である。そこで、平均値(期待値)を仮にγ、分散を仮にδとでもして、対数正規分布の確率密度関数をμとσではなくγとδの式に書き直せばよいわけである。
 この項には続編があります。

| | コメント (0) | トラックバック (0)

2007.02.08

[九大]九大を舞台にした小説

 『九大を舞台にした小説は何があるのだろうか』という話をちょっと耳にはさんだ。「坊ちゃん」級のはさすがにないかもしれないが、私がすぐ思いつくだけでも、メインの舞台として登場する(あるいは、らしい)小説に「ドグラ・マグラ」と「海と毒薬」がある。

| | コメント (0) | トラックバック (0)

2007.02.01

[その他]入学金の免除

 大分大学が、経済的理由で入学を辞退する人をたすけるため、入学金(28万2千円)の免除制度を作るとのことである。

| | コメント (0) | トラックバック (0)

« 2007年1月 | トップページ | 2007年3月 »