« 2006年12月 | トップページ | 2007年2月 »

2007.01.29

[統計]ベイズたとえ話

 以下は、Carlin&Louisの本(Bayes and Empirical Bayes Methods for Data Analysisの第2版)に出てくるベイズ統計のたとえ話である。
 ある学術雑誌では原稿の採択率は30%という情報がある。自分が投稿してみたらacceptされた。次に似たテーマを扱った原稿をその雑誌に投稿したらどのくらいの確率でacceptされると、あなたは見積もりますか?というのが問題である。直接的な推定値は1/1で100%なのだが、そうではなく30%と100%の間だと見積もるなら、あなたはベイジアンというわけだ。30%という全体的な採択率情報が事前分布、1つ投稿したらその1つがacceptされたというのがデータである。

| | コメント (0) | トラックバック (0)

2007.01.27

[その他][香椎・千早]カレー

 千代県庁口から馬出方向へと歩くことになり、ふと見ると、スープカレーのフェンネルがなくなっていた。店の看板などはそのままだが、空き店舗になっていた。洋食のかね吉の場所も工事していた(工事中休業だろうか?)。
 カレーというつながり以外にはこの件と関係がないのだが、香椎(JR)の駅前にシャルマというカレーの店があったので入ってみた。茄子とじゃがいものカレーとナンを食べた。久しぶりにナンを食べたような気がする。この店の場所はかなりわかりにくい。JR香椎駅前のブックオフと同じ建物で、ブックオフのすぐ上の階、焼き鳥屋さん(?)の隣である。11時から3時までの昼時だけの営業だそうだ。

| | コメント (0) | トラックバック (0)

2007.01.26

[統計]数式処理ソフトウェア

 数式処理ソフトウェアというと、Mathematicaなどが有名だが、オープンソースのものはないのかとさがしてみると、すぐMaxima見つかった。早速MS-Windows用のをインストールしてみた。いまのところ順調に動いている。

| | コメント (0) | トラックバック (0)

2007.01.22

[統計]Small Area Estimation

 階層ベイズや経験ベイズによる方法が使われているのを比較的よく見かける例として、Small Area Estimation(小地域推定)がある。これは、ある広い地域での調査があって、そのデータを使って、ある狭い地域について推定したいというときに使われる方法である。狭い地域のデータだけを使ったのでは推定精度が悪いということはよく起こる。そのときに他の情報を使って(Small Area Estimationでは「strengthをborrowする」と表現することがある)推定を良くしようということになる。”借りてくる”ものは、他の地域のデータということもあるし、別の時点で得られたその地域のデータということもあるし、場所も時間もちがうということもある。
 このような方法は、よく知られているところでは市町村別生命表などでも使われている(市区町村別生命表でのベイズ推定説明)。
 Small Area Estimation in Survey Sampling (ISBN-13は978-8173192203)、著者P. Mukhopadhyay、出版社Alpha Science International,のような教科書も出ている。

| | コメント (0) | トラックバック (0)

2007.01.19

[統計][本]生物科学のための現代統計学

 Grafen&Hailsの『Modern Statistics for the Life Scientises』が翻訳・出版された(出版社のサイト)。『一般線形モデルによる生物科学のための現代統計学』(野間口謙太郎、野間口真太郎訳、共立出版、ISBN978-4-320-05639-8)である(共立出版のページ)。題名の「一般線形モデル」は一般化線形モデル(Generalized Linear Models)の誤りではなく、一般線形モデルつまり正規線形モデルのことである。(追加は別項にてする予定です)
 共立出版が抽選でプレゼントしているようです。

| | コメント (1) | トラックバック (0)

2007.01.15

[統計][本]ロスマンの疫学

 『ロスマンの疫学』(篠原出版新社、 2004、矢野栄二・橋本 英樹訳 )は、人間以外の生物を対象に研究している人でも、データ解析の考え方をつかむうえで読んでおいて損はない1冊だと思う(原著はKenneth J. Rothman著Epidemiology: An Introductionで、発行はOxford University Press、2002)。数式も少なく(もう少しあったほうがかえってわかりやすそうな気が、私はするのだが)、説明もていねいである。

| | コメント (0) | トラックバック (0)

2007.01.14

[その他]福岡市の教員採用試験問題漏洩

 結局、出題の責任者のような人が問題を見せたか渡したかした、ということのようだ。この後、どうなるのだろうか。20年くらい前に、東京都の教員採用試験の音楽で似たできごとがあった。やはり洩らしたルートは”母校”だった。このケースでは、問題の試験をやり直したと記憶している。

| | コメント (0) | トラックバック (0)

[統計]なんでもノンパラメトリクス

 一時期、ノンパラメトリックな検定に凝っていたとしかいえない時期があった。動物の行動や生態では、多くの量は正規分布とはかなりちがった分布だし、等分散ということは少ない。20-30年ほど前には、連続量は正規分布&等分散を仮定した方法で、離散量はいわゆるカイ2乗検定で、それぞれ分析されるのが普通だった(いまでもその残影は意外に濃い)。等分散ではない量がでてきたときには、角度変換や平方根変換などの変数変換するのが普通で、しかも、変数変換で等分散化されないデータはよくあった。
 分布に仮定を置かないノンパラメトリックな検定(その代表はなんと言ってもMann-WhitneyのU検定[Wilcoxonの順位和検定と同値]である)を使い始めたときには、順位にしているのだからデータの情報量をかなり失っているのだろうと思っていた。すぐにMann-WhitneyのU検定の効率はt検定に対して約95%(3/π)と書いてある本を見て、意外にわずかなロスなのだと思ったのをかすかにおぼえている。数年後、(たぶんLehmannの本か論文を見て)この値は母集団が正規分布のときのもので、母集団が正規分布でなければt検定よりも効率の高いノンパラメトリックな検定があることを知った。
 ノンパラメトリックな検定を使うのがむしろ普通になると、単純な2サンプルの比較などではなくもっと複雑な状況の検定にも使いたくなるのはいわば人情だろう。すると、ノンパラメトリックな検定には不得意なことがあるのに次第に気づいていく。たとえば、交互作用である。
 私自身が何でもノンパラメトリックな検定を使うというのに近い状態ではなくなってかなり経つが、分布がよくわからないときなど(そのノンパラメトリックな検定の仮定は当然満たしている場合に)いまでもその有効性は変わらないと思う。
 そして、尤度になじんでみると、ノンパラメトリクスで使われている考え方や方法の使える範囲(わかりにくく言えば射程)は思っていたよりもだいぶ広い。

| | コメント (1) | トラックバック (0)

2007.01.05

[統計]ecological fallacy

 統計でecological fallacyと呼ばれている、比較的よく登場する誤りがある。生態学(ecology)とはまちがった学問だということでは、もちろんない。集団(個体群ではなく単に複数の個体のこと)を1つのデータ点と見た分析の結論が、個体レベルでもあてはまるというものである。たとえば、アメリカの州をそれぞれ1つのデータ点とみて、ある性質(以下A)の平均値が高い州ほど識字率が高いという相関があったとする。ここから、Aという性質が大きな値である人の方が識字率が高いという個体レベルの主張も直ちに正しいと考えてしまう。というのが典型的な例である。表現はいろいろでもよく教わる内容なので(たとえば、集団のところを種にして、XとYの種内の関係と種間の関係が逆になることもあるから気をつけろ、などはよく言われることだろう)、間違えそうもないような気がするかもしれないが、割とよく見られるし、どうも繰り返して間違いやすいようである。
 対策はとくにむずかしいことはない。散布図などの基本的なグラフを作っていろいろながめては、また、別のグラフを作ってみるといった基本的操作が役に立つ。

| | コメント (0) | トラックバック (0)

2007.01.04

[九大]紀伊国屋(書店)天神店その後

 天神コアにある紀伊国屋(書店)がもうすぐ閉店になるという話はしばらく前に聞いたのだが、かなり大きな店舗がゆめタウン(東区の東浜)にできるそうだ。3000平方メートルとのことで、博多駅のバスセンタービルの紀伊国屋(福岡本店という名前)が3300くらいだそうだから、かなり広い。4月開店予定だそうだ。
 個人的希望としては、九大箱崎キャンパス内(工学部移転で、よく言えば余裕ができ、悪く言えば閑散としている)のどこかの建物をまるまる紀伊国屋ってのが望ましいのですが。

| | コメント (0) | トラックバック (0)

[九大]道路の凹み

 九大箱崎キャンパス内の道路には、穴やくぼみが多い。少し雨が降ると、あちこちに大きな水たまりができる。歩いていると暗くて水たまりにふみこんでしまったり、自動車で走るとよけるのに苦労したりする。中には深めのものもあり、タイヤが入ると盛大な水しぶきが飛ぶというのは日常的j光景である。キャンパス内の道路がいたんでいるのは、速度を下げさせるために道路に埋め込んである金属のでっぱりがとれてなくなっているところが少なくないことにもあらわれている。(私は今、自転車を使っていないが)金属のでっぱりが取れて無くなっているところを通れば衝撃がほとんどないから、そこを通る自転車をよく見かける。すると、金属の出っ張りがある付近で、自転車が進路を大きく変更することになる。慣れていないと、自動車のドライバーはなんでそんなに急に方向を変えるんだと言いたくなるだろう。キャンパス内のいたんでいる道路を見ると、だいぶ昔あったSimCityというコンピューターゲーム(それなりに、はやった)を思い出す。メンテナンスコストをけちると街のあちこちが壊れていくのだが、それによく似ている。

| | コメント (0) | トラックバック (0)

2007.01.02

[その他]NFLプレーオフ

 今シーズンはときたまウェブサイトで成績を確認する以外のことはほとんどできないうちにNFLのレギュラーシーズンは終わってしまった。NFCはフィラデルフィアがカンファレンスチャンピオンシップまでいくのではないかという気がする。インディアナポリスはどうだろうかー根拠はあまりないが行ってもカンファレンスチャンピオンシップまでという気がするのだが。スーパーボウルは、シカゴvsサンディエゴ、ボルチモア、ニューイングランドのどれかだと今のところでは予想しますーAFCは予想にもなってませんが。

| | コメント (0) | トラックバック (0)

2007.01.01

[その他]ウィルス

 新しい年になった。ときどきメールを見ると、この休みの間にメールにくっついてくるコンピューター・ウィルスが多くなったような気がする。(シマンテックの名前だと)W32.Mixor.Q@mmなどはいくつか来た。

| | コメント (0) | トラックバック (0)

« 2006年12月 | トップページ | 2007年2月 »