« 2009年2月 | トップページ | 2009年4月 »

2009.03.25

[その他]WBCと近未来通信

 24日は卒業式だった。WBC決勝を気にしながら、仕事(ほぼ盛岡の整理)をしていたら、前のWBCのときのテレビ中継を思い出した。近未来通信(会社の名前)である。前のWBCは2006年の春で、このころには女子プロゴルフのツアーのスポンサーだったのが、その秋から冬には実は宣伝していたサーバーなどはほとんど動いていないことが明らかになり、社長はお金を持って海外逃亡(いまでもつかまっていない)となるのだった。

| | コメント (0) | トラックバック (1)

2009.03.24

[その他]デハビランド

 昔の有名映画の1つである『風と共に去りぬ』(一度見たことがある)に出演している女優に、オリビア・デハビランド(Olivia de Havilland)がいる。イギリスの飛行機メーカーにデハビランド社(コメットなどを製造)があるが、両者は何か関係はないのかと思っていた。定跡通りウィキペディア(日本語)で見ても、直接のつながりは書かれていなかったが、オリビア・デハビランドの妹(女優のジョーン・フォンテイン、『レベッカ』などの主演女優)のところを見ると、デハビランド社の創業者とオリビア・デハビランド姉妹は、いとこだとわかってしまった。オリビア・デハビランドとジョーン・フォンテイン姉妹のお父さんは、特許弁護士で東京帝大教授で、姉妹は東京で生まれたとのことである。お父さんが書いた本がamazonにものっていた。
 

| | コメント (0) | トラックバック (0)

[その他]福岡に戻る

 生態学会を終え、福岡に戻ってきました。桜は、葉桜のところもあるものの、まだ花が残っていました。盛岡での”宿題”を1つずつ片付けています。まもなく(昼までには)、自由集会での表示内容のファイルもウェブサイトに出る予定です(←すでに出ています)。

| | コメント (0) | トラックバック (0)

2009.03.13

[NBA]プレーオフ出場、そろそろ決定

 シーズンも終わりが見え、プレーオフ出場チームがそろそろ決まりだした、と思ったら、西のカンファレンスはすでにプレーオフ出場可能性があるのは10チームだけになっている。東の8位争いはかなり激しいー6チームほどで8位を争いそうだ。

| | コメント (0) | トラックバック (0)

2009.03.12

[その他]26年前

 平均株価が26年前くらいの値段まで下がったというニュースを聞いて(私は株を持っていない)、26年前というと・・・と考えてしまった。電子メールはもちろんみかけることがなかったし(パソコン通信でさえ、日本では初期だと思うーniftyserveもまだ始まっていないのではないだろうか)、まだ、パソコン自体があまりなく、NECのPC98シリーズが始まった頃である(値段が高かった)。

| | コメント (0) | トラックバック (0)

2009.03.11

[その他]JRの新駅

 鹿児島本線の、古賀と福工大前(以前の筑前新宮)の間には2つ駅ができる計画だが、そのうちの古賀に近い方が、14日に開業するそうだ。「ししぶ」駅という名前だそうで、古賀市の新宮町との境付近にできる(このあたり)。駅名はひらがなの「ししぶ」で、もとになった地名は鹿部と書く。函館本線の鹿部駅は、「しかべ」だそうである。

| | コメント (0) | トラックバック (0)

2009.03.10

[その他]太

 苗字である。「太」と書いて、「ふとり」と読むそうだ。サッカーのJ2熊本の選手(今年からガンバ大阪に移ったそうだ)にこの苗字の人がいた。

| | コメント (0) | トラックバック (0)

2009.03.09

[統計][R]交互作用があるときー2つのサンプルへの直線回帰(計算例・続々)

 2つのサンプルがあって、それぞれのサンプルに別々の回帰式をあてはめたときと、1つにまとめて交互作用を入れたときでは、意味している回帰式はどちらでもそれぞれ同じだった。では両者はまったく同じだろうか。少し例を変えて、見てみる。

> ff01
[1] 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1
これはサンプルのちがいを表現するための2値的変数で、0が第1のサンプル、1が第2のサンプルを表す。それぞれ標本数は12である。
 データ自体は、説明変数xと目的変数yで、以下がyであり、
> yy10
[1] 2.2488221 1.9799937 3.7504875 3.5454482 5.2465367 5.2569419
[7] 5.3512673 2.8108693 9.4631050 2.5486629 8.4183612 2.9300625
[13] 16.8921915 14.6140562 11.4044017 10.2141847 15.3765631 18.5378851
[19] 16.0148672 -0.0994805 2.2876513 12.9308352 4.9445873 15.0245021
最初の12個が第1のサンプル、後半が第2のサンプルである。
 次にxで、
> xx10
[1] 1.901628 1.189416 2.497983 2.970987 3.958775 4.822747 4.565434 1.689338
[9] 8.571783 1.564368 7.491317 2.822647 9.980802 8.324157 6.803240 6.054728
[17] 8.228597 8.778725 7.613337 1.163588 2.651272 7.439294 3.565445 7.699280
こちらも、前半と後半の各12個のデータが、それぞれのサンプルになる。

 前半(第1のサンプル)だけで回帰すると、
 Coefficients:
 (Intercept) xx1
  0.7528 1.0107

後半(第2のサンプル)だけで回帰すると
 Coefficients:
 (Intercept) xx2
  -2.869 2.204
となる。両方一緒にして、交互作用ありだと、
 Coefficients:
 (Intercept) xx10 ff01 xx10:ff01
  0.7528 1.0107 -3.6216 1.1932
となる。先の例と同じく、交互作用のある場合の意味する回帰式はそれぞれ別々に当てはめた場合と同じである。
 次に、対数尤度を見てみる。前半だけだと、
 'log Lik.' -4.414788 (df=3)
後半だけだと
 'log Lik.' -19.02389 (df=3)
両方一緒にして、交互作用ありだと、
 'log Lik.' -30.73781 (df=5)
となる。別々に当てはめた場合の和の方がだいぶ大きい。この対数尤度がどのように計算されているのか、以下少し見てみる。
 前半だけの回帰の結果(関数glmないしlmの結果)をresc1に入れておき、残差平方和を割り算して出した分散から計算した標準偏差(esd1とする、0.3495742だった)を使って、対数尤度を求める、
> sum(dnorm((fitted(resc1)-yy1),mean=0,sd=esd1,log=TRUE))
[1] -4.414788
と、上記と同じである。同様に、後半だけだと(標準偏差esd2は、 1.181028だった)、
> sum(dnorm((fitted(resc2)-yy2),mean=0,sd=esd2,log=TRUE))
[1] -19.02389
であり、これも上記と同じである。
  両方一緒にして交互作用ありだと(分散esd10i1は0.8709278だった)、
> sum(dnorm((fitted(resc10i1)-yy10),mean=0,sd=esd10i1,log=TRUE))
[1] -30.73781
となる。これも同じである。
 それぞれに別の回帰式という場合には、両サンプルで回帰式のみならず正規分布の分散(目的変数yの予測値からの外れ方を表す正規分布の分散)にもちがう値を使っているのに対して、両方一緒にして交互作用ありという場合には、両サンプルで正規分布の分散に共通の値を使っていることがわかる。これが対数尤度のちがいの原因となっている。
 結局、それぞれに別の回帰式という場合と、両方一緒にして交互作用ありという場合は、確率モデルとしてみると別のものであった。前者は3パラメーター×2で6パラメーター、後者は傾きと切片が2つずつだが正規分布の分散は共通の1つだけで5パラメーターを持つモデルである。

| | コメント (0) | トラックバック (0)

2009.03.08

[NBA]マーブリー移籍

 ニューヨークに在籍しながら、ここしばらくは試合はもちろん記録を見るとベンチ入りもしていなかった、ステフォン・マーブリーが少し前にニックスとの間で契約短縮をしたと思ったら、(噂通りだったが)ボストンに移籍した。得点はそう多くなくても、また今はひざのけがで休んでいても、ガーネットはボストンの大黒柱と言ってもいいと思うのだが、かつてのミネソタでの因縁を思うと、うまくいくのだろうか。

| | コメント (0) | トラックバック (0)

2009.03.05

[統計]有意な差があるとは信頼区間が重ならないこと?(余談)

 2つのグループの平均に有意な差があるとは、それぞれのグループの信頼区間が重ならないこととどういう関係にあるのだろうかという内容を以前に書いた。では、それと類似した問題、平均の標準誤差が重ならないことと、平均間の有意な差との関係はどうだろうか。
 先の例と同じような場合(正規分布で等分散、しかもサンプル数もサンプルの分散も等しい)で、考えてみると、両方の平均にエラーバーとし標準誤差(SEM[母平均の標準誤差])を付けて、ちょうどエラーバーの端同士が接するときにはtは約1.4になるので、たとえば5%水準で有意な差は無いと判断されることになる(サンプル数が大きければ10%と20%のあいだとなる)。

 検定ではないのだが、この、SEMで付けたエラーバーの端が接する場合は、AICとはどんな関係になるだろうか。先の例と同様の場合(つまり、正規分布で等分散、そのうえサンプル数もサンプルの分散も等しい)だと、(n-1)/nが1で近似でき、(1+1/n)のn乗がeで近似できるくらい、大きなnについては、2つの別の平均というモデルと1つの共通の平均というモデルがほぼ同じAICという場合であることが計算すると分かる。

| | コメント (0) | トラックバック (0)

2009.03.04

[統計]moderated regression

 回帰などでmoderatedというと、2つの説明変数の積を別の説明変数として入れることをさしていることがある(2つの説明変数があるので、重回帰ということになる)。呼び方はちがうが、現在、回帰などで交互作用と呼んでいる変数と同じということになる。moderatedな(重)回帰は、心理学などで使われるそうである(たとえばこの論文の最初の著者は方法について論文や本をいくつも書いている)。

| | コメント (0) | トラックバック (0)

2009.03.01

[統計]mixture

 統計でmixtureといえば、確率分布のmixtureを考える方もいるだろうが、まったくちがった意味でも使われる。mixture experimentとかmixture dataといった場合には、説明変数(処理)の値そのものではなく、他の説明変数(処理)との割合が目的変数に影響する状況を指す。たとえば、ケーキの個々の材料の量を説明変数とし、できたケーキの量ではなくケーキのなんらかの性質(たとえば味とか)を目的変数とすると、その目的変数は材料の量というより配合比により決まるだろう。CornellのExperiments with mixtures(Wileyより発行)はよく引用される教科書の1つである。考え方としては比較的新しく発達したもので、この分野の古典とされるScheffeの論文(Experiments with mixtures.J.R.Statist.Soc.B20:344–360)が出たのが1958年である。このScheffeとは、いうまでもないかもしれないが、分散分析や多重比較でよく出てくるScheffeである。

| | コメント (0) | トラックバック (0)

[その他]鳥の動き

 変わった動きを見ると人+機械でも(たとえばクルビットとか)人でも(たとえばコバチとかコルブト宙返りとか)、気がつくと他の事は考えずに見ていることがよくある。生き物で変わった動きに思わず見いってしまうことが多いのは鳥である。manakin[マイコドリ]ではムーンウォークはあまりに有名で、それ以外にも、複数のオスで行うレックでの求愛の動き(たとえば あるいは )はかなり変わっていると思う。

| | コメント (0) | トラックバック (0)

« 2009年2月 | トップページ | 2009年4月 »