[統計]ヒストグラム
なんらかのデータ(1変数)の分布を見るとき、ヒストグラムを書いてみることはよく推奨されている。確かに、代表値と誤差棒[エラーバー]など(たとえば、平均値や中央値と、標準偏差や四分位数)よりも、箱ひげ図よりも、ヒストグラムのほうがよくわかることは多いー場所もとるが。
ヒストグラムからの印象はわりと強いので、変わったヒストグラムからは実際のデータの分布とは違った印象が生じることがよくある。すぐに思いつくのは、区間の境目が自然でないものである。どう考えてもたとえば5,10,15、と区切ったほうが自然なのに、なぜこんな中途半端な値で区切ったのだろうかと不思議に思うことがある。平均値なども与えられていると、そのヒストグラムからの印象は偏っていることがわかってしまうこともある。
次には区間の幅がそろっていないヒストグラムである。こちらはつまづいた経験を持つ人が少なくないだろう。区間の境目が自然でないものよりもこちらの方がたいてい破壊力が大きい。
区間の幅がそろっていないものの変種とも言えそうだが、対照区ー処理区のような2枚のヒストグラムで区間の幅がちがうというものを見ることがたまにあるーだいぶ以前(確か)生態学会でそういうヒストグラム(3枚だったと思う)で発表していた院生の話を聞いたことがある。質疑の時間に私よりだいぶ年長の方が指摘した。私は発表を聞いた直後でもほとんどヒストグラムの幅のことしかおぼえていなかった。
経験分布関数を図にしてみると(見るのにいくらか慣れは必要だと思うが)ヒストグラムよりもよく分布の様子がわかることもある。
| 固定リンク
トラックバック
この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/35623/12139748
この記事へのトラックバック一覧です: [統計]ヒストグラム:

コメント