「1. パン屋のインチキをあばく話」の編集履歴(バックアップ)一覧に戻る

1. パン屋のインチキをあばく話 - (2008/08/12 (火) 15:09:22) の編集履歴(バックアップ)


とりあえずレジメのPDFファイルをアップしておきます。内容は近日中に、それはもうすぐに追加します。


米をパンに切り替えたら血圧が下がるのか?

白米に比べライ麦パンなどはカリウムを多く含むため、血圧上昇の予防になる。パンでなくとも玄米でも可。

ヒストグラム

「横軸にパンの重さをとり、縦軸にパンの数をとって(p38)」描いた次にようなグラフをヒストグラムと呼ぶ。
図1.ヒストグラム

本文中では60、70、80…グラムのパンの重さを数えたと書いてあるが、実際にはパンの重さがそのような調度の値だけをとるということはありえない。本文中表10(p39)は正しくは次のような形となる。
階級(g) 階級値(パンの重さ、g) 度数(個数、個)
55-65 60 1
65-75 70 15
75-85 80 23
85-95 90 27
95-105 100 20
105-115 110 12
115-125 120 2
このように、ある代表値(階級値)を中心とするある範囲(階級)に含まれるデータの個数(度数)をまとめた表を度数分布表と呼ぶ。

図1に点線で示したのはパンの数を無限大、階級幅を無限小にしたときのヒストグラムで、この曲線により示される分布を正規分布、Gauss分布などと呼ぶ。

データの切捨ての余蘊亜人為操作が加わると、本文中表12(p40)のように切断された分布となる。これは切断正規分布と呼ばれる。

コントロールできない偶然の誤差は結果として正規分布を生じやすい。これを逆に利用し、正規性を調べることで偶然でない誤差を探すこともできる。

資料と母集団

「パン屋が売っている全体のパン(p44)」のように、全ての対象の集まりを母集団と呼ぶ。そして、「A老人が買った100切れのパン」のように母集団から抽出された集まりを資料、または標本と呼ぶ。

母集団の概念を使って仮設検定を説明すると、仮説検定と言うのは、「ある資料がある母集団から抽出されたものとみなすことができるかどうか」を調べているということができる。

分布の代表値

平均値は分布がどこを中心としているかを述べるのに便利なパラメータであるが、同じ平均値でも分布が同じとは限らない。
図2.2つの正規分布

図2はいずれも平均値が0の正規分布であるが、明らかに形が違う。とがった分布は平均に近い値が出やすく、平らな分布は出にくい。バラつかない分布とばらついた分布と言い換えることもできる。「バラつき」を測る測度が必要である。そこで、次の式で定義される母分散\sigma^2を導入する^{*1}
\sigma^2 = \frac{1}{n}\sum^n_{i=1}(x_i-m)^2