「2. 飲んべえ族に耳寄りな話」の編集履歴(バックアップ)一覧に戻る

2. 飲んべえ族に耳寄りな話 - (2008/08/19 (火) 12:43:02) の編集履歴(バックアップ)


m\bar{x}

正規分布する母集団のんぷの中心を示す母集団m、および分布のひろがりを示す母標準偏差\sigmaは、通常は直接知ることができない。
→母集団から抽出した資料から求めた資料平均\bar{x}mの推定値。資料の標準偏差s\sigmaの推定値とする。
\bar{x}sの精度はどのくらいか?

(検討ポイント)
平均値m、標準偏差\sigmaの正規分布する母集団から、資料xnこ抽出して求めたxの平均値\bar{x}の分布は?またその分布から何がわかるか?

ノーマルチップス

シューハートのノーマル・チップス(表27)をグラフ化すると以下のような正規分布になる。

図1.シューハートのノーマル・チップス。総枚数998枚。
平均値30、標準偏差10の正規分布。

この中から無作為にチップを抜き出す行為は、mが30、\sigmaが1の正規分布する母集団から試料を抽出することに値する。このときの\bar{x}の分布はどのようになるか?

シミュレーション

よくかきまぜた998枚のチップから無作為に1枚を抽出し、再び箱の中に戻し、さらによくかきまぜて1枚を取り出す行為を5回繰り返す。取り出した5枚を1組として試料平均値\bar{x}を記録する(正規母集団から無作為に5個の試料をサンプリングして試料平均値を算出)。
→この操作100組のデータが表29(p.74)である。
    平均値\bar{x}の平均値=29.70
    平均値\bar{x}の標準偏差=4.65

\bar{x}の分布

表29のデータの度数分布図(図30)からわかること。
  1. 母集団の平均値30日回試料平均値の頻度が多い。しかし、少数ながら、18や40のように離れた数値も存在する。
  2. \bar{x}=29.7でm=30に近い。→試料平均値が母集団の平均値の良い推定値になる。
  3. \bar{x}の分布の標準偏差→不偏分散s^2より求める。s=4.65となり、母集団の標準偏差10よりも小さい(重要!)

推定の制度と\bar{x}の標準偏差

試料平均値の分布の標準偏差とは何を意味するのか?→試料平均値から母集団平均値を推定する精度。
「母平均値m、母標準偏差\sigmaの正規分布する母集団からn個の試料を抽出して試料平均値\bar{x}を求めると、\bar{x}は平均値mで標準偏差が\sigma/\sqrt{n}の正規分布となる。」

図2.正規母集団分布→試料平均値の分布→t分布への変換
(佐藤信「推計学のすすめ」p.78)

nが大きくなればなるほど、\bar{x}の精度はよくなる(図2の(ロ))。しかし、図32(p.79)に示すように、n>30になると、制度の向上は小さくなる。(サンプル数の目安になる?)

t分布を導く

母平均値m、母標準偏差\sigmaは、一般的には不明である。→試料平均値\bar{x}および試料平均値の標準偏差sから母集団が推定できるか?

以下の操作を行う。

試料平均値と母平均値との差
\bar{x}-\mu
この差を\bar{x}の標準偏差の単位ではかると考えると、

  \bar{x}-\mu
―――――――――――
 \bar{x}の標準偏差

ただし、\bar{x}の標準偏差は\sigma/\sqrt{n}であるが、\sigmaも未知であるため、sで代用する。

\frac{\bar{x}-\mu}{\frac{s}{\sqrt{n}}}

この式は、図31(ハ)に示すように、\bar{x}の分布を平均値0、標準偏差1の分布に基準化したことに相当する。→t分布(p.56,58の図20,21に示した正規分布の基準化の手続きと比較せよ。t分布と正規分布の相違点は\sigmaの代わりにその推定値sを用いている点である)。

t分布表(p.82)

図33 t分布表 自由度(n-1)
(佐藤信「推計学のすすめ」p.82)

t分布表…t分布の中心0からt以上はなれた値が出現する確率を分布の面積で表したもの。例えば、自由度3のとき、両裾の斜線部分をあわせた面積が5%となるtの絶対値は、t=3.18となる。

t分布は、母集団から試料を抽出する数nによって、分布の形が変形する。→標準偏差が1/\sqrt{n}の割合で変化するため。