■三つの集団
母集団、標本、標本平均の集まり
- 母集団
- 標本
- 標本平均X~、標本分散S2、標本標準偏差S
- X~(~はバーのつもり)の代わりにmXと表記する
- 標本平均
- 標本平均の平均E(mX) = m
- 標本平均の分散V(mX) = σ2 / n
- 標本平均は、nが充分に大きければ、正規分布N(m, σ2/n)に近似的に従う
- 母集団が正規分布に従うなら、nの大小に拘らず、N(m, σ2/n)に従う
■標本平均から母集団を推定する
- 標本平均の分布はN(m, σ2/n)
- 標本平均mXはnが大きくなると母平均mに接近する(一致性)
- 標本平均mXの平均E(mX) = 母平均m (不偏性)
- 標本平均mXを母平均mの推定量とする時、他のものを推定量に選ぶよりもmXの散らばりが小さい (有効性)
■標本分散と不偏分散
■無限母集団(平均m, 分散σ2)では
- 母分散σ2の不偏推定量(不偏分散)は
- u^2 = Σ(X-mX)^2 / (n-1)
- E(u^2) = σ2
- このn-1を「自由度(degree of freedom, d.f.)」という
- nが充分大きければ、標本分散v^2は母分散σ2の推定量として使うことが許される
- なお、
■自由度n-1
- 標本平均mXは母平均mの不偏推定量。不偏分散u^2は母分散σ2の不偏推定量
- 標本分散を求める時に標本平均X~を使う。
- Σ(X-mX) = 0となってしまう
- n-1個選べばn個目は決定される
- 制約が一つ増える⇔自由度が一つ減る
■推定と信頼区間
- 信頼区間: 標本から母平均を推定して得られた区間(母平均が含まれる区間)
- 信頼度: 母平均が信頼区間の中に含まれると期待できる確率
■母分散σ2が判っている時
- 母平均が変わっても母分散はあまり変化しないので
- 標本平均mX, 標本数nから
- 信頼度95%なら信頼区間は
- mX - 1.96・σ/√n < m < mX + 1.96・σ/√n
- 信頼度99%なら信頼区間は
- mX - 2.58・σ/√n < m < mX + 2.58・σ/√n
■母分散が判らない時
- σ2 = S2・n/(n-1)として上を適用(不偏分散)
■母比率も同様
- 標本比率Rの時、母比率pを推定する
- 信頼度95%なら信頼区間は
- R - 1.96・√{R・(1-R)/n} < p < R + 1.96・√{R・(1-R)/n}
- 信頼度99%なら信頼区間は
- R - 2.58・√{R・(1-R)/n} < p < R + 2.58・√{R・(1-R)/n}
最終更新:2007年03月30日 16:22