第5回 標準偏差と正規分布
前回の復習と補足
- エクセルの計算式の入れ方で困っているという声をよく聞く。この授業で、エクセルの使い方を教えるつもりではない。
- 簡単に計算するのであれば、関数を使えばよい。
平均(average)・・・=average(範囲)
偏差平方和(square sum of deviations)・・・=devsq(範囲)
分散(variance)・・・=varp(範囲)
varp() ⇒ データ要素すべての分散(全数調査)
var() ⇒ 標本から母集団分散の推定(標本調査)
関数の使用目的によって異なる関数を使用する。
標準偏差(standard deviation;SD)
- 分散の正の平方根を「標準偏差」という。
- 平均は「左右のバランスをとる位置」を与える。
- 標準偏差は、「平均-SD」と「平均+SD」の間に、全体の約3分の2を含む区間を与える値である。
p12のリンゴの重量データから平均、分散、標準偏差を求めてみる。
- 左の(A1:A20)がリンゴの重量データである。
- D4には、=varp(A1:A20) が入っている。
- D5には、=stdevp(A1:A20) が入っている。
- D9には、=D3-D5 が入っている。
- D10には、=D3+D5 が入っている。
- この158.5271~219.4729の間に含まれてるデータの個数を数えると「12個」であり、
20個中12個だから、確率は0.6=60.0% である。
自分で1から9までの数を20個、ランダムにA1:A20に入れなさい。
- 今度は任意に区間を求めてみた。
- 左の(A1:A20)は、各自でランダムに数字を入力する。
- D5には、=varp(A1:A20) が入っている。
- D6には、=stdevp(A1:A20) が入っている。
- D9には、=D3-D5 が入っている。
- D10には、=D3+D5 が入っている。
- D16には、=D9-D6 が入っている。
- D17には、=D9+D6 が入っている。
- この2.971836~6.728164の間に含まれてるデータの個数を数えると「13個」であり、
20個中13個だから、確率は0.65=65.0% である。
- 上記のように、平均からの集中度により含まれる割合を、標準偏差で特徴付けをすることができる。
- ばらつく範囲を目安を立てること、これが標準偏差の役割である。
何かあれば、質問してくださいね。
- なんでも結構です。氏名欄は学生番号でよいです。あと、「投稿」をクリックしてください。 -- 小西 (2016-05-16 18:45:39)
最終更新:2016年05月16日 18:45