アットウィキロゴ

第5回 標準偏差と正規分布


前回の復習と補足

  • エクセルの計算式の入れ方で困っているという声をよく聞く。この授業で、エクセルの使い方を教えるつもりではない。
  • 簡単に計算するのであれば、関数を使えばよい。
 平均(average)・・・=average(範囲)
 偏差平方和(square sum of deviations)・・・=devsq(範囲)
 分散(variance)・・・=varp(範囲)
   varp() ⇒ データ要素すべての分散(全数調査)
   var() ⇒ 標本から母集団分散の推定(標本調査)
    関数の使用目的によって異なる関数を使用する。

標準偏差(standard deviation;SD)

  • 分散の正の平方根を「標準偏差」という。
  • 平均は「左右のバランスをとる位置」を与える。
  • 標準偏差は、「平均-SD」と「平均+SD」の間に、全体の約3分の2を含む区間を与える値である。


p12のリンゴの重量データから平均、分散、標準偏差を求めてみる。

  • 左の(A1:A20)がリンゴの重量データである。
  • D4には、=varp(A1:A20) が入っている。
  • D5には、=stdevp(A1:A20) が入っている。
  • D9には、=D3-D5 が入っている。
  • D10には、=D3+D5 が入っている。
  • この158.5271~219.4729の間に含まれてるデータの個数を数えると「12個」であり、
20個中12個だから、確率は0.6=60.0% である。

自分で1から9までの数を20個、ランダムにA1:A20に入れなさい。

  • 今度は任意に区間を求めてみた。
  • 左の(A1:A20)は、各自でランダムに数字を入力する。
  • D5には、=varp(A1:A20) が入っている。
  • D6には、=stdevp(A1:A20) が入っている。
  • D9には、=D3-D5 が入っている。
  • D10には、=D3+D5 が入っている。
  • D16には、=D9-D6 が入っている。
  • D17には、=D9+D6 が入っている。
  • この2.971836~6.728164の間に含まれてるデータの個数を数えると「13個」であり、
20個中13個だから、確率は0.65=65.0% である。
  • 上記のように、平均からの集中度により含まれる割合を、標準偏差で特徴付けをすることができる。
  • ばらつく範囲を目安を立てること、これが標準偏差の役割である。


何かあれば、質問してくださいね。

  • なんでも結構です。氏名欄は学生番号でよいです。あと、「投稿」をクリックしてください。 -- 小西 (2016-05-16 18:45:39)
名前:
コメント:

最終更新:2016年05月16日 18:45