第3回 データの中心と散らばり
前回の復習と補足
- 中央値・・・小さい順に並べて中央に来る値
- 平均値・・・データの合計を個数で割る
- 最頻値・・・度数が最大になるデータの値
元のデータが無く、度数分布表で与えられたときは、度数最大の階級の中央の値
stat0425.xlsxの時は、60-69が8個で最大なので、(60+69)/2=64.5となる。
○平均値≒中央値≒最頻値(≒は「ほぼ同じ」の意味)
⇒左右対称
○平均値<中央値<最頻値
⇒右寄り
○平均値>中央値>最頻値
⇒左寄り
データの形状は、上記の3つの値を比較することで、グラフ化しなくてもわかる。
平均が有効になるのは、基本的に「左右対称の場合」である。
- 左右対称の場合、中央の値は「平均値」で、幅は「標準偏差」で与える。
- 偏りがある場合、中央の値は「中央値」で、幅は「四分位偏差」で与える。
【練習問題】
次のデータの、平均値、中央値、最頻値、四分位偏差を求めよ。
{10、11、13、14、16、17、17、18、20、23}
セル内容
F5:=(16+17)/2
F6:=average(A2:A11)
F7:=17
F9:=(11+13)/2
F10:=(17+18)/2
F11:=(F10-F9)/2
次回の小テストで、今までの部分を確認するので、復習しておいてください。
最終更新:2016年05月09日 19:03