ビジネス情報処理(第3回)
【復習+α】
- 度数分布表の作り方(1回目)
- ヒストグラムの作り方(2回目)
今日は、基本統計量の使い方を述べる。
1.集団の代表値について
- 平均値・・・全体の左右のバランスをとる位置。偏りがあれば、そちらに場所がずれる。
- 中央値(メディアン)・・・データを小さい順に並べたときに中央に来る値。偏りに影響されない。
- 最頻値(モード)・・・度数が最大になるもの。(多数決なら強い!)
2.ばらつきを示す尺度
- 分散・・・(各データ-平均)の2乗、の平均 各データが平均に近い(中央に集中)ときは小さい。
ばらばらだと分散は大きい。
- 標準偏差(SD、Standard Deviation)・・・分散の平方根
(注意)平均をM、標準偏差をsとすると、「正規分布」の形の時には
M-s~M+s 全体の68%が含まれる。
M-2s~M+2S 全体の95%が含まれる。
M-3s~M+3s 全体の99.7%が含まれる。含まれないのは0.3%(=1000分の3、1000に3つ)
(適用例)知能指数(IQ)、平均100、標準偏差15である。このとき、
IQが85(=100-15)から115(=100+15)の人は全体の68%いる。
基本統計量の計算法(分析ツール)
「ファイル」「オプション」「アドイン」「分析ツール」を選んで「設定」
「分析ツール」にチェックを入れる「OK」
①「データ」「データ分析」基本統計量を選んで「OK」
【練習問題】先週のファイル「練習1004解答例」を用いて、分析ツールを適用して基本統計量を求め、
データの集団について、わかることを述べなさい。
掲示板
何か質問があれば記入すること。
最終更新:2016年10月25日 12:25