アットウィキロゴ

第2回 ヒストグラムと代表値


【小テスト】

下のデータは、50本の立木の高さの測定値である(単位:m)。
これらのデータを分類して、次の度数分布表を作る。空欄に数値を記入し、ヒストグラムを作りなさい。
68、70、61、82、54、84、51、74、64、45
77、80、52、62、63、70、69、55、68、66
60、60、88、67、84、87、77、66、69、61
47、85、66、94、57、71、58、87、78、64
71、72、50、57、95、88、64、70、73、56

階 級 チェック欄 度数
44以上50未満
50以上56未満
56以上62未満
62以上68未満
68以上74未満
74以上80未満
80以上86未満
86以上92未満
92以上98未満
合 計

(ヒストグラム)  目盛りは自分で作ること

【実習】
PC教室の「共有フォルダ」に「サンプル.xlsx」というファイルあるので、
このファイルを右クリック、「送る」「ドキュメント」(またはUSBメモリ)で転送する。
転送先からファイルを開く。

「ドキュメント」から「サンプル.xlsx」をダブルクリックして開く。

  • チェック欄は、自分のやりやすい方法で数える。
  • 幹葉図:
  4|57
  5|012456778
  6|00112344466678899
  7|0001234778
  8|024457788
  9|45
 のように数えると、最大値と最小値、また、後述する最頻値が一目でわかる。

【エクセルで数える方法】・・・FREQUENCY()を使う
  • 入力されたデータは、「A2:A51」にあるとする。
  • 問題で与えられている「50未満」は「49以下」と同じであることを確認する。
  • D4セルに「49」を入力し、階級幅が6であることから、D5セルに「55」を入れる。
  • 「D4:D5」を範囲指定し、右下ハンドルを下へドラッグし「97」までコピーする。
  • 関数の使い方:「E2:E12」を範囲指定する。「関数挿入」より「FREQUENCY」を選ぶ。
  • データ範囲に「A2:A51」、区間範囲に「D4:D12」とする。その後。「CTRL」「SHIFT」を同時に押し「OK」として計算ができる。下記のように得られる。

【ヒストグラム】・・・縦棒グラフで幅を広げる。
  • まず、「E4:E12」を範囲指定し、「挿入」「縦棒グラフ」「2D」を選ぶ。
  • グラフができたら、『グラフツール」「デザイン」「データの選択」で、「編集」をクリックして、「D4:D12」を範囲指定し「OK」とする。
  • グラフ中の縦棒を一回クリックし、縦棒全体を範囲指定する。「グラフツール」「レイアウト」で、「選択対象の書式設定」で、「要素の間隔」を「なし」にして「閉じる」をクリックする。これでヒストグラムができる。

1.4 データの特徴を考えてみよう(代表値)

  • データ集団の特徴を表すものが「代表値」である。「代表値」はデータ集団の「真ん中」を意味する。
  • 代表値としては、次の3つがある。
  • 中央値(メディアン、median)・・・データ集団を小さい順に並べたときに中央に来る値。データ数が奇数個ならば1個、偶数ならば中央の2個の平均で与える。
(例){8,10,12,13,18}・・・5個なので、(5+1)÷2=3番目「12」が中央値。
   {8,10,11,12,13,18}・・・6個なので、6/2=3で、3番目「11」と4番目「12」の平均値「11.5」が中央値。
  • 最頻値(モード、mode)・・・登場する回数の最も多いもの。1個とは限らず、複数あることがある。幹葉図で重複する数の多いものが最頻値である。
(例){2,3,3,4,7,7,7,8}・・・「7」が3個あるので、最頻値は「7」。
  • 平均値・・・データの合計を個数で割ったもの。データ集団のバランスを取る位置である。
  • 小テストのデータの場合、下記のようになる。

四分位数

  • データ集団を小さい順に並べ、全体の4分の1の位置にあるものが「第1四分位数」、全体の4分の3にあたるものが「第3四分位数」である。
  • 「第3四分位数」と「第1四分位数」の差を「四分位範囲」といい、その半分を「四分位偏差」という。
  • これらの値を用いて「箱ひげ図」が作られる。


次回の小テストは、上記までの範囲です。

質問タイム

  • とにかく自分でエクセルを操作してみよう! -- 小西敏雄 (2016-04-18 19:18:42)
名前:
コメント:

最終更新:2016年04月25日 15:34