第2回 ヒストグラムと代表値
【小テスト】
下のデータは、50本の立木の高さの測定値である(単位:m)。
これらのデータを分類して、次の度数分布表を作る。空欄に数値を記入し、ヒストグラムを作りなさい。
| 68、70、61、82、54、84、51、74、64、45 |
| 77、80、52、62、63、70、69、55、68、66 |
| 60、60、88、67、84、87、77、66、69、61 |
| 47、85、66、94、57、71、58、87、78、64 |
| 71、72、50、57、95、88、64、70、73、56 |
| 階 級 |
チェック欄 |
度数 |
| 44以上50未満 |
|
|
| 50以上56未満 |
|
|
| 56以上62未満 |
|
|
| 62以上68未満 |
|
|
| 68以上74未満 |
|
|
| 74以上80未満 |
|
|
| 80以上86未満 |
|
|
| 86以上92未満 |
|
|
| 92以上98未満 |
|
|
| 合 計 |
|
|
(ヒストグラム) 目盛りは自分で作ること
【実習】
PC教室の「共有フォルダ」に「サンプル.xlsx」というファイルあるので、
このファイルを右クリック、「送る」「ドキュメント」(またはUSBメモリ)で転送する。
転送先からファイルを開く。
「ドキュメント」から「サンプル.xlsx」をダブルクリックして開く。
- チェック欄は、自分のやりやすい方法で数える。
- 幹葉図:
4|57
5|012456778
6|00112344466678899
7|0001234778
8|024457788
9|45
のように数えると、最大値と最小値、また、後述する最頻値が一目でわかる。
【エクセルで数える方法】・・・FREQUENCY()を使う
- 入力されたデータは、「A2:A51」にあるとする。
- 問題で与えられている「50未満」は「49以下」と同じであることを確認する。
- D4セルに「49」を入力し、階級幅が6であることから、D5セルに「55」を入れる。
- 「D4:D5」を範囲指定し、右下ハンドルを下へドラッグし「97」までコピーする。
- 関数の使い方:「E2:E12」を範囲指定する。「関数挿入」より「FREQUENCY」を選ぶ。
- データ範囲に「A2:A51」、区間範囲に「D4:D12」とする。その後。「CTRL」「SHIFT」を同時に押し「OK」として計算ができる。下記のように得られる。
【ヒストグラム】・・・縦棒グラフで幅を広げる。
- まず、「E4:E12」を範囲指定し、「挿入」「縦棒グラフ」「2D」を選ぶ。
- グラフができたら、『グラフツール」「デザイン」「データの選択」で、「編集」をクリックして、「D4:D12」を範囲指定し「OK」とする。
- グラフ中の縦棒を一回クリックし、縦棒全体を範囲指定する。「グラフツール」「レイアウト」で、「選択対象の書式設定」で、「要素の間隔」を「なし」にして「閉じる」をクリックする。これでヒストグラムができる。
1.4 データの特徴を考えてみよう(代表値)
- データ集団の特徴を表すものが「代表値」である。「代表値」はデータ集団の「真ん中」を意味する。
- 代表値としては、次の3つがある。
- 中央値(メディアン、median)・・・データ集団を小さい順に並べたときに中央に来る値。データ数が奇数個ならば1個、偶数ならば中央の2個の平均で与える。
(例){8,10,12,13,18}・・・5個なので、(5+1)÷2=3番目「12」が中央値。
{8,10,11,12,13,18}・・・6個なので、6/2=3で、3番目「11」と4番目「12」の平均値「11.5」が中央値。
- 最頻値(モード、mode)・・・登場する回数の最も多いもの。1個とは限らず、複数あることがある。幹葉図で重複する数の多いものが最頻値である。
(例){2,3,3,4,7,7,7,8}・・・「7」が3個あるので、最頻値は「7」。
- 平均値・・・データの合計を個数で割ったもの。データ集団のバランスを取る位置である。
- 小テストのデータの場合、下記のようになる。
四分位数
- データ集団を小さい順に並べ、全体の4分の1の位置にあるものが「第1四分位数」、全体の4分の3にあたるものが「第3四分位数」である。
- 「第3四分位数」と「第1四分位数」の差を「四分位範囲」といい、その半分を「四分位偏差」という。
- これらの値を用いて「箱ひげ図」が作られる。
次回の小テストは、上記までの範囲です。
質問タイム
- とにかく自分でエクセルを操作してみよう! -- 小西敏雄 (2016-04-18 19:18:42)
最終更新:2016年04月25日 15:34