アットウィキロゴ

例題

ある会社の社員の月給は以下の通りであった。(単位:万円)
 15、15、15、15(新入社員)、20、20、25(社員)、30(課長)、50(部長)、80(社長)

このとき、給与の平均は28.5万円、メディアンは20万円、モードは15万円、となる。
今回はメディアンの値が代表値として適切であると言える。

  • 平均値は外れ値に弱い!
  平均値は外れ値(はずれち:極端に大きい値や小さい値)に引きずられることがあるので、注意しなければいけない。
  場合によっては外れ値を除外して処理しないと、当初に予定した結論が変わってしまうことがある。

問題

pttestのscoreの値を用いて、平均、メディアン、モードを求め、データの形状を予想せよ。


参考

標本分散S_{x}と不偏分散U_{x}の関係
NS_{x}=(x_1 -\bar{x})^2+\dots+(x_N -\bar{x})^2=(N-1)U_x
ゆえに、
NS_{x}=(N-1)U_{x}
S_{x}=\frac{N-1}{N}U_{x}

Rの関数

NROW( )  サンプル数(縦方向のデータ数)
var( )   不偏分散を求める関数
sqrt( )  平方根を求める関数
sd( )   不偏標準偏差を求める関数

最終更新:2012年06月09日 12:35