■分散と標準偏差
- 分散(variance)
- σ^2, Var(X), V(X), V
- V = Σ(偏差の二乗) / n
- V = {Σ(X^2) / n} - M^2
- 標準偏差(standard deviation)
- 分散の平方根。√V
- σ = √{Σ(X-M)^2 / n}
- σ = √{Σf(X-M)^2 / Σf}
■標準測度と偏差値
- 標準測度
- t{i} = (x{i} - M) / σ
- 平均との差を標準偏差で割った値
- 平均との差が標準偏差の何倍に当たるか
- 変量の値が資料全体の中でどのような位置にあるか
- t{i} = 1 ということは
- x{i} - M = σ、即ちx{i}は平均からσだけ離れている
- 偏差値
- z{i} = 50 + 10*t{i}
- 標準測度は負の値になることもあり、印象が悪い(^^)
- 必ず非負の値になるのかな?
- 偏差値60ということは
- 標準測度t{i} = 1, 即ち平均からσだけ離れている
■チェビシェフの不等式
- n個の変量の平均値をM、標準偏差をσとすると、任意の正数λについて以下が成り立つ
- |x{i}-M|≦λ・σとなる資料の個数はn・(1-1/(λ^2))以上である
- 平均との差が標準偏差のλ倍以内である資料の個数は、全体の(1-1/(λ^2))パーセント以上を占める
- λ=2なら、1-1/(2^2) = 1-1/4 = 3/4, 75%
- 平均との差(の絶対値)が標準偏差の2倍以内である変量の個数は全体の75%以上
- 逆に言えば、|x{i}-M|>λ・σとなる資料の個数はn・1/(λ^2)以下
- 平均からλ×σ以上離れているデータは1/(λ^2)の割合しかない
■変化係数
- 標準偏差は「散らばりの大きさ」を表す
- 複数の標準偏差を比べる時、散らばりの相対的大きさを表すのが変化係数(CV)
- CV = σ/M
- 変化係数 = 標準偏差÷平均
最終更新:2007年05月19日 22:10