<代表値>
m乗平均m乗平方根:
2乗平均2乗平方根:m=2
相加平均(算術平均):m=1
相乗平均(幾何平均):m→0
調和平均(調和平均):m=-1
m分位数:分布をm:(1-m)に分割する
第im分位点(i/m分位数):分布をm等分したうちのi番目の順位
qパーセンタイル(q/100分位数):分布を100等分したうちのq番目の順位
100パーセンタイル(最大値,1分位点):q=100
75パーセンタイル(第3四分位点):q=75
50パーセンタイル(中央値,第2四分位点):q=50
25パーセンタイル(第1四分位点):q=25
0パーセンタイル(最小値,0分位点):q=25
離散確率分布の最頻値は、確率質量関数が最大となる値
連続確率分布の最頻値は、確率密度関数が最大となる値
全域的最大値が最頻値
最も頻繁に出現する値は1つとは限らないため、最頻値は一意に定まらないことがある
確率密度関数が複数の極値を持つ場合、それぞれをその分布の最頻値とすることもある
そのような連続確率分布を「多峰性分布」、そうでないものを「単峰性分布」と呼ぶ
線対称な単峰性分布では、平均値、中央値、最頻値が全て一致する
- 中央値+四分位数範囲(第3四分位点と第1四分位点の差)
平均値は、外れ値(他の値より著しく異なる値)に大きく影響され、誤差が大きくなったり、無意味な値となることがある
中央値は、外れ値にほとんど影響されない
平均値では、データが限定(正値のみなど)される場合、分布は非対称になりやすく、少数の大きな値に引きずられて大きくずれることがある
中央値では、そういった影響はほとんどない。
平均値は、±∞を含むデータに対して、必ず無限または不定となる
中央値は、±∞を含むデータに対しても、有限となることがある
平均値は、2峰分布に対ししばしば谷に位置する
中央値は、分布の谷に位置する場合が少ない
平均値の誤差は、データの誤差の1/√n倍
中央値の誤差は、データの誤差と同程度
原点まわりの1次モーメント
和を個数で割ったもの
2次中央モーメントから求められる統計量
分布の広がり
3次中央モーメントから求められる統計量
分布の左右非対称の度合い
4次中央モーメントから求められる統計量
分布の峰の鋭さ(裾野の広さ)
3 を引かない定義もある
最終更新:2013年10月11日 20:33