統計

<代表値>

  • 平均値
 m乗平均m乗平方根:

 2乗平均2乗平方根:m=2
 相加平均(算術平均):m=1
 相乗平均(幾何平均):m→0
 調和平均(調和平均):m=-1

  • 中央値
 m分位数:分布をm:(1-m)に分割する
 第im分位点(i/m分位数):分布をm等分したうちのi番目の順位
 qパーセンタイル(q/100分位数):分布を100等分したうちのq番目の順位

 100パーセンタイル(最大値,1分位点):q=100
 75パーセンタイル(第3四分位点):q=75
 50パーセンタイル(中央値,第2四分位点):q=50
 25パーセンタイル(第1四分位点):q=25
 0パーセンタイル(最小値,0分位点):q=25

  • 最頻値
 離散確率分布の最頻値は、確率質量関数が最大となる値
 連続確率分布の最頻値は、確率密度関数が最大となる値

 全域的最大値が最頻値
 最も頻繁に出現する値は1つとは限らないため、最頻値は一意に定まらないことがある

 確率密度関数が複数の極値を持つ場合、それぞれをその分布の最頻値とすることもある
 そのような連続確率分布を「多峰性分布」、そうでないものを「単峰性分布」と呼ぶ

 線対称な単峰性分布では、平均値、中央値、最頻値が全て一致する

  • 平均値+分散or標準偏差

  • 中央値+四分位数範囲(第3四分位点と第1四分位点の差)


 平均値は、外れ値(他の値より著しく異なる値)に大きく影響され、誤差が大きくなったり、無意味な値となることがある
 中央値は、外れ値にほとんど影響されない

 平均値では、データが限定(正値のみなど)される場合、分布は非対称になりやすく、少数の大きな値に引きずられて大きくずれることがある
 中央値では、そういった影響はほとんどない。

 平均値は、±∞を含むデータに対して、必ず無限または不定となる
 中央値は、±∞を含むデータに対しても、有限となることがある

 平均値は、2峰分布に対ししばしば谷に位置する
 中央値は、分布の谷に位置する場合が少ない

 平均値の誤差は、データの誤差の1/√n倍
 中央値の誤差は、データの誤差と同程度

  • 平均
 原点まわりの1次モーメント
 和を個数で割ったもの

  • 分散
  • 標準偏差
 2次中央モーメントから求められる統計量
 分布の広がり

  • 歪度
 3次中央モーメントから求められる統計量
 分布の左右非対称の度合い

  • 尖度
 4次中央モーメントから求められる統計量
 分布の峰の鋭さ(裾野の広さ)
 3 を引かない定義もある

  • 疫学

最終更新:2013年10月11日 20:33
ツールボックス

下から選んでください:

新しいページを作成する
ヘルプ / FAQ もご覧ください。