アットウィキロゴ

正規分布

  • 平均
    • 観測されるデータから、算術的に計算して得られる、統計的な指標値である。(wikipedia)
  • 分散
    • データの散らばり具合を示す尺度
       \sigma^2 = \frac{ \sum_{k = 1}^{n}({\overline{x}-x_i })^2 }{n}} 
      
  • なぜ2乗するか
    • 平均50点:Aさん50点、Bさん50点 = 平等
    • 平均50点:Aさん100点、Bさん0点 = 不平等(この平等、不平等感を数値で表す)
    • データのばらつき=平均点からの距離で表す。つまり分散は距離の2乗と考えられる。
    • 面積とも見れる。(https://www.youtube.com/watch?v=dCekZ3FdCz4)
    • 分散は距離^2もしくは面積の平均
    • ちなみに単位がない←何気に大事な考え方
    • より厳密にいうと、偏差では全て加算するとゼロになるため、偏差の二乗を加算する = 分散(Variance)。
  • 偏差
    • 平均値からどれほどずれているかを数値化
    • 偏差の平均はゼロ(当たり前)
  • 標準偏差(Standard Deviation)
    • 標準偏差はデータの広がり幅を見ることができる。
    • 分散の平方根 = 標準偏差(単位がつく)
    • 平均+1標準偏差(σ),平均-1標準偏差(-σ)内に収まる確立は約60%
    • (分散と標準偏差)https://www.youtube.com/watch?v=iW37lk7VgMQ
    • もっとたくさんあるデータの中から標本を選定して標準偏差を推定する場合はN-1で割る。
  • 正規分布(ガウス分布)
    • 標準正規分布 (平均,標準偏差) = (0,1) → N(0,1)
    • 平均+1標準偏差(σ),平均-1標準偏差(-σ)内に収まる確率は約68%
    • 平均+2標準偏差(2σ),平均-2標準偏差(-2σ)内に収まる確率は約95.44%
      • ぴったり95%にするには:1.96σとする。
  • 標準ではない正規分布
    • N(μ,σ)
最終更新:2015年02月21日 17:47