Library > 数学 > 統計学 > Note4_推定と検定

キーワード:推定

点推定量
不偏推定量
一致推定量
有効推定量
最尤推定量

キーワード:検定

仮説
有意水準
棄却
棄却域
受容域、採択域
第1種誤り
第2種誤り
検出力
帰無仮説(null hypothesis)
対立仮説(alternative hypothesis)
片側検定
両側検定
最強力検定
z検定
t検定
χ二乗検定
無相関性の検定


推定

  • 推定とは、サンプルデータ(母集団)から、パラメータの値そのものを知る事を目的とする。1つの値もしくは区間によって推定を行う。

点推定量

  • 確率分布における特定のパラメータを一つの値で推定する。
  • 平均であれば、例えば以下の指標を用いる。
    1. 算術平均(標本平均、平均値)
    2. 幾何平均
    3. 調和平均
    4. 中央値(Median、メディアン、メデアン)
    5. 最頻値(Mode)
    6. 重み付き平均
    7. α刈り込み平均(α-trimmed mean)
    8. 標本平均、幾何平均、調和平均の関係
  • 分散であれば、同様に以下。
    1. 標本分散(standard variance)
    2. 不偏分散(unbiased variance)

区間推定

  • 点推定に対して、ある程度推定区間を設定したもの。どの程度信頼するかまでの区間も考える。

不偏推定量

  • 以下を満たすとき、不偏推定量という。 E(\hat{\theta}) = \theta

一致推定量

  • 推定パラメータが真のパラメータに確率収束するとき、それを一致推定量という。

P(|\hat{\theta} -\theta | \geq \epsilon) \to 0 , n\to \infty

有効推定量

  • クラメル-ラオの不等式の等号を満たす不偏推定量を有効推定量という。

クラメル-ラオの不等式

  • 結構、証明すると長くなる。

Var(\hat{\theta}) \geq 1/(nE\{ [ \frac{\partial}{\partial \theta} log f(X;\theta) ]^2 \}  )

最尤推定量

  • 尤度関数を最大にする推定方法である。
  • 尤度関数 L(\theta) = \prod_{i=1}^n f(x_i;\theta)
  • 尤度関数を最大化ポイントを探す(普通は以下の方程式を解く)

\frac{\partial}{\partial \theta} log L(\theta)=0

最大事後確率(MAP)推定

ベイズ推定

モーメント法

最良線形不偏推定量(BLUE)

推定に関する理論

フィッシャー情報量

フィッシャー-ネイマンの分解定理

ラオ-ブラックウェル推定量

EMアルゴリズム



検定

仮説

  • パラメータもしくは、分布に関する二つの推測(仮説)を立て、どちらが正しいか推測する問題を取り扱う。

帰無仮説(null hypothesis),Ho

  • 現状維持仮説

対立仮説(alternative hypothesis),Hi

  • 変化が合ったかを問う仮説

棄却

棄却域(critical region,rejection region)

  • データが特定の分布の領域に入れば、帰無仮説を棄却する。帰無仮説を棄却する領域のことを棄却域という。
  • 検定とは、棄却域をどのように決めるかと等価である。

受容域、採択域(acceptance region)

  • 棄却されない領域のこと。

誤り、過誤

判断 Hoが正しいとき Hiが正しいとき
棄却 第1種誤り=確率α(危険率) 正しい=1-β
受容 正しい=1-α 第2種誤り=確率β(検出力)

第1種誤り(第1種の過誤、生産者危険)

  • 帰無仮説(Ho)が、正しいにも関わらず、帰無仮説(Ho)を棄却する誤り(Hiを棄却しない誤り)

第2種誤り(第2種の過誤、消費者危険)

  • 対立仮説(Hi)が、正しいにも関わらず、帰無仮説(Ho)を棄却しない誤り(Hiを棄却する誤り)

有意水準(危険率,significance level)

  • 第1種誤りが発生する確率=αのこと、有意水準(危険率)を言う。

検出力(power)

  • 第2種誤りが発生する確率=βとしたとき、1-βを検出力という。

最強力検定

  • 有意水準αの条件で、検出力(1-β)を最大にする検定を、最強力検定という。

一様最強力検定(Uniformly most Powerful test:UMP test)

  • 有意水準αの検定δ*が、他のどんな有意水準αの検定δを想定しても、検出力が大きいとき一様最強力検定と言う。

検定の理論

ネイマン-ピアソンの基本定理

不偏検定

尤度比検定

スコア検定(Score検定)

ワルド検定(Wald検定)

z検定(正規検定、正規分布の平均に関する検定)

  • 正規分布を想定したときの平均値の検定(棄却域の決め方)である。

片側検定

  • 正規分布の片側の領域を棄却域として設定する。

両側検定

  • 正規分布の両側の領域を棄却域として設定する。

Welch検定(分散が未知の場合の平均の差の検定)

マクネマー検定(差の検定)

分割表の検定

フィッシャー検定

t検定

カイ2乗検定(適合度検定)

無相関性の検定

G検定

  • KL距離を使うらしい。

分散均一性の検定

バートレットの検定

ゴールドウェルト・クォントの検定

  • Goldfeld-Quandt's test

ブルーシュ・ベイガン検定

  • Breuseh-Pagan Test

順位によるノンパラメトリック検定

ウィルコクソンの順位和検定(マン・ホイットニーU検定)

ウィルコクソンの符号付順位検定

モンテカルロ検定

解析ソフトウェア

Dunnetの検定

両側検定、片側検定

BONFERRONI’S AND SIDAK’S MODIFIED TESTS

一元配置分散分析のその後の検定

Sidak:

  • t 統計量に基づくペアごとの多重比較検定。Sidak の方法は、 多重比較の有意水準を調整して、Bonferroni の方法より厳しい限界を設定します。

Bonferroni.

  • t 検定を使用してグループ平均の間でのペアワイズ比較を行います。 ただし、実験ごとの誤差率を総検定数で割った値を各検定の誤差率として設定することによって、全体の誤差率を調整します。したがって、多重比較を実行するとして観測有意水準を調整します。

このコラムの参考文献

  • 白旗 慎吾,"統計解析入門",共立出版
  • 統計検定2級対応 統計学基礎 日本統計学会 編
  • 基礎統計学Ⅱ(人文・社会科学の統計学)
  • 基礎統計学Ⅲ(自然科学の統計学)
最終更新:2021年08月03日 16:26