Library > 数学 > 統計学 > Note3_確率分布の理解と乱数生成

「Library/数学/統計学/Note3_確率分布の理解と乱数生成」の編集履歴(バックアップ)一覧はこちら

Library/数学/統計学/Note3_確率分布の理解と乱数生成 - (2016/05/05 (木) 18:49:06) の1つ前との変更点

追加された行は緑色になります。

削除された行は赤色になります。

#navi(Library/数学/統計学) #contents *キーワード ベルヌーイ試行 2項分布 負の2項分布 超幾何分布 ポワソン分布 一様分布 正規分布 ベータ分布 ガンマ分布 指数分布 ワイブル分布 ラプラス分布 ハザード分布 ロジスティック分布 カイ2乗分布 t分布 F分布 ---- ---- *離散確率分布 ---- ---- **ベルヌーイ試行 -独立同一分布(i.i.d)で、事象の要素が、2種類(0と1)で、例として、1の発生確率をp、0の発生確率を1-pとした長さnの、事象の順序を決めた場合の確率 $$P(X_{1}=k_1, X_{2}=k_2, \dots ,X_{n}=k_n)=p^k(1-p)^{n-k}, k=\sum_{i=1}^{n}k_i$$ ---- **2項分布 -独立同一分布(i.i.d)で、事象の要素が、2種類(0と1)で、例として、1の発生確率をp、0の発生確率を1-pとした長さnの時の、1の発生回数が、X=kとした場合の確率 $$P(X=k)={}_n C_k p^k(1-p)^{n-k}, k=0,1,\dots,n$$ ---- **ポワソン分布 -2項分布の極限操作によってポワソン分布を作る事ができる。 -希現象の大量観察のモデルとして、使われる。 -トラフィック理論では、呼の到着モデルとして使われる。 $$n \to \infty , p \to 0, np=\lambda \ge 0$$ $$p_k = e^{-\lambda} \frac{\lambda^k}{k!}$$ ---- **負の2項分布 -ベルヌーイ試行において、0がr回数出るまで続ける場合、その間に出続ける1の回数をXとする。 $$P(X=k)=p_k={}_{k+r-1} C_k p^k(1-p)^{r},$$ ---- **超幾何分布 -M個の要素から成り、そのうちN個は、1であるサンプルを想定する。M-N個は、0である母集団から重複を許さずn個の要素を取り出す(非復元抽出)行為を行う。そこから取り出した1個が、Xとなる確率。 $$P(X=k) = ({}_N C_k)({}_{M-N} C_{n-k}) / {}_{N} C_{n} $$ ---- ---- *連続確率分布 ---- **一様分布 -区間(a,b)内に一様にランダムに値を取る確率変数 $$f(x) = \frac{1}{b-a}, a\leq x \leq b $$ -平均 $$E(X)= \frac{a+b}{2}$$ -分散 $$VAR(X)= \frac{(b-a)^2}{12}$$ ---- **正規分布 -平均$$\mu$$、分散$$\sigma$$の正規分布。中心極限定理で保証される。 -密度関数 $$\Huge f(x) = \frac{1}{ \sqrt(2\pi \sigma^2)} exp(-(x-\mu)^2/(2 \sigma^2))$$ ***標準正規分布 -平均0、分散1の正規分布。 ***対数正規分布 -Y=logXが、正規分布に従う場合のXの分布 ***ロジスティック分布 $$\Huge f(x) = exp(-(x-\mu)/\sigma)/(\sigma \{1+ exp(-(x-\mu)/\sigma) \})^2$$ ---- **ベータ分布 -密度関数 $$f(x) = \frac{1}{B(a,b)} x^{a-1}(1-x)^{b-1}, a\le x \le b $$ -ベータ関数 $$B(a,b)=\int_0^{\infty}x^{a-1}exp(-x)dx, a\ge 0$$ ***ウィシャート分布 -多次元のベータ分布 ---- **ガンマ分布 -ベイズ推定では、応用上、重要らしい。 -密度関数 $$f(x)=\frac{1}{\Gamma (\alpha) \beta^{\alpha}} x^{\alpha -1} exp(-\frac{x}{\beta}), x \geq 0, \alpha, \beta \geq 0$$ ***ディリクレ分布 -多次元のガンマ分布 ---- **指数分布 -故障確率のモデルでもある。ポワソン分布と関連深い。 -密度関数 $$f(x)=\lambda exp(-\lambda x)$$ -ポワソン分布との関係 --ポワソン分布をアレンジ(0,t]の間にk個の事象(故障)が発生する確率は、 $$p_k = e^{-\lambda t} \frac{(\lambda t)^k}{k!}$$ --次に、最初から(0,t]の間に0個の事象(故障)が発生する確率は、 $$P(X \geq 0)=p_0 = e^{-\lambda t} \frac{(\lambda t)^0}{0!}=e^{-\lambda t}$$ --これから、(0,t]の間に1個以上の事象(故障)が発生する確率は、 $$P(X \leq 0) = 1- P(X \geq 0) = 1- e^{-\lambda t}$$ --よって、単位時間当たりに、1個以上の事象(故障)が発生する確率は、 $$\frac{d P(X \leq 0)}{dt} = \lambda exp(-\lambda t)$$ --tをxに置き換えればよし。 ---- ***ワイブル分布 -指数分布のアレンジ $$f(x)=\frac{c}{\alpha } (\frac{x}{\alpha })^{c-1} exp (-(\frac{x}{\alpha })^c), x\geq 0$$ ---- ***パレート分布 -高額所得者の分布で見られる分布 ---- ***ラプラス分布(2重指数分布) -a,bは、正規化する必要あり。 $$f(x)=\frac{1}{2b} exp(-\frac{|x-a|}{b})$$ ---- ---- **カイ2乗分布 -X_1,...X_nが、互いに独立で、標準正規分布N(0,1)に従う変数とする。このとき、 $$X= \sum_{i=1}^n X_i^2$$ -の分布を自由度nのカイ2乗分布と呼ぶ。 -平均は、n、分散は、2nとなる。 ---- **t分布(stdudent分布) -Xが、標準正規分布N(0,1)、Yが、自由度nのカイ2乗分布に従うとき、 $$T=\frac{X}{\sqrt{Y/n}}$$ -の分布を自由度nのt分布とする。 ***コーシー分布 -自由度1のt分布である。 ---- **F分布 -Xが、由度mのカイ2乗分布、Yが、自由度nのカイ2乗分布に従うとき、 $$F=\frac{(X/m)}{(Y/n)}$$ -の分布を自由度(m,n)のF分布と呼ぶ。 ---- ---- *統計物理学との関連 **マクスウェル-ボルツマン(Maxwell-Boltzman)分布 **フェルミ分布 **ボース分布 ---- ---- *乱数生成 **一様分布の生成 ***メルセンヌツイスター -有名 **正規分布の生成 ***ボックス=ミュラー法 ***中心極限定理を用いた手法 *任意の分布の生成 **棄却法 **マルコフ連鎖モンテカルロ法 ***メトロポリス・へイスティング法 ***ギブスサンプラー ---- *このコラムの参考文献 統計 -白旗 慎吾,"統計解析入門",共立出版 -NTTラーニングシステムズ株式会社編,"電気通信主任技術者 伝送交換設備及び設備管理・法規編" --故障率の解説がわかりやすい。 -阿部龍蔵,"熱統計物理学",裳華房 -基礎統計学Ⅰ(統計学入門),東京大出版 --パレート分布の存在を教えてくれた。 -杉山将,"機械学習プロフェッショナルシリーズ 機械学習のための確率と統計",講談社 --ラプラス分布、ディリクレ分布、ウィシャート分布を参考。
#navi(Library/数学/統計学) #contents *キーワード ベルヌーイ試行 2項分布 負の2項分布 超幾何分布 ポワソン分布 一様分布 正規分布 ベータ分布 ガンマ分布 指数分布 ワイブル分布 ラプラス分布 ハザード分布 ロジスティック分布 カイ2乗分布 t分布 F分布 ---- ---- *離散確率分布 ---- ---- **ベルヌーイ試行 -独立同一分布(i.i.d)で、事象の要素が、2種類(0と1)で、例として、1の発生確率をp、0の発生確率を1-pとした長さnの、事象の順序を決めた場合の確率 $$P(X_{1}=k_1, X_{2}=k_2, \dots ,X_{n}=k_n)=p^k(1-p)^{n-k}, k=\sum_{i=1}^{n}k_i$$ ---- **2項分布 -独立同一分布(i.i.d)で、事象の要素が、2種類(0と1)で、例として、1の発生確率をp、0の発生確率を1-pとした長さnの時の、1の発生回数が、X=kとした場合の確率 $$P(X=k)={}_n C_k p^k(1-p)^{n-k}, k=0,1,\dots,n$$ ---- **ポワソン分布 -2項分布の極限操作によってポワソン分布を作る事ができる。 -希現象の大量観察のモデルとして、使われる。 -トラフィック理論では、呼の到着モデルとして使われる。 $$n \to \infty , p \to 0, np=\lambda \ge 0$$ $$p_k = e^{-\lambda} \frac{\lambda^k}{k!}$$ ---- **負の2項分布 -ベルヌーイ試行において、0がr回数出るまで続ける場合、その間に出続ける1の回数をXとする。 $$P(X=k)=p_k={}_{k+r-1} C_k p^k(1-p)^{r},$$ ---- **超幾何分布 -M個の要素から成り、そのうちN個は、1であるサンプルを想定する。M-N個は、0である母集団から重複を許さずn個の要素を取り出す(非復元抽出)行為を行う。そこから取り出した1個が、Xとなる確率。 $$P(X=k) = ({}_N C_k)({}_{M-N} C_{n-k}) / {}_{N} C_{n} $$ ---- ---- *連続確率分布 ---- **一様分布 -区間(a,b)内に一様にランダムに値を取る確率変数 $$f(x) = \frac{1}{b-a}, a\leq x \leq b $$ -平均 $$E(X)= \frac{a+b}{2}$$ -分散 $$VAR(X)= \frac{(b-a)^2}{12}$$ ---- **正規分布 -平均$$\mu$$、分散$$\sigma$$の正規分布。中心極限定理で保証される。 -密度関数 $$\Huge f(x) = \frac{1}{ \sqrt(2\pi \sigma^2)} exp(-(x-\mu)^2/(2 \sigma^2))$$ ***標準正規分布 -平均0、分散1の正規分布。 ***対数正規分布 -Y=logXが、正規分布に従う場合のXの分布 ***ロジスティック分布 $$\Huge f(x) = exp(-(x-\mu)/\sigma)/(\sigma \{1+ exp(-(x-\mu)/\sigma) \})^2$$ ---- **ベータ分布 -密度関数 $$f(x) = \frac{1}{B(a,b)} x^{a-1}(1-x)^{b-1}, a\le x \le b $$ -ベータ関数 $$B(a,b)=\int_0^{\infty}x^{a-1}exp(-x)dx, a\ge 0$$ ***ウィシャート分布 -多次元のベータ分布 ---- **ガンマ分布 -ベイズ推定では、応用上、重要らしい。 -密度関数 $$f(x)=\frac{1}{\Gamma (\alpha) \beta^{\alpha}} x^{\alpha -1} exp(-\frac{x}{\beta}), x \geq 0, \alpha, \beta \geq 0$$ ***ディリクレ分布 -多次元のガンマ分布 ---- **指数分布 -故障確率のモデルでもある。ポワソン分布と関連深い。 -密度関数 $$f(x)=\lambda exp(-\lambda x)$$ -ポワソン分布との関係 --ポワソン分布をアレンジ(0,t]の間にk個の事象(故障)が発生する確率は、 $$p_k = e^{-\lambda t} \frac{(\lambda t)^k}{k!}$$ --次に、最初から(0,t]の間に0個の事象(故障)が発生する確率は、 $$P(X \geq 0)=p_0 = e^{-\lambda t} \frac{(\lambda t)^0}{0!}=e^{-\lambda t}$$ --これから、(0,t]の間に1個以上の事象(故障)が発生する確率は、 $$P(X \leq 0) = 1- P(X \geq 0) = 1- e^{-\lambda t}$$ --よって、単位時間当たりに、1個以上の事象(故障)が発生する確率は、 $$\frac{d P(X \leq 0)}{dt} = \lambda exp(-\lambda t)$$ --tをxに置き換えればよし。 ---- ***ワイブル分布 -指数分布のアレンジ $$f(x)=\frac{c}{\alpha } (\frac{x}{\alpha })^{c-1} exp (-(\frac{x}{\alpha })^c), x\geq 0$$ ---- ***パレート分布 -高額所得者の分布で見られる分布 ---- ***ラプラス分布(2重指数分布) -a,bは、正規化する必要あり。 $$f(x)=\frac{1}{2b} exp(-\frac{|x-a|}{b})$$ ---- ---- **カイ2乗分布 -X_1,...X_nが、互いに独立で、標準正規分布N(0,1)に従う変数とする。このとき、 $$X= \sum_{i=1}^n X_i^2$$ -の分布を自由度nのカイ2乗分布と呼ぶ。 -平均は、n、分散は、2nとなる。 ---- **t分布(stdudent分布) -Xが、標準正規分布N(0,1)、Yが、自由度nのカイ2乗分布に従うとき、 $$T=\frac{X}{\sqrt{Y/n}}$$ -の分布を自由度nのt分布とする。 ***コーシー分布 -自由度1のt分布である。 ---- **F分布 -Xが、由度mのカイ2乗分布、Yが、自由度nのカイ2乗分布に従うとき、 $$F=\frac{(X/m)}{(Y/n)}$$ -の分布を自由度(m,n)のF分布と呼ぶ。 ---- ---- *統計物理学との関連 **マクスウェル-ボルツマン(Maxwell-Boltzman)分布 **フェルミ分布 **ボース分布 ---- ---- *乱数生成(特定の分布) **一様分布の生成 ***メルセンヌツイスター -有名 **正規分布の生成 ***ボックス=ミュラー法 ***中心極限定理を用いた手法 *乱数生成(任意の分布) **棄却法 **マルコフ連鎖モンテカルロ法 ***メトロポリス・へイスティング法 ***ギブスサンプラー ---- *このコラムの参考文献 統計 -白旗 慎吾,"統計解析入門",共立出版 -NTTラーニングシステムズ株式会社編,"電気通信主任技術者 伝送交換設備及び設備管理・法規編" --故障率の解説がわかりやすい。 -阿部龍蔵,"熱統計物理学",裳華房 -基礎統計学Ⅰ(統計学入門),東京大出版 --パレート分布の存在を教えてくれた。 -杉山将,"機械学習プロフェッショナルシリーズ 機械学習のための確率と統計",講談社 --ラプラス分布、ディリクレ分布、ウィシャート分布を参考。

表示オプション

横に並べて表示:
変化行の前後のみ表示: