アットウィキロゴ

Chapter 2 Probability Distributions(DRaEA)

二項分布、ポアソン分布、ガウス分布を考える。中でもガウス分布が最も重要で、実際には、ランダム観測の分布を記述しているようなので有用である。

ポアソン分布は、一般的に、単位間隔に観測されるイベント数などの係数実験に適している。放射性崩壊などのランダムプロセスで重要である。

二項分布は、結果がありうる最終状態の小さな数のうちのひとつであるときに、有用である。例えば、コイントスの表と裏などの場合である。ポアソン分布もガウス分布も、二項分布の極限の場合なので、二項分布を考える。

  • 2.1. BINOMIAL DISTRIBUTION

コインを投げて、表が出る場合と、裏が出る場合があるが、この試行回数を増やしていくと、表が出る確率は1/2に収束するはず。
コインを2枚にすると、表表、表裏、裏表、裏裏がそれぞれ1/4で起こるはず。それぞれのコインを区別しなければ、表と裏が1枚ずつになる確率は1/2になり、すべての確率を足すと1/4+1/4+1/4+1/4=1となる。つまり、必ず何かが起こるということである。
拡張して、n枚のコインを投げるとすると、そのうちのx枚が表を向くかという確率を、P(x;n)とする。この時、xは整数であるべきだが、数学的な目的から連続的な変数であるとする。

[Permutations and Combinations]

n枚のコインを投げた場合、異なるケースが2^n通りあり、それぞれが1/2^nの確率で起こることとなる。
何通りが、x枚表になるケースになるかを考える。”表”と書いた箱と”裏”と書いた箱を用意して、表にはxこのスロットを用意する。まず、xと(n-x)に分かれるかを考え、その中でそれぞれ表と裏になることを考える。
置換(permutation)の数Pm(n,x)を考えるために、n枚のコインから1枚ずつ選んで、表の箱に入れる。最初の選択では、n枚が選べる。2回目の選択では、(n-1)枚が選べる。xこのスロットがいっぱいになるまでやると、選択数は、
Pm(n,x) = n(n-1)(n-2)\cdots (n-x+2)(n-x+1) = \frac{n!}{(n-x)!}
表の箱の中のコインは区別がないので、x!通りの置換があるため、組み合わせC(n,x)は
C(n,x)=\frac{Pm(n,x)}{x!} = \frac{n!}{x!(n-x)!} = \begin{pmatrix} n \\ x \end{pmatrix}

[Probability]

各組み合わせC(n,x)がどの確率P(x;n)は、(1/2)^nである。
実際には、表と裏が同じ確率でない場合、表がp、裏がqの確率で起こるとすると、p^xq^{n-x}=p^x(1-p)^{n-x}となる。
これらの定義で言うと、二項分布は、
$$P_B(x;n,p) = \begin{pmatrix} n \\ x \end{pmatrix}p^xq^{n-x} = \frac{x!}{x!(n-x)!}p^x(1-p)^{n-
}$$
となる。二項定理によると、
(p+q)^n = \sum_{x=0}^n\left[\begin{pmatrix} n \\ x \end{pmatrix} p^x q^{n-x}\right]
であり、これと似ているから付けられた名前である。
これから、二項分布が1に規格化されていることが確かめられる。

[Mean and Standard Deviation]

平均\muは、(1.10)と(2.4)から、
\mu = \sum_{x=0}^n\left[x\frac{n!}{x!(n-x)!}p^x(1-p)^{n-x}\right] = np
となる。
このことから、試行を繰り返せば、\bar{x}\muに近づくことになる。
分散\sigma^2は、(1.11)と(2.4)を組み合わせて、
\sigma^2 = \sum_{x=0}^n\left[(x-\mu )^2\frac{n!}{x!(n-x)!}p^x(1-p)^{n-x}\right] = np(1-p)
となる。ここでは、結果のみに注目する。

p=q=1/2のとき、分布は平均について対称で、最頻値と中央値も平均値と一致する。

=Example 2.1.=
10枚のコインを100回投げて、i回目に表になった数をx_iとすると、二項分布に従った。
==============

母分布P_B(x;10,1/2)がFigure2.1に示されている。
平均は、(2.6)から、
\mu = np = 10(1/2) = 5
で、分散は、(2.7)から
\sigma = \sqrt{np(1-p)} = \sqrt{10(1/2)(1/2)} = \sqrt{2.5} \simeq 1.58

=Example 2.2.=
10個のサイコロを投げて、x個で1が出る確率を考える。そうすると、n=10,p=1/6だから、
P_B\left(x;10,\frac{1}{6}\right) = \frac{10!}{x!(10-x)!}\left(\frac{1}{6}\right)^x\left(\frac{5}{6}\right)^{10-x}
この分布は、Figure2.2.に示されている。
平均と、分散は、
\mu = 10/6 \simeq 1.67
\sigma = \sqrt{10(1/6)(5/6)} \simeq 1.18
となる。分布は非対称で、最頻値は1であるが、連続曲線のピークはわずかに大きい。
==============

=Example 2.3.=
液体水素から散乱されるKメソンの角度分布を測定した。粒子の重心系で前方散乱と後方散乱の粒子数は同じであるとわかっている。1000回の相互作用を測定し、472回前方散乱し、528回後方散乱した。この数でどのくらいの不定性があるか。
==============

不定性は、
\sigma = \sqrt{np(1-p} = \sqrt{1000(1/2)(1/2)} =\sqrt{250}\simeq 15.8
であるから、
f_F = (472 ± 15.8)/1000 = 0.472 ± 0.15
f_B = (528 ± 15.8)/1000 = 0.528 ± 0.15
となる。
前もって、前方散乱と後方散乱の確率がわからない場合は、pとqを実験から予想しなければならない。
p\simeq 472/1000=0.472, q \simeq 528/1000 = 0.528
すると、
s \simeq \sqrt{1000(0.472)(0.528)} = \sqrt{249.2} = 15.8
である。確率pが50%に近い場合、標準偏差は実験で決めたpの不定性に比較的鈍感である。

  • 2.2. POSSION DISTRIBUTION

ポアソン分布は、p \ll 1から、\mu \ll nとなる極限の二項分布である。普通に同じようなケースを考えると、二項分布P_B(x;n,p)で与えられるが、nが大きくなると、実際はそうはいかない。nもpもたいてい分からない。わかるのは、平均値\muもしくはその評価\bar{x}である。ポアソン分布は、変数xとパラメータである平均値\muによって表される確率分布である。

二項分布のp\ll 1の極限を考える。平均値\mu = npを一定とするため、n \gg 1である。(2.4)式は
P_B(x;n,p) = \frac{1}{x!} \frac{n!}{(n-x)!}p^x(1-p)^{-x}(1-p)^n
とかける。第二項を展開すると、
\frac{n!}{(n-x)!} = n(n-1)(n-2)\cdots (n-x-2)(n-x-1)
であり、x個の要素の積であると考えられる。これらは、n\gg xだから、ほぼnであるから、第二項はn^xに近づく。第二項と第三項の積は、n^xp^x = (np)^x = \mu^xとすることができる。p \ll 1であるから、第四項は、
(1-p)^{-x} \sim 1+px \sim 1
となる。

最後の項は、nに\mu /pを代入して整理することができ、それの極限を取ると、
\lim_{p\rightarrow 0}(1-p)^n = \lim_{p\rightarrow 0}[(1-p)^{1/p}]^{\mu} = \left(\frac{1}{e}\right)^{\mu} = e^{-\mu}
となる。(xとnが誤植)

これらの近似を組み合わせると、二項分布P_B(x;n,p)は、ポアソン分布P_P(x;\mu )に近づく。
\lim_{p\rightarrow 0} P_B(x;n,p) = P_P(x;\mu ) \equiv \frac{\mu^x}{x!}e^{-\mu}
ポアソン分布は、平均値\muについて非対称であり、Figure2.2.のようになる。P_P(x;\mu )は、x=0で0にならず、xが負の値について定義されていない。これは問題ではないと考えられる。

[Derivation]

ある事象が時間間隔ごとに確率が一定であるとすると、時間間隔dtに事象が起きない確率dPは、
dP(0; t, \tau ) = -P(0;t, \tau )\frac{dt}{\tau}
P(x;t,\tau )は、時間間隔dtにxの事象が起きる確率を表しており、\tauは、事象間の比例定数である。マイナス符号は、dtが増加すると、確率は比例して減少することを示している。この方程式を積分すると、
P(0;t,\tau ) = P_0e^{-t/\tau}
で、P_0は、積分定数で、t=0p(0;t,\tau )=1だから、1となる。

確率P_(x;t,\tau )は、
d^xP(x;t,\tau ) = \frac{e^{-t/\tau}}{x!}\prod_{i=1}^x \frac{dt_i}{\tau}
を解くことで得られる。

すると、
P_P(x;\mu ) = P(x;t,\tau ) = \frac{e^{-t/\tau}}{x!}\left(\frac{t}{\tau}\right)^x
または、
P_P(x;\mu ) = \frac{\mu^x}{x!}e^{-\mu}
で、\mu = t/\tauは、時間間隔tに観測される事象の平均数である。(2.16)は規格化されている。
\sum_{x=0}^{\infty}P_P(x,\mu ) = \sum_{x=0}^{\infty}\frac{\mu^x}{x!}e^{-\mu} = e^{-\mu}\sum_{x=0}^{\infty} \frac{\mu^x}{x!} = e^{-\mu}e^{\mu} = 1

[Mean and Standard Deviation]

平均値は、
<x> = \sum_{x=0}^{\infty} \left(x\frac{\mu^x}{x!}e^{-\mu}\right) = \mu e^{-\mu}\sum_{x=1}^{\infty}\frac{\mu^{x-1}}{(x-1)!} = \mu e^{-\mu} e^{\mu} = \mu
であり、分散は、
\sigma^2 = <(x-\mu )^2> = \sum_{x=0}^{\infty}\left[(x-\mu )^2\frac{\mu^x}{x!}e^{-\mu}\right] = \mu
となる。

=Example 2.4=
銀の放射同位体の平均寿命を決める実験の一部として、宇宙線の背景カウントを検出した。2秒間隔で100回測定し、平均カウント数が1.69であることを知った。このことから、標準偏差を\sigma = \sqrt{1.69} = 1.3とし、式(1.9)から直接計算したs=1.29と比較した。

そして、さらに、15秒間隔で60回の検出を行うと、11.48という平均カウントを得た。これから、\sigma = \sqrt{11.48} = 3.17s=3.39となった。

それぞれをヒストグラムにしたのが、Figure2.3とFigure2.4である。
=============

[Summed Probability]

x_1x_2のあいだの値を取る確率は、
S_P(x_1,x_2;\mu ) = \sum_{x_1}^{x_2}P_P(x;\mu )
である。さらに、n以上の値を取る確率は、
S_P(n,\infty ;\mu ) = \sum_{x=n}^{\infty}P_P(x;\mu ) = 1-\sum_{x=0}^{n-1}P_P(x;\mu ) = 1-e^{-\mu )\sum_{x=0}^{n-1}\frac{\mu^x}{x!}
となる。Example2.4で、15秒間隔で記録された平均カウント数は\bar{x}=11.48であった。ある間隔では、23カウントが記録された。(2.22)から、23以上がカウントされる確率は0.0018であり、60回の試行で一回でも観測される確率は、p\simeq 1-(1-0.0018)^{60} \simeq 0.10である。
\muの大きな値に対しては、(2.22)の確率は、ガウス関数の積分によって近似できる。

  • 2.3 GAUSSIAN OR NORMAL ERROR DISTRIBUTION

ガウス分布は、nとpが極めて大きな二項分布の極限である。つまり、np \gg 1の極限で、ポアソン分布の\muが大きな極限でもある。

[Characteristics]

ガウス確率分布は、
p_G = \frac{1}{\sigma \sqrt{2\pi}}\exp\left[-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2\right]
で表される。
平均値\muと標準偏差\sigmaをもつ母分布からランダム観測の値xを得る可能性を示す連続分布である。確率密度分布は、ランダム観測がxの周りの幅dxにある確率dP_G(x;\mu ,\sigma )は、
dP_G(x;\mu , \sigma ) = p_G (x; \mu , \sigma ) dx
で与えられる。確率密度関数は規格化されているので、
\int_{x=-\infty}^{x=\infty}dP_G(x; \mu , \sigma ) = \int_{x=-\infty}^{x=\infty}p_G(x; \mu , \sigma ) dx
となる。曲線の幅はx = \mu + \sigmaのように、\sigmaの値によって決定され、曲線の高さは、頂点からe^{-1/2}で減少する。
p_G(x;\mu \pm \sigma ,\sigma ) = e^{-1/2}p_G(\mu ;\mu , \sigma )
ガウス分布の形はFigure2.5に示されている。翌千波、ベル型をしており、平均値\muについて対称である。

FWHM(full-width at half maximum)、しばしば半値幅(half-width)といわれる\Gammaによって、確率密度が最大値の半分になる値を表す。
p_G(\mu \pm 1/2\Gamma , \mu , \sigma ) = 1/2 p_G(\mu ; \mu ,\sigma )
この定義で、(2.23)から
\Gamma = 2.354\sigma
となる。

[Standard Gaussian Distribution]

無次元変数z = (x-\mu )/\sigmaを定義することで、
p_G(z)dz = \frac{1}{\sqrt{2\pi}}\exp \left(-\frac{z^2}{2}\right)dz
とできる。規格化も維持されている。

[Mean and Standard Deviation]

(2.23)式の\mu\sigmaが、ガウス分布の平均と標準偏差である。
ガウス分布に従うとされる限られたデータサンプルに対しては、平均値と標準偏差は(1.1)と(1.9)から直接計算できる。結果となる\bar{x}sが平均値と標準偏差の評価である。Example1.2の最初の50回からこの方法で得られる\bar{x}sは、Figure1.2の実線のガウス曲線を計算するための式(2.23)の評価に用いられる。曲線はヒストグラムと同じ面積を持つように設定されている。曲線は、サンプルに基づいた母分布の評価を代表している。

[Integral Probability]

よく、平均から\Delta xだけずれている確率を知りたい時がある。答えは、数値的に以下の確率で与えられることになる。
P_G(\Delta x,\mu ,\sigma )=\frac{1}{\sigma\sqrt{2\pi}}\int_{\mu -\Delta x}^{\mu +\Delta x} \exp \left[-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2\right]dx
確率関数は1に規格化されているので、平均値からのズレが\Delta x以上になる確率は、1-P_G(\Delta x; \mu ,\sigma )である。興味深いのは、ズレが1σ、2σといった場合である。また、ありうる誤差(probable error,\sigma_{pe})で、観測の半分がズレの絶対値を超える幅である。

もし、(2.29)式の標準形を使ったとすると、無次元変数z=(x-\mu )/\sigmaで積分確率P_G(z)が計算できる。
P_G(z) = \frac{1}{\sqrt{2\pi}}\int_{-\Delta z}^{\Delta z}e^{-z^2/2}dz
ここで、\Delta z = \Delta x/\sigmaは、標準偏差の単位で平均値からのズレを測定している。

(2.31)式の積分は、解析的には評価できないので、確率P_G(\Delta x;\mu ,\sigma )を得るためには、ガウス関数をテイラー展開して、各項を積分するか、数値的に解くかである。現代のコンピュータでは、数値積分は早くて正確であり、信頼できる結果が得られている。(Appendix A.3)

[Tables and Graphs]

ガウス分布の確率密度関数と積分確率がTable C.1とC.2にある。Table C.2から、1σ以内、2σ以内に入る確率は、68%と95%である。また、50%の確率となるのは、\sigma_{pe}=0.6745\sigmaである。

[Comparison of Gaussian and Poisson Distributions]

ポアソン分布は、ガウス分布と比べて、ありうる値が片方に偏っている場合に有効である。ポアソン分布は、0と正の整数のみに対して定義されており、一般的には、ガウス分布を使うのが楽であるが、ポアソン分布が有効な場面もある。

  • 2.4 LORENTZIAN DISTRIBUTION

他にも色々と分布がある。理論に埋め込まれた分布の一つが、二項分布に似ているけれど異なる、ローレンツ分布(Lorentzian distribution)というものがある。これは、Mossbauer effectの核、粒子反応または放射の吸収の断面積のエネルギーの変化のような共鳴の振る舞いに対応したデータを記述するのに適している。

ローレンツ確率密度関数P_L(x;\mu ,\Gamma )は、コーシー分布(Cauchy distribution)とも呼ばれており、以下で定義される。
p_L(x;\mu ,\Gamma ) = \frac{1}{\pi}\frac{\Gamma /2}{(x-\mu )^2+(\Gamma /2)^2}
この分布は、半幅\Gammaによって特徴づけられた幅で平均値について対称である。ガウス分布との歴然とした違いは、急速には0にならないことで、大きなズレの振る舞いは、ズレの2乗に関して指数的にではなく、逆2乗に比例するという点である。

ガウス分布と同様、連続関数であり、値xの周りdxの間に入る確率は、
dP_L(x;\mu ,\Gamma ) = p_L(x;\mu , \Gamma )dx
である。

確率密度関数は、1に規格化されている。
\int_{-\infty}^{\infty}p_L(x;\mu ,\Gamma )dx = \frac{1}{\pi}\int_{-\infty}^{\infty}\frac{1}{1+z^2}dz = 1
z = (x-\mu )/(\Gamma /2)

[Mean and Half-Width]

ローレンツ分布の平均値は、(2.32)式のパラメータのひとつとして与えられる。対称性から、\muは平均値、中央値、最頻値と一致する。

標準偏差は定義されない。もし、ずれの2乗の期待値を評価したら、
\sigma^2 = <(x-\mu )^2>=\frac{1}{\pi}\frac{\Gamma^2}{4}\int_{-\infty}^{\infty}\frac{z^2}{1+z^2}dz
であり、積分は、収束しない。サンプル標準偏差(sample standard deviation)は計算できるが、計算には意味がない。

代わりにローレンツ分布の幅は、半値幅(fullwidth at half maximum)\Gammaで特徴づけられる。これは、以下で定義される。
p(\mu \pm \Gamma /2;\mu , \Gamma ) = 1/2 p(\mu ;\mu ,\Gamma )
このことは、(2.32)式にx = \mu \pm \Gamma /2を代入することで確かめられる。

[EXERCISES]
解答はこのページの添付ファイルに。


最終更新:2014年03月12日 15:33
添付ファイル