アットウィキロゴ

Chapter 1 Uncertainties in Measurements(DRaEA)

  • 1.1 MEASURERING ERRORS

実験などには、誤差と不定性が存在していて、それらの誤差を評価しなければならない。

「誤差」は、Websterによって、「観測値や計算値と実際の値との違い」と定義された。実際の値は、たいてい分からないが、近似的に過去の実験や理論的予言から分かるかもしれない。そのような近似は、指針にはなるが、データや実験の条件から結果の確からしさを系統的に決定しなければならない。

誤差には、まず、実験や計算でのミスや手違いで起きるものがある。これは、期待される値と違ったり明らかにおかしい値として明らかである。これらは、「illegitimate errors」に分類され、手順を注意深く繰り返せば修正できる。興味があるのは、測定におけるランダムな揺らぎとしての「不定性(uncertainties)」と、結果の精度(precision)と正確さ(accuracy)を制限する「系統誤差(systematic errors)」である。一般的に、不定性を結果の誤差といい、不定性を評価する手順を誤差分析(error analysis)という。

[Accuracy Versus Precision]

正確さと精度を区別することは重要である。正確さは、実験の値が、実際の値とどれだけ近いかを示す。精度は、実際の値に一致しているかは関係なく、どれだけきっちり決められているかを示す。

非常に不正確である場合に、精度を高めることは意味がない。逆に精度が低ければ、結果が極めて正確だと考えることはできない。一般に、不定性や誤差という場合には、精度を示している。「絶対精度(Absolute precision)」は、結果として、同じ単位の結果の不定性の度合いを示している。「相対精度(relative precision)」は、結果の値の比率の意味での不定性である。

[Systematic Errors]

実験の正確さは、一般的に系統誤差をどれだけコントロールできるかによっており、再現可能なずれをもつ実際の値からの違いを作る。このタイプの誤差は検出するのが難しく、統計解析によって簡単に研究できない。系統誤差は、機器のキャリブレーションミスや観測バイアスなどによるものである。実験の計画の大部分は、系統誤差の素を減らすことである。

=EXAMPLE 1.1=
生徒がテーブルの高さを鉄のものさしで測り、測定の平均がテーブルの長さに対して(1.982±0.001)mであった。生徒は、徐々にものさしを25℃でキャリブレートすることを学び、膨張係数が0.0005℃^{-1}であることを得た。測定は、20℃の室温で行われていたため、値は、系統的に小さかったことになる。この効果を補正するために、結果に、1 + 0.0005 × (20 - 25) = 0.9975を掛けて、新たに1.977mの結果を得た。
生徒が実験を繰り返したとき、2つめの系統誤差を発見した。ものさしを読む技術は間違っていて、いつも真上から読んでいなかった。検証で、生徒は、いつも2mm短く読んでいた。修正された結果は、1.979mである。
=============

このEXAMPLEでは、最初の結果は、少し高い精度で与えられていて、だいたい2000のうちの1の精度であった。この結果に対する修正は、可能な限り、知っている最初の結果のずれのもとを補正することで正確さを改善している。ここでは、精度は改善されなかったが、修正を行った。最終結果を示す前に、誤差解析を行い、追加の補正を考慮する必要がある。

[Random Errors]

精度を上げるためには、繰り返し実験で毎回異なる結果を出すゆらぎである、ランダム誤差(random errors)を克服しなければならない。与えられた正確さは同等の精度を意味しており、いくらかランダム誤差に依存している。

ランダム誤差を減らすには、実験を繰り返すだけでなく、条件や手順を改善する必要がある。信頼性の高い機器を使ったり、実験回数を増やしたりするのである。

[Significant Figures and Roundoff]

結果の有効数字(Significant figures)の数は以下のように定義される。
  1. 最も左の0でない数字が最も有効な数字である
  2. 小数点がなければ、最も右の0でない数字が最も有効でない数字である
  3. 小数点があれば、最も右の数字が、0であっても最も有効でない数字である。
  4. 最も有効でない数字と最も有効な数字の間のすべての数字が有効数字としてカウントされる

有効数字がわかるように、1010であれば、1.010×10^3と書くのが良い。
計算中に有効数字以下の追加の数字を取っておくのは、後の計算で丸め誤差(rounding errors)による誤差を避けるためである。EXAMPLE 1.1の測定の結果がL=1.979mで不定性が0.012mの場合、この結果はL=(1.979±0.012)mとかける。しかし、不定性の最初の数字が0.082mのように大きければ、おそらく、L=(1.98±0.08)mとするべきだろう。

非有効数字が落とされる時には、最後の数字にベストの正確さで丸めないといけない。少ない有効数字に丸めるときには、要求される数字を切り捨て、溢れた数字を少数部分として扱う。
  1. 少数部分が1/2よりも大きければ、新たな最も有効でない数字を1増やす
  2. 少数部分が1/2よりも小さければ、増やさない
  3. 少数部分が1/2であれば、新たな最も有効数字でない数字が奇数の時だけ1増やす

3番目の規則は、その前のわずかに1/2より小さい切り上げの結果によるものか、わずかに1/2より大きな切り捨ての結果によるものかもしれないからだ。例えば、1.249と1.251は、両方とも1.25に丸められる。もし、2桁の有効数字とする場合には、両方とも、1.2か1.3になる。結果の最後の数字が奇数ならば、切り上げられ、偶数ならば、切り捨てられ、そのような数字のグループの平均に系統誤差がいれられてしまうのである。一般的には、途中計算は丸めず、最後の結果だけを丸めるのがよい。

  • 1.2 UNCERTAINTIES

不定性には、測定の揺らぎの結果と結果の理論的な記述の結果によるものがある。例えば、長方形のテーブルの長さを測るとしたら、試行ごとに測定のゆらぎがあるのはわかる。無限回測定できれば、精度は上がるが、そういうわけにもいかない。結果的に、長さは測定の平均として現れる。テーブルの角の位置の揺らぎそのものも存在している。今後、理論モデルに基づいた不定性について議論する。

「誤差(error)」という用語は、実際の値からのずれを示している。大抵は実際の値はわからず、実験から誤差を評価することしかできない。実験を繰り返せば、初回とは違いが生じる。この違いを、2つの結果の「ずれ(descrepancy)」という。例えば、物理定数の異なる測定や受け入れられている値と自分の結果の値の違いは、ずれというべきで、誤差や不定性ではない。

一般的に、実際の誤差を求めることはできないので、求める方法がなければならない。同じ量の繰り返し測定の結果の分布の研究は、誤差の理解につながり、その誤差は分布の広がりの測定である。しかし、繰り返し試行できないものもあるので、それに対応する必要もある。その場合、標準誤差(standard error)を求めるために、期待される繰り返し測定の70%が入る範囲を評価するべきである。

実験結果を記述する理論モデルが正しくないかもしれないことも知っておくべきだ。以下の章では、仮定したパラメータとありうふ誤差の分布を議論し、これらのパラメータとその不定性の評価の方法を議論する。

[Minimizng Unvertainties and Best Results]

誤差解析で問題にしているのは、結果の精度だけではない。一般的に、よい機器や測定を増やして不定性を減らすということなしに、データから最大限の有用な情報を得ることに興味がある。なので、データから理論パラメーターとランダム誤差の最もよい評価を引き出すことを問題とし、結果がどれくらいの信頼性を持つかを考える。言ってしまえば、誤差を最小にするということである。

しかし、最大限に努力しても、調査する量の「評価」のみであることを注意しておく。

  • 1.3 PARENTT AND SAMPLE DISSTRIBUTIONS

xの測定値をx_1としたとき、観測が量を近似していると期待するが、それが全く正しい値だとは考えない。もう一回測定を行った場合、2つの測定にはずれが生じる。ランダム誤差によるものだと考えられ、どちらが正しいというわけではない。もっともっと測定すると、パターンがデータから現れる。測定のいくつかは大きすぎたり小さすぎたりするだろう。しかし、系統誤差を除けば、平均すると、正しい値の周りに分布していると期待できる。

無限回の測定ができれば、データ点の分布を正確に記述できるが、実際にはできない。しかし、1回の観測でそのような分布の存在を仮定し、特定の観測を得られる確率を決定できる。この分布は、「母分布(parent distribution)」と呼ばれている。同様に測定値は母分布からのサンプルであると仮定することができ、そのデータはサンプル分布(sample distribution)を形成する。無限回の測定の極限では、サンプル分布は母分布となる。

=EXAMPLE 1.2=
実験測定で、生徒がボールを50回落として、2.00m落ちるのにかかる時間を記録した。観測の1セットは系統誤差を補正して、0.59sから0.70sまで広がっていて、観測のいくつかは一致していた。Figure1.2は、この測定のヒストグラムである。高さはプロットの横軸の上限と下限の間に入る測定の数である。(Appendix Dをみよ)

分布が測定のランダム誤差によるものであれば、ガウス分布(Gaussian)または正規分布(normal error distribution)に従いそうだ(Chapter2で議論する)。ガウシアン曲線はこれらの測定の平均(mean)と標準偏差(standard deviation)によってFigure1.2の実践にプロットされている。この曲線は、ガウシアンでサンプル分布のデータをまとめたもので、母分布の評価を与えている。

測定されたデータとそこから導かれた曲線ははっきりと一致するわけではない。ヒストグラムの荒さはなめらかな理論のガウシアン曲線とはおkとなる。生徒がとてつもなくたくさん測定するか、いくつかの測定のセットを組み合わせてヒストグラムのbinを小さくすればなめらかなガウシアン曲線に近づくだろう。そのような大きなサンプルからパラメータを計算すれば、Figure1.2の点線のような母分布を決められるだろう。
=============

単位面積で規格化された(曲線全体で1)確率密度関数(probablity density function)p(x)と、とても大きな観測数Nと値xからx+\Delta xの間にある数\Delta Nとしたものを考えると、\Delta N =Np(x)\Delta xとなる。Figure1.2の実線と点線はこの方法でスケーリングされていて、縦軸の値は、50回の観測から得られる数字に直接対応していて、それぞれの曲線の下の面積はヒストグラムの全面積に対応している。

[Notation]

母分布のパラメータの数は集合体によって決められる。それを表すのに、ギリシャ文字を用い、ラテン文字はその実験の評価を示す。

実験の回数を無限大にすると、実験の結果は母分布に一致すると仮定する。ある実験で、N回の観測があったとすると、
\mathrm{(parent parameter)} = \lim_{N\rightarrow\infty} \mathrm{(expermental parameter)}
とかく。もし、N回の測定を行い、それらをx_1,x_2,x_3,...,x_Nとすると、すべての測定の合計は、
\sum_{i=1}^{N} x_i \equiv x_1 + x_2 + x_3 + \cdots + x_N
とかける。省略して、
\sum x_i \equiv \sum_{i=1}^N x_i
と書くこともある。

[Mean, Median, and Mode]
平均(mean)\bar{x}は、
\bar{x} \equiv \frac{1}{N} \sum x_i
とかけ、母分布の平均(mean)\muは、
\mu \equiv \lim_{N\rightarrow\infty} \left(\frac{1}{N} \sum x_i \right)
とかける。平均(mean)は、量xの重心値と等価である。

母分布の中央値(median)\mu_{1/2}は、N\rightarrow\inftyの極限で測定の半分が小さく、測定の半分が大きい値である。母分布の用語で言うと、
P(x_i < \mu_{1/2}) = P(x_i > \mu_{1/2}) = 1/2
であり、確率密度分布の面積を半分に切る場所である。計算の不便さから、あまり使われない。

母分布の最頻値(mode/most probable value)\mu_{max}は、ぼ分布が最も大きな値を持つ値である。もっとも観測されそうな値である。N\rightarrow\inftyの極限で、この値は、
P(\mu_{max}) \geq P(x \neq \mu_{max]
である。

平均、中央値、最頻値の関係は、Figure1.3に描かれている。対称な分布では、これらの値はすべて一致する。

[Deviations]

ずれd_iは、
d_i \equiv x_i - \mu
とかける。計算の目的で、ズレは一般に平均に大して求められ、中央値や最頻値には用いられない。もし、平均が実際の値であれば、このずれは、$$x_i$4の実際の誤差である。

ずれdの平均は、平均すると0となってしまうため、平均偏差(average deviation)\alphaは、以下のように定義される。
\alpha \equiv \lim_{N\rightarrow\infty}\left[\frac{1}{N}\sum |x_i-\mu|\right]
絶対値があると、計算に不便である。

よって、計算を便利にするために、標準偏差(standard deviation)\sigmaを導入する。分散(variance)\sigma^2は、以下のように定義される。
\sigma^2 \equiv \lim_{N\rightarrow\infty}\left[\frac{1}{N}\sum (x_i -\mu )^2\right]
 =\lim_{N\rightarrow\infty}\left(\frac{1}{N}\sum x_i^2\right) - \mu^2
標準偏差はずれの2乗平均(root mean square)で、データの平均についての2次モーメントと関連している。サンプル分布の分散s^2の表現は、
s^2 \equiv \frac{1}{N-1} \sum (x_i-\bar{x})^2
である。ファクターがNではなくN-1なのは、データの自由度が1つ減るからである。sでなく\sigmaを母分布の標準偏差の最高の評価として表すことがある。

[Significance]

平均値や標準偏差は、ここまで定義してきた値とともに、実験結果を特徴付けるパラメータである。よく、分布を平均値と標準偏差で表すことがある。より詳細な記述が必要であれば、平均について高次のモーメントを計算する必要がある。

一般に、平均値は確率分布を特徴づける一つのパラメータであるといえる。ある観測回数で母分布の平均値を決める際の不定性は標準偏差に比例する。

一般に、純粋に統計的な誤差からの分布は平均値と標準偏差で記述できるが、平均値から数標準偏差えも統計的でない誤差が支配的になるかもしれない。分散が存在しない分布もある。その場合には、平均偏差などを用いる必要がある。以下では、分散が存在する分布について記述する。

  • 1.4 MEAN AND STANDARD DEVIATION O DISTRIBUTIONS

母分布の平均値や標準偏差を確率分布p(x)で定義することができる。xからx+dxのあいだの値を取る観測の割合をdNとすると、
dN = Np(x)dx
とできる。

平均値はxの期待値<x>であり、分散は、期待値<(x-\mu )^2>である。

[Discrete Distributions]

確率関数が離散的なP(x)であれば、平均は、
\mu = \lim_{N\rightarrow\infty}\frac{1}{N}\sum_{i=1}^Nx_i = \lim_{N\rightarrow\infty}\frac{1}{N}\sum_{j=1}^N [x_jNP(x_j)]
=\lim \sum_{N\rightarrow\infty}[x_jP(x_j)]
となる。同様に、分散は、
\sigma^2 = \lim_{N\rightarrow\infty}\frac{1}{N}\sum_{j=1}^N [(x_j - \mu )^2P(x_j)] =\lim_{N\rightarrow\infty}\frac{1}{N}\sum_{j=1}^N [x_j^2P(x_j)] - \mu^2
とかける。
一般的に、関数f(x)の期待値は、以下のようにかける。
<f(x)> = \sum_{j=1}^n [f(x_j)P(x_j)]

[Continuous Distributions]

確率密度関数がなめらかであれば、合計を積分に置き換えれば良い。
\mu = \int_{-\infty}^{\infty} xp(x)dx
\sigma^2 = \int_{-\infty}^{\infty}(x-\mu )^2p(x)dx = \int_{-\nfty}^{\infty}x^2p(x)dx - \mu^2
<f(x)> = \int_{-\infty}^{\infty}f(x)p(x)dx

サンプルと母分布はどうつながっているのだろうか。実際、データと求めようとしている情報の間には3レベルある。

  1. 実験のデータ点から、データ点が分布している範囲でサンプル頻度分布を決定する。平均には\bar{x}、分散にはs^2を使う。サンプル分布の形と大きさはサンプルごとに異なる。
  2. サンプルの確率分布のパラメータから、母分布の確率分布のパラメータを評価する。ベストな評価は、\mu = \bar{x},\sigma^2 = s^2である。この母分布の形でも評価されているまたは仮定されている。
  3. 母分布の評価されたパラメータから、求めている結果を評価する。一般に、母分布の評価されたパラメータは実際の値と等価であると仮定されるが、評価された母分布は実際の値と同様に実験条件の関数であり、これらは分離される必要はない。

Figure1.2の実験的に求められた実線と、母分布から求められた破線には違いがある。データを母分布に従って分布した観測の値の母分布からのサンプルと考えると、結果の精度と信頼度の情報を得るために、母分布の形とずれを評価することができる。そうすると、サンプルのパラメータが母分布のパラメータとして使える。

[EXERCISES]
1.1.
(a) 5 (b) 2 (c) 2 (d) 5 (e) 4 (f) 1 (g) 3 (h) 1 (i) 3 (j) 4
1.2.
most: (a) 9 (b) 8 (c) 9 (d) 3 (e) 4 (f) 1 (g) 5 (h) 4 (i) 4 (j) 3
least: (a) 5 (b) 4 (c) 4 (d) 7 (e) 0 (f) 1 (g) 8 (h) 4 (i) 0 (j) 0
1.3.
(a) 980 (b) 84000 (c) 0.0094 (d) 300 (e) 4.0 (f) 10 (g) 5300 (h) 400 (i) 4.0×10^2 (j) 3.0×10^4
1.4.
平均値:7.36
中央値:7
最頻値:8
1.5.
binを5ずつ区切って、その中央を代表値とする。
平均値:73.475
中央値:73
最頻値:73
1.6.
2.18
1.7.
√(9349.775/39)=15.5
1.8.
省略
1.9.
省略



最終更新:2014年03月12日 15:27