有用な不等式

関数の不等式を見たら → sup/inf を付けてみよう↑
f(x) \leq g(x) \quad \Leftrightarrow \quad \sup f(x) \leq \sup g(x)
f(x) \leq g(y) \quad \Leftrightarrow \quad \sup f(x) \leq \inf g(y)
← 作用素ノルム示すときとか。

初等不等式

相加相乗平均
\frac{a+b}{2} \geq \sqrt{ab} \quad (a,b \geq 0)
Sinc関数
\frac{2}{\pi} \leq \frac{\sin x}{x} \quad (0 \leq x \leq \frac{\pi}{2})
[証明]は,図を描くとほぼ明らか。y=\sin xy=\frac{2}{\pi}x を比べる。
Cor. 以下の形でも覚えておくとよい。
\frac{2}{\pi} \leq \sin x \leq x \quad (0 \leq x \leq \frac{\pi}{2})
これを用いて,難しいところにある sin を x で置き換えてしまうことができる。
三角関数を抑えこむ
1 - \frac{1}{2} x^2 \leq \cos x \leq 1 - \frac{1}{2} x^2 + \frac{1}{24} x^4 \quad \mbox{for all } x
\sin x \leq x \quad \mbox{for all } x \geq 0
平均値の定理
(適当な微分可能性のもとで)
|f(x)-f(y)| \leq |f'(c)||x-y|
C∞級とかなら何回も適用してみても良いことあるかも。
Jordanの不等式
Dirichletの振動積分を評価するときに使う。
\int_0^\pi e^{-r \sin \theta} d \theta < \frac{\pi}{r} \quad (r>0)

[証明]は,sinの符号が変わる90度前後で場合わけして,Sinc関数の不等式に持ち込む。
90~180度は ω=π-θ とおくと0~90度の式に変わる。
複素数列とかで使う。
| \Re z |, | \Im z | \leq |z| \leq | \Re z | + | \Im z |
複素積分の基本不等式
曲線Cの長さをLとし、C上でf(z) \leq M とする。
\Big| \int_C f(z) dz \Big| \leq \int_C |f(z)||dz| \leq LM
超関数論で出てくる。
x \leq \sqrt{1+x^2}
|x|大のとき
x \sim \sqrt{1+x^2}
で,C級,また
1 \leq \sqrt{1+x^2}
なども成り立つ。
より一般に,
|\mathbf{x}^\alpha| \leq (1+\|\mathbf{x}\|^2)^\frac{|\alpha|}{2}
さらに,ある定数があって,
c_{-}(1+\|\mathbf{x}\|^2)^k \leq \sum_{|\alpha|\leq k} \|\mathbf{x}^\alpha \|^2 \leq c_{+}(1+\|\mathbf{x}\|^2)^k
エントロピーの計算とかで使う。
\log x \leq x - 1

\sum_x p(x) \log \frac{q(x)}{p(x)} \leq \sum_x p(x) \left( \frac{q(x)}{p(x)} -1 \right) = 0

Chebyshev(Чебышёв)の系譜

Chebyshev(Чебышёв)不等式

大数の弱法則を証明するのに使う。
Lpと測度収束の関係とか。
確率論的表現式は特に,平均からの離れ具合を分散の倍数で測った場合の確率を評価している。
測度論的
0<p<∞に対し,f∈Lp(X)とする。
任意の ε>0 に対し以下が成り立つ。
E_\epsilon := \{x \in X | |f| > \epsilon \}
\mu(E_\epsilon) \leq \frac{1}{\epsilon^p} \| f \|_{L^p(X)}^p

[証明]
\| f \|^p_{L^p(X)} = \int_X |f|^p dx \geq \int_{E_\epsilon} |f|^p dx > \epsilon^p \int_{E_\epsilon} dx = \epsilon^p \mu(E_\epsilon)
確率論
確率変数Xは平均μと分散σ2を持つとする。←つまり二乗可積分
このとき,p=2,f=X-μ,ε=kσ とおけば以下を得る。
P \{ |X-\mu| \geq k \sigma\} < \frac{1}{k^2} 
[証明]は次のようにしても良い。
\sigma^2 = \int_\Omega |x-\mu|^2 dp(x) \geq \int_{E_{k \sigma}} |x- \mu|^2 dp(x) > (k \sigma)^2 \int_{E_{k \sigma}} d p(x) = (k \sigma)^2 P( E_{k \sigma} )
Cor. 不等号の向きを逆にしておくのも有効
P \{ |X - \mu| < k \sigma \} > 1 - \frac{1}{k^2}
あるいは  1 - \frac{1}{k^2} = \alpha とおいて,
P \{ |X - \mu| < \frac{\sigma }{\sqrt{1-\alpha}} \} > \alpha
Ex. 平均と分散が分かっているときに,平均からズレる確率を測る

Jensenの系譜

Jensenの不等式 (1906)

基本的な不等式の1つ
相加相乗平均,Hölder,Cramer-Raoなどはみなこの不等式の系
相加相乗平均は -log(x) の凸性から導かれる。
KL divergenceの正値性もJensenから導かれる。
f(x) \textrm{ : convex-function}
\sum^N p_i = 1 \; (p_i \geq 0)
  \Rightarrow \sum^N p_i f(x_i) \geq f\left( \sum^N p_i x_i\right)
\textrm{equality holds when } x_1= \cdots =x_N
Cor.(変形)
f(x) \textrm{ : convex-function}
\alpha_i \geq 0
  \Rightarrow \frac{\sum \alpha_i f(x_i)}{\sum \alpha_i} \geq f \left( \frac{\sum \alpha_i x_i}{\sum \alpha_i}\right)
凸関数の平均は,平均の凸関数よりでかい。
Cor.(積分版)
I \subset \mathbb{R} \textrm{ : interval s.t. } |I|=1
f(x) \textrm{ : convex on I}
\phi(x) \textrm{ : integrable on I}
  \Rightarrow \int_I f(\phi(x)) dx \geq f \left( \int_I \phi(x) dx \right)
Cor.(拡張)
f(x) \textrm{ : convex on \mathbb{R}}
\int_\mathbb{R} p(x) dx=1
\phi(x) \textrm{ : integrable on \mathbb{R}}
  \Rightarrow \int_\mathbb{R} f(\phi(x)) d p(x) \geq f \left( \int_\mathbb{R} \phi(x) dp(x) \right)
Cor.(期待値版)
f \textrm{ : convex}
\mathbf{X} \textrm{ : integrable random variable}
\mathbb{E} \{ f(\mathbf{X})\} \geq f\left( \mathbb{E} \{ \mathbf{X}\} \right)
凸関数の期待値は,期待値の凸関数よりでかい。
Def. 凸関数(convex-function)
f(x)が凸であるとは,以下が成り立つことをいう。
  ^\forall a,b\in \mathbb{R}, \; t \in [0,1]
   t f(a) + (1-t) f(b) \geq f\left( ta+(1-t)b\right)
要するに,下に凸のこと。
Prop. C2級関数の凸判定法
二階微分が常に正ならおk
f(x)\textrm{ : convex } \Leftrightarrow f^{\prime\prime} \geq 0
Ex.
f(x) = x^{2n} \; \left( x \in (-\infty ,\infty) \right)
f(x) = - \sin x \; \left( x \in [0 , \pi] \right)
f(x) = \tan x \; \left( x \in [0 , \frac{\pi}{2}) \right)
f(x) = - \log x \; \left( x \in (0, \infty) \right)

不詳

(a+b)^p < 2^p(a^p+b^p)
[証明]
実際には(対称性を崩して)もっときつく押さえられることに注意↑
0 < a \leq b としてよい。
(a+b)^p \leq (2b)^p \leq 2^p b^p < 2^p(a^p+b^p)

Youngの不等式

a,b \geq 0 に対し,
ab \leq \frac{1}{p}a^p + \frac{1}{q}b^q
[証明]
log は上に凸なので,
\log(tx+(1-t)y) \geq t \log x + (1-t) \log y
この不等式に以下を代入する。
t = \frac{1}{p},\ 1-t = \frac{1}{q}, \ x = a^p, \ y = b^q
次の形に変形できる。
\log \left( \frac{1}{p}a^p + \frac{1}{q}b^q \right) \geq \log ab
log は単調増加なので,求める不等式を得る。
ab \leq \frac{1}{p}a^p + \frac{1}{q}b^q

Hölder不等式 (1889; Rogers 1888)

f,g \textrm{ : measurable functions on } \Omega
\|fg\|_1 \le \|f\|_p \|g\|_q
f,g がそれぞれLp,Lqであることは求めない。
つまり,無限大も含めて成立するということ。
f∈Lp,g∈Lq が成立するときは,fg∈L1 が漏れなくついてくる。
Rem.
1≦p≦∞に対し,1/p+1/q=1なるqを,Hölder共役(-conjugates)という。
Rem.
p=q=2のとき,Cauchy-Schwaltz不等式
使い方
指数は見方次第でコロコロ変えられるってこと。
\| f \|_{L^p}^p = \int_X |f|^p dx = \int_X |f^\frac{p}{q}|^q dx = \|f^\frac{p}{q} \|_{L^q}^q = \int_X |f^q|^\frac{p}{q} dx = \| f^q \|_{L^\frac{p}{q}}^\frac{p}{q}

Mincowski不等式

f,g \in L^p
\|f+g\|_p \le \|f\|_p + \|g\|_p
Rem.
Lp空間の三角不等式にあたる。
Hölder不等式から証明される。

Schwartz不等式

何種類かある。
内積空間の特徴づけ。
Lp版はHölderの系として出てくる。

Cramer-Rao不等式

Jensenから証明される。
不偏推定量(推定量の期待値が真値と一致)に対して,分散を評価する不等式
X_i \sim p(X, \theta) \quad (i=1,\cdots,n) 目的の分布からとられた確率変数列
\widehat{\theta} := \delta( X_1, \cdots, X_n ) 推定量(つまり真の母数θの推定方法)
\mathbb{E} \widehat{\theta} = \theta 不偏推定量
このときさらに,δが適当な正則条件を満たせば,推定量の分散について以下の不等式が成り立つ。
\mathrm{Var}\widehat{\theta} = \frac{1}{n \mathbb{E} \left[ \left( \frac{\partial p(X, \theta)}{\partial \theta}\right)^2 \right]}
等号を成立させる推定量を有効推定量という。
一様分布は正則条件を満たさないので使えない。

相加相乗平均

\frac{\sum a_n }{n} \geq \sqrt[n]{\prod a_n}

タグ:

+ タグ編集
  • タグ:

このサイトはreCAPTCHAによって保護されており、Googleの プライバシーポリシー利用規約 が適用されます。

最終更新:2015年09月08日 17:41
ツールボックス

下から選んでください:

新しいページを作成する
ヘルプ / FAQ もご覧ください。