twilight1730の資料室(wiki別館)

期待値理論(成否二極型・成功+1のみ)

最終更新:

twilight1730

- view
管理者のみ編集可


期待値理論(スゴロク型・完美精錬モデル)

目次







はじめに


 ここで説明する期待値理論は、主に完美世界における装備の精錬を元に作り上げた理論です。完美の精錬をモデル化し、スゴロクのような形である地点からある地点へ移動するのに必要な回数の期待値の出し方を説明します。




完美世界の精錬について


 完美世界とはC&Cメディア社が展開するMMORPG(ネットゲーム)です。そのゲームにおいて、装備の強化として精錬という作業があります。なるべく性能の良い装備を作ろうと多くのプレイヤーが必死になっています。

 精錬には幻仙石というアイテムを使用します。相場は2.5円/個ぐらいです。こちらはゲームプレイで手に入る普通のアイテムです。特定のNPCのところでこのアイテムを使い精錬を行います。武器の精錬には2個、その他装備品には1個が一度の精錬に必要です。

 ただし、精錬は100%成功するものではありません。連続で成功すれば+1,+2,…と徐々に強化レベルが上がりますが、一度失敗すると+0まで戻されてしまいます。幻仙石による精錬では成功率は低く30%程といわれています。

 そこで、課金アイテム(現実でお金を払い買うアイテム)を用いて精錬成功率やリスクを改善することが出来ます。天空の石は精錬成功率を大きく(20%)上昇させます。神秘の石は精錬成功率を少し上げ(10%)失敗したとき精錬レベルが一段階下がるだけにリスクを抑えます。天地石は精錬成功率は今の精錬レベル固有の値に修正し、かつ失敗による精錬値の変動はありません。確率が絡むのは以上のものがあります。

 一方、100%の成功率を保障するものが精錬石です。こちらはそれぞれレベルがありLv5精錬石ではLv5までの精錬ならば必ず成功させることが出来ます。LvはLv1(+0⇒+1のみ成功率100%)からLv12(+11⇒+12までどんな精錬でも成功する)まであり、もちろんレベルが上がるほどかなりの金額になります。

 つまり完美世界における精錬は次の5パターンあることが分かります。

精錬方法 成功率 失敗時
幻仙石のみ 30% +0に戻される
幻仙石+天空の石 50% +0に戻される
幻仙石+神秘の石 40% 1つ下がるだけ
幻仙石+天地石 固有 Lv変動なし
幻仙石+精錬石 100% (失敗はない)


精錬のモデル化


 精錬値をどうやってモデル化するか。注目するべきは精錬値です。成功すれば精錬値は1増えて、失敗したら①0に戻る②-1される③変化しない、の三種類です。なのでスゴロクのようにマスを一直線につないだものを考えて、スタートから0を割り振ることでモデル化します。

■□□□□□□□□□□□□ (精錬値+0)

成功すれば一つずつ増えていきます

□■□□□□□□□□□□□ (精錬値+1)
□□■□□□□□□□□□□ (精錬値+2)
□□□■□□□□□□□□□ (精錬値+3)
□□□□■□□□□□□□□ (精錬値+4)
□□□□□■□□□□□□□ (精錬値+5)

ここで5から失敗したとすれば

■□□□□□□□□□□□□ (精錬値+0:幻仙石のみ,天空の石)
□□□□■□□□□□□□□ (精錬値+4:神秘の石)
□□□□□■□□□□□□□ (精錬値+5:天地の石)

 上記のように表すことが出来ます。どちらにせよ精錬値の場所は1つのパラメータ(変数)で表すことが出来ることがわかります。逆に考えて、完美の精錬値の性質を調べていくことで、同じようなモデル化が可能な場合も同様の性質を持つとして考えることが出来ます。よって、このスゴロクのように一直線な1つのパラメータのみで場所を表せるモデルについて考えて見ます。




使用する変数


 上記の推論より、現在位置が一つのパラメータで表されるようなスゴロク型のモデルでの期待値の求め方を考えます。ただし今回は簡単の為、成功で+1が共通で、失敗で①0に戻る②-1される③変わらないパターンのみに限定します。

  • 場所を表す変数
i,j,k,m,n \in N

  • 成功率
p(i) \in R

  • コスト
\tau(i) \in R

  • 期待値
E(i,j),E_c(i,j) {i<j} \in R

基本文字変数は特にことわりのない場合は精錬値を表します。p(i)は精錬値iでの精錬成功率とします。τ(i)は精錬値iで一回の試行で必要なコストです。E(i,j)はiからjに到達するまでの期待値です。前者を回数期待値とし、後者は必要コストについて考えた場合の期待値とします。

ここでi⇒i(同じ場所へ行くための期待値)は元々最初から条件が整っているという意味で便宜上次の値に定義します。

E(i,i)=E_c(i,i)=0

また成功率が0の場合進むことが絶対にないためp(i)の定義域は次のように定めます。

0 < p(i) \le 1

期待値の法則性


 詳しい説明は別にまとめますが上記のように定義した精錬期待値の場合、次の性質があります

  • m≦k≦nのとき

E(m,n) = E(m,k) + E(k,n) (式1.1)

 m⇒nに進むまでの期待値は、まずm⇒kに進むための期待値にk⇒mに進むための期待値を足したものになります。補足をしておくと、これは成功で+1だからこそ成り立つことで、m⇒nに行くまでには必ずkを経由することから想像がつきます。

 これをさらに発展させて、m⇒nを、m⇒m+1…n-1⇒nに分解することで次のようにまとまります。

  • m≦nのとき

E(m,n) = \sum_{i=m}^{n-1}E(i,i+1) (式1.2)

 次に失敗したらm'(≦m)に戻ると考えてm⇒m+1の期待値E(m,m+1)を考えます。mでは確率p(m)で成功しm+1へ、確率1-p(m)で失敗しi'に戻ることが分かります。そして、i'⇒m+1へはE(i',m+i)の期待値でたどり着くと考えられます。また精錬値iで行う試行は1回です。

E(m,m+1) = 1 + p(m)E(m+1,m+1) + (1-p(m))E(m',m) (式1.3)

ここで右辺第二項は定義より0なので消えるので

E(m,m+1) = 1 + (1-p(m))E(m',m+1) (式1.4)

さらに(1.1)を適応することでE(m',m+1)からE(m,m+1)のみ左辺に移項て

p(m)E(m,m+1) = 1 + (1-p(m))E(m',m) (式1.5.a)

コスト期待値については一回の試行を表す1の部分を一回のコストτ(m)に置き換えることですなわち

p(m)E_c(m,m+1) = \tau(m) + (1-p(m))E(m',m) (式1.5.b)

これで議論の見通しが大分つきました。次から①+0に戻るパターン②-1されるパターン③戻らないパターンの3つに分けて一般系を説明します。


天地石タイプ(失敗で変動なし)


 このパターンが一番簡単です。(式1.5.a),(式1.5.b)の右辺第二項に注目するとm'=mのため定義より0となります。すなわち(式1.5.a)(式1.5.b)は次の式のようになります。

p(m)E(m,m+1) = 1 (式:2.1.a)

p(m)E(m,m+1) = \tau(m) (式:2.1.b)

p(m)>0なので両辺をp(m)で割ることが出来て

E(m,m+1) = \frac{1}{p(m)} (式:2.2.a)

E_c(m,m+1) = \frac{\tau(i)}{p(m)} (式:2.2.b)

あとは(式:1.2)の関係を利用しE(m,n)は次のようになります

E(m,n) = \sum_{i=m}^{n-1}\frac{1}{p(i)} (式:2.3.a)

E_c(m,n) = \sum_{i=m}^{n-1}\frac{\tau(i)}{p(i)} (式:2.3.b)

 つまり、単純にそれぞれの地点の成功率の逆数を足して行ったものが回数の期待値に、成功率の逆数にそれぞれ同じ地点でのコストを掛けてやればコスト期待値となります。

例:10円玉を投げて3回表がでるまでにかかる回数の期待値

E(0,3) &= \frac{1}{\frac{1}{2}} + \frac{1}{\frac{1}{2}} + \frac{1}{\frac{1}{2}}\\&=2+2+2=6


天空の石タイプ


次に簡単なタイプです。(式:1.5.a)(式:1.5.b)の右辺第二項が消えることはありませんが、常に0に戻ることによってある程度型にはまった値が出てくれます。

E(m,m+1)=\frac{1}{p(m)}+\frac{1-p(m)}{p(m)}E(0,m+1) (式:3.1.a)

E_c(m,m+1)=\frac{\tau(m)}{p(m)}+\frac{1-p(m)}{p(m)}E(0,m+1) (式:3.1.b)

見通しを良くする為にm=0から順に計算してみます


  • m=0

E(0,1)=\frac{1}{p(0)}(式:3.2.a)

E_c(0,1)=\frac{\tau(0)}{p(0)}(式:3.2.b)


  • m=1

E(1,2)&=\frac{1}{p(1)}+\frac{1-p(1)}{p(1)}E(0,1)\\ =\frac{1-p(1)}{p(0)p(1)} + \frac{1}{p(1)} (式:3.3.a)

E_c(1,2)&=\frac{\tau(1)}{p(1)}+\frac{1-p(1)}{p(1)}E_c(0,1)\\&=\frac{\tau(0)(1-p(1))}{p(0)p(1)}+\frac{\tau(1)}{p(1)} (式:3.3.b)


つまり0⇒2の期待値は

E(0,2)=\frac{1}{p(0)}+\frac{1-p(1)}{p(0)p(1)}+\frac{1}{p(1)}

=\frac{p(1)+1-p(1)}{p(0)p(1)}+\frac{1}{p(1)}

=\frac{1}{p(0)p(1)}+\frac{1}{p(1)} (式:3.4.a)

E_c(0,2)=\frac{\tau(0)}{p(0)}+\frac{\tau(0)(1-p(1))}{p(0)p(1)}+\frac{\tau(1)}{p(1)}

=\frac{\tau(0)(p(1)+1-p(1))}{p(0)p(1)}+\frac{\tau(1)}{p(1)}

=\frac{\tau(0)}{p(1)p(0)}+\frac{\tau(1)}{p(1)} (式:3.4.b)


  • m=2

E(2,3)=\frac{1}{p(2)}+\frac{1-p(2)}{p(2)}E(0,2)

=\frac{1-p(2)}{p(0)p(1)p(2)}+\frac{1-p(2)}{p(1)p(2)}+\frac{1}{p(2)} (式:3.5.a)

E_c(2,3)=\frac{\tau(2)}{p(2)}+\frac{1-p(2)}{p(2)}E_c(0,2)

=\frac{\tau(0)(1-p(2))}{p(0)p(1)p(2)}+\frac{\tau(1)(1-p(2))}{p(1)p(2)}+\frac{\tau(2)}{p(2)} (式:3.5.b)


同様に0⇒3は途中式を省略しますが整理すると次の式となります

E(0,3)=\frac{1}{p(0)p(1)p(2)}+\frac{1}{p(1)p(2)}+\frac{1}{p(2)} (式:3.6.a)

E(0,3)=\frac{\tau(0)}{p(0)p(1)p(2)}+\frac{\tau(1)}{p(1)p(2)}+\frac{\tau(2)}{p(2)} (式:3.6.b)


これより次の予想が出来ます

E(0,n)=\sum_{i=0}^{n-1}\frac{1}{\prod_{j=i}^{n-1}p(i)} (式:3.7.a)

E_c(0,n)=\sun_{i=0}^{n-1}\frac{\tau(i)}{\prod_{j=i}^{n-1}p(i)} (式:3.7.b)


これは帰納法で証明できます。まずn=1の時(式:3.2.a)(式:3.2.b)と同系の式となるため成り立ちます。

次にn=kで成り立つと仮定してE(0,k+1)を考えて見ます。

E(0,k+1)=E(0,k)+E(k,k+1) (式:3.8.a)

E_c(0,k+1)=E_c(0,k)+E_c(k,k+1) (式:3.8.b)


E(k,k+1)はそれぞれ

E(k,k+1)=\frac{1}{p(k)}+\frac{1-p(k)}{p(k)}E(0,k) (式:3.9.a)

E_k(k,k+1)=\frac{\tau(k)}{p(k)}+\frac{1-p(k)}{p(k)}E_c(0,k) (式:3.9.b)


それぞれ(式:3.8,a)(式:3.8,b)に代入すると

E(0,k+1)=\frac{1}{p(k)}+\frac{1}{p(k)}E(0,k) (式:3.10.a)

E_c(0,k+1)=\frac{\tau(k)}{p(k)}+\frac{1}{p(k)}E_c(0,k) (式:3.10.b)


仮定より(式:3.7.a)(式:3.7.b)はE(0,k)においては成り立っているので代入して、第二項を考える

\frac{1}{p(k)}E(0,k)=\frac{1}{p(k)}\sum_{i=0}^{k-1}\frac{1}{\prod_{j=i}^{k-1}p(j)}

=\sum_{i=0}^{k-1}\frac{1}{p(k)\prod_{j=i}^{k-1}p(j)}

=\sum_{i=0}^{k-1}\frac{1}{\prod_{j=i}^{k}p(j)} (式:3.11.a)


\frac{1}{p(k)}E_c(0,k)=\frac{1}{p(k)}\sum_{i=0}^{k-1}\frac{\tau(i)}{\prod_{j=i}^{k-1}p(j)}

=\sum_{i=0}^{k-1}\frac{\tau(i)}{p(k)\prod_{j=i}^{k-1}p(j)}

=\sum_{i=0}^{k-1}\frac{\tau(i)}{\prod_{j=i}^{k}p(j)} (式:3.11.b)


また(式:3.10.a)(式:3.10.b)の第一項はi=kとおいた時の(式:3.11.a)(式:3.11.b)の総和の中身と同じなのですなわち

E(0,k+1)=\sum_{i=0}^{k}\frac{1}{\prod_{j=i}^{k}p(j)} (式:3.12.a)
E(0,k+1)=\sum_{i=0}^{k}\frac{\tau(i)}{\prod_{j=i}^{k}p(j)} (式:3.12.b)


よって帰納的に(式:3.7.a)(式:3.7.b)が示されました。失敗したら0に戻るタイプは、常に以前の期待値が累積して期待値が大きくなるので、目標地点を遠くすれば遠くするほど劇的に期待値は大きくなります。また目標手前の成功率が低いほど、それ以前の期待値の項にも上乗せされていくため、結果的に目標手前の成功率が低いほど期待値は増大します。

最後に(式:3.7.a)(式:3.7.b)からm⇒nまでの期待値を求めるとそれぞれ

E(m,n)=\sum_{i=m}^{n-1}\frac{1}{\prod_{j=i}^{n-1}p(j)} (式:3.13.a)

E_c(m,n)=\sum_{i=m}^{n-1}\frac{\tau(i)}{\prod_{j=i}^{n-1}p(j)} (式:3.13.a)


例)2連続成功の時だけサイコロで3の倍数の目が出れば成功、それ以外では10円玉で表で成功としたとき、3回連続で成功するまでに試行する回数期待値

E(0,3)=\frac{1}{\frac{1}{2}}\cdot\frac{1}{\frac{1}{2}}\cdot\frac{1}{\frac{1}{3}}+\frac{1}{\frac{1}{2}}\cdot\frac{1}{\frac{1}{3}}+\frac{1}{\frac{1}{3}}=2^2{\times}3+2{\times}3+3=21

(以下後日)
記事メニュー
ウィキ募集バナー