◆広島県 清川 育男 さんからの解答。
【問題1】
作戦
【問題2】
この作戦が最善だとするとき、賞金の期待値は、
6×(1/6)=6/6
5×(1/6)=5/6
33/18
6×(1/6)×(2/3)=6/9
5×(1/6)×(2/3)=5/9
4×(1/6)×(2/3)=4/9
30/18
6×(1/6)×(1/3)=6/18
5×(1/6)×(1/3)=5/18
4×(1/6)×(1/3)=4/18
3×(1/6)×(1/3)=3/18
2×(1/6)×(1/3)=2/18
1×(1/6)×(1/3)=1/18
21/18
33/18+30/18+21/18
=84/18
=14/3
答え 14/3万円。
プログラムを組んでシミュレーションした結果40000回の実験で4.665となりました。
◆補足
1回であれば、期待値は3.5万円。
1,2,3のとき次のサイコロを振る作戦のときの期待値は37/8万円。
14/3−37/8=1/24。
10000×1/24=416.66
約416円66銭の差がある。
実験で4.666まで確定させるためには200万回以上の試みが必要のようです。
200万回のとき、4.66886でした。
◆武田 隆司 さんからの解答。
一回サイコロを振ったとき、ある数の出る確率をpとすると、
| p= | 1 ―― 6 |
<T>n=1のとき、
M(1)=p×(1+2+3+4+5+6)=3.5
<U>n=2のとき、
<T>の結果より一回目の出目が、3以下の場合は振りなおすのが良い。
一回目に4,5,6が出る確率は、それぞれpだから、
M(2)=p×(4+5+6)+3p×M(1)=4.25
<V>n=3のとき、
<U>の結果より一回目の出目が、4以下の場合のみ振りなおすのが良い。
一回目に5,6が出る確率は、それぞれpだから、
M(3)=p×(5+6)+4p×M(2)=4.666
【コメント】
お二人の方からほぼ同時に解答が来ました。
種本と結果が違って驚きましたが、自分で計算してみるとどうも本の方が間違っているようです。
シミュレーションの結果と比べて、本の数値が小さいようで不審に思っていたのですが、4.666・・・で正しいと確信しました。
でも当然かもしれませんが、だんだん妥協するラインが下がってくるのが面白いですね。
お見合いなどでも同じでしょうか。
◆東京都 鳳 奥人 さんからの解答。
最初に考えたのは、
| 1回だけサイコロを振ってやめることが前提の場合の期待値は35000円。 だから、それより多い賞金を獲得できる場合(=4以上が出た場合)はその場でやめ、さもなくば次を振る |
というものでした。すなわち
「1回目も2回目も、4以上が出ればそこでやめ、3以下ならもう1回振る」。
さて、検証に入ってみましょう。
1回目はa以上が出たらやめ、2回目はb以上が出たらやめるものとしますと、期待値は
| 10000a× | 1 6 |
+10000(a+1)× | 1 6 |
+・・・+60000× | 1 6 |
| + | a-1 6 |
×(10000b× | 1 6 |
+10000(b+1)× | 1 6 |
+・・・+60000× | 1 6 | ) |
| + | a-1 6 |
× | b-1 6 |
×(10000× | 1 6 |
+20000× | 1 6 | +・・・+60000× | 1 6 | ) |
1行目は1回目でやめる場合
2行目は2回目でやめる場合
3行目は3回目まで振る場合 ・・・です。
これを計算して、最大値を出すaとbの組み合わせを求めることになりますが私にはちょっと難しいので、Excelの助けを借りてやります。
すると、下表 のようになります。
(小数点以下第2位で四捨五入)

※a=1、つまり「1回目で1以上が出たらそこでやめる」とは「1回目で何が出ようと2回目は振らない」ということなので、この表からは除外しました。
ちなみに、この場合の期待値が35000円であることはすぐ求められるはずです。
意外や意外、「1回目で5以上が出たらそこでやめ、2回目は4以上ならそこでやめる」のが一番期待値が高いようです。
さっそく実験してみましたところ、100回やって平均獲得賞金は約47,180円でした。
いい感じです。