劉禹彤 趙毅
一、圣彼得堡悖論
圣彼得堡悖論來自于一個擲幣游戲關于概率期望值的悖論。擲幣游戲規(guī)則:設定擲出正面為成功,游戲者如果第一次投擲成功,得獎金2元,游戲結束;否則,繼續(xù)投擲,第二次成功得獎金4元,游戲結束;以此類推,如果第n次投擲成功,得獎2n金元,游戲結束。
按照概率期望值的計算方法:將每一個可能結果的獎金乘以該結果發(fā)生的概率,即可得到該結果的獎金期望值,游戲的期望值即為所有可能結果的獎金期望值之和。隨著實驗次數n的增加,雖然發(fā)生概率小,但獎金越來越多,且每一個結果的獎金期望值均為1,則游戲的期望值將為“無窮大”。而且按照概率的理論,多次實驗的結果將會接近于數學期望。
但是,以往經驗表明“沒有人愿意花25元去參加一次這樣的游戲?!边@就出現了計算的期望值與實際情況的“矛盾”。我們可以使用MATLAB軟件模擬實驗過程來解釋這一問題。
二、圣彼得堡實驗的MATLAB模擬分析
由于投擲硬幣得到正面和反面的概率相同(等概率事件),即P(正面)=P(反面)=0.5。
1.單輪圣彼得堡游戲的MATLAB模擬
當游戲參與者投擲硬幣出現正面時游戲結束,我們可以將每次投擲的隨機值由函數rand產生。如果該次rand函數運算結果小于等于0.5,定義為投擲出反面,游戲繼續(xù);反之,則定義為投擲出正面,游戲終止。
由于圣彼得堡游戲的不確定性,為了獲得可信度較高的均值數據,需要進行多次模擬。下面討論中,對一次性連續(xù)多次的游戲模擬統(tǒng)稱為一輪游戲模擬。一輪圣彼得堡游戲由多個單次圣彼得堡游戲組成。截取每次運行的投擲次數和獎金數額這兩個結果,得到單輪多次圣彼得堡游戲的MATLAB模型(設本輪投擲運行為100次)。從結果可以看出,在本輪模擬實驗中單次游戲最高獎金達到32元,但是平均獎金只有10.62元,遠小于32元。同時單次游戲最大投擲次數為5,但平均投擲次數只有1.98。
為了增加實驗的可靠性,減少不確定性,增加單輪游戲的次數,以此觀察實驗結果與單輪100次模擬實驗的結果的異同,以此找出規(guī)律(程序運行5000次)。
結果表明:單次游戲的最高獎金雖然達到了2048元,但平均獎金只有13.4972元,遠小于2048元。同時,單次最大投擲次數增加為11,但平均投擲次數只有2.004。也就是說,對單次游戲來講,平均每次游戲能夠得到6.7351元。之所以可以達到13.4972元這樣的平均獎金,是由于游戲的不確定性,產生了11次的最大單次投擲次數,使該游戲的獎金額大幅增加。
2.多輪圣彼得堡游戲的MATLAB模擬
在上圖中發(fā)現最大投擲次數隨著輪數的增加而增加,但是,增加速度并不明顯。其中,最大的投擲次數為16次,此時,這一事件的概率為,約為1.5259×10-5。
在此基礎上驗證了當輪數為100000時的隨機模擬實驗,隨著輪數的劇增,但是,單輪最大投擲次數僅為18,最大獎金額為 262144元。
說明當輪數趨向于無窮大時,最大投擲次雖然數也會增加,但是增加速率極慢。
在上圖100個樣本值中,數據分布如下:
54個數據分布在0~10元,均值為9.4720元,34個數據分布在10~20元,均值為17.1560元,8個數據分布在20~30元,均值為24.8400元,只有4個數據在30元以上。
綜上分析,圣彼得堡游戲的定價可以按照其從小到大排序的88個數據的平均值為參照標準,定價為12元左右。
3.單輪游戲的平均投擲次數
從下圖可以發(fā)現無論單輪的游戲次數是多少,其單輪的平均投擲次數的平均值為1.9911,最大值為2.1071,最小值為1.82,在直線y=2上下波動震蕩(見下圖)。
三、結論
從以上的模擬實驗的結果數據分析得出以下結論:
1.圣彼得堡游戲的平均單次投擲次數趨近于2
2.單輪圣彼得堡游戲的最高投擲次數增長速度隨著次數的增加而變緩,趨近于0
3.單輪圣彼得堡游戲的平均獎金的增長速度隨著次數的增加而變緩,趨近于0
4.由于實驗的不確定性,單次游戲可以有較高的獎金,但是其概率極小,不會對其他參與者產生吸引力
由上述模擬結果分析得出:可以將游戲定價為12元時,此時需要投擲硬幣4次才可以贏取獎金4元,此時的概率為0.0625,這已經是一個小概率事件了,而且可以保證游戲參與者中既有失敗者,又有成功者,而且游戲組織者的損失和收益也大致相當。
參考文獻:
朱琳,葉向.圣彼得堡悖論的計算機模擬分析[J]計算機系統(tǒng)應用,2009(11).
(作者單位 劉禹彤:北京林業(yè)大學理學院 趙毅: 浙江財經大學)