?

博餅游戲中骰子投擲次數的概率分布與數學期望

2022-02-18 06:25儲理才
關鍵詞:骰子概率分布正態分布

儲理才

(集美大學理學院,福建 廈門 361021)

0 引言

游戲從一開始就伴隨著人類文明的發展史,最簡單的游戲中都可能蘊含著基本的數學原理[1-2]。從最原始的賭博游戲到現在各種復雜的電腦手機游戲,游戲的持續時間一直是人們關注的焦點。對于游戲的持續時間現在已發展了一系列研究方法,如馬爾科夫鏈方法[3]、鞅方法[4]等。

中秋博餅是流行于閩南廈漳泉以及臺灣、東南亞地區的一項民俗活動[5]。傳統的“博餅”活動設有大小不同、形態各異的月餅作為獎品,分為6個等級,由高到低分別設“狀元”1 個、“對堂”2 個、“三紅”4 個、“四進”8 個、“二舉”16 個、“一秀”32 個。全套月餅共 63 塊,稱為“會餅”。當前在閩南地區比較通用的獲獎規則如下:1)狀元,6枚骰子中出現 5 個以上相同點數或有 4 個以上為 4 點;2)對堂,6枚骰子的點數恰好為 1,2,3,4,5,6;3)三紅,6枚骰子 中出現 3 個 4 點;4)四進,6枚骰子中出現 4 個相同的不為 4 的點數;5)二舉,6枚骰子中出現 2 個 4 點;6)一秀,6枚骰子中出現 1 個 4 點;7)罰黑,若結果不符合以上任何一個條 件,則稱為罰黑,不取得任何獎品。獲獎等級采取就高不就低原則。根據以上規則,可以計算出各個等級的獲獎概率[6-8],即:罰黑為14 300/46 656,狀元為561/46 656,對堂為720/46 656,三紅為2 500/46 656,四進為1 875/46 656,二舉為9 300/46 656,一秀為17 400/46 656。本文研究博餅游戲的持續時間分布問題,在這個游戲中,持續時間與游戲中投擲骰子的次數成正比。經查閱文獻,發現此問題與概率統計學中著名的“賭徒輸光”[9-13]問題有相通之處。因此,本文應用馬爾可夫鏈方法,通過計算機編程計算,獲得了投擲次數為800以內的概率分布,發現該分布可以用對數正態分布進行擬合,并進一步給出了精確計算數學期望的方法,獲得了數學期望的精確有理數表示。

1 符號說明

為敘述方便,引入以下符號:設A0,A1,A2,A3,A4,A5,A6分別表示隨機事件“罰黑”、“狀元”、“對堂”、“三紅”、“四進”、“二舉”、“一秀”,記pj=P(Aj),j=0,1,…,6。一局游戲剛開始時,各類獎品都未分發出去,隨著游戲的進行,剩余獎品數越來越少,直至所有獎品分發完畢,游戲結束。定義狀態向量(i1,i2,i3,i4,i5,i6),其分量i1,i2,i3,i4,i5,i6分 別表示狀元、對堂、三紅、四進、二舉、一秀獎項的剩余獎品數,則狀態空間T={(i1,i2,i3,i4,i5,i6)│0≤i1≤1,0≤i2≤2,0≤i3≤4,0≤i4≤8,0≤i5≤16,0≤i6≤32,i1,…,i6為整數}。易知,狀態空間包含151 470(2×3×5×9×17×33)個狀態點,游戲初始狀態為(1,2,4,8,16,32),游戲結束狀態為(0,0,0,0,0,0)。

由博餅游戲的規則可知,某個時刻的狀態只依賴于前一個時刻的狀態,從當前狀態轉移到其他狀態或自身都有確定的概率。因此,獎品剩余狀態向量構成一個典型的離散馬爾可夫過程,即馬爾可夫鏈。從一個狀態經過一步轉移可達到的狀態稱為該狀態的一步可達狀態。

2 投擲次數的概率分布

2.1 概率分布的計算算法

設隨機變量Z表示一局游戲需要的投擲次數。一局游戲開始,所有獎品都未分發,所以有:

(1)

考慮k=0 的情形。顯然,只有當獎品全分完時,才不需要投擲骰子,所以有:

(2)

再考慮k>0 的情形。在獎品剩余狀態為(i1,i2,i3,i4,i5,i6)時,設想第1次的投擲結果必定為事件Ai(i=0,1,…,6)中的某一個發生,顯然事件Ai(i=0,1,…,6)兩兩互不相交,它們構成樣本空間的一個完備事件組,有全概率公式為:

(3)

(4)

(5)

(6)

類似地分析,有:

(7)

(8)

(9)

(10)

(11)

將式(4)和式(6)~式(11)代入式(3),得:

(12)

對任意正整數k,要計算式(1),只需以式(2)為初始條件,按式(12)進行迭代即可,具體算法可描述為算法1。

算法1 計算累計概率分布:P{Z≤k},k=0,1,2,…,K。

Input:轉移概率p0,p1,p2,p3,p4,p5,p6,正整數K。

Output:P{Z≤k}=P(k),k=0,1,2,…,K。

預分配2個6維數組P1、P2和一個1維數組P;

初始化:P1(0,0,0,0,0,0)← 1,P1(i1,i2,i3,i4,i5,i6)← 0,其他;

P(0)←P1(1,2,4,8,16,32);

fork← 1,k<=K,k++do

for each(i1,i2,i3,i4,i5,i6)∈Tdo

P2(i1,i2,i3,i4,i5,i6)←p0P1(i1,i2,i3,i4,i5,i6)+p1P1(?i1-1」,i2,i3,i4,i5,i6)+

p2P1(i1,?i2-1」,i3,i4,i5,i6)+p3P1(i1,i2,?i3-1」,i4,i5,i6)+p4P1(i1,i2,i3,?i4-1」,i5,i6)+

p5P1(i1,i2,i3,i4,?i5-1」,i6)+p6P1(i1,i2,i3,i4,i5,?i6-1」);

end

P(k)←P2(1,2,4,8,16,32);

for each(i1,i2,i3,i4,i5,i6)∈Tdo

P1(i1,i2,i3,i4,i5,i6)←P2(i1,i2,i3,i4,i5,i6);

end

end

2.2 概率分布的計算結果

對給定的正整數K,按節2.1方法計算Z在 {0,1,2,…,K} 上的概率分布。由于狀態空間中的元素數目多達151 470,需計算機編程計算。以下是K=800 的計算結果。

表2是Z的累計概率分布表。從表2中可以看出,投擲數不超過220的概率為0.522 067,而投擲數不超過640的概率高達0.999 031。由Z的累積概率分布,很容易計算Z取某個整數值的概率P{Z=k}=P{Z≤k}-P{Z≤k-1}。

表2 投擲次數Z的累積概率分布表(P {Z≤k})

定義概率最大的投擲次數為最可能出現的投擲次數,則最可能出現的投擲次數為 196,其概率P{Z=196}=P{Z≤196}-P{Z≤195}=0.005 920 890,即1 000 局游戲中大約會出現6局是以196次投擲次數結束游戲的。

2.3 投擲次數Z的擬合分布

投擲次數Z的概率分布表雖已得出,但使用起來有些不便,能否使用已知的概率分布對其進行擬合呢?

圖1是投擲次數Z的概率分布圖。由圖1b可以看出,Z的分布是一種偏態分布,分別選擇Γ-分布和對數正態分布對Z的概率分布用最小二乘法進行擬合,得出相應的參數。擬合效果見圖 2,其中Γ-分布的形狀參數α=9.289,尺度參數β=24.603,對數正態分布的參數μ=5.377 8,σ=0.328 4。從擬合效果來看,顯然對數正態分布要優于Γ-分布。容易計算該對數正態分布的數學期望為 228.543,方差為 5 947.990,可作為Z的數學期望E(Z)和方差Var(Z)近似值,即平均要投 228.543次就可將獎品分配完畢。

3 投擲次數的數學期望

本節考慮E(Z)的精確計算問題。設獎品剩余狀態為(i1,i2,i3,i4,i5,i6)時還需要的投擲次數的數學期望為E(i1,i2,i3,i4,i5,i6),類似節2.1的分析可得:

E(0,0,0,0,0,0)=0,

(13)

(14)

由式(14)可以解出E(i1,i2,i3,i4,i5,i6)。例如,當i1,i2,i3,i4,i5,i6全大于0時,有:

(15)

當(i1,i2,i3,i4,i5,i6)中出現0時,不失一般性,假設i1=i3=i5=0,i2,i4,i6>0,有:

(16)

由式(15)~式(16)可見,狀態點(i1,i2,i3,i4,i5,i6)處的數學期望可以由一步可達狀態點的數學期望遞推算出,為此將狀態空間T分層,對整數0≤k≤63,定義

Tk={(i1,i2,i3,i4,i5,i6)∈T|i1+i2+i3+i4+i5+i6=k}。

(17)

顯然,T0={(0,0,0,0,0,0)},T63={(1,2,4,8,16,32)},Tk中的狀態點的一步可達狀態點一定在Tk-1中,計算E(Z)=E(1,2,4,8,16,32)的精確值的算法為算法2。

算法2 計算E(Z)=E(1,2,4,8,16,32)。

輸入參數:p0,p1,p2,p3,p4,p5,p6;

初始化:E(0,0,0,0,0,0)← 0;

按式(17)構造Tk,k=0,1,…,63;

fork←1,k<=63,k++do

for each(i1,i2,i3,i4,i5,i6)∈Tkdo

由式(14)計算E(i1,i2,i3,i4,i5,i6)

end

end

輸出:E(1,2,4,8,16,32)。

按算法2用數學軟件Mathematica編程,計算得到E(Z)的精確值為:

E(Z)=(729 282 124 … 214 477 889)/(3 191 150 … 807 040 000)。

(18)

式(18)中分子為4 770位整數,分母為4 768位整數。由于篇幅所限,中間數位的數字略去。保留六位小數為:E(Z)=(729 282 124 … 214 477 889)/(3 191 150 … 807 040 000)≈ 228.532 698,與用對數正態分布計算的結果相比較,二者之間只差 0.01,再一次說明對數正態分布能很好地擬合投擲次數的概率分布。

猜你喜歡
骰子概率分布正態分布
關于n維正態分布線性函數服從正態分布的證明*
離散型概率分布的ORB圖像特征點誤匹配剔除算法
偏對稱正態分布的若干性質
關于概率分布函數定義的辨析
基于概率分布的PPP項目風險承擔支出測算
正態分布及其應用
關于二維正態分布的一個教學注記
骰子不見了
依賴于時滯概率分布的不確定細胞神經網絡的魯棒穩定性
巧猜骰子
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合