【摘要】本文首先對二項分布進行了回顧,然后從模型的背景出發(fā)分別從不同的角度探討了其極限分布,并通過案例分析發(fā)現(xiàn)在很多二項分布的計算中適當?shù)氖褂脴O限分布可以簡化計算。
【關鍵詞】二項分布 ?泊松分布 ?正態(tài)分布
【中圖分類號】G64 【文獻標識碼】A 【文章編號】2095-3089(2018)42-0230-02
在概率論與數(shù)理統(tǒng)計中,二項分布是最常用的一類離散型分布,在生活中二項分布的例子比比皆是,但當它的參數(shù)比較大的時候其相關計算并不簡單,這時若利用極限分布來近似替代二項分布會使計算大大簡化,但由于學生對這些分布和其極限分布的相關定理理解不夠清晰,使得對極限分布到底選擇泊松分布還是正態(tài)分布感到疑惑。本文我們就重點來分析二項分布的相關極限定理。
1.二項分布的定義
1)背景模型:n重伯努利試驗,即,每次試驗中只有兩種可能的結果(伯努利試驗),獨立重復地進行n次這樣的試驗。
2)定義:設X表示n重伯努利試驗中事件A出現(xiàn)的次數(shù),每次伯努利試驗中事件A出現(xiàn)的概率均為p,則X可能的取值為:0,1,2,…n,X取各個值的概率分別為P(X=m)=C■■pmqn-m,其中m=0,1,2,…n,則稱X服從參數(shù)為n,p的二項分布,記為X~B(n,p)
從定義可以看出,一個隨機變量是否服從二項分布主要看隨機試驗是否滿足其背景模型:1)X表示n次試驗中我們所關心的事件A出現(xiàn)的次數(shù);2)每次試驗都是一個伯努利試驗,即,只有兩種可能的結果(事件A出現(xiàn)和事件A不出現(xiàn)),并且每次試驗中事件A出現(xiàn)的概率都為p;3)n次試驗相互獨立。當試驗滿足以上三條時,我們就可以判定X~B(n,p)。
在生活中利用二項分布可以解決很多現(xiàn)實問題。下面我們給出一個例子:
例1.某車間有10臺同型號車床。如果每臺車床的工作情況是彼此獨立的,且每臺車床平均每小時開動12分鐘。令X表示該車間任意時刻處于工作狀態(tài)的車床數(shù),試求同時處于工作狀態(tài)的車床數(shù)大于8個的概率。
解析:1)該題目關心的是10臺車床中處于工作狀態(tài)的車床的數(shù)量;2)每一車床只有工作狀態(tài)和非工作狀態(tài)兩種,所以對每一臺車床的觀察就是一個伯努利試驗,且每臺車床平均每小時開動12分鐘,即他們處于工作狀態(tài)的概率都是一樣的;3)他們工作情況又是彼此獨立的,也就是說對10臺車床工作狀態(tài)的觀察就是10次獨立重復的試驗。所以此試驗模型完全符合10重伯努利試驗,X~B(10,p),因為本題關心的事件是處于工作狀態(tài)的車床數(shù),所以p是處于工作狀態(tài)的概率。每臺車床平均每小時開動12分鐘,那么,任一時刻處于工作狀態(tài)的概率根據(jù)幾何分布可以計算p=■=0.2。所以,同時處于工作狀態(tài)的車床數(shù)大于8個的概率P(X>8)=P(X=9)+P(X=10)=C■■0.290.81+C■■0.210
2.二項分布的極限分布
2.1 泊松分布
設隨機變量可能的取值為:0,1,2,…k,…,X取各個值得概率分別為P(X=k)=■e-?姿,其中k=0,1,2,…,則稱X服從參數(shù)為?姿的泊松分布,記為X~P(?姿)。
泊松分布可以看作是二項分布的一個極限分布,具體的理論依據(jù)就是泊松定理:
在n重伯努利試驗中,事件A在每次伯努利試驗中發(fā)生的概率均為pn,如果n→∞時,npn→?姿(?姿>0),則對任意k=0,1,2…,n,有■C■■p■■(1-pn)n-k=■e-?姿。
注:定理中的pn和事件A發(fā)生的概率根據(jù)總試驗次數(shù)有關。當n充分大,pn充分小時,服從二項分布的隨機變量X~B(n,pn)近似的服從參數(shù)為?姿=npn的泊松分布。事實上,當n充分大,pn充分小時,二項分布的概率P(X=k)=C■■p■■(1-pn)n-k計算并不簡單,如果這個時候可以借助于泊松分布的話,泊松分布有現(xiàn)成的泊松分布概率值表就大大減少計算量。
例2.一個計算機硬件公司生產(chǎn)一種型號的微型芯片,每一芯片有0.1%的概率為次品,且各芯片是否為次品是相互獨立的。求1000塊芯片中至少有兩塊是次品的概率。
解析:設X表示1000塊芯片中次品的數(shù)量,則X~B(1000,
0.001)
如果直接用二項分布來計算概率,則P(X=2)=C■■0.0012×0.999998,顯然計算中冪的計算太復雜。這里的n=1000充分大,p=0.001充分小,我們可以根據(jù)泊松定理利用泊松分布來近似代替二項分布:P(X=2)=C■■0.0012×0.999998≈■e-1=■,?姿=np=1000×0.001=1
2.2正態(tài)分布
根據(jù)中心極限定:設獨立同分布的隨機變量序列X1,X2,…,Xn,…,EX=?滋,DXi=?滓2>0,則X=■Xi近似的服從正態(tài)分布N(?滋,?滓2)。二項分布可以看作是n個獨立同分布的兩點分布的和,所以當n→∞時,二項分布近似的服從正態(tài)分布。我們知道在計算概率的時候正態(tài)分布具有先天優(yōu)勢(現(xiàn)成的分布函數(shù)表可以查),所以計算二項分布相關的概率時,當n充分大時,我們可以借助正態(tài)分布來計算二項分布的概率。
例3:設電路供電網(wǎng)中有10000盞燈,晚上每一盞燈開著的概率都是0.7,假定各開或關的時間彼此無關,計算同時開著的燈數(shù)在6800到7200之間的概率。
解析:本題關心的是開著的燈的數(shù)量,每一盞燈只有開或者關兩種狀態(tài),這就是一個伯努利試驗,因為每盞燈開或關都彼此無關說明對每盞燈的觀察是獨立,且每盞燈開著的概率都一樣都是0.7,由此可見,這10000盞燈中開著的燈的數(shù)量服從二項分布。我們可以設X表示10000盞燈中同時開著的燈的數(shù)量,則X~B(10000,0.7)。我們發(fā)現(xiàn)10000已經(jīng)很大了,要計算此二項分布的概率是很不容易的,所以我們考慮用二項分布的極限分布近似替代二項分布來計算相應概率。又發(fā)現(xiàn)第二個參數(shù)為0.7比較大,所以泊松分布在這里就不適用,而根據(jù)中心極限定理我們完全可以用正態(tài)分布來近似替代。
解:設X表示10000盞燈中同時開著的燈的數(shù)量,則X~B(10000,0.7)
由中心極限定理知,X~N(7000,2100)
所以,P(6800 =?椎0(■)-?椎0(■) =?椎0(4.36)-?椎0(-4.36)=2?椎0(4.36)-1=0.99998 通過這個例子我們看到,利用中心極限定理將二項分布轉換為其極限分布(正態(tài)分布)可以更方便快捷的得到概率。 3.小結 通過本文的總結,我們將學生容易搞混的幾個分布進行對比探討,發(fā)現(xiàn)他們的區(qū)別與聯(lián)系:二項分布中,當n充分大,p充分小時,泊松分布是它的極限分布;當n充分大(p并不?。r,正態(tài)分布是其極限分布。實際應用中,當參數(shù)比較大時,概率的計算概率并不簡單,然而,通過其極限分布近似替代二項分布便可以簡化計算。 參考文獻: [1]茆詩松等.概率論與數(shù)理統(tǒng)計[M]. 北京:高等教育出版社,2004. [2]龍永紅.概率論與數(shù)理統(tǒng)計[M]. 北京:高等教育出版社,2009. 作者簡介: 張愛麗(1984.11-),女,漢族,陜西鳳翔人,博士,講師,研究方向:數(shù)理金融。