王露
摘要:二項分布b(n,p)是一種應(yīng)用較為廣泛的離散型分布.在實際應(yīng)用中,常常需要對參數(shù)p進行估計;但當(dāng)總體參數(shù)p較小時,樣本中目標事件出現(xiàn)的頻率為0,此時對參數(shù)p采用傳統(tǒng)的矩估計具有一定的局限性,使其估計結(jié)果出現(xiàn)=0.針對這種局限性,本文提出一種基于二項分布的改進模型,該模型及其估計方法在一定程度上能克服傳統(tǒng)矩估計方法在處理參數(shù)p較小時的不足.
關(guān)鍵詞:二項分布;改進模型;參數(shù)估計
中圖分類號:O212? 文獻標識碼:A? 文章編號:1673-260X(2019)06-0009-02
1 引言
對于二項分布b(n,p)中抽取的樣本,若p較小,樣本中目標事件出現(xiàn)的頻率極低,甚至為0;此時該如何對總體參數(shù)p進行估計?利用傳統(tǒng)的矩估計和極大似然估計,得到的=0,該結(jié)果幾乎沒有意義,因為可能根據(jù)對事件的認知發(fā)現(xiàn)概率不可能為0;國內(nèi)外已有對二項分布中比例參數(shù)估計改進的相關(guān)研究,張學(xué)新[1]針對p值接近于0或1的極端情形下對17種置信區(qū)間的選擇方法進行比較.Alan Agresti[2]等人對分類數(shù)據(jù)分析中參數(shù)的最優(yōu)置信區(qū)間進行了探討.徐鵬鵬[3]針對二項分布應(yīng)用的局限性,通過構(gòu)造矩方程和極大似然方程可求出估計參數(shù).
2 二項分布的簡介
隨機試驗中僅有兩個結(jié)果A與A,且A發(fā)生的概率P(A)=p;對于該隨機試驗獨立重復(fù)進行n次,則稱為n重伯努利試驗.若以隨機變量X表示n重伯努利試驗事件發(fā)生的次數(shù),則在n重伯努利試驗中事件A發(fā)生k次的概率
P(X=k)=Cnkpk(1-p)n-k k=0,1…n
上式稱為二項分布[4],記為X~b(n,p).
對該模型中參數(shù)p進行估計,若采用傳統(tǒng)的矩估計和極大似然估計方法得出=(k表示樣本中目標事件發(fā)生的次數(shù)).
由于二項分布中概率計算的復(fù)雜和煩瑣性,尤其當(dāng)參數(shù)n較大時.針對二項分布在一些特殊情形下,有不同的近似計算方法.比如利用泊松定理、棣莫弗-拉普拉斯中心極限定理分別給出了二項分布的泊松近似、正態(tài)近似[1].
3 基于二項分布改進的模型
3.1 模型的構(gòu)建
在實際實驗中,由于試驗場地、人員、設(shè)備等條件的影響,試驗單元的個數(shù)受到了限制;假設(shè)一次試驗中有n個試驗單元;若這n個試驗單元中目標事件發(fā)生的次數(shù)獨立的服從b(n,p),上述試驗可以看作一次n伯努利試驗.若研究的目標事件發(fā)生概率極小,則在一次n重伯努利試驗中該事件未發(fā)生,此時若對參數(shù)p進行估計得到=0;根據(jù)對事件的認知,該事件發(fā)生的概率肯定不為0,可以得出該估計顯然不合理;例如,國外有一項研究在車險定價中需估計汽車保險杠在一次碰撞中脫落的概率,該事件發(fā)生的概率較小;若采用重復(fù)試驗的方式進行研究,重復(fù)試驗的次數(shù)會受到場地和設(shè)備的限制,會出現(xiàn)試驗已全部進行完目標事件仍未發(fā)生.
針對上述問題,本文構(gòu)建如下模型:
第1次n重伯努利試驗,若事件A發(fā)生的頻率為0;則進行第2次n重伯努利試驗,若事件A發(fā)生的為頻率0;則繼續(xù)進行第3次n重伯努利試驗……直到出現(xiàn)事件A發(fā)生的頻率不為0為止,記發(fā)生在第K次n重伯努利試驗.以隨機變量Y表示事件A在第K次n重伯努利試驗中發(fā)生的次數(shù).
假設(shè)事件發(fā)生的概率為p,各試驗單元之間是相關(guān)獨立的.離散型隨機變量Y的分布列可表示如下.
4 結(jié)語
二項分布是現(xiàn)實生活中常見的一種分布,應(yīng)用范圍較廣;實際應(yīng)用中涉及參數(shù)p的估計問題,傳統(tǒng)的矩估計和極大似然估計方法適用的范圍是參數(shù)p不宜過小.對于一些小概率事件傳統(tǒng)的矩估計和極大似然估計極易出現(xiàn)估計值為0,導(dǎo)致與現(xiàn)實不符.本文提出了一種基于二項分布的改進模型,在一定程度能克服傳統(tǒng)估計方法的不足.
參考文獻:
〔1〕張學(xué)新.極端頻率情形下二項分布比例置信區(qū)間的比較[J].重慶師范大學(xué)學(xué)報(自然科學(xué)版),2016,33(3):91-97.
〔2〕Agresti A,Coull B. Approximate better than‘exact’for Cls for binomial parameters[J].American Statistician,2008,52:119-126.
〔3〕徐鵬鵬,蘇本躍.改進二項分布的性質(zhì)及其應(yīng)用[J].安慶師范學(xué)院學(xué)報(自然科學(xué)版),2016,22(4):11-13.
〔4〕盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計[M].北京:高等教育出版社,2009.
〔5〕張艷.談二項分布的近似計算及其在保險問題中的應(yīng)用[J].雞西大學(xué)學(xué)報,2012(1):45-46.