彭東海
(中山職業(yè)技術(shù)學院,中山 528404)
泊松分布是概率論與數(shù)理統(tǒng)計中一類重要的計數(shù)模型,由法國數(shù)學家Poisson[1]在研究二項分布當事件發(fā)生的概率p很小、試驗次數(shù)n很大的情況下推導出的極限分布,常用于模擬單位時間或空間內(nèi)稀有事件發(fā)生的總次數(shù)的分布模型,如單位時間內(nèi)來到某公共設(shè)施要求給予服務(wù)的顧客數(shù)、機器出現(xiàn)故障的次數(shù)、保險公司收到的索賠次數(shù)等,它的定義如下:
定義1[2]:設(shè)隨機變量X所有可能取值為0,1,2,…,而取各個值的概率為:
其中λ>0是常數(shù),則稱X服從參數(shù)為λ的泊松分布,記為X~P()λ。
泊松分布的一個重要性質(zhì)是它的數(shù)學期望和方差都等于參數(shù)λ。稱為等離散(equal dispersion),因此實際問題中對計數(shù)資料能否選用泊松分布進行模擬的首要條件是看樣本均值與方差是否近似相等,即需要進行過離散度(over dispersion)檢驗,最常用的過離散度檢驗由B?ning提出的O統(tǒng)計量[3]的計算為:
其中S2,分別表示泊松分布的樣本方差與樣本均值。文獻[3]指出利用文獻[4]的結(jié)果可得在總體為泊松分布條件下
有:
再利用卡方分布與正態(tài)分布的關(guān)系可得:
即O統(tǒng)計量具有漸近正態(tài)性。
下文,我們將利用多維向量的中心極限定理及delta方法給出在泊松分布條件下O統(tǒng)計量的漸近正態(tài)性的一種簡便證明。
引理1[5]:記,設(shè)
其中:
引理2:設(shè)隨機變量X服從參數(shù)為λ的泊松分布,則X的前4階原點矩分別為:
文獻[6]給出了計算泊松分布的高階矩的兩個遞推公式,此處,我們利用文獻[7]中的定理3.6.8(Hwang)等式可得到一個新的遞推公式。
證明:由[7]中定理3.6.8(Hwang)等式:
其 中 函 數(shù) g(x)滿 足, 且可知,若取,則有:
從而有:
即:
因此可得:
定理:從參數(shù)為λ的泊松分布總體中抽取容量為n的樣本X1,X2,…,Xn,記:
則有:
其中:
因此可得:
由多維隨機向量的中心極限定理可知:
即:
取則易知g關(guān)于t1,t2有連續(xù)的一階偏導數(shù),且:
根據(jù)引理1有:
其中:
而:
從而有:
由于,因此由 Slutsky 公式可得:
而,因此:
證畢。
參考文獻:
[1]Cameron AC,Trivedi P.Regression Analysis of Count Data[M].Oxford University Press,1998.
[2]何遠江,區(qū)景祺,尹小玲.概率統(tǒng)計引論[M].北京:高等教育出版社,2010:46-47.
[3]B?ning D.A Note on Test for Poisson Overdispersion[J].Biometrika,1994(81):418-419.
[4]Hoel,P.G..On Indices of Dispersion[J].Ann.Math.Statist,1943(14):155-162.
[5]茆詩松,王靜龍,濮曉龍.高等數(shù)理統(tǒng)計(第二版)[M].北京:高等教育出版社,1998:110-112.
[6]于晶賢,李金秋.泊松分布高階原點矩的兩種計算方法[J].數(shù)學的實踐與認識,2010(11):221-224.
[7]George Casella,Roger L.Berger.統(tǒng)計推斷(英文版,原書第2版)[M].北京:機械工業(yè)出版社,2002:126-127.