徐圣楠,張桂穎,劉洋萍
在統(tǒng)計(jì)學(xué)中,由于Pareto 分布具有遞減的失效率函數(shù),故能較好地描述股票價(jià)格和微信流量波動(dòng).文獻(xiàn)[1]通過(guò)實(shí)證分析驗(yàn)證了廣義Pareto 分布能夠較好地刻畫(huà)保險(xiǎn)公司每年的最大索賠損失金額;文獻(xiàn)[2-3]分別通過(guò)貝葉斯和極大似然估計(jì)法研究了Pareto 分布的參數(shù)估計(jì)問(wèn)題.數(shù)據(jù)缺失是統(tǒng)計(jì)工作中的常見(jiàn)問(wèn)題,文獻(xiàn)[4-7]分別研究了兩種離散型和連續(xù)型分布總體的估計(jì)問(wèn)題;文獻(xiàn)[8]利用MLE 算法研究了在丟失部分樣本數(shù)據(jù)時(shí)Pareto分布的參數(shù)估計(jì)問(wèn)題.本文以高等數(shù)理統(tǒng)計(jì)學(xué)為理論基礎(chǔ),進(jìn)一步分析缺失數(shù)據(jù)下混合Pareto 分布總體的參數(shù)估計(jì)問(wèn)題,通過(guò)建立矩估計(jì)方程組,解出未知參數(shù)的估計(jì)值.然后,驗(yàn)證估計(jì)量是否具有相合性和漸近正態(tài)性.最后,對(duì)估計(jì)結(jié)果進(jìn)行隨機(jī)模擬,說(shuō)明估計(jì)的可行性.
假設(shè)混合Pareto 分布,其密度函數(shù)為:
其中:設(shè)定門(mén)限參數(shù)α> 0.其次,分別取形狀參數(shù)θi> 0(i=1,2)為總體的未知參數(shù).然后,對(duì)兩個(gè)混合Pareto 分布進(jìn)行n次獨(dú)立觀測(cè),抽取分布總體做樣本觀測(cè)時(shí),記1-P為丟失樣本時(shí)的概率.最后,用(Xi,δi)表示混合Pareto 分布的第i個(gè)總體觀測(cè)值,Xi表示該分布總體的第i個(gè)樣本觀測(cè)值,i=1,2,…,n.若缺少第i個(gè)樣本值記δi=0,反之記δi=1.
下面考慮θ1,θ2的矩估計(jì).根據(jù)得到的樣本觀測(cè)值(Xi,δi),i=1,2,…,n,建立矩估計(jì)方程
解方程得
其中:
由上述參數(shù)的矩估計(jì)結(jié)果,下面驗(yàn)證,的相合性和漸近正態(tài)性.
證明{Xiδi,1
并且
即
同理得到
于是有
其中:
引理1[9]記Tn=(T1n,T2n,…,Tkn)T,α=(α1,α2,…,αk)T,設(shè)∑=(δij)k×k,又設(shè)g(t1,t2,…,tk)對(duì)各ti有連續(xù)偏導(dǎo)數(shù),則當(dāng)n→∞時(shí),有
其中:δ2=
定理2 在前面記號(hào),有
證明 令Wi=(δi,δiXi,δiXi2)T,{Wi,i≥1}為獨(dú)立同分布隨機(jī)變量序列,從而
令∑=E(W1-EW1)(W1-EW1)T,于是利用多元中心極限定理得到
令
于是得出
根據(jù)引理1
同時(shí)
同理,令
依據(jù)引理1
其中
其中:
使用MATLAB 軟件進(jìn)行隨機(jī)模擬,驗(yàn)證此方法的可行性.設(shè)定門(mén)限參數(shù)α=2,混合概率q=0.4,分別給定樣本量n=100,n=300,n=500,缺失概率為1-P=0.01 的模擬研究結(jié)果如表1所示.
從表1可以看出,當(dāng)數(shù)據(jù)不完整時(shí),混合Pareto 分布的參數(shù)估計(jì)量具有漸近正態(tài)性.在給定θ1、θ2不同參數(shù)真值時(shí),進(jìn)行1 000 次隨機(jī)模擬比較兩參數(shù)的均方誤差,得到參數(shù)估計(jì)的誤差值不受樣本量大小的影響,并且和的均方誤差都在可接受范圍內(nèi),再次驗(yàn)證矩估計(jì)方法具有可行性.
表1 模擬結(jié)果
針對(duì)數(shù)據(jù)不完整情況下的混合Pareto 分布總體參數(shù)估計(jì)問(wèn)題,目前還很少有人研究.本文利用ME 算法證明了其優(yōu)良性,同時(shí)隨機(jī)模擬的結(jié)果也驗(yàn)證了其合理性.通過(guò)對(duì)本文的研究,為今后應(yīng)用Pareto 分布的相關(guān)性質(zhì)做了準(zhǔn)備.