顧蓓青,王蓉華,徐曉嶺
(1.上海對(duì)外經(jīng)貿(mào)大學(xué) 統(tǒng)計(jì)與信息學(xué)院,上海 201620;2.上海師范大學(xué) 數(shù)理學(xué)院,上海200234)
設(shè)隨機(jī)變量X服從位置參數(shù)μ、刻度參數(shù)λ的兩參數(shù)Cauchy分布(記為C(μ,λ)),其密度函數(shù)f(x)和分布函數(shù)F(x)分別為:
Cauchy分布因其期望和方差都不存在而受到廣泛關(guān)注,其在物理學(xué)等眾多領(lǐng)域也有著十分重要的應(yīng)用價(jià)值。關(guān)于Cauchy分布的一些特別性質(zhì),可查閱文獻(xiàn)[1-3]。同時(shí),也有很多文獻(xiàn)對(duì)Cauchy分布的參數(shù)估計(jì)問(wèn)題進(jìn)行了一些研究。文獻(xiàn)[4]討論了矩估計(jì)和極大似然估計(jì)等一些常用的點(diǎn)估計(jì)方法對(duì)Cauchy分布C(μ,1)并不適用,從而提出了利用中位數(shù)的方法得到參數(shù)μ的估計(jì)。文獻(xiàn)[5]通過(guò)局部矩估計(jì)的方法得到Cauchy分布C(0,λ)的參數(shù)λ的點(diǎn)估計(jì)與區(qū)間估計(jì),同時(shí)也說(shuō)明了該方法的局限性。文獻(xiàn)[6]給出了Cauchy分布C(μ,λ)的兩個(gè)參數(shù)的分位數(shù)估計(jì)。文獻(xiàn)[7]在全樣本場(chǎng)合下研究了兩參數(shù)Cauchy分布C(μ,λ)的點(diǎn)估計(jì)與區(qū)間估計(jì)。
本文給出了兩參數(shù)Cauchy分布C(μ,λ)在全樣本場(chǎng)合下參數(shù)的區(qū)間估計(jì)和定數(shù)截尾場(chǎng)合下參數(shù)的點(diǎn)估計(jì)與區(qū)間估計(jì)方法,并通過(guò)Monte-Carlo模擬考察了點(diǎn)估計(jì)與區(qū)間估計(jì)的精度。
設(shè)X1,X2,…,Xn為來(lái)自總體X~C(μ,λ)的一個(gè)容量為n的簡(jiǎn)單隨機(jī)樣本,其樣本觀察值記為x1,x2,…,xn,次序統(tǒng) 計(jì) 量 記 為X(1)≤X(2)≤ … ≤X(n),其 次 序 觀 察 值 記 為則Y~C(0,1),而Y1,Y2,…,Yn與來(lái)自標(biāo)準(zhǔn) Cauchy 分布C(0,1)總體的容量為n的一個(gè)簡(jiǎn)單隨機(jī)樣本同分布,將其從小到大排序記為:Y(1),Y(2),…,Y(n)。
令μ的函數(shù)
其中,若n為偶數(shù)若n為奇數(shù)時(shí),
于是?(μ)是僅含有參數(shù)μ的樞軸量,又?(μ)為μ的嚴(yán)格單調(diào)增函數(shù),且:
由此,給定顯著性水平α,樞軸量)的上側(cè)1-α/2,α/2分位數(shù)記為和,通過(guò)Monte-Carlo模擬可以得到不同樣本容量所對(duì)應(yīng)的樞軸量)的上側(cè)分位數(shù)值。從而,參數(shù)μ的置信水平1-α的區(qū)間估計(jì)為:
構(gòu)造如下僅含有參數(shù)λ的樞軸量:
又:
于是T(λ)是僅含有參數(shù)λ的樞軸量,又T(λ)是λ的嚴(yán)格單調(diào)減函數(shù)。
給定顯著性水平α,樞軸量T(λ)的上側(cè)1-α/2,α/2分位數(shù)分別記為T(mén)1-α/2和,通過(guò)Monte-Carlo模擬可以得到不同樣本容量所對(duì)應(yīng)的樞軸量T(λ)的上側(cè)分位數(shù)值。從而,參數(shù)λ的置信水平1-α的區(qū)間估計(jì)為:
給定置信水平1-α=0.90 ,取樣本容量n=10(5)30 ,參數(shù)真值取為μ=-5,0,5,λ=0.5,通過(guò)1000次Monte-Carlo模擬得參數(shù)μ,λ的區(qū)間估計(jì)的平均下限、平均上限和平均區(qū)間長(zhǎng)度,同時(shí)統(tǒng)計(jì)1000次模擬所得的區(qū)間估計(jì)包含參數(shù)真值的次數(shù),結(jié)果如表1所示,從中可以看到上述所給出的求區(qū)間估計(jì)的方法是可行的。
表1 參數(shù)μ,λ的區(qū)間估計(jì)
設(shè)X(1),X(2),…,X(r)為來(lái)自總體X~C(μ,λ)的一個(gè)容量為n的前r個(gè)次序統(tǒng)計(jì)量,其次序觀察值記為則Y~C(0,1),而Y(1),Y(2),…,Y(r)與來(lái)自標(biāo)準(zhǔn) Cauchy分布C(0,1)總體的容量為n的前r個(gè)次序統(tǒng)計(jì)量同分布。
注意到,如給定0<p<1,由文獻(xiàn)[8]可知樣本的p分位數(shù)X*(p)可定義為:
其中,<pn>為pn的整數(shù)部分。
進(jìn)而參數(shù)μ的點(diǎn)估計(jì)為:
則參數(shù)λ的點(diǎn)估計(jì)為:
進(jìn)而參數(shù)μ的點(diǎn)估計(jì)為:
其中[]表示取整函數(shù)。
由于該情況下的樣本量較少,估計(jì)的效果不甚理想,會(huì)受到樣本值的影響,在此僅舉一模擬算例說(shuō)明該方法的應(yīng)用:取n=20,r=4,參數(shù)真值取μ=0,λ=1,通過(guò)Monte-Carlo模擬產(chǎn)生的一組截尾樣本為-4.2946,-4.2491,-1.9168,-0.92,則?=0.0207 ,?=0.6835 。
取樣本容量n=10(5)30以及定數(shù)截尾數(shù)r,參數(shù)真值取μ=0,λ=1,通過(guò)10000次模擬得到參數(shù)μ,λ的點(diǎn)估計(jì)的均值與均方差,結(jié)果列于表2。
表2 參數(shù)μ,λ的點(diǎn)估計(jì)
2.2.1 參數(shù)μ的區(qū)間估計(jì)
令μ的函數(shù)
其中,若r為偶數(shù)若n為奇數(shù)時(shí),
于是?(μ)是僅含有參數(shù)μ的樞軸量,又?(μ)為μ的嚴(yán)格單調(diào)增函數(shù),且:
由此,給定顯著性水平α,樞軸量)的上側(cè)1-α/2,α/2分位數(shù)記為和,通過(guò)Monte-Carlo模擬可以得到不同樣本容量n和定數(shù)截尾數(shù)r所對(duì)應(yīng)的樞軸量?(μ)的上側(cè)分位數(shù)值。從而,參數(shù)μ的置信水平1-α的區(qū)間估計(jì)為:
2.2.2 參數(shù)λ的區(qū)間估計(jì)
構(gòu)造如下僅含有參數(shù)λ的樞軸量:
又:
于是T(λ)是僅含有參數(shù)λ的樞軸量,又T(λ)是λ的嚴(yán)格單調(diào)減函數(shù)。
給定顯著性水平α,樞軸量T(λ)的上側(cè)1-α/2,α/2的分位數(shù)分別記為和,通過(guò)Monte-Carlo模擬可以得到不同樣本容量n和定數(shù)截尾數(shù)r所對(duì)應(yīng)的樞軸量T(λ)的上側(cè)分位數(shù)值。從而,參數(shù)λ的置信水平1-α的區(qū)間估計(jì)為:
2.2.3 模擬分析
給定置信水平1-α=0.90,取樣本容量n和定數(shù)截尾數(shù)r,參數(shù)真值取為μ=1,λ=1,通過(guò)1000次Monte-Carlo模擬得參數(shù)μ,λ的區(qū)間估計(jì)的平均下限、平均上限和平均長(zhǎng)度,同時(shí)統(tǒng)計(jì)1000次模擬所得的區(qū)間估計(jì)包含參數(shù)真值的次數(shù),結(jié)果如表3所示。
例1:文獻(xiàn)[5]提供了如下算例,取樣本容量n=10,刻度參數(shù)λ的真值取為5,通過(guò)Monte-Carlo模擬產(chǎn)生10個(gè)服從C(0,λ)分布的隨機(jī)數(shù)如下:
2.3008 ,3.9756,-6.4165,11.9341,16.4812,-0.2428,-7.9044,-6.3136,14.5784,-1.9155
文獻(xiàn)[5]得到了參數(shù)λ的局部矩估計(jì)為:?=5.0953;利用文獻(xiàn)[7]的方法可以得到:μ的點(diǎn)估計(jì)為?=X*(0.5)=1.029 ,λ的點(diǎn)估計(jì)為=X*(0.5)-X*(0.25)=7.3426 ,=X*(0.75)-X*(0.5)=10.9051,=5.6939;利用本文方法可以得到:在置信水平1-α=0.90下,μ的區(qū)間估計(jì)為[- 4.4215,9.0711] ,λ的區(qū)間估計(jì)為[0 . 1705,6.5199] 。
例2:取樣本容量n=30,定數(shù)截尾數(shù)r=26,通過(guò)Monte-Carlo模擬產(chǎn)生一組服從C(3,2)分布的隨機(jī)數(shù)如下:
-3.71106,-2.40515,-1.21566,-0.424847,0.296015,0.518243,0.744813,1.49002,1.90678,1.98354,1.99277,2.27703,2.47186,2.86832,2.8724,3.02303,3.27706,3.3678,3.69184,4.29,4.54302,4.63784,4.91429,5.53984,7.47502,8.44948
利用本文方法可以得到:μ的點(diǎn)估計(jì)為?=X*(0.5)=2.9477 ,λ的點(diǎn)估計(jì)為?=X*(0.75)-X*(0.5)=1.9666 ,在置信水平1-α=0.90下,μ的區(qū)間估計(jì)為[2 . 2743,4.4547] ,λ的區(qū)間估計(jì)為[0 .0383,2.0716] 。
針對(duì)兩參數(shù)Cauchy分布C(μ,λ),在全樣本場(chǎng)合下通過(guò)構(gòu)造樞軸量分別得到參數(shù)μ和λ的區(qū)間估計(jì),通過(guò)Monte-Carlo模擬考察了區(qū)間估計(jì)的精度,從模擬結(jié)果來(lái)看,該區(qū)間估計(jì)方法具有可行性。此外,在定數(shù)截尾場(chǎng)合下,通過(guò)分位數(shù)得到參數(shù)μ和λ的點(diǎn)估計(jì),并利用樞軸量法得到參數(shù)μ和λ的區(qū)間估計(jì),同時(shí)通過(guò)Monte-Carlo模擬分別考察了點(diǎn)估計(jì)與區(qū)間估計(jì)的精度,從模擬結(jié)果來(lái)看,點(diǎn)估計(jì)和區(qū)間估計(jì)的方法都是可行的。最后,通過(guò)兩個(gè)模擬算例說(shuō)明了本文方法的應(yīng)用。