吳志超,程義斌,孫 波,郭寶才
(1. 浙江工商大學統(tǒng)計與數(shù)學學院,浙江 杭州 310018; 2. 中國疾病預防控制中心環(huán)境與健康相關產(chǎn)品安全所,北京100021)
總體參數(shù)的區(qū)間估計是統(tǒng)計推斷的一個重要內(nèi)容,已廣泛應用于經(jīng)濟與生產(chǎn)實踐.衡量置信區(qū)間的優(yōu)良性有兩個標準:置信水平和區(qū)間長度.給定置信水平,區(qū)間長度越短,參數(shù)估計精度就越高.傳統(tǒng)的區(qū)間估計是按概率對稱方法來選取的,即等尾置信區(qū)間.但對于偏態(tài)總體或偏態(tài)抽樣分布而言,等尾置信區(qū)間長度顯然不是最短的.有許多學者針對最短置信區(qū)間問題進行了相關研究.如文獻[1-3]對正態(tài)總體方差的最短置信區(qū)間進行了比較詳細的討論.王秀麗[4]介紹了均勻分布區(qū)間長度的最短置信區(qū)間.徐美萍等[5]對Weibull分布中尺度參數(shù)的最短置信區(qū)間問題進行了研究.李廣正[6]討論了兩正態(tài)總體方差比的最短置信區(qū)間問題.李云飛等[7]利用樣本分位數(shù)來構造樞軸量,給出了雙參數(shù)指數(shù)分布的等尾置信區(qū)間.
Maxwell分布是可靠性統(tǒng)計和實踐中常見的壽命分布之一,制造行業(yè)、立式鏜床的使用壽命等均遵循該偏態(tài)分布,在統(tǒng)計動力學中也有諸多應用.國內(nèi)學者對這一問題的研究比較少.桂春燕[8]給出了Maxwell分布的一些特性,但沒有討論參數(shù)估計的問題.王曉紅等[9]在文獻[8]的基礎上給出了Maxwell分布參數(shù)的極大似然估計和Bayes估計.文獻[10-13]構建了統(tǒng)計質量控制圖監(jiān)控Maxwell分布尺度參數(shù)的變化.
就筆者所知,還沒有文獻討論Maxwell分布參數(shù)的最短置信區(qū)間問題.本文將構建樞軸量來計算Maxwell分布尺度參數(shù)的最短置信區(qū)間,并與傳統(tǒng)的等尾置信區(qū)間進行比較.最后用一個實例進行分析和說明.
若隨機變量X的概率密度函數(shù)為
則稱X服從參數(shù)為σ的Maxwell分布,記作X~Maxwell(σ).
引理1設X1,X2,…,Xn為來自總體X的簡單隨機樣本,那么σ2的極大似然估計為
(1)
引理2設總體X~Maxwell(σ),那么X2/2σ2服從形狀參數(shù)為3/2、尺度參數(shù)為1的伽馬分布,即X2/2σ2~Gamma(3/2,1).
(2)
即T的概率密度函數(shù)為
(3)
本文將T用作樞軸量來求解σ2的置信區(qū)間.
設X1,X2,…,Xn為來自總體X~Maxwell(σ)的樣本,若統(tǒng)計量L(X1,X2,…,Xn)和U(X1,X2,…,Xn)滿足
P(L<σ2
(4)
則稱(L,U)為σ2的置信水平為1-α的置信區(qū)間.因為
所以式(4)等價于
(5)
(6)
由于樞軸量T的分布并不對稱,因此σ2的等尾置信區(qū)間長度不是最短的,從而精度也不是最高的.圖1表示在不同的n下樞軸量T的圖像.
圖1 不同樣本容量下樞軸量T的概率密度曲線Fig.1 Probability density curves of T under different values of n
(7)
定理1設總體X服從Maxwell(σ),X1,X2,…,Xn為來自該總體的樣本,條件極值問題(7)中的a,b應滿足下列方程:
(8)
證明利用拉格朗日數(shù)乘法,令
H(a,b,λ)=1/a-1/b+λ[FT(b)-FT(a)-1+α],
對a,b分別求偏導數(shù)并令其為0,有
于是
a2fT(a)=b2fT(b)=-1/λ.
(9)
將樞軸量T的概率密度函數(shù)fT(t)代入式(9),化簡得a1+3n/2e-a=b1+3n/2e-b,因此結論成立.
定理2Maxwell分布參數(shù)的最短置信區(qū)間存在.
令g′(w)=0,則有
其中w0=1+3n/2.即g(w)為單峰函數(shù),當0
因為
由中值定理知:必存在a=a*(0w0),則(a*,b*)必為方程組(7)的最優(yōu)解.證畢.
定理3Maxwell分布參數(shù)的最短置信區(qū)間是唯一的.
因為
a*2fT(a*)=b*2fT(b*)=-1/λ*>0,a*<3n/2+1
所以
同理,
由于式(8)的復雜性,方程組沒有分析解.本文利用MATLAB來求方程組的數(shù)值解,樣本容量為n∈{2,3,…,20},結果如表1所示.
表1 σ2最短置信區(qū)間的精度分析Tab.1 The accuracy analysis of the shortest confidence interval for σ2
由表1可觀察到,在同一置信水平下,最短置信區(qū)間的精度一致優(yōu)于傳統(tǒng)的等尾置信區(qū)間,特別是在小樣本情況下,提升效果更顯著.隨著樣本容量的增大,兩者的差異性越來越小.
采用的實際數(shù)據(jù)來源于文獻[13].選取32個垂直鉆孔機數(shù)據(jù),立式鏜床的故障時間(h)如下:2 802,2 937,2 136,4 359,4 020,1 781,2 816,2 655,3 886,2 296,3 158,3 695,4 155,3 811,2 380,376,2 172,3 705,2 848,4 339,2 076,2 672,3 632,1 976,1 700,1 596,1 701,3 575,3 802,4 351,4 291,808.
文獻[13]已證明Maxwell分布最適合此數(shù)據(jù).
兩者的絕對誤差為44 441.3,相對誤差為2.45%.最短置信區(qū)間明顯小于等尾置信區(qū)間,說明最短置信區(qū)間的精度更高.