羅修輝,韋程東,王一茸
(廣西師范學(xué)院 數(shù)學(xué)與統(tǒng)計學(xué)院,南寧 530023)
大數(shù)定律決定了傳統(tǒng)的概率統(tǒng)計在進行可靠性分析時,需要有足夠的樣本容量來對未知分布特征進行估計,然而在工程實踐中、特殊產(chǎn)品壽命分析或者在對高科技新型裝備進行可靠性分析時,往往產(chǎn)生的是珍貴的小樣本(在工程實踐中,一般以樣本容量n≤30為小樣本),此時數(shù)據(jù)少的問題就顯得極為突出。在此情況下,如果將大樣本理論引用到對小樣本可靠性分析時,顯然會導(dǎo)致估計精度降低,使得可靠性分析不那么可靠。因此,如何在小樣本情況下估計所研究未知分布的可靠性參數(shù)是一個急需解決的問題。
目前,小樣本可靠性參數(shù)估計主要有Bayes方法、Bayes Bootstrap方法和蒙特卡羅仿真方法[1-4]。但大多數(shù)文獻都是基于正態(tài)分布進行研究的,而在大多情況下典型的可靠性分布都是非正態(tài)的,因而基于其他分布下去研究可靠性參數(shù)估計是非常必要的,本文正是在小樣本條件下研究指數(shù)分布可靠性的參數(shù)估計。
當(dāng)產(chǎn)品可靠性能指標X~Exp(λ)且任務(wù)要求X≤x時,產(chǎn)品可靠度可由式(1)計算:
其中F(x)為指數(shù)分布的分布函數(shù),I{A}表示A的示性函數(shù)。
由于參數(shù)λ真值無法獲取,于是,在估計產(chǎn)品的可靠度時,首先需要通過樣本對參數(shù)λ進行估計。
所以有λ=1/EX,故λ的矩估計為:
在指數(shù)分布中,有時記θ=1/λ,則θ為指數(shù)分布的數(shù)學(xué)期望。
另外,又因為:
由此可得X方差為:
所以,根據(jù)替換原理,λ的矩估計也可以取為:
其中s為樣本標準差。由此可得到不同的矩估計,這是矩估計的一個缺點。為了計算簡便,此時應(yīng)該選用低階矩來估計。
例1:由指數(shù)分布Exp(3),產(chǎn)生如下10個來自該分布的樣本數(shù)據(jù),0.920、0.143、0.1268、0.146、1.136、0.217、0.678、0.022、0.0004、0.0966,可認為是產(chǎn)品某性能指標服從Exp(3)的10個樣本,其樣本均值=0.349,現(xiàn)要求產(chǎn)品的性能指標不大于1.5時,根據(jù)式(3)可計算λ的估計值為=1/=2.865 ,再依據(jù)公式(1)可計算其可靠性為=0.9864。
對指數(shù)總體Exp(λ)設(shè)有樣本,則其似然函數(shù)為:
其對數(shù)似然函數(shù)為:
將lnL()λ關(guān)于λ求導(dǎo)并令其為0得到似然方程:
解之得:
由于:
于是,是極大值點。
所以,=1/是λ的極大似然估計。這與式(3)的矩估計結(jié)果一致。
經(jīng)典學(xué)派方法是根據(jù)總體信息和樣本信息進行統(tǒng)計推斷;而貝葉斯方法與經(jīng)典學(xué)派方法主要不同之處在于:還需利用先驗信息進行統(tǒng)計推斷。其基本步驟如下:
(1)總體依賴于未知參數(shù)θ的概率密度函數(shù)為p(x|θ),其表示θ取某個值時總體的條件概率密度函數(shù)。
(2)確定θ的先驗分布 π(θ)。
(3)分兩步產(chǎn)生樣本X=(x1,x2,…,xn),首先從 π(θ)中產(chǎn)生θ0,然后再從p(x|θ0)中產(chǎn)生X=(x1,x2,…,xn),由此可得到X的聯(lián)合條件概率密度函數(shù)為:
它包含了總體信息和樣本信息。
(4)由于按上述方法得到的θ0還是未知量,所以仍需兼顧其他可能的θ值,即要用π()θ進行綜合,這樣可得樣本X與未知參數(shù)θ的聯(lián)合分布為:
這個聯(lián)合分布包含了上述三種信息。
(5)將h(X,θ)作如下分解:
其中m(X)是X的邊際概率函數(shù):
由此可以得到參數(shù)θ的后驗分布計算公式:
(6)選取后驗分布均值:
或后驗分布的其他特征量做估計。但是根據(jù)以下定理,一般選取后驗分布均值作為參數(shù)θ的估計量。
定理1[5]:設(shè)損失函數(shù)L(θ,a)=(θ-a)2,且Eθ2<∞則:
為參數(shù)θ唯一的Bayes估計。
仍然以指數(shù)分布為例,討論其參數(shù)λ的Bayes估計。設(shè)X1,X2,…,Xni.i.d.~Exp(λ)。取θ的共軛先驗分布為伽瑪分布 Γ(b,α),其中超參數(shù)b,α已知,求λ的Bayes估計。
設(shè)X=( )X1,X2,…,Xn,則X的密度函數(shù)為:
從而λ的似然函數(shù)為:
其中∝的含義是:其余因子與λ無關(guān),而λ的共軛先驗分布為 Γ(b,α),即:
則λ的后驗分布:
添加正則化常數(shù)后,得到:
此后驗分布為伽瑪分布Γ( )n+b,nx+α。
故由定理1可知,取λ后驗期望估計為其Bayes估計:
仍然采用例1的數(shù)據(jù),根據(jù)以上推導(dǎo),運用Open BUGS軟件采用Gibbs抽樣法抽取10000個樣本編程對其可靠性進行MCMC模擬可以得到=3.006,其可靠性估計值為R=0.9889。其參數(shù)迭代過程及參數(shù)分布圖如圖1和圖2所示。
圖1 Bayes參數(shù)估計迭代圖
圖2 Bayes方法參數(shù)分布圖
Bootstrap方法最早是由斯坦福大學(xué)教授Efron于1977年提出的。此方法認為經(jīng)驗分布函數(shù)能夠較好地擬合總體分布,但在小樣本條件下,其擬合效果可能會比較嚴重,導(dǎo)致過大的估計誤差,因而可以考慮通過再抽樣來增加樣本量。Bayes Bootstrap方法(亦稱為隨機加權(quán)法),它的基本思想是:通過隨機加權(quán)來擴充小樣本的樣本量,以此對參數(shù)進行估計。這兩種方法都是通過計算機模擬,從小樣本中抽取再生樣本來獲得大樣本,由此對未知分布進行模擬。
下面是Bootstrap方法的基本步驟:
(2)從Fn中抽取N組自助樣本具體方法為:
①從[0,M](M>>n)中產(chǎn)生隨機整數(shù)η,其必須滿足獨立性和均勻性的要求。
②令i=η%n,i為n整除η得到的余數(shù)。
③從原生樣本中以xi作為再抽樣本x*,其中xi為與i對應(yīng)下標的觀測樣本,則x*可作為所需的隨機樣本。
(3)計算以下的自助統(tǒng)計量:
(4)用Rn(在給定經(jīng)驗分布Fn的條件下)的分布去模擬Tn的分布。即有,于是可得到N個,由此可求出θ的分布和特征量。
將Rn換成隨機加權(quán)統(tǒng)計量:
沿用例1的數(shù)據(jù),不考慮先驗信息的情況下,由于樣本量n=10。設(shè)Fn是樣本X的經(jīng)驗分布函數(shù),=1/是指數(shù)分布F參數(shù)的估計。則估計誤差:
構(gòu)造并產(chǎn)生N=10000組自助統(tǒng)計量:
圖3 Bootstrap方法參數(shù)分布圖
表1 評估結(jié)果比較表
構(gòu)造并產(chǎn)生N=10000組自助統(tǒng)計量:
由Bayes Bootstrap方法估計參數(shù)λ得到其服從的分布如圖4所示,其估計值見表1。
圖4 Bayes Bootstrap方法參數(shù)分布圖
通過表1所列結(jié)果,可以看出貝葉斯方法和Bayes Bootstrap方法相對于另外兩種方法對可靠性的估計結(jié)果更為精確。但是本算例中貝葉斯方法是基于伽瑪分布的先驗信息情況下進行的統(tǒng)計推斷,然而實際的可靠性分析中先驗信息不一定容易獲得,此時Bayes Bootstrap就體現(xiàn)出了其優(yōu)勢。另外,由圖3和圖4發(fā)現(xiàn)由Bootstrap和Bayes Bootstrap方法估計得到的參數(shù)仿真曲線符合伽瑪分布概率函數(shù)曲線,這與λ的后驗分布一致,這也給我們提供了在沒有先驗信息情況下,如何運用Bayes方法提供了一種思路,即先用Bootstrap和Bayes Bootstrap方法模擬出參數(shù)估計的分布概率密度曲線,以此確定先驗分布的形式,然后再運用Bayes方法進行估計。因此,在具體分析中,幾種方法綜合運用能起到更好的估計效果。
本文以指數(shù)分布為例對小樣本情況下的可靠性參數(shù)估計問題進行了對比研究,并通過數(shù)值模擬說明了算法的有效性。模擬結(jié)果表明,在具有先驗信息情況下,Bayes方法和Bayes Bootstrap方法更為適用;并給出了在沒有先驗信息情況下,Bayes方法和Bayes Bootstrap方法結(jié)合使用的思路。但是如何通過改進Bootstrap方法擴充樣本容量來提高估計的精度還有待進一步的研究。
[1]Efron B.The Jackknife,the Bootstrap and other Resampling Plans[M].Philadelphia:SIAM,1982.
[2]孫慧玲,胡偉文.小樣本條件下參數(shù)估計方法比較研究[J].統(tǒng)計與決策,2014,(24).
[3]馬智博,朱建士,徐迺新.有關(guān)正態(tài)分布的小樣本可靠性評估[J].核科學(xué)與工程,2003,23(4).
[4]曹軍海,杜海東,申瑩.基于改進Bayes-Bootstrap方法的系統(tǒng)可靠性仿真評估[J].裝甲兵工程學(xué)院學(xué)報,2016,30(1).
[5]陸璇.數(shù)理統(tǒng)計基礎(chǔ)[M].北京:清華大學(xué)出版社,1998.