唐 莉,程世娟,張曉潔,蔣玉婷
(1.西南交通大學(xué) 數(shù)學(xué)學(xué)院, 成都 611756; 2.西南交通大學(xué)希望學(xué)院 基礎(chǔ)部, 成都 610400)
科技的不斷進(jìn)步和新型材料的不斷出現(xiàn),使產(chǎn)品的壽命越來(lái)越長(zhǎng),這些高長(zhǎng)壽命產(chǎn)品在正常試驗(yàn)條件下在短時(shí)間內(nèi)的失效數(shù)據(jù)較少,這些小樣本攜帶的信息量不足以支撐傳統(tǒng)的統(tǒng)計(jì)分析。很多研究學(xué)者開始探索信息融合的方法,為小樣本可靠性評(píng)估提出了一些新的研究思路[1]。
王鳳飛等[2]通過(guò)融合歷史退化數(shù)據(jù)和失效壽命數(shù)據(jù),發(fā)現(xiàn)多源信息融合可以提高剩余壽命預(yù)測(cè)的準(zhǔn)確性。貝葉斯方法在信息融合計(jì)算方面有著廣泛應(yīng)用,基于貝葉斯理論,賈祥等[3]融合不同的專家經(jīng)驗(yàn)信息和壽命試驗(yàn)數(shù)據(jù)來(lái)擴(kuò)充可靠性信息;王博等[4]融合多類型研制試驗(yàn)數(shù)據(jù)來(lái)評(píng)估航天閥門的可靠性;Papananias等[5]融合不同來(lái)源和制造階段的數(shù)據(jù)和信息來(lái)提高產(chǎn)品質(zhì)量。為了提高融合的精準(zhǔn)度,有學(xué)者考慮在進(jìn)行數(shù)據(jù)融合之前,先對(duì)信息源給予一個(gè)加權(quán)處理,比如,王保昌等[6]基于相關(guān)函數(shù)的多源信息融合方法實(shí)現(xiàn)了多個(gè)驗(yàn)前分布的融合;文獻(xiàn)[7-10]分別采用自適應(yīng)加權(quán)數(shù)據(jù)融合、利用指數(shù)衰減函數(shù)度量傳感器觀測(cè)值的相互支持程度、通過(guò)定義一致性和可靠性測(cè)度進(jìn)行數(shù)據(jù)融合權(quán)值分配、提出一種基于最優(yōu)權(quán)值的數(shù)據(jù)加權(quán)融合等方法,實(shí)現(xiàn)了傳感器信息數(shù)據(jù)的加權(quán)融合。張金槐[11]提出了產(chǎn)品驗(yàn)前信息和現(xiàn)場(chǎng)信息進(jìn)行融合的可信度加權(quán)融合方法;Zhang等[12]提出了一種新的加權(quán)數(shù)據(jù)融合方法,該方法可以計(jì)算多組先驗(yàn)數(shù)據(jù)的定量可信度。對(duì)先驗(yàn)信息的加權(quán)融合有了較深研究后,邵松世等[13]采用似然權(quán)重系數(shù)對(duì)不同來(lái)源可靠性信息的可信程度進(jìn)行了量化,再基于貝葉斯方法實(shí)現(xiàn)了多源先驗(yàn)信息的融合及可靠性分析。
以上研究解決了多個(gè)先驗(yàn)信息如何進(jìn)行加權(quán),再與現(xiàn)場(chǎng)信息進(jìn)行融合的問(wèn)題,但是其研究?jī)H考慮了不同先驗(yàn)分布的權(quán)重,對(duì)于多個(gè)不同信息源數(shù)據(jù)信息的變權(quán)融合研究甚少。Berger指出先驗(yàn)分布對(duì)離群值有較好排除能力的理論[14],以此理論作為準(zhǔn)則,在考慮現(xiàn)場(chǎng)真實(shí)數(shù)據(jù)對(duì)先驗(yàn)分布權(quán)重影響的情況下,實(shí)現(xiàn)各個(gè)信息源的權(quán)重分配,提出一種對(duì)多源異構(gòu)壽命數(shù)據(jù)信息進(jìn)行變權(quán)融合的貝葉斯可靠性評(píng)估模型。
多源指試驗(yàn)信息具有多種信息源,異構(gòu)指這些信息源的數(shù)據(jù)類型或特征等不一致,在統(tǒng)計(jì)學(xué)領(lǐng)域認(rèn)為這類數(shù)據(jù)不屬于同一總體,簡(jiǎn)稱多源異構(gòu)數(shù)據(jù)。下面討論獨(dú)立異構(gòu)的壽命信息如何進(jìn)行加權(quán)融合。
假設(shè)信息源獲取數(shù)據(jù)的環(huán)境條件相同,并將這些數(shù)據(jù)信息看作是傳感器對(duì)同一物理量采集到的。記n1,n2,…,nN表示N個(gè)信息源分別所對(duì)應(yīng)的樣本數(shù),x(i)={xi1,xi2,…,xini},i=1,2,…,N表示第i個(gè)信息源下獨(dú)立同分布的樣本;并假設(shè)第N個(gè)信息源為現(xiàn)場(chǎng)試驗(yàn)信息源獲取的真實(shí)現(xiàn)場(chǎng)數(shù)據(jù)。
根據(jù)各信息源獲取的數(shù)據(jù)信息x(i)={xi1,xi2,…,xini},i=1,2,…,N所反應(yīng)的總體分布特征,選擇適合各信息源的分布類型,擬合得到分布Fi(θ;x),求得各信息源的似然函數(shù)Li(x(i)|θ),其似然函數(shù)的尾部梯度特征[15]可表示為:
(1)
由現(xiàn)場(chǎng)試驗(yàn)數(shù)據(jù)x(N)=(xN1,xN2,…,xNnN),求得其似然函數(shù)LN(x(N)|θ)的尾部梯度特征為:
(2)
若通過(guò)查閱資料等途徑獲得參數(shù)θ的先驗(yàn)分布為φ(θ;u1,u2,…,uk),其中u1,u2,…,uk為先驗(yàn)分布中的超參數(shù),當(dāng)關(guān)于θ的先驗(yàn)信息在其分布的尾部區(qū)域取值θ0時(shí),即可得到上述各信息源的尾部梯度特征值τi(Li(x(i)|θ0)),i=1,2,…,N和τN(LN(x(N)|θ0)),比較各信息源和現(xiàn)場(chǎng)試驗(yàn)數(shù)據(jù)的尾部梯度特征值的絕對(duì)值差可得
hi=|τN(LN(x(N)|θ0))-τi(Li(x(i)|θ0))|,
i=1,2,…,N
(3)
當(dāng)信息源的尾部特征和現(xiàn)場(chǎng)試驗(yàn)數(shù)據(jù)的尾部特征越靠近時(shí),說(shuō)明此信息源和現(xiàn)場(chǎng)試驗(yàn)數(shù)據(jù)越相似,信息源的可信度也越高,所占的權(quán)重也應(yīng)該更高。即各信息源和現(xiàn)場(chǎng)試驗(yàn)數(shù)據(jù)的尾部梯度特征值的絕對(duì)值誤差越小,此信息源數(shù)據(jù)信息所占的權(quán)重越大。故各信息源的權(quán)重可確定為:
(4)
(5)
i=1,2,…,N
(6)
若無(wú)關(guān)于參數(shù)θ的任何先驗(yàn)信息,根據(jù)Fisher信息陣的理論知識(shí)[16],基于第i個(gè)信息源的數(shù)據(jù)信息x(i)=(xi1,xi2,…,xini),i=1,2,…,N得到其概率分布fi(x;θ),得似然函數(shù)為:
計(jì)算出參數(shù)θ(單參數(shù)情形)的Fisher信息陣:
因此,單參數(shù)場(chǎng)合下的無(wú)信息先驗(yàn)密度函數(shù)為:
(7)
結(jié)合前文獲取的各信息源權(quán)重εi和先驗(yàn)分布φi(θ|x(i)),i=1,2,…,N,以及第N個(gè)現(xiàn)場(chǎng)信息源壽命數(shù)據(jù)關(guān)于參數(shù)θ的似然函數(shù)LN(x(N)|θ),采用貝葉斯估計(jì)法[17],考慮對(duì)各信息源數(shù)據(jù)信息估計(jì)的先驗(yàn)分布進(jìn)行加權(quán)處理,并且將通過(guò)現(xiàn)場(chǎng)試驗(yàn)獲得的信息融合到先驗(yàn)信息的估計(jì)中,得到一個(gè)更客觀、合理的先驗(yàn)分布,再以現(xiàn)場(chǎng)試驗(yàn)數(shù)據(jù)作為樣本信息。最終,得到N個(gè)信息源數(shù)據(jù)信息融合后,關(guān)于參數(shù)θ的聯(lián)合后驗(yàn)密度為:
φ1,2,…,N(θ|x(1),x(2),…,x(N))=
(8)
(9)
(10)
表1 不同信息源數(shù)據(jù) 年
采用2種變權(quán)方式:
表2 3個(gè)信息源先驗(yàn)分布的參數(shù)估計(jì)結(jié)果
根據(jù)式(1)和式(2),計(jì)算得到A、B、C信息源的尾部梯度特征分別為:
τA=41.37,τB=36.48,τC=τ0=3.33
在參數(shù)μ的先驗(yàn)正態(tài)分布的尾部3σ域內(nèi)取值μ0=32.65時(shí),根據(jù)式(3)和式(4),獲取各信息源的權(quán)重占比(見表3)分別為:
εA=0.23,εB=0.27,εC=0.50
根據(jù)式(8),可以寫出3源樣本數(shù)據(jù)變權(quán)融合后,關(guān)于平均壽命參數(shù)μ的后驗(yàn)密度為:
φA,B,C(μ|x(1),x(2),x(3))=
由式(9),得到在平方損失函數(shù)下,產(chǎn)品的平均壽命為:
2) 假設(shè)僅對(duì)A、B 2個(gè)信息源(不考慮現(xiàn)場(chǎng)試驗(yàn)數(shù)據(jù)對(duì)參數(shù)μ先驗(yàn)信息的影響)進(jìn)行加權(quán)融合,同理求解,得到A、B信息源的權(quán)重占比為:
此時(shí)的后驗(yàn)密度為:
表3 不同加權(quán)方式的權(quán)重結(jié)果
為驗(yàn)證各組壽命數(shù)據(jù)經(jīng)過(guò)變權(quán)實(shí)現(xiàn)融合所得到的融合結(jié)果,相較于等權(quán)融合而言,更具真實(shí)有效性,此處使用相同數(shù)據(jù),采用貝葉斯理論進(jìn)行3源等權(quán)融合[18],可得到3源等權(quán)融合后的后驗(yàn)分布為:
表4 3種不同融合方式獲取參數(shù)的檢驗(yàn)結(jié)果
利用表1—4中的數(shù)據(jù)及參數(shù)估計(jì)的檢驗(yàn)結(jié)果可知,通過(guò)極大似然法得到A、B、C源的平均壽命分別為11.78、10.60、13.11年,在3源加權(quán)、僅對(duì)A、B信息源加權(quán)和3源等權(quán)的3種變權(quán)情況下,進(jìn)行數(shù)據(jù)融合,獲取融合后的平均壽命分別為12.81、12.15、10.87年,說(shuō)明3源加權(quán)融合的評(píng)估結(jié)果更客觀合理,驗(yàn)證了加權(quán)融合方法的有效性、合理性。
3源信息均變權(quán)進(jìn)行融合后,得到產(chǎn)品的總體失效密度函數(shù)為:
可靠度函數(shù)的貝葉斯估計(jì)為:
式中:Φ(·)為標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)。在3種不同變權(quán)融合方式情形下,得到融合前后的可靠度函數(shù)曲線,如圖1所示。
圖1 3源數(shù)據(jù)在不同加權(quán)融合情況下的可靠度函數(shù)曲線
通過(guò)圖1發(fā)現(xiàn)3源均變權(quán)和僅對(duì)A、B變權(quán),2種融合方式得到的可靠度函數(shù)結(jié)果,介于3源等權(quán)融合和C源現(xiàn)場(chǎng)數(shù)據(jù)融合結(jié)果之間,并且3源均變權(quán)的結(jié)果更靠近C源現(xiàn)場(chǎng)數(shù)據(jù)的結(jié)果,可知變權(quán)融合效果優(yōu)于等權(quán),3源均變權(quán)的融合效果優(yōu)于僅對(duì)A、B信息源變權(quán),3源變權(quán)融合后的分布總體明顯更接近真實(shí)現(xiàn)場(chǎng)試驗(yàn)數(shù)據(jù)的分布總體。因此,將現(xiàn)場(chǎng)試驗(yàn)數(shù)據(jù)融入先驗(yàn)信息,考慮對(duì)各信息源權(quán)重占比的影響,使得利用貝葉斯方法做數(shù)據(jù)融合估計(jì)時(shí),先驗(yàn)信息中含有更全面、更客觀的參數(shù)信息,能更科學(xué)合理地評(píng)估產(chǎn)品的可靠性。
針對(duì)小樣本數(shù)據(jù),提出了基于貝葉斯理論進(jìn)行多源壽命數(shù)據(jù)變權(quán)融合的可靠性評(píng)估模型,獲得產(chǎn)品的壽命分布信息及可靠性特性。仿真結(jié)果表明,該模型簡(jiǎn)單易操作,考慮了現(xiàn)場(chǎng)試驗(yàn)數(shù)據(jù)對(duì)參數(shù)先驗(yàn)和各信息源權(quán)重占比的影響,可以提高評(píng)估精準(zhǔn)度。從信息論的角度而言,利用各種途徑獲取的信息數(shù)據(jù),避免資源浪費(fèi),能夠得到對(duì)產(chǎn)品更科學(xué)合理的可靠性評(píng)估分析結(jié)論,在統(tǒng)計(jì)決策方面也有更好的穩(wěn)健性,為產(chǎn)品后續(xù)的預(yù)測(cè)研究奠定了基礎(chǔ)。