余珊珊,張永進,張燕軍,展佳慧
(1.安徽工業(yè)大學(xué) 數(shù)理科學(xué)與工程學(xué)院,安徽 馬鞍山 243002;2.揚州大學(xué) 機械工程學(xué)院,江蘇 揚州 225127)
對于長期處于貯存狀態(tài)的產(chǎn)品,需要保證在結(jié)束貯存、投入使用時具備很高的可靠性[1]。為保持其高可靠性,在產(chǎn)品貯存期間通常要對其進行周期檢測試驗,從而需要分析系統(tǒng)的失效信息數(shù)據(jù)。此處的失效信息數(shù)據(jù)來源于系統(tǒng)中失效的具體元件。以串聯(lián)系統(tǒng)和并聯(lián)系統(tǒng)為例,在串聯(lián)系統(tǒng)中,組成系統(tǒng)的元件中如果有1個失效,就會導(dǎo)致系統(tǒng)失效,因此最早發(fā)生失效的元件即為該系統(tǒng)的失效原因[2]。但是,對于實際貯存產(chǎn)品,由于缺乏檢測設(shè)備以及檢測對產(chǎn)品造成破壞等原因,導(dǎo)致貯存試驗中系統(tǒng)失效的元件不能被準確識別,而只能將其歸咎于某些元件所組成的集合,系統(tǒng)真正的失效原因被屏蔽掉了。在并聯(lián)系統(tǒng)中,組成系統(tǒng)的所有元件失效才會導(dǎo)致系統(tǒng)失效,因此在系統(tǒng)的未失效數(shù)據(jù)中可能含有部分元件失效數(shù)據(jù),此時該部分元件失效數(shù)據(jù)就被屏蔽掉了。由于系統(tǒng)中部分失效元件未知,稱這種系統(tǒng)壽命試驗數(shù)據(jù)為屏蔽數(shù)據(jù)[3,4]。因產(chǎn)品貯存壽命檢測試驗中常包含屏蔽數(shù)據(jù),所以考慮含屏蔽失效信息下的貯存可靠性具有重要的理論與實際意義。
已有的有關(guān)產(chǎn)品貯存可靠性評定與預(yù)測研究[5]主要分為不包含及包含屏蔽數(shù)據(jù)2種情形。若不考慮屏蔽數(shù)據(jù),早期Merren[6]分析了貯存3~6 a的大量電子元器件的成敗型檢測數(shù)據(jù),獲得了貯存失效率,認為貯存壽命并非完全服從常數(shù)型參數(shù)的指數(shù)分布。由于貯存失效數(shù)據(jù)需要通過測試手段獲得,Martinez[7]基于指數(shù)壽命分布,評估了周期檢測失效數(shù)據(jù)。針對周期檢修記錄的貯存失效數(shù)據(jù),Zhang等[8]給出了參數(shù)估計的極大似然(Maximum likelihood,ML)方法,對周期檢修下的貯存可靠性進行評估與預(yù)測,并在Poisson失效過程的假設(shè)下,給出了在周期檢測點處貯存可靠性點估計“倒掛”數(shù)據(jù)的修正方法[9]。為此,Zhao等[10,11]修正檢修時刻的點估計值,給出了產(chǎn)品貯存可靠性的最小二乘估計(Least square estimate,LSE),但未考慮實際情況下的周期檢測情形。由于定期檢修是提高貯存產(chǎn)品使用可靠性的主要措施,閆霞[12]、張永進等[13-15]、楊軍等[16,17]考慮此情形并討論了貯存可靠性相關(guān)問題,但未考慮失效信息被屏蔽的情形。目前,考慮貯存檢測失效數(shù)據(jù)具有屏蔽情形的文獻較少,最早Friedman等[3]給出了屏蔽數(shù)據(jù)相關(guān)概念,Usher等[18]應(yīng)用ML方法估計了含屏蔽數(shù)據(jù)信息的系統(tǒng)可靠性問題。針對完全樣本數(shù)據(jù),Sarhan等[19]給出了含屏蔽信息的并聯(lián)系統(tǒng)可靠性ML估計;對于截尾樣本數(shù)據(jù),基于逆Weibull壽命分布,Cai等[20,21]研究了元件屏蔽數(shù)據(jù)情況下并聯(lián)系統(tǒng)的可靠性。然而,文獻[3,18-21]未涉及產(chǎn)品在貯存狀態(tài)下的可靠性問題,為此,Zhao等[22]給出了含屏蔽數(shù)據(jù)的串聯(lián)系統(tǒng)貯存可靠性,基于LSE,對含有初始失效元件的貯存可靠性進行了分析,但未涉及并聯(lián)貯存系統(tǒng)情形。
鑒于貯存屏蔽數(shù)據(jù)存在的合理性,以及大量存在的并聯(lián)結(jié)構(gòu)系統(tǒng)問題,本文將建立含元件級屏蔽數(shù)據(jù)的并聯(lián)系統(tǒng)貯存可靠性模型??紤]各元件都具有不同的初始失效情況,在指數(shù)壽命分布下進行周期檢測試驗。考慮成敗型周期檢測數(shù)據(jù),其中在未失效的系統(tǒng)數(shù)據(jù)中含屏蔽元件級失效數(shù)據(jù)。擬使用改進的期望最大化(Expectation maximization,EM)算法在未失效系統(tǒng)數(shù)據(jù)中挖掘被屏蔽的元件失效數(shù)據(jù),用來更新周期檢測的實時數(shù)據(jù),并用LSE對各元件的初始可靠度和失效率進行參數(shù)估計。最后通過仿真數(shù)據(jù)驗證模型的有效性以及改進的EM算法的可行性。
為保持產(chǎn)品的高使用可靠性,通常在產(chǎn)品貯存期間進行周期檢測并維護[7],則周期檢測下貯存試驗條件如下:
(1)試驗環(huán)境為,貯存試驗的外界應(yīng)力恒定,產(chǎn)品系統(tǒng)或元件能在同一環(huán)境條件下處于等待使用狀態(tài);
(2)貯存初始狀態(tài)為,產(chǎn)品系統(tǒng)或元件在出廠或貯存開始時并非處于完美狀態(tài),即貯存初始可靠度滿足0≤R0≤1;
(3)貯存樣本個數(shù)為,在條件(1)的試驗環(huán)境中存放N個同型產(chǎn)品,構(gòu)成該產(chǎn)品的元件1,2,…,m分別為N10,N20,…,Nm0個;
(4)抽樣方式為無放回抽樣方式,對貯存產(chǎn)品及其構(gòu)成元件進行檢測試驗;
(5)抽檢樣本量為,在各檢測時刻,產(chǎn)品系統(tǒng)及元件檢測數(shù)遠小于對應(yīng)總貯存樣本數(shù);
(6)貯存壽命為假定服從常用的指數(shù)分布。
設(shè)t′為產(chǎn)品系統(tǒng)的貯存壽命,其中t′為1個隨機變量且在試驗中很難觀察到其具體值,通常已知的是1個偏大、偏小或在某段貯存時間點之間的值。記A為“產(chǎn)品在貯存開始時刻是合格的”這一隨機事件,則根據(jù)上述基本假設(shè)以及條件概率理論,產(chǎn)品在貯存時刻t的可靠度為[13]
R(t)=P(t′>t)=P(A)P(t′|A)=R0Rs(t)
(1)
式中:Rs(t)為條件貯存可靠性,表示某產(chǎn)品處于完美狀態(tài)下,在貯存時刻t的瞬時可靠度,反映的是在一定貯存環(huán)境條件下,貯存對產(chǎn)品系統(tǒng)帶來的可靠度影響。
根據(jù)條件假設(shè)(6),記該產(chǎn)品系統(tǒng)中元件i的條件貯存失效率為λi,則根據(jù)式(1)知,其元件的可靠度為
Ri(t)=R0iexp(-λit)
(2)
因為每個產(chǎn)品由m個獨立且不完全相同的元件并聯(lián)構(gòu)成,從而當且僅當所有元件失效時才導(dǎo)致該產(chǎn)品失效,則式(1)中貯存壽命t′應(yīng)為max(t′1,…,t′i,…,t′m)。記t′i表示第i個元件的貯存壽命時間,R0i表示第i個元件的初始可靠度,λi是第i個元件的貯存失效率(i=1,2,…,m),根據(jù)式(1)、(2),該產(chǎn)品系統(tǒng)在時刻t的貯存可靠性為
R(t)=p{max(t′1,…,t′i,…,t′m)>t}=
1-p{max(t′1,…,t′i,…,t′m)≤t}=
1-p{t′1≤t,…,t′i≤t,…,t′m≤t}=
(3)
對于同時貯存的產(chǎn)品系統(tǒng),若記該產(chǎn)品的失效率為λ,則根據(jù)式(1),產(chǎn)品系統(tǒng)在貯存時刻t的可靠度應(yīng)為
R(t)=R0exp(-λt)
(4)
由式(3)、(4)得
(5)
(6)
式(6)表明,系統(tǒng)在并聯(lián)結(jié)構(gòu)形式下,初始可靠度R0可根據(jù)元件初始可靠度確定。
由于部分元件失效并未導(dǎo)致系統(tǒng)失效,從而檢測成功的產(chǎn)品系統(tǒng)中可能隱藏著部分失效元件,需要在未失效的產(chǎn)品系統(tǒng)數(shù)據(jù)中挖掘屏蔽的元件失效數(shù)據(jù)。對于貯存產(chǎn)品的周期檢驗結(jié)果,假定周期檢測記錄數(shù)據(jù)為成敗型數(shù)據(jù)。根據(jù)假設(shè)條件(3)、(5),在周期檢測時刻tj,從貯存的N件產(chǎn)品系統(tǒng)中抽樣nj(nj=N)件,檢測出產(chǎn)品失效數(shù)為fj,未失效數(shù)為sj,j=1,2,…,v。同一時刻,從Ni0(nij==Ni0)個貯存元件i中抽樣nij個,檢測出該型號的元件失效數(shù)為fij,未失效數(shù)為sij,i=1,2,…,m。具體地,產(chǎn)品系統(tǒng)與元件檢測記錄數(shù)據(jù)如表1所示,其中,nj=fj+sj,nij=fij+sij,i=1,2,…,m,j=1,2,…,v。
表1 檢測時記錄的成敗型數(shù)據(jù)表
在貯存檢測時刻tj,系統(tǒng)含有元件個數(shù)為m的條件下,造成系統(tǒng)失效的元件集可表示為1個非空集合Fj?{1,2,…,m}。由于檢測的系統(tǒng)是并聯(lián)結(jié)構(gòu)形式,所有元件失效才會導(dǎo)致系統(tǒng)失效,即有Fj={1,2,…,m}。反之,可定義系統(tǒng)未失效時所對應(yīng)的元件集為Sj,則有Sj?{1,2,…,m}。而在并聯(lián)系統(tǒng)中,只要有1個元件未失效系統(tǒng)就不會失效。若系統(tǒng)中各元件均未失效,此時沒有失效數(shù)據(jù)被屏蔽,即Sj={1,2,…,m};若未失效的產(chǎn)品系統(tǒng)中,至少有1個元件失效,此時系統(tǒng)的失效數(shù)據(jù)存在一定的隱蔽性,稱該產(chǎn)品系統(tǒng)的失效數(shù)據(jù)信息被屏蔽,此時成功元件集應(yīng)為集合{1,2,…,m}的非空真子集,即Sj?{1,2,…,m}。
在使用貯存可靠性模型進行可靠性分析前,首先需要確定模型的參數(shù)。對于并聯(lián)系統(tǒng)下的貯存可靠性模型式(3),共有2i個參數(shù)R0i,λi需要進行估計,i=1,2,…,m。若不考慮系統(tǒng)屏蔽失效數(shù)據(jù),根據(jù)成敗型數(shù)據(jù),在指數(shù)壽命分布下,使用LSE確定貯存可靠性函數(shù)中的參數(shù)。應(yīng)用貯存元件的檢測數(shù)據(jù),根據(jù)式(2)可得到各元件在時刻tj的可靠度函數(shù)Ri(tj)為
Ri(tj)=R0iexp(-λitj)
(7)
取對數(shù)有l(wèi)n(Ri(tj))=ln(R0i)-λitj,若令Yij=ln(Ri(tj)),ai=ln(R0i),bi=-λi,i=1,2,…,m,j=1,2,…,v,則有一元線性回歸方程Yij=ai+bitj。結(jié)合式(7)有
于是貯存元件可靠性參數(shù)的LSE可表示為
(8)
(9)
另一方面,基于產(chǎn)品系統(tǒng)的貯存檢測數(shù)據(jù),根據(jù)式(4)知,產(chǎn)品系統(tǒng)的可靠性參數(shù)的LSE為
(10)
(11)
顯然,通過式(8)~(11),可對產(chǎn)品系統(tǒng)及元件的可靠性做出評估和預(yù)測,并對產(chǎn)品的貯存檢測周期給出理論依據(jù)。
EM算法的一般思想是首先給出待估參數(shù)的初始值,如α0,然后計算缺失數(shù)據(jù)的期望。利用ML方法,計算出α1,從而獲得完整的數(shù)據(jù)。以α1為新的初始值,重復(fù)這個過程,一直達到穩(wěn)定值[10]。
(12)
系統(tǒng)在對應(yīng)檢測時刻的貯存可靠度ML估計為
(13)
結(jié)合式(3),易通過ML方法得出各元件初始可靠度R0i和失效率參數(shù)λi[13,14]。
EM算法的適用前提是易獲得ML估計,但當系統(tǒng)屏蔽失效數(shù)據(jù)存在時,要考慮各元件參數(shù)的ML函數(shù),此時ML函數(shù)會變成1個具有高維度的多變量函數(shù),一般不存在參數(shù)的分析解,因此直接使用EM算法很復(fù)雜。
由于元件參數(shù)的LSE具有近似的解析形式,基于LSE可對EM算法改進如下:
(1)E步,給出元件參數(shù)的初始值α0,找出系統(tǒng)屏蔽未失效數(shù)據(jù)的期望。
(2)M-LS步,使用計算出的系統(tǒng)屏蔽未失效數(shù)據(jù)期望和系統(tǒng)檢測數(shù)據(jù),假設(shè)其數(shù)據(jù)完整,更新數(shù)據(jù)后,利用LSE,計算出元件參數(shù)α1。
將α1作為新的初始值,進行k次迭代,直至相鄰2次參數(shù)之差的絕對值小于指定閾值,即
|α(k)-α(k-1)|<ε
ε→0時,達到收斂。
考慮并聯(lián)系統(tǒng),當系統(tǒng)中元件失效數(shù)據(jù)被屏蔽且檢測數(shù)據(jù)是成敗型數(shù)據(jù)時,使用改進的EM算法對貯存可靠性參數(shù)進行估計。
(14)
由于系統(tǒng)未失效時,至少有1個元件未失效,則有
i=1,2,…,mj=1,2,…,v
對于屏蔽數(shù)據(jù)(nj,fj),使用式(14)計算每個元件的期望未失效數(shù)
(2)M-LS步,將表1中的元件成敗型數(shù)據(jù)更新為
(15)
利用式(15)的計算結(jié)果估計元件成敗型數(shù)據(jù),再應(yīng)用式(7)~(9)、(12),得到各元件的初始可靠度和失效率估計為
(16)
(17)
(18)
(19)
ε→0時,可以終止E步和M-LS步的迭代。
為演示改進的EM算法估計模型參數(shù)的有效性,以2個元件構(gòu)成的并聯(lián)系統(tǒng)為例。貯存系統(tǒng)及元件的檢測數(shù)據(jù)(n,f)如表2所示,根據(jù)貯存模型的條件假設(shè),其中系統(tǒng)未失效數(shù)據(jù)中含有被屏蔽的元件失效數(shù)據(jù)。
表2 系統(tǒng)及元件的成敗型數(shù)據(jù)表
根據(jù)式(3)并聯(lián)系統(tǒng)下的貯存可靠性模型,分別對元件1、元件2的初始可靠度R01、R02及失效率λ1、λ2進行計算。
圖1 元件1與元件2的初始可靠度及失效率變化圖
圖2 參數(shù)差值變化圖
從算法結(jié)果知,考慮屏蔽數(shù)據(jù)時的初始可靠度均低于不考慮屏蔽數(shù)據(jù)時的初始可靠度,考慮屏蔽數(shù)據(jù)時的失效率均高于不考慮屏蔽數(shù)據(jù)時的失效率。鑒于貯存屏蔽數(shù)據(jù)的存在性,考慮屏蔽數(shù)據(jù)與工程實際情況更相符。
表3 元件1、元件2的貯存可靠性模型的參數(shù)估計表
表3估計出的各元件初始可靠度和失效率再結(jié)合式(2),可得到元件1和元件2的貯存可靠性函數(shù)如圖3所示。
圖3 各元件的貯存可靠性變化趨勢圖
圖3表示元件1、元件2在貯存情形下,不考慮屏蔽數(shù)據(jù)時,通過LSE得到的貯存可靠性變化曲線,以及考慮屏蔽數(shù)據(jù)時,通過改進的EM算法得到的貯存可靠性變化曲線圖。由圖3知,不管是元件1還是元件2,考慮屏蔽數(shù)據(jù)時,得到的貯存可靠性函數(shù)值均比不考慮屏蔽數(shù)據(jù)時低,主要原因是:不考慮屏蔽數(shù)據(jù)時,只需要通過檢測到的元件數(shù)據(jù)來估計元件模型中的參數(shù),沒有考慮到系統(tǒng)對其元件的可靠性也會造成影響;而考慮屏蔽數(shù)據(jù)時,不僅要通過檢測到的元件數(shù)據(jù)來進行估計,還要結(jié)合檢測到的系統(tǒng)數(shù)據(jù)進行參數(shù)估計。
表4 系統(tǒng)的貯存可靠性模型的參數(shù)估計表
工程上,常用預(yù)測的可靠性相對誤差來度量實際值和擬合值的匹配程度[24,25],具體地,設(shè)θE和θP分別表示估計的參數(shù)值和預(yù)測的參數(shù)值,則預(yù)測的參數(shù)值相對誤差可以表示為
(20)
根據(jù)表4數(shù)據(jù),取θ=R0和θ=λ,RE1和RE2分別為計算得出的系統(tǒng)初始可靠度相對誤差和失效率相對誤差,相關(guān)結(jié)果如表5所示。
表5 系統(tǒng)初始可靠度和失效率的相對誤差表
表5中數(shù)據(jù)顯示,考慮屏蔽數(shù)據(jù)時系統(tǒng)初始可靠度和失效率的相對誤差均小于不考慮時的情形,從而表明考慮屏蔽數(shù)據(jù)得到的參數(shù)估計更加精確。表4估計出的系統(tǒng)初始可靠度和失效率再結(jié)合式(4),可得到系統(tǒng)的貯存可靠性函數(shù)如圖4所示。
圖4 系統(tǒng)的貯存可靠性函數(shù)圖
圖4表示系統(tǒng)及元件在貯存情形下,通過系統(tǒng)檢測數(shù)據(jù),得到的系統(tǒng)貯存可靠性變化曲線,以及在考慮屏蔽數(shù)據(jù)與不考慮屏蔽數(shù)據(jù)時,通過元件檢測數(shù)據(jù)估計得到的系統(tǒng)貯存可靠性函數(shù)變化曲線圖。由圖4可清晰地看出,考慮屏蔽數(shù)據(jù)時的曲線變化圖與通過系統(tǒng)檢測數(shù)據(jù)得到的曲線變化圖較吻合,更符合實際情形。
針對并聯(lián)形式的貯存結(jié)構(gòu)系統(tǒng),基于指數(shù)壽命分布,本文工作主要有:
(1)建立了各元件都具有不同初始失效情況的系統(tǒng)貯存可靠性模型,得到了貯存可靠性失效率與初始可靠度的等效方程;
(2)針對并聯(lián)系統(tǒng)中的屏蔽失效數(shù)據(jù),提出了基于LSE的改進EM算法,估計了考慮系統(tǒng)屏蔽失效數(shù)據(jù)的元件及系統(tǒng)貯存可靠性模型中的參數(shù);
(3)通過算例分析知,本文算法能有效挖掘系統(tǒng)未失效數(shù)據(jù)中的元件失效信息。雖然考慮屏蔽失效數(shù)據(jù)時,得到的元件及系統(tǒng)貯存可靠性函數(shù)值都略低于沒有考慮屏蔽數(shù)據(jù)時的貯存可靠性函數(shù)值,但更符合實際貯存情形。