趙志博,多依麗,王 博,孫 鐵,劉 明,高 涵
(遼寧石油化工大學(xué)機(jī)械工程學(xué)院,遼寧撫順113001)
隨著科技的飛速發(fā)展,各個(gè)領(lǐng)域涌現(xiàn)出大量性能優(yōu)越、復(fù)雜程度高的系統(tǒng)。然而,系統(tǒng)的復(fù)雜度越高,發(fā)生故障的可能性就越大。為滿足系統(tǒng)的可靠性要求,設(shè)計(jì)者往往會(huì)采用冗余結(jié)構(gòu),即在關(guān)鍵或易損部分增加一套具有相同功能的元件、設(shè)備或裝置,以確保當(dāng)該部分發(fā)生故障時(shí)系統(tǒng)可以正常運(yùn)行[1]。因此,冗余系統(tǒng)的可靠性很大程度上決定整套系統(tǒng)的使用壽命。
解決冗余系統(tǒng)的可靠性分析問題,傳統(tǒng)的研究方法是利用動(dòng)態(tài)故障樹中的備件門對(duì)系統(tǒng)的失效機(jī)理進(jìn)行建模與分析[2]。動(dòng)態(tài)故障樹雖然可以考慮共因失效與維修因素對(duì)可靠性的影響,但是當(dāng)系統(tǒng)規(guī)模較大時(shí)會(huì)產(chǎn)生大量的基本事件,從而導(dǎo)致故障樹變得復(fù)雜,增加建模與求解的難度。目前,馬爾科夫技術(shù)是一種廣泛應(yīng)用于冗余系統(tǒng)可靠性分析的方法。文獻(xiàn)[3]將狀態(tài)空間方法與馬爾可夫模型的概率分析相結(jié)合,成功應(yīng)用于冗余與非冗余的熱電聯(lián)產(chǎn)系統(tǒng)的可靠性評(píng)估中;文獻(xiàn)[4]利用馬爾科夫技術(shù),構(gòu)造了冗余系統(tǒng)可靠性分析模型,該模型結(jié)合共因失效與已建立的失效模式,提出過程需求,并分析了對(duì)系統(tǒng)可靠性的影響。雖然馬爾科夫技術(shù)可有效表達(dá)冗余系統(tǒng)的動(dòng)態(tài)特性,卻存在狀態(tài)空間組合爆炸的問題,難以對(duì)規(guī)模較大的系統(tǒng)進(jìn)行求解。
GO 法是一種有效處理具有時(shí)序、復(fù)雜關(guān)聯(lián)系統(tǒng)的可靠性分析方法,因其能描述不同單元之間備用相關(guān)的功能,可應(yīng)用于冗余系統(tǒng)的可靠性分析中。文獻(xiàn)[5]利用GO 法對(duì)含有共因失效的三取二冗余系統(tǒng)和外電源備用系統(tǒng)進(jìn)行了可靠性分析;文獻(xiàn)[6]創(chuàng)建新的操作符,提出了一種基于GO 法與馬爾科夫理論的冗余可修系統(tǒng)可靠性分析方法。與動(dòng)態(tài)故障樹相比,雖然GO 法在建模方面更能反映系統(tǒng)的原貌,但定量分析過程繁瑣,并且沒有相關(guān)軟件支持,所以應(yīng)用不夠廣泛。
近幾年發(fā)展起來(lái)的動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(Dynamic Bayesian Network,DBN)不僅可以反映維修因素對(duì)系統(tǒng)的影響,還能描述研究對(duì)象隨時(shí)間變化的動(dòng)態(tài)特性,最重要的是它擁有成熟的算法,可有效彌補(bǔ)GO 法在分析過程中的不足,目前已經(jīng)廣泛應(yīng)用于數(shù)據(jù)挖掘[7]、可靠性分析[8]和風(fēng)險(xiǎn)評(píng)估[9]等領(lǐng)域。本文將GO 法進(jìn)行改進(jìn),增設(shè)兩種可以描述備件相關(guān)的操作符并將其與動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)相結(jié)合。首先,給出新操作符向DBN 的轉(zhuǎn)換規(guī)則。然后,根據(jù)算法建立案例中控制單元的DBN 模型,綜合考慮共因失效與維修因素對(duì)控制單元進(jìn)行可靠性分析。最后,基于DBN 的反向推理功能,迅速得出控制單元在發(fā)生故障時(shí)的薄弱環(huán)節(jié),從而節(jié)約計(jì)算成本,對(duì)工程的實(shí)際應(yīng)用亦具有一定的價(jià)值。
GO 法[10]是一種以成功為導(dǎo)向的可靠性分析方法。它將系統(tǒng)的原理圖、流程圖或工程圖按照一定的規(guī)則轉(zhuǎn)化成GO 圖模型,利用模型中的操作符與信號(hào)流表達(dá)單元之間的邏輯關(guān)系與物流進(jìn)程。最后,根據(jù)不同操作符的運(yùn)算規(guī)則完成系統(tǒng)的定量或定性分析。
DBN[11]是包含時(shí)間維度的隨機(jī)模型,它由有向無(wú)環(huán)圖和相對(duì)應(yīng)的條件概率表構(gòu)成。構(gòu)造DBN 時(shí),需要滿足兩個(gè)條件:(1)有限的時(shí)間內(nèi)條件概率的變化過程是平穩(wěn)的;(2)動(dòng)態(tài)概率的變化具有馬爾科夫性。以上假設(shè)在DBN 中可以表示為一個(gè)先驗(yàn)網(wǎng)絡(luò)(B0)和一個(gè)轉(zhuǎn)移網(wǎng)絡(luò)(B→),已知這兩個(gè)部分就能建立任意時(shí)刻的DBN 模型。
先驗(yàn)網(wǎng)絡(luò)在初始條件下的概率分布:
轉(zhuǎn)移網(wǎng)絡(luò)在相鄰時(shí)間片間的轉(zhuǎn)移概率分布:
DBN 各節(jié)點(diǎn)的聯(lián)合分布概率:
GO 法對(duì)備用相關(guān)的描述:在冗余并聯(lián)系統(tǒng)中,當(dāng)正在運(yùn)行的主件發(fā)生故障時(shí),備件開始工作以保證系統(tǒng)繼續(xù)正常運(yùn)行。若冗余系統(tǒng)的備件在備用狀態(tài)時(shí)不發(fā)生故障或者發(fā)生故障的概率很小,則備件的故障狀態(tài)與主件工作時(shí)的故障狀態(tài)有關(guān)。
傳統(tǒng)的GO 法模型只擁有17 種操作符,不存在描述備用相關(guān)的操作符。為表達(dá)上述關(guān)系,本文建立了未考慮共因失效的備件操作符18,具體描述如下:
在M 取K 冗余系統(tǒng)中,有M 個(gè)輸入信號(hào),但正常工作時(shí)只允許K 個(gè)信號(hào)輸入,其余信號(hào)均處于備用狀態(tài),只有當(dāng)M 個(gè)輸入信號(hào)全失效時(shí),輸出信號(hào)才會(huì)失效。
現(xiàn)假設(shè)有一雙機(jī)冗余冷備系統(tǒng)由主件1-1 和備件1-2 組成,當(dāng)主件發(fā)生故障時(shí)備件開始工作。根據(jù)各操作符的建立方法及向DBN 轉(zhuǎn)化的一般規(guī)則[12],其GO 圖模型及對(duì)應(yīng)的DBN 網(wǎng)絡(luò)模型如圖1所示。在DBN 網(wǎng)絡(luò)模型中,節(jié)點(diǎn)1、2 分別為GO 圖模型中主、備件對(duì)應(yīng)的節(jié)點(diǎn);R 為輸出信號(hào);圓弧箭頭1、2 表示節(jié)點(diǎn)從t 時(shí)刻向t+1 時(shí)刻傳遞的信息;直線箭頭3 表示主件發(fā)生故障后向備件發(fā)出的信息;直線箭頭4、5 表示上一節(jié)點(diǎn)向下一節(jié)點(diǎn)傳播的信息。
圖1 備用相關(guān)系統(tǒng)GO 圖模型向DBN 網(wǎng)絡(luò)模型轉(zhuǎn)化規(guī)則
由于DBN 引入了時(shí)間序列,需獲得同一節(jié)點(diǎn)從t 時(shí)刻向t+1 時(shí)刻的條件概率。假設(shè)系統(tǒng)只有故障(用1 表示)和正常(用0 表示)兩種狀態(tài),因DBN 擁有Markov 性,故節(jié)點(diǎn)xi的條件概率可表示為:
式中,fxi(t)為xi的失效概率密度函數(shù)。
由此可知,圖1 中冗余系統(tǒng)的DBN 模型各節(jié)點(diǎn)的條件概率可以表達(dá)為:
式中,f1(t)、f2(t)分別為節(jié)點(diǎn)1、節(jié)點(diǎn)2 的失效密度函數(shù);m1(t)、m2(t)分別為節(jié)點(diǎn)1、節(jié)點(diǎn)2 的維修密度函數(shù);fα2(t)為節(jié)點(diǎn)2 處于備用狀態(tài)時(shí)的失效概率密度。
其中,當(dāng)冗余系統(tǒng)中兩元件為熱備相關(guān)時(shí),α(休眠因子)=1;兩元件為溫備相關(guān)時(shí),0 <α <1,兩元件為冷備相關(guān)時(shí),α=0;當(dāng)節(jié)點(diǎn)1 或2 的狀態(tài)不可修時(shí),m1(t)及m2(t)均為0。
在對(duì)熱儲(chǔ)備系統(tǒng)進(jìn)行建模時(shí),共因失效是一個(gè)必須考慮的因素,雖然GO 法可以說(shuō)明共因失效對(duì)冗余系統(tǒng)中備份相關(guān)性的影響,但求解過程比較繁瑣。為此,本文建立了新的操作符19,其描述如下:操作符19 由K 個(gè)輸入信號(hào)和一個(gè)控制信號(hào)組成,只有當(dāng)控制信號(hào)有效且至少有一個(gè)輸入信號(hào)有效時(shí),輸出信號(hào)才有效。
雙機(jī)熱備冗余系統(tǒng)GO 圖模型向DBN 的轉(zhuǎn)化規(guī)則如圖2 所示。GO 圖模型中操作符19-3 為共因失效備件門,操作符5-4 為主件與備件的控制信號(hào),本文將共因失效信號(hào)作為操作符的控制信號(hào)。DBN 中A1為主件的獨(dú)立失效節(jié)點(diǎn),A2為備件的獨(dú)立失效節(jié)點(diǎn),E1為主件與備件的共因失效節(jié)點(diǎn),其他符號(hào)的定義與上文一致,此處不再贅述。
圖2 共因失效系統(tǒng)GO 圖模型向DBN 的轉(zhuǎn)化規(guī)則
共因失效的故障率很難通過測(cè)量獲得,目前常用的方法是通過α 因子模型或β 因子模型進(jìn)行估計(jì)[13]。本文利用β 因子模型確定熱儲(chǔ)備系統(tǒng)的共因失效概率。假設(shè)系統(tǒng)中元件的使用壽命服從指數(shù)分布,則β 因子可表示為:
式中,λc為共因失效概率;λ1為元件獨(dú)立失效概率;β值通常由專家確定,取值范圍為β∈[0,0.25]。
考慮共因失效的熱儲(chǔ)備系統(tǒng)DBN 模型的條件概率可以表示為:
式中,fA1(t)、fA2(t)分別為節(jié)點(diǎn)A1、A2的失效密度函數(shù);mA1(t)、mA2(t)分別為節(jié)點(diǎn)A1、A2的維修密度函數(shù);fE1(t)為節(jié)點(diǎn)E1的失效密度函數(shù);mE1(t)為節(jié)點(diǎn)E1的維修密度函數(shù)。當(dāng)節(jié)點(diǎn)A1、A2和E1的狀態(tài)是不可修時(shí),mA1(t)、mA2(t)及mE1(t)均為0。
基于GO 圖模型的DBN 推理是在給定網(wǎng)絡(luò)模型和參數(shù)基礎(chǔ)上,利用獲取的證據(jù),得到所需節(jié)點(diǎn)概率的過程,具體步驟如下:(1)根據(jù)系統(tǒng)內(nèi)不同單元之間的邏輯關(guān)系建立GO 圖;(2)把GO 圖中的操作符(非邏輯門操作符)作為DBN 中先驗(yàn)網(wǎng)絡(luò)的根節(jié)點(diǎn),并同時(shí)設(shè)置轉(zhuǎn)移網(wǎng)絡(luò)中與其相應(yīng)的子節(jié)點(diǎn),最后建立二者之間的連接關(guān)系;(3)以操作符的狀態(tài)概率為DBN 中根節(jié)點(diǎn)的先驗(yàn)概率,根據(jù)式(5)—(7)與式(9)—(14)確定其轉(zhuǎn)移網(wǎng)絡(luò)中子節(jié)點(diǎn)的條件概率;(4)將根節(jié)點(diǎn)先驗(yàn)概率與其對(duì)應(yīng)的子節(jié)點(diǎn)的條件概率輸入DBN 模型中,利用DBN 的算法獲得所需信息。
應(yīng)用文獻(xiàn)[14]中已有的案例對(duì)新算法進(jìn)行驗(yàn)證,并針對(duì)該案例中動(dòng)態(tài)故障樹在冗余系統(tǒng)可靠性分析中的不足,建立考慮共因失效的可靠性模型,分析案例中某控制單元的可靠性。
某控制單元GO 圖模型如圖3 所示。圖3 中,操作符1 表示電源;操作符2、3、4、7、8、9、11、12 分別代表單元內(nèi)的各個(gè)元件;直線箭頭為信號(hào)流,表示由電源發(fā)出的電壓信號(hào)在操作符之間的輸入與輸出。
圖3 某控制單元GO 圖模型
該控制單元包括三個(gè)模塊,模塊1 由三個(gè)相同的元件組成,工作方式為三機(jī)冗余熱儲(chǔ)備,因此需要采用操作符19 共因失效備件門描述該模塊的備用相關(guān)性;模塊2 由屬性不同的三個(gè)元件并聯(lián)構(gòu)成,使用第2 類操作符連接輸出;模塊3 為雙機(jī)冗余溫儲(chǔ)備設(shè)計(jì),利用操作符18 進(jìn)行連接。組成該控制單元的元件均為可修,并且只有故障(F)和成功(T)兩種工作狀態(tài)。表1 為GO 圖模型中各操作符含義及案例中所提供的各元件的可靠性參數(shù)。根據(jù)各操作符向DBN 映射的一般規(guī)則,利用GeNIe 軟件建立的DBN 模型如圖4 所示。
表1 GO 圖模型中各操作符含義及各元件的可靠性參數(shù)
圖4 基于改進(jìn)GO 法的某控制單元DBN 模型
本文根據(jù)軟件中的聯(lián)合樹算法,計(jì)算控制單元中電壓輸出正常與失敗概率。對(duì)控制單元進(jìn)行定量分析時(shí),一般基于如下幾個(gè)條件:(1)控制單元中所有元件在初始時(shí)刻的工作狀態(tài)均正常;(2)控制單元中各元件的使用壽命及維修度服從指數(shù)分布;(3)維修該控制單元的人員充足,共因失效組的維修率為模塊內(nèi)所有元件的維修率之和;(4)分析控制單元在工作條件最差的情形下的可靠度時(shí),共因失效因子β=0.1。利用式(8)可得熱儲(chǔ)備冗余系統(tǒng)的共因失效概率為0.000 375。由式(5)—(7)和式(9)—(14)可算出DBN 中各個(gè)根節(jié)點(diǎn)的先驗(yàn)概率與轉(zhuǎn)移概率,t=1 時(shí)DBN 內(nèi)各根節(jié)點(diǎn)的轉(zhuǎn)移概率見表2。將表2中的參數(shù)輸入到DBN 模型中進(jìn)行計(jì)算,節(jié)點(diǎn)N17 的輸出信息即為控制單元的成功與故障概率。
表2 控制單元DBN 各根節(jié)點(diǎn)轉(zhuǎn)移概率
續(xù)表2
為證明本方法的有效性,首先選擇未考慮共因失效與維修因素時(shí)控制單元的可靠度進(jìn)行分析。基于動(dòng)態(tài)故障樹與GO 法得到的控制單元可靠性退化曲線對(duì)比結(jié)果如圖5 所示。由圖5 可知,基于兩種方法所得結(jié)果一致,驗(yàn)證了本方法的正確性。雖然文獻(xiàn)[14]采用的動(dòng)態(tài)故障樹分析法可以處理維修因素與溫備結(jié)構(gòu)對(duì)可靠度的影響,但并未考慮共因失效等因素,所得結(jié)果趨于理想,無(wú)法反映系統(tǒng)真實(shí)的工況。因此,為直觀地說(shuō)明共因失效對(duì)計(jì)算結(jié)果的影響,本文將控制單元分包含共因失效與不包含共因失效兩種情況進(jìn)行比較,其可用度的動(dòng)態(tài)變化規(guī)律如圖6 所示。
圖5 基于動(dòng)態(tài)故障樹與GO 法得到的控制單元可靠性退化曲線對(duì)比結(jié)果
圖6 考慮/未考慮共因失效與維修因素的控制單元可用度曲線
由圖6 可以看出,控制單元在運(yùn)行初期,兩種情況下系統(tǒng)的正常工作概率下降趨勢(shì)均十分明顯。這一階段控制單元還未處于平穩(wěn)的工作狀態(tài),各個(gè)元件發(fā)生故障的速率大于其維修的速率,從而導(dǎo)致系統(tǒng)可用度驟降。30 周后,控制單元的維修速率開始上升,正常工作的概率走勢(shì)也不再驟降,系統(tǒng)的可用度也趨于平穩(wěn)。從圖6 還可以看出,考慮共因失效時(shí),系統(tǒng)的可用度要低于未考慮共因失效的可用度。由此可知,若對(duì)熱備冗余系統(tǒng)進(jìn)行可靠性分析時(shí),只考慮獨(dú)立失效而忽略共因失效的影響,必然會(huì)降低可靠性的精度,進(jìn)而造成分析結(jié)果的誤差。
DBN 具有強(qiáng)大的反向推理能力,它可以通過設(shè)置模型中任一節(jié)點(diǎn)在任意時(shí)刻的不同狀態(tài),得到其他節(jié)點(diǎn)的后驗(yàn)概率。本文假設(shè)控制單元處于工作狀態(tài)穩(wěn)定階段即t=30 周時(shí)出現(xiàn)故障,此時(shí)各個(gè)元件所對(duì)應(yīng)的根節(jié)點(diǎn)的后驗(yàn)概率如圖7 所示。由圖7可知,元件C1、C2、C3的正常工作狀態(tài)概率最小。因此,以上元件是該控制單元的薄弱環(huán)節(jié)。當(dāng)控制單元發(fā)生故障時(shí),應(yīng)優(yōu)先安排技術(shù)人員檢查上述三個(gè)元件,及時(shí)維修或更換,通過降低關(guān)鍵元件的故障率,保證整個(gè)系統(tǒng)的長(zhǎng)周期穩(wěn)定運(yùn)行。
圖7 根節(jié)點(diǎn)后驗(yàn)概率直方圖
(1)基于GO 法中對(duì)備用相關(guān)的描述,構(gòu)建了分別適用于冷、熱儲(chǔ)備的操作符,給出了其向DBN 轉(zhuǎn)化的方法,并以一個(gè)簡(jiǎn)單的控制單元為例,證明了該方法在冗余系統(tǒng)可靠性評(píng)估中的有效性與正確性。
(2)共因失效是冗余可修系統(tǒng)中不可忽視的因素,若將熱備冗余系統(tǒng)當(dāng)作獨(dú)立失效來(lái)處理,必然會(huì)造成分析結(jié)果的誤差,難以真實(shí)反映系統(tǒng)的運(yùn)行狀況。
(3)憑借DBN 強(qiáng)大的推理能力,可方便地計(jì)算系統(tǒng)中每個(gè)部件正常工作的概率,彌補(bǔ)了GO 法計(jì)算不便的劣勢(shì),還可利用其故障診斷功能,迅速確定研究對(duì)象在發(fā)生故障時(shí)的薄弱環(huán)節(jié),為制定冗余系統(tǒng)的防控與維修措施提供了理論支持。