顧煜炯,楊 楠,陳東超,宋 磊
(1.華北電力大學 能源動力與機械工程學院,北京 102206;2.東北電力大學 能源與動力工程學院,吉林 1320123.中國科學院 太空應用重點實驗室,北京 100094)
汽輪機故障診斷問題的復雜性主要表現(xiàn)為兩點:
(1)正常樣本多,故障樣本少;
(2)在線監(jiān)測數(shù)據(jù)不足。數(shù)據(jù)不足是相對于設備的故障模式數(shù)量而言的,如監(jiān)測高壓轉子旋轉狀態(tài)的測點有6個振動測點、4個溫度測點,但導致旋轉狀態(tài)異常的故障模式有原始質量不平衡、前軸封碰磨、旋轉部件飛脫等20類之多。當前研究一般會對某一類故障采用頻譜分析、小波分析等信號特征提取方法,以獲取更多的故障特征信息,但在缺乏故障樣本的前提下,新獲得的故障征兆也不易在各類故障中得到充分的交叉驗證。
故障診斷方法基本可以劃分為基于模型的方法、基于信號處理的方法,以及基于數(shù)據(jù)驅動的方法[1]。目前,常用的智能故障診斷方法有基于專家系統(tǒng)的方法[2]、基于故障樹分析的方法[3]、基于神經(jīng)網(wǎng)絡的方法[4]、基于支持向量機的方法[5]等。針對復雜系統(tǒng)故障案例不易積累的問題,通過機理分析獲得診斷模型,在復雜系統(tǒng)故障診斷中已有類似研究。Chen等[6]以多變量因果分析為基礎,對貝葉斯網(wǎng)絡(Bayesian Network,BN)的建模過程進行了改進,以田納西-伊斯曼(Tennessee Eastman,TE)化工過程為例,構建監(jiān)測變量因果網(wǎng)絡結構,并以正常樣本訓練網(wǎng)絡參數(shù),用于監(jiān)測和診斷反應過程的故障。但該模型建立在正常運行時各過程變量之間的因果關系之上。而具有強耦合性的機械系統(tǒng)故障,由于故障征兆在正常狀態(tài)下的因果關系并不明顯,而可供訓練的故障樣本也很缺乏,因此不易在汽輪機振動故障診斷中應用。
本文在總結汽輪機故障診斷特殊性的基礎上,提出以故障樹分析(Fault Tree Analysis,F(xiàn)TA)和失效模式和影響分析(Failure Mode and Effect Analysis,F(xiàn)MEA)為機理分析指導,建立3層故障因果網(wǎng)絡。在解釋基于故障機理建立診斷模型的不確定性問題的基礎上,通過Noisy-Or/And模型,將因果網(wǎng)絡轉化貝葉斯網(wǎng)絡。以原因層和征兆層作為模型輸入,推理中間層故障模式的后驗概率。最后,針對汽輪機多類碰磨故障診斷,從參數(shù)變化、設備缺陷等分析故障原因,根據(jù)振動特征分析故障結果,建立診斷模型,驗證本文方法的有效性。
設備的故障模式是指設備故障表現(xiàn)形式的抽象表述,即設備故障期間所發(fā)生的、能被觀察或被測量到的故障現(xiàn)象的規(guī)范描述。圍繞故障模式展開的故障機理分析是針對故障產(chǎn)生的機理、后果及其在監(jiān)測系統(tǒng)中表現(xiàn)特征的基礎研究。
FTA是可靠性研究中分析故障原因的工具,分析結果是以邏輯門表示的一種倒樹狀因果關系圖。從故障發(fā)生發(fā)展過程來看,F(xiàn)TA是從“故障發(fā)生”向前分析“故障原因”的過程[7]。
FMEA是在假定只有一種故障發(fā)生的前提下,分析故障對系統(tǒng)局部和全局造成的影響[8]。從故障發(fā)生發(fā)展過程來看,F(xiàn)MEA是從“故障發(fā)生”向后分析“故障結果”的過程。
將FMEA和FTA思想相結合,對于復雜系統(tǒng)的故障分析步驟如下:
(1)確定分析范圍,劃分系統(tǒng)結構初步確定要分析的故障模式清單;
(2)基于FTA“演繹法建樹”,分析各層次故障原因;
(3)基于FMEA中故障發(fā)生后對局部和全局的影響,尋找反映故障的特征參量。
為清晰、系統(tǒng)描述故障機理中的因果關系,本文提出1種3層網(wǎng)絡結構的故障因果網(wǎng)絡(Fault Cause and Effect Nets,F(xiàn)CEN),見圖1,以圖形化結構梳理故障模式的診斷知識。
圖13 層故障因果網(wǎng)絡與征兆識別研究
其中,第1層為故障原因層,是基于多個故障模式的FTA分析得到的故障樹聯(lián)立形成的網(wǎng)絡結構,包含了故障模式的成因知識信息;第2層為故障模式層,是故障機理分析的核心,也是故障診斷的目標;第3層為故障特征層,是基于多種故障模式FMEA分析得到的故障影響,總結為采用監(jiān)測、檢修、實驗等手段可獲得的故障特征描述形成的征兆集合。FCEN以關系型網(wǎng)絡結構將設備多類故障模式的成因、現(xiàn)象以及抽象名稱有機結合,從設備功能、故障原因、故障后果、監(jiān)測系統(tǒng)響應、檢修現(xiàn)象等方面,盡可能全面描述了設備所有可能的故障因果鏈。
最后,結合征兆識別研究中的多種特征提取方法,形成將故障機理知識與故障監(jiān)測信息融合的機理分析+征兆識別的診斷研究框架。機理分析+征兆識別可以充分發(fā)揮專家診斷經(jīng)驗在因果關系歸納總結上的優(yōu)勢。應用特征工程、模式識別等機器學習算法分析監(jiān)測數(shù)據(jù)時,前期的機理研究可為其提供更加系統(tǒng)化的專業(yè)背景知識,提高機器學習效率。
FCEN分析了設備各種故障模式的原因與征兆,征兆識別研究提供了在線征兆識別方法,但將其轉化為診斷模型時存在以下問題:
(1)故障與征兆的對應關系普遍存在多對多關系,當故障征兆表現(xiàn)不充分時容易出現(xiàn)多類故障無法區(qū)分的情況;
(2)故障原因分析得出的是確定性的因果關系,而現(xiàn)場對于故障原因的排查不可能一步到位,當原因查找不充分時無法進行推理。因此,需要一種方法將故障與征兆、原因與故障間的確定性因素引入建模過程,實現(xiàn)更加穩(wěn)定的診斷模型。
1988年Pear提出了貝葉斯網(wǎng)絡,以嚴格的概率學為基礎,有效描述不確定性問題中的因果關系,并實現(xiàn)問題的推理和預測。因此BN模型在智能診斷領域受到了廣泛關注[9-10]。
針對基于FCEN建立診斷模型中存在的問題,對于BN描述的不確定性做如下物理解釋:
先驗概率:在設備可靠性研究中認為,設備發(fā)生故障是必然的,只是發(fā)生的概率有高有低,故障發(fā)生的概率近似服從某種概率分布規(guī)律。本文中特指其為根據(jù)先驗知識對故障原因R發(fā)生概率的估計,稱為先驗概率。由于P( )R在重大設備診斷中不易獲得,在2.3小節(jié)討論了解決措施。
條件概率:指故障F(或征兆S)在故障原因R(或故障F)發(fā)生(或不發(fā)生)條件下出現(xiàn)的概率P(F|R()或P(S|F))。如轉子發(fā)生不平衡故障(F1=T)時,該轉子軸承水平方向振動超限(S1=T)的概率P(S1=T|F1=T)。BN中以條件概率表(Conditional Probability Table,CPT)描述完整的條件概率。
后驗概率:指在得知故障征兆S(或故障模式F)出現(xiàn)與否(或概率值)后,利用貝葉斯定理對故障模式F(或故障原因R)出現(xiàn)的概率進行修正,而得到的更符合當前情況的概率。將經(jīng)典的貝葉斯公式作為計算原理進行計算
FCEN中的因果關系可以定義BN中的事件間有向弧的連接。但有向弧條件概率的賦值和無父節(jié)點事件的先驗概率賦值則需要根據(jù)FTA和FMEA分析的特點進行轉化。
對比FTA中故障樹的特點,將BN網(wǎng)絡進行相應定義,以保留原因層中的故障機理信息,同時引入針故障診斷中存在的不確定性因素,如表1所示。
FMEA分析的前提是假設某單一故障發(fā)生對系統(tǒng)產(chǎn)生的影響,即故障征兆。因此,當轉化為BN網(wǎng)絡關系時,同一征兆的不同故障模式父節(jié)點間相互獨立,這一特性可以簡化條件概率賦值過程。即通過多個單一故障對征兆的條件概率可得到多故障模式下征兆的條件概率表CPT。
故障的診斷過程可以被理解為:從具體事件現(xiàn)象到抽象事件發(fā)生與否的推理過程。即根據(jù)監(jiān)測系統(tǒng)中各種測量信號的異常,推理出其為某故障結果的整體涌現(xiàn),本文稱之為尋找“現(xiàn)象因果”關系的過程。而基于機理分析的因果網(wǎng)絡是建立在對故障機理分析的推測與演繹之上的,是對確定性因果關系的描述,可稱之為“機理因果”關系。雖然故障的發(fā)生、發(fā)展過程大致按照故障機理規(guī)劃的“路徑”進行,但從監(jiān)測系統(tǒng)角度來看,從檢測到原因事件到結果現(xiàn)象的檢出還受到許多諸如環(huán)境、檢測條件、故障程度等條件的影響,因此診斷推理要尋找的“現(xiàn)象因果”關系存在著一定的不確定性。要將機理因果網(wǎng)轉化為診斷模型,就要將不確定性融入其中,否則根據(jù)絕對的因果網(wǎng)絡無法診斷復雜的故障現(xiàn)象。
Noisy-Or模型在表達不確定性關系上已經(jīng)有了很多應用。該模型的使用條件是事件原因之間相互獨立。而FTA和FMEA分析形成的3層故障因果網(wǎng)絡完全滿足Noisy-Or的建模條件。
考慮到“現(xiàn)象因果”中存在的不確定性因素,采用Noisy-Or模型的改進版Leaky Noisy-Or|And模型,將“機理因果”關系和現(xiàn)象間的不確定性影響抽象為BN模型描述的“現(xiàn)象因果”模型。
Leaky Noisy-OrAnd模型如圖2所示。
函數(shù)F為“與”計算時表示為Leaky Noisy-And模型;為“或”計算時表示為Leaky Noisy-Or模型。以Leaky Noisy-Or模型為例(即F函數(shù)為“或”運算),這樣的模型設計表示如下不確定性關系:
表1 BN針對故障樹的定義
圖2 Leaky Noisy-Or/And概念模型
(1)當輸入Xi=True,其他輸入為F時,結果Y為True的概率P(Y=T|Xi=T,Xj=F,j=1,2..n,j≠i)并不等于1,而是有一定的概率qi使得輸出結果Y為False,即P(Y=F|Xi=T,Xj=F,j=1,2…n,j≠i)=qi??衫斫鉃榇嬖谝粋€失效函數(shù)Ni,具有概率qi使輸出X'i為F和概率1-qi使X'i=Xi。概率qi稱為失效概率。
(2)當輸入都為F時,最終結果P(Y'=T|Xi=F,i=1,2,…,n)也不等于1,而是有一定的概率ql使輸出的結果為Y'=T。即存在失效函數(shù)Nl和恒定額外輸入Xl=T使得P(Y′=F|Xi=F,i=1,2,…,n)=ql,Xl稱為泄露因素,ql稱為泄露概率。
對照實際診斷采用的“現(xiàn)象因果”關系與故障“機理因果”關系存在的不確定性,Leaky Noisy-Or/And模型的失效概率qi和泄露概率ql物理意義定義如下:
失效概率qi:“或”門表示:由于監(jiān)測手段、測量誤差、故障程度較低等所導致的故障原因(或故障模式)A發(fā)生,而相應的故障模式(或征兆)C未被檢測到的概率。“與”門則表示:故障原因(或故障模式)A和B同時發(fā)生,而相應的故障模式C未被監(jiān)測到的概率(qA=qB)。對于具體故障診斷問題,當故障案例充足時,可以通過統(tǒng)計符合失效概率定義的案例數(shù)量占總體故障案例的比例獲得;當沒有充足故障案例時(大多數(shù)情況下如此),本文建議基于專家經(jīng)驗和故障機理,評估故障因果關系的強度,間接估計失效概率qi。
泄露概率qi:由于對原因事件分析不充分所導致的故障原因(或故障模式)Xi未檢測到,而相應的故障模式(或征兆)被檢測到的概率。(出于保守估計本文中統(tǒng)一設置為0.01)。
Leaky Noisy-Or|And模型不僅合理描述了“現(xiàn)象因果”對于“機理因果”關系的不確定性,而且使BN模型構建時關鍵的CPT賦值工作量大大減少,只需要確定n個失效概率qi(i=1,2,…,n)和一個泄露概率qi即可計算出原本需要2n項的CPT表。
Leaky Noisy-Or模型子節(jié)點Y的條件概率為
其中,XP表示所有父節(jié)點狀態(tài)集合,XT表示XP中所有為T的父節(jié)點集合,qi表示父節(jié)點Xi的失效概率,ql表示泄露概率。
Leaky Noisy-And模型子節(jié)點Y的條件概率為
其中:XT=Ω表示所有父節(jié)點狀態(tài)都為T,XT≠Ω表示所有父節(jié)點不完全為T,qi表示父節(jié)點Xi的失效概率,ql表示泄露概率。
采用Leaky Noisy-OrAnd將“機理因果”關系轉化為BN的過程如下:
(1)確定機理因果關系;
(2)確定各原因節(jié)點的失效概率和因果關系的泄漏概率;
(3)根據(jù)式(2)和式(3)計算對應節(jié)點的CPT。
圖3為“機理因果”關系中的“或”和“與”關系轉化為“現(xiàn)象因果”關系的BN條件概率過程。
BN中無父節(jié)點R的先驗概率P(R)的賦值,采用文獻[11] 中的方法對故障案例進行統(tǒng)計
上式中:P(SR=T)表示原因R經(jīng)故障模式傳遞后最終影響的征兆集合SR出現(xiàn)的概率。由于診斷模型是在發(fā)現(xiàn)征兆之后開始推理的,即P(SR=T)=1,所以原因事件的先驗概率P(R)就可以理解為原因事件在所有引起征兆SR出現(xiàn)的案例中占的比例。例如某機組“2號軸承X方向軸振1X倍頻超限”的100次案例中,有11例是“軸封供汽溫度異?!睂е碌模瑒tP(R)=11∕100=0.11。同時,對于原因節(jié)點的在線判斷方法進行研究,盡量找出原因事件R的在線判別征兆RS,則可將基于原因事件的先驗概率P(R)更新為更為可靠的后驗概率P(R|RS)。
最終,因果網(wǎng)絡轉化為如圖4所示的貝葉斯網(wǎng)絡診斷模型。
圖3 “或”和“與”門關系轉化為BN節(jié)點
圖4 貝葉斯網(wǎng)絡診斷模型結構
BN模型推理大致可以分為4種模式:診斷推理、因果推理、交互因果推理、混合推理[12]。無論采取哪種推理模式,區(qū)別只在與證據(jù)變量和目標變量在網(wǎng)絡中位置的不同,而求解復雜BN模型的方法基本相同,如聯(lián)合樹、變量消除、近似推理等。
根據(jù)統(tǒng)計,國內(nèi)汽輪機彎軸事故中86%是由轉軸碰磨引起的,且通過振動特征判斷轉軸發(fā)生碰磨彎軸事故的診斷技術比較成熟[13]。但是需要經(jīng)驗豐富的專家,才能根據(jù)機組的運行、檢修歷史判斷碰磨產(chǎn)生的具體原因(如設計安裝不當、運行中系統(tǒng)膨脹不暢、材料或熱處理不合格等),而對于不同原因和不同位置的碰磨故障,所采取的消除故障的措施也不相同。例如對于輕微的軸封碰磨,會采用低速磨合方法,而對于浮動油檔碰磨,則需停機更換油檔等。因此,只基于振動信號區(qū)分碰磨彎軸與其他振動故障,已不能滿足汽輪機狀態(tài)檢修與健康管理工作向智能化發(fā)展的需求。經(jīng)過故障機理分析汽輪機碰磨故障主要存在以下幾種模式:軸封碰磨、固定油檔碰磨、浮動油檔碰磨、軸瓦碰磨以及軸向碰磨。
根據(jù)FTA和FMEA分析,建立碰磨故障FCEN后,對網(wǎng)絡中的因果關系強度進行評估,定義因果關系強度與泄露概率的對應關系為:{強相關:q=0.25;一般相關:q=0.3;理論相關:q=0.35}。根據(jù)2.3小節(jié)中對先驗概率的定義,計算各原因事件的先驗概率。表2和表3為在關系型數(shù)據(jù)庫中碰磨故障BN模型參數(shù)的存儲內(nèi)容。
由于幾類碰磨故障所引起的轉子振動異常的現(xiàn)象相同,本文引用文獻[8,14] 中對碰磨振動征兆的描述,并對各故障與征兆間具有相同的失效概率q作了保守估計,如表3所示。
將以上BN參數(shù)導入推理工具GeNIe,建立BN推理模型如圖5所示。
GeNIe是由匹斯堡大學決策系統(tǒng)實驗室研發(fā)的一款針對貝葉斯網(wǎng)絡推理的軟件,具有操作簡單、運行內(nèi)存小、支持算法多樣的特點。該軟件還可通過安裝Simile.py的Python開發(fā)包,嵌入系統(tǒng)進行二次開發(fā)??赏ㄟ^讀取數(shù)據(jù)庫中網(wǎng)絡參數(shù)生成BN網(wǎng)絡,便于嵌入診斷、決策、推理等系統(tǒng)中應用。本文采用GeNIe中默認的聯(lián)合樹算法進行實時推理。
表2 碰磨故障BN模型參數(shù)
表3 碰磨征兆RUB_Symptom及失效概率
實例1:文獻[15] 記載了某機組帶負荷過程低壓缸碰磨故障。該機組為西屋公司350 MW亞臨界機組,初步對振動、運行數(shù)據(jù)和現(xiàn)象進行綜合診斷:
第1次推理:3X軸振有證據(jù)E1={S1=相位(波動),S2=1倍頻(高),S4=幅值趨勢(波動)}。將證據(jù)輸入診斷模型后,各故障的后驗概率如表3所示。
除斷油燒瓦P(FM05|E1)=0.199發(fā)生概率較低外,其他幾種碰磨故障發(fā)生的可能性相似。
第2次推理:有證據(jù)E2={E1,C02_3=汽缸溫差大(低壓缸外缸兩側溫差達25度~30度)}。更新證據(jù)內(nèi)容后,各故障后驗概率最高的變?yōu)椋旱蛪焊纵S封碰磨故障P(FM01|E2)=0.726。從而得出故障鏈為:因溫差大,造成低壓缸缸體變形,進而引起低壓缸軸封碰磨故障,與案例中專家診斷結論相符。根據(jù)故障鏈,采取低壓缸內(nèi)外缸空間檢查以及低負荷磨大間隙的措施,即可抑制低壓缸振動故障。
實例2:文獻[16] 記載了某600 MW亞臨界汽輪機低壓缸碰磨故障。推理過程如下:
第1次推理:2X軸振有證據(jù)E1={S1=相位(波動),S2=1倍頻(高),S4=幅值趨勢(波動)}。各故障的后驗概率如表5所示。
除斷油燒瓦P(FM05|E1)=0.199發(fā)生概率較低外,其他幾種碰磨故障發(fā)生的可能性相似,因此無法得出結論。
第2次推理:在故障排查中,雖然沒有找到可能故障原因,但除了一些原因事件,獲得新證據(jù)集E2={E1,?C01_1=軸封供汽溫度正常,?C01_2=軸封供汽壓力正常,?C02_4=真空正常,?C09=軸承未過載,?C09_1=工況變化無關,?C10_2=潤滑油溫度正常,?C11=脹差正常,?C11_1=軸向位移正常},第2次推理結果縮小了診斷范圍:初步判斷固定油檔和浮動油檔碰磨的可能性最大,分別為P(FM03|E2)=0.491和P(FM02|E2)=0.467。
表4 實例診斷1
表5 實例診斷2
圖5 GeNie中搭建的碰磨故障BN模型
第3次推理:在沒有更多證據(jù)的情況下,對引起這兩種故障的直接原因C03C05C06C07C08發(fā)生的可能性進行排序,得出故障原因排查順序為:C05C08C03C07C06。
案例中顯示,經(jīng)過之后的停機檢查,確認故障原因為碳化物積累C05,處理后運行正常。
該案例說明,基于因果網(wǎng)絡的貝葉斯診斷網(wǎng)絡不僅可以根據(jù)出現(xiàn)的故障特征和原因推理故障模式,并且可以像專家一樣,根據(jù)排除法,縮小診斷范圍,并根據(jù)當前信息,給出進一步排查故障原因的順序建議,實現(xiàn)了復雜故障問題的反復推理和驗證。
提出了一種以故障機理分析為基礎構建BN智能診斷模型的方法。診斷模型可與檢修工作結合,實現(xiàn)多次推理,得出故障因果鏈,輔助排查故障。本文創(chuàng)新點有以下幾點:
(1)提出了故障因果網(wǎng)(FCEN),可系統(tǒng)描述故障機理知識。為汽輪機故障診斷這類主要依靠經(jīng)驗歸納總結、不易積累樣本學習的問題提供了一種新的知識總結形式。
(2)提出了故障診斷過程是在監(jiān)測數(shù)據(jù)中尋找“現(xiàn)象因果”關系的過程。定義了失效概率和泄露概率,描述“機理因果”關系向“現(xiàn)象因果”關系轉化過程中的不確定性因素。
(3)基于因果網(wǎng)絡的BN模型實現(xiàn)了智能診斷與現(xiàn)場故障排查過程的有機結合,根據(jù)逐步豐富的證據(jù),反復對故障進行推理,為排查工作提供了更加準確的指導建議。