王印松 ,孫天舒 ,丁夢婷 ,袁環(huán)環(huán) ,解沛然
(1.華北電力大學(xué)自動化系,河北保定 071003;2.華北電力大學(xué)控制與計算機工程學(xué)院,北京 102206)
隨著工業(yè)過程的日益大型化和復(fù)雜,提高控制系統(tǒng)的可靠性尤為重要[1].流程工業(yè)中,執(zhí)行器作為控制系統(tǒng)中的關(guān)鍵部件,工作環(huán)境惡劣、故障發(fā)生頻繁,其故障的發(fā)生往往危及整個系統(tǒng)的控制策略,造成巨大的經(jīng)濟損失,因此有關(guān)執(zhí)行器故障檢測技術(shù)的研究對于提高系統(tǒng)可靠性、安全性,保證正常的生產(chǎn)活動具有極為重要的現(xiàn)實意義[2-3].
當(dāng)前執(zhí)行器故障檢測的方法可分為基于解析模型的方法、基于經(jīng)驗知識的方法以及基于數(shù)據(jù)驅(qū)動的方法[4-7].基于解析模型的方法主要包括狀態(tài)估計法[8]、參數(shù)估計法[9]、等價空間法[10]這3種方法.其基本思想是利用系統(tǒng)的物理模型對產(chǎn)生的殘差進行評價來判斷故障是否發(fā)生,是一種比較成熟的方法,但是需要精確的模型,而現(xiàn)代系統(tǒng)結(jié)構(gòu)復(fù)雜、噪聲多、內(nèi)部變量耦合度高,這都為建立精確模型帶來了困難.基于經(jīng)驗知識的方法可分為3大類:專家系統(tǒng)[11]、定性仿真[12]以及模糊邏輯推理[13]的方法.該類方法對模型精度要求不高,但依賴相關(guān)技術(shù)人員的從業(yè)經(jīng)驗對故障進行推理判斷,學(xué)習(xí)性不強且經(jīng)驗知識難以獲得.隨著計算機技術(shù)的發(fā)展,基于數(shù)據(jù)驅(qū)動的故障診斷方法受到了人們的關(guān)注,它通過提取過程數(shù)據(jù)來診斷系統(tǒng)故障,不過分依賴經(jīng)驗知識,不受限于復(fù)雜的機理過程,包括機器學(xué)習(xí)法[14]、信息融合法[15]、信號處理法[16]、粗糙集法[17]和統(tǒng)計分析方法[18]等.文獻[19]利用擴展卡爾曼濾波觀測器估計狀態(tài)向量,計算不同故障執(zhí)行器引起的殘差序列,利用這些殘差所對應(yīng)的概率對無人機執(zhí)行器進行故障檢測和診斷;對于電液執(zhí)行器的故障,文獻[20-21]提出了支持向量機、深度卷積神經(jīng)網(wǎng)絡(luò)等方法來進行檢測,面對復(fù)雜的數(shù)據(jù)展現(xiàn)出更好的診斷能力.但是,以上研究通常設(shè)定系統(tǒng)工作在穩(wěn)定工況下,忽略了系統(tǒng)長期處于動態(tài)調(diào)節(jié)過程的實際情況,從而導(dǎo)致在實際檢測中效果不佳,及時性不好.針對這樣的問題,許多學(xué)者使用了其他數(shù)據(jù)驅(qū)動方法對動態(tài)過程進行故障檢測:文獻[22]提出動態(tài)主元分析方法,用主成分分析(principal component analysis,PCA)方法進行過程監(jiān)測,但其不能給出動態(tài)元素間的相互關(guān)系;文獻[23]使用動態(tài)內(nèi)部主元分析(dynamic internal principal component analysis,DiPCA)并結(jié)合隱馬爾科夫模型(hidden Markov model,HMM)進行動態(tài)性分析,實現(xiàn)了動態(tài)過程的故障檢測.上述研究主要針對穩(wěn)定過程出現(xiàn)故障的情況,然而執(zhí)行器具備更加復(fù)雜的動態(tài)運行過程,這些沒有得到關(guān)注.
流程工業(yè)過程中,由于外界干擾、系統(tǒng)調(diào)節(jié)、對象模型漂移等因素,執(zhí)行器更多的處于動態(tài)調(diào)節(jié)中,而不是穩(wěn)定的狀態(tài).此外,故障的發(fā)生往往是隨機的,動態(tài)情況下的執(zhí)行器故障無法避免,單一的穩(wěn)態(tài)檢測極有可能導(dǎo)致檢測時延.因此,僅針對穩(wěn)定工況下的執(zhí)行器進行故障檢測是片面的,考慮執(zhí)行器動態(tài)過程的故障檢測,對提高生產(chǎn)過程安全性、可靠性具有重要意義.動態(tài)調(diào)節(jié)過程中,執(zhí)行器頻繁動作,難以獲取完備標(biāo)準(zhǔn)的訓(xùn)練集.同時,運行數(shù)據(jù)的局部線性關(guān)系被打破,實現(xiàn)動態(tài)過程的故障檢測需要及時有效地處理數(shù)據(jù)中的動態(tài)特征和非線性特性,過程干擾等因素也對檢測算法的魯棒性提出了一定的要求[24-25].
非負(fù)矩陣分解算法(nonnegative matrix factorization,NMF)是一種非常有效的降維方法[26],但不能很好處理非線性數(shù)據(jù)集;通過核技巧,可將低維空間數(shù)據(jù)映射到高維空間,以此實現(xiàn)線性可分,由此提出了基于核函數(shù)的非負(fù)矩陣分解算法(robust nonnegative matrix factorization,KNMF)[27],KNMF 不僅計算方便、復(fù)雜度低,在特征空間內(nèi)具備NMF所有的數(shù)學(xué)特性,而且比NMF更加靈活,可以為不同的數(shù)據(jù)集選用不同的核函數(shù),從而擁有更好的檢測性能[28].但一般的KNMF算法并不能適應(yīng)于所有的復(fù)雜工業(yè)過程模型.
針對以上問題,本文提出了一種基于KRNMF的執(zhí)行器故障檢測算法.首先,針對動態(tài)調(diào)節(jié)過程缺乏標(biāo)準(zhǔn)訓(xùn)練集的問題,利用基于自動搜索的分段線性化方法從歷史數(shù)據(jù)中建立執(zhí)行器的動態(tài)特性模型,并以此獲得用于訓(xùn)練的數(shù)據(jù)集;其次,針對動態(tài)過程的非線性故障檢測問題,設(shè)計了一種新的算法-核魯棒非負(fù)矩陣分解(kernel robust nonnegative matrix factorization,KRNMF),該算法在KNMF的基礎(chǔ)上引入一個稀疏的誤差矩陣從而隔離異常狀況,提取執(zhí)行器的有效特征,基于SPE統(tǒng)計量實現(xiàn)動態(tài)工況下執(zhí)行器故障的檢測.
針對動態(tài)過程,利用正常狀態(tài)下的執(zhí)行器動態(tài)變化歷史數(shù)據(jù),構(gòu)建它的流量特性曲線.在此使用基于自動搜索的分段線性化建模方法.采集盡可能包含全行程的執(zhí)行器動態(tài)運行數(shù)據(jù),按照控制指令從小到大重排數(shù)據(jù)樣本,并以最小控制指令為起始向后搜索特征區(qū)間.在每個特征區(qū)間上用最小二乘算法辨識模型.
如下式,其中:f代表流量信號,u是執(zhí)行器的控制指令,[Ui,Ui+1]表示第i段特征區(qū)間.
假設(shè)樣本數(shù)目為N,定義如下模型性能指標(biāo):
KRNMF首先基于KNMF算法,利用核技巧將非線性輸入空間的數(shù)據(jù)映射到線性空間,在特征空間進行矩陣分解時,引入一個誤差矩陣通過迭代用以隔離異常信息,從而在實現(xiàn)非線性處理的基礎(chǔ)上提高魯棒性.給定輸入數(shù)據(jù)X ∈Rn×m,n代表變量,m代表樣本.通過映射函數(shù)Φ(·)將數(shù)據(jù)映射到高維特征空間F,得到數(shù)據(jù)矩陣Φ(X)=[Φ(x1)Φ(x2)··· Φ(xm)].在高維特征空間對Φ(X)進行分解
其中:Wφ和Hφ分別是特征空間中映射數(shù)據(jù)的基矩陣和表示矩陣,Sφ則代表誤差矩陣.值得注意的是,Φ(X)是未知的,導(dǎo)致分解過程無法實現(xiàn),為此在等式兩邊左乘(Φ(X))T
根據(jù)文獻[27],核函數(shù)可以定義為
令Y=(Φ(X))TWφ,Q=(Φ(X))TSφ,結(jié)合式(5)-(6)可以轉(zhuǎn)化為如下形式:
由此,高維特征空間的分解問題轉(zhuǎn)化為了對核矩陣的魯棒非負(fù)分解過程.因此,為求解各矩陣的近似解,定義目標(biāo)代價函數(shù)如下:
其中:Y和Hφ分別可以看作核矩陣的基矩陣和表示矩陣,Q則代表誤差矩陣.
式(8)在同時考慮Y,Hφ和Q時是非凸的,而分開考慮時屬于凸優(yōu)化問題,因此通過局部優(yōu)化方法求解各部分的近似解.
1) 固定Q,分別優(yōu)化Y和Hφ,此時式(8)轉(zhuǎn)化為局部優(yōu)化,令J1代表局部目標(biāo)函數(shù)
然而,Y和Hφ的迭代過程中,使代價函數(shù)最小的優(yōu)化結(jié)果并不是唯一的,因此,需要對Y和Hφ添加標(biāo)準(zhǔn)化步驟
2) 固定Y和Hφ,優(yōu)化Q,此時的優(yōu)化目標(biāo)函數(shù)形式如下:
應(yīng)用文獻[24]中的定理,考慮一個l1最小化問題
式(17)的特解可以通過定義的軟閾值算子Tμ(x)得出
根據(jù)上述定理,結(jié)合式(16)-(17)的結(jié)構(gòu)特征,得到Q的更新法則
核魯棒非負(fù)矩陣分解的核心思想是利用核技巧將非線性數(shù)據(jù)映射到高維線性空間中,從而解決非線性問題.通過將核矩陣分解出稀疏的誤差矩陣,隔離異常信息,以此解決魯棒性問題.根據(jù)第3.2節(jié)的理論推導(dǎo),得到KRNMF的算法步驟如表1所示.
表1 KRNMF算法流程Table 1 KRNMF algorithm flow
本文模仿KNMF算法的平方預(yù)測誤差(SPE)監(jiān)控統(tǒng)計量,設(shè)計了新的SPE統(tǒng)計量.二者的區(qū)別在于,前者僅表示測試量與檢測模型的偏離程度,后者表示剔除訓(xùn)練集異常特征后的測試量與檢測模型的偏離程度.訓(xùn)練集雖然是正常數(shù)據(jù),但并非標(biāo)準(zhǔn)數(shù)據(jù),依舊包含部分噪聲干擾等異常信息.新的SPE統(tǒng)計量通過引入包含該信息的誤差矩陣從而在檢測過程中剔除了它的干擾,避免發(fā)生誤報、漏報.計算公式如下:
評價故障檢測性能的指標(biāo)主要有故障檢測率(FDR)[29]、故障延遲時間(FDT)、誤報率(FAR)和漏報率(MAR)[30]等.計算公式如下:
如式(23)-(26)所示,故障檢測率是指故障樣本中,被正確檢測的故障情況(TP)占實際故障樣本數(shù)(TP+FN)的比例;故障延遲時間是指檢測到故障的時間(DT)與實際故障發(fā)生的時間(AT)的差距;誤報率是指正常樣本中,判斷為故障的情況(FP)占正常樣本總數(shù)(FP+TN)的比例;漏報率是指故障樣本中,判斷為正常的情況(FN)占故障樣本總數(shù)(TP+FN)的比例.因此,故障檢測率越高、故障延遲時間越短、誤報率越低、漏報率越低,則說明故障檢測性能越好.
判斷故障的發(fā)生通過使用控制限來衡量,本文采取核密度估計法計算控制限.當(dāng)統(tǒng)計量指標(biāo)超過控制限時,判斷為發(fā)生故障;反之,則為正常狀態(tài).
基于KRNMF的故障檢測具體步驟如下:
步驟1采集正常工況下執(zhí)行器的歷史數(shù)據(jù),構(gòu)建動態(tài)特性模型;
步驟2獲取實時數(shù)據(jù),輸入模型得到標(biāo)準(zhǔn)訓(xùn)練集,進行標(biāo)準(zhǔn)化處理,選取合適的核函數(shù),計算核矩陣,并進行中心化和方差歸一化;
步驟3參照表1中的步驟3至步驟9的迭代過程,計算基矩陣和殘差矩陣;
步驟4根據(jù)式(20)-(22),計算監(jiān)測統(tǒng)計量,使用核密度估計法計算控制限;
步驟5將實時數(shù)據(jù)基于正常數(shù)據(jù)的均值和方差進行標(biāo)準(zhǔn)化處理,依據(jù)步驟2的方法計算核矩陣;
步驟6根據(jù)式(20)-(22),計算新數(shù)據(jù)集的監(jiān)測統(tǒng)計量,判斷其是否超過正常工況下建模時得到的控制限,如果超出則表明發(fā)生故障,反之則為正常.
本節(jié)選取3個案例分別驗證KRNMF算法對執(zhí)行器動態(tài)調(diào)節(jié)過程故障檢測的有效性和及時性.包括基于工業(yè)控制系統(tǒng)中執(zhí)行器診斷方法的發(fā)展與應(yīng)用(DAMADICS)平臺、基于水箱平臺的仿真實驗和基于火電廠減溫水調(diào)節(jié)閥的實際數(shù)據(jù)實驗.KNMF,核主成分分析(KPCA)被選作對比算法.3個實驗中均采用高斯核函數(shù),核密度估計的置信度設(shè)為95%.
本文以DAMADICS平臺[31]為基礎(chǔ),進行執(zhí)行器故障診斷算法的研究.該平臺由歐洲訓(xùn)練基金會在2002年至2006年期間研究開發(fā),充分仿真氣動調(diào)節(jié)閥的工作狀態(tài).其氣動調(diào)節(jié)閥由氣動執(zhí)行機構(gòu)、調(diào)節(jié)結(jié)構(gòu)、閥門定位器和一些附件組成,平臺模擬了氣動調(diào)節(jié)閥可能發(fā)生的仿真故障以及幾類發(fā)生在制糖工藝中的實際故障.因此,在模擬、診斷閥門的故障研究中多有應(yīng)用.例如,文獻[32]利用DAMADICS平臺的19種不同故障模式來驗證提出的故障檢測與診斷方法的有效性.
本文中,首先在DAMADICS平臺上,采用正弦信號作為控制指令產(chǎn)生執(zhí)行器全行程的數(shù)據(jù)樣本,然后,利用基于自動搜索的分段線性化方法建立流量特性曲線.設(shè)定模型指標(biāo)閾值為0.002,初始特征區(qū)間長度為樣本總數(shù).圖1是上下行程的特性曲線(實線)及建模結(jié)果(虛線).從圖中可以看出,采用本文的建模方法可以有效的搜索到合適的特征區(qū)間,并且每個區(qū)間內(nèi)的流量特性的估計能夠確保在允許精度范圍內(nèi).
圖1 DAMADICS平臺執(zhí)行器流量特性曲線Fig.1 Flow characteristic curve on DAMADICS platform
為了驗證本文提出的算法在執(zhí)行器動態(tài)過程中的檢測效果,給定正弦信號u=0.28 sin(0.02πt)+0.72作為輸入的控制指令,在故障1,6,13,19狀態(tài)下仿真過程數(shù)據(jù),故障在第300 s發(fā)生.以檢測樣本的控制指令為輸入,線性化后的特性曲線為模型,可以獲得對應(yīng)控制指令的訓(xùn)練集.
本文算法與KNMF,KPCA方法的檢測結(jié)果如圖2所示.由圖2可知,本文算法及構(gòu)建的SPE統(tǒng)計量能夠快速準(zhǔn)確的檢測出故障的發(fā)生:在1~300 s之間,監(jiān)測統(tǒng)計量保持穩(wěn)定;在第300 s時,統(tǒng)計量出現(xiàn)突變,超出控制限預(yù)示發(fā)生故障;301~400 s之間,大部分時間都超過了控制限.對于KNMF算法,故障1的檢測在1~300 s出現(xiàn)明顯的誤判.故障19的檢測在300~350 s出現(xiàn)了明顯的漏報.對于KPCA算法,在正常狀態(tài)和故障狀態(tài)下,其監(jiān)測統(tǒng)計量都出現(xiàn)了頻繁的波動情況,由此還產(chǎn)生了許多誤報、漏報的現(xiàn)象.根據(jù)上述分析,可以得出以下結(jié)論:1)處于正常狀態(tài)的監(jiān)測統(tǒng)計量的波動說明KNMF和KPCA不能克服數(shù)據(jù)的動態(tài)特性;2)KNMF和KPCA算法出現(xiàn)誤報、漏報的情況反證本文算法引入的誤差矩陣實現(xiàn)異常信息的隔離,從而提高故障檢測率.
圖2 DAMADICS平臺仿真實驗中各算法的故障檢測效果Fig.2 Fault detection effect of each algorithm in the simulation experiment of DAMADICS platform
為了直觀對比3種方法的優(yōu)劣,統(tǒng)計了故障檢測率、故障誤報率以及故障延遲3個性能指標(biāo),如表2所示.從故障檢測率來看,面對同樣的故障,本文算法的故障檢測率最高,KNMF次之,KPCA最差.本文算法中沒有誤報的情況,個別故障下KNMF存在誤報,而KPCA則一直有誤報警發(fā)生.從故障延遲的角度分析,KRNMF算法的檢測延遲最小,即故障檢測最及時.因此,3個性能指標(biāo)都驗證本文算法故障檢測的準(zhǔn)確性和快速性.此外,3種方法均基于同樣的訓(xùn)練和測試數(shù)據(jù),但是出現(xiàn)了不同的檢測結(jié)果.KPCA容易出現(xiàn)漏報、誤報和故障延遲的原因在于:該方法未能消除樣本數(shù)據(jù)動態(tài)變化的特征,反而受其影響.KNMF相比于KPCA,受動態(tài)變化的影響較小,因此有較好的故障檢測率和誤報率,但是KNMF算法在檢測故障1和故障19時的延遲較高.這表明,執(zhí)行器的動態(tài)特征數(shù)據(jù)掩蓋了故障的發(fā)生,使得KNMF沒有及時辨別出故障信號.與這兩種方法相比,本文算法既能克服執(zhí)行器的動態(tài)變化的影響,又能挖掘出動態(tài)數(shù)據(jù)中存在的故障特征.
表2 DAMADICS平臺仿真實驗中各算法性能指標(biāo)Table 2 Performance indexes of each algorithm in the simulation experiment of DAMADICS platform
本節(jié)基于水箱實驗平臺設(shè)計了一個實現(xiàn)液位控制的單回路系統(tǒng),實驗裝置如圖3所示.水箱的液位通過傳感器和I/O設(shè)備輸入上位機,PID控制器計算出指令控制氣動閥的動作.采集氣動閥的控制指令、閥位反饋以及流量信號,采樣間隔為1 s,故障模式為恒增益故障.開環(huán)狀態(tài)時,利用氣動閥在0~100%的指令下采集的流量變化信號,繪制流量特性曲線如圖4所示,其中實線代表真實的特性曲線,虛線代表使用本文算法構(gòu)建的動態(tài)模型.模型指標(biāo)閾值為0.002,初始特征區(qū)間長度為樣本總數(shù).
圖3 水箱實驗裝置Fig.3 Experimental device for water tank
圖4 水箱實驗執(zhí)行器流量特性曲線Fig.4 Actuator flow characteristic curve in water tank
液位設(shè)定值為r=2 sin(0.01t)+94時對應(yīng)的閉環(huán)系統(tǒng)中的氣動閥信號如圖5所示.其中在第201 s加入了持續(xù)100 s的增益故障.使用動態(tài)模型構(gòu)建訓(xùn)練集,同時利用KPCA,KNMF與本文算法進行對比實驗,檢測效果及各項指標(biāo)如圖6和表3所示.本文算法能夠準(zhǔn)確判斷執(zhí)行器在第201~300 s之間的故障情況,而對其余時間內(nèi)執(zhí)行器的動態(tài)調(diào)節(jié)過程沒有發(fā)生誤判.KNMF的SPE統(tǒng)計量對處于動態(tài)調(diào)節(jié)的非故障過程存在大量誤報,KPCA的SPE統(tǒng)計量也有少量的誤報,這兩種算法對執(zhí)行器的動態(tài)過程的特征提取不夠充分.由實驗結(jié)果可知,本文算法全面優(yōu)于其他兩種方法,保證了及時性和準(zhǔn)確性,同時KRNMF算法具有強大的特征提取能力,可以克服非線性和動態(tài)特征的影響,具有很高的應(yīng)用價值.
表3 水箱實驗中各算法性能指標(biāo)Table 3 Performance indexes of each algorithm in water tank
圖5 水箱實驗氣動閥信號Fig.5 Pneumatic valve signal of water tank experiment
圖6 水箱實驗中的故障檢測效果Fig.6 Fault detection effect in water tank experiment
本節(jié)以火電廠減溫水調(diào)節(jié)閥數(shù)據(jù)為例,驗證本算法的正確性.大修后的機組處于良好的工作狀態(tài)中,認(rèn)為此時無故障,而檢修前的調(diào)節(jié)閥由于長期使用等原因勢必會出現(xiàn)劣化,認(rèn)為此時的調(diào)節(jié)閥是有故障的.使用檢修后的數(shù)據(jù)建模,繪制流量特性曲線如圖7所示,模型指標(biāo)閾值為0.002,初始特征區(qū)間長度為樣本總數(shù).分別使用檢修后和檢修前的數(shù)據(jù)測試3種算法的檢測效果.
圖7 減溫水調(diào)節(jié)閥流量特性曲線Fig.7 Flow characteristic curve of desuperheater control valve
檢修前后對應(yīng)的調(diào)節(jié)閥信號如圖8所示.3種算法檢測結(jié)果如圖9、表4所示.檢修后調(diào)節(jié)閥無故障時,KRNMF算法精確度最高,誤報率為0,而KNMF 和KPCA算法均有較高的誤報率.檢修前的調(diào)節(jié)閥處于故障狀態(tài),同樣的,KRNMF算法的檢測率最高,而其他兩種算法幾乎不能檢測出故障.
圖8 檢修前后調(diào)節(jié)閥信號Fig.8 Signal of valve before and after maintenance
圖9 檢修前后各算法檢測效果Fig.9 Detection effect of each algorithm before and after maintenance
表4 算法效果對比Table 4 Comparison of each algorithm effects
由各項結(jié)果可知,在減溫水調(diào)節(jié)閥的實際數(shù)據(jù)實驗中,本文提出的KRNMF算法具有最高的檢測率和最小的誤報率,同時能夠如實反應(yīng)檢修前后調(diào)節(jié)閥的真實狀態(tài),對實現(xiàn)工業(yè)過程中執(zhí)行器的精準(zhǔn)故障檢測,特別是處于動態(tài)調(diào)節(jié)下的執(zhí)行器,具有一定的指導(dǎo)意義.
本文提出了一種新的基于核魯棒非負(fù)矩陣分解的執(zhí)行器故障檢測方法.該方法構(gòu)建了完備的動態(tài)工況訓(xùn)練集和新的監(jiān)測統(tǒng)計量,實現(xiàn)了執(zhí)行器動態(tài)調(diào)節(jié)過程中的故障檢測,既考慮到了運行數(shù)據(jù)的非線性特性,也能夠克服執(zhí)行器動態(tài)變化的影響,并且通過引入誤差矩陣,提高算法的抗干擾能力.相較于傳統(tǒng)的故障檢測方法,本文算法具有較強的提取能力,可以挖掘出執(zhí)行器動態(tài)調(diào)節(jié)過程中存在的故障特征.通過基于DAMADICS平臺、水箱平臺和火電廠減溫水調(diào)節(jié)閥實際數(shù)據(jù)的對比實驗,充分表現(xiàn)了本文算法在執(zhí)行器故障檢測中的優(yōu)越能力.