鐘 純 李 楠 楊煜普
(上海交通大學(xué)電子信息與電氣工程學(xué)院,上海 200240)
基于核可預(yù)測(cè)元分析的非線性故障檢測(cè)技術(shù)
鐘 純 李 楠 楊煜普
(上海交通大學(xué)電子信息與電氣工程學(xué)院,上海 200240)
為克服可預(yù)測(cè)元分析方法在非線性領(lǐng)域的不足,并更好地反映工業(yè)監(jiān)控過(guò)程的動(dòng)態(tài)特性,將核可預(yù)測(cè)元分析方法引入非線性故障檢測(cè)領(lǐng)域。首先將觀測(cè)數(shù)據(jù)映射到高維特征空間,提取可預(yù)測(cè)元特征;然后基于貝葉斯定理構(gòu)造統(tǒng)計(jì)量,用于監(jiān)控工業(yè)過(guò)程進(jìn)行并檢測(cè)故障。在TE模型的仿真實(shí)驗(yàn)結(jié)果表明:基于核可預(yù)測(cè)元分析的非線性故障檢測(cè)方法能有效提高系統(tǒng)的故障檢測(cè)準(zhǔn)確率。
非線性故障檢測(cè) 核可預(yù)測(cè)元分析 統(tǒng)計(jì)量 TE過(guò)程
對(duì)于復(fù)雜的工業(yè)過(guò)程,要建立其精確的數(shù)學(xué)模型非常困難,而傳統(tǒng)的故障檢測(cè)技術(shù),如主元分析(Principal Component Analysis,PCA)方法,不僅要假設(shè)數(shù)據(jù)服從高斯分布,而且在面對(duì)非線性復(fù)雜工業(yè)數(shù)據(jù)時(shí)存在明顯不足。雖然核主元分析(KPCA)方法能較好地處理非線性數(shù)據(jù),但不能反映數(shù)據(jù)的動(dòng)態(tài)時(shí)序特性[1,2]。因此,基于數(shù)據(jù)驅(qū)動(dòng)的故障檢測(cè)技術(shù)成為研究熱點(diǎn),并獲得了成功應(yīng)用[3~5]。
可預(yù)測(cè)元分析(Forecastable Component Analysis,ForeCA)方法以全新的模型從大量數(shù)據(jù)中挖掘潛在的可預(yù)測(cè)特征,從而反映系統(tǒng)的動(dòng)態(tài)特性,不需要假設(shè)數(shù)據(jù)服從高斯分布,更符合實(shí)際工業(yè)過(guò)程。但是,F(xiàn)oreCA方法是一種線性變換方法,對(duì)于大型工業(yè)過(guò)程中的非線性數(shù)據(jù)無(wú)法較好地提取動(dòng)態(tài)時(shí)序特性(即可預(yù)測(cè)特征),影響故障檢測(cè)準(zhǔn)確率[6]。因此,引進(jìn)核可預(yù)測(cè)元分析(KForeCA)方法,該非線性方法不僅能提取數(shù)據(jù)中的動(dòng)態(tài)時(shí)序特性,而且彌補(bǔ)了ForeCA方法在非線性領(lǐng)域的不足,因此提取的特征更能反映實(shí)際工業(yè)過(guò)程狀況。
在此,筆者提出用KForeCA方法進(jìn)行故障檢測(cè),通過(guò)將輸入樣本映射到高維特征空間,對(duì)數(shù)據(jù)進(jìn)行可預(yù)測(cè)元分析,選取合適的可預(yù)測(cè)元,并基于貝葉斯定理構(gòu)造一個(gè)統(tǒng)計(jì)量來(lái)監(jiān)控系統(tǒng)的運(yùn)行狀況。
KForeCA方法的基本思想是將低維非線性空間中的輸入數(shù)據(jù)映射到高維線性特征空間,并使用核方法避免“維數(shù)災(zāi)難”,然后在特征空間中對(duì)數(shù)據(jù)進(jìn)行ForeCA,提取可預(yù)測(cè)元特征,即尋找一個(gè)負(fù)載矩陣W,使S=WTU,其中,S為提取的可預(yù)測(cè)元特征,U為映射到特征空間后的數(shù)據(jù)。
k(xi,xj)=〈Φ(xi),Φ(xj)〉
(1)
其中〈·,·〉表示內(nèi)積。核矩陣可定義為K=ΘTΘ,由此計(jì)算核矩陣K。標(biāo)準(zhǔn)化后的特征空間核矩陣為:
(2)
Λ=diag(λ1≥λ2≥…≥λd)
H=[α1,α2,…,αd]
(3)
由此可求出特征空間中的數(shù)據(jù)白化后為:
Θs=[Φs(X1),Φs(X2),…,Φs(XN)]
(4)
式中P——白化矩陣;
Θs——標(biāo)準(zhǔn)化后的數(shù)據(jù)。
最后對(duì)白化后的數(shù)據(jù)U進(jìn)行可預(yù)測(cè)元分析。其基本思想是尋找一個(gè)線性變換矩陣WT∈Rd×m,使得S=WTU,其中,W為負(fù)荷矩陣,其列向量為負(fù)載向量,且彼此之間兩兩正交,S為得分矩陣。文獻(xiàn)[6]給出了ForeCA的最優(yōu)化問(wèn)題:
s.t.wTΣUw=1
(5)
式中SU(ω)——多變量平穩(wěn)過(guò)程的譜密度;
ΨU(k)——自協(xié)方差函數(shù);
ΣU——協(xié)方差矩陣。
選取正常工況下的觀測(cè)數(shù)據(jù)X∈Rn×N,其中,n為變量個(gè)數(shù),N為采樣點(diǎn)個(gè)數(shù)。首先將觀測(cè)數(shù)據(jù)映射到高維特征空間,對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化和白化后為U,然后對(duì)其運(yùn)用ForeCA算法,得負(fù)荷矩陣為:
WT=[w1,w2,…,wn]T∈Rn×N
(6)
筆者基于貝葉斯定理構(gòu)造一個(gè)新的統(tǒng)計(jì)量,將傳統(tǒng)的統(tǒng)計(jì)量轉(zhuǎn)換為概率測(cè)度。根據(jù)貝葉斯定理有:
(7)
(8)
(9)
根據(jù)概率值設(shè)置加權(quán)值,對(duì)反映故障信息的可預(yù)測(cè)元特征增加權(quán)重值,這樣更能反映出系統(tǒng)的實(shí)際情況,提高故障檢測(cè)的靈敏度。為減少監(jiān)控結(jié)果的劇烈波動(dòng),提出移動(dòng)時(shí)間窗策略,可以提高EL2統(tǒng)計(jì)量的監(jiān)控性能,對(duì)EL2統(tǒng)計(jì)量可以描述為:
(10)
式中CL——EL2的控制限;
n——移動(dòng)窗的點(diǎn)數(shù);
Δs——加權(quán)矩陣函數(shù)。
(11)
綜上所述,使用KForeCA方法提取系統(tǒng)的可預(yù)測(cè)元特征,基于貝葉斯定理構(gòu)造計(jì)量,建立核可預(yù)測(cè)元模型用于在線數(shù)據(jù)對(duì)系統(tǒng)的監(jiān)控。如果監(jiān)控結(jié)果在統(tǒng)計(jì)量的控制限以下,則系統(tǒng)處于正常工作范圍內(nèi);相反,則認(rèn)為系統(tǒng)此時(shí)不在系統(tǒng)預(yù)測(cè)的變化范圍內(nèi),進(jìn)而檢測(cè)出系統(tǒng)出現(xiàn)故障。
TE(Tennessee Eastman)過(guò)程是基于實(shí)際化工生產(chǎn)過(guò)程提出的一個(gè)仿真系統(tǒng),由連續(xù)攪拌式反應(yīng)釜、冷凝器、氣液分離塔、汽提塔、再沸器及離心式壓縮機(jī)等多個(gè)單元組成[10],其流程如圖1所示。
圖1 TE流程
TE模型有21個(gè)預(yù)設(shè)故障,訓(xùn)練集包含500個(gè)樣本數(shù)據(jù),測(cè)試集由前160個(gè)正常數(shù)據(jù)和后800個(gè)故障數(shù)據(jù)構(gòu)成。將KForeCA方法與傳統(tǒng)PCA方法、KPCA方法、ForeCA方法進(jìn)行比較,7個(gè)故障的檢測(cè)準(zhǔn)確率見(jiàn)表1,其中IDV(4)為反應(yīng)器冷卻水的入口溫度變化,IDV(5)為冷凝器冷卻水的入口溫度變化,IDV(10)為C的進(jìn)料溫度變化(流2),IDV(11)為反應(yīng)器冷卻水的入口溫度變化,IDV(16)、IDV(19)和IDV(20)為未知類(lèi)型故障。
表1 PCA、KPCA、ForeCA、KForeCA的故障檢測(cè)率比較
由表1可知,KForeCA方法和KPCA方法明顯優(yōu)于PCA方法和ForeCA方法;KForeCA方法基于貝葉斯定理構(gòu)造的EL2統(tǒng)計(jì)量的故障檢測(cè)準(zhǔn)確率要高于其他方法,說(shuō)明基于貝葉斯定理的統(tǒng)計(jì)量對(duì)提高故障檢測(cè)準(zhǔn)確率具有有效性。
圖2所示為故障10在4種方法下的故障檢測(cè)監(jiān)控圖,可以看出KForeCA方法基于貝葉斯定理構(gòu)造的統(tǒng)計(jì)量在故障檢測(cè)中具有可行性和有效性。
a. PCA方法
b. KPCA方法
c. ForeCA方法
d. KForeCA方法
筆者介紹了一種基于KForeCA方法的非線性故障檢測(cè)方法。該方法不僅繼承了ForeCA方法的優(yōu)點(diǎn),而且克服了ForeCA方法無(wú)法處理非線性數(shù)據(jù)的不足,同時(shí)針對(duì)傳統(tǒng)的PCA、KPCA方法更能有效地反映系統(tǒng)的動(dòng)態(tài)特性。在可預(yù)測(cè)空間中構(gòu)造基于貝葉斯定理的EL2統(tǒng)計(jì)量,用于反映故障信息的可預(yù)測(cè)元特征,增加權(quán)重值,并利用時(shí)間移動(dòng)窗策略減少波動(dòng),提高了故障檢測(cè)準(zhǔn)確率。在TE模型上的仿真表明,KForeCA方法比傳統(tǒng)的PCA方法、KPCA方法和ForeCA方法的檢測(cè)精度更高、效果更好。
[1] Fan Y,Li P,Zhi H S.KPCA Based on Feature Samples for Fault Detection[J].Control and Decision,2005,20(12):1415.
[2] Lee J M,Yoo C K,Choi S W,et al.Nonlinear Process Monitoring Using Kernel Principal Component Analysis[J].Chemical Engineering Science,2004,59(1):223~234.
[3] 周東華,胡艷艷.動(dòng)態(tài)系統(tǒng)的故障診斷技術(shù)[J].自動(dòng)化學(xué)報(bào),2009,35(6):748~758.
[4] 李晗,蕭德云.基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷方法綜述[J].控制與決策,2011,26(1):1~9.
[5] Kresta J V,MacGregor J F,Marlin T E.Multivariate Statistical Monitoring of Process Operating Performance[J]. The Canadian Journal of Chemical Engineering,1991,69(1):35~47.
[6] Goerg G.Forecastable Component Analysis[C].Proceedings of the 30th International Conference on Machine Learning. Atlanta:ACM,2013:64~72.
[7] Nuttall A H,Carter G C.Spectral Estimation Using Combined Time and Lag Weighting[J].Proceedings of the IEEE, 1982,70(9):1115~1125.
[8] Botev Z I,Grotowski J F,Kroese D P.Kernel Density Estimation via Diffusion[J].The Annals of Statistics,2010, 38(5):2916~2957.
[9] Chen Q,Kruger U,Leung A T Y.Regularised Kernel Density Estimation for Clustered Process Data[J].Control Engineering Practice,2004,12(3):267~274.
[10] Lyman P R,Georgakis C.Plant-wide Control of the Tennessee Eastman Problem[J].Computers Chemical Engineering, 1995,19(3):321~331.
NonlinearFaultDetectionTechnologyBasedonKernelForecastableComponentAnalysis
ZHONG Chun, LI Nan, YANG Yu-pu
(SchoolofElectronicInformationandElectricalEngineering,ShanghaiJiaotongUniversity,Shanghai200240,China)
Considering the forecastable component analysis’(ForeCA) insufficiency in the nonlinear field and in view of reflecting dynamic property of the industrial control, the Kernel forecastable component analysis(KForeCA) was introduced into the nonlinear fault detection. This method can map the data observed into a high-dimensional feature space to extract forecastable component’s features and then to constitute statistics based on Bayes’ theorem so as to monitor industrial process and detect any fault. Simulation on Tennessee Eastman (TE) shows that this KForeCA-based nonlinear fault detection method can improve the accuracy of fault detection.
nonlinear fault detection, KForeCA, statistics, TE process
TH862+.3
A
1000-3932(2016)01-0023-05
2015-06-15(修改稿)基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目——2013非完整數(shù)據(jù)過(guò)程的魯棒故障檢測(cè)與故障認(rèn)知方法(61273161)