宋新建 鐘 純 李 楠 楊煜普
(上海交通大學(xué)電子信息與電氣工程學(xué)院,上海 200240)
基于集成核可預(yù)測(cè)元分析的非線(xiàn)性故障檢測(cè)
宋新建 鐘 純 李 楠 楊煜普
(上海交通大學(xué)電子信息與電氣工程學(xué)院,上海 200240)
以核可預(yù)測(cè)元分析(KForeCA)為例,將它與集成學(xué)習(xí)方法相結(jié)合,提出了一種基于集成核可預(yù)測(cè)元分析(EKForeCA)的非線(xiàn)性故障檢測(cè)方法。給出EKForeCA的故障檢測(cè)原理。TE仿真實(shí)驗(yàn)結(jié)果表明:基于EKForeCA的故障檢測(cè)方法可有效提高故障檢測(cè)靈敏度和魯棒性。
非線(xiàn)性故障檢測(cè) 核可預(yù)測(cè)元分析 集成學(xué)習(xí)方法 統(tǒng)計(jì)量
近年來(lái),現(xiàn)代工業(yè)過(guò)程逐漸趨向于規(guī)模化和復(fù)雜化,因此工業(yè)過(guò)程的安全性和可靠性越來(lái)越受到人們的關(guān)注。隨著測(cè)量技術(shù)的不斷發(fā)展,工業(yè)過(guò)程中的大量過(guò)程變量被保存下來(lái),為此基于數(shù)據(jù)驅(qū)動(dòng)的故障檢測(cè)技術(shù)在工業(yè)過(guò)程中得到了廣泛應(yīng)用[1~3]。
作為一種傳統(tǒng)的多元統(tǒng)計(jì)故障檢測(cè)方法,主元分析法(PCA)假設(shè)數(shù)據(jù)服從高斯分布,并且數(shù)據(jù)變量之間線(xiàn)性相關(guān)。然而實(shí)際的工業(yè)過(guò)程數(shù)據(jù)是有限的,常表現(xiàn)出一定的非高斯性,且不同的工業(yè)過(guò)程數(shù)據(jù)具有不同的非線(xiàn)性特征,因此PCA方法在實(shí)際應(yīng)用中存在一定的缺陷[4~6]。核可預(yù)測(cè)元分析(KForeCA)方法作為一種新興的數(shù)據(jù)特征提取方法,考慮了數(shù)據(jù)之間的時(shí)序相關(guān)性,能夠提取具有動(dòng)態(tài)時(shí)序特性和可預(yù)測(cè)性的數(shù)據(jù)特征,同時(shí)又引入了非線(xiàn)性核函數(shù),能夠?qū)⒌途S空間中的數(shù)據(jù)通過(guò)非線(xiàn)性映射投影到高維空間,因此可以很好地處理非線(xiàn)性的過(guò)程數(shù)據(jù)[7,8]。其中,核函數(shù)的選擇非常關(guān)鍵,這直接影響了該方法提取非線(xiàn)性信息的能力,進(jìn)而影響故障檢測(cè)的效果[9,10]。對(duì)于核函數(shù)的選擇,一般的方法是根據(jù)經(jīng)驗(yàn)選擇一個(gè)核函數(shù)并確定核函數(shù)的參數(shù),這具有一定的盲目性,很難在故障信息未知的情況下獲取合適的核參數(shù),而且即便是對(duì)于同一個(gè)核函數(shù),不同的故障可能在不同的核參數(shù)下具有不同的檢測(cè)性能[11]。針對(duì)該問(wèn)題,筆者將集成學(xué)習(xí)方法與KForeCA相結(jié)合,提出一種基于集成核可預(yù)測(cè)元分析(EKForeCA)的非線(xiàn)性故障檢測(cè)方法,以提高故障檢測(cè)率,增強(qiáng)過(guò)程檢測(cè)魯棒性。
將低維非線(xiàn)性空間的數(shù)據(jù)映射到線(xiàn)性高維空間后,對(duì)高維空間中的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。則特征空間F的協(xié)方差矩陣ΣF為:
Ki,j=k(xi,xj)=〈Φ(xi),Φ(xj)〉
計(jì)算出核矩陣后,對(duì)Φ(xi)進(jìn)行去中心化處理,得到:
(1)
由式(1)可以得出,去中心化后的核矩陣為:
H=[α1,α2,…,αp]
Λ=diag(λ1,λ2,…,λp),λ1≥λ2≥…≥λp
其中,U是經(jīng)過(guò)非線(xiàn)性核映射和白化處理得到的數(shù)據(jù),滿(mǎn)足E(UUT)=1,U∈Rp。
獲得U后,利用ForeCA方法對(duì)U進(jìn)行處理,提取可預(yù)測(cè)元。ForeCA的基本原理是找到一個(gè)線(xiàn)性變換矩陣WT∈Rp×m,使得S=WTU,其中S為得分矩陣,W為負(fù)荷矩陣,其列向量為負(fù)載向量,且兩兩正交。W的求取可以轉(zhuǎn)換為求解最優(yōu)化問(wèn)題,即:
s.t.wTΣUw=1
其中,SU(ω)表示多變量平穩(wěn)過(guò)程的譜密度,ΨU(k)表示自協(xié)方差函數(shù),ΣU表示協(xié)方差矩陣。
構(gòu)建KForeCA的過(guò)程統(tǒng)計(jì)量L2和SPE:
(2)
其中,L2是通過(guò)可預(yù)測(cè)主元模的變化來(lái)反映系統(tǒng)趨勢(shì)變化的統(tǒng)計(jì)量;SPE統(tǒng)計(jì)量是觀(guān)測(cè)數(shù)據(jù)到可預(yù)測(cè)模型空間的距離,反映測(cè)量值與可預(yù)測(cè)模型之間的偏離程度。
針對(duì)KForeCA方法在核函數(shù)和核參數(shù)選擇方面存在的不足,筆者將KForeCA與集成學(xué)習(xí)方法[13,14]相結(jié)合,提出一種基于EKForeCA的故障檢測(cè)方法。EKForeCA方法選取一系列的高斯核函數(shù)進(jìn)行集成學(xué)習(xí),得到多個(gè)KForeCA訓(xùn)練子模型,然后利用貝葉斯推理將子模型的檢測(cè)結(jié)果轉(zhuǎn)換成故障概率,通過(guò)加權(quán)策略突出故障信息,提高故障檢測(cè)性能。
EKForeCA方法選用的一系列具有不同帶寬參數(shù)的高斯核函數(shù)為:
其中,核函數(shù)序號(hào)ci=2i-1rmσ2,i=1,…,ns。
然后利用這些核函數(shù)分別構(gòu)造不同的KForeCA子模型,根據(jù)式(2)為每一個(gè)KForeCA子模型分別構(gòu)建L2(i)和SPE(i)統(tǒng)計(jì)量:
利用貝葉斯推理把每個(gè)子模型中已導(dǎo)出的傳統(tǒng)檢測(cè)統(tǒng)計(jì)量的數(shù)值轉(zhuǎn)換為故障概率,分別為:
統(tǒng)計(jì)量EL2和ESPE的控制限同樣可以通過(guò)選取合適的置信水平并利用核密度估計(jì)方法獲得。當(dāng)兩個(gè)統(tǒng)計(jì)量均未超出各自的控制限時(shí),判定檢測(cè)過(guò)程處于正常狀態(tài);當(dāng)任一統(tǒng)計(jì)量超出控制限時(shí),則判定為出現(xiàn)故障,觸發(fā)故障警報(bào)。
Tennessee Eastman(TE)模型是一個(gè)基于實(shí)際化工反應(yīng)過(guò)程的基準(zhǔn)模型[16],其過(guò)程變量之間具有很強(qiáng)的耦合、非線(xiàn)性及時(shí)變等特點(diǎn),被廣泛用于評(píng)估過(guò)程檢測(cè)技術(shù)。TE過(guò)程有41個(gè)測(cè)量變量(包括22個(gè)連續(xù)變量和19個(gè)成分變量)和12個(gè)操作變量。TE仿真模型共預(yù)設(shè)了21個(gè)故障,具體見(jiàn)表1。
表1 TE仿真模型的過(guò)程故障
筆者選取TE仿真模型中的22個(gè)連續(xù)變量和11個(gè)操作變量作為被檢測(cè)的變量,選取500個(gè)運(yùn)行在正常狀態(tài)下的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,每一個(gè)故障測(cè)試分別選用960個(gè)樣本構(gòu)造測(cè)試數(shù)據(jù)集,且每一個(gè)過(guò)程故障都是在第161個(gè)采樣時(shí)刻被引入。
高斯核函數(shù)的帶寬參數(shù)通常根據(jù)經(jīng)驗(yàn)公式選擇,即c=2i·5m,i=1,2,…,10。TE模型仿真實(shí)驗(yàn)分別測(cè)試了i=4、i=8時(shí)的KForeCA模型與EKForeCA模型對(duì)于TE過(guò)程21個(gè)故障的檢測(cè)率,結(jié)果見(jiàn)表2。其中,L2和EL2分別反映單個(gè)KForeCA模型與EKForeCA模型的系統(tǒng)變化趨勢(shì),SPE和ESPE分別表示觀(guān)測(cè)數(shù)據(jù)到可預(yù)測(cè)模型空間KForeCA與EKForeCA的距離。
表2 KForeCA、EKForeCA模型對(duì)21個(gè)故障的檢測(cè)結(jié)果
(續(xù)表2)
分析表2中的數(shù)據(jù)可以發(fā)現(xiàn),通過(guò)對(duì)核函數(shù)的集成學(xué)習(xí),對(duì)于大部分過(guò)程故障,EKForeCA基本都能檢測(cè)出故障的發(fā)生與傳播,尤其對(duì)于故障4、10、11、16、20,其故障檢測(cè)率得到了顯著提升。下面結(jié)合故障4和故障16的仿真實(shí)驗(yàn)結(jié)果進(jìn)行具體分析。
KForeCA和EKForeCA對(duì)故障4的檢測(cè)結(jié)果如圖1所示??梢钥闯觯瑹o(wú)論是EL2統(tǒng)計(jì)量還是ESPE統(tǒng)計(jì)量,相比于單個(gè)核函數(shù)的KForeCA子模型,EKForeCA的檢測(cè)效果均得到了極大提升。幾乎在整個(gè)檢測(cè)周期內(nèi),ESPE統(tǒng)計(jì)量都能以非常高的靈敏度將故障檢測(cè)出來(lái)。
圖1 KForeCA和EKForeCA對(duì)故障4的檢測(cè)結(jié)果
由表1可知,故障16是一種未知故障,對(duì)未知故障的檢測(cè)效果可以體現(xiàn)出集成核學(xué)習(xí)方法在故障檢測(cè)領(lǐng)域中的推廣應(yīng)用能力。KForeCA和EKForeCA對(duì)故障16的檢測(cè)結(jié)果如圖2所示,可以看出,L2、SPE統(tǒng)計(jì)量在采樣區(qū)間內(nèi)的檢測(cè)效果都不是很理想,不同核參數(shù)下的檢測(cè)效果也有很大差異,而基于集成核學(xué)習(xí)方法的EL2和ESPE統(tǒng)計(jì)量基本都能夠檢測(cè)出區(qū)間內(nèi)的絕大部分故障,其檢測(cè)靈敏度明顯優(yōu)于基于單個(gè)核函數(shù)的L2和SPE統(tǒng)計(jì)量。
圖2 KForeCA和EKForeCA對(duì)故障16的檢測(cè)結(jié)果
筆者針對(duì)核學(xué)習(xí)方法中核函數(shù)參數(shù)選擇存在的問(wèn)題,利用集成學(xué)習(xí)的思想,以KForeCA為例,將它與集成學(xué)習(xí)方法相結(jié)合,對(duì)一系列的核函數(shù)進(jìn)行集成學(xué)習(xí),訓(xùn)練得到若干不同的KForeCA子模型,利用貝葉斯推理將各個(gè)子模型的檢測(cè)結(jié)果轉(zhuǎn)換成故障概率,并通過(guò)加權(quán)策略突出故障信息,進(jìn)而提高過(guò)程檢測(cè)性能。通過(guò)對(duì)核函數(shù)的集成學(xué)習(xí),避免了盲目選擇單個(gè)核函數(shù)對(duì)檢測(cè)性能的不利影響,提高了過(guò)程檢測(cè)魯棒性。TE仿真模型的實(shí)驗(yàn)結(jié)果表明,與基于單個(gè)核函數(shù)的KForeCA模型的故障檢測(cè)方法相比,基于集成核學(xué)習(xí)的EKForeCA故障檢測(cè)模型顯著提高了過(guò)程檢測(cè)性能。因此,基于集成核學(xué)習(xí)方法的故障檢測(cè)方法在非線(xiàn)性過(guò)程檢測(cè)領(lǐng)域具備一定的研究潛力與應(yīng)用價(jià)值。
[1] 李晗,蕭德云.基于數(shù)據(jù)驅(qū)動(dòng)的故障診斷方法綜述[J].控制與決策,2011,26(1):1~9.
[2] 周東華,胡艷艷.動(dòng)態(tài)系統(tǒng)的故障診斷技術(shù)[J].自動(dòng)化學(xué)報(bào),2009,35(6):748~758.
[3] 赫偉英,裴峻峰.往復(fù)機(jī)械故障診斷技術(shù)進(jìn)展綜述[J].化工機(jī)械,2010,37(5):671~674.
[4] Jiang Q,Yan X,Huang B.Performance-Driven Distributed PCA Process Monitoring Based on Fault-Relevant Variable Selection and Bayesian Inference[J].IEEE Transactions on Industrial Electronics,2016,63(1):377~386.
[5] Ge Z,Song Z,Gao F.Review of Recent Research on Data-Based Process Monitoring[J].Industrial & Engineering Chemistry Research,2013,52(10):3543~3562.
[6] 王迎,王新明,趙小強(qiáng).基于小波去噪與KPCA的TE過(guò)程故障檢測(cè)研究[J].化工機(jī)械,2011,38(1):49~53.
[7] Goerg G.Forecastable Component Analysis[C].The 30th International Conference on Machine Learning.Atlanta:ICML, 2013:64~72.
[8] 林圣才,楊煜普,屈衛(wèi)東.一種基于可預(yù)測(cè)元分析的故障診斷方法[J].化工自動(dòng)化及儀表,2015,42(3):272~276.
[9] Lee J M,Yoo C K,Sang W C,et al.Nonlinear Process Monitoring Using Kernel Principal Component Analysis[J].Chemical Engineering Science,2004,59(1):223~234.
[10] Cho J H,Lee J M,Sang W C,et al.Fault Identification for Process Monitoring Using Kernel Principal Component Analysis[J].Chemical Engineering Science,2005,60(1):279~288.
[11] Li N,Yang Y.Ensemble Kernel Principal Component Analysis for Improved Nonlinear Process Monitoring[J]. Industrial & Engineering Chemistry Research,2015,54(1):318~329.
[12] Sang W C,Lee C,Lee J M,et al.Fault Detection and Identification of Nonlinear Processes Based on Kernel PCA[J]. Chemometrics & Intelligent Laboratory Systems,2005,75(1):55~67.
[13] Banfield R E,Hall L O,Bowyer K W,et al.A Comparison of Decision Tree Ensemble Creation Techniques[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2007,29(1):173~180.
[14] Polikar R.Ensemble Based Systems in Decision Making[J].IEEE Circuit Systems Magazine,2006,6(3):21~45.
[15] Chen Q,Kruger U,Meronk M,et al.Synthesis ofT2,andQ,Statistics for Process Monitoring[J].Control Engineering Practice,2004,12(6):745~755.
[16] Downs J J,Vogel E F.A Plant-Wide Industrial Process Control Problem[J].Computers & Chemical Engineering,1993, 17(3):245~255.
NonlinearFaultDetectionBasedonEnsembleKernelForecastableComponentAnalysis
SONG Xin-jian, ZHONG Chun, LI Nan, YANG Yu-pu
(CollegeofElectronicInformationandElectricalEngineering,ShanghaiJiaotongUniversity,Shanghai200240,China)
Taking KForeCA(Ensemble Kernel Forecastable Component Analysis)as an example, having it combined with ensemble learning and KForeCA based to put forward the nonlinear fault detection method was implemented, including the presentation of EKForeCA fault detection principle. The TE simulation results show that, that the EKForeCA-based nonlinear fault detection method can improve the sensitivity of fault detection effectively and the robustness.
nonlinear fault detection, KForeCA, ensemble learning method, statistics
TH165+.3
A
1000-3932(2016)09-0917-06
2016-02-25(修改稿)