梁銀林,劉 慶
(1.東方汽輪機(jī)有限公司,四川德陽618000; 2.東方電機(jī)有限公司,四川德陽618000)
集成KPCA-SVM的汽輪發(fā)電機(jī)組故障診斷
梁銀林1,劉 慶2
(1.東方汽輪機(jī)有限公司,四川德陽618000; 2.東方電機(jī)有限公司,四川德陽618000)
針對汽輪發(fā)電機(jī)組系統(tǒng)故障數(shù)據(jù)呈現(xiàn)出的強(qiáng)非線性、數(shù)據(jù)高維等特點(diǎn),將非線性數(shù)據(jù)處理方法KPCA和小樣本分類器SVM相結(jié)合,提出了一種集成KPCA-SVM的故障診斷方法。首先,該方法將利用KPCA對非線性數(shù)據(jù)的處理能力強(qiáng)的特點(diǎn),在高維特征空間提取故障特征信息;其次,將故障特征信息輸入SVM模型,構(gòu)建分類模型,克服SVM訓(xùn)練不充分、無針對性的缺點(diǎn)。對汽輪發(fā)電機(jī)組模擬故障進(jìn)行仿真實(shí)驗(yàn)表明,提出的方法與SVM和PCA-SVM方法相比,能夠更好地處理非線性數(shù)據(jù),提取有效的分類特征信息,獲得更高的故障模式識別準(zhǔn)確率。
汽輪發(fā)電機(jī)組;特征提取;故障診斷;KPCA;SVM
汽輪發(fā)電機(jī)組是一類由大型旋轉(zhuǎn)動力機(jī)械設(shè)備、自動化控制設(shè)備等通過機(jī)、電、液、熱、信息等多介質(zhì)耦合而成的復(fù)雜機(jī)電系統(tǒng)。這類發(fā)電系統(tǒng)通過TSI系統(tǒng)和DCS系統(tǒng)監(jiān)控和記錄了整個系統(tǒng)運(yùn)行過程狀態(tài),存儲了海量多態(tài)數(shù)據(jù)。汽輪發(fā)電機(jī)組故障診斷是一個非常復(fù)雜的系統(tǒng)工程,融合了多學(xué)科領(lǐng)域的相關(guān)知識,而且故障本身的多因素特點(diǎn),使得難以通過理論分析的方法在故障原因和故障特征之間建立其對應(yīng)關(guān)系,而數(shù)據(jù)驅(qū)動的方法是挖掘海量、高維、多態(tài)數(shù)據(jù)中蘊(yùn)含的故障信息。因此,研究數(shù)據(jù)驅(qū)動的汽輪發(fā)電機(jī)組[1-3],對于及時發(fā)現(xiàn)機(jī)組故障原因、避免重特大安全事故發(fā)生、實(shí)現(xiàn)機(jī)組安全、穩(wěn)定、長周期高效運(yùn)行具有重要意義。
傳統(tǒng)的汽輪發(fā)電機(jī)組故障診斷技術(shù)大多針對某一具體設(shè)備的固定部位和設(shè)備自身的運(yùn)行狀態(tài),缺乏系統(tǒng)層面整體性的研究。汽輪發(fā)電機(jī)組結(jié)構(gòu)復(fù)雜、工作條件特殊 (高溫、高壓、高轉(zhuǎn)速 ),系統(tǒng)故障信號具有背景噪聲干擾大、非平穩(wěn)、非線性的特點(diǎn),其傳播過程途徑與衰減特性復(fù)雜,往往是多故障源信號混疊在一起,對故障信息的正確分析與獲取,進(jìn)而準(zhǔn)確地診斷故障造成困難。因此,從系統(tǒng)層面研究汽輪發(fā)電機(jī)組故障信號的特征分析與提取技術(shù),從系統(tǒng)監(jiān)測數(shù)據(jù)中獲取有效的、正確的故障特征信息,是進(jìn)行準(zhǔn)確故障診斷的技術(shù)關(guān)鍵[4]。
由汽輪發(fā)電機(jī)組的工作原理可知,機(jī)組轉(zhuǎn)子系統(tǒng)的振動是反映汽輪機(jī)運(yùn)行狀態(tài)的重要指標(biāo),采用數(shù)據(jù)驅(qū)動的方法提取軸系振動信號中的故障特征信息,識別機(jī)組故障模式,進(jìn)而對故障原因部位、程度進(jìn)行分析,是對機(jī)組運(yùn)行維護(hù)維修提供技術(shù)支持的一種有效途徑。本文采用KPCA[5-9]的非線性特征提取方法有效挖掘變量間的非線性關(guān)系,結(jié)合SVM處理分類問題的非線性和小樣本特點(diǎn)[9-11],提出集成KPCA-SVM的汽輪機(jī)組故障診斷方法,通過實(shí)驗(yàn)數(shù)據(jù)分析對比,驗(yàn)證了本方法的有效性和實(shí)用性。
核主成分分析方法——KPCA是PCA的非線性擴(kuò)展。其核心思想是:通過非線性映射函數(shù)將輸入空間數(shù)據(jù)映射到高維的特征空間F,在F上進(jìn)行PCA分析,其基本原理如下所述[5]:
(1)
Mλα=Kα
(2)
通過對上式求解,即可獲得要求的特征值λ和與之對應(yīng)的特征向量ν。則X在F空間向量νk上的投影為:
(3)
(4)
其中En為單位矩陣。
支持量機(jī)(SVM)是一種基于統(tǒng)計學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險最小化原理的機(jī)器學(xué)習(xí)算法,相比于傳統(tǒng)學(xué)習(xí)方法,SVM具有精度高、運(yùn)算速度快、泛化推廣能力強(qiáng)等特點(diǎn),能夠解決傳統(tǒng)學(xué)習(xí)方法的過學(xué)習(xí)、模型選擇、維數(shù)災(zāi)難、非線性等問題,因此,支持向量機(jī)廣泛應(yīng)用于多個領(lǐng)域。
SVM的內(nèi)涵是通過核函數(shù)將原始數(shù)據(jù)嵌入高維特征空間,從而在核特征空間中求取最優(yōu)超平面分類器實(shí)現(xiàn)線性分類。SVM的實(shí)質(zhì)是通過求解二次優(yōu)化問題解決線性不可分和非線性可分兩類問題,其中線性不可分問題的判別函數(shù):
f(x)=sgn[(w·x)+b]=
(5)
但在大多數(shù)情況下,因研究對象常伴有諸多非線性因素,實(shí)際采集的數(shù)據(jù)分類呈非線性可分。對此,引入核函數(shù),將輸入空間的非線性可分轉(zhuǎn)變?yōu)楦呔S特征空間的線性可分,其最優(yōu)分類函數(shù)為:
f(x)=sgn((w·x)+b)=
(6)
由上述原理可知,SVM不僅可以用于模式線性分類,而且還能夠利用“核技巧”解決非線性模式分類問題。
SVM本質(zhì)是一種針對兩分類問題的分類器,但是實(shí)際模式分類往往是針對多分類問題。對于多分類問題,SVM的解決途徑通常有兩種:一種是通過多個兩類SVM分類器的組合實(shí)現(xiàn)多分類,如一對多(One-Against-Rest)、一對一(One-against-One)和導(dǎo)向無環(huán)圖(DGASVM);第二種是通過求解多個分類決策函數(shù)的最優(yōu)化問題實(shí)現(xiàn)多分類。兩者相比較,后者的問題求解涉及變量多,求解復(fù)雜,導(dǎo)致訓(xùn)練速度慢、分類精度差。針對汽輪機(jī)組運(yùn)行數(shù)據(jù)的海量多態(tài)、非線性等特點(diǎn),本文SVM將采用一對一分類策略實(shí)現(xiàn)故障模式多分類。
本文提出一種集成KPCA-SVM的汽輪機(jī)組故障診斷方法,用來提取原始數(shù)據(jù)中的有效分類信息,挖掘原始數(shù)據(jù)特征中的整體特征信息作為分類特征,從而進(jìn)行故障模式識別。利用KPCA對原始數(shù)據(jù)進(jìn)行非線性特征提取,并將其作為SVM模型的輸入進(jìn)行訓(xùn)練,建立故障模式分類模型。
基于集成KPCA-SVM建模方法具體步驟如下:
(1)集成KPCA-SVM故障模式診斷模型建立
(a)對汽輪機(jī)組故障案例數(shù)據(jù)X,通過KPCA提取數(shù)據(jù)非線性主元,將其當(dāng)作SVM分類器的訓(xùn)練數(shù)據(jù)。
(c)通過上述條件,建立第k個支持向量機(jī)分類器模型:
(7)
(d)重復(fù)步驟(b)和(c),直到獲得故障模式案例數(shù)據(jù)所有的支持向量分類器。
(2)KPCA-SVM故障模式在線診斷模型建立
(a) 裝入SVM模型參數(shù)。
(c)根據(jù)決策值輸出故障模式類型。
集成KPCA-SVM診斷模型的構(gòu)建,需要根據(jù)研究系統(tǒng)的特點(diǎn),選取適數(shù)據(jù)性的KPCA核參數(shù)和主元個數(shù),以及SVM核參數(shù)及正則參數(shù),目前研究只是給出了一般性的指導(dǎo)原則[2,4],本文不失一般性的選取合適的模型參數(shù),以便對集成KPCA-SVM的方法的正確性及實(shí)用性進(jìn)行驗(yàn)證。
汽輪發(fā)電機(jī)組故障具有多樣性、多層次性、復(fù)雜性、非線性、模糊性以及隨機(jī)性等特點(diǎn),因此研究汽輪發(fā)電機(jī)組故障診斷方法需要大量故障實(shí)驗(yàn)數(shù)據(jù),但在實(shí)際應(yīng)用中從很難從豐富的機(jī)組監(jiān)測數(shù)據(jù)獲取有效全面的故障數(shù)據(jù)信息,進(jìn)而準(zhǔn)確地診斷出故障的類型、嚴(yán)重程度以及發(fā)生部位。本文擬采用試驗(yàn)臺模擬汽輪發(fā)電機(jī)組運(yùn)行狀況,建立汽輪發(fā)電機(jī)組故障案例庫,有針對性地對機(jī)組典型故障進(jìn)行分析,驗(yàn)證方法的準(zhǔn)確性和可靠性,掌握故障分析方法的影響因素(如監(jiān)測變量的選取、機(jī)組運(yùn)行參數(shù)和機(jī)組結(jié)構(gòu)等),積累分析經(jīng)驗(yàn),對實(shí)際生產(chǎn)過程出現(xiàn)的機(jī)組故障提供科學(xué)有效的技術(shù)支持。因此本文主要研究汽輪發(fā)電機(jī)組常見的4種振動故障,用同步整周期采樣方法采集故障數(shù)據(jù)進(jìn)行分析,每周朗采樣32點(diǎn),采樣點(diǎn)數(shù)為1 024點(diǎn),故障樣本數(shù)據(jù)見表1。研究表明,這4種故障對分析機(jī)組軸瓦異常振動、提取故障特征值及故障診斷有十分重要的意義。
表1 故障測試樣本數(shù)據(jù)集
故障特征的提取是故障診斷的關(guān)鍵步驟,因時域波形為原始振動信號的信息來源,頻域分析則是對系統(tǒng)動態(tài)特征的分析,這里綜合考慮時域與頻域信息,選取反映時域波形特征的6個無量綱參數(shù)和頻域信息中的8個頻率(或頻段)的譜值(譜值和)作為分析樣本的特征屬性。樣本特征屬性如下:
[K,C,I,L,Kv,S,0.01~0.49f,0.5f,1f,
2f,3f,(3~5)f,(5~10)f,oddf]
(8)
式中:K為波形指標(biāo);C為脈沖指標(biāo);I為峰值指標(biāo);L為裕度指標(biāo);Kv為歪度指標(biāo);S為峭度指標(biāo);f為工作頻率;oddf為奇倍頻譜值和。
汽輪發(fā)電機(jī)組振動信號的頻域和時域特征是對同一信號的不同方面指標(biāo)分析,信息冗余量大,故障特征屬性存在非線性,使得故障模式錯分率高。將本文提出的方法應(yīng)用于實(shí)驗(yàn)數(shù)據(jù)分析,對實(shí)驗(yàn)樣本數(shù)據(jù)進(jìn)行KPCA非線性特征提取,在高維特征空間選取有效的故障特征并降低特征維數(shù),提取的故障特征作為SVM的輸入,構(gòu)建SVM故障模式分類模型,對測試樣本進(jìn)行故障模式分類。同時,為了呈現(xiàn)KPCA-SVM對汽輪發(fā)電機(jī)組故障診斷效果的優(yōu)越性,本文將SVM、PCA-SVM和KPCA-SVM進(jìn)行對比分析,實(shí)驗(yàn)結(jié)果如表2所示。在實(shí)驗(yàn)數(shù)據(jù)分析中,SVM和KPCA中的核函數(shù)都采用高斯核函數(shù),其中SVM核參數(shù)采用默認(rèn)設(shè)置,KPCA方法中核參數(shù)取σ=60,核主元個數(shù)通過CPV(主元累積貢獻(xiàn)率法)獲得m=3。
表2 三種故障模式識別對比
由表2可見,KPCA-SVM的識別率明顯優(yōu)于SVM和PCA-SVM,其實(shí)驗(yàn)結(jié)果如圖1、圖2、圖3所示。由圖可進(jìn)一步看出,錯分主要存在故障4,在3種方法中,其最后兩個測試樣本都被錯分為故障2,主要原因是訓(xùn)練樣本集以及診斷模型參數(shù)的選擇有關(guān)。進(jìn)一步對SVM和PCA-SVM 分類結(jié)果對比分析,可以看出兩種方法的分類率相近,并遠(yuǎn)小于KPCA-SVM的判別率,從而驗(yàn)證了汽輪發(fā)電機(jī)組故障數(shù)據(jù)集的非線性特性,并說明采用非線性方法提取故障特征的可行性。從整體上看,KPCA-SVM的效果優(yōu)于其他兩類,這也說明了KPCA-SVM可以汽輪發(fā)電機(jī)組的故障模式診斷,且具有較好的診斷效果。
圖1 SVM故障分類結(jié)果圖
可見,通過KPCA方法提取機(jī)組監(jiān)測數(shù)據(jù)中的有效的故障信息,并在高維特征空間反映了數(shù)據(jù)之間的可分性,融合SVM對小樣本數(shù)據(jù)分類處理能力,從而可以有效提高故障診斷的正確率。在實(shí)際生產(chǎn)過程的應(yīng)用中,汽輪發(fā)電機(jī)組設(shè)備龐大、系統(tǒng)復(fù)雜、自動化程度高,TSI系統(tǒng)和DCS系統(tǒng)監(jiān)控監(jiān)測變量多,因此,選取與機(jī)組故障關(guān)聯(lián)強(qiáng)的監(jiān)測變量,剔除系統(tǒng)一些“非正?!睌?shù)據(jù),分層次、分模塊地自適應(yīng)的建立系統(tǒng)動態(tài)的KPCA-SVM故障診斷模型(模型參數(shù)適數(shù)據(jù)性的選取方法),可以有效地提高KPCA-SVM故障診斷方法的可用性和準(zhǔn)確性。
圖2 PCA-SVM故障分類結(jié)果圖
圖3 KPCA-SVM故障分類結(jié)果圖
汽輪發(fā)電機(jī)組系統(tǒng)運(yùn)行過程中的故障診斷包括故障特征提取和故障模式分類兩大部分。提取的原始數(shù)據(jù)故障特征越準(zhǔn)確,故障模式的可分離能力越強(qiáng),識別的準(zhǔn)確率則越高。本文基于集成KPCA-SVM的方法,利用KPCA的非線性處理能力提取原始數(shù)據(jù)中的有效故障特征,在降低數(shù)據(jù)維數(shù)的基礎(chǔ)上能夠更加準(zhǔn)確地捕獲數(shù)據(jù)分類特征信息,并用于SVM的輸入,從而提高SVM的分類效果。將集成KPCA-SVM方法在汽輪發(fā)電機(jī)組模擬多種故障模式下進(jìn)行仿真測試,并與SVM和PCA-SVM分類方法得到結(jié)果相比較,本文提出的集成KPCA-SVM方法能夠得到更高的識別正確率。在后期工作中,需要進(jìn)一步對模型的參數(shù)選取方法進(jìn)行深入研究,以期能進(jìn)一步提高系統(tǒng)故障診斷的準(zhǔn)確性和可靠性。
[1] 翟永杰,王東風(fēng),韓璞.基于多類支持向量機(jī)的汽輪發(fā)電機(jī)組故障診斷[J].動力工程學(xué)報,2003,23(5):2694-2698.
[2] 司娟寧,劉金園,董澤,等.基于主成分分析與支持向量機(jī)的汽輪機(jī)故障診斷[J].汽輪機(jī)技術(shù),2011,53(2):139-142..
[3] 嚴(yán)可國.大型汽輪發(fā)電機(jī)組故障診斷方法及監(jiān)測保護(hù)系統(tǒng)研究[D].北京:華北電力大學(xué),2009:17-32.
[4] 張曦,閻威武,劉振亞,等.基于核主元分析和鄰近支持向量機(jī)的汽輪機(jī)凝汽器過程監(jiān)控和故障診斷[J].中國電機(jī)工程學(xué)報,2007,27(14):56-61.
[5] 何青,解芳芳,李紅,等.基于流形學(xué)習(xí)方法的汽輪機(jī)組振動特征提取[J].振動、測試與診斷,2014,34(4):705-708.
[6] 肖健華.智能模式識別方法[M].廣州:華南理工大學(xué)出版社,2006:126-133.
[7] 黃保海,李巖,王東風(fēng).基于 KPCA 和 KFCM 集成的汽輪機(jī)故障診斷[J].電力自動化設(shè)備,2010,30(7):84-87.
[8] 鄧曉剛,田學(xué)民.一種基于 KPCA 的非線性故障診斷方法[J].山東大學(xué)學(xué)報(工學(xué)版),2005,35(3):103-106.
[9] 王加祥,吳斌,蘇紅偉.基于核主元分析和支持向量機(jī)相結(jié)合的齒輪箱齒輪故障識別方法[J].上海電機(jī)學(xué)院學(xué)報,2015,18(4):221-226.
[10] ANDREW A M.An Introduction to support vector machines and other kernel‐based learning methods[M]// An Introduction to Support Vector Machines:China Machine Press,2005:1-28.
[11] 石志標(biāo),苗瑩.基于FOA-SVM 的汽輪機(jī)振動故障診斷[J].振動與沖擊,2014,33(22):111-114.
The Steam Turbine Fault Diagnosis Based on KPCA and SVM Ensemble
LIANG Yinlin1,LIU Qing2
(1.Dong Fang Steam Turbine Corporation,Deyang 618000,China; 2.Dong Fang Electric Machinery Corporation,Deyang 618000,China)
A steam turbine fault diagnosis method based on KPCA and SVM ensemble is proposed for the fault data with high-dimensional and non-linear characteristics,which combines the nonlinear data processing method with small sample classifier.Firstly,the method is used to extract the fault feature information in the high dimensional feature space,considering of the excellent nonlinear processing ability of KPCA.Secondly,a classification SVM model with the fault feature information is set up to overcome the disadvantages of SVM model.The simulation results of steam turbine proves the better capability of processing nonlinear data,effective classification feature information extraction and higher fault pattern recognition accuracy of the proposed method,compared with the SVM method and PCA-SVM method.
steam turbine; feature extraction; fault diagnosis; SVM; KPCA
10.3969/j.ISSN.1672-0792.2017.01.005
2016-09-05。
TP391;TK267
1672-0792(2017)01-0027-05
梁銀林(1987-),男,碩士研究生,研究方向?yàn)槠啓C(jī)狀態(tài)監(jiān)測和故障診斷。