孫 斌 劉立遠 ?!×?/p>
1.東北電力大學,吉林,132012 2.大唐保定熱電廠,保定,071000
基于局部切空間排列和K-最近鄰分類器的轉子故障診斷方法
孫斌1劉立遠1牛翀2
1.東北電力大學,吉林,1320122.大唐保定熱電廠,保定,071000
為了解決大型機械設備故障數據難以準確快速提取的問題,提出了一種基于局部切空間排列(LTSA)和K-最近鄰分類器的轉子故障診斷模型。首先基于轉子的振動信號構造一個高維多征兆矩陣,利用LTSA提取高維矩陣的低維特征向量,映射在可視空間里;然后將提取的低維特征向量輸入K-最近鄰分類器進行故障模式識別。試驗和數據降維仿真過程表明,該模型的準確度和快速性均優(yōu)于LTSA和神經網絡以及LTSA和支持向量機組成的故障診斷模型。
局部切空間排列;K-最近鄰分類器;模式識別;故障診斷
現代大機組汽輪機轉子的結構越來越復雜,出現故障的原因也日趨多樣化,使得設備的故障診斷很難準確快速地進行,而提取故障特征又是故障診斷的關鍵步驟。早期人們通常利用時域、頻域的特征參數分析來進行特征提取,然后應用人工神經網絡等技術進行故障識別[1]。然而,單一的時域或頻域特征都無法準確全面地描述故障特征,而高維多征兆特征的非線性信息中又存在冗余信息,必須人工去除冗余信息,提取主要特征。
特征提取方法有線性方法和非線性方法,線性判別分析(linear discrimination analysis, LDA)等算法稱為線性降維方法,主要適合對具有線性結構的高維數據進行維數約簡處理。2000年Science雜志上發(fā)表了3篇關于流形學習的論文[2-4],流形學習方法可以有效地對高維非線性數據進行維數約簡、特征信息提取處理[5-6]。局部切空間排列(local tangent space alignment, LTSA)是一種經典的新型流形特征提取方法,在降維前后,數據的內在屬性沒有任何變化,相比拉普拉斯特征映射(Laplacian eigenmaps, LE)等流形學習算法具有更強的特征提取能力[7-8],分類效果和效率都要明顯優(yōu)于上述方法。
故障的特征信息提取之后,還需要用分類器進行模式識別來提高故障診斷精度。BP神經網絡(BP neural network, BPNN)、支持向量機(support vector machine, SVM)等方法在應用過程中需要選擇合適參數,所以需要消耗大量時間來進行參數調整和訓練,存在結構難以確定等問題[9-11]。K-最近鄰分類器(K-nearest neighbor,KNN)可以直接用訓練樣本的局部信息對測試樣本進行分類決策,不僅結構穩(wěn)定,而且具有集成高效的模式識別能力[12]。
本文提出了“原始故障信號-高維矩陣-LTSA-K-最近鄰分類器”模型,該模型實現了故障診斷的準確化和快速化。
1.1局部切空間排列
LTSA通過無限靠近每一樣本點的切空間來構建低維流形的局部幾何空間,然后利用局部切空間排列得到整體低維特征坐標。過程如下: 首先,獲得每個數據點的鄰近點,局部的非線性幾何特性近似用鄰域中低維切空間的坐標來表示; 然后,利用變換矩陣把各數據點鄰域切空間的局部坐標投影到規(guī)范的全局坐標上; 最后,把求解整體嵌入坐標問題演變?yōu)榍蠼饩仃嚨奶卣髦祮栴},從而把高維數據降到低維。設故障樣本個數為N,故障樣本維數為m,Y為高維故障樣本集,高維樣本集Y在Rm空間的數據集Y=[y1y2…yN],該算法的目的是從中提取出一個d(m>d) 維的主流形,局部切空間排列特征提取過程如下。
(1)樣本點鄰域的選取?;诿總€樣本點yi(i=1,2,…,N),以K-最近鄰為標準,選取包括其自身在內的k個最短距離點作為鄰域,樣本點yi的近鄰點構成一個鄰域矩陣YNi=[yi1yi2…yij]。
(3)局部坐標的整合。根據k個局部投影Ai獲得全局坐標{βi},對于所有的Li∈Rd×d和Ti=(β1,β2,…,βn),βi=(βi1,βi2,…,βik),利用最小化全局重構誤差得到全局坐標:
(1)
1.2K-最近鄰分類器
最近鄰分類器的具體內容如下:先計算測試樣本與各訓練樣本的余弦距離,找出距離最近的k個近鄰,然后求出測試樣本對訓練樣本各狀態(tài)的隸屬度,隸屬度最大的為測試樣本的狀態(tài)。K-最近鄰分類器具體計算步驟如下。
設測試樣本經LTSA提取的特征向量為y0,y0和訓練樣本yi之間的余弦距離為
(2)
定義測試樣本y0和Ei類樣本的隸屬度為
(3)
其中,KNN(y0)是y0的最近鄰域集,δ(yi,Ei)是yi關于Ei的類屬性,則使y0與之隸屬度最大的E為y0所屬類別,即
(4)
2.1試驗數據的采集
轉子振動試驗臺(圖1)可以模擬振動信號,通過人為措施制造一些故障來模擬汽輪機轉子的振動故障。試驗裝置包括轉子ZXP-4A、振動試驗臺、41M/HG-2508型數字測振儀主機、信號采集器、電渦流傳感器、計算機以及DASP等。模擬的故障分為3類,包括不對中、不對中加松動、轉子質量不平衡。各種故障模擬的方法如下:不對中故障是將聯(lián)軸器換成硬質橡膠管,并在軸末端的軸承座底墊上1個或2個墊片,人為地將軸承座扭轉一定角度來實現;不對中加松動故障則是在不對中的試驗中同時加入軸承座松動來實現;不平衡故障通過在臨近電渦流傳感器的轉子轉盤上旋入3~5個螺絲釘,螺絲釘要集中,以使轉子發(fā)生質量不平衡故障。
圖1 轉子試驗臺
故障信號的原始振動頻率分別為1000 Hz、1200 Hz、1400 Hz,轉子轉速分別對應為1000 r/min、1150 r/min、1200 r/min,采取樣本點數為8000。在每個轉速下每種故障取10組樣本數據。
2.2構造高維矩陣
三類故障信號如圖2所示。單一地通過分析波形圖,或者研究時域、頻域特征都不可能準確診斷故障特征類型,這是因為故障的特征沒有被全面地描述,需要構造一個有效的高維空間來全方位地刻畫故障特點。本文以相空間重構思想為基礎,提出了一種新的高維空間構造方法,獲得的高維空間能夠使故障特征被全面刻畫,該方法相對于相空間重構,對故障分類的效果更佳。設原始振動信號為S=[S1S2…Sn],構造高維空間的過程如下。
圖2 故障振動
(1)找出S中所有的極值點,標記極值點的位置。
(2)對所有極值點取絕對值,再求其平均值,若極值點大于平均值,則保留極值點,否則去除它。得到的保留極值X=[X1X2…Xn]。
(3)以步驟(2)的保留極值作為基點截取長度為?的m維相空間,每一個m維向量都是重構相空間中的點X1,X2,…,XN,即所要構造的m×N高維矩陣。有
X1=(X1,X1+τ,…,X1+(m-1)τ)
X2=(X2,X2+τ,…,X2+(m-1)τ)
…
XN=(XN,XN+τ,…,XN+(m-1)τ)
(m-1)τ=?
其中,m為嵌入維數,τ為延遲時間。本方法和相空間重構的本質區(qū)別在于增加了步驟(1)、(2),使故障信息能被準確和全面地描述。嵌入維數m和延遲時間τ是決定重構相空間質量的兩個重要參數。
2.3數據降維過程
分別用LDA、LE、LTSA三種方法對高維矩陣X進行降維,得到低維空間Y,然后映射到可視空間來完成視覺故障分類。經過深入研究得出結論,這三種方法的特征提取結果和樣本長度、樣本點個數關系不大,但是和近鄰點個數、特征提取維數d密切相關。筆者通過多次模擬和分析得到了各種方法的最佳近鄰點數和維數:LDA(d=2,k=15,d=3,k=20)、LE(d=2,k=12,d=3,k=10)、LTSA(d=2,k=16,d=3,k=18)。二維特征如圖3所示,LDA方法的提取結果最差,故障狀態(tài)樣本分布較分散,無法判斷故障種類。LE方法能把不同的故障區(qū)分開,但是不同的故障有交叉重疊現象。LTSA方法實現了三種狀態(tài)樣本數據的完全分離,并且各類狀態(tài)樣本平穩(wěn)性較好,基本聚集在同一個局部區(qū)域。
(a)LDA特征
(b)LE特征
(c)LTSA特征圖3 三種提取方法的二維特征分布
三維特征如圖4所示,LDA的分類效果也較差,三種故障樣本有交疊的部分,而且不同故障的類型距離也非常近,不能把故障區(qū)別開。LE效果稍好一些,不同故障相對較遠,但是同種故障樣本距離稍遠,不利于分類。LTSA效果較好,不同故障點沒有交疊的部分,而且相對距離較遠,容易把不同的故障類型分辨出來。
綜上所述,可以證明局部切空間排列算法能夠很好地獲取高維數據空間的幾何結構特性,有效地完成了視覺故障分類。
(a)LDA特征
(b)LE特征
(c)LTSA特征圖4 三種提取方法的三維特征分布
為了進一步將LTSA和其他特征提取算法效果作對比,將三種方法提取的特征向量送入支持向量機分類器進行模式識別。每類故障選用400個訓練樣本,100個測試樣本,三種方法的鄰域大小、約簡維數設置保持一致。支持向量機選擇高斯函數作為核函數,以核半徑σ=0.99和誤差懲罰參數λ=100作為最優(yōu)確定參數,計算機配置為Core2 2.2GHzCPU,內存2GB。從表1可以看出,三種方法的樣本訓練時間和測試時間相差不大。但是LTSA+SVM的故障診斷模型中每種故障的診斷率和總體診斷率最高,充分體現了LTSA較高的綜合性能。
表1 三種不同的特征提取方法的故障診斷精度比較
2.4K-最近鄰分類器模式識別
為了驗證KNN方法的有效性,分別采用BP、支持向量機、KNN作為分類器和LTSA組成故障診斷模型。BP網絡模型選用運算速度最快、最穩(wěn)健的Levenberg-Marquardt 算法,選用效率最高的高斯核支持向量機。每類故障也是選用800個訓練樣本,100個測試樣本。
從表2可以看出,由于KNN直接用訓練樣本的局部信息對測試樣本進行分類決策,LTSA+KNN構造的故障分類器效率非常高,而SVM和BP網絡的訓練過程需要反復迭代來確定參數,所以耗時較長。LTSA+KNN故障診斷率也非常高,說明該模型大大提高了故障診斷精度。
表2 三種不同的特征提取模型的故障診斷精度比較
(1)本文將流形學習方法應用到轉子故障診斷中,研究了局部切空間排列算法。通過和另外兩種降維方法作對比,說明該算法成功提取了高維數據的低維流形特征,明顯改善了故障模式識別的分類效果。進一步比較了這三種流形算法維數化簡后的故障診斷精度,顯示了LTSA的優(yōu)越性。
(2)將LTSA+KNN和其他兩種故障診斷模型作對比,由于KNN的故障診斷模型具有建模方法簡單、人為確定參數少、識別精度高等優(yōu)點,充分證明了該模型在運算速度和故障診斷率方面的可應用性。
[1]劉麗娟,陳果,郝騰飛.基于流形學習與一類支持向量機的滾動軸承早期故障識別方法[J].中國機械工程,2013,24(5):629-633.
Liu Lijuan, Chen Guo, Hao Tengfei. Incipient Fault Recognition of Rolling Bearings Based on Manifold Learning and One-class SVM[J].China Mechanical Engineering, 2013, 24(5): 629-633.
[2]Seung H S, Daniel D L. The Manifold Ways of Perception[J]. Science, 2000, 290(5500): 2268-2269.
[3]Roweis S, Saul L. Nonlinear Dimensionality Reduction by Locally Linear Embedding[J]. Science, 2000, 290(5500): 2323-2326.
[4]Tenenbaum J, Silva D D, Langford J. A Global Geometric Framework for Nonlinear Dimensionality Reduction[J]. Science, 2000, 290(5500): 2319-2323.
[5]Kouropteva O, Okun O, Pietikainen M. Supervised Locally Linear Embedding Algorithm for Pattern Ecognition[J]. Pattern Recognition and Image Analysis, 2003, 2652(9): 386-394.
[6]Liu Xiaoming, Yin Jianwei, Feng Zhilin, et al. Orthogonal Neighborhood Preserving Embedding for Face Recognition[C]//2007 IEEE International Conference on Image Processing(ICIP 2007).New York,2007: 133-136.
[7]萬鵬,王紅軍,徐小力.局部切空間排列和支持向量機的故障診斷模型[J].儀器儀表學報,2012, 33(12):2790-2795.
Wan Peng, Wang Hongjun, Xu Xiaoli. Fault Diagnosis Model Based on Local Tangent Space Alignment and Support Vector Machine[J]. Chinese Journal of Scientific Instrument, 2012, 33(12): 2790-2795.
[8]李鋒,湯寶平,董紹江,等. 基于正交鄰域保持嵌入特征約簡的故障診斷模型[J].儀器儀表學報, 2011, 32(3):622-627.
Li Feng, Tang Baoping, Dong Shaojiang, et al. Fault Diagnosis Model Based on Feature Compression with Orthogonal Neighborhood Preserving Embedding[J]. Chinese Journal of Scientific Instrument, 2011, 32(3): 622-627.
[9]陳法法,湯寶平,蘇祖強,等. 基于等距映射與加權KNN的旋轉機械故障診斷[J].儀器儀表學報, 2013, 34(1):216-220.
Chen Fafa, Tang Baoping, Su Zuqiang, et al. Rotating Machinery Fault Diagnosis Based on Isometric Mapping and Weighted KNN[J]. Chinese Journal of Scientific Instrument, 2013, 34(1): 216-220.
[10]李勝,張培林,吳定海,等. 基于漸近式權值小波降噪和算法的液壓泵Adaboost故障診斷[J].中國機械工程, 2011, 22(9):1067-1071.
Li Sheng, Zhang Peilin, Wu Dinghai,et al. Fault Diagnosis for Hydranlic Pump Based on Gradual Asymptotic Weight Selection of Wavelet and Adaboost[J]. China Mechanical Engineering, 2011, 22(9): 1067-1071.
[11]于德介,陳淼峰,程軍圣,等. 一種基于支持向量機預測器模型的轉子系統(tǒng)故障診斷方法[J].中國機械工程,2006, 17(7):696-699.
Yu Dejie,Chen Miaofeng,Cheng Junsheng,et al. Fault Diagnosis Approach for Rotor Systems Based on Support Vector Machine Predictive Model[J]. China Mechanical Engineering, 2006, 17(7): 696-699.
[12]宋濤,湯寶平,李鋒. 基于流形學習和K-最近鄰分類器的旋轉機械故障診斷方法[J].振動與沖擊,2013,32(5):150-153.
Song Tao, Tang Baoping, Li Feng. Fault Diagnosis Method for Totating Machinery Based on Manifold Learning and K-nearest Neighbor Classifier[J] Journal of Vibration and Shock, 2013, 32(5): 150-153.
(編輯陳勇)
Rotor Fault Diagnosis Methods Based on Local Tangent Space Alignment and K-Nearest Neighbor
Sun Bin1Liu Liyuan1Niu Chong2
1.Northeast Dianli University,Jilin,132012 2.Datang Baoding Thermal Power Plant,Baoding,Hebei,071000
In order to solve the problem that the large mechanical equipment failure data is difficult to accurately extract, this paper put forward a kind of rotor fault diagnosis models based on LTSA and KNN. The vibration signals of rotor structure were used to construct dimensional matrix, then the low dimensional feature vector of high dimension matrix in the LTSA was extracted,and projected into the visual space.And the extracted low dimensional feature vectors were put into the KNN in order to do fault pattern recognition. Finally, experimental and data dimension reduction simulation process shows that the accuracy and rapidity of the method with LTSA and KNN are better than the fault diagnosis model by neural network and support vector machine.
local tangent space alignment(LTSA); K-nearest neighbor(KNN); pattern recognition; fault diagnosis
2013-08-09
TH165< class="emphasis_italic">DOI
:10.3969/j.issn.1004-132X.2015.01.013
孫斌,男,1972年生。東北電力大學能源與動力工程學院教授、博士。主要研究方向為設備狀態(tài)監(jiān)測與故障診斷。劉立遠,男,1987年生。東北電力大學能源與動力工程學院碩士研究生。牛翀,男,1989年生。大唐保定熱電廠助理工程師。