肖 婷, 湯寶平, 秦 毅, 陳 昌
(重慶大學(xué) 機械傳動國家重點實驗室,重慶 400030)
基于流形學(xué)習(xí)和最小二乘支持向量機的滾動軸承退化趨勢預(yù)測
肖 婷, 湯寶平, 秦 毅, 陳 昌
(重慶大學(xué) 機械傳動國家重點實驗室,重慶 400030)
為更好地表征滾動軸承性能退化趨勢,提出基于流形學(xué)習(xí)和最小二乘支持向量機的滾動軸承退化趨勢預(yù)測新方法。提取振動信號的多域特征組成高維特征集,利用局部保持投影算法(LPP)對多域高維特征集進行維數(shù)約簡,消除各特征指標(biāo)之間的冗余、沖突等問題。將維數(shù)約簡后的特征向量作為最小二乘支持向量機的輸入,建立退化趨勢預(yù)測模型,完成退化趨勢預(yù)測。運用實測的滾動軸承全壽命實驗數(shù)據(jù)進行檢驗,結(jié)果表明該方法能獲得準(zhǔn)確的預(yù)測結(jié)果。
性能退化評估;信息熵;流形學(xué)習(xí);最小二乘支持向量機
滾動軸承退化過程的準(zhǔn)確預(yù)測,對預(yù)防設(shè)備失效具有重要意義。滾動軸承退化過程準(zhǔn)確預(yù)測的關(guān)鍵是提取能準(zhǔn)確反映滾動軸承運行狀態(tài)的特征指標(biāo)及建立有效的預(yù)測模型。單個時、頻域特征指標(biāo)[1~2]如均方根值、峭度等指標(biāo)對初始損傷的敏感程度低,不能較好地確定初始損傷時間。文獻[3]將三個時域指標(biāo)和三個頻域指標(biāo)進行融合,能較好地評估軸承性能退化變化。然而,滾動軸承的故障信號是一種典型的非平穩(wěn)、非線性信號[4],傳統(tǒng)時、頻域指標(biāo)提取是將振動信號看作平穩(wěn)信號進行處理,存在評估能力不足的問題。小波包分析是一種有效的非平穩(wěn)信號分析方法,將小波包分解與信息熵結(jié)合提取小波包熵可以很好地解決時、頻域指標(biāo)評估能力不足的問題。因此,選擇時、頻域指標(biāo)及基于信息熵[5~6]的特征指標(biāo)組成多域特征集,既能避免單純依靠時、頻域指標(biāo)性能評估能力不足的問題,又能有效地反映滾動軸承性能退化趨勢,提高預(yù)測精度。但多域特征中部分特征之間存在冗余、相互沖突的問題[7],流形學(xué)算法LPP可在盡量保持數(shù)據(jù)間幾何關(guān)系和距離測度不變前提下對高維特征集進行維數(shù)約簡,解決特征之間的冗余、沖突等問題。同時,克服了線性降維算法PCA[8],LDA方法不能處理非線性問題的缺陷,相對于Isomap、LLE等非線性算法而言具有更快的處理速度[9]。
在提取性能退化指標(biāo)之后,趨勢預(yù)測另一個關(guān)鍵步驟是建立可靠的預(yù)測模型。文獻[3,10-11]分別采用神經(jīng)網(wǎng)絡(luò)和AR模型建立預(yù)測模型,AR模型在理論上十分成熟,但其精度不高,容錯性較差,只適合做短期預(yù)測。神經(jīng)網(wǎng)絡(luò)在理論上的缺陷導(dǎo)致其存在局部極值、小樣本推廣能力差以及隱層節(jié)點個數(shù)難以確定等問題。最小二乘支持向量機[12]能有效地避免神經(jīng)網(wǎng)絡(luò)算法中過學(xué)習(xí)、欠學(xué)習(xí)、局部極小等棘手問題,在小樣本、非線性等數(shù)據(jù)空間下具有較好的泛化能力,可明顯提高預(yù)測精度和預(yù)測的穩(wěn)定性。
本文提出了基于高維多域特征集維數(shù)約簡的趨勢預(yù)測理論,充分發(fā)揮了多域特征集在性能評估,流形學(xué)習(xí)算法在維數(shù)約簡和最小二乘支持向量機在趨勢預(yù)測方面的各自的優(yōu)勢,具有較高的預(yù)測精度。
1.1 多域特征提取
1.1.1 時域特征指標(biāo)
(1)
1.1.2 基于信息熵的特征指標(biāo)
(2)
信息熵是從平均意義上表征信源總體信息測度的一個量,同時又是對信源輸出信息的不確定性和事件發(fā)生的隨機性的度量。當(dāng)信源中各變量的概率均勻分布時,信息熵取得最大值lnN,此時信源中信息量是最大的。反之,信源中各變量概率分布不均勻時,信息熵的值減少。當(dāng)其某一變量以概率1出現(xiàn)時,此時信息熵為0,信源包含的信息量最小。
對振動信號進行時、頻域處理及小波包變換,分別提取幅值譜熵xame、功率譜熵[5]xpoe以及小波包能譜熵xwae、小波包奇異值熵[6]xwse作為特征量,構(gòu)成另一個4維的信息熵特征向量:
Χ2=(xame,xpoe,xwae,xwse)T
(3)
由信息熵特征指標(biāo)以及時域特征指標(biāo)組成14維的多域特征集作為維數(shù)約簡的輸入高維特征,即
Χ=(Χ1,Χ2)Τ
(4)
1.2 局部保持投影(LPP)算法原理
局部保持投影(LPP)算法繼承了非線性流形學(xué)習(xí)算法LE的思想[13],即基于K近鄰圖建立映射,它在保持數(shù)據(jù)局部特征的條件下,將高維觀測數(shù)據(jù)映射到低維空間,使得在高維空間相互靠近的數(shù)據(jù)點在低維空間也相互靠近。設(shè)多域特征集為Χ={x1,x2,…,xn}∈Rh×n,特征集的樣本數(shù)為n,特征維數(shù)為h。通過轉(zhuǎn)換矩陣Α,通過Y=ΑΤΧ降維后的特征集Y={y1,y2,…,yn}∈Rl×n,降維后維數(shù)是l,且l?h。轉(zhuǎn)換矩陣A可以通過如下的目標(biāo)函數(shù)求得,即
(5)
式中:W為加權(quán)矩陣,由k近鄰方法定義矩陣元素。由目標(biāo)函數(shù)可以看出,最小化目標(biāo)函數(shù)的目的就是使原高維特征空間的局部特性得以保持,也就是說如果xi和xj中靠近,那么yi和yj在低維空間中也相互靠近。
由式(5)變換得到
(6)
YΤDY=1?ΑΤΧDΧΤΑ=1
(7)
于是,目標(biāo)函數(shù)可以簡化為
(8)
目標(biāo)函數(shù)取最小值的轉(zhuǎn)換矩陣A可以通過求解式(9)的廣義特征向量獲得,即
ΧLΧΤΑ=λΧDΧΤΑ
(9)
設(shè)a0,a1,…,al-1為(9)式的特征向量,并按照其對應(yīng)的特征值由小到大進行排列,則由高維數(shù)據(jù)得到的低維嵌入可表示為
xi→yi=ΑΤxi
(10)
其中:Α=(a0,a1,…,al-1),由(10)式求得的低維特征集Y即可作為預(yù)測模型的輸入。
最小二乘支持向量機將最小二乘線性理論引入到支持向量機[10]中,LS-SVM定義了與標(biāo)準(zhǔn)支持向量機不同的約束函數(shù),將不等式約束化成等式約束,求解速度較支持向量機明顯加快。LS-SVM的函數(shù)估計問題如(11)所示:
(11)
此時約束條件為:
s.t.yi-ωφ(xi)-b=ei
(12)
其中:ω為權(quán)向量;γ為正則化參數(shù)或者說懲罰因子,其決定了對超出誤差樣本的懲罰程度,是支持向量機擬合程度和推廣能力的平衡參數(shù);b為偏差向量,ei為誤差變量,該變量表明實際對象對逼近函數(shù)在樣本數(shù)據(jù)點上的誤差期望。
式(11)、(12)對應(yīng)的拉格朗日函數(shù)為:
(13)
其中:αi是拉格朗日乘子。由Karush-Kuhn-Tucker 最優(yōu)化條件,即式(13)分別對ω、ei、b、αi求偏導(dǎo)數(shù),并令其偏導(dǎo)數(shù)為零。消掉變量ω、ei,得到如下方程組:
(14)
其中:I=[1,1,…,1]T,E為單位矩陣,y=[y1,y2,…,yn]T,α=[α1,α2,…,αn]T,Φ=[φ(x1),φ(x2),…,φ(xn)]T。
根據(jù)Mercer條件,采用徑向基核函數(shù)(RBF)作為核函數(shù),即:
(15)
其中:σ為核函數(shù)寬度。此時,LS-SVM回歸估計函數(shù)可表示為:
(16)
建立LS-SVM輸入x=(xn-m,xn-m+1,…,xn-1)與輸出y=(xn)之間的映射關(guān)系:Rm→R,m為輸入維數(shù),由此得到LS-SVM的訓(xùn)練樣本對為:
(17)
(18)
其中:s為訓(xùn)練數(shù)據(jù)的起點,l是訓(xùn)練樣本對數(shù),n為預(yù)測點數(shù)。將Xtrain和Ytrain分別作為LS-SVM的輸入和輸出,即可訓(xùn)練處預(yù)測模型,求出LS-SVM回歸估計函數(shù)(16)的具體數(shù)學(xué)表達式。將測試樣本Xtest代入式(16)即可得到n個預(yù)測值。
本文趨勢預(yù)測的基本流程是采用時域方法、頻域方法、小波包變換以及信息熵理論提取振動信號的多域特征集信息,并利用最小二乘支持向量機進行趨勢預(yù)測。由于多域特征集維數(shù)較高,各指標(biāo)之間的冗余、沖突等問題嚴重,引入LPP對多域特征集進行維數(shù)約簡,實現(xiàn)數(shù)據(jù)冗余信息的剔除。然后,將約簡后的特征信息輸入到LS-SVM模型中預(yù)測軸承的退化趨勢。具體流程如圖1所示。
圖1 趨勢預(yù)測流程Fig.1 The process of the trend forecasting
(1) 使用時域方法提取時域特征指標(biāo),采用頻域方法、小波包變換及信息熵理論提取小波包熵、幅值譜熵及功率譜熵組成高維多域特征集;本文采用db5小波包進行3層分解,利用Shannon熵理論提取小波包能譜熵和小波包奇異值熵作為特征指標(biāo)。
(2) 采用LPP維數(shù)約簡算法對高維多域特征集降維,并將降維后的特征信息作為LS-SVM的輸入;
(3) 按照步驟(1~2)處理全壽命數(shù)據(jù),將處理后的結(jié)果輸入到預(yù)測模型中作趨勢預(yù)測。
圖2 實驗裝置示意圖[15]Fig.2 The test equipment[15]
使用Cincinnati大學(xué)實測的滾動軸承全壽命數(shù)據(jù)[15]進行驗證,實驗裝置示意圖如圖2所示。軸承實驗臺的轉(zhuǎn)軸上安裝四個軸承,軸承為 Rexnord 公司的ZA-2115雙列滾子軸承,交流電機通過帶傳動以2 000 r/min的恒定轉(zhuǎn)速帶動轉(zhuǎn)軸旋轉(zhuǎn),實驗過程中軸承被施加6 000 lbs的徑向載荷。采樣頻率為20 kHz,每隔10 min采集一次軸承的振動數(shù)據(jù),每次采樣長度為20 480個點,軸承持續(xù)運行15天,直到軸承3出現(xiàn)內(nèi)圈故障和軸承4出現(xiàn)滾動體故障,本文采用軸承4采集到的振動數(shù)據(jù)驗證本文所提方法。
提取10個時域特征指標(biāo)和4個信息熵特征指標(biāo)組成高維多特征集。采用LPP流形學(xué)習(xí)算法對高維特征集進行維數(shù)約簡,將約簡以后的部分特征信息(LPP1)用來訓(xùn)練LS-SVM模型并完成預(yù)測,將獲取的預(yù)測值和實際的性能退化指標(biāo)之間進行對比分析。確定性能退化指標(biāo)之后,根據(jù)交叉驗證法確定最小二乘支持向量機的核參數(shù)σ為509、正規(guī)化參數(shù)γ為291,用這兩個模型參數(shù)構(gòu)建最小二乘支持向量機模型進行訓(xùn)練和預(yù)測。為了評價預(yù)測結(jié)果的準(zhǔn)確性,采用平均相對誤差作為預(yù)測效果的評價指標(biāo),即
(19)
然而,在工業(yè)現(xiàn)場當(dāng)中,軸承的全壽命實驗數(shù)據(jù)一般較難獲取。因此,在保持預(yù)測模型不變的情況下,將獲取的預(yù)測數(shù)據(jù)作為下一步預(yù)測的輸入,如此循環(huán)迭代完成預(yù)測,這種預(yù)測策略可使預(yù)測方法具有更好的實用性和推廣性。由式(17)、(18)建立預(yù)測模型,預(yù)測起始點s=1 925,訓(xùn)練樣本數(shù)l=191,輸入向量維數(shù)m=20,預(yù)測步數(shù)n=17。預(yù)測數(shù)據(jù)部分結(jié)果如圖3所示,從圖上可以看出在17步的預(yù)測范圍內(nèi),預(yù)測曲線與實際性能退化曲線比較接近,平均相對誤差為0.078 8。
圖3 滾動軸承趨勢預(yù)測曲線與實際狀態(tài)趨勢曲線Fig.3 The actual state trend curve and the forecast trend curve
為了進一步驗證多特征集融合信息作為退化指標(biāo)方法的準(zhǔn)確性,以及整體算法各個環(huán)節(jié)的必要性,作如下幾個對比驗證,比較預(yù)測結(jié)果的平均相對誤差值:① 峭度作為性能退化指標(biāo), LS-SVM建立預(yù)測模型;② LPP融合時域特征集作為性能退化指標(biāo), LS-SVM建立預(yù)測模型;③ PCA融合多域特征集(PC1)作性能退化指標(biāo),LS-SVM建立預(yù)測模型;④ LPP融合多域特征集作性能退化指標(biāo),神經(jīng)網(wǎng)絡(luò)建立預(yù)測模型;⑤ LLE融合多域特征集(LLE1)作性能退化指標(biāo),LS-SVM的模型參數(shù)建立預(yù)測模型。對比結(jié)果如圖4及表1所示,實線代表真實值,虛線代表預(yù)測值。
圖4 其他方法趨勢預(yù)測曲線與實際狀態(tài)趨勢曲線Fig.4 The forecast trend curve obtained by other methods and the actual state trend curve
表1 各方法預(yù)測結(jié)果與真實值之間的誤差比較
從圖3、圖4以及表1結(jié)果可以看出,多域特征集融合后的特征信息作為性能退化指標(biāo)能很好地反應(yīng)軸承的退化趨勢,且預(yù)測效果優(yōu)于峭度作為性能退化指標(biāo)的預(yù)測效果。同時,多域特征集融合后的特征信息作性能退化指標(biāo)的預(yù)測效果優(yōu)于時域特征集融合后的預(yù)測效果,說明單純依靠融合時域指標(biāo)得到的特征信息存在評估能力不足的問題,不能很好地反映滾動軸承的退化趨勢。
由表1還可以看出,基于LPP的維數(shù)約簡方法獲得的預(yù)測效果優(yōu)于PCA、LLE方法的預(yù)測結(jié)果,因此,多域特征集經(jīng)流形學(xué)習(xí)LPP進行維數(shù)約簡是有效且適用的。同時,采用LS-SVM建立預(yù)測模型的預(yù)測效果優(yōu)于神經(jīng)網(wǎng)絡(luò)的預(yù)測效果,說明LS-SVM作為預(yù)測模型具有較高的預(yù)測精度和很強的推廣能力。
圖5 2號軸承的預(yù)測曲線與實際預(yù)測曲線Fig.5 The actual state trend curve and the forecast trend curve of the second bearing
趨勢預(yù)測的實際應(yīng)用,通常是用一個已經(jīng)訓(xùn)練好的軸承預(yù)測模型預(yù)測另一個同型號、同工況滾動軸承的退化趨勢的。由圖2可看出,軸承2和軸承3是兩個工況類似、型號相同的兩個滾動軸承。用訓(xùn)練好的3號軸承的預(yù)測模型預(yù)測2號軸承的退化趨勢,預(yù)測數(shù)據(jù)部分結(jié)果如圖5所示,平均相對誤差為0.236 6。
由圖5可以看出,用已經(jīng)訓(xùn)練好的3號軸承預(yù)測模型預(yù)測2號軸承的退化趨勢整體效果較好,但是并沒有完全逼近真實曲線,其原因有兩方面:① 3號軸承與2號軸承之間的工況不是完全相同,提取的特征指標(biāo)之間會存在一定的差異;② 預(yù)測方法是把預(yù)測結(jié)果作為下一次預(yù)測的輸入,導(dǎo)致出現(xiàn)預(yù)測誤差的積累,影響了最后預(yù)測結(jié)果的精度。
(1) 分析了常用時頻域特征作為性能退化指標(biāo)存在的問題,提出了采用多域特征集的特征提取方法,在有效反映軸承運行狀態(tài)的同時能很好地預(yù)測軸承的性能退化趨勢。
(2) 針對多域特征集維數(shù)較高,特征間冗余性較為嚴重的問題,提出了通過流形學(xué)習(xí)算法LPP進行維數(shù)約簡的方法,提取敏感的特征信息。
(3) 為了得到更準(zhǔn)確的預(yù)測結(jié)果,選用LS-SVM建立預(yù)測模型,利用LS-SVM的泛化能力提高預(yù)測精度。
(4) 通過對比分析,表明本文所提出的趨勢預(yù)測方法的有效性及各個環(huán)節(jié)之間互補性,充分發(fā)揮了各部分的優(yōu)勢,實現(xiàn)較高精度的退化趨勢預(yù)測。
[1] Gebraeel N,Lawley M,Liu R,et al. Residual life predictions from vibration-based degradation signals: a neural network approach [J]. Industrial Electronics, IEEE Transactions on, 2004, 51(3): 694-700.
[2] Janjarasjitt S, Ocak H, Loparo K A. Bearing condition diagnosis and prognosis using applied nonlinear dynamical analysis of machine vibration signal [J]. Journal of Sound and Vibration, 2008(317): 112-126.
[3] 奚立峰,黃潤青,李興林,等. 基于神經(jīng)網(wǎng)絡(luò)的球軸承剩余壽命預(yù)測[J]. 機械工程學(xué)報,2007,43(10): 137-143. XI Li-feng, HUANG Run-qing, LI Xing-lin, et al. Residual life predictions for ball bearing based on neural networks [J].Chinese Journal of Mechanical Engineering, 2007,43(10): 137-143.
[4] Antoni J. Cyclic spectral analysis of rolling-element bearing signals: facts and fictions [J]. Journal of Sound and Vibration, 2007, 304(3-5): 497-529.
[5] 王小玲,陳進,從飛云. 基于時頻的頻帶熵方法在滾動軸承故障識別中的應(yīng)用[J]. 振動與沖擊,2012,31(18): 29-33. WANG Xiao-ling, CHEN Jin, CONG Fei-yun. Application of spectral band entropy (SBE) method in rolling bearing fault diagnosis based on time-frequency analysis [J]. Journal of Vibration and Shock, 2012, 31(18): 29-33.
[6] 郭磊,陳進. 小波包熵在設(shè)備性能退化評估中的應(yīng)用[J]. 機械科學(xué)與技術(shù),2008,27(9): 1203-1206. GUO Lei, CHEN Jin.Application of wavelet packet entropy to equipment performance degradation assessment[J]. Mechanical Science and Technology for Aerospace Engineering, 2008, 27(9): 1203-1206.
[7] 宋濤,湯寶平,李鋒. 基于流形學(xué)習(xí)和 K-最近鄰分類器的旋轉(zhuǎn)機械故障診斷方法[J]. 振動與沖擊,2013,32(5): 149-153. SONG Tao, TANG Bao-ping, LI Feng. Fault diagnosis method for rotating machinery based on manifold learning and K-nearest neighbor classifier [J]. Journal of Vibration and Shock, 2013, 32(5): 149-153.
[8] Dong S, Luo T. Bearing degradation process prediction based on the PCA and optimized LS-SVM model [J]. Measurement, 2013, 46(9): 3143-3152.
[9] 董紹江,湯寶平,張焱. 基于非廣延小波特征尺度熵和支持向量機的軸承狀態(tài)識別[J]. 振動與沖擊,2012,31(15): 50-54. DONG Shao-jiang, TANG Bao-ping, ZHANG Yan. Bearingrunning state recognition based on non-extensive wavelet feature scale entropy and support vector machine [J]. Journal of Vibration and Shock, 2012,31(15): 50-54.[10] Yan J, Guo C, Wang X. A dynamic multi-scale Markov model based methodology for remaining life prediction [J]. Mechanical Systems and Signal Processing, 2011, 25(4): 1364-1376.
[11] 石林鎖,沈金偉,張亞洲,等. 基于AR模型和譜峭度法的滾動軸承故障診斷[J]. 振動與沖擊,2011,30(12): 257-260. SHI Lin-suo, SHEN Jin-wei, ZHANG Ya-zhou, et al. Fault diagnosis of a rolling element bearing based on AR model and spectral kurtosis [J]. Journal of Vibration and Shock,2011, 30(12): 257-260.
[12] 田中大,高憲文,李琨. 基于KPCA與LSSVM的網(wǎng)絡(luò)控制系統(tǒng)時延預(yù)測方法[J]. 系統(tǒng)工程與電子技術(shù),2013,35(6):1281-1285. TIAN Zhong-da, GAO Xian-wen, LI Kun. Networked control system time-delay prediction method based on KPCA and LSSVM [J]. Systems Engineering and Electronics, 2013, 35(6):1281-1285.
[13] 何強,蔡洪,韓壯志,等. 基于非線性流形學(xué)習(xí)的 ISAR 目標(biāo)識別研究[J]. 電子學(xué)報,2010,38(3): 585-590. HE Qiang, CAI Hong, HAN Zhuang-zhi, et al. ISAR Target Recognition Based on Nonlinear Manifold Learning [J].Acta Electronica Sinica, 2010, 38(3): 585-590.
[14] He X F, Niyogi P. Locality preserving projections, in: Proceedings of the Conference on Advances in Neural Information Processing Systems, 8-13 December 2003, Vancouver[C]. Canada, MIT Press, Cambridge, MA, 2004:1-8.
[15] Lee J, Qiu H, Yu G, et al. Rexnord technical services, “bearing data set”,IMS, university of cincinnati, NASA ames prognostics data repository, 〈http://ti.arc.nasa.gov/project/prognostics-data-repository〉, NASA Ames, Moffett Field, CA, 2007.
Degradation trend prediction of rolling bearing based on manifold learning and least squares support vector machine
XIAO Ting, TANG Bao-ping, QIN Yi, CHEN Chang
(The State Key Laboratory of Mechanical Transmission, Chongqing University, Chongqing 400030, China)
A new prediction method was proposed based on manifold learning and least squares support vector machine to describe the rolling bearing degradation trend. Time-domain features and features based on information entropy were extracted to construct high-dimensional characteristic sets. The locality preserving projection algorithm was used for dimensionality reduction in order to eliminate the problem of redundancy between each indicators. The characteristic features were input to the least squares support vector machine to train and construct a model, so as to accomplish the trend prediction. The rolling bearing run-to-failure tests were carried out to inspect the prediction model, and the results demonstrate the effectiveness and accurateness of the proposed method.
degradation assessment; information entropy; manifold learning; least squares support vector machine (LS-SVM)
國家自然科學(xué)基金資助項目(51275546,51375514);高等學(xué)校博士學(xué)科點專項科研基金資助(20130191130001)
2014-01-08 修改稿收到日期:2014-05-08
肖婷 女,碩士生,1989年12月生
湯寶平 男,博士,教授,博士生導(dǎo)師,1971年9月生
TP393.1;TH17
A
10.13465/j.cnki.jvs.2015.09.027