陳 劍,蔡坤奇,陶善勇,楊 斌,劉圓圓,劉幸福,黃凱旋
(1.合肥工業(yè)大學(xué) 噪聲振動研究所,安徽 合肥 230009;2.安徽省汽車NVH技術(shù)研究中心,安徽 合肥 230009)
滾動軸承是大多數(shù)機械和電氣設(shè)備的重要支承部件,它發(fā)生故障將直接影響設(shè)備的正常工作,導(dǎo)致重大經(jīng)濟(jì)損失。準(zhǔn)確有效地軸承故障診斷既可提高設(shè)備運行的可靠性和穩(wěn)定性,也可避免重大事故的發(fā)生[1]。
滾動軸承故障診斷主要包括兩個方面,故障特征提取和故障模式識別。通常,故障特征提取可進(jìn)行時域特征、頻域特征或者時頻特征分析,進(jìn)而構(gòu)建特征向量。對于非平穩(wěn)、非線性信號,時頻分析是最有效的分析方法。常見的滾動軸承故障時頻提取方法有:局部均值分解、經(jīng)驗?zāi)B(tài)分解、變分模態(tài)分解、小波變換、固有時間尺度分解等[2,3]。故障模式識別是人工智能研究領(lǐng)域的一個重要研究方向,基于系統(tǒng)論、控制論和信息論,主要研究參數(shù)估計、系統(tǒng)辨識等。常見方法有:神經(jīng)網(wǎng)絡(luò)、聚類分析和支持向量機方法等[4,5,15]。
固有時間尺度分解(intrinsic time scale decomposition,ITD)是Frei M G等人提出的一種自適應(yīng)時頻分析方法[6],相比經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition,EMD)和局部均值分解(local mean decomposition,LMD),ITD方法在端點效應(yīng)和計算效率方面優(yōu)勢明顯,且適合在線監(jiān)測和分解[7]。但I(xiàn)TD方法自身也存在一些不足,即采用線性變換構(gòu)造基線號有可能導(dǎo)致分解后的信號出現(xiàn)毛刺而失真;IITD(improved intrinsic time scale decomposition)方法改善了ITD分解的波形失真和端點效應(yīng)問題,廣泛應(yīng)用于故障診斷領(lǐng)域[8,9]。文獻(xiàn)[10]提出基于固有時間尺度分解和近似熵結(jié)合隨機森林(RF)的軸承故障診斷方法,雖提高了微弱信號故障診斷準(zhǔn)確率,但近似熵采用硬閾值判據(jù)指標(biāo),影響數(shù)據(jù)統(tǒng)計結(jié)果穩(wěn)定性。文獻(xiàn)[11]提出基于IITD樣本熵和支持向量機的齒輪故障診斷方法,但樣本熵易受數(shù)據(jù)波動影響,支持向量機在處理大樣本數(shù)據(jù)能力不足以及多分類問題精度較低等缺陷。
本文擬將IITD分解和模糊熵方法用于滾動軸承振動故障信號特征提取,構(gòu)建其特征向量,作為隨機森林分類器的輸入用于軸承故障類型識別與診斷,以解決近似熵和樣本熵易受數(shù)據(jù)波動,支持向量機處理大樣本數(shù)據(jù)能力不足等問題。其主要原理是:對原振動信號進(jìn)行IITD分解得到多個PR分量,提取PR分量的模糊熵構(gòu)建特征向量來表達(dá)故障軸承的信號特征;然后采用隨機森林算法對軸承故障進(jìn)行模式識別分類,最后與支持向量機識別結(jié)果對比,驗證方法的準(zhǔn)確性和優(yōu)越性。
ITD分解的分量出現(xiàn)明顯變形和端點效應(yīng),對原信號分解精度產(chǎn)生影響,進(jìn)而導(dǎo)致各PR分量發(fā)生改變且分解得到的信號左、右兩端偽局部極值點。IITD分解,采用端點延拓和三次樣條擬合的方法,使IITD分解后的分量更精準(zhǔn)地體現(xiàn)原始信號的頻率成分。
IITD分解具體步驟如下[12]:
1) 確定信號Xt(t≥0)的局部極值點XN對應(yīng)的時刻τk(k=1,2,…,N),N為極值點的個數(shù),在連續(xù)極值點[τk,τk+1]上,定義信號線性提取因子L為:
(1)
式中:
式中:α為線性縮放因子,一般取值為0.5。
2) 上述公式提取到的基線控制點Lk,通過對時間序列采用鏡像對稱延拓方法,可得左右兩端極值點(τ0,X0),(τM+1,XM+1),令k分別為0和M-1進(jìn)而求出L1與LM的值,再用三次樣條插值函數(shù)擬合得到基線信號L1(t)。
3) 原信號Xt與基線信號Lt之差得到固有旋轉(zhuǎn)因子h1(t):
h1(t)=Xt-L1(t)
(2)
判斷基線Lk+1≠0,則h1(t)是一個固有旋轉(zhuǎn)分量,輸出h1(t),令PR1=h1(t),如果Lk+1=0,則h1(t)作為原始數(shù)據(jù),重復(fù)上述步驟直到滿足:
h1k(t)=PR1
(3)
4) 從原始數(shù)據(jù)中分離出來PR1分量,得到新信號r1(t),具體過程為:
r1(t)=Xt-PR1
(4)
5) 將r1(t)作為新的給定信號重復(fù)步驟(1)~(4),循環(huán)n-1次之后,直到將rn(t)為一單調(diào)函數(shù)或常函數(shù),最終,原始信號Xt被分解為n個PR分量和一個殘余項r1(t)之和。
(5)
為了驗證IITD分解信號的有效性,分別采用IITD、ITD方法對一解析信號進(jìn)行分解。設(shè)仿真信號為:x1=(1+0.5cos(8 π t))·cos(200 π t+2cos(10 π t)),x2=cos(30 π t),x=x1+x2,采樣頻率為1 kHz,采樣點數(shù)為1 000。3種方法的分解結(jié)果分別如圖1、圖2、圖3所示。
圖1 仿真信號波形圖Fig.1 Simulation signal waveform
圖2 信號x(t) ITD分解結(jié)果Fig.2 ITD decomposition result of signal x(t)
圖3 信號x(t) IITD分解結(jié)果Fig.3 IITD decomposition results of signal x(t)
比較二者的分解結(jié)果,從圖2、圖3分解的分量效果表明,ITD分解得到的第二個分量出現(xiàn)了明顯的端點效應(yīng),IITD分解得到的分量較ITD光滑,更準(zhǔn)確地體現(xiàn)仿真信號的頻率組成。
模糊熵是由Zadeh L A在1968年首次提出,它用來描述一個模糊集模糊程度[13]。采用近似熵和樣本熵處理信號時,信號的絕對幅值差決定其相似性,數(shù)據(jù)的波動對結(jié)果產(chǎn)生影響。模糊熵算法則通過均值運算,采用指數(shù)函數(shù)代替絕對幅值差,除去基線漂移和數(shù)據(jù)波動的影響,向量的相似度由模糊函數(shù)形狀決定,保證模糊熵值隨參數(shù)平穩(wěn)變化。
模糊熵的定義為:
1) 對于給定的N點時間序列{u(i):1≤i≤N},處理后得到m維向量:
(6)
(7)
(u(i+k)-u0(j))|)
(8)
i,j=1,2…N-m;i≠j
(9)
4) 定義函數(shù):
(10)
5) 同樣,根據(jù)以上步驟構(gòu)造m+1維向量:
(11)
6) 定義模糊熵為:
FuzzyEn(m,n,r)=
(12)
當(dāng)N為有限數(shù)時,上述表達(dá)為:
(13)
上述公式中,模糊熵的值不僅與數(shù)據(jù)長度N有關(guān),還與參數(shù)m、r和n有關(guān)。根據(jù)文獻(xiàn)[14]的研究,嵌入維數(shù)m一般選擇1或2,模糊函數(shù)的梯度n,相似容限r(nóng)取0.1~0.5 SD(SD是原數(shù)據(jù)的標(biāo)準(zhǔn)差),本文計算取值:N取2 048,n取2,m取2,r取0.2 SD。
隨機森林(random forest)是Breiman在2001年提出的一種分類方法,采用Bagging技術(shù)訓(xùn)練多個決策樹組合得到隨機森林?;贐agging算法,隨機森林同時加入了樣本和特征兩個方面的隨機屬性選擇。隨機森林分類的思想是隨機選擇一些特征屬性構(gòu)建一個決策樹,重復(fù)這個過程建立多個決策樹,并由產(chǎn)生的決策樹作為投票原則產(chǎn)生分類結(jié)果。
1) 生成每顆決策樹的訓(xùn)練集。隨機森林利用Bootstrap法重采樣從原始訓(xùn)練集中有放回?zé)o權(quán)重地抽取T個訓(xùn)練子集,每一個子集對應(yīng)一個決策樹。未被抽中的數(shù)據(jù)稱為袋外OOB(out-of-bag)數(shù)據(jù),OOB數(shù)據(jù)用來評估分類器的正確率,且對異常數(shù)據(jù)具有抗干擾能力,這樣可以避免隨機森林中的決策樹產(chǎn)生局部最優(yōu)解,使分類更準(zhǔn)確。
3) 特征β把節(jié)點分成2個分支,然后從剩下的特征中尋找分類效果最好的特征,最終決策樹按照不純度最小原則充分生長,且不剪枝處理,直到?jīng)Q策樹的屬性生長到葉子節(jié)點或完全被使用。
4) 通過構(gòu)建的決策樹對測試樣本預(yù)測后分類,分類的標(biāo)簽來自于所有決策樹的綜合?;贗ITD模糊熵的隨機森林模式識別具體方法如圖4所示。
圖4 基于IITD模糊熵和RF的滾動軸承診斷方法Fig.4 Diagnosis method of rolling bearing based on IITD fuzzy entropy and RF
實驗數(shù)據(jù)來自合肥工業(yè)大學(xué)航空發(fā)動機軸承試驗臺。試驗臺的整體結(jié)構(gòu)布置如圖5所示。實驗軸承采用NSK的NU1010型號單列圓柱滾子軸承。為滿足實驗需求,利用激光打標(biāo)機和線切割加工出內(nèi)圈、外圈、滾動體等3種軸承故障。
圖5 軸承試驗臺總體結(jié)構(gòu)Fig.5 Overall structure of bearing test bench
利用LMS Test.lab軟件在電腦上采集額定軸向載荷等4種故障狀態(tài)3種轉(zhuǎn)速振動信號,傳感器測點布置如圖6所示。試驗工況設(shè)定:采樣頻率為20 480 Hz。轉(zhuǎn)速為3 000 rpm,軸向載荷為2 kN,定轉(zhuǎn)速每類故障狀態(tài)采集長度為634 880。
圖6 傳感器測點布置Fig.6 Sensor measuring point arrangement
隨機選取45組長度為1 000個采樣點的樣本,其中隨機選擇30組作為訓(xùn)練,另外15組用來測試。IITD分解得到前5個PR分量與原信號Xt之間相關(guān)度高于設(shè)定閾值λ=0.2,相關(guān)性較高; 第6個分量相關(guān)性為0.023,遠(yuǎn)小于0.2,故選取前5個PR分量進(jìn)行計算得到模糊熵數(shù)據(jù)。4種故障狀態(tài)經(jīng)過計算,最終形成(4×45)×5即維數(shù)為180×5的數(shù)據(jù)集。
隨機抽取120組訓(xùn)練集數(shù)據(jù)訓(xùn)練得到隨機森林分類器模型。剩余60組測試集數(shù)據(jù)用來驗證。為了體現(xiàn)隨機森林分類方法的準(zhǔn)確性,使用模糊熵數(shù)據(jù)集訓(xùn)練SVM、BPNN對比。三者分類輸出結(jié)果分別如圖7(a)、(b)、(c)和表1所示。其中圖7中縱坐標(biāo)類別標(biāo)簽1、2、3、4分別對應(yīng)軸承的滾子故障、內(nèi)圈故障、外圈故障、正常狀態(tài)。
圖7 RF、SVM與BPNN分類結(jié)果對比Fig.7 Comparison of classification results of RF, SVM and BPNN
表1 隨機森林和支持向量機診斷準(zhǔn)確率對比Tab.1 Comparison of diagnosis accuracy between random forest and support vector machine (%)
針對IITD分解得到模糊熵數(shù)據(jù)構(gòu)成的特征向量,IITD-RF方法識別率最高,誤判數(shù)為1次;IITD-SVM以及IITD-BPNN方法誤判次數(shù)分別為3次和4次。由表1可以看出IITD模糊熵與隨機森林的滾動軸承故障診斷方法準(zhǔn)確率高于其余兩種,對滾動軸承故障診斷更有優(yōu)勢。
本文提出了一種將IITD與模糊熵結(jié)合并利用隨機森林分類的滾動軸承故障診斷方法。IITD方法克服了ITD的缺點,分解得到的分量曲線光滑;模糊熵應(yīng)用到滾動軸承故障診斷,消除了數(shù)據(jù)波動的影響;采用隨機森林和支持向量機、BP神經(jīng)網(wǎng)絡(luò)等3種算法對故障軸承進(jìn)行模式識別,實驗對比結(jié)果表明,本文方法能準(zhǔn)確地診斷出滾動軸承的故障類型,且分類總精度大于98%,驗證了該方法的有效性,為滾動軸承故障診斷提供了新思路。