汪友明,程 琳
(西安郵電大學(xué) 自動化學(xué)院,陜西 西安 710121)
滾動軸承作為機(jī)械設(shè)備的易損部件,其健康狀態(tài)對整個機(jī)械設(shè)備的性能、穩(wěn)定性以及使用壽命有著巨大的影響[1]。因此,在滾動軸承出現(xiàn)局部損傷、缺陷或者早期故障時,需要準(zhǔn)確地獲取故障信息并快速地識別故障。軸承故障數(shù)據(jù)具有數(shù)據(jù)量大、故障類型多和和運(yùn)轉(zhuǎn)速率高等3個特點(diǎn)[2]。每個軸承有上萬個測試樣本點(diǎn),需要通過智能診斷方法進(jìn)行自動分析,在不同工況、不同頻率下造成軸承故障的原因和類型也多種多樣。并且,機(jī)械設(shè)備的各個部分密切相關(guān),僅僅因?yàn)檩S承的微小故障就有可能使整個機(jī)械設(shè)備處于癱瘓狀態(tài)。
特征提取和狀態(tài)分類是軸承故障診斷的重要部分。傳統(tǒng)的軸承故障診斷大多采用機(jī)器學(xué)習(xí)[3]的方法,需要信號處理技術(shù)和診斷經(jīng)驗(yàn),依賴軸承故障數(shù)據(jù)的先驗(yàn)知識提取特征,使得訓(xùn)練的網(wǎng)絡(luò)模型普適性差,給不同工況下的故障識別與診斷帶來了嚴(yán)重困擾。深度學(xué)習(xí)[4-6]能夠從原始機(jī)械故障輸入數(shù)據(jù)中提取出具有良好抽象和泛化的特征,尤其適合處理復(fù)雜故障診斷數(shù)據(jù)。卷積神經(jīng)網(wǎng)絡(luò)[7](Convolutional Neural Network,CNN)作為深度學(xué)習(xí)的經(jīng)典算法之一,其局部連接、權(quán)值共享以及池化操作等特性使之可以有效降低網(wǎng)絡(luò)的復(fù)雜度,降低訓(xùn)練參數(shù)的冗長現(xiàn)象,具有魯棒性強(qiáng)、容錯能力高、易于訓(xùn)練和優(yōu)化等優(yōu)點(diǎn)。利用CNN能夠捕獲特征的優(yōu)勢,對旋轉(zhuǎn)機(jī)械進(jìn)行故障診斷[8]。當(dāng)加速度傳感器所采集的滾動軸承振動信號為一維時序數(shù)據(jù)時,利用緊湊的自適應(yīng)一維CNN分類器可對滾動軸承進(jìn)行進(jìn)行軸承故障分類[9]。根據(jù)長短時記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)善于處理故障數(shù)據(jù)時間序列的優(yōu)勢,處理小波包變換提取的特征向量,可實(shí)現(xiàn)風(fēng)電機(jī)組滾動軸承故障診斷[10]。LSTM網(wǎng)絡(luò)還可對于軸承的故障部位和故障程度進(jìn)行有效識別[11]。
上述方法雖然能夠?qū)S承故障特征進(jìn)行自主學(xué)習(xí),但是在CNN中并沒有考慮時間序列數(shù)據(jù)中隱藏的長期依賴關(guān)系,即當(dāng)前時間步長與先前時間步長之間的相關(guān)性,這是形成可分類特征的關(guān)鍵。忽略時間序列數(shù)據(jù)可能會出現(xiàn)數(shù)據(jù)丟失、異常等問題,為此,擬提出一種改進(jìn)的卷積-長短時記憶網(wǎng)絡(luò)(Convolutional Neural Network-Long and Short Term Memory,CNN-LSTM)滾動軸承故障診斷方法實(shí)現(xiàn)特征的時序表達(dá)。該方法先利用卷積神經(jīng)網(wǎng)絡(luò)方法提取軸承數(shù)據(jù)的局部復(fù)雜特征,再將輸出的特征信息加載到LSTM中,提取時間序列數(shù)據(jù)的全局特征,以克服卷積神經(jīng)網(wǎng)絡(luò)對長時間依賴關(guān)系建模能力弱的缺點(diǎn)。最后,通過對故障軸承從低層到高層的特征表示,實(shí)現(xiàn)故障診斷。
為了方便卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算,將采集到的軸承加速度振動一維信號轉(zhuǎn)換成二維信號。采用原始一維序列信號逐行堆疊的方式進(jìn)行信號的維度轉(zhuǎn)換,將1×2 400一維數(shù)據(jù)轉(zhuǎn)化為60×40二維特征矩陣,變換示意圖如圖1所示。
圖1 二維矩陣變換
為了克服淺層網(wǎng)絡(luò)難以表征大數(shù)據(jù)和不同工況下軸承故障振動信號與健康狀況之間復(fù)雜的映射關(guān)系,將預(yù)處理后的二維數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò)中,選用ReLU函數(shù)作為激活函數(shù),采用2個卷積層、2個池化層和1個全連接層。池化操作一般有最大池化和平均池化,選用最大池化提取顯著的軸承故障特征。改進(jìn)的CNN-LSTM滾動軸承故障診斷方法采用卷積神經(jīng)網(wǎng)絡(luò)提取軸承振動深層數(shù)據(jù)特征,捕捉豐富的局部關(guān)聯(lián)信息,利用長短時記憶網(wǎng)絡(luò)中隱藏單元的記憶模塊提取時序特征,處理時間序列問題。將卷積特征和提取時序特征相融合,從而輸出診斷結(jié)果。如果達(dá)到比較高的分類精度,則可得到分類結(jié)果,反之,則重新調(diào)整參數(shù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練。改進(jìn)的CNN-LSTM結(jié)構(gòu)如圖2所示。
圖2 改進(jìn)的CNN-LSTM結(jié)構(gòu)
CNN是一種帶有卷積結(jié)構(gòu)的前饋深度神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)包括輸入層、卷積層、降采樣層、全連接層和輸出層。深度神經(jīng)網(wǎng)絡(luò)的基本構(gòu)成是神經(jīng)元,在神經(jīng)元中存在一個激活函數(shù),由于非負(fù)區(qū)間的梯度為常數(shù),不存在梯度消失問題,使得網(wǎng)絡(luò)的收斂速度維持在一個穩(wěn)定狀態(tài)。利用CNN自動提取軸承故障特征過程描述如下。
對于CNN卷積層的第r層輸出故障信號二維特征圖,可表示為
(1)
對于采樣層的第r層輸出故障信號二維特征圖,可表示為
(2)
式中:down表示下采樣函數(shù);β為乘性偏置。
對于第r層的全連接層的輸出,可表示為
xr=f(wrxr-1+br)
(3)
式中,xr-1為輸出前一層二維特征圖,wr為全連接層的權(quán)值矩陣,br為偏置項(xiàng)。
LSTM網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)[12](Recurrent Neural Network,RNN)的一種特殊類型,其增加了輸入門、輸出門和遺忘門等3個控制單元學(xué)習(xí)長期依賴信息。LSTM網(wǎng)絡(luò)中的控制單元對輸入信息進(jìn)行判斷,留下符合規(guī)則的信息,不符合的信息則被遺忘。利用LSTM網(wǎng)絡(luò),提取長短時的間隔信息以及預(yù)測時間序列[13-14],LSTM網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 LSTM網(wǎng)絡(luò)結(jié)構(gòu)
將式(3)得到CNN的輸出結(jié)果輸入LSTM網(wǎng)絡(luò)中。LSTM網(wǎng)絡(luò)當(dāng)前時刻的輸入特征圖表示為
(4)
其中,M表示選擇的輸入故障信號二維特征圖個數(shù)。x(t)的前一節(jié)點(diǎn)的輸出特征圖表示為
(5)
其中,N表示輸出特征圖的個數(shù)。
對數(shù)據(jù)進(jìn)行更新和整合,得到輸入門為
(6)
式中:wmd和bmd分別表示在當(dāng)前時刻第m個特征圖輸入門i(t)所對應(yīng)的的權(quán)重和偏置;wnd和bnd分別表示在前一時刻第n個特征圖所對應(yīng)的權(quán)重和偏置;σ表示sigmoid激活函數(shù);g(t) 表示信息候選向量。
(7)
式中:wmφ和bmφ分別表示在當(dāng)前時刻第m個特征圖遺忘門f(t)所對應(yīng)的的權(quán)重和偏置;wnφ和bnφ分別表示在前一時刻第n個特征圖所對應(yīng)的的權(quán)重和偏置。
根據(jù)輸入門和遺忘門傳遞的信息,得到新的信息候選值
(8)
信息候選值選用tanh函數(shù)激活,并與輸出門
(9)
進(jìn)行計(jì)算,從而得到網(wǎng)絡(luò)輸出
(10)
其中:wmφ和bmφ分別表示在當(dāng)前時刻第m個特征圖輸入門i(t)所對應(yīng)的的權(quán)重和偏置;wnφ和bnφ分別表示在前一時刻第n個特征圖所對應(yīng)的權(quán)重和偏置。
實(shí)驗(yàn)數(shù)據(jù)來自美國凱斯西儲大學(xué)(Case Western Reserve University,CWRU)的滾動軸承數(shù)據(jù)中心[15]。CWRU軸承中心數(shù)據(jù)采集系統(tǒng)由1個電動機(jī)、1個扭矩傳感器和1個功率測試計(jì)組成,如圖4所示。
圖4 CWRU軸承中心數(shù)據(jù)采集系統(tǒng)及軸承結(jié)構(gòu)
軸承的損傷為用電火花加工的單點(diǎn)損傷,電動機(jī)風(fēng)扇端和驅(qū)動端的軸承座上方各放置1個加速度傳感器,采集故障軸承的振動加速度信號。采集系統(tǒng)是在采樣頻率為48 kHz,電機(jī)負(fù)載工況為2馬力,轉(zhuǎn)速為1 750 r/min工作條件下記錄振動加速度信號數(shù)據(jù)。被檢測的軸承一共有內(nèi)圈故障、外圈故障和滾珠故障等3種缺陷位置,損傷直徑分別為0.18 mm,0.36 mm和0.54 mm,9種故障狀態(tài)加上正常狀態(tài),一共存在10種狀態(tài)。在對數(shù)據(jù)進(jìn)行重構(gòu)時,為了最大化對數(shù)據(jù)進(jìn)行特征分析,將所有樣本點(diǎn)重構(gòu)為2 000個樣本,每個樣本有2 400個數(shù)據(jù)點(diǎn),每種故障類型有200個樣本。將1×2 400一維數(shù)據(jù)轉(zhuǎn)化為60×40二維特征矩陣進(jìn)行處理,作為卷積神經(jīng)網(wǎng)絡(luò)的輸入。這樣處理既降低了數(shù)據(jù)處理的復(fù)雜性,又保留了原始振動數(shù)據(jù)的關(guān)鍵特征。
實(shí)驗(yàn)樣本信息如表1所示。不同類型的軸承振動信號時域波形如圖5所示,其中,橫坐標(biāo)表示采樣點(diǎn)數(shù),縱坐標(biāo)表示幅值,單位為mm。由于不同類型的故障信號時域波形間存在的相似性難以有效識別的問題,直接將振動數(shù)據(jù)轉(zhuǎn)化為二維矩陣,利用深度學(xué)習(xí)方法進(jìn)行特征提取。
表1 實(shí)驗(yàn)樣本信息表
圖5 不同類型的軸承振動信號時域波形
CNN結(jié)構(gòu)由2個卷積層、2個池化層和1個全連接層組成。網(wǎng)絡(luò)超參數(shù)批次大小batch_size設(shè)置為50,網(wǎng)絡(luò)的步數(shù)設(shè)置為64,隱藏單元設(shè)置為128,故障類型是10種。第1個卷積層的卷積核尺寸為5×5,步長為1,卷積特征為25。第1個池化層步長為2,池化特征為25。第2個卷積層的卷積核尺寸為5×5,卷積核深度為25,步長為1,卷積后的特征為50。第2個池化層步長為2,池化特征為50。對振動數(shù)據(jù)進(jìn)行二維處理后,得到60×40的圖像,采用5×5的卷積核,步長為4,卷積層的輸出維度為15×10,并增加1個全連接層,將輸出結(jié)果輸入長短時記憶網(wǎng)絡(luò)中,經(jīng)過3個控制門進(jìn)行處理后,輸出給分類器進(jìn)行分類。改進(jìn)的CNN-LSTM滾動軸承故障診斷方法的參數(shù)設(shè)置如表2所示。
表2 卷積層和池化層的參數(shù)設(shè)置
改進(jìn)的CNN-LSTM軸承故障診斷方法在TensorFlow深度學(xué)習(xí)庫中進(jìn)行訓(xùn)練,需要不斷更新參數(shù),尋找最優(yōu)參數(shù)。軸承故障診斷的常用評估指標(biāo)包括F1分?jǐn)?shù)、準(zhǔn)確率、精確率和召回率。在相同實(shí)驗(yàn)環(huán)境下,構(gòu)建相應(yīng)的網(wǎng)絡(luò)結(jié)構(gòu),分別對比改進(jìn)的CNN-LSTM、CNN-LSTM、LSTM、CNN、支持向量機(jī)(Support Vector Machine,SVM)及反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Petwork,BPNN)[16]等方法的軸承故障監(jiān)測與診斷結(jié)果,如表3所示。
表3 不同方法的滾動軸承故障監(jiān)測診斷結(jié)果
由表3可以看出,改進(jìn)的CNN-LSTM方法的診斷準(zhǔn)確率約為99%,可穩(wěn)定、準(zhǔn)確地診斷出不同故障位置和故障模式下的軸承故障。與LSTM和CNN相比,改進(jìn)的CNN-LSTM方法和CNN-LSTM方法均具有更高的診斷識別率,表明LSTM方法的引入可以提高網(wǎng)絡(luò)的診斷性能。基于傳統(tǒng)特征工程的SVM和BPNN方法的診斷結(jié)果最差,這是因?yàn)檫@兩種方法是先對原始信號進(jìn)行模態(tài)分解,再經(jīng)過希爾伯特變換,經(jīng)驗(yàn)?zāi)B(tài)分解的端點(diǎn)效應(yīng),限制了的數(shù)據(jù)處理能力。
深度學(xué)習(xí)方法的初始化是隨機(jī)的,初始化狀態(tài)的不同可能導(dǎo)致同一數(shù)據(jù)集的性能不同。對改進(jìn)的CNN-LSTM、CNN-LSTM、LSTM、CNN、SVM及BPNN等方法進(jìn)行10次實(shí)驗(yàn),分別對比不同初始化狀態(tài)下的準(zhǔn)確性和穩(wěn)定性,箱線圖結(jié)果如圖6所示。
圖6 10次試驗(yàn)的軸承故障監(jiān)測診斷準(zhǔn)確率
由圖6可以看出,改進(jìn)的CNN-LSTM方法的診斷準(zhǔn)確性超過99%。CNN-LSTM方法的診斷結(jié)果在最高水平上可以達(dá)到98%,但是在不同的初始化過程中表現(xiàn)不一,并且出現(xiàn)異常點(diǎn)。與其他方法相比,改進(jìn)的CNN-LSTM的中位值精度更高,更穩(wěn)定,診斷結(jié)果優(yōu)于CNN、LSTM和其他單一表達(dá)域SVM及BPNN的方法。改進(jìn)的CNN-LSTM方法不僅在收斂速度上明顯快于其他5種方法,而且訓(xùn)練誤差最終收斂在0.1以下,取得了良好的測試精度,具有更好的監(jiān)測診斷能力。
CNN-LSTM結(jié)構(gòu)的軸承故障診斷方法訓(xùn)練過程需要不斷更新參數(shù),尋找最優(yōu)參數(shù)。在識別任務(wù)中混淆矩陣是評價(jià)算法的一個指標(biāo)。為了研究改進(jìn)的CNN-LSTM、CNN-LSTM、LSTM和CNN等方法在不同組合故障類別下的性能,在多個實(shí)驗(yàn)?zāi)繕?biāo)和實(shí)際軸承組合故障分類組合下,得到的混淆矩陣故障診斷結(jié)果如圖7所示,其中,橫坐標(biāo)代表預(yù)測標(biāo)簽值,縱坐標(biāo)代表真實(shí)標(biāo)簽值。
圖7 4種方法的混淆矩陣故障診斷結(jié)果
由圖7(a)可以看出,改進(jìn)的CNN-LSTM方法能夠?qū)S承復(fù)合故障進(jìn)行有效分類,平均精確率能達(dá)到99%以上,高于其他3種方法,表明該方法在滾動軸承故障診斷分類中具有明顯的優(yōu)越性。
作用在軸承故障振動信號上的改進(jìn)的CNN-LSTM方法,利用卷積神經(jīng)網(wǎng)絡(luò)提取軸承數(shù)據(jù)的復(fù)雜特征,通過加入長短時記憶提取豐富的故障特征時間序列信息,可自動學(xué)習(xí)對診斷軸承故障有益的特征。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的CNN-LSTM方法在CWRU軸承數(shù)據(jù)庫上的準(zhǔn)確率達(dá)到99%左右,主觀診斷結(jié)果和客觀評價(jià)指標(biāo)均優(yōu)于CNN-LSTM、LSTM、CNN、SVM及BPNN等現(xiàn)有方法,具有較高的分類精度和較強(qiáng)的穩(wěn)定性。