姚立,孫見(jiàn)君,馬晨波
(南京林業(yè)大學(xué) 機(jī)械電子工程學(xué)院,南京 210037)
滾動(dòng)軸承是旋轉(zhuǎn)機(jī)械的重要組成部分,其健康狀況直接影響設(shè)備的服役性能。據(jù)統(tǒng)計(jì),約有40%的旋轉(zhuǎn)機(jī)械故障源于滾動(dòng)軸承損傷,因此,開(kāi)展軸承故障診斷研究對(duì)于保障設(shè)備安全,穩(wěn)定生產(chǎn)具有重要意義[1-3]。
軸承振動(dòng)信號(hào)中包含豐富的狀態(tài)信息,是分析軸承故障狀態(tài)的重要手段。從機(jī)械設(shè)備上采集得到的軸承振動(dòng)信號(hào)往往具有非線性、非平穩(wěn)性的特點(diǎn),而且,隨著機(jī)械設(shè)備監(jiān)測(cè)點(diǎn)的增多,傳感器采樣頻率的提高,監(jiān)測(cè)時(shí)長(zhǎng)的增加,使得監(jiān)測(cè)數(shù)據(jù)呈現(xiàn)出“大數(shù)據(jù)”的特征,這些因素都增加了準(zhǔn)確識(shí)別軸承故障類(lèi)型的難度。
針對(duì)軸承故障類(lèi)型識(shí)別困難的問(wèn)題,以深度學(xué)習(xí)為主的模式識(shí)別方法憑借強(qiáng)大的數(shù)據(jù)處理能力和學(xué)習(xí)能力[4-6],越來(lái)越多地應(yīng)用于機(jī)械故障診斷領(lǐng)域。文獻(xiàn)[7]從齒輪箱振動(dòng)信號(hào)中提取了時(shí)、頻域特征,輸入到構(gòu)建好的卷積神經(jīng)網(wǎng)絡(luò)(CNN)中實(shí)現(xiàn)了故障識(shí)別。文獻(xiàn)[8]分析了不同故障類(lèi)型下的軌跡圖像,結(jié)合CNN實(shí)現(xiàn)了軸承故障的準(zhǔn)確識(shí)別。文獻(xiàn)[9]將軸承振動(dòng)信號(hào)轉(zhuǎn)換為灰度圖,利用改進(jìn)LeNet-5模型實(shí)現(xiàn)故障診斷。文獻(xiàn)[10]提出了一種基于希爾伯特-黃變換和CNN的診斷方法,并成功應(yīng)用于滾動(dòng)軸承的故障診斷。文獻(xiàn)[11]建立了基于長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)的診斷模型,對(duì)含有混合故障以及強(qiáng)噪聲的航空發(fā)動(dòng)機(jī)振動(dòng)信號(hào)進(jìn)行了故障識(shí)別。文獻(xiàn)[12]利用MCKD-Teager能量算子提取軸承振動(dòng)信號(hào)的特征,并用LSTM實(shí)現(xiàn)了軸承的故障分類(lèi)。
盡管上述診斷方法已經(jīng)實(shí)現(xiàn)了故障診斷的功能,但仍然存在以下問(wèn)題:1)在對(duì)原始信號(hào)進(jìn)行預(yù)處理時(shí)缺乏完善的重構(gòu),破壞了數(shù)據(jù)點(diǎn)的相關(guān)性,從而造成信息的丟失;2)CNN模型用于靜態(tài)輸出,其當(dāng)前輸出只與當(dāng)前輸入有關(guān),而軸承振動(dòng)信號(hào)具有明顯的時(shí)間特性,當(dāng)前輸出還與過(guò)去一段時(shí)間的輸出有關(guān),CNN很難處理這類(lèi)包含時(shí)間信息的數(shù)據(jù);3)LSTM等循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)可用于時(shí)間上的連續(xù)狀態(tài)輸出,具有短期記憶能力且能夠有選擇地將累積的信息進(jìn)行遺忘,但其本身不具備特征提取能力,依賴于人工提取的時(shí)頻域等特征。
基于以上分析,本文首先采用格拉姆角場(chǎng)(Gramian Angular Fields,GAF)對(duì)軸承振動(dòng)信號(hào)進(jìn)行重構(gòu),然后再利用CNN和RNN相融合的模型進(jìn)行故障識(shí)別,兼具了CNN在時(shí)空上的平移不變性和RNN的記憶能力,可以完整地表現(xiàn)原始振動(dòng)信號(hào)中的相關(guān)性,從而提高軸承故障診斷的精度。
(1)
(2)
根據(jù)編碼過(guò)程中所采用的三角函數(shù),GAF編碼方法可以將時(shí)間序列轉(zhuǎn)化為2種特征圖像,即基于正弦函數(shù)的格拉姆角差場(chǎng)(GADF)圖和基于余弦函數(shù)的格拉姆角和場(chǎng)(GASF)圖,其定義為
GGADF=
(3)
GGASF=
(4)
軸承振動(dòng)信號(hào)進(jìn)行GAF編碼的過(guò)程如圖1所示,原始時(shí)域信號(hào)中2個(gè)較為明顯的波峰對(duì)應(yīng)著GAF圖像中相應(yīng)位置不同顏色的點(diǎn)、線所組成的交叉特征,且峰值較大部分顏色較深,特征也愈發(fā)明顯(見(jiàn)圖1標(biāo)注處)。此外,原始波形中的其余振蕩幅度較小的部分也在GAF圖像中得到了很好地體現(xiàn)(表現(xiàn)為圖像中顏色較淺的特征),因此GAF編碼完成了對(duì)原始信號(hào)的完整映射,避免了信息的丟失。
圖1 軸承振動(dòng)信號(hào)GAF圖像編碼過(guò)程
受生物學(xué)感受野機(jī)制啟發(fā)而提出的卷積神經(jīng)網(wǎng)絡(luò)一般由卷積層、池化層和全連接層交叉堆疊而成,通常用于圖片和視頻的分析任務(wù),在結(jié)構(gòu)上具有局部連接、權(quán)值共享和匯聚的特征,具有一定的平移、縮放以及旋轉(zhuǎn)不變性,效果優(yōu)于其他神經(jīng)網(wǎng)絡(luò)模型。在本文中,卷積神經(jīng)網(wǎng)絡(luò)的輸入對(duì)象為GAF圖像,經(jīng)過(guò)一系列堆疊的卷積池化操作后,輸出故障類(lèi)型的標(biāo)簽。
2.1.1 卷積層
卷積層利用多個(gè)卷積核對(duì)輸入圖像進(jìn)行卷積,通過(guò)一個(gè)非線性激活函數(shù)輸出一系列特征圖[14],整個(gè)計(jì)算過(guò)程可定義為
(7)
非線性激活函數(shù)通常選用線性修正單元 ReLU,其定義為
(8)
2.2.2 池化層
池化層位于卷積層之后,目的是降低特征圖的維數(shù),進(jìn)一步減少可訓(xùn)練的參數(shù),并在一定程度上保持特征的尺度不變性,其定義為
(9)
2.2.3 全連接層
輸入圖像在經(jīng)過(guò)多個(gè)堆疊的卷積池化操作后,將得到的特征圖展開(kāi)為一維特征向量并輸入到全連接層中,建立特征與故障類(lèi)別的映射關(guān)系,可表示為
yk=f(ωkxk-1+bk),
(10)
式中:k為網(wǎng)絡(luò)的層數(shù);yk為全連接層的輸出;xk-1為全連接層的輸入;ωk為權(quán)重;bk為網(wǎng)絡(luò)偏置。
門(mén)控循環(huán)單元網(wǎng)絡(luò)(GRU)是傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)基于門(mén)控機(jī)制的變體,有效改善了RNN中的長(zhǎng)程依賴問(wèn)題,其包括更新門(mén)zt和重置門(mén)rt,數(shù)學(xué)表達(dá)式為
zt=σ(Wzxt+Uzht-1+bz),
(12)
rt=σ(Wrxt+Urht-1+br),
(13)
式中:σ(·)為L(zhǎng)ogistic函數(shù),輸出區(qū)間為(0,1);xt為當(dāng)前時(shí)間步輸入;ht-1為上一時(shí)刻的外部狀態(tài)。
(14)
(15)
基于CNN-RNN的故障診斷方法集特征提取和故障模式識(shí)別于一體,通過(guò)引入GRU網(wǎng)絡(luò)使該方法具有一定的特征記憶能力,從而實(shí)現(xiàn)軸承端到端的智能故障診斷。具體診斷流程如圖2所示:將采集的振動(dòng)信號(hào)按一定長(zhǎng)度截取為一系列樣本段;通過(guò)格拉姆角場(chǎng)將樣本編碼為224×224×3的GADF和GASF圖像并劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集;將訓(xùn)練集和驗(yàn)證集輸入到網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練和學(xué)習(xí),不斷更新網(wǎng)絡(luò)參數(shù);將測(cè)試集應(yīng)用于訓(xùn)練好的模型中實(shí)現(xiàn)故障分類(lèi)。
圖2 基于CNN-RNN的故障診斷流程圖
為驗(yàn)證所建立模型在軸承故障診斷中的有效性和實(shí)用性,采用XJTU-SY滾動(dòng)軸承加速壽命試驗(yàn)數(shù)據(jù)集[15]和美國(guó)凱斯西儲(chǔ)大學(xué)(CWRU)軸承數(shù)據(jù)集[16]進(jìn)行分析。
選取XJTU-SY滾動(dòng)軸承數(shù)據(jù)集中的Bearing1進(jìn)行分析,試驗(yàn)軸承型號(hào)為L(zhǎng)DK UER204,電動(dòng)機(jī)轉(zhuǎn)速為2 100 r/min,采集頻率為25.6 kHz。分別選取327 680個(gè)數(shù)據(jù)點(diǎn)用于樣本制作,每類(lèi)狀態(tài)包含326個(gè)樣本,建立了一個(gè)具有1 630個(gè)樣本的數(shù)據(jù)集,見(jiàn)表1。每種故障狀態(tài)均采用“獨(dú)熱碼(one-hot)”進(jìn)行編碼,用一個(gè)除了某一維為1其他各維均為0的向量表示類(lèi)別,向量的維數(shù)與故障類(lèi)別數(shù)相同。
表1 XJTU-SY試驗(yàn)樣本類(lèi)別描述
選取CWRU數(shù)據(jù)集中48 kHz采樣頻率下驅(qū)動(dòng)端SKF6205深溝球軸承的振動(dòng)信號(hào),包含正常運(yùn)行狀態(tài)總計(jì)10種故障模式,每類(lèi)故障類(lèi)別包含480個(gè)樣本,建立了一個(gè)具有4 800個(gè)樣本的數(shù)據(jù)集,見(jiàn)表2。
表2 CWRU試驗(yàn)樣本類(lèi)別描述
每種狀態(tài)下軸承振動(dòng)信號(hào)的長(zhǎng)度是固定的,為在有限的數(shù)據(jù)集中獲得盡可能多的樣本,采用滑窗取樣的方式截取信號(hào)段。如圖3所示,將滑動(dòng)窗口的長(zhǎng)度作為截取樣本的長(zhǎng)度,移動(dòng)步長(zhǎng)(通常小于滑動(dòng)窗口的長(zhǎng)度)為滑窗一次移動(dòng)的距離,使相鄰2個(gè)樣本之間部分重疊。令樣本長(zhǎng)度為2 000,移動(dòng)步長(zhǎng)為1 000,即以50%的重疊率進(jìn)行樣本分割,使樣本數(shù)量增加1倍[17-18],同時(shí)減輕了信號(hào)因直接截?cái)喽鴮?dǎo)致特征信息丟失的現(xiàn)象。
圖3 滑窗采樣
將XJTU-SY軸承數(shù)據(jù)的每類(lèi)故障狀態(tài)信號(hào)通過(guò)滑窗采樣劃分為326組,再對(duì)劃分好的信號(hào)進(jìn)行GAF變換,得到326張振動(dòng)信號(hào)時(shí)序圖像;同樣對(duì)CWRU軸承數(shù)據(jù)進(jìn)行劃分和GAF變換,得到每種故障狀態(tài)下的480張時(shí)序圖像。2個(gè)數(shù)據(jù)集中所有狀態(tài)的GAF圖像分別按照6∶2∶2的比例分為訓(xùn)練樣本、驗(yàn)證樣本和測(cè)試樣本。上述2個(gè)軸承數(shù)據(jù)集中不同故障狀態(tài)下的GAF圖像分別如圖4和圖5所示。
圖4 基于XJTU-SY軸承數(shù)據(jù)集的5種GAF圖像
圖5 基于CWRU數(shù)據(jù)集的10種GAF圖像
卷積核的大小、數(shù)目、移動(dòng)步長(zhǎng)、是否補(bǔ)零,池化層的大小以及全連接層中的神經(jīng)元個(gè)數(shù)等參數(shù)均會(huì)對(duì)卷積神經(jīng)網(wǎng)絡(luò)的識(shí)別效果造成影響。CNN選用在圖像識(shí)別領(lǐng)域表現(xiàn)較好的VGG網(wǎng)絡(luò)[19]并在預(yù)訓(xùn)練VGG16網(wǎng)絡(luò)的基礎(chǔ)上進(jìn)行參數(shù)調(diào)整。VGG網(wǎng)絡(luò)通過(guò)不斷堆疊較小卷積核的網(wǎng)絡(luò)層獲得相同的感受區(qū)域,在減少模型參數(shù)的同時(shí)增加了其非線性的特點(diǎn)。
本文所建立的CNN-RNN模型是在VGG16網(wǎng)絡(luò)的最后一個(gè)池化層后加上一個(gè)GRU網(wǎng)絡(luò)用于訓(xùn)練,最后將特征圖展開(kāi)為一維向量輸入全連接層中,并建立特征向量與故障類(lèi)別的映射,具體結(jié)構(gòu)如圖6所示,模型擁有12個(gè)卷積層,5個(gè)池化層,1個(gè)GRU網(wǎng)絡(luò)層,1個(gè)全連接層和1個(gè)激活函數(shù)為softmax的輸出層。卷積層采用3×3的卷積核提取特征,并通過(guò)ReLU函數(shù)激活輸出。池化層采用2×2的卷積核降低輸入數(shù)據(jù)的維度,dropout層的比率設(shè)置為0.3。經(jīng)過(guò)多次堆疊的卷積池化操作后,輸出特征圖的尺寸大小從(224,224,3)變?yōu)?7,7,512)。通過(guò)Reshape方法將輸出特征圖的大小重構(gòu)為(49,512)并輸入到GRU網(wǎng)絡(luò)中提取相應(yīng)的時(shí)間信息。分析完時(shí)間特征后利用全連接層對(duì)GAF圖像進(jìn)行排序,判斷其隸屬類(lèi)別。CNN-RNN模型的總體結(jié)構(gòu)和參數(shù)見(jiàn)表3,試驗(yàn)平臺(tái)為Python+Tensorflow2.0,硬件為Intel(R) Xeon(R) E5-2680 v4+Nvidia 2070。
表3 CNN-RNN網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)
圖6 CNN-RNN的網(wǎng)絡(luò)結(jié)構(gòu)
將所構(gòu)造的訓(xùn)練樣本和驗(yàn)證樣本輸入所建立的CNN-RNN模型中訓(xùn)練,利用測(cè)試樣本對(duì)模型性能進(jìn)行檢驗(yàn)。模型的參數(shù)設(shè)置如下:批處理圖片數(shù)(batchsize)為32,迭代步數(shù)(Epoch)預(yù)設(shè)為500,選擇Adam算法作為優(yōu)化器,交叉熵作為損失函數(shù);學(xué)習(xí)率設(shè)置在10-4~10-5之間動(dòng)態(tài)可調(diào),即訓(xùn)練過(guò)程中準(zhǔn)確率不再上升時(shí),學(xué)習(xí)率每次減少10%;引入Early-Stopping機(jī)制以防止模型出現(xiàn)過(guò)擬合現(xiàn)象,即模型的損失函數(shù)值在迭代一定次數(shù)不再顯著變化時(shí),停止訓(xùn)練。
采用XJTU-SY和CWRU軸承數(shù)據(jù)集進(jìn)行故障診斷模擬試驗(yàn)的結(jié)果如圖7所示:訓(xùn)練集上的識(shí)別率高于驗(yàn)證集,并且在2種訓(xùn)練集上均達(dá)到了100%;XJTU-SY軸承數(shù)據(jù)集中,GADF和GASF圖在測(cè)試集的識(shí)別率分別為99.08%和96.47%;CWRU軸承數(shù)據(jù)集中,GADF和GASF圖在測(cè)試集上識(shí)別率分別為98.15%和96.94%。以上結(jié)果表明本文的CNN-RNN模型具有較強(qiáng)的特征學(xué)習(xí)能力和故障診斷能力,能夠準(zhǔn)確識(shí)別軸承狀態(tài)。
圖7 軸承故障識(shí)別結(jié)果
為驗(yàn)證CNN-RNN模型在軸承故障診斷中的優(yōu)勢(shì),將其與標(biāo)準(zhǔn)VGG16模型和標(biāo)準(zhǔn)GRU模型進(jìn)行對(duì)比,使用相同的數(shù)據(jù)集分別在VGG16和GRU模型上進(jìn)行訓(xùn)練,參數(shù)設(shè)置與CNN-RNN模型中相應(yīng)部分相同。
3種模型的診斷結(jié)果見(jiàn)表4:GRU模型在訓(xùn)練集上均達(dá)到了100%的識(shí)別率,但在測(cè)試集上的識(shí)別率僅為79.69%和85.00%;相對(duì)于GRU模型,VGG16模型在測(cè)試集上的識(shí)別率均有較大的提升,但仍低于CNN-RNN模型,說(shuō)明CNN與RNN融合后要優(yōu)于單獨(dú)使用CNN模型或RNN模型;同一模型中,GADF圖像的識(shí)別率均比GASF圖像高,說(shuō)明GADF編碼方式的特征表達(dá)能力更強(qiáng)。以上分析證明了CNN-RNN模型能夠有效解決卷積神經(jīng)網(wǎng)絡(luò)難以處理時(shí)間序列數(shù)據(jù)和循環(huán)卷積網(wǎng)絡(luò)無(wú)法提取繁雜數(shù)據(jù)深層特征的問(wèn)題。
表4 不同模型的診斷結(jié)果
為更好地驗(yàn)證GAF編碼方法在軸承故障診斷領(lǐng)域的性能,基于希爾伯特-黃變換(HHT)將原始一維信號(hào)轉(zhuǎn)換為時(shí)頻圖,同樣按6∶2∶2的比例劃分訓(xùn)練集、驗(yàn)證集和測(cè)試集,并將訓(xùn)練集和測(cè)試集輸入CNN-RNN模型進(jìn)行特征提取和故障分類(lèi),結(jié)果如圖8所示:GADF圖像的識(shí)別率均高于HHT圖像,HHT圖像的識(shí)別率則高于GASF圖像,GASF圖像的像素較為單一且數(shù)據(jù)樣本量不足等因素共同作用導(dǎo)致其識(shí)別率較低。因此,在實(shí)際使用時(shí),可優(yōu)先考慮用GADF圖像進(jìn)行數(shù)據(jù)處理。
圖8 不同編碼方法對(duì)軸承故障信號(hào)時(shí)頻圖的識(shí)別結(jié)果
采用GAF編碼方法將軸承的一維振動(dòng)信號(hào)轉(zhuǎn)換為二維圖片,對(duì)原始信號(hào)進(jìn)行重構(gòu)并保留了其中的相關(guān)性。在VGG16模型的基礎(chǔ)上,提出了一種用于滾動(dòng)軸承狀態(tài)識(shí)別的CNN-RNN模型。XJTU-SY和CWRU軸承數(shù)據(jù)集上的試驗(yàn)結(jié)果表明CNN-RNN模型能達(dá)到98.15%以上的識(shí)別率,相對(duì)于標(biāo)準(zhǔn)VGG16模型和標(biāo)準(zhǔn)GRU模型,CNN-RNN模型的識(shí)別效果更好;相對(duì)于HHT和GASF編碼方法,GADF編碼方法對(duì)原始信號(hào)故障特征的表達(dá)能力更強(qiáng),與CNN-RNN模型相結(jié)合時(shí)具有更高的識(shí)別率。