金海龍, 馬吳旭, 孟 宗, 孫登云, 曹 偉, 樊鳳杰
(燕山大學(xué)電氣工程學(xué)院,河北秦皇島066000)
隨著國家“智能制造”戰(zhàn)略的逐漸推進,機械系統(tǒng)開始朝著大型化、復(fù)雜化、智能化的方向發(fā)展[1]。滾動軸承作為旋轉(zhuǎn)機械設(shè)備必不可少的零部件,其故障可能導(dǎo)致旋轉(zhuǎn)機械系統(tǒng)停機、性能下降甚至是巨大的經(jīng)濟損失及人員傷亡[2,3]。因此,滾動軸承運行狀態(tài)及時準(zhǔn)確地診斷對保證許多復(fù)雜機械系統(tǒng)安全可靠運行起著至關(guān)重要的作用。傳統(tǒng)的基于振動信號的故障診斷方法主要包括3個步驟:數(shù)據(jù)預(yù)處理,特征提取以及模式分類。文獻[4]利用相空間重構(gòu)、奇異值分解及獨立分量分析完成了軸承故障信號中故障特征的有效提取,實現(xiàn)了軸承故障的高效識別。文獻[5]利用變分模態(tài)分解分解、均方根熵及支持向量機完成了滾動軸承振動信號故障特征參量的有效提取,實現(xiàn)滾動軸承運行狀態(tài)的有效監(jiān)測。雖然,上述方法在故障診斷中取得了一定的成就,但是,這些傳統(tǒng)故障診斷方法需要大量的先驗知識和專業(yè)知識以及花費大量的時間選取合適的特征[6]。近年來,深度學(xué)習(xí)技術(shù)[7~9]為設(shè)備的故障診斷提供了強有力的數(shù)學(xué)工具,成為眾多研究者關(guān)注的焦點。文獻[10]結(jié)合對稱點模式圖像和卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)了轉(zhuǎn)子故障可靠、準(zhǔn)確的識別。文獻[11]結(jié)合卷積神經(jīng)網(wǎng)絡(luò)及分層正則化實現(xiàn)了滾動軸承故障的有效診斷。文獻[12]提出了一種基于優(yōu)化的帶有余弦損失的長短時記憶網(wǎng)絡(luò)(long short-term memory,LSTM)的滾動軸承故障診斷算法,消除了信號強度對滾動軸承故障診斷的影響,提高了診斷精度。文獻[13]提出了一種基于門控遞歸神經(jīng)網(wǎng)絡(luò)的滾動軸承故障診斷方法,實現(xiàn)了滾動軸承故障的快速精確診斷。
然而,目前多數(shù)研究只利用了振動數(shù)據(jù)在空間或者時間的單個尺度上的特征,無法充分利用振動數(shù)據(jù)所包含的信息。同時還存在故障診斷模型結(jié)構(gòu)復(fù)雜、泛化性能欠佳等問題。基于上述分析,本文將振動數(shù)據(jù)空間及時間特征相融合,提出了一種改進一維卷積神經(jīng)網(wǎng)絡(luò)(one-dimensional convolutional neural networks, 1DCNN)與門控遞歸神經(jīng)網(wǎng)絡(luò)(gated recurrent neural networks, GRU)相結(jié)合故障診斷方法。同時,提出了一種IReLU激活函數(shù),改進卷積網(wǎng)絡(luò)中的激活函數(shù),增強網(wǎng)絡(luò)的特征提取能力。
作為深度學(xué)習(xí)中提取數(shù)據(jù)特征的通用方法,CNN在圖像處理[14]、語音識別[15]及故障診斷[2~13]研究中取得了顯著的成就。典型CNN主要由3部分組成:卷積層、池化層和全連接層,如圖1所示。在軸承故障診斷中,軸承信號通常被轉(zhuǎn)換成頻域圖或者時頻圖,然后輸入到2DCNN進行處理。鑒于信號在轉(zhuǎn)換過程中會造成部分信息丟失,本研究采用一維卷積操作對信號進行特征提取。
圖1 典型CNN結(jié)構(gòu)圖Fig.1 Structure of typical CNN
卷積操作主要完成數(shù)據(jù)的空間特征提取,其數(shù)學(xué)表達式為:
(1)
激活函數(shù)的重要作用就是增強網(wǎng)絡(luò)的非線性表達能力,進而增強網(wǎng)絡(luò)的分類能力。由于ReLU激活函數(shù)在輸入值為負(fù)數(shù)時梯度為0,神經(jīng)元不再處于激活狀態(tài),導(dǎo)致信息丟失。為了充分利用信號所含信息,本研究提出IReLU激活函數(shù)曲線圖如圖2所示,其數(shù)學(xué)表達式為:
(2)
由圖2可知,當(dāng)輸入較大時,IReLU激活函數(shù)仍有輸出,則可以防止模型進入飽和狀態(tài);當(dāng)輸入較小時,函數(shù)具有下限,又可以起到一定的正則化作用。此外,其允許輸入小于0時,信號所含信息仍能夠深入神經(jīng)網(wǎng)絡(luò),從而減少信息丟失,增強網(wǎng)絡(luò)的特征提取能力。
圖2 IReLU曲線圖Fig.2 The curve of IReLU
池化層主要用來對上層輸出特征圖進行縮放映射,進而減少卷積網(wǎng)絡(luò)的參數(shù)量、加快運算速度,同時抑制過擬合。目前常用的池化方法有最大池化和平均池化。本研究采用最大池化操作,數(shù)學(xué)表達式為:
(3)
循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)能夠充分提取序列數(shù)據(jù)中的時間特征信息。然而,標(biāo)準(zhǔn)的RNN在梯度更新過程中存在梯度消失和梯度爆炸的問題。因此,RNN出現(xiàn)了2種常用的變體,即LSTM[12]和GRU[13]。但是,GRU的結(jié)構(gòu)更加簡潔緊湊,在訓(xùn)練數(shù)據(jù)很大時既能保證準(zhǔn)確率,又能夠加快運算速度。GRU結(jié)構(gòu)如圖3所示,其計算式為:
(4)
(5)
(6)
(7)
圖3 GRU結(jié)構(gòu)圖Fig.3 Structure of GRU
結(jié)合1DCNN、GRU及Dense網(wǎng)絡(luò)的優(yōu)勢,本研究所建模型主要由3部分組成:空間特征提取部分、時間特征提取及空間-時間特征融合部分以及故障診斷部分,如圖4所示。首先,預(yù)處理后的數(shù)據(jù)通過具有不同尺度卷積核的1DCNN模塊,經(jīng)過一系列卷積和池化操作之后,數(shù)據(jù)的空間特征被提取出來。同時,為了抑制高頻噪聲,網(wǎng)絡(luò)第1層的卷積核尺寸較大。接著,1DCNN模塊輸出的具有空間特征的數(shù)據(jù)經(jīng)過堆疊GRU模塊之后,數(shù)據(jù)中的時間特征也被提取出來并且完成了時間-空間特征融合。最后,具有時間-空間特征的數(shù)據(jù)通過Dense模塊之后,輸出診斷結(jié)果,實現(xiàn)滾動軸承的智能故障診斷。
圖4 改進1DCNN-GRU結(jié)構(gòu)圖Fig.4 Structure of the improved 1DCNN-GRU
實際工況時,軸承往往工作在健康狀態(tài),因此軸承的故障數(shù)據(jù)較少。為增強網(wǎng)絡(luò)故障識別能力,本研究提出一種新的數(shù)據(jù)增強方法,如圖5所示。首先,將原始振動數(shù)據(jù)分為2部分,第1部分用于得到訓(xùn)練集,第2部分用于得到驗證集和測試集。對于第1部分?jǐn)?shù)據(jù),首先,在合適范圍內(nèi)隨機生成1個起始點以樣本長度為窗口大小開始滑窗,把樣本長度與步長的比值設(shè)為滑窗次數(shù),達到滑窗次數(shù)后,會隨機得到另1個滑窗起點再次將窗口滑動相應(yīng)次數(shù)(每次滑窗次數(shù)相同),重復(fù)上述操作,得到訓(xùn)練集。對于第2部分?jǐn)?shù)據(jù),采用隨機切分方法,在一定數(shù)據(jù)長度內(nèi), 隨機生成1個起始點以樣本長度為切分尺寸切取樣本,然后按比例再分為驗證集和測試集。此方法既可以實現(xiàn)數(shù)據(jù)增強,又能夠保證訓(xùn)練集與驗證集和測試集不發(fā)生數(shù)據(jù)混疊,進而增強網(wǎng)絡(luò)的識別能力和泛化性能。
圖5 數(shù)據(jù)增強及劃分Fig.5 Data augmentation and partition
4.2.1 數(shù)據(jù)集描述及劃分
本試驗首先采用西儲大學(xué)公開的滾動軸承數(shù)據(jù)集[16]對本文所提方法進行實驗分析。采用不同工況下的驅(qū)動端滾動軸承數(shù)據(jù)的10種狀態(tài)作為此次實驗數(shù)據(jù)集,每個狀態(tài)下1 000個樣本,單個樣本長度為2 048,按照7:2:1劃分訓(xùn)練集、驗證集以及測試集,根據(jù)負(fù)載不同分為4組數(shù)據(jù)集A~D如表1所示。
表1 數(shù)據(jù)集信息表Tab.1 Datasets information table
4.2.2 模型優(yōu)化及結(jié)果分析
本研究所提模型包含2個1D卷積和最大池化層、2個GRU層及1個Dense模塊(包含輸出層)。為了防止過擬合及加快網(wǎng)絡(luò)訓(xùn)練速度,模型中引入批標(biāo)準(zhǔn)化層及dropout機制。運行平臺為windows10+PyCharm,CPU為Intel(R) Core(TM) i7-6500U。
本研究所提模型的堆疊GRU模塊中含有2個GRU層,用于提取數(shù)據(jù)中的時間特征,因此需要討論每層所含神經(jīng)元個數(shù)以達到充分提取特征的目的。設(shè)置4組實驗,第1組堆疊GRU模塊中神經(jīng)元個數(shù)分別為128和64;第2組分別為64和32;第3組分別為32和16;第4組分別為16和8。以數(shù)據(jù)集A為例,進行10次實驗,模型在測試集上的實驗結(jié)果如圖6所示。
圖6 堆疊GRU中不同神經(jīng)元個數(shù)對模型準(zhǔn)確率的影響Fig...6 Effects of different number of neurons in stacked GRU on model accuracy
從圖6中可看出,當(dāng)2個GRU層的神經(jīng)元數(shù)目分別為32和16時,模型準(zhǔn)確率較高且比較穩(wěn)定。故本研究所提模型的堆疊GRU模塊中的神經(jīng)元數(shù)目分別設(shè)為32和16。模型主要參數(shù)如表2所示。
表2 模型主要參數(shù)設(shè)計Tab.2 Model parameter design
4.2.3 模型性能評估
為了驗證本文所建立模型的特征提取能力及泛化性能,采用t分布-隨機鄰近嵌入算法[17]對模型在不同數(shù)據(jù)集下的故障診斷結(jié)果進行降維可視化,如圖7所示。從圖7可以看出,本文模型對不同負(fù)載下的數(shù)據(jù)集都能進行有效的特征提取,具有較強分類和泛化性能。
為了驗證本文所建模型在故障診斷中的優(yōu)勢,利用相同的數(shù)據(jù)集,將該模型與其他模型進行對比,每個模型進行10次測試,實驗結(jié)果如表3所示。
圖7 不同數(shù)據(jù)集下模型的分類結(jié)果可視化Fig.7 Visualization of classification results of the proposed model under different datasets
表3 不同模型性能對比Tab.3 The performance comparison of different models
測試集準(zhǔn)確率取均值。實驗1、5中使用的是向后傳播網(wǎng)絡(luò)(back propagation neural network, BPNN);實驗2、6中所用的模型為典型1DCNN網(wǎng)絡(luò);實驗3、7中所用模型是1DCNN-LSTM模型且模型中的1DCNN模塊同實驗2、6相同。
由表3可知,本文所提方法在不同數(shù)據(jù)集下的故障診斷中,平均準(zhǔn)確率最高可達99.96%,高于對比模型且準(zhǔn)確率標(biāo)準(zhǔn)差均低于對比模型,穩(wěn)定性能最優(yōu)。此外,當(dāng)使用本文所提的IReLU激活函數(shù)時,模型的診斷準(zhǔn)確率以及穩(wěn)定性能普遍提高,進一步說明本文所提的IReLU激活函數(shù)能夠使模型更加充分地提取信號特征、提高模型故障診斷準(zhǔn)確率以及增強模型穩(wěn)定性。
4.3.1 數(shù)據(jù)集描述及劃分
實驗室的軸承試驗平臺是標(biāo)準(zhǔn)機械故障模擬試驗臺,如圖8所示。軸承故障的引入方式及信號采集頻率同西儲大學(xué)試驗臺一致,電機轉(zhuǎn)速為1 800 r/min。實驗中主要模擬了滾動軸承的3種故障狀態(tài),即滾動體故障(RF)、內(nèi)圈故障(IF)、外圈故障(OF),加上正常狀態(tài),總共4種狀態(tài)。數(shù)據(jù)集按照7∶2∶1劃分訓(xùn)練集、驗證集和測試集,實驗數(shù)據(jù)集如表4所示。
圖8 機械故障模擬試驗臺Fig.8 Mechanical fault simulation test stand
表4 數(shù)據(jù)集劃分Tab.4 Datasets partition
4.3.2 故障診斷結(jié)果分析
為進一步驗證本文所提方法的優(yōu)越性,利用實驗室中采集的滾動軸承振動數(shù)據(jù)對第4.2.2節(jié)實驗1、2、3及實驗8中模型進行測試。10次對比實驗準(zhǔn)確率均值如圖9所示。由圖9可知,本文所提方法測試準(zhǔn)確率均值高達98.58%,遠(yuǎn)高于其他方法,具有顯著的優(yōu)越性。
綜上所述,本文所提方法在不同的數(shù)據(jù)集上都具有較高的診斷準(zhǔn)確率,這也表明本文所構(gòu)建的模型具有較強的魯棒性和更好的泛化能力。
圖9 不同模型的故障診斷準(zhǔn)確率Fig.9 The fault diagnosis accuracy of different models
本文提出一種改進的1DCNN-GRU滾動軸承故障診斷方法,其優(yōu)越性如下:
1) 所提模型使用原始被測數(shù)據(jù)作為輸入,無需進行人工特征提取及特征選擇,既保證了原始振動信號中所含信息的完整性又減少了對先驗知識和專家知識的依賴;
2) 提出IReLU激活函數(shù),使振動信號所含信息更好地深入網(wǎng)絡(luò),減少信號所含信息的丟失,進而增強網(wǎng)絡(luò)的特征提取能力,提高模型的故障診斷性能;
3) 引入堆疊GRU模塊,從1DCNN模塊輸出的具有空間特征的數(shù)據(jù)中提取時間特征并進行特征融合,提高模型的診斷準(zhǔn)確率;
4) 所提方法在不同的數(shù)據(jù)集上都表現(xiàn)出卓越的特征提取性能,故障識別率高達99.96%,高于對比模型且具有優(yōu)越的泛化性能,對實際工況下的滾動軸承故障診斷有一定的幫助。