蔡超志 白金鑫 張仲杭 池耀磊
(河北工程大學(xué)機械與裝備工程學(xué)院,河北邯鄲 056038)
在現(xiàn)代工業(yè)中,汽車、輪船和飛機等諸多機器的動力傳動裝置上都裝有齒輪系統(tǒng)。由于長時間連續(xù)運轉(zhuǎn)、工作環(huán)境惡劣等,齒輪容易發(fā)生磨損、斷齒、點蝕及其他損傷。當(dāng)齒輪箱發(fā)生異?;蚬收蠒r,將會改變振動信號。通過分析振動信號,分離出與故障相關(guān)的特征信號,進一步分析分離出的特征信號,進而判斷機械系統(tǒng)的故障類別[1-2]。
齒輪箱故障診斷過程一般包括數(shù)據(jù)采集、特征提取、特征選擇融合以及故障識別4個步驟,其中,特征提取是一個關(guān)鍵步驟,特征提取直接決定著故障診斷結(jié)果的準(zhǔn)確與否[3]。文獻[4]提出了一種基于局部均值分解理論的解調(diào)分析方法,先利用局部均值分解將行星齒輪箱振動信號分解為一系列乘積函數(shù),再對乘積函數(shù)做傅里葉頻譜分析,成功提取了風(fēng)機行星齒輪箱齒輪局部裂紋故障特征頻率。文獻[5]將一種改進的經(jīng)驗小波變換應(yīng)用于行星齒輪箱振動信號解調(diào)分析,通過濾波將信號分解為一組調(diào)幅-調(diào)頻單分量成分,提取出行星齒輪箱故障特征振動信號。但是,上述故障特征提取方法都需要工作人員經(jīng)過長時間的學(xué)習(xí),掌握大量的知識與經(jīng)驗。并且上述的特征提取方法對一些簡單的信號很有效果,而對一些有噪聲的復(fù)雜信號特征提取困難[6]。
現(xiàn)如今,隨著計算機的發(fā)展,機器學(xué)習(xí)技術(shù)也發(fā)展迅速,也引發(fā)了更多的研究人員用機器學(xué)習(xí)模型對設(shè)備進行智能故障診斷的高潮,如反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)和支持向量機(SVM)等。但是用BPNN、SVM等淺層學(xué)習(xí)模型對機器進行故障診斷時,模型提取的抽象特征決定了故障類型,然而在海量的高維數(shù)據(jù)下,這些模型的診斷準(zhǔn)確率和和泛化能力明顯不足[7-8]。近年來,深度學(xué)習(xí)作為機器學(xué)習(xí)領(lǐng)域中一個新的研究方向,因其強大的建模能力和表征能力,在人臉識別、語音識別以及故障診斷等領(lǐng)域取得很大的成果[9]。文獻[10]對齒輪箱用堆棧式去噪自編碼器(SDAE)進行故障診斷。文獻[11]用深度置信網(wǎng)絡(luò)(DBN)對軸承進行故障診斷。劉磊等[12]采用Inception網(wǎng)絡(luò)結(jié)合雙向長短時記憶對軸承進行故障診斷,并對凱斯西儲大學(xué)軸承數(shù)據(jù)集進行實驗驗證,達到99.4%的診斷準(zhǔn)確率。文獻[13]采用Inception網(wǎng)絡(luò)對印刷設(shè)備的軸承進行故障診斷,實驗表明該方法的平均診斷精度達92.53%。然而,現(xiàn)有的故障診斷模型在理想環(huán)境下診斷效果較好,而設(shè)備在實際運行中總會伴有各種各樣的噪聲,這些噪聲會干擾模型,使得故障診斷準(zhǔn)確率降低。
本文利用自適應(yīng)小波降噪原理與Inception模塊的多尺度抽象特征提取性能[14],提出用基于自適應(yīng)小波降噪和Inception網(wǎng)絡(luò)的方法對齒輪箱進行故障診斷,該模型將采集的振動信號進行自適應(yīng)小波降噪后利用Inception網(wǎng)絡(luò)從降噪后的信號中自適應(yīng)地提取較為全面的故障特征信息,實現(xiàn)齒輪箱故障診斷。先對信號進行降噪,然后設(shè)計Inception模塊提取降噪信號中的多尺度特征,通過Inception模塊疊加以及連接全連接層和Softmax分類器構(gòu)成模型,并在多種齒輪故障情況下進行實驗,證實了提出模型的有效性,并將此模型與幾種相關(guān)模型進行對比,也證實了所提出模型的優(yōu)勢。
小波閾值降噪的關(guān)鍵是選取合適的小波閾值。若選擇的小波閾值過大,可能將信號當(dāng)中的有效信號和關(guān)鍵信號濾除,不能保留信號的原始特征;反之,如若選擇的小波閾值過小,信號中的干擾不能充分濾除,導(dǎo)致信噪比較低。作為最常用的小波閾值,在一定程度上滿足降噪需要,但由于缺乏適應(yīng)性并不適用所有工況。另外,硬、軟閾值小波降噪方法存在間斷點和恒定偏差以及現(xiàn)有的閾值函數(shù)靈活性較差,因此本文采用自適應(yīng)的小波閾值來對齒輪箱故障振動信號進行降噪,表達式為
式中:η為選擇后的小波閾值;小波分解第j層的閾值為
其中:x為調(diào)節(jié)參數(shù),εj為均方根誤差,通常ε=w j,k為小波系數(shù),median(*)為計算中值,N為信號長度。
假設(shè)原始的一組數(shù)據(jù)為a1=[a11,a12,···,a1n]T,以及每層分解后的一組數(shù)據(jù)a2,j=[a21,a22,···,a2n]T,將r1,2的計算,其中r1,2表示為每層小波閾值分解后的信號與原信號進行相關(guān)系數(shù)
其 中:Cov(a1,a2,j)為a1,a2,j的 樣 本 協(xié) 方 差;Var(a1)、Var(a2,j)為a1,a2,j的樣本方差,且|||r1,2|||≤1。綜上,小波在進行每一層的分解得到的數(shù)據(jù)與原始數(shù)據(jù)相關(guān)性不同,小波閾值相應(yīng)的取值也有所不同,根據(jù)相關(guān)系數(shù)自適應(yīng)的選取小波閾值,提高算法的適應(yīng)性。
自適應(yīng)閾值函數(shù)公式如下。
卷積層是用多個卷積核對輸入數(shù)據(jù)進行卷積運算,卷積運算的公式如下。
式中:*表示第l層的第i個卷積核與輸入序列的卷積操作;為卷積核的偏置項;f是激活函數(shù),可以使卷積核能夠擬合非線性關(guān)系。
池化層通過計算局部最大值或平均值對卷積運算得到的特征序列進行降采樣,在減小網(wǎng)絡(luò)參數(shù)的同時過濾了部分冗余信息,計算公式如下。
式中:down為 降采樣函數(shù),通常使用最大池化與均值池化為池化層的權(quán)值與偏置項。
全連接層和Softmax層連接在模型的最后階段。卷積和池化操作后得到的特征圖可以通過它疊加起來,最后用Softmax層計算并得出分類結(jié)果。Softmax層的的計算公式為
式中:Xl-1、Yl分 別是全連接層的輸入和輸出;Wl、b(l)i分別是全連接層的權(quán)值和偏置。
對機器設(shè)備中某一部件進行故障診斷時,模型以及模型參數(shù)的選擇可能會導(dǎo)致訓(xùn)練過程中發(fā)生過擬合、收斂緩慢以及不收斂的問題,因此在模型中的某些隱藏層中加入批量歸一化(BN)層和隨機丟棄(dropout)層。BN層是對每一層輸入的數(shù)據(jù)進行標(biāo)準(zhǔn)化處理,如式(8)所示,將每層的輸入數(shù)據(jù)轉(zhuǎn)換為均值為1、方差為0的分布,這可以加快模型的計算速度。
式中:xi為某一批次中的第i個輸入向量;為標(biāo)準(zhǔn)化處理后的數(shù)據(jù);μB是 某一批次的均值;是某一批次的方差;ε是一個很小的正數(shù),用來確保根號內(nèi)始終為正。
Droupout層是在計算過程中隨機丟棄卷積層或全連接層中的一些神經(jīng)元,如圖1所示。訓(xùn)練過程中將神經(jīng)元h2和h5失活,通過隨機丟棄,可以減少模型中的參數(shù),降低模型的復(fù)雜度,避免過擬合現(xiàn)象的發(fā)生,而在測試時,恢復(fù)失活神經(jīng)元的連接,提高測試準(zhǔn)確率。
圖1 丟棄法示意圖
Inception模塊是將不同的卷積層和池化層通過并聯(lián)的方式連接在一起,并且在同一卷積層中可以具有多個通道,每個通道能夠包含不同尺寸及深度的卷積核,從而使網(wǎng)絡(luò)能夠在不同級別上提取特征。本文的Inception模塊由不同尺寸的一維卷積核構(gòu)成,如圖2所示。該結(jié)構(gòu)能從原始信號中提取到多尺度的抽象特征。另外,每個Inception模塊的輸入前都用(1,1)的卷積核對輸入數(shù)據(jù)進行降維同時增加了網(wǎng)絡(luò)的深度及非線性能力。每個卷積后加入BN層,以減少內(nèi)部協(xié)變量轉(zhuǎn)移,加速模型訓(xùn)練。
圖2 Inception模塊
減少對故障診斷先驗知識的依賴以及人為選擇特征導(dǎo)致的誤差。利用該特征,本文構(gòu)造了一個Inception神經(jīng)網(wǎng)絡(luò)模型,利用該模型對齒輪箱進行故障診斷。該模型是一種對卷積層的深度及寬度進行擴展后得到的模型,特征學(xué)習(xí)能力很強。一個訓(xùn)練好的Inception神經(jīng)網(wǎng)絡(luò)模型可以通過卷積池化操作從原始振動信號中提取有用的特征,這些特征能表征設(shè)備的運行狀況。模型結(jié)構(gòu)如圖3所示。
圖3 模型結(jié)構(gòu)
圖3 模型結(jié)構(gòu)
該模型將采樣好的振動信號作為輸入,先經(jīng)過3個卷積層及池化層使得神經(jīng)網(wǎng)絡(luò)特征提取縱深增加,提高了特征提取能力。另外,對全連接層使用Dropout使經(jīng)過全連接層的輸出數(shù)據(jù)依某一概率隨機失活,從而達到使網(wǎng)絡(luò)具有更高抵抗數(shù)據(jù)丟失的能力,也可以避免在模型訓(xùn)練過程中發(fā)生過擬合同時提高模型的泛化能力。在模型中,對每個層的輸入數(shù)據(jù)使用BN,可以避免訓(xùn)練過程中發(fā)生梯度爆炸或者梯度消失,也可以使用較大的學(xué)習(xí)率提高訓(xùn)練速度。經(jīng)過卷積池化操作后,由Inception模塊繼續(xù)提取多尺度局部抽象特征。最后將特征融合后使用全連接層對特征信息與故障模式之間的關(guān)系進行映射,并通過Softmax分類器輸出診斷結(jié)果。
在此模型結(jié)構(gòu)中,不同的參數(shù)會對模型的診斷效果產(chǎn)生重大的影響。經(jīng)過多次實驗后,最終確定模型的主要參數(shù)如表1所示。
表1 模型參數(shù)
此外,模型的訓(xùn)練設(shè)置如下:訓(xùn)練輪數(shù)為200;批尺寸為256;優(yōu)化器為adam;執(zhí)行環(huán)境為單GPU。
對齒輪箱進行故障診斷時,將傳感器安裝在輸出軸電機側(cè)軸承,用于采集振動數(shù)據(jù),然后對采集的數(shù)據(jù)進行小波降噪并對降噪后的數(shù)據(jù)進行數(shù)據(jù)增強、歸一化等預(yù)處理,最后通過模型分析得出故障類別。本文的故障診斷流程如圖4所示。
圖4 診斷流程圖
圖5a所示為本研究采用的齒輪箱故障試驗臺,可以模擬齒輪箱的不同健康狀況。該試驗臺主要由交流電機、聯(lián)軸器、齒輪箱以及制動器組成。電機的驅(qū)動功率為0.75 kW,標(biāo)定轉(zhuǎn)速為1 000r/min,通過變頻器可控制其轉(zhuǎn)速。聯(lián)軸器用于連接交流電機與齒輪箱的輸入端。齒輪箱是由兩個相同齒輪組成的一級齒輪箱,用來改變力的傳動反向,其內(nèi)部輸入級、輸出級齒輪都是齒數(shù)為35、模數(shù)為2、壓力角為20°的標(biāo)準(zhǔn)直齒輪。制動器用來模擬負載,通過對制動器加載不同電流形成不同的制動力矩來模擬負載的變化,本實驗沒有加載負載項。另外,試驗臺上所有軸承均為SKF606-2RSH型深溝球軸承且在本實驗無故障發(fā)生。
從圖5b中可以看出,兩個齒輪在嚙合過程中受力最大部分為齒根部和嚙合點,因此本研究對齒輪箱內(nèi)輸出級齒輪進行了點蝕、磨損、斷齒、點蝕和磨損、斷齒和磨損5種最容易發(fā)生的故障進行診斷研究,有故障的齒輪由電火花加工制作而成。故障類型如表2所示。
表2 故障類型
圖5 實驗儀器與齒輪靜力學(xué)分析圖
實驗過程中,將傳感器安裝在輸出軸電機側(cè)軸承采集信號,采集時通過變頻器將電機轉(zhuǎn)速調(diào)整為800 r/min,采樣頻率為5 120 Hz,每種故障采集76 800個樣本點。
為了避免因為樣本數(shù)量少而發(fā)生過擬合的現(xiàn)象,本實驗用重疊采樣的方法增強數(shù)據(jù)集。從原始信號采集訓(xùn)練集、驗證集樣本時,每一段信號與其后一段信號之間有重疊,而測試樣本采集時沒有重疊。重疊采樣的方法如圖6所示。重疊采樣的方法可以通過調(diào)整采樣窗口的大小來獲得不同長度的樣本,也可以通過調(diào)整滑動步長來最大限度獲得足夠多的樣本。重疊采樣法獲得樣本數(shù)的公式為
圖6 重疊采樣
式中:n為樣本數(shù)量;m為 采集的數(shù)據(jù)點數(shù);l為采樣窗口的大小即樣本長度;b為滑動步長。
實驗中,樣本長度為1 024,先無重疊采集出30個測試樣本,剩下的數(shù)據(jù)點經(jīng)過重疊采樣得到訓(xùn)練集和驗證集。將滑動步長設(shè)置為52,得到866個樣本,再將重疊采樣得到的866個樣本進行無交集劃分訓(xùn)練集與驗證集,最終得到800個訓(xùn)練集樣本和66個驗證集樣本。
為了數(shù)據(jù)處理方便,將樣本數(shù)據(jù)映射到0~1范圍之內(nèi)處理,會使模型收斂更加便捷快速。歸一化后各個故障的波形圖如圖7所示。
圖7 波形圖
將4.1中構(gòu)建的數(shù)據(jù)作為模型的輸入,訓(xùn)練、測試模型。首先使用構(gòu)建好的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練帶有標(biāo)簽的訓(xùn)練集,然后用驗證集調(diào)整模型的超參數(shù)以及對模型的能力進行初步評估,最后用無標(biāo)簽的測試集測試模型。圖8為實驗過程中損失函數(shù)值和正確率隨訓(xùn)練次數(shù)的變化。根據(jù)圖可以看出,模型在訓(xùn)練20次左右訓(xùn)練集時開始收斂,準(zhǔn)確率提高,損失函數(shù)值減小。訓(xùn)練結(jié)束后,訓(xùn)練集和驗證集的分類準(zhǔn)確率分別達到了99.85%和99.92%,在訓(xùn)練過程中也沒有出現(xiàn)過擬合,并且對測試集的表現(xiàn)良好。
圖8 正確率和損失函數(shù)值
圖9顯示了測試集的混淆矩陣,也可以看出該模型在測試集上表現(xiàn)良好,即分類效果良好。
圖9 混淆矩陣
為了驗證Inception神經(jīng)網(wǎng)絡(luò)模型的優(yōu)勢,將其分別與1D-CNN、LSTM、WDCNN(deep convolutional neural networks with wide first-layer kernel)在 相同實驗背景下對結(jié)果進行對比,各模型訓(xùn)練結(jié)果如表3所示。
從表3中也可以看出,Inception網(wǎng)絡(luò)模型比其他各模型的訓(xùn)練集準(zhǔn)確率及驗證集準(zhǔn)確率都高,而且在此實驗背景條件下,該模型在測試集的準(zhǔn)確率達到了99.89%,都充分證明了此模型的優(yōu)越性。
表3 各模型實驗結(jié)果
由于采集的數(shù)據(jù)是在實驗室條件下,為模擬實際工作環(huán)境,本文將測試集加上不同程度的加性高斯白噪聲,然后對加噪后的信號進行自適應(yīng)小波降噪。小波降噪時分解層數(shù)過多與過少都不合理,分解層數(shù)過多會造成重構(gòu)信號的失真,分解層數(shù)過少則會降噪不徹底。本文將加噪后的信號進行3層小波分解,可以有效降低一些噪聲并且重構(gòu)信號不失真,再加上Inception網(wǎng)絡(luò)的強大特征提取能力,可以在即使含有一些噪聲的信號中提取出故障特征,可以彌補分解層數(shù)過少造成的降噪不徹底。圖10為對點蝕故障情況下采集的信號加上-2 dB噪聲下的信號及降噪后的信號,可以看出,降噪后信號相對于加噪后信號振動沖擊較為明顯,噪聲污染降低,與原始信號重合度變高。對測試集加上-4~6 dB的噪聲,測試模型在噪聲環(huán)境下的識別率。圖11為該模型有小波降噪和無小波降噪對測試集的識別率。
圖10 點蝕故障系列信號
圖11 有無小波降噪對比
本文模型與1D-CNN、LSTM、WDCNN(deep convolutional neural networks with wide first-layer kernel)在-2 dB噪聲環(huán)境下的識別率對比如圖12所示。
圖12 不同模型在—2 d B環(huán)境下的準(zhǔn)確率對比
從圖11、圖12可以看出,含有小波降噪的Inception網(wǎng)絡(luò)比不包含小波降噪的網(wǎng)絡(luò)以及其他常見模型的識別率都高,抗噪性好。
針對數(shù)據(jù)驅(qū)動的齒輪箱故障診斷過程中存在噪聲污染、特征提取復(fù)雜、計算過程復(fù)雜等問題,本文提出了一種基于自適應(yīng)小波降噪和Inception網(wǎng)絡(luò)的自適應(yīng)特征提取的齒輪箱故障診斷模型,即一種先經(jīng)小波降噪再通過Inception網(wǎng)絡(luò)自適應(yīng)提取多尺度特征并對各層輸入引入BA、合理使用Dropout以及使用合理的激活函數(shù)和優(yōu)化器等結(jié)構(gòu)的模型,該模型能準(zhǔn)確識別出齒輪箱的故障類型。通過理論分析和實驗驗證,得到了以下結(jié)論:
(1)針對采集的原始信號中含有噪聲的問題,本文采用自適應(yīng)小波閾值去噪,可以有效去除噪聲,保留明顯的故障特征。
(2)本文利用Inception模塊的多尺度抽象特征提取性能更好地提取故障特征,克服了單一CNN模型提取特征尺度不夠豐富的問題。
(3)為了得到更多的樣本,用重疊采樣的方法進行采樣,解決了小樣本訓(xùn)練容易出現(xiàn)過擬合以及訓(xùn)練好的模型泛化能力弱的不足。
(4)由實驗結(jié)果可知,基于小波降噪和Inception網(wǎng)絡(luò)的齒輪箱故障診斷模型可以對齒輪不同類型的故障進行確分類。