劉 俊,吳海軍,周華西
(1.江蘇電子信息職業(yè)學(xué)院數(shù)字裝備學(xué)院,淮安 223003;2.上海交通大學(xué)機(jī)械系統(tǒng)與振動(dòng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,上海 200001;3.南京理工大學(xué)機(jī)械工程學(xué)院,南京 210094)
滾動(dòng)軸承的健康狀況對(duì)機(jī)械系統(tǒng)的穩(wěn)定運(yùn)行具備重要影響,但高速變載的惡劣工作環(huán)境不僅容易使其發(fā)生故障,還會(huì)對(duì)其采集信號(hào)產(chǎn)生強(qiáng)烈干擾[1]。研究在強(qiáng)噪聲環(huán)境下的軸承故障診斷技術(shù)對(duì)故障的及時(shí)發(fā)現(xiàn)、機(jī)械系統(tǒng)的安全運(yùn)行具有重大意義。
傳統(tǒng)的信號(hào)處理方法如奇異值分解(singular value decomposition,SVD)、經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)、獨(dú)立分量分析及小波閾值降噪被廣泛應(yīng)用于滾動(dòng)軸承的故障特征提取[2-4];雖取得良好的診斷效果,但大多存在以下問題:①識(shí)別方法均是針對(duì)某種特定情況下專門設(shè)計(jì)的,泛化能力較差;②人工提取的方法難以獲取軸承故障的深層特征;③當(dāng)噪聲干擾強(qiáng)度增大到一定程度后,很難直接從采集信號(hào)中提取出軸承特征頻率。
隨著人工智能技術(shù)的高速發(fā)展,基于深度學(xué)習(xí)的特征提取技術(shù)成為機(jī)械部件故障診斷的強(qiáng)有力工具[5-6]。卷積神經(jīng)網(wǎng)絡(luò)憑借其強(qiáng)有力的非線性映射特性和深度特征自適應(yīng)提取能力成為當(dāng)前軸承故障診斷的主流方法。趙小強(qiáng)、吳楠等[7-8]雖證實(shí)了CNN在軸承故障診斷中有效性,但未能考慮到軸承實(shí)際運(yùn)行中的強(qiáng)噪聲干擾。昝濤等[9]結(jié)合信號(hào)譜分析和CNN對(duì)強(qiáng)噪聲環(huán)境下進(jìn)行軸承故障診斷,但其在信噪比(signal-to-noise ratio,SNR)為10 dB下的診斷正確率僅為56.4%;董紹江等[10]以SVD和EMD降噪處理的信號(hào)作為輸入,利用注意力機(jī)制驅(qū)動(dòng)的CNN中進(jìn)行識(shí)別,雖然在強(qiáng)噪聲環(huán)境下表現(xiàn)良好,但其基于SVD和EMD的信號(hào)處理過程需要消耗大量的計(jì)算成本;劉恒暢等[11]結(jié)合多分支網(wǎng)絡(luò)架構(gòu)結(jié)和可分離CNN在SNR為-2 dB環(huán)境下的實(shí)現(xiàn)了準(zhǔn)確率為91.2%的軸承故障識(shí)別,但與其在SNR為8 dB時(shí)的99.6%準(zhǔn)確率相比產(chǎn)生了較大的落差,說明其模型在抵抗噪聲干擾方面仍有待提高。
因此,本文提出一種基于降噪多分支CNN和注意力機(jī)制的滾動(dòng)軸承故障診斷方法,設(shè)計(jì)對(duì)始信號(hào)及其頻譜、濾波信號(hào)同步處理的多分支CNN特征提取結(jié)構(gòu);并引入注意力機(jī)制對(duì)各分支的輸出進(jìn)行權(quán)重分配,在增強(qiáng)有效信息的同時(shí)抑制無(wú)效信息對(duì)診斷結(jié)果的影響。實(shí)驗(yàn)結(jié)果證明了本文方法在強(qiáng)噪聲干擾下對(duì)軸承故障識(shí)別的有效性和魯棒性。
CNN強(qiáng)大的特征提取能力源于自身的3個(gè)重要特性:參數(shù)共享、稀疏交互、等變表示。通過卷積核以局部連接的方式在整體輸入信號(hào)上進(jìn)行特征提取,CNN具有良好的模型泛化能力以及出色的訓(xùn)練速度[12]。在信號(hào)處理方面,由于輸入信號(hào)大多為一維時(shí)序傳感器信號(hào),目前用于故障診斷的CNN大多是一維CNN(one-dimensional CNN,1-D CNN)。1-D CNN不僅繼承了CNN強(qiáng)大的特征提取能力和非線性映射能力,還由于自身結(jié)構(gòu)從二維到一維的簡(jiǎn)化提升了運(yùn)算速度。典型的1-D CNN通常由輸入層、多個(gè)交替連接的卷積層和池化層、全連接層和最終的輸出層構(gòu)成。以x表示卷積層的輸入信號(hào),卷積層的計(jì)算可表示為:
(1)
式中,w為卷積核的權(quán)重;b為偏執(zhí)單元;conv1D()為卷積操作;h為隱藏層的輸出;y為卷積層的輸出;本文采用ReLU()作為激活函數(shù),其目的是防止神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中出現(xiàn)梯度消失現(xiàn)象。在卷積層之后緊接著是池化層,有:
x′=maxpool(y,s)
(2)
式中,x′為經(jīng)由一個(gè)卷積層和池化層映射后的輸出;s為池化核尺寸,本文選擇最大值池化,其作用是輸出為池化范圍內(nèi)的最大神經(jīng)元數(shù)值。池化層賦予了1-D CNN等變表示的能力,提升了網(wǎng)絡(luò)的泛化能力和抗干擾能力。
(3)
注意力機(jī)制作為深度學(xué)習(xí)模型中的一種特殊嵌入結(jié)構(gòu),可以在模型訓(xùn)練過程中自動(dòng)學(xué)習(xí)和計(jì)算輸入數(shù)據(jù)對(duì)輸出結(jié)果的貢獻(xiàn)大小,并廣泛應(yīng)用于圖像識(shí)別、自然語(yǔ)言處理等領(lǐng)域[13]。在基于1-D CNN的故障診斷模型訓(xùn)練過程中,由于深度神經(jīng)網(wǎng)絡(luò)的自適應(yīng)學(xué)習(xí)機(jī)制,不同通道提取的故障特征存在著一定的差異性,其中既包含了對(duì)實(shí)現(xiàn)故障識(shí)別有顯著貢獻(xiàn)的特征,也存在貢獻(xiàn)低、甚至起負(fù)激勵(lì)的特征。因此,將注意力機(jī)制引入深度學(xué)習(xí)模型,可以對(duì)輸入中每個(gè)部分實(shí)現(xiàn)不同的權(quán)重分配,從而抽取出更加有效及重要的特征,提升模型的自適應(yīng)能力及準(zhǔn)確性。
如圖1所示介紹注意力機(jī)制的工作原理,其中Z=[z1,z2,…,zn]為包含n個(gè)通道的輸入,zi∈RH×1表示第i個(gè)通道的特征。首先,如式(4)所示,利用平均池化操作avgpool()將輸入Z的通道特征zi進(jìn)行壓縮,獲取具備表征該通道全局信息的向量a=[a1,a2,…,an]。
圖1 注意力機(jī)制的工作原理
(4)
(5)
(6)
式中,?表示矩陣對(duì)應(yīng)元素間的點(diǎn)乘。
本文所提出的基于降噪多分支CNN和注意力機(jī)制的診斷模型如圖2所示。以軸承監(jiān)測(cè)的原始振動(dòng)信號(hào)為輸入,首先分別利用快速傅立葉變換(fast fourier transform,F(xiàn)FT)和高斯濾波得到原始信號(hào)的頻譜和濾波信號(hào);然后將原始信號(hào)、信號(hào)頻譜、高斯濾波信號(hào)分別輸入到均由1-D CNN構(gòu)建的直接映射分支、頻譜映射分支和高斯降噪分支的多分支1-D CNN中實(shí)現(xiàn)特征提取;隨及將多分支CNN提取的多通道特征作為注意力網(wǎng)絡(luò)輸入,獲取經(jīng)由注意力加權(quán)的輸出;最后將加權(quán)后的分支輸出作為分類CNN的輸入,實(shí)現(xiàn)滾動(dòng)軸承故障模式的端到端識(shí)別。
圖2 本文模型
本文方法首先將原始信號(hào)進(jìn)行FFT和高斯濾波處理,其中FFT[14]被廣泛應(yīng)用于時(shí)域信號(hào)的頻譜獲取,本文不再贅述。高斯濾波屬于線性平滑濾波,廣泛應(yīng)用于高斯噪聲的消除,其降噪過程本質(zhì)上是經(jīng)由本身和鄰域范圍內(nèi)的其他數(shù)據(jù)點(diǎn)進(jìn)行加權(quán)平均的過程。由于機(jī)械運(yùn)轉(zhuǎn)過程中的干擾噪音屬于獨(dú)立不同源分布,經(jīng)由疊加后對(duì)軸承本身的影響近似于高斯白噪聲影響[15-16]。因此,本文選擇高斯濾波信號(hào)作為多分支CNN中的濾波降噪分支的輸入。由于傳感器數(shù)據(jù)均為一維離散的時(shí)序信號(hào),故本文選取一維高斯離散濾波函數(shù)進(jìn)行濾波處理,其表達(dá)式為:
(7)
式中,m為濾波半徑,由于是高斯離散濾波,半徑對(duì)應(yīng)信號(hào)點(diǎn)個(gè)數(shù),所以m為正整數(shù);δ為高斯濾波函數(shù)的標(biāo)準(zhǔn)差,其大小直接影響高斯離散濾波過程中周圍數(shù)據(jù)點(diǎn)對(duì)濾波結(jié)果的權(quán)重,本文中取m=2,δ=1。
本文模型中的多分支CNN和分類CNN均采用1-D CNN作為基礎(chǔ)結(jié)構(gòu)進(jìn)行構(gòu)造。其中,多分支CNN中每個(gè)分支的CNN結(jié)構(gòu)完全相同,均只包含兩個(gè)相互交替的卷積層和池化層。分類CNN同樣由包含兩個(gè)卷積層和池化層的1-D CNN構(gòu)成,但與傳統(tǒng)1-D CNN經(jīng)卷積池化映射后利用全連接層實(shí)現(xiàn)預(yù)測(cè)輸出不同,本文中分類CNN采用全局平均池化層實(shí)現(xiàn)最終預(yù)測(cè)結(jié)果的輸出。相較于全連接層參數(shù)多、計(jì)算量大、易產(chǎn)生過擬合等缺點(diǎn),全局平均池化層不僅可以對(duì)神經(jīng)網(wǎng)絡(luò)中的參數(shù)數(shù)量進(jìn)行縮減,提升訓(xùn)練速度;另一方面還能避免深度神經(jīng)網(wǎng)絡(luò)發(fā)生過擬合問題。全局平均池化層的計(jì)算表達(dá)式為:
(8)
表1 故障類別
為了驗(yàn)證本文模型在面向強(qiáng)噪聲環(huán)境下的抗噪性和有效性,選取某大學(xué)軸承數(shù)據(jù)集為研究對(duì)象[17],在其采集信號(hào)的基礎(chǔ)上人為添加高斯白噪聲,獲取包含不同SNR的數(shù)據(jù)集。式(9)為SNR計(jì)算公式。
(9)
式中,Ps為信號(hào)的有效功率;Pn為噪聲的有限功率。
試驗(yàn)選取軸承數(shù)據(jù)集中轉(zhuǎn)速為1772 r/min時(shí)驅(qū)動(dòng)端的加速度傳感器信號(hào),其對(duì)應(yīng)軸承型號(hào)為SKF6205-2RS,信號(hào)采樣頻率為12 kHz。如表2所示,構(gòu)造的基礎(chǔ)數(shù)據(jù)集由包含正常狀態(tài)、內(nèi)圈故障、外圈故障以及滾動(dòng)體故障在內(nèi)的10類軸承故障狀態(tài)構(gòu)成,以重采樣的方式構(gòu)造采樣點(diǎn)數(shù)為1200的數(shù)據(jù)樣本,每類故障狀態(tài)對(duì)應(yīng)的樣本數(shù)為320,最終構(gòu)成包含10類共3200個(gè)數(shù)據(jù)樣本的基礎(chǔ)數(shù)據(jù)集。在此基礎(chǔ)上,基于式(9)向基礎(chǔ)數(shù)據(jù)集中添加高斯白噪聲,構(gòu)造SNR分別為-5 dB、0 dB、5 dB、10 dB和15 dB的數(shù)據(jù)集。如圖3所示,以軸承內(nèi)圈故障信號(hào)為例,展現(xiàn)了原始信號(hào)及不同SNR值的加噪信號(hào)時(shí)域波形。由圖可知,隨著噪聲強(qiáng)度的不斷增加,信號(hào)中因內(nèi)圈故障引起的周期性脈沖越來越不明顯,表明軸承的故障特征逐漸被加入的噪聲所淹沒。
圖3 原始信號(hào)及加噪信號(hào)時(shí)域波形
表2 故障類別
以SNR為5 dB的情況為例,介紹本文模型的訓(xùn)練過程。圖4中展現(xiàn)了模型訓(xùn)練過程的損失曲線及識(shí)別精度,可以看出本文模型在SNR為5 dB的情況下,迭代30次之后基本收斂,且識(shí)別精度穩(wěn)定保持在99%以上。進(jìn)一步地,利用混淆矩陣將模型各個(gè)類別的分類結(jié)果可視化如圖5所示,可以看出本文模型在軸承內(nèi)圈故障、外圈故障以及滾動(dòng)體故障上均取得突出的診斷效果,能夠準(zhǔn)確分辨出軸承故障的強(qiáng)弱程度,僅在故障類別3(滾動(dòng)體故障,故障尺寸0.021 ft)上未實(shí)現(xiàn)100%的準(zhǔn)確診斷。
(a) 訓(xùn)練損失曲線 (b) 訓(xùn)練及預(yù)測(cè)識(shí)別精度圖4 模型訓(xùn)練過程
圖5 診斷結(jié)果混淆矩陣(SNR=-5 dB)
為了進(jìn)一步驗(yàn)證本文提出方法的有效性,以支持向量機(jī)(support vector machine,SVM)、BP神經(jīng)網(wǎng)絡(luò)、1-D CNN為對(duì)象開展對(duì)比實(shí)驗(yàn)研究。其中SVM的核函數(shù)選擇高斯核函數(shù);BP神經(jīng)網(wǎng)絡(luò)由1個(gè)輸入層、2個(gè)隱藏層及1個(gè)輸出層共4層網(wǎng)絡(luò)構(gòu)成,神經(jīng)元數(shù)分別為1200、512、256和10;1-D CNN的卷積部分包含3個(gè)交替連接的卷積層和池化層,全連接層由1個(gè)輸入層、1個(gè)隱藏層和1個(gè)輸出層構(gòu)成。對(duì)比實(shí)驗(yàn)中所有模型使用相同的訓(xùn)練集和測(cè)試集,并在五種不同SNR下對(duì)模型的診斷能力進(jìn)行評(píng)估。圖6所示為SNR為5 dB的情況下,采用BP神經(jīng)網(wǎng)絡(luò)以及CNN方法的模型訓(xùn)練過程的損失曲線及識(shí)別精度。所有模型在每種SNR情況下均重復(fù)實(shí)驗(yàn)10次,其最終的平均診斷正確率和標(biāo)準(zhǔn)差如圖7所示。
(a) BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練損失曲線 (b) BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練及預(yù)測(cè)識(shí)別精度
圖7 不同模型對(duì)比實(shí)驗(yàn)結(jié)果
從實(shí)驗(yàn)結(jié)果可以看出,本文模型在-5 dB~15 dB的所有SNR水平下均取得了最優(yōu)的診斷結(jié)果,且在0 dB的強(qiáng)噪聲干擾下,仍取得的高達(dá)93.79%的診斷精度。在所有對(duì)比模型中,SVM模型的診斷精度相對(duì)較弱,即使在15 dB水平下也僅獲得82.76%的診斷正確率,說明在噪聲干擾下淺層機(jī)器學(xué)習(xí)模型相對(duì)于深層網(wǎng)絡(luò)模型的特征提取能力較弱。此外,從1-D CNN和本文模型在SNR從低到高時(shí)診斷正確率的變化過程可以看出,在10 dB和15 dB的低SNR情況下,1-D CNN作為深層神經(jīng)網(wǎng)絡(luò)其診斷精度與本文模型差距較小,也能取得高于95%的診斷正確率;而隨著噪聲強(qiáng)度增加,1-D CNN與本文模型在診斷正確率上的差距逐漸拉大,在-5 dB水平下的診斷正確率相差接近20%,進(jìn)一步證明了本文模型具備對(duì)強(qiáng)噪聲環(huán)境的抗干擾能力。
為了進(jìn)一步論述本文模型多分支結(jié)構(gòu)和注意力機(jī)制的有效性,在本文模型的基礎(chǔ)上取消注意力機(jī)制,并將模型的輸入改為僅原始信號(hào)、僅信號(hào)頻譜和僅高斯濾波信號(hào),其訓(xùn)練的模型分別記作原始信號(hào)模型,頻譜信號(hào)模型和高斯濾波模型。各模型在不同SNR情況下均重復(fù)實(shí)驗(yàn)10次,其平均診斷正確率和標(biāo)準(zhǔn)差如圖8所示。
圖8 不同輸入對(duì)比實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)結(jié)果表明,本文多分支結(jié)構(gòu)和注意力機(jī)制能在所有SNR水平下均能幫助模型獲取更高的故障識(shí)別精度;且相較于噪聲干擾較弱的高SNR情況,多分支結(jié)構(gòu)和注意力機(jī)制在強(qiáng)噪聲干擾的低SNR情況下能帶來更為明顯的提升。例如,在15 dB水平下的本文模型的診斷正確率為99.87%,而第二高的診斷正確率為原始信號(hào)模型的97.79%,正確率提升了2%左右;而在-5 dB水平下本文模型的診斷正確率為87.45%,相較于診斷正確率為80.38%的高斯濾波模型,提升了將近7%的診斷正確率。
本文提出一種基于降噪多分支CNN和注意力機(jī)制的滾動(dòng)軸承故障端到端診斷方法,實(shí)現(xiàn)了故障信號(hào)在原始時(shí)域和頻域特征的充分提取及權(quán)重自適應(yīng)分配。試驗(yàn)結(jié)果表明,本文模型在不同SNR水平下均能實(shí)現(xiàn)較傳統(tǒng)機(jī)器學(xué)習(xí)模型SVM、BP神經(jīng)網(wǎng)絡(luò)以及深層神經(jīng)網(wǎng)絡(luò)CNN更高的故障識(shí)別精度;尤其是在強(qiáng)噪聲干擾的環(huán)境下,本文模型表現(xiàn)出更強(qiáng)的抗干擾能力和更高的診斷精度。通過改變輸入信號(hào)和取消注意力機(jī)制的對(duì)比試驗(yàn),進(jìn)一步驗(yàn)證了提出模型中多分支結(jié)構(gòu)和注意力機(jī)制的有效性。本文方法可為滾動(dòng)軸承在強(qiáng)噪聲環(huán)境下的故障診斷提供有力工具。