錢思宇,秦東晨,陳江義,袁峰
(鄭州大學 機械與動力工程學院,鄭州 450001)
機電驅動系統(tǒng)和電動機的大多數(shù)故障由滾動軸承損壞引起,這可能導致設備停機,造成經(jīng)濟損失或安全事故,因此滾動軸承的故障檢測尤為重要。
近幾年,深度學習方法大量應用于軸承故障診斷領域,利用其深度學習的特點自動提取原始數(shù)據(jù)的層次表示特征[1-2]:文獻[3]提出一種基于深度殘差神經(jīng)網(wǎng)絡的智能故障診斷方法,并使用多傳感器融合對其改進,實現(xiàn)了信噪比0~10 dB范圍內軸承故障振動信號的分析;文獻[4]通過對堆疊式去噪自編碼器進行遷移性學習的研究,提高了編碼器在低噪聲干擾環(huán)境下的樣本分類正確率;文獻[5]提出了基于神經(jīng)網(wǎng)絡的領域自適應故障診斷,可將舊領域學習到的知識應用到新領域;文獻[6]提出通過最小化最大均值差異來實現(xiàn)領域共享特征技術;文獻[7]提出用于軸承時序振動信號的卷積模型,在不同數(shù)據(jù)集上表現(xiàn)良好,而且將批量自適應標準化引入模型,從而提高了模型的抗噪性能。
上述研究沒有涉及無噪和有噪領域的遷移,且提出的抗噪模型在高噪環(huán)境下表現(xiàn)不佳。因此,提出一種基于卷積-注意力機制-強制特征適配(Attention Mechanism Convolutional Neural Network—Mandatory Feature Adaptation,AMCNN-MFA)的軸承故障診斷模型,其具備以下特點:1)實現(xiàn)端到端的軸承故障診斷模式,無需對數(shù)據(jù)進行相關信號處理;2)模型結構簡單,網(wǎng)絡參數(shù)規(guī)模??;3)模型能夠應對不同程度的噪聲干擾,診斷精度高。
在傳統(tǒng)領域,軸承故障類型和工況保持不變的情況下,傳感器采集到的軸承振動信號雖然會由于其他機械部件的噪聲干擾而有所區(qū)別,但通過傳統(tǒng)信號處理得到的軸承故障特征是不會改變或不會有太大波動,也就是說噪聲干擾不會改變軸承本應存在的故障特征。而在深度學習中,標簽相同的樣本經(jīng)過模型網(wǎng)絡層會得到類似的樣本特征,本文的故障特征(通過卷積特征提取層得到,沒有具體的物理意義,與傳統(tǒng)信號領域具有實際物理意義的故障特征有所區(qū)別)適配就是在這種背景下,將無噪聲樣本(傳感器采集的原始樣本)與高噪聲樣本(添加高強度隨機干擾后的樣本)的故障特征進行適配,即將特征的數(shù)據(jù)分布映射到同一空間,減小兩類樣本故障特征的距離,以確保故障特征不會有太大的數(shù)值波動,使深度學習模型挖掘信號數(shù)據(jù)中的有效故障特征,從兩類樣本中獲取不變特征,以增強模型的抗噪性。
對于共享標簽的原始數(shù)據(jù)和加噪數(shù)據(jù)(通過對原始數(shù)據(jù)添加高強度噪聲得到),強制特征適配(MFA)根據(jù)標簽類別對卷積模型特征提取層得到的高層故障特征進行正確的特征分布歸一化,并減小特征分布偏移程度。
強制特征適配中的數(shù)據(jù)分為兩類:服從數(shù)據(jù)分布p的原始特征Ds(xs,ys),服從數(shù)據(jù)分布q的加噪特征Dt(xt,yt)。其中,x為樣本特征數(shù)據(jù),y為樣本標簽,ys和yt共享標簽。強制特征適配的示意圖如圖1所示,其原理為:使用評估原始域和加噪域數(shù)據(jù)分布偏移程度的相關方法,利用2個域的正確標記將相同類別的振動信號樣本經(jīng)過卷積模型特征提取后得到的高層故障特征強制性進行數(shù)據(jù)分布重合(盡可能減小特征數(shù)據(jù)的分布偏移),使深度學習模型從加噪樣本中學習到與原始樣本通用的故障特征,從而能夠應對復雜的高噪場景。
圖1 強制特征適配示意圖
最大均值差異(Maximum Mean Discrepancy,MMD)[8]是目前遷移學習,尤其是域適應(Domain Adaptation)中使用最廣泛的一種損失函數(shù),主要用來度量2個不同但相關的分布(p,q)的距離。2個分布的距離定義為
(1)
式中:xs為源域數(shù)據(jù);xt為目標域數(shù)據(jù);H表示這個距離由φ(·)將數(shù)據(jù)映射到再生核希爾伯特空間中進行度量;E表示對映射到再生核希爾伯特空間的樣本特征取均值。利用最大均值差異可以很好地評估軸承振動信號原始樣本與高噪樣本之間故障特征的差異性。
無偏估計是用樣本統(tǒng)計量估計總體參數(shù)時的一種無偏推斷,dH(p,q)的無偏估計為
(2)
原始樣本特征與加噪樣本特征之間的數(shù)據(jù)分布偏移距離可以用最大均值差異表示,對于故障特征向量屬于故障類別c的偏移距離為
(3)
式中:xs為原始樣本的特征向量;xt為加噪樣本的特征向量。
由于每個樣本都有長度為類別總數(shù)C的標簽向量(獨熱編碼),向量中只有1個位置為1,其余C-1個位置都為0,所以在計算所有樣本的屬于類別c的故障特征均值時,由于所有樣本的類別標簽并非都是c,在計算有效樣本總數(shù)時應該去除類別標簽不為c的無效樣本,即
(4)
(5)
(6)
(7)
AMCNN-MFA模型由特征提取層、分類層、特征適配模塊等構成,具體算法流程如圖2所示。
圖2 AMCNN-MFA軸承故障診斷模型結構示意圖
通道注意力機制能夠使模型將更多的注意力集中在更重要的特征上,其具體算法如圖3所示,因此在模型引入通道注意力以權衡卷積層所得特征數(shù)據(jù)中每個通道特征信息的重要程度,增強模型的魯棒性和分類聚類效果。在卷積特征提取層的首尾兩層引入通道注意力,將經(jīng)過卷積層后得到的特征H經(jīng)過一定處理后的數(shù)值送入sigmoid函數(shù),通過計算得到不同特征維度各自的權重系數(shù)(0~1),再將得到的系數(shù)與輸入特征進行對應通道相乘組成新的特征H′,這些新特征便是經(jīng)過權重分配的特征,能夠幫助模型獲得更關鍵和重要的信息,使模型做出更準確的判斷。
圖3 通道注意力機制
l=lJ+αlMFA,
(8)
(9)
式中:α用于權衡域適配損失在模型總損失中所占的權重。
AMCNN模型的具體參數(shù)見表1:在模型輸入的開始加入隨機采樣層,相當于對數(shù)據(jù)加入適度噪聲,使網(wǎng)絡提取的故障特征更具魯棒性;網(wǎng)絡模型中,除了提取振動信號高級特征的一維卷積神經(jīng)網(wǎng)絡層外,還在卷積模塊的首尾添加通道注意力模塊,為特征通道分配不同的權重,以增大有效特征在總特征域的占比,減少無效特征的干擾。
表1 AMCNN軸承故障診斷模型的具體參數(shù)
模型使用Adam優(yōu)化器,加速模型尋優(yōu)過程,減少迭代次數(shù)。在網(wǎng)絡迭代過程中,為避免學習率過大導致迭代路徑振蕩過大,使用學習率指數(shù)衰減策略,以確保模型在迭代循環(huán)中能夠越來越逼近最優(yōu)解。學習率指數(shù)衰減策略為
(10)
式中:lR為初始學習率;e為當前訓練步數(shù);et為模型總訓練步數(shù);λ為衰減速率參數(shù)。
基于Python-Pytorch搭建深度學習模型,在不同類型的數(shù)據(jù)集上進行5次訓練和測試并對測試結果取平均值,與其他模型進行性能對比,驗證本文提出的AMCNN-MFA模型的抗噪聲能力和泛化能力。
3.1.1 CWRU軸承數(shù)據(jù)集
選取凱斯西儲大學(CWRU)軸承數(shù)據(jù)集[10]中的驅動端軸承SKF6205在2hp工況下的數(shù)據(jù)進行試驗,振動信號的采樣頻率為48 kHz,不對數(shù)據(jù)進行任何預處理,實現(xiàn)端輸入,數(shù)據(jù)長度為1 600(軸承運轉一圈的采樣點),數(shù)據(jù)采取半周期重疊采樣以擴充數(shù)據(jù)量。具體數(shù)據(jù)集構成見表2,其中,訓練集分為源域(原始樣本,不作任何處理)和目標域(加噪樣本,在原始樣本中添加信噪比-10 dB的高斯白噪聲[11]);驗證集為加噪樣本(在原始樣本中添加信噪比-10 dB的高斯白噪聲);測試集為加噪樣本(在原始樣本中添加信噪比-10~10 dB的高斯白噪聲)。
表2 CWRU軸承數(shù)據(jù)集
訓練集中一隨機原始故障信號及其加噪信號(添加-10 dB的隨機噪聲)的時域波形如圖4所示,加噪信號與原始信號差異很大,原始信號的幅值在0.5 m/s2以內,而加噪信號的幅值大部分在0.5~1.0 m/s2,小部分超過1.0 m/s2。模型的作用是在2個不同信號中提取公共的故障特征。
(a)原始信號
3.1.2 PB軸承數(shù)據(jù)集
采用帕德博恩大學(PB)滾動軸承人工損傷數(shù)據(jù)集[12]中的6203軸承在N15M07F10工況(轉速1 500 r/min,轉矩0.7 N·m,徑向載荷1 000 N)下的數(shù)據(jù)進行試驗,振動信號的采樣頻率為64 kHz,采樣長度為2 560,噪聲配置同表2。故障缺陷由電動雕刻機單點加工,加工位置為軸承內、外圈,根據(jù)不同的加工深度(1~2 mm)將故障程度分為等級Ⅰ和Ⅱ,結合軸承健康運轉狀況共構成5種故障類型,具體數(shù)據(jù)集構成見表3。
表3 PB軸承數(shù)據(jù)集
3.1.3 加速壽命試驗真實損傷數(shù)據(jù)集
真實損傷軸承數(shù)據(jù)來自帕德博恩大學滾動軸承加速壽命試驗[12],試驗軸承為6203型深溝球軸承,通過加速壽命試驗使軸承產(chǎn)生疲勞損壞,大多以點狀剝落的形式出現(xiàn),損傷程度分為等級Ⅰ和Ⅱ,損傷位置為內、外圈,與健康狀況共構成5類故障類別。本文選擇運行在N15M07F10工況的故障軸承數(shù)據(jù),振動信號的采樣頻率為64 kHz,采樣長度為2 560,數(shù)據(jù)集(PB-Reality)的最終構成與3.1.2中的表3完全一致。
模型訓練參數(shù)見表4,采用Kaiming進行網(wǎng)絡初始化[13],分別使用3個數(shù)據(jù)集中的訓練集對模型進行訓練,其中,CWRU訓練集的具體訓練過程如圖5所示:各損失曲線在訓練過程中逐漸收斂趨于0;訓練集、驗證集的分類正確率緩慢增長并趨于穩(wěn)定。
表4 AMCNN軸承故障診斷模型訓練參數(shù)
圖5 模型訓練過程(CWRU訓練集)Fig.5 Model training process(CWRU training sets)
為確保試驗結果的可靠性,進行5次訓練并對測試集的分類正確率取平均值。本文搭建的AMCNN-MFA模型通過特征適配提高抗噪能力,除此之外,還采用具備抗噪能力的機器學習模型和其他深度學習模型進行對比分析:使用高斯徑向基核函數(shù)的支持向量機(SVM)、深度神經(jīng)網(wǎng)絡[14](DNN)、第一層寬卷積核深度卷積神經(jīng)網(wǎng)絡[7](WDCNN)、深度殘差收縮卷積神經(jīng)網(wǎng)絡[15](DRSN)、基于訓練干擾的卷積神經(jīng)網(wǎng)絡[16](TICNN),同時使用未添加注意力機制模塊的CNN-MFA模型進行消融試驗,驗證注意力機制在模型中的作用。所有模型都使用相同的時序數(shù)據(jù)結構輸入,其中,DNN中大量引入Dropout層, WDCNN中引入隨機采樣層,DRSN中引入自適應軟閥值去噪模塊,TICNN引入AdaBN,用于增強各模型的抗噪能力。
各軸承數(shù)據(jù)的測試集在不同模型中的分類結果如圖6和圖7所示,具體的分類準確率見表5,分析可知:
表5 各軸承數(shù)據(jù)測試集在不同模型中的分類準確率
Tab.5 Classification accuracy of each bearing data test set in different models
模型參數(shù)量CWRU軸承數(shù)據(jù)集PB軸承數(shù)據(jù)集PB-Reality軸承數(shù)據(jù)集SVM—38.04%±1.32%33.37%±2.07%34.03%±2.01%DNN2 476 74483.22%±2.41%66.20%±3.01%79.29%±1.93%WDCNN50 63674.75%±1.56%87.13%±1.76%89.98%±1.03%DRSN63 69674.56%±2.59%62.26%±2.02%78.10%±1.59%TICNN60 28885.54%±1.03%91.89%±1.32%96.65%±0.56%CNN-MFA30 74494.20%±0.51%95.13%±0.43%99.59%±0.21%AMCNN-MFA30 75696.79%±0.23%96.14%±0.34%99.92%±0.05%
圖6 各軸承數(shù)據(jù)測試集在不同模型中的分類結果Fig.6 Classification results of each bearing data test set in different models
圖7 各軸承數(shù)據(jù)測試集的消融試驗結果
1)AMCNN-MFA模型總體性能最可靠,平均分類準確率最高,均高于96%且波動不超過0.4%;在高噪聲(低信噪比,-10~0 dB)場景下,AMCNN-MFA模型的性能大幅度領先其他模型,在最強噪聲(信噪比-10 dB)下的分類準確率也能達到80%以上的,遠高于其他模型;在低噪聲(高信噪比,0~10 dB)場景下,AMCNN-MFA模型的性能也能以較小優(yōu)勢領先其他模型,分類準確率都在98%以上。
2)相對于CNN-MFA模型,在使用注意力機制的情況下,AMCNN-MFA模型總體增加的參數(shù)量可忽略不計,但分類準確率均有不同程度的提升,在3個數(shù)據(jù)集上的平均性能提升分別為2.59%,1.01%,0.33%。
利用TSEN[17]可視化方法對CWRU軸承數(shù)據(jù)測試集(信噪比-5 dB)在AMCNN-MFA和CNN-MFA模型中進行各網(wǎng)絡層的二維可視化,并對測試得到的預測標簽和真實標簽求取混淆矩陣,結果如圖8和圖9所示:
圖8 CWRU軸承數(shù)據(jù)測試集(信噪比-5 dB)在AMCNN-MFA模型上的可視化圖及混淆矩陣Fig.8 Visualization and confusion matrix of CWRU bearing data test set(SNR-5 dB)on AMCNN-MFA model
圖9 CWRU軸承數(shù)據(jù)測試集(信噪比-5 dB)在CNN-MFA模型上的可視化圖
1)原始信號在特征空間中幾乎不可區(qū)分;隨著層級深入,模型可區(qū)分出健康和故障狀態(tài),并逐漸對故障類型進行細分,通道注意力模塊2已可對10類故障狀態(tài)完全聚類。
2)由混淆矩陣可知,在整個測試集中,模型只對故障類別1和8產(chǎn)生錯誤判別,圖8h同樣反映了這一現(xiàn)象。
3)與CNN-MFA模型相比,AMCNN-MFA模型中,通道注意力模塊1將卷積層1得到的特征類別7和9更明顯地聚類,通道注意力模塊2將卷積層4得到的特征類別1,2,3,5,8,9十分明顯的聚類,表明注意力機制能夠提高模型對各故障類別的聚類能力,提高模型的魯棒性。
本文提出的一種新的抗不同程度噪聲干擾的AMCNN-MFA模型,其是基于卷積神經(jīng)網(wǎng)絡、注意力機制、強制特征適配模塊搭建而成的高性能模型,具備以下特點:
1)AMCNN-MFA模型可實現(xiàn)端到端的診斷模式,無需對原始診斷數(shù)據(jù)進行任何處理,避免了傳統(tǒng)故障診斷方法需人工提取故障特征的步驟,診斷信號輸入模型后可直接輸出分類結果。
2)AMCNN-MFA模型具備最少的參數(shù)量,結構簡單且訓練難度較小,對不同軸承數(shù)據(jù)集的平均分類準確率均高于96%且波動不超過0.4%。
3)采用通道注意力機制,使AMCNN-MFA模型3個軸承數(shù)據(jù)集上的平均性能分別提高了2.59%,1.01%,0.33%,有效提升了模型的診斷性能和分類魯棒性。