洪曉翠 段禮祥 徐繼威 付強
(1.中國石油大學(北京)安全與海洋工程學院 2.中國石油塔里木油田分公司)
在實際工程中,機械設備(如齒輪箱和滾動軸承等)常在變工況(變速或變載)下運行[1-3],監(jiān)測信號呈現(xiàn)非平穩(wěn)、異分布的特點,故障特征頻率及其幅值也將隨轉(zhuǎn)速和負載而變化,具有時變特點,因此傳統(tǒng)的以恒定轉(zhuǎn)速和平穩(wěn)信號為前提的故障診斷方法(如時域分析和頻域分析等)難以有效提取故障特征[4]。
近年來,對變工況下機械設備故障診斷方法的研究受到了學者們的廣泛關注。一些學者從降低故障特征對工況敏感度的角度展開研究,采用同步線性調(diào)頻[5]、角域重采樣[6]及階比跟蹤[7]等技術進行信號處理和特征提取,在一定程度上實現(xiàn)了變工況機械設備的故障診斷。但此類方法依賴專業(yè)的信號處理知識,且過程繁瑣復雜,難以滿足“工業(yè)大數(shù)據(jù)”背景下對高維、復雜及海量監(jiān)測數(shù)據(jù)進行診斷分析的需求。隨著人工智能技術的不斷發(fā)展,機器學習逐漸被應用于機械設備的跨工況診斷。常用的方法有淺層機器學習方法(如支持向量機[8]和K-近鄰算法[9]等)以及深度學習算法(如卷積神經(jīng)網(wǎng)絡(Convolutional neural network,CNN)[10]、深度置信網(wǎng)絡(Deep Belief Network,DBN)[11]及自動編碼器(Auto-encoder,AE)[12]等)。其中,深度學習算法通過復雜、非線性的映射關系學習原始數(shù)據(jù)深層次的抽象表示,能夠自動從數(shù)據(jù)中提取敏感特征,成為了領域研究熱點[13]。但是,上述機器學習方法建立在獨立同分布假設之上,即假設訓練數(shù)據(jù)和測試數(shù)據(jù)滿足相同分布,它是通過訓練數(shù)據(jù)獲得的模型能夠在測試集取得良好效果的基本保障。設備只有在平穩(wěn)工況下才滿足該假設,而在變工況下設備監(jiān)測信號不穩(wěn)定、異分布,這將導致穩(wěn)定工況下訓練的模型難以應用于新工況,使泛化性能大大下降。
遷移學習理論的提出為解決上述問題提供了新思路,它打破了機器學習對測試樣本與訓練樣本同分布的局限,是一種跨領域、跨任務的學習方法[14]。對于變工況機械故障診斷,源域(訓練數(shù)據(jù))和目標域(測試數(shù)據(jù))共享相同的特征和類別,但特征分布不同,屬于跨域問題。此類問題的解決方法為領域自適應,即將源域和目標域映射到同一個公共特征空間以消除領域差異,重新形成具有相同分布的特征集[15]。不少學者從遷移學習角度出發(fā),提出了基于遷移成分分析[16]、遷移因子分析[17]和最大平均偏差[18]等技術的領域自適應方法,但上述淺層遷移方法的特征提取能力有限,難以挖掘?qū)λ泄收厦舾械挠虿蛔兲卣鳌?/p>
為解決上述問題,本文將深度學習中的殘差網(wǎng)絡(Residual Network,ResNet)與遷移學習中的領域?qū)咕W(wǎng)絡(Domain Adversarial Neural Network,DANN)相結合,提出一種深度遷移方法——殘差對抗網(wǎng)絡(Residual Adversarial Neural Network,RANN),并用于變工況滾動軸承的故障診斷。首先采用滑窗取樣策略從原始振動信號中截取故障樣本,以此增加樣本數(shù)量。接著構建包含特征提取器、故障分類器和領域判別器的殘差對抗網(wǎng)絡。其中,特征提取器采用雙通道ResNet以實現(xiàn)多源信號的融合以及故障特征的自適應挖掘,同時通過最大化領域判別器損失和最小化故障分類器損失來實現(xiàn)變工況機械設備的故障診斷。最后采用美國凱斯西儲大學[19]的滾動軸承故障數(shù)據(jù)集對該方法的可行性和優(yōu)越性進行了驗證。相比于現(xiàn)有基于上述數(shù)據(jù)集開展的研究[20-22],本文提出的RANN通過采用雙通道輸入融合不同位置的數(shù)據(jù)可獲取更加全面的故障信息。本文采用3個工況下的滾動軸承數(shù)據(jù),共開展6組遷移診斷試驗,且直接采用原始振動信號實現(xiàn)端到端的遷移診斷,更加簡潔高效。該研究所得結論可以為變工況機械設備的故障診斷提供參考。
2016年,G.YAROSLAV等[23]借鑒生成對抗網(wǎng)絡中生成器與判別器的對抗訓練策略,提出了領域?qū)咕W(wǎng)絡。該網(wǎng)絡(見圖1)首次將對抗學習的思想引入到遷移學習中,主要由3部分組成,包括基于CNN的特征提取器、標簽預測器和領域判別器,其輸出分別為:
Gf(x;p,q)=Hf(px+q)
(1)
Gy(Gf(x);v,c)=Hy(vGf(x)+c)
(2)
Gd(Gf(x);u,z)=Hd(uTGf(x)+z)
(3)
式中:x為輸入變量,Gf、Gy及Gd分別為特征提取器、標簽預測器及領域判別器的輸出,Hf、Hy、Hd分別為Gf、Gy、Gd的激活函數(shù),p、v、u分別為特征提取器、標簽預測器及領域判別器的權重,uT為u的轉(zhuǎn)置,q、c、z分別為特征提取器、標簽預測器及領域判別器的偏置。
圖1 標準域?qū)咕W(wǎng)絡結構示意圖Fig.1 Schematic structure of a standard DANN
特征提取器將源域數(shù)據(jù)和目標域數(shù)據(jù)進行映射和混合,提取后續(xù)網(wǎng)絡完成任務所需要的特征,使標簽預測器能夠準確區(qū)分數(shù)據(jù)類別(例如能將故障數(shù)據(jù)準確分為故障1、故障2、……、故障n),同時使領域判別器無法分辨數(shù)據(jù)來自目標域或源域,以學習出具備不受領域變化影響的特征。標簽預測器利用特征提取器提取的信息對源域數(shù)據(jù)進行分類,盡可能分出正確的標簽。領域判別器對特征空間的數(shù)據(jù)進行分類,盡可能分出數(shù)據(jù)來自哪個域。DANN通過特征提取器與領域判別器的對抗訓練來消除領域差異,提取域不變特征。它是深度學習與遷移學習的完美結合,在情感分析[24]和文本分類[25]等領域均得到了成功應用。
具體而言,特征提取器提取的特征信息傳入領域判別器,領域判別器判斷信息來自源域還是目標域,并計算損失Ld。在反向傳播過程中,領域判別器和特征提取器中間有一個梯度反轉(zhuǎn)層,即領域判別器的訓練目標是盡可能正確判斷特征信息所屬的域類別,而特征提取器的訓練目標是使領域判別器不能正確判斷出信息來自哪個域,從而形成一種對抗關系。
在領域?qū)鼓P椭?,前向傳播時梯度反轉(zhuǎn)層與普通全連接層作用相同,則有:
a=wx+b
(4)
而在誤差反向傳播過程中梯度方向自動取反,可得:
(5)
式中:w為梯度反轉(zhuǎn)層的權重,b為梯度反轉(zhuǎn)層的偏置,a為梯度反轉(zhuǎn)層的輸出,I為單位矩陣,x為網(wǎng)絡輸入的變量。
(6)
式中:xi為第i(i=1,2,3,……,n)個樣本變量,yi表示相應標簽類別,di表示領域類別,θf為Gf參數(shù),θy為Gy參數(shù),θd為Gd參數(shù),DS表示源域數(shù)據(jù)集,DT表示目標域數(shù)據(jù)集,N為中間參變量,N=NS+NT,其中NS為輸入的源域樣本數(shù),NT為輸入的目標域樣本數(shù)。
2006年,深度學習理論[26]的提出使得CNN成為各領域研究熱點。2012年,A.KRIZHEVSKY等[27]構建的8層網(wǎng)絡包括5個卷積層和3個全連接層,在ILSVRC競賽上取得了優(yōu)異的成績。2014年,VGGNet首次將網(wǎng)絡的深度增加到了19層,在ILSVRC競賽上取得了24.7%的Top-1錯誤率和7.3%的Top-5錯誤率[28]。但是,網(wǎng)絡的性能并不會隨著網(wǎng)絡層數(shù)的增加而不斷提升。研究發(fā)現(xiàn),20層以上的深度網(wǎng)絡,繼續(xù)增加網(wǎng)絡層數(shù),分類的精度反而會降低,50層網(wǎng)絡的測試錯誤率大概是20層網(wǎng)絡的兩倍[29]。
為了解決增加網(wǎng)絡深度帶來的網(wǎng)絡性能退化問題,HE K.M.等[30]在殘差學習的啟發(fā)下對CNN進行改進,提出了殘差網(wǎng)絡(ResNet)。ResNet引入了恒等映射的設計,巧妙地緩解了由于深度增加帶來的梯度彌散以及網(wǎng)絡退化問題,增加了信息傳遞路徑的數(shù)量,使網(wǎng)絡的深度可以由幾十層推至上千層[31]。
假定某神經(jīng)網(wǎng)絡的輸入為x(如圖像、文本、振動信號等),期望輸出為H(x),傳統(tǒng)神經(jīng)網(wǎng)絡直接優(yōu)化H(x),難度較大。在ResNet中,定義殘差函數(shù)F(x),并將其設為網(wǎng)絡學習的目標,可得:
F(x)=H(x)-x
(7)
研究人員通過試驗證明優(yōu)化殘差函數(shù)F(x)比優(yōu)化原始函數(shù)映射H(x)容易得多。在殘差學習模塊中,左側分支對應殘差函數(shù)F(x),右側分支為輸入x的恒等映射,兩分支對應元素相加再經(jīng)過ReLU激活函數(shù),從而形成整個殘差模塊(見圖2)。通過堆疊多個殘差模塊形成深度殘差網(wǎng)絡。
圖2 殘差學習模塊Fig.2 Residual learning module
ResNet的特點是容易優(yōu)化,并且能夠通過增加網(wǎng)絡深度來提高準確率。其創(chuàng)新點在于引入了殘差學習“快捷連接(shortcut connection)”的思想,整個網(wǎng)絡只需要學習輸入、輸出差別的那一部分,降低了學習難度,緩解了在深度神經(jīng)網(wǎng)絡中增加深度帶來的梯度問題。目前,常用的ResNet結構有ResNet-34、ResNet-50、ResNet-101等,如表1所示。
表1 經(jīng)典殘差網(wǎng)絡結構Table 1 Structure of classical residual network
從表1可見,ResNet-34中殘差學習模塊使用2個卷積核大小為3×3的卷積層進行運算;而ResNet-50和ResNet-101則采用3層殘差學習模塊,即第一個卷積層采用1×1的卷積核對數(shù)據(jù)進行降維,第二層采用3×3的卷積核進行卷積運算,最后再經(jīng)過一個1×1的卷積核還原。采用這種方式既能保證網(wǎng)絡精度,又大大減少了網(wǎng)絡計算量[32]。
以表1中Conv1為例,“7×7”為卷積核尺寸,“64”為卷積核個數(shù),步長為2;“3×3”為池化核尺寸,池化方法為“最大池化”,步長為2。
本文將ResNet與DANN相結合,構建殘差對抗網(wǎng)絡,在解決深度網(wǎng)絡梯度彌散問題的同時進行領域?qū)褂柧?,實現(xiàn)機械設備的跨工況遷移診斷。
RGB色彩模式是工業(yè)界的一種顏色標準,通過對紅(R)、綠(G)、藍(B)3個顏色通道的變化以及它們相互之間的疊加來得到各式各樣的顏色。RGB圖像所含信息更加豐富,更有利于進行圖像識別[33]。類似地,在機械故障診斷領域,采用多通道輸入進行多源信號融合可以收集更加全面的故障信息,從而提升故障診斷的準確率。
本文采用雙通道輸入,輸入信號為1×1 024×2的雙通道一維信號,為了更加直觀地展示雙通道信號與單通道信號的不同,將各通道信號映射到同一幅圖中,如圖3所示(以凱斯西儲大學軸承故障數(shù)據(jù)中735 W(1 hp)負載下故障直徑為0.18 mm的內(nèi)圈故障為例)。從圖3可以看到,雙通道信號融合了各通道信號的頻率和幅值等信息,突出了多通道信號輸入的特點。
圖3 融合信號的波形與頻譜示例Fig.3 Fused signal waveform and spectrum samples
本文引入殘差學習的思想對標準DANN進行改進,提出殘差對抗網(wǎng)絡,由基于雙通道ResNet的特征提取器、故障分類器以及領域判別器3部分組成,如圖4所示。
圖4 殘差對抗網(wǎng)絡結構圖Fig.4 Schematic structure of RANN
對于特征提取器,采用ResNet可以提取復雜數(shù)據(jù)的深層特征,解決網(wǎng)絡深度增加引起的梯度彌散及性能退化問題,但現(xiàn)有的ResNet模型結構復雜、參數(shù)量大、訓練時間長,計算效率不高。因此,本文以ResNet-50為基礎網(wǎng)絡框架構建雙通道ResNet提取故障特征,主要修改如下:原網(wǎng)絡結構中的Conv1、Conv2_x層數(shù)保持不變、Conv3_x和Conv4_x層各保留一個殘差塊,去除Conv5_x層,網(wǎng)絡層數(shù)從50層縮減為16(1+3×3+3×1+3×1)層,如表2所示。以Conv1為例,表2中“1×7”為卷積核尺寸,“64”為卷積核個數(shù),“stride2”為步長。
表2 雙通道殘差網(wǎng)絡結構Table 2 Structure of dual-channel residual networks
此外,為獲取全面的故障信息,采用雙通道輸入進行信號融合。相應地,在特征提取器中設置雙通道卷積核進行卷積操作,如圖5所示。在各通道分別進行一維卷積操作,為了將各自獨立的信號聯(lián)通在一起以達到信號融合的目的,將各通道在同一位置上的結果求和,則可以得到該位置的一維卷積輸出[34]:
(8)
圖5 雙通道卷積操作Fig.5 Dual-channel convolution operation
故障分類器由輸入層、兩個全連接層及輸出層構成,采用交叉熵[35]作為損失函數(shù),通過最小化損失函數(shù)實現(xiàn)故障準確分類。交叉熵是一種常用的損失函數(shù),計算式為:
(9)
式中:M為類別數(shù)量,x表示輸入的樣本,pi(x)與qi(x)分別表示輸入樣本屬于第i類的實際概率和模型預測概率。
領域判別器由輸入層、一個全連接層和輸出層組成。同時,在特征提取器與領域判別器之間添加“梯度反轉(zhuǎn)層”,最大化領域判別器的損失函數(shù)使其難以實現(xiàn)工況的準確分類,使得特征提取器提取到對工況信息低敏感度的特征,這也是“域?qū)埂钡膬?nèi)涵所在[36]。
本文構建RANN進行變工況機械設備的遷移診斷,主要步驟如下。
(1)采集設備多通道振動信號,并采用滑窗取樣策略從原始振動信號中截取故障樣本,以增加樣本數(shù)量。
(2)按照一定比例劃分訓練集和測試集,用于模型的訓練和測試。
(3)構建殘差對抗網(wǎng)絡,采用Adam優(yōu)化算法進行模型訓練,并設置學習率為0.001、批量尺寸為50,迭代次數(shù)為150。
(4)初始化網(wǎng)絡權重和偏置,以批量方式將訓練樣本輸入模型,逐層進行前向傳播提取樣本特征,計算期望輸出與實際輸出之間的誤差;利用反向傳播算法將誤差進行反向傳播,逐層更新網(wǎng)絡的權重和偏置。
(5)重復步驟(3)和步驟(4),直到將訓練樣本全部訓練完畢且網(wǎng)絡誤差小于允許值或者達到了迭代次數(shù),此時得到理想的RANN模型。
(6)輸入測試樣本,輸出診斷結果。
圖6 基于RANN的故障診斷方法操作步驟Fig.6 Operation steps of the fault diagnosis method based on RANN
本文采用美國凱斯西儲大學的滾動軸承故障數(shù)據(jù)集進行試驗驗證。試驗系統(tǒng)由1臺提供驅(qū)動力的感應電機(左側)、1臺產(chǎn)生額定負載的測力器(右側)以及控制電路組成,如圖7所示。2個加速度傳感器分別安裝在電機的風扇端和驅(qū)動端以采集振動信號。試驗對象為驅(qū)動端軸承,型號為SKF6205,通過電火花加工在軸承上施加單點故障。
圖7 試驗裝置示意圖Fig.7 Diagram of the experimental device
本試驗同時選用電機驅(qū)動端和風扇端加速度傳感器監(jiān)測的振動信號,采用雙通道輸入以實現(xiàn)信號融合,采樣頻率為12 kHz。軸承設置有內(nèi)圈故障、滾動體故障和外圈故障3種故障類型,每種故障類型又設有0.18、0.36和0.53 mm 3種不同的損傷直徑,加上正常軸承,一共設置10種故障狀態(tài)。試驗構建了3種不同轉(zhuǎn)速及負載下的數(shù)據(jù)集,如表3所示。
表3 試驗數(shù)據(jù)集詳情Table 3 Details of the experimental data sets
為獲取大量故障樣本用于深度學習模型的訓練,采用數(shù)據(jù)增強(滑窗取樣)策略從原始振動信號中截取故障樣本,以此增加樣本數(shù)量,如圖8所示。樣本長度設為1 024點,每種狀態(tài)生成故障樣本500組,隨機選擇400組用于訓練,剩余100組用于測試,則10種狀態(tài)共有訓練集4 000組,測試集1 000組。
圖8 滑窗取樣操作Fig.8 Sliding window sampling
基于RANN的變工況軸承遷移診斷結果如表4所示。
表4 雙通道RANN診斷準確率 %
從表4可以看出,模型在源域和目標域上都取得了很高的故障診斷準確率,表明本文方法能有效克服領域分布差異,實現(xiàn)不同工況下軸承故障的準確分類。
為進一步定量分析殘差對抗網(wǎng)絡的性能,以A→B、A→C試驗為例,繪制10種故障狀態(tài)的分類混淆矩陣,如圖9所示。圖9中,橫坐標為預測標簽,縱坐標為真實標簽,對角線數(shù)據(jù)則表示分類正確率。從圖9可以看出,基于RANN的變工況軸承故障診斷方法能準確識別正常、內(nèi)/外圈故障及滾動體故障4種故障類型,對各類故障狀態(tài)的分類正確率均在97%以上,充分證明了該方法能夠有效克服領域差異,提取對所有故障敏感的域不變特征,實現(xiàn)軸承的跨工況診斷。
圖9 混淆矩陣Fig.9 Confusion matrix
為更直觀地展示本文方法在各組試驗中的領域適應能力,以A→B、A→C試驗為例,采用t-分布鄰域嵌入算法[37]對故障分類器輸出層的特征進行可視化,如圖10所示。圖10a為原始數(shù)據(jù)可視化結果,從圖10a可以看出,所有樣本最初呈混亂的狀態(tài),源域和目標域數(shù)據(jù)分布不同,且各類故障間重疊較多,可區(qū)分性差。而通過RANN學習得到的特征(見圖10b、圖10c)聚類效果良好,各類故障間界限明晰,來自同一故障但分屬不同領域的故障樣本彼此之間相互重疊,結果表明,源域和目標域的樣本雖然采集自不同的工況條件,但經(jīng)RANN處理后,已經(jīng)具有了相似甚至相同的分布規(guī)律。
圖10 特征可視化Fig.10 Feature-based visualization
本文方法同時選用電機驅(qū)動端和風扇端加速度傳感器監(jiān)測的振動信號,采用雙通道輸入以實現(xiàn)信號融合。為充分體現(xiàn)雙通道輸入的優(yōu)越性,僅選用電機驅(qū)動端的監(jiān)測信號進行故障診斷試驗,對比結果如圖11所示。從圖11可以看出,采用雙通道輸入的平均診斷準確率(98.58%)比單通道輸入(97.25%)高約1.3百分點,證明了雙通道融合信號所含故障信息更加全面,能有效改善故障診斷的效果。
圖11 不同輸入診斷結果對比Fig.11 Comparison of diagnosis results with different inputs
同時,將本文方法與標準DANN(特征提取器為CNN)模型[38]以及非深度遷移方法——遷移成分分析(Transfer Component Analysis,TCA)[39]進行對比,結果如表5所示。從表5可以看出,相比于淺層機器學習(TCA)方法,深度學習算法(RANN、DANN)在各組試驗中雖運行時間較長,但診斷準確率具有明顯的優(yōu)勢;本文提出的基于ResNet的RANN相比于常規(guī)DANN在軸承故障診斷試驗中運行時間稍長,但平均準確率提高約2.5百分點,這在故障診斷中是更為重要的。因此,綜合考慮診斷精度和時間成本兩方面因素,本文方法具有更佳的診斷性能。
表5 不同方法診斷效果對比Table 5 Diagnostic effects of different methods
本文針對變工況機械設備故障診斷中監(jiān)測數(shù)據(jù)非平穩(wěn)、非線性、異分布的特點以及單通道信號輸入難以全面表達故障特征,從而導致穩(wěn)定工況下訓練的分類模型性能大大下降的問題,提出一種深度遷移方法——殘差對抗網(wǎng)絡(RANN)以實現(xiàn)機械設備的跨工況診斷。通過變工況滾動軸承遷移診斷試驗證明了該方法的可行性和有效性,得出以下結論。
(1)將殘差網(wǎng)絡(ResNet)與領域?qū)咕W(wǎng)絡(DANN)相結合,可有效提取深層故障敏感特征,同時緩解深度網(wǎng)絡面臨的梯度彌散及性能下降問題。相比于標準DANN,特征提取及故障診斷效果均有所改善,平均準確率提升了約2.5百分點。
(2)相比于淺層遷移方法,如遷移成分分析(TCA)等,本文提出的殘差對抗網(wǎng)絡通過特征提取器與領域判別器的對抗訓練可以自適應逐層提取對工況信息敏感度低的域不變特征,有效克服領域分布差異,具有更佳的診斷性能。
(3)采用雙通道輸入可有效融合多源信號,獲取各通道信號的頻率和幅值等信息,為故障診斷提供更加全面的信息基礎。相比于單通道輸入,采用雙通道輸入的平均故障診斷準確率提升約1.3百分點。