楊勝康,孔憲光,王奇斌,程 涵,李中權(quán),2
(1.西安電子科技大學(xué) 機(jī)電工程學(xué)院,西安 710071;2.上海杭和智能科技有限公司,上海 201111)
機(jī)械故障是風(fēng)力電設(shè)備、航空發(fā)動機(jī)、高檔數(shù)控機(jī)床等國家大型機(jī)械裝備安全可靠運(yùn)行的“潛在殺手”[1]?,F(xiàn)如今,對于如何準(zhǔn)確診斷機(jī)械故障已成為裝備故障預(yù)測與維護(hù)管理的研究熱點(diǎn)。
為及時發(fā)現(xiàn)機(jī)械故障,使機(jī)器處于正常運(yùn)行狀態(tài),提出了多種機(jī)械故障診斷方法,這些故障診斷方法可分為信號處理方法[2-3]和數(shù)據(jù)驅(qū)動方法[4]。信號處理主要是通過小波分解[5]、經(jīng)驗(yàn)?zāi)B(tài)分解[6]、變分模態(tài)分解[7]等信號處理方法采集振動信號進(jìn)行時頻特征分析,進(jìn)行故障特征提取實(shí)現(xiàn)故障診斷。隨著大數(shù)據(jù)時代的到來[8],傳統(tǒng)的信號處理方法逐漸被基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的數(shù)據(jù)驅(qū)動方式所替代。以支持向量機(jī)[9],人工神經(jīng)網(wǎng)絡(luò)[10]、決策樹隨機(jī)森林[11]等為代表的機(jī)器學(xué)習(xí)方法在故障診斷領(lǐng)域展開應(yīng)用研究。由于機(jī)器學(xué)習(xí)方法需要大量的有標(biāo)簽數(shù)據(jù),進(jìn)行監(jiān)督學(xué)習(xí)故障特征。而真實(shí)的工業(yè)環(huán)境中常常面臨無標(biāo)簽信息的工業(yè)數(shù)據(jù),機(jī)器學(xué)習(xí)方法無法滿足這種需求,因此以深度置信網(wǎng)絡(luò)(deep belief networks,DBN),深度自編碼器等無監(jiān)督特征學(xué)習(xí)的深度學(xué)習(xí)技術(shù)迅速得到廣泛應(yīng)用。Shao等[12]利用優(yōu)化后的DBN進(jìn)行滾動軸承故障診斷方法研究,獲得較好的故障診斷效果。Zhou等[13]對深度自編碼進(jìn)行改進(jìn)應(yīng)用于故障診斷。李濤等[14]利用自適應(yīng)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行旋轉(zhuǎn)機(jī)械故障診斷,增強(qiáng)模型的穩(wěn)定性和適應(yīng)性。
盡管機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)在故障診斷領(lǐng)域有不錯的診斷性能,但是針對不同工況、不同設(shè)備之間以及引入新故障模式的故障診斷問題仍然難以達(dá)到理想的效果。隨著遷移學(xué)習(xí)[15]在圖像識別與分類領(lǐng)域的成功應(yīng)用,近年來,遷移學(xué)習(xí)在故障診斷領(lǐng)域的應(yīng)用成為研究熱點(diǎn)。Wen等[16]提出基于堆棧式稀疏自編碼器的深度遷移學(xué)習(xí)方法,應(yīng)用不同工況下的滾動軸承故障診斷。Yang等[17]提出基于特征遷移的卷積神經(jīng)網(wǎng)絡(luò),并引入多層MMD(maximum mean discrepancy)實(shí)現(xiàn)特征的域適應(yīng),將實(shí)驗(yàn)室軸承故障知識遷移到現(xiàn)場作業(yè)機(jī)械環(huán)境的軸承上,實(shí)現(xiàn)了不同設(shè)備之間故障診斷遷移學(xué)習(xí)。Zhang等[18]針對引入的新故障問題,提出基于深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)修正的遷移學(xué)習(xí)故障診斷方法,對訓(xùn)練好神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行修正并對參數(shù)進(jìn)行補(bǔ)充,利用少量目標(biāo)域數(shù)據(jù)進(jìn)行訓(xùn)練獲得較好故障診斷分類效果。Xu等[19]針對故障診斷中的樣本不平衡引起的域自適應(yīng)問題,提出一種卷積遷移特征判別網(wǎng)絡(luò),在變轉(zhuǎn)速不平衡故障數(shù)據(jù)下具有很好的域適應(yīng)特征提取能力。Li等[20]針對小樣本數(shù)據(jù)下不同工況不同故障類型的問題,提出基于域?qū)箤W(xué)習(xí)網(wǎng)絡(luò)的遷移學(xué)習(xí)故障診斷模型。Zhang等[21]提出一種雙判別器生成對抗網(wǎng)絡(luò)學(xué)習(xí)模型提高模型在不平衡數(shù)據(jù)集上的故障診斷精度。Zhang等[22]設(shè)計了一種專門的聯(lián)邦學(xué)習(xí)框架解決在遷移學(xué)習(xí)過程中數(shù)據(jù)隱私和數(shù)據(jù)孤島問題。Li等[23]提出了一種兩階段遷移對抗遷網(wǎng)絡(luò)實(shí)現(xiàn)對旋轉(zhuǎn)機(jī)械出現(xiàn)未知新故障的智能診斷。Huang等[24]針對耦合故障診斷問題,建立深度對抗膠囊網(wǎng)絡(luò)模型將耦合故障解耦為單一故障,進(jìn)而提高模型在實(shí)際工業(yè)場景中的診斷效果。
以上研究主要是從單源域出發(fā)利用域適應(yīng)或域?qū)箤W(xué)習(xí)方法解決變工況、不同設(shè)備、新工況故障數(shù)據(jù)不足以及出現(xiàn)未知故障的旋轉(zhuǎn)機(jī)械故障診斷問題。然而在實(shí)際工業(yè)場景中,由于單一工況或單一設(shè)備的個性,進(jìn)行單源域遷移學(xué)習(xí)會出現(xiàn)域不匹配造成負(fù)遷移和模型泛化能力不足的現(xiàn)象。而從多種工況的數(shù)據(jù)出發(fā),即進(jìn)行多源域下遷移學(xué)習(xí)任務(wù),能夠集成多源域故障特征信息,提取更好的域不變公共特征,學(xué)習(xí)到故障知識,將對于未知工況下的故障診斷具有較好的診斷效果。因此,本文將結(jié)合錨適配器集成和深度神經(jīng)網(wǎng)絡(luò)提出基于多源域深度遷移學(xué)習(xí)的機(jī)械故障診斷方法,利用錨適配器集成,充分集成多源域故障特征信息,學(xué)習(xí)域不變公共特征,減少源域與目標(biāo)域之間的分布差異,進(jìn)而達(dá)到較好的診斷效果。
多源域遷移學(xué)習(xí)故障診斷中,源域和目標(biāo)域在所有數(shù)據(jù)上可能不是緊密相關(guān)的。但是,從源域和目標(biāo)域的相同鄰近區(qū)域隨機(jī)選擇數(shù)據(jù)點(diǎn),基于這些數(shù)據(jù)點(diǎn)進(jìn)行遷移學(xué)習(xí)可以獲得較好的分類效果。因此,Zhuang等[25]基于該思想建立基于錨適配器集成的遷移學(xué)習(xí)框架,本文將從多源域中隨機(jī)選擇錨點(diǎn)進(jìn)行錨適配器的構(gòu)建與集成,用于多源域遷移學(xué)習(xí)故障診斷。
錨適配器的結(jié)構(gòu)如圖1所示,主要包括相似度計算和生成錨適配器矩陣兩部分,其具體的構(gòu)建流程如下。
圖1 錨適配器構(gòu)建
(1)
(2)
(3)
因此,最終錨適配器集成分類器輸出的計算公式如式(4)所示
(4)
基于錨適配器集成的遷移學(xué)習(xí)框架,利用深度神經(jīng)網(wǎng)絡(luò)模型具有挖掘數(shù)據(jù)深層次特征的優(yōu)勢,采用深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行多源域故障診斷遷移學(xué)習(xí)特征提取,進(jìn)而提出基于多源域深度遷移學(xué)習(xí)的機(jī)械故障診斷方法,其故障診斷模型如圖2所示?;诙嘣从蛏疃冗w移學(xué)習(xí)的故障診斷模型主要由深度特征提取網(wǎng)絡(luò)、源域分類損失和源域與目標(biāo)域特征分布均值差異三部分組成。深度特征提取采用深度神經(jīng)網(wǎng)絡(luò)(deep neural networks, DNN),為了保證模型能夠盡可能多地提取不同工況下的融合特征,DNN網(wǎng)絡(luò)共享權(quán)值和偏差,從而降低計算成本。引入最大均值差異損失函數(shù)是為了減小源域和目標(biāo)域之間的特征分布差異,使得不同轉(zhuǎn)速下樣本特征的邊際概率分布盡可能一致,使深度特征提取網(wǎng)絡(luò)、該遷移學(xué)習(xí)網(wǎng)絡(luò)更好地學(xué)習(xí)不同工況下的域不變特征。在提取到域不變特征之后,利用有標(biāo)簽的源域數(shù)據(jù)訓(xùn)練得到較好的故障分類器,從而用于目標(biāo)域工況下的故障診斷。
圖2 基于多源域深度遷移學(xué)習(xí)的故障診斷遷移學(xué)習(xí)模型
故障模型的深度特征提取網(wǎng)絡(luò)采用一個共享參數(shù)的3層深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行深層故障特征的提取,分別為輸入層、隱藏層和特征輸出層,最后采用SoftMax分類器進(jìn)行故障分類。假設(shè)x,f為神經(jīng)網(wǎng)絡(luò)的輸入和特征向量,隱藏層輸出向量定義h,則前向過程如下
(5)
式中:W1為輸入層和隱藏層之間的權(quán)值矩陣;W2為隱藏層和特征輸出層之間的權(quán)值矩陣;b1和b2分別為隱藏層和特征輸出層的偏置。則深度神經(jīng)網(wǎng)絡(luò)模型的分類損失函數(shù)定義
(6)
(7)
基于MMD的定義,多源域故障診斷遷移學(xué)習(xí)中的MMD計算如下式所示
(8)
因此,DNN的遷移學(xué)習(xí)故障診斷模型的總損失函數(shù)定義如下
λ·[DMM(Fs1,Ft)+DMM(Fs2,Ft)]
(9)
式中,λ為MMD項的懲罰系數(shù)。該損失函數(shù)由源域的分類損失函數(shù)以及源域和目標(biāo)域特征分布最大均值差異的損失函數(shù)兩部分組成。其分類損失函數(shù)可以保證模型具有較好的分類性能,MMD損失項可以減小不同域特征分布的差異,提高域特征的相似性和不變性。模型訓(xùn)練過程通過采用Adam優(yōu)化算法來最小化式(9),Adam算法能夠有效地加速訓(xùn)練過程,解決大量參數(shù)優(yōu)化的問題。
本文提出的基于多源域深度遷移學(xué)習(xí)的故障診斷方法流程如圖3所示。
圖3 基于多源域深度遷移的故障診斷方法流程
首先,從多源域中隨機(jī)選擇q個樣本作為錨點(diǎn),計算每個錨點(diǎn)與多源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)的相似度,并基于相似度生成新的源域和目標(biāo)域適配器數(shù)據(jù),并構(gòu)建基于錨適配器的源域-目標(biāo)域數(shù)據(jù)對。其次,對每一個數(shù)據(jù)對采用基于深度神經(jīng)網(wǎng)絡(luò)模型的故障診斷遷移學(xué)習(xí)方法進(jìn)行模型訓(xùn)練,得到q個分類器,并利用生成的新目標(biāo)域數(shù)據(jù)進(jìn)行故障分類預(yù)測,得到q個預(yù)測結(jié)果。最后,通過采用加權(quán)集成的方式,對所有錨適配器對應(yīng)的分類器進(jìn)行集成,實(shí)現(xiàn)最終故障診斷模型的構(gòu)建,用于對目標(biāo)域數(shù)據(jù)進(jìn)行測試,獲得最終故障診斷結(jié)果。
選取凱斯西儲大學(xué)實(shí)驗(yàn)室[26]的軸承數(shù)據(jù)集作為試驗(yàn)數(shù)據(jù)對所提方法進(jìn)行驗(yàn)證,試驗(yàn)設(shè)置如圖4所示,主要由感應(yīng)電機(jī)、檢測軸承和加載電機(jī)組成,測試軸承支撐電機(jī)軸。采用電火花加工方法對電機(jī)軸承(6205-2RS JEM SKF)進(jìn)行了故障植入,分別內(nèi)圈、滾子元件和外圈處引入直徑0.177 8 mm、0.355 6 mm、0.533 4 mm、0.711 2 mm的單點(diǎn)故障。每個軸承在4種不同的負(fù)載(1 797 r/min,1 772 r/min,1 750 r/min,1 730 r/min)下測試。在驅(qū)動端附近的外殼上安裝了一個帶有磁吸式底座的加速度計來收集振動信號,采樣頻率為12 kHz。
圖4 軸承故障試驗(yàn)設(shè)置
分別采集4種不同工況下的數(shù)據(jù)對所提方法進(jìn)行驗(yàn)證,每一類工況下包含12類的數(shù)據(jù):正常,0.177 8 mm(滾子、內(nèi)圈、外圈(3點(diǎn)鐘方向、6點(diǎn)鐘方向));0.355 6 mm(滾子、內(nèi)圈、外圈(6點(diǎn)鐘方向));0.533 4 mm(滾子、內(nèi)圈、外圈(3點(diǎn)鐘方向、6點(diǎn)鐘方向))。每種工況下每一故障類別數(shù)據(jù)包含300個樣本,每個樣本是一個采集到的振動信號段,由400個樣本點(diǎn)組成,并通過傅里葉變換獲得頻域數(shù)據(jù),從頻域數(shù)據(jù)樣本中隨機(jī)選擇225個樣本作為訓(xùn)練數(shù)據(jù),其余75個樣本作為測試數(shù)據(jù),其數(shù)據(jù)具體劃分如表1所示。
表1 12類軸承數(shù)據(jù)描述
采用錨適配器集成與深度神經(jīng)網(wǎng)絡(luò)結(jié)合的多源域遷移學(xué)習(xí)方法進(jìn)行多工況下軸承故障診斷,采用模型網(wǎng)絡(luò)結(jié)構(gòu)為200-100-50-12,激活函數(shù)采用Sigmoid函數(shù),其網(wǎng)絡(luò)模型的學(xué)習(xí)率為0.02,相關(guān)參數(shù)如表2所示。此外,設(shè)置錨適配器的個數(shù)n為24,特征相似度的度量MMD的懲罰系數(shù)為2。
表2 DNN模型參數(shù)
3.2.1 單源域與多源域遷移結(jié)果對比分析
將4種不同負(fù)載(1 797 r/min,1 772 r/min,1 750 r/min,1 730 r/min)的軸承故障數(shù)據(jù)集標(biāo)記為(Hp0, Hp1, Hp2, Hp3)。將Hp0和Hp1同時作為源域,有標(biāo)簽,Hp2作為目標(biāo)域,無標(biāo)簽,進(jìn)行多種工況與單一工況遷移學(xué)習(xí)(Hp0→Hp2、Hp1→Hp2、Hp0-Hp1→Hp2)故障分類,采用所提方法進(jìn)行5次故障分類試驗(yàn),其余任務(wù)采用類似方式進(jìn)行同樣方式進(jìn)行故障分類,分類結(jié)果如表3和圖5所示。
從表3結(jié)果進(jìn)行對比分析,可以發(fā)現(xiàn)單一工況任務(wù)的遷移學(xué)習(xí)任務(wù),如Hp0→Hp3和Hp1→Hp3兩種任務(wù)的平均準(zhǔn)確率分別為0.917 3和0.984 8,而對于Hp0-Hp1→Hp3的準(zhǔn)確率可達(dá)0.997 3,其分類準(zhǔn)確率明顯高于Hp0、Hp1分別遷移到Hp3兩種單一工況遷移學(xué)習(xí)任務(wù);此外,通過圖5中可以看出除了任務(wù)C1之外的其他任務(wù)比較,兩種工況共同進(jìn)行遷移學(xué)習(xí)任務(wù)的分類準(zhǔn)確率明顯高于其中任意單一源域工況遷移到目標(biāo)域工況的任務(wù),其中,多工況遷移學(xué)習(xí)的分類精度相比于其中任意一種單一工況的遷移學(xué)習(xí)最高可提升8.78%;而且通過對比其他單一工況遷移學(xué)習(xí)和兩種工況共同遷移學(xué)習(xí)任務(wù)的分類精度變化趨勢可以看出多源域遷移學(xué)習(xí)模型的穩(wěn)定性明顯比較好。
表3 多源域深度遷移故障分類結(jié)果
圖5 單源域遷移與多源域遷移故障診斷結(jié)果對比圖
單源域遷移學(xué)習(xí)任務(wù)Hp0→Hp3和Hp1→Hp3以及多源域遷移學(xué)習(xí)任務(wù)Hp0-Hp1→Hp3的特征分布,如圖6所示。從圖6中任務(wù)Hp0→Hp3的特征分布可知,故障類別7、10沒有完全被區(qū)分,同樣從任務(wù)Hp1→Hp3的特征分布看出,故障類別5、7的部分樣本被誤分類到故障類別10中,導(dǎo)致任務(wù)Hp0→Hp3和Hp1→Hp3的精度不足;然而從任務(wù)Hp0-Hp1→Hp3的特征分布可以看出,12種故障深度特征完全被區(qū)分,使得任務(wù)Hp0-Hp1→Hp3的分類準(zhǔn)確率率明顯高于對應(yīng)的單源域遷移學(xué)習(xí)任務(wù)。因此,結(jié)合錨適配器集成和深度神經(jīng)網(wǎng)絡(luò)的多源域遷移學(xué)習(xí)故障診斷方法能夠從不同工況源域數(shù)據(jù)中綜合考慮多種工況下的故障特征信息,可以學(xué)習(xí)到較為穩(wěn)定的域不變特征,進(jìn)而對于目標(biāo)域工況獲得比較好的分類性能,提高模型精度。
(a)Hp0→Hp3
3.2.2 與其他遷移學(xué)習(xí)方法對比分析
為了更客觀地測試所提方法的性能,與其他遷移學(xué)習(xí)方法進(jìn)行對比來證明本文所提方法在故障診斷方面具有更好的穩(wěn)定性和準(zhǔn)確率。這些方法主要包括:遷移成分分析(transfer component analysis, TCA)、聯(lián)合分布適應(yīng)方法(joint distribution adaptation, JDA)、平衡分布適應(yīng)方法(balanced distribution adaptation, BDA)、公共關(guān)系對齊方法(co-relation alignment, CORAL),這些方法的主要參數(shù)描述如表4所示。
表4 不同方法的主要參數(shù)
此外,并與基于卷積神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí)網(wǎng)絡(luò)(deep convolutional transfer learning network, DCTLN)[27]和域?qū)股窠?jīng)網(wǎng)絡(luò)(domain adversarial neural networks, DANN)[28]兩種方法的診斷結(jié)果對比分析。利用以上6種遷移學(xué)習(xí)方法進(jìn)行同樣的12類多源域遷移學(xué)習(xí)故障診斷任務(wù),不同方法在12類任務(wù)上的分類結(jié)果準(zhǔn)確率如表5和圖7所示。
從表5的對比結(jié)果可知,基于多源域深度遷移學(xué)習(xí)故障診斷模型相比于其他方法在12個不同的遷移學(xué)習(xí)故障診斷任務(wù)上具有最好的分類性能,并且該方法的在12個不同任務(wù)的平均準(zhǔn)確率為0.994 5,而TCA、JDA、BDA、CORAL、DTCLN和DANN的平均準(zhǔn)確率分別為0.872 7,0.903 3,0.894 1,0.859 8,0.941 3和0.957 9,通過對比可以看出該方法明顯比其他6種遷移學(xué)習(xí)方法的性能好。此外,根據(jù)對比標(biāo)準(zhǔn)差分析以及圖6可知,其他6種方法在不同的任務(wù)上性能表現(xiàn)不是很穩(wěn)定,尤其是BDA,BDA的標(biāo)準(zhǔn)差為0.051 7,從圖7中也可知對于不同任務(wù)其性能波動最大。然而本文方法在12個任務(wù)上的標(biāo)準(zhǔn)差為0.003 8,明顯比其他方法小,從圖7可知其性能波動較小,進(jìn)一步說明該方法在不同的任務(wù)能夠呈現(xiàn)出較好的穩(wěn)定性,具有較好的泛化能力。
表5 不同遷移學(xué)習(xí)方法對于多源域故障診斷的準(zhǔn)確率
圖7 不同方法故障診斷準(zhǔn)確率對比圖
以多源域遷移學(xué)習(xí)任務(wù)Hp0-Hp1→Hp3為例,進(jìn)行其他對比方法TCA、JDA、BDA、CORAL、DTCNN和DANN在該任務(wù)上的特征分布可視化,如圖8所示。
從圖8可知,TCA、JDA、BDA和CORAL相比于DTCNN和DANN,對于可判別特征學(xué)習(xí)能力較差,進(jìn)而可以從表5和圖7可知TCA、JDA、BDA和CORAL在多源域遷移學(xué)習(xí)任務(wù)上的故障診斷效果沒有DTCNN和DANN效果好。盡管DTCNN和DANN有較好的特征學(xué)習(xí)能力,與本文方法在任務(wù)Hp0-Hp1→Hp3上特征分布圖6(c)相比,在域不變特征學(xué)習(xí)能力方面仍然不足。
對比圖6(c)和圖8可以可看出,本文方法可以從多個域中提取可判別的域不變特征,進(jìn)而導(dǎo)致本文方法相比于其他不同方法在任務(wù)Hp0-Hp1→Hp3上具有較好的故障診斷精度。
(a)TCA
針對單源域遷移學(xué)習(xí)出現(xiàn)的負(fù)遷移和泛化能力差的問題,提出了基于多源域深度遷移學(xué)習(xí)的機(jī)械故障診斷方法,并通過滾動軸承數(shù)據(jù)集驗(yàn)證所提方法的有效性。主要結(jié)論如下:
(1)結(jié)合錨適配集成和深度神經(jīng)網(wǎng)絡(luò)的多源域深度遷移學(xué)習(xí)故障診斷方法,集成了滾動軸承多源域數(shù)據(jù)的故障信息,更好地從源域數(shù)據(jù)中學(xué)習(xí)公共的域不變故障特征信息。通過滾動軸承故障診斷案例分析,多源域遷移學(xué)習(xí)相比于其中的任意單源域遷移學(xué)習(xí)有較好的診斷效果,最高可提升8.78%。
(2)與其他方法相比,本文所提方法對于不同的多源域遷移學(xué)習(xí)方法具有較好的穩(wěn)定性和診斷效果,提高了模型的泛化能力,為機(jī)械故障診斷提供一種新的途徑。