王志超,徐 江,劉維鴿,楊延西,史雯雯
(1.中國重型機(jī)械研究院股份公司,陜西 西安 710018;2.西安理工大學(xué)自動化與信息工程學(xué)院,陜西 西安 710048)
旋轉(zhuǎn)機(jī)械在工業(yè)生產(chǎn)中發(fā)揮著重要作用,如帶鋼冷軋線、帶鋼酸洗線、帶鋼彩涂線等都存在多個轉(zhuǎn)動軸承,都屬于旋轉(zhuǎn)機(jī)械的范疇,在工業(yè)生產(chǎn)中應(yīng)用廣泛。旋轉(zhuǎn)機(jī)械普遍運(yùn)行在惡劣的工作環(huán)境下并且長期處于高速旋轉(zhuǎn),極易發(fā)生損壞。一旦某個旋轉(zhuǎn)機(jī)械零部件故障失靈,很有可能導(dǎo)致整體加工系統(tǒng)的損壞,甚至威脅操作人員的安全。目前,針對這類易損零部件,大多工廠車間都是采用定期維護(hù)的策略來預(yù)防故障的發(fā)生,實(shí)際效果也不盡理想。況且,一些旋轉(zhuǎn)機(jī)械安裝在一些大型設(shè)備的內(nèi)部,其拆卸與安裝都十分麻煩,對其檢修一次可能會耽誤數(shù)小時的生產(chǎn),對生產(chǎn)計劃有很大影響。因此,了解旋轉(zhuǎn)機(jī)械的故障機(jī)理,掌握故障發(fā)生的規(guī)律,提出科學(xué)有效且經(jīng)濟(jì)可行的運(yùn)維策略是十分必要的。
在現(xiàn)有的大多數(shù)數(shù)據(jù)驅(qū)動的智能故障診斷方法中,一個重要前提是訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)同分布,而在實(shí)際工業(yè)中,由于機(jī)器工況的變化、環(huán)境噪聲的干擾、軸承質(zhì)量等因素,訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)的分布通常存在差異,導(dǎo)致診斷性能顯著下降,需要建立具有較強(qiáng)泛化性能的故障診斷模型,以適應(yīng)不同工況的場景。遷移學(xué)習(xí)為解決這類問題提供了新的思路,可以將相關(guān)領(lǐng)域?qū)W到的知識進(jìn)行遷移,以幫助提高訓(xùn)練數(shù)據(jù)較少的目標(biāo)任務(wù)的學(xué)習(xí)性能,放松了源數(shù)據(jù)集和目標(biāo)數(shù)據(jù)集必須具有相同的分布的假設(shè),以減少重新收集足夠大的訓(xùn)練數(shù)據(jù)的需要。因此,本文主要以滾動軸承的故障診斷為主要研究內(nèi)容,以深度學(xué)習(xí)框架中的卷積神經(jīng)網(wǎng)絡(luò)作為基礎(chǔ)網(wǎng)絡(luò)框架,結(jié)合遷移學(xué)習(xí)方法構(gòu)建模型進(jìn)行軸承故障診斷,對滾動軸承智能故障診斷的發(fā)展具有重要促進(jìn)意義。
針對全監(jiān)督情況固定工況下基于卷積神經(jīng)網(wǎng)絡(luò)的滾動軸承故障診斷,提出的模型可以實(shí)現(xiàn)較高的準(zhǔn)確率,噪聲干擾下也有著較好的魯棒性。然而在許多實(shí)際應(yīng)用中,某些工況下的樣本由于客觀條件的限制可能很難采集,大量的訓(xùn)練樣本可能來自某個特定工況。除此之外,軸承的運(yùn)行狀態(tài)參量——載荷和速度,也會隨著時間和空間的變化而變化,導(dǎo)致軸承的訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)工況不同。因此需要用某個工況訓(xùn)練的模型可以有效地對其他工況的樣本進(jìn)行故障狀態(tài)判別。由于工作條件的不同,測試數(shù)據(jù)的分布可能與訓(xùn)練數(shù)據(jù)的分布不一致。而基于深度學(xué)習(xí)的“端到端”模型不僅需要大量標(biāo)記數(shù)據(jù),且要求訓(xùn)練數(shù)據(jù)集與測試數(shù)據(jù)集同分布。因此基于卷積神經(jīng)網(wǎng)絡(luò)的模型已不能滿足此類情況的需求,診斷性能會降低。另外,有標(biāo)簽的數(shù)據(jù)在某些機(jī)器上很難獲得,如果要對某一工況下的數(shù)據(jù)進(jìn)行故障診斷,通常只能采集到少量無標(biāo)簽數(shù)據(jù)。手動標(biāo)記數(shù)據(jù)和從頭開始構(gòu)建一個模型都是復(fù)雜而耗時的。
由于基于卷積神經(jīng)網(wǎng)絡(luò)的模型已不能滿足某些工況的需求,且診斷性能低,數(shù)據(jù)采集困難等,需要通過遷移學(xué)習(xí)的方法對模型和帶有標(biāo)簽的數(shù)據(jù)進(jìn)行重用。因此本文在深度卷積神經(jīng)網(wǎng)絡(luò)模型中引入了遷移學(xué)習(xí),提出了一種多尺度卷積聯(lián)合適配對抗網(wǎng)絡(luò),來有效解決變工況情景下的故障診斷問題。通過對不同的遷移學(xué)習(xí)算法進(jìn)行分析,設(shè)計了故障診斷模型,并進(jìn)行實(shí)驗(yàn)對模型進(jìn)行了驗(yàn)證。在進(jìn)行實(shí)驗(yàn)時,專門研究了比較壞的一種情況,即目標(biāo)域?yàn)闊o標(biāo)簽數(shù)據(jù),該探索對于無標(biāo)簽數(shù)據(jù)智能故障診斷的發(fā)展具有重要意義。
遷移學(xué)習(xí)方法多種多樣,其核心思路就是通過利用已有樣本、參數(shù)或特征,使用已有領(lǐng)域知識來完成目標(biāo)領(lǐng)域知識的學(xué)習(xí)。其中,基于實(shí)例的遷移學(xué)習(xí)方法當(dāng)某些特征是源(目標(biāo))域特定使用時,重新加權(quán)樣本不能減少域差異,適用于源域和目標(biāo)域相似度較高的情況。基于模型的遷移學(xué)習(xí)方法所遷移的知識被編碼到模型參數(shù)、模型先驗(yàn)知識、模型架構(gòu)等模型層次上,不過其大多假設(shè)目標(biāo)域是有標(biāo)簽的樣本。基于特征的遷移學(xué)習(xí)算法可以應(yīng)用在域間相似度不太高甚至不相似的情況??紤]到本文研究的是半監(jiān)督變工況條件下的軸承故障診斷,因此決定采用基于特征的遷移學(xué)習(xí)算法,將來自源域和目標(biāo)域的數(shù)據(jù)映射到共同的特征空間,通過距離度量將域差異最小化。然后使用映射之后的源域和目標(biāo)域數(shù)據(jù)在新的特征空間上訓(xùn)練目標(biāo)分類器。
基于特征的遷移學(xué)習(xí)重點(diǎn)就是要找到一個距離度量準(zhǔn)則,這是量化遷移學(xué)習(xí)中兩域差異的重要手段,可以用來衡量源域和目標(biāo)域的相似性。選擇一個好的度量準(zhǔn)則對于遷移學(xué)習(xí)模型的訓(xùn)練至關(guān)重要,不僅可以很好地度量源域和目標(biāo)域間的差異,量化兩域的相似程度,還要能夠作為準(zhǔn)則,在進(jìn)行遷移訓(xùn)練時可以利用方法或模型對該度量進(jìn)行優(yōu)化,以增加源域目標(biāo)域的相似性,從而完成遷移學(xué)習(xí)。本文模型用到了特征遷移學(xué)習(xí)中的JMMD距離,后續(xù)對比實(shí)驗(yàn)用到MK-MMD距離及CORAL。
許多研究人員通過最大均值差異(Maximum Mean Discrepancy,MMD)來減小域差異,MMD最早在文獻(xiàn)[1]中提出,并被許多其他研究人員用于遷移學(xué)習(xí)??梢杂米骱饬績蓚€數(shù)據(jù)分布差異的度量準(zhǔn)則,MMD的主要思想是當(dāng)兩個數(shù)據(jù)的分布線性不可分時,將數(shù)據(jù)映射到一個高維空間中,然后在此空間衡量兩個數(shù)據(jù)分布的差異。MMD在計算兩數(shù)據(jù)分布差異時引入了核函數(shù),可以解決數(shù)據(jù)在高維空間難以計算的問題,在遷移學(xué)習(xí)領(lǐng)域應(yīng)用廣泛。
再生核希爾伯特空間(RKHS)中定義的MMD算法就是求得兩數(shù)據(jù)集在高維空間的均值差異,具體公式為
(1)
式中,xi為數(shù)據(jù)集X的第i個樣本;yj為數(shù)據(jù)集Y的第j個樣本;n為數(shù)據(jù)集X的樣本個數(shù);m為數(shù)據(jù)集Y的樣本個數(shù);φ(·)為到高維空間的映射函數(shù);H為距離,是由φ(·)將數(shù)據(jù)映射到RKHS中進(jìn)行度量的。
MMD的關(guān)鍵在于如何找到一個合適的φ(·)作為一個映射函數(shù)。但是這個映射函數(shù)在不同的任務(wù)中都不是固定的,所以是很難去選取或者定義的。如果不能知道φ(·),MMD的求解步驟如下,首先對式(1)的平方進(jìn)行分解,可以得到:
(2)
MMD的目標(biāo)函數(shù)中含有類似內(nèi)積的計算,這可以聯(lián)想到SVM中核函數(shù)的定義:
k(x,y)=φ(x)·φ(y)
若將核函數(shù)引入MMD的目標(biāo)函數(shù)中,可以避免內(nèi)積無法計算的問題,則可以表示如下:
考慮到高斯核函數(shù)可以把數(shù)據(jù)映射到無窮維空間,因此通常選用高斯核作為核函數(shù)。高斯核函數(shù)的定義為
k(x,x′)=exp(-‖x-x″‖2/(2σ2))
式中,βu不同核的加權(quán)參數(shù)(本文βu=1)。
CORAL即相關(guān)對齊算法,也可以作為一種度量準(zhǔn)則,描述兩個數(shù)據(jù)間的分布差異。核心思想是先計算出源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)的協(xié)方差,隨后白化并重著色源域數(shù)據(jù)的協(xié)方差,通過調(diào)整網(wǎng)絡(luò)參數(shù),使得兩域數(shù)據(jù)分布的協(xié)方差損失最小,從而使源域和目標(biāo)域分布的二階統(tǒng)計數(shù)據(jù)保持一致。此方法的思想比較簡單,旨在對齊數(shù)據(jù)的二階特征,而最大均值差異是將數(shù)據(jù)映射到高維空間,對齊數(shù)據(jù)的一階特征。CORAL不用再進(jìn)行進(jìn)行核函數(shù)的選擇,對源域和目標(biāo)域進(jìn)行的非對稱變換,而最大均值差異對兩個數(shù)據(jù)域進(jìn)行的是同一種核函數(shù)的變換。CORAL算法具體定義如下:
(3)
式中,Cs為源域數(shù)據(jù)的協(xié)方差矩陣;Ct為目標(biāo)域數(shù)據(jù)的協(xié)方差矩陣; ‖‖F(xiàn)為范數(shù),用來衡量兩個矩陣的距離。
由式(3)可以知道,如果要使目標(biāo)函數(shù)最小,需要尋找到一個矩陣,當(dāng)其對應(yīng)的線性變換作用于源域時,目標(biāo)函數(shù)值可以盡可能地小,從而源域和目標(biāo)域數(shù)據(jù)的二階統(tǒng)計特征差異達(dá)到最小。在傳統(tǒng)機(jī)器學(xué)習(xí)的跨域遷移中可以直接使用CORAL算法,但對于深度學(xué)習(xí)網(wǎng)絡(luò)來說,網(wǎng)絡(luò)每一層都是對輸入數(shù)據(jù)進(jìn)行卷積、激活或者池化后的特征表示,因此無法獲得矩陣的值。針對這一問題,文獻(xiàn)[4]提出了Deep CORAL算法,對原始CORAL算法進(jìn)行了改進(jìn),使得CORAL算法可以應(yīng)用于深度學(xué)習(xí)網(wǎng)絡(luò),進(jìn)行深度遷移學(xué)習(xí)模型的訓(xùn)練。CORAL損失定義為源域目標(biāo)域特征的二階協(xié)方差距離,用式(4)表示。
(4)
式中,d為每個樣本的維數(shù)。
源域數(shù)據(jù)的協(xié)方差矩陣Cs和目標(biāo)域數(shù)據(jù)的協(xié)方差矩陣Ct分別按照式計算得到:
式中,Xs為源域訓(xùn)練樣本;Xt為目標(biāo)域訓(xùn)練樣本;ns為源域訓(xùn)練樣本個數(shù);nt為目標(biāo)域訓(xùn)練樣本個數(shù);1為元素均等于1的列向量。
利用微積分的鏈?zhǔn)角髮?dǎo)法可以輸入特征的梯度進(jìn)行計算,計算方法如下:
通常深度神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)會經(jīng)過多層的特征變換和抽象,提取到的特征隨著網(wǎng)絡(luò)層數(shù)的增加逐漸從一般特征過渡到具體特征,以此學(xué)習(xí)輸入數(shù)據(jù)的特征與輸出標(biāo)簽之間的復(fù)雜映射關(guān)系。最大均值差異已經(jīng)被廣泛用于衡量源域邊緣分布和目標(biāo)域邊緣分布的差異,由于聯(lián)合分布不容易于操作和匹配,MMD或者M(jìn)KMMD還不能解決此類問題。所以當(dāng)輸入數(shù)據(jù)與輸出數(shù)據(jù)的聯(lián)合分布發(fā)生變化時,如何有效地進(jìn)行遷移學(xué)習(xí)是一個難點(diǎn)。另外當(dāng)源域和目標(biāo)域的差異增大時,數(shù)據(jù)特征和分類器的可遷移性會極大地降低,也不利于遷移學(xué)習(xí)模型的訓(xùn)練。為解決問題, 而定義的MMD和MK-MMD不能用于解決由輸入和輸出的聯(lián)合分布,聯(lián)合最大均值差異(JMMD)被設(shè)計為測量源域和目標(biāo)域之間的經(jīng)驗(yàn)聯(lián)合分布差異??紤]到在把源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)輸入深度神經(jīng)網(wǎng)絡(luò)后,即使經(jīng)過多層特征變換和抽象,源域聯(lián)合分布和目標(biāo)域聯(lián)合分布的變化仍然會停留在多個域特定高層的網(wǎng)絡(luò)激活中。因此,可以使用這些域特定層的激活的聯(lián)合分布來近似推出原始的聯(lián)合分布,從而實(shí)現(xiàn)源域和目標(biāo)域的域適應(yīng)。JMMD為希爾伯特空間中兩個聯(lián)合分布的差異,具體定義為
由于在深度卷積神經(jīng)網(wǎng)絡(luò)中,多個域特定層中網(wǎng)絡(luò)激活的聯(lián)合分布的變化與輸入數(shù)據(jù)的特征與輸出標(biāo)簽的聯(lián)合分布的變化相似。因此JMMD可以通過測量源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)的經(jīng)驗(yàn)聯(lián)合分布的核平均嵌入之間的希爾伯特-施密特范數(shù)(Hilbert-Schmidt Norm),來對齊多個域特定層的激活的聯(lián)合分布。
JMMD經(jīng)驗(yàn)估計值可以表示為經(jīng)驗(yàn)核平均嵌入之間的平方距離,
式中,ns為源域樣本數(shù)量;nt為目標(biāo)域樣本數(shù)量;L為適配的總層數(shù)。
不同工況下進(jìn)行軸承故障診斷,源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)差異性增大,因此比起固定工況下診斷難度更大。針對此場景提出了一種多尺度卷積聯(lián)合適配對抗網(wǎng)絡(luò)(MSCJACN),通過縮小兩域數(shù)據(jù)間的分布差異,使得源域訓(xùn)練的模型可以很好地遷移到目標(biāo)域。提出的MSCJACN模型框架由故障識別和域自適應(yīng)兩大模塊組成,模型總體框架如圖1所示。
(1)故障識別。故障識別模塊包括特征提取器和故障狀態(tài)分類器兩部分,通過一維多尺度卷積神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)。具體網(wǎng)絡(luò)參數(shù)見表1。包括一個輸入層,一個多尺度特征融合層、四層卷積池化層,兩個全連接層和一個Softmax輸出層。Softmax層之前為特征提取器,Softmax層為故障狀態(tài)分類器。特征提取器試圖從原始輸入信號中自動學(xué)習(xí)故障特征。故障狀態(tài)分類器基于提取的特征來識別軸承故障類型,并且在對網(wǎng)絡(luò)進(jìn)行訓(xùn)練時,損失函數(shù)會依據(jù)源域輸入的真實(shí)標(biāo)簽和分類器的預(yù)測輸出計算誤差,然后將誤差進(jìn)行反向傳播來訓(xùn)練網(wǎng)絡(luò)。故障狀態(tài)分類器使得網(wǎng)絡(luò)可以利用有標(biāo)簽的源域數(shù)據(jù)進(jìn)行有監(jiān)督訓(xùn)練,以提高分類準(zhǔn)確性。
表1 一維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)
(2)域自適應(yīng)。域自適應(yīng)模塊由聯(lián)合分布適配器和域判別器組成,域自適應(yīng)模塊連接到故障識別模塊的特征提取器,來幫助一維CNN學(xué)習(xí)域不變特征。學(xué)習(xí)域不變特征意味著,無論從中學(xué)習(xí)源域數(shù)據(jù)還是目標(biāo)域數(shù)據(jù),這些特征都應(yīng)服從相同或幾乎相同的分布。如果特征是領(lǐng)域不變的,則使用源領(lǐng)域數(shù)據(jù)訓(xùn)練的健康狀況分類器能夠有效地對從目標(biāo)領(lǐng)域數(shù)據(jù)中學(xué)到的特征進(jìn)行分類。
聯(lián)合分布適配器用來對網(wǎng)絡(luò)高層提取的具體特征進(jìn)行適配。前面已經(jīng)對深度神經(jīng)網(wǎng)絡(luò)的可遷移性進(jìn)行了分析,低層網(wǎng)絡(luò)提取的是通用特征,高層網(wǎng)絡(luò)提取的是具體特征,高層中特征的可遷移性低,因此需要對高層的特征進(jìn)行適配,在網(wǎng)絡(luò)最后兩個全連接層上添加適配網(wǎng)絡(luò),使用聯(lián)合最大均值差異(JMMD)來減小源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)的分布距離。
域判別器采用了對抗學(xué)習(xí)的思想,用來判斷輸入的訓(xùn)練樣本是源域樣本還是目標(biāo)域樣本,同時計算域判別損失。在特征提取器和域判別器之間添加一個特殊的梯度反轉(zhuǎn)層(GRL),使得特征提取器和域判別器的訓(xùn)練目標(biāo)相反,從而形成一種對抗關(guān)系。在反向傳播更新參數(shù)的過程中,域判別器的訓(xùn)練目標(biāo)是盡可能地將輸入的訓(xùn)練樣本分到其所屬的域。由于GRL的存在,特征提取器的訓(xùn)練目標(biāo)是使域判別器不能正確判斷輸入的訓(xùn)練樣本來自哪一個域。當(dāng)域判別器不能正確區(qū)分源域樣本和目標(biāo)域樣本時,特征提取器的任務(wù)就完成了。此時,在某個空間內(nèi)源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)已經(jīng)被混合在一起了,即源域和目標(biāo)有了相同或相似的分布。MSCJACN使用了兩層完全連接的二進(jìn)制分類器作為域判別器,第一層全連接層后的特征經(jīng)過ReLU激活之后,采用Dropout進(jìn)行隨機(jī)丟棄,再經(jīng)過一層全連接層,最終提取的特征傳遞到最后的Softmax層,Softmax輸出層具有2個神經(jīng)元判斷輸入的訓(xùn)練樣本是源域樣本還是目標(biāo)域樣本。
為了使得源域訓(xùn)練的模型能夠很好地遷移到目標(biāo)域,本文提出的MSCJACN網(wǎng)絡(luò)模型具有三個優(yōu)化對象。
(1)最小化源域數(shù)據(jù)集上的故障狀態(tài)分類錯誤。為了完成遷移故障診斷,MSCJACN應(yīng)該能夠識別軸承的健康狀況并學(xué)習(xí)域不變特征。故障識別模塊旨在識別機(jī)器的健康狀況。因此,MSCJACN的第一個優(yōu)化目標(biāo)是最小化源域數(shù)據(jù)上的健康狀況分類錯誤。對于具有健康狀況類別的數(shù)據(jù)集,其目標(biāo)函數(shù)采用交叉熵?fù)p失函數(shù)為
式中,Gf為是參數(shù)為θf的特征提取器;Gc為是參數(shù)為θc的類預(yù)測器。
因此,目標(biāo)一的優(yōu)化目標(biāo)為
ψ1=minL1(θf,θc)
(2)最小化源和目標(biāo)域數(shù)據(jù)集之間的JMMD距離。域適應(yīng)模塊旨在學(xué)習(xí)域不變特征。域適應(yīng)模塊包括分布差異度量和域分類器。高級特征直接影響遷移故障診斷的有效性。為了減小從不同域?qū)W習(xí)到的特征之間的分布差異距離,采用聯(lián)合分布適配器直接測量兩域之間的分布差異距離。因此,MSCJACN的第二個優(yōu)化目標(biāo)是使源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù)之間的聯(lián)合分布差異距離JMMD最小。為了計算高級學(xué)習(xí)特征在不同域之間的分布距離,JMMD損失為
因此,目標(biāo)二的優(yōu)化目標(biāo)為
ψ2=minL2
(3)最大化源和目標(biāo)域的域分類錯誤。如圖1所示,域分類器與特征提取器連接。如果域分類器無法區(qū)分源域和目標(biāo)域之間的特征,則特征是域不變的。因此,MSCJACN的第三個優(yōu)化目標(biāo)是最大化源和目標(biāo)域數(shù)據(jù)上的域分類誤差。域分類損失采用二分類交叉熵?fù)p失函數(shù):
因此,目標(biāo)三的優(yōu)化目標(biāo)為
ψ3=maxL3(θf,θd)
最終的目標(biāo)損失函數(shù)可以寫成
L=L1(θf,θc)+λL2-μL3(θf,θd)
式中,λ為JMMD損失L2的懲罰系數(shù);μ為域分類損失L3的懲罰系數(shù)。
因此,最終的網(wǎng)絡(luò)優(yōu)化目標(biāo)為
ψ=minL=min{L1(θf,θc)+λL2-μL3(θf,θd)}
圖1 多尺度卷積聯(lián)合適配對抗網(wǎng)絡(luò)(MSCJACN)框架圖
依舊采用CWRU數(shù)據(jù)集對實(shí)驗(yàn)?zāi)P瓦M(jìn)行驗(yàn)證,如表2所示,數(shù)據(jù)集是在四個不同的電動機(jī)負(fù)載(0HP,1HP,2HP和3HP)下采集,分別對應(yīng)于四個不同的運(yùn)行速度(1 797 r/min、1 772 r/min、1 750 r/min和1 730 r/min)。對于遷移學(xué)習(xí)任務(wù),將這些不同的工作條件視為不同的遷移學(xué)習(xí)任務(wù),因此仍然將CWRU軸承數(shù)據(jù)集分為四個子數(shù)據(jù)集,包括數(shù)據(jù)集A、B、C和D。在不同的數(shù)據(jù)集之間進(jìn)行遷移故障診斷,任務(wù)A→B表示源域是電機(jī)負(fù)載等于0 HP的數(shù)據(jù),而目標(biāo)域是電動機(jī)負(fù)載等于1 HP的數(shù)據(jù)。因此,此數(shù)據(jù)集中總共有十二種遷移學(xué)習(xí)設(shè)置。
表2 CWRU軸承數(shù)據(jù)集
負(fù)載不同,加速度傳感器采集的信號也會有差異。如圖2所示,是故障尺寸為0.007 inch對應(yīng)的四種負(fù)載(0HP,1HP,2HP和3HP)下的外圈故障信號,可以看出在負(fù)載不同時,信號的幅值、相位及波動周期也具有較大差異。因此變負(fù)載情況下的故障診斷比固定工況下的故障診斷更具難度。
圖2 四種負(fù)載下的軸承外圈故障信號
變工況診斷一般應(yīng)用場景的限制是源域有充足的帶標(biāo)簽數(shù)據(jù),而目標(biāo)域只有少量的無標(biāo)簽數(shù)據(jù),為了使得源域訓(xùn)練的模型遷移到目標(biāo)域,可以實(shí)現(xiàn)對目標(biāo)域數(shù)據(jù)故障狀態(tài)的準(zhǔn)確判別,需要對此場景進(jìn)行準(zhǔn)確模擬。因此在構(gòu)建數(shù)據(jù)集時,應(yīng)該對源域數(shù)據(jù)集進(jìn)行增強(qiáng),目標(biāo)域數(shù)據(jù)集不需要增強(qiáng),并且源域數(shù)據(jù)帶標(biāo)簽,目標(biāo)域數(shù)據(jù)不帶標(biāo)簽。以數(shù)據(jù)集A為源域,數(shù)據(jù)集B為目標(biāo)域舉例。采用滑動窗口對數(shù)據(jù)集A的樣本數(shù)據(jù)進(jìn)行重疊采樣來擴(kuò)充數(shù)據(jù),每個數(shù)據(jù)集的每種故障類型的樣本取固定長度120 000,按照樣本長度為1 024,采樣間隔為132去采樣,可得到每個數(shù)據(jù)集每種故障類別的樣本數(shù)為902,數(shù)據(jù)集A中有十種故障類別,取80%作為訓(xùn)練數(shù)據(jù),20%作為測試數(shù)據(jù),因此數(shù)據(jù)集A的訓(xùn)練集=902×10×80%=7 216,數(shù)據(jù)集A的測試集=900×10×20%=1 804。數(shù)據(jù)集B不需要進(jìn)行數(shù)據(jù)擴(kuò)充,就按照樣本長度1024去采樣,可得到每個數(shù)據(jù)集每種類別的樣本數(shù)為117,同樣80%作為訓(xùn)練數(shù)據(jù),20%作為測試數(shù)據(jù),最終數(shù)據(jù)集B的訓(xùn)練集=117×10×80%=936,測試集=117×10×20%=234。其他的遷移學(xué)習(xí)設(shè)置數(shù)據(jù)集構(gòu)建方式和上述舉例一樣,作為源域的數(shù)據(jù)訓(xùn)練集大小為7 216,測試集大小為1 804,作為目標(biāo)域的數(shù)據(jù)訓(xùn)練集大小為936,測試集大小為234。最終構(gòu)建的數(shù)據(jù)集如表3所示。
表3 實(shí)驗(yàn)數(shù)據(jù)劃分
實(shí)驗(yàn)平臺在Python3.7.10+Pytorch1.3.1上搭建模型并進(jìn)行實(shí)驗(yàn)。模型迭代周期epoch設(shè)置為60。前30 epoch先利用數(shù)據(jù)量充足的帶標(biāo)簽源域樣本訓(xùn)練網(wǎng)絡(luò),此時網(wǎng)絡(luò)的目標(biāo)函數(shù)只有交叉熵?fù)p失函數(shù),得到預(yù)訓(xùn)練模型。第30 epoch激活遷移學(xué)習(xí)策略,網(wǎng)絡(luò)中同時輸入帶標(biāo)簽源域數(shù)據(jù)和無標(biāo)簽?zāi)繕?biāo)域數(shù)據(jù),此時網(wǎng)絡(luò)的目標(biāo)函數(shù)為交叉熵?fù)p失函數(shù)、JMMD損失及域分類損失三部分,對預(yù)訓(xùn)練模型的參數(shù)進(jìn)行微調(diào)。訓(xùn)練時采用小批量的Adam算法來進(jìn)行反向傳播,每批大小batch_size設(shè)置為64。初始學(xué)習(xí)率設(shè)置為0.001,并分別在第40 epoch和50 epoch中衰減,即學(xué)習(xí)率乘以0.1。JMMD損失和域分類損失的懲罰系數(shù)和采用漸進(jìn)式訓(xùn)練,使用公式從0增加到1, 表示從0變?yōu)?的訓(xùn)練進(jìn)度。達(dá)到最大迭代周期,即可得到最終的故障診斷模型,可對不同工況的目標(biāo)域數(shù)據(jù)進(jìn)行故障類別診斷,具體診斷框圖如圖3所示。
圖3 基于MSCJACN的軸承故障診斷框圖
為了驗(yàn)證本文提出的MSCJACN網(wǎng)絡(luò)在變工況場景故障診斷的有效性,將本文模型與MS-1DCNN模型,在12種遷移任務(wù)下進(jìn)行實(shí)驗(yàn)?zāi)P停瑧?yīng)用于CWRU數(shù)據(jù)集。最終測試集的診斷結(jié)果如圖4。
圖4 MSCJACN與MS-1DCNN在12種遷移任務(wù)上的診斷結(jié)果對比
本文模型和僅由源數(shù)據(jù)訓(xùn)練的MS-1DCNN之間的唯一區(qū)別是,在本文模型中添加了域自適應(yīng)模塊,而結(jié)果表明,本文的MSCJACN比僅由源數(shù)據(jù)訓(xùn)練的MS-1DCNN具有更高的分類精度??梢钥闯鯩SCJACN在加入域自適應(yīng)模塊后,在變工況場景診斷精度仍然很高,而沒加遷移學(xué)習(xí)的MS-1DCNN模型診斷性能不穩(wěn)定,且識別精度都低于MSCJACN。尤其在工況差距比較大時,MS-1DCNN模型診斷性能大大降低,比如D→A的遷移,診斷準(zhǔn)確率只有73.4%,而MSCJACN依然可以達(dá)到約95.7%的識別率。這意味著,遷移學(xué)習(xí)可能是促進(jìn)具有未標(biāo)記數(shù)據(jù)的機(jī)器的智能故障診斷成功應(yīng)用的有前途的工具。
為了進(jìn)一步證實(shí)本文提出的模型在變工況遷移故障診斷時的優(yōu)越性,把本文模型的域自適應(yīng)部分替換為其他經(jīng)典的遷移學(xué)習(xí)方法。如圖5所示,構(gòu)建的模型只有域自適應(yīng)部分不同,故障識別部分的結(jié)構(gòu)相同。即JMMD+域判別器、多核最大均值差異MK-MMD、相關(guān)對齊算法CORAL。三種方法在12種遷移學(xué)習(xí)任務(wù)上的結(jié)果如表4所示,將此結(jié)果繪制成折線圖如圖6所示。
圖5 不同的域自適應(yīng)模塊
圖6 三種域自適應(yīng)模塊在12種遷移任務(wù)上的診斷結(jié)果
表4 不同的域自適應(yīng)模塊在12種遷移任務(wù)上的診斷結(jié)果
從實(shí)驗(yàn)結(jié)果可以看出,本文提出的JMMD+域判別器的方式比起其他遷移學(xué)習(xí)方法在遷移故障診斷上更具優(yōu)勢,并且診斷效果依次為:JMMD+域判別器最優(yōu),其次是MK-MMD,最后是CORAL。JMMD+域判別器的方式最高可以達(dá)到百分之百識別正確,在D→A識別效果最差,但也可以達(dá)到95.7%識別準(zhǔn)確,而MK-MMD只有88.46%,CORAL只有82.48%。
針對變工況故障診斷問題,在深度學(xué)習(xí)框架中引入了遷移學(xué)習(xí),提出了一種多尺度卷積聯(lián)合適配對抗網(wǎng)絡(luò)(MSCJACN),通過縮小兩域數(shù)據(jù)間的分布差異,使得源域訓(xùn)練的模型可以很好地遷移到目標(biāo)域,可有效解決目標(biāo)域可用訓(xùn)練樣本不足的問題。并且專門針對比較壞的一種情況,即目標(biāo)域只有少量的無標(biāo)簽數(shù)據(jù),在12組遷移學(xué)習(xí)任務(wù)上進(jìn)行實(shí)驗(yàn),均達(dá)到了很高的準(zhǔn)確率。與其他遷移學(xué)習(xí)方法進(jìn)行對比實(shí)驗(yàn),MSCJACN的性能表現(xiàn)也更優(yōu)。