彭 博,張 毅,蹇清平,于 翔
(1.成都工業(yè)職業(yè)技術(shù)學(xué)院,四川 成都 610218;2.西南石油大學(xué)機(jī)電工程學(xué)院,四川 成都 610500)
近年來(lái),深度學(xué)習(xí)作為一種高效的數(shù)據(jù)驅(qū)動(dòng)特征提取技術(shù)正在興起,而故障診斷研究在很大程度上得益于深度神經(jīng)網(wǎng)絡(luò)的發(fā)展[1]。由于運(yùn)行條件的變化、附加噪聲的干擾、機(jī)器安裝誤差等,在許多行業(yè)中,訓(xùn)練和測(cè)試數(shù)據(jù)更有可能從不同的分布中收集[2]。因此,測(cè)試診斷性能存在分布差異,這被稱(chēng)為域轉(zhuǎn)移問(wèn)題[3]。
域自適應(yīng)方法已經(jīng)成功地被開(kāi)發(fā)用于知識(shí)轉(zhuǎn)移,其目的是最小化源領(lǐng)域和目標(biāo)領(lǐng)域之間的分布差異。其中,深度學(xué)習(xí)網(wǎng)絡(luò)使得知識(shí)可以在不同的領(lǐng)域之間進(jìn)行有效的傳遞,因此得到了廣泛的研究。文獻(xiàn)[4]提出了一種用于故障診斷知識(shí)轉(zhuǎn)移的深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其中采用了兩個(gè)模塊,即狀態(tài)識(shí)別和域自適應(yīng)。文獻(xiàn)[5]提出了一種用于跨域故障診斷任務(wù)的深生成神經(jīng)網(wǎng)絡(luò),測(cè)試場(chǎng)景中的假故障數(shù)據(jù)可以通過(guò)MMD人工生成。文獻(xiàn)[6]提出了一種基于深度學(xué)習(xí)的故障診斷領(lǐng)域自適應(yīng)方法,使得域間最小均方誤差最小。然而,考慮到現(xiàn)有的方法一般側(cè)重于域的邊緣分布的比較,這類(lèi)方法的嚴(yán)重局限性在于兩個(gè)域都有標(biāo)識(shí)空間的理想化假設(shè)。
在實(shí)際的工業(yè)應(yīng)用中,在測(cè)試場(chǎng)景中收集所有機(jī)器健康狀況的數(shù)據(jù)幾乎是不可能的。因此,考慮了部分遷移學(xué)習(xí)問(wèn)題,即目標(biāo)域的標(biāo)簽空間是源標(biāo)簽空間的子空間。文獻(xiàn)[7]提出了一種選擇性對(duì)抗網(wǎng)絡(luò),其中使用多個(gè)鑒別器進(jìn)行部分域自適應(yīng)。文獻(xiàn)[8]提出了一種非監(jiān)督部分遷移學(xué)習(xí)的重要性加權(quán)對(duì)抗式網(wǎng)絡(luò),在源樣本上附加學(xué)習(xí)到的實(shí)例級(jí)權(quán)值來(lái)度量與目標(biāo)域的相似度。文獻(xiàn)[9]對(duì)不同來(lái)源實(shí)例的部分相關(guān)“實(shí)例特征”知識(shí)進(jìn)行了探索,并相應(yīng)地提出了一種具有部分相關(guān)“實(shí)例特征”知識(shí)的轉(zhuǎn)移學(xué)習(xí)方法,用于選擇性知識(shí)轉(zhuǎn)移。但是上述方法在處理邊緣數(shù)據(jù)分布時(shí)由于源類(lèi)的離群性,無(wú)法跨領(lǐng)域傳遞有效的診斷知識(shí)。
為解決邊緣數(shù)據(jù)離群性問(wèn)題,提出了一種基于類(lèi)加權(quán)對(duì)抗網(wǎng)絡(luò)的跨域旋轉(zhuǎn)機(jī)械故障診斷方法。通過(guò)在源類(lèi)別上附加類(lèi)級(jí)權(quán)重,可以直觀地表示源域和目標(biāo)域之間的關(guān)系,大大提高域自適應(yīng)效果。在兩個(gè)機(jī)械故障診斷數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果驗(yàn)證了該方法的有效性。
這里的目的是設(shè)計(jì)一個(gè)特征提取器h=G(x),以獲取數(shù)據(jù)的域不變特征,并尤其注意標(biāo)簽空間的差異。同時(shí),構(gòu)造了用于機(jī)器故障診斷的分類(lèi)器y=F(G(x)),在源監(jiān)督下的最小化概率Rt=
這里以機(jī)械振動(dòng)信號(hào)為研究對(duì)象,進(jìn)行故障診斷。具體地說(shuō),利用頻域信息,首先對(duì)原始采集的加速度數(shù)據(jù)進(jìn)行快速傅里葉變換(FFT)。端到端學(xué)習(xí)方案是深度學(xué)習(xí)的優(yōu)點(diǎn)之一,但直接對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)源提取通常會(huì)導(dǎo)致網(wǎng)絡(luò)訓(xùn)練效率較低,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。與其他常見(jiàn)信號(hào)大多分布在圖像等固定范圍內(nèi)的數(shù)據(jù)值不同,振動(dòng)信號(hào)普遍存在顯著峰值,可能比穩(wěn)態(tài)時(shí)的值大上百倍。因此,目前流行的最小最大尺度等數(shù)據(jù)預(yù)處理方法不能直接用于機(jī)械信號(hào)的處理。在本研究中,提出了一種頻域樣本縮放的預(yù)處理方法,如式(1)所示。
式中:xs,i,k—源域中第i個(gè)樣本的第k個(gè)數(shù)據(jù)點(diǎn);xt,j,k—目標(biāo)域中第j個(gè)樣本的第k個(gè)數(shù)據(jù)點(diǎn);xs,min—所有源域數(shù)據(jù)點(diǎn)的最小值;Ninput—樣本的維數(shù)。利用對(duì)數(shù)函數(shù),大幅度降低峰值,將信號(hào)映射到數(shù)據(jù)分布較為均勻的區(qū)域,便于后續(xù)深度神經(jīng)網(wǎng)絡(luò)的特征提取。
近年來(lái),域?qū)咕W(wǎng)絡(luò)在遷移學(xué)習(xí)中得到了廣泛的發(fā)展,通常采用特征提取器G和域鑒別器D兩個(gè)模塊,其參數(shù)分別記為θG和θD。同時(shí)進(jìn)行對(duì)抗訓(xùn)練,其中域鑒別器的目標(biāo)是根據(jù)提取的特征G(x)來(lái)區(qū)分源域和目標(biāo)域,然后訓(xùn)練G來(lái)混淆鑒別器。這里進(jìn)一步采用分類(lèi)器模塊C進(jìn)行故障診斷,其參數(shù)記為θC,所提方法,如圖1所示。
圖1 遷移學(xué)習(xí)總體結(jié)構(gòu)Fig.1 Overall Structure of Transfer Learning
首先,分類(lèi)器用于機(jī)器故障診斷,并進(jìn)行源監(jiān)督訓(xùn)練。具體來(lái)說(shuō),在源域樣本的經(jīng)驗(yàn)分類(lèi)損失最小的前提下,對(duì)特征提取器和分類(lèi)器同時(shí)進(jìn)行優(yōu)化。
同時(shí),為了減少域的移動(dòng),特征提取器需要學(xué)習(xí)域不變特征。基于對(duì)抗訓(xùn)練方案,對(duì)參數(shù)θD進(jìn)行優(yōu)化,以減小區(qū)域鑒別器D的損失。其中,D是兩個(gè)域的二值分類(lèi)器。另一方面,特征提取器被訓(xùn)練用來(lái)使得D的損失最大化。綜上所述,域?qū)咕W(wǎng)絡(luò)的目標(biāo)定義為:
式中:Lc—機(jī)器狀態(tài)預(yù)測(cè)損失;Ld—領(lǐng)域分類(lèi)損失;di—域標(biāo)號(hào);α0—兩項(xiàng)懲罰系數(shù)。
在本研究中,機(jī)器狀態(tài)和域分類(lèi)都采用了交叉熵?fù)p失函數(shù)[10]。對(duì)參數(shù)θG、θD和θC進(jìn)行了優(yōu)化,得到了最優(yōu)解。
式中:、和—θG、θD和θC的最佳取值。
這樣,G可以提取域不變特征,在源監(jiān)督下最小化目標(biāo)故障診斷的風(fēng)險(xiǎn)。
傳統(tǒng)的領(lǐng)域?qū)咕W(wǎng)絡(luò)旨在拉近源域和目標(biāo)域的邊界分布。由于目標(biāo)標(biāo)簽空間是部分遷移學(xué)習(xí)中源域標(biāo)簽空間的一個(gè)子空間,即Yt?Ys,直接進(jìn)行對(duì)抗訓(xùn)練基本上會(huì)由于源離群數(shù)據(jù)而導(dǎo)致測(cè)試性能下降。因此,由于目標(biāo)域數(shù)據(jù)無(wú)監(jiān)督且目標(biāo)標(biāo)簽空間不可用,因此在域自適應(yīng)過(guò)程中需要忽略離群類(lèi)。
針對(duì)部分遷移學(xué)習(xí)問(wèn)題,這里提出了一種類(lèi)加權(quán)域自適應(yīng)方法。盡管目標(biāo)標(biāo)簽空間不可訪問(wèn),但可以向源類(lèi)附加額外的權(quán)重,以衡量它們與目標(biāo)域的相似性??梢园l(fā)現(xiàn),域鑒別器的輸出非常適合用來(lái)作為權(quán)重的指標(biāo)。
損失函數(shù)Ld描述了真實(shí)域標(biāo)號(hào)d和預(yù)測(cè)標(biāo)號(hào)之間的差異。在對(duì)抗訓(xùn)練過(guò)程中,期望屬于同一類(lèi)的樣本聚類(lèi)到相同的區(qū)域。相應(yīng)的,離群源類(lèi)與兩個(gè)域的重疊較小,這意味著可以獲得較高的預(yù)測(cè)離群源類(lèi)的置信度,獲得較小的Ld值。另一方面,共享的類(lèi)經(jīng)過(guò)大量的對(duì)抗訓(xùn)練,并且域鑒別器對(duì)域標(biāo)簽預(yù)測(cè)沒(méi)有信心。因此,損失Ld更大。
因此,在部分遷移學(xué)習(xí)中,源類(lèi)的權(quán)值可以通過(guò)域預(yù)測(cè)損失Ld來(lái)估計(jì)。
式中:wj和Djs—第j個(gè)源類(lèi)的權(quán)重和樣本;ns,j—Djs中樣本的個(gè)數(shù);ds—源域標(biāo)簽;Nc—源類(lèi)的個(gè)數(shù)。
等式4表明,如果域鑒別器在識(shí)別源類(lèi)時(shí)不太清晰,則源類(lèi)有更大的機(jī)會(huì)進(jìn)入目標(biāo)域。相應(yīng)的,應(yīng)該更多地關(guān)注共享類(lèi)的域適配,而忽略離群類(lèi)。本研究中提出的類(lèi)加權(quán)遷移學(xué)習(xí)方法的方案,在對(duì)抗學(xué)習(xí)中,源類(lèi)被賦予不同的權(quán)值,如圖2所示。
圖2 對(duì)抗性學(xué)習(xí)中提出的類(lèi)加權(quán)遷移學(xué)習(xí)Fig.2 Class Weighted Transfer Learning Proposed in Antagonistic Learning
雖然權(quán)值可以很好地用域分解損失表示,但值應(yīng)在一定范圍內(nèi)歸一化。這里采用最小最大歸一化方法:
綜上所述,這里方法的最終目標(biāo)函數(shù)為:
式中:α1和α2—懲罰系數(shù);dt—目標(biāo)域標(biāo)簽。優(yōu)化目標(biāo)為:
目前廣泛使用的隨機(jī)梯度下降優(yōu)化方法基本上不能直接求解式(7)中的優(yōu)化問(wèn)題。這是因?yàn)?,同時(shí)通過(guò)特征提取器的優(yōu)化和域鑒別器的優(yōu)化,可以使域預(yù)識(shí)別損失最小化。因此,引入梯度反轉(zhuǎn)層(GRL)來(lái)解決這一問(wèn)題。
具體來(lái)說(shuō),在網(wǎng)絡(luò)模型的前饋過(guò)程中,GRL作為身份映射,也可以忽略。在反向傳播中,GRL在翻轉(zhuǎn)符號(hào)后將接收到梯度傳遞的前一層。具體地說(shuō),GRL可以用前向傳播和后向傳播過(guò)程中的函數(shù)R(x)表示。
式中:I—單位矩陣;λ—懲罰參數(shù),為簡(jiǎn)便起見(jiàn),這里將懲罰參數(shù)設(shè)為1。
通過(guò)等式(7)中梯度反轉(zhuǎn)層的應(yīng)用,優(yōu)化問(wèn)題可以通過(guò)基于隨機(jī)梯度下降的算法求解,該算法也可以在常用的深度學(xué)習(xí)編程平臺(tái)上實(shí)現(xiàn)。這樣就可以在一個(gè)訓(xùn)練步驟中同時(shí)更新網(wǎng)絡(luò)模型中的所有參數(shù),并且可以很好地解決局部遷移學(xué)習(xí)問(wèn)題,有效地過(guò)濾源離群類(lèi),并將共享類(lèi)集中于域自適應(yīng)區(qū)域。
所提出的網(wǎng)絡(luò)結(jié)構(gòu),如圖3所示。一般采用三個(gè)模塊,即:特征提取器、域鑒別器和分類(lèi)器。在特征抽取器中,首先使用三個(gè)卷積層,其濾波器尺寸為3,濾波器數(shù)目分別為128、64和32。在扁平化層之后,使用一個(gè)完全連接層對(duì)128個(gè)神經(jīng)元進(jìn)行分類(lèi),并將所學(xué)到的表示進(jìn)一步用于域分類(lèi)和機(jī)器狀態(tài)分類(lèi)。
圖3 所提出的網(wǎng)絡(luò)架構(gòu)Fig.3 Proposed Network Architecture
對(duì)于域鑒別器,使用2個(gè)卷積層,分別使用大小為3的256個(gè)和128個(gè)濾波器,然后使用2個(gè)全連接層,分別使用512和128個(gè)神經(jīng)元。然后連接兩個(gè)神經(jīng)元,分別代表兩個(gè)域標(biāo)簽,最后使用softmax函數(shù)進(jìn)行域分類(lèi)。
分類(lèi)器模塊的結(jié)構(gòu)與域鑒別器相似。使用了兩個(gè)卷積層,分別帶有大小為3的32和16個(gè)過(guò)濾器。在64個(gè)神經(jīng)元完全連接后,利用Nc神經(jīng)元和softmax分類(lèi)器進(jìn)行故障診斷。此外,為了避免過(guò)擬合,整個(gè)網(wǎng)絡(luò)一般采用主動(dòng)丟棄策略,大多數(shù)層采用LRe-LU激活函數(shù)。采用BP 算法對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行更新,并采用Adam優(yōu)化方法。
(1)CWRU。首個(gè)滾動(dòng)軸承數(shù)據(jù)集由凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)中心提供。這里使用的振動(dòng)數(shù)據(jù)采集自電機(jī)驅(qū)動(dòng)端2個(gè)轉(zhuǎn)速下的振動(dòng)數(shù)據(jù)。1797rpm 和1730rpm,在4 個(gè)健康狀態(tài)下:(1)健康(H);(2)外圈故障(OF);(3)內(nèi)圈故障(IF);(4)球圈故障(BF)。這三個(gè)故障是人工制造的,直徑分別為7mils、14mils 和21mils。因此,在兩個(gè)轉(zhuǎn)速域考慮了10種軸承條件。
(2)TrainBogie。第二個(gè)滾動(dòng)軸承數(shù)據(jù)集是在高速多單元列車(chē)轉(zhuǎn)向架軸承系統(tǒng)實(shí)驗(yàn)裝置上制備的,如圖4所示。
圖4 列車(chē)轉(zhuǎn)向架試驗(yàn)臺(tái)以及三種軸承故障Fig.4 Test Bed of Train Bogie and Three Kinds of Bearing Faults
與CWRU數(shù)據(jù)集類(lèi)似,將1590rpm和1950rpm的兩個(gè)轉(zhuǎn)速作為不同的域,分別對(duì)應(yīng)于260km∕h和320km∕h的列車(chē)速度。產(chǎn)生了三種類(lèi)型的斷層,即斷層。外圈故障(OF)、滾子故障(RF)、內(nèi)圈故障(IF)。這里還考慮了故障嚴(yán)重程度的三個(gè)級(jí)別,即輕度故障、中度故障和嚴(yán)重故障。兩個(gè)數(shù)據(jù)集的詳細(xì)信息,如表1所示。
表1 兩個(gè)數(shù)據(jù)集的詳細(xì)信息Tab.1 Details of the Two Data Sets
本研究對(duì)部分遷移學(xué)習(xí)問(wèn)題采用不同的觀點(diǎn)進(jìn)行比較。以下所有方法均與該方法共享相似的網(wǎng)絡(luò)和實(shí)驗(yàn)配置。
基準(zhǔn)方法:首先,在沒(méi)有域自適應(yīng)和部分轉(zhuǎn)移特征提取的情況下,特征提取器和分類(lèi)器在源監(jiān)督下訓(xùn)練并直接用于測(cè)試。
DA-Ad[11]:該方法去掉了領(lǐng)域自適應(yīng)的類(lèi)加權(quán)方案,只引入了傳統(tǒng)的域?qū)褂?xùn)練。兩個(gè)數(shù)據(jù)集的詳細(xì)信息,如表1所示。
DA-MMD[12]:最大平均差度量(Maximum Mean Difference,MMD)已被廣泛應(yīng)用于測(cè)量源域和目標(biāo)域之間分布的離散性。因此,也可以通過(guò)最小化學(xué)習(xí)表示中的MMD來(lái)提取領(lǐng)域不變特征。
在本節(jié)中,對(duì)部分轉(zhuǎn)移學(xué)習(xí)問(wèn)題進(jìn)行了實(shí)驗(yàn)研究,研究了不同的故障診斷任務(wù)。相關(guān)任務(wù)的詳細(xì)信息,如表2所示。在兩個(gè)數(shù)據(jù)集中隨機(jī)選取部分遷移學(xué)習(xí)任務(wù)。每個(gè)機(jī)器條件下有100個(gè)標(biāo)記的源域樣本可用于不同場(chǎng)景的訓(xùn)練,在每個(gè)考慮的條件下測(cè)試400個(gè)未標(biāo)記的目標(biāo)域樣本。在實(shí)現(xiàn)過(guò)程中,首先對(duì)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練,只保留最小的分類(lèi)損失Lc。然后,對(duì)網(wǎng)絡(luò)進(jìn)行優(yōu)化,使式(6)中提出的目標(biāo)F最小。為了減少隨機(jī)性的影響,對(duì)報(bào)告的實(shí)驗(yàn)結(jié)果進(jìn)行10次試驗(yàn)平均,并給出平均值和標(biāo)準(zhǔn)差。模型參數(shù),如表3所示。它們主要是由任務(wù)中的驗(yàn)證結(jié)果確定的,任務(wù)中僅使用1797rpm 轉(zhuǎn)速下的CWRU 數(shù)據(jù)進(jìn)行訓(xùn)練和驗(yàn)證,目標(biāo)類(lèi)與C2相同。本研究的實(shí)驗(yàn)是在NVIDIA GeForce RTX 2080 Ti GPU和i7 CPU的工作站上進(jìn)行的。使用Tensorflow 深度學(xué)習(xí)平臺(tái)進(jìn)行編程。
表2 部分遷移學(xué)習(xí)任務(wù)的信息Tab.2 Information of the Partial Transfer Learning Tasks in this Study
表3 用到的參數(shù)Tab.3 Parameters Used in this Study
3.3.1 跨域的診斷結(jié)果
CWRU數(shù)據(jù)集不同部分遷移學(xué)習(xí)任務(wù)下的跨域故障診斷結(jié)果,如表4所示。除了提出的框架中的三種比較方法外,還使用了重要性加權(quán)對(duì)抗網(wǎng)絡(luò)(IWAN)進(jìn)行比較。實(shí)驗(yàn)結(jié)果表明,提出方法具有較高的測(cè)試正確率,大多數(shù)正確率在98%以上。在不同的任務(wù)下,該方法的性能優(yōu)于其他方法,證明了提出的方法在解決部分遷移學(xué)習(xí)問(wèn)題上的有效性。此外,該方法在不同情況下的標(biāo)準(zhǔn)差一般較小,表明該方法在不同的實(shí)驗(yàn)運(yùn)行中都能取得良好的收斂性能。
可以看出,在非部分任務(wù)C1中,兩種邊緣域自適應(yīng)方法DAAdv和DA-MMD 取得了良好的遷移學(xué)習(xí)性能。但是,當(dāng)測(cè)試數(shù)據(jù)有偏差時(shí),這些方法會(huì)產(chǎn)生顯著的負(fù)傳遞效應(yīng)。例如,在測(cè)試數(shù)據(jù)集中只有3個(gè)類(lèi)的任務(wù)C5中,傳統(tǒng)的領(lǐng)域自適應(yīng)方法診斷正確率僅為60%左右,而在不使用遷移學(xué)習(xí)技術(shù)的情況下,基線方法的診斷正確率達(dá)到87.6%。使用該方法,正確率達(dá)到99.6%,在部分遷移學(xué)習(xí)任務(wù)中具有優(yōu)越性。此外,比較方法的標(biāo)準(zhǔn)差也顯著,特別是在C5等極端情況下,所提方法可以在較小的變化下取得穩(wěn)定的性能。進(jìn)一步驗(yàn)證了該算法的收斂性能。
此外,通過(guò)與IWAN方法的比較,該方法也取得了較好的效果。IWAN在相對(duì)簡(jiǎn)單的任務(wù),如C1、C2和C8中具有較強(qiáng)競(jìng)爭(zhēng)力,但在目標(biāo)域有很大偏差的困難任務(wù)中效率較低。例如,在任務(wù),C7和C10中,只有一個(gè)類(lèi)包含在目標(biāo)域中,而提出的方法明顯有較大的改善。另外,在機(jī)器狀態(tài)監(jiān)控任務(wù)中,目標(biāo)機(jī)器健康狀態(tài)集通常較小,故障類(lèi)別有限。因此,該方法適用于故障診斷中的局部域自適應(yīng)問(wèn)題。
不同方法的平均計(jì)算時(shí)間也,如表4所示??梢钥闯?,在一般情況下,所提出的方法可以在半小時(shí)內(nèi)實(shí)現(xiàn)。由于部分遷移學(xué)習(xí)問(wèn)題大多離線進(jìn)行,所以其計(jì)算量可以接受。雖然基線和DAAdv的比較方法導(dǎo)致更快的計(jì)算,但它們?cè)跍y(cè)試精度上的競(jìng)爭(zhēng)力卻比較弱。值得注意的是,IWAN方法引入了源和目標(biāo)域之間的實(shí)例級(jí)校準(zhǔn),因此相關(guān)樣本包含了更多的參數(shù)。IWAN還使用了正則化技術(shù)[13],因此,盡管其具有較好的診斷性能,但卻需要更多的計(jì)算時(shí)間。
表4 CWRU數(shù)據(jù)集中不同任務(wù)測(cè)試精度的均值和標(biāo)準(zhǔn)差(%)Tab.4 Mean and Standard Deviation of test Accuracy for Different Tasks in CWRU Data Set(%)
列車(chē)轉(zhuǎn)向架數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果,如表5所示。與CWRU數(shù)據(jù)集相比,該數(shù)據(jù)集具有更強(qiáng)的實(shí)用性,因此獲得的測(cè)試正確率較低。然而,仍然可以觀察到相似的規(guī)律。對(duì)于目標(biāo)域內(nèi)相關(guān)類(lèi)別超過(guò)半數(shù)的部分遷移任務(wù),即B1、B2、B3和B8,三種域自適應(yīng)方法的性能一般都優(yōu)于基準(zhǔn)方法。與該方法相比,DA-Adv 和DAMMD兩種優(yōu)化邊界域分布的方法都具有較強(qiáng)的競(jìng)爭(zhēng)力。但是,當(dāng)目標(biāo)域存在顯著偏置時(shí),兩種邊緣方法均達(dá)到負(fù)遷移性能,且測(cè)試結(jié)果比基準(zhǔn)方法差。
表5 列車(chē)轉(zhuǎn)向架數(shù)據(jù)集中不同任務(wù)測(cè)試精度的平均值和標(biāo)準(zhǔn)差Tab.5 Means and Standard Deviations of the Testing Accuracies in Different Tasks in the Train Bogie Data Set
與此同時(shí),盡管IWAN方法在很多情況下都有很好的結(jié)果,但在目標(biāo)領(lǐng)域存在很大偏差的困難任務(wù)中,IWAN方法的競(jìng)爭(zhēng)力較弱。該方法在不同場(chǎng)景下仍然具有最佳的診斷性能,進(jìn)一步驗(yàn)證了該方法對(duì)部分遷移學(xué)習(xí)問(wèn)題的有效性和優(yōu)越性。
3.3.2 參數(shù)分析
在本節(jié)中,研究了模型參數(shù)對(duì)診斷性能的影響。具體地,研究了懲罰系數(shù)α1和α2作為不同優(yōu)化目標(biāo)的權(quán)重。驗(yàn)證任務(wù)的實(shí)驗(yàn)結(jié)果,如圖5所示??梢钥闯?,在合理范圍內(nèi),不同參數(shù)的性能變化不明顯。例如,沒(méi)有參數(shù)大于或小于另一個(gè)參數(shù)的十倍。結(jié)果表明,該方法的收斂性一般是穩(wěn)定的。
圖5 懲罰系數(shù)對(duì)驗(yàn)證任務(wù)的影響Fig.5 The Effect of Penalty Coefficient on Verification Task
3.3.3 特征可視化
在本節(jié)中,基于學(xué)習(xí)表示的可視化,定性地研究了所提方法的有效性。有效的t-SNE技術(shù)通過(guò)將樣本從原始特征空間映射到二維地圖來(lái)使得高維數(shù)據(jù)表示可視化[14]。
任務(wù)C2中特征提取器在不同方法下學(xué)習(xí)的高級(jí)表示的可視化結(jié)果,藍(lán)色和紅色數(shù)字分別表示源域和目標(biāo)域中共享類(lèi)的樣本,如圖6所示。綠色數(shù)字表示源異常值,值表示類(lèi)。結(jié)果表明,不同的適應(yīng)方法使不同域的分布更加接近,同一類(lèi)群在不同域上很好地聚在一起。這表明現(xiàn)有的遷移學(xué)習(xí)方法一般適用于目標(biāo)域偏性不顯著且包含源類(lèi)最多的部分遷移任務(wù)。結(jié)果表明,測(cè)試正確率較高,如表4所示。
圖6 任務(wù)C2中不同方法學(xué)習(xí)的高級(jí)表征的可視化Fig.6 Visualization of Advanced Representations of Different Learning Methods in Task C2
任務(wù)C5中的可視化結(jié)果,如圖7所示。其中,10個(gè)源類(lèi)中只有3 個(gè)存在于目標(biāo)域中。在這個(gè)場(chǎng)景中,使用DA-Adv 和DAMMD方法觀察到兩個(gè)域中不同類(lèi)之間的顯著重疊?,F(xiàn)有的兩種深度遷移學(xué)習(xí)方法都是為了最小化兩個(gè)域的邊緣分布,由于目標(biāo)域存在較大偏差,導(dǎo)致同類(lèi)的聚類(lèi)性能較差。因此,兩種方法的測(cè)試正確率都很低,如表4所示。另一方面,該方法對(duì)兩個(gè)域之間的共享類(lèi)具有較好的聚類(lèi)性能,并且離群類(lèi)與共享類(lèi)能夠很好地分離。因此,測(cè)試精度接近100%。
圖7 任務(wù)C5的可視化結(jié)果Fig.7 Visualization Results of Task C5
此外,這里的方法在不同任務(wù)下的學(xué)習(xí)表示和類(lèi)級(jí)權(quán)重,如圖8所示。一色和另一色的數(shù)字表示不同權(quán)重的源樣本,顏色條表示權(quán)重值。一色的數(shù)字是目標(biāo)樣本,值代表類(lèi)??梢杂^察到,兩個(gè)域之間的共享類(lèi)大多聚在相同的區(qū)域,源離群類(lèi)是分開(kāi)的。另外,共享類(lèi)基本上附加了最大的權(quán)值,源離群值的權(quán)值一般接近于0。例如,對(duì)于目標(biāo)域存在顯著偏倚且只有1 類(lèi)中的任務(wù)C10,現(xiàn)有的域自適應(yīng)方法負(fù)遷移性能?chē)?yán)重,測(cè)試正確率明顯低于基準(zhǔn)方法,如表4所示。
圖8 不同任務(wù)中的可視化結(jié)果Fig.8 Visualization Results in Different Tasks
然而,這里提出的方法通過(guò)將異常值的權(quán)值設(shè)置為幾乎為零來(lái)忽略異常值,并關(guān)注權(quán)值最大的共享類(lèi)5的自適應(yīng)的結(jié)果。其結(jié)果表明,該方法對(duì)于解決部分遷移學(xué)習(xí)問(wèn)題是非常有效的。
為解決邊緣數(shù)據(jù)離群性問(wèn)題,提出了一種基于類(lèi)加權(quán)對(duì)抗網(wǎng)絡(luò)的跨域旋轉(zhuǎn)機(jī)械故障診斷方法。在CWRU數(shù)據(jù)集和一個(gè)列車(chē)轉(zhuǎn)向架數(shù)據(jù)集上對(duì)該方法進(jìn)行了實(shí)驗(yàn),分析實(shí)驗(yàn)結(jié)果可以得出如下結(jié)論:
(1)提出的診斷方法能夠有效地忽略離群源類(lèi),在不同的任務(wù)下,該方法的性能優(yōu)于其他故障診斷方法,證明了提出的方法在解決部分遷移學(xué)習(xí)問(wèn)題上的有效性。
(2)該方法在不同情況下的標(biāo)準(zhǔn)差一般較小,表明該方法在不同的實(shí)驗(yàn)運(yùn)行中都能取得良好的收斂性。
(3)提出的故障診斷方法相對(duì)來(lái)說(shuō)具有更好的診斷精度,且時(shí)間成本也處于可接受區(qū)間。