王業(yè)統(tǒng),吳海威,李 美,蘇 明
(1.海南科技職業(yè)大學(xué)信息工程學(xué)院,海南 海口 571126;2.海南大學(xué)機(jī)電工程學(xué)院,海南 ???570228;3.海南科技職業(yè)大學(xué)機(jī)電工程學(xué)院,海南 海口 571126)
滾動(dòng)軸承是旋轉(zhuǎn)機(jī)械的重要組成部分,軸承的失效直接影響機(jī)械的性能,甚至導(dǎo)致嚴(yán)重的事故[1]。實(shí)際機(jī)器中使用的軸承(Bearings in Real-Case Machines,BRMS)大多在健康狀態(tài)下運(yùn)行,故障很少發(fā)生,因此,故障數(shù)據(jù)比健康數(shù)據(jù)更難收集。另外,數(shù)據(jù)量持續(xù)增長(zhǎng),由于噪聲大、知識(shí)依賴性強(qiáng),用信號(hào)處理的方法來表示數(shù)據(jù)是不合適的[2]。
因此,提出在實(shí)驗(yàn)室中模擬各種故障,然后從軸承試驗(yàn)機(jī)(Bearings in Laboratory Machines,BLM)上收集足夠的標(biāo)記數(shù)據(jù),然而,由于測(cè)量環(huán)境的多樣性、運(yùn)行條件的多樣性、振動(dòng)傳遞路徑的多樣性等因素的影響,BLM和BRMS采集到的數(shù)據(jù)分布存在很大差異[3]。
遷移學(xué)習(xí)的目標(biāo)是使用源域中包含的知識(shí)來減少分布差異并提高目標(biāo)域預(yù)測(cè)模型的性能。為了實(shí)現(xiàn)這一目標(biāo),基于特征的學(xué)習(xí)方法作為一種常用的遷移學(xué)習(xí)方法得到了廣泛的研究,該方法致力于從源域和目標(biāo)域的數(shù)據(jù)中提取可轉(zhuǎn)換特征,以減少跨域差異。文獻(xiàn)[4]提出了一種基于域自適應(yīng)的軸承故障診斷深度神經(jīng)網(wǎng)絡(luò),利用源域的頻譜數(shù)據(jù)和目標(biāo)域的部分標(biāo)記數(shù)據(jù)對(duì)其進(jìn)行訓(xùn)練。文獻(xiàn)[5]采用稀疏自動(dòng)編碼器從不同運(yùn)行條件下的軸承中提取頻譜數(shù)據(jù)的特征,然后最小化最大平均偏差(MMD)以適應(yīng)學(xué)習(xí)到的可遷移特征的分布。文獻(xiàn)[6]采用基于域自適應(yīng)的深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)完成不同噪聲環(huán)境下的軸承故障診斷。
雖然上述方法取得了一定效果,但是存在三個(gè)缺點(diǎn):
(1)它們是在同一臺(tái)機(jī)器上進(jìn)行的診斷知識(shí)的遷移學(xué)習(xí)任務(wù),能否在不同的機(jī)器之間進(jìn)行遷移學(xué)習(xí)還需探討。(2)上述方法存在性能下降的問題,并且忽略了振動(dòng)數(shù)據(jù)的平移不變性。(3)上述方法部分地利用了目標(biāo)域數(shù)據(jù)的分布信息,由于缺乏標(biāo)記信息,沒有充分利用目標(biāo)域中未標(biāo)記的數(shù)據(jù)來訓(xùn)練智能診斷模型[7-8]。
為了克服上述缺點(diǎn),提出了一種基于特征的遷移神經(jīng)網(wǎng)絡(luò)軸承智能故障診斷方法,該方法能夠?qū)W習(xí)跨域差異小、類間距離小的可遷移特征。實(shí)驗(yàn)結(jié)果證明了提出方法的有效性。
令Ds和Dt分別表示源域和目標(biāo)域,如果將樣本空間表示Xs∈Ds和Xt∈Dt,源域和目標(biāo)域的數(shù)據(jù)樣本分別為xs∈Xs和xt∈Xt。將標(biāo)簽樣本表示為y={1 ,2,3,...,k} ,其中,包含k種正常工作狀態(tài)。假設(shè)從BLM和BRM采集的數(shù)據(jù)樣本服從邊際概率分布P(xs)和Q(xt)。
(1)利 用Ds={Xs,P(xs)}的ns標(biāo)記 樣本 構(gòu) 建 源 域Xs=,以提供診斷信息。
(3)源域應(yīng)該為目標(biāo)域提供足夠的診斷信息,即yt?ys?y,其中ys和yt分別是源域和目標(biāo)域中的標(biāo)簽空間。
由于從不同的方位采集源域和目標(biāo)域的振動(dòng)數(shù)據(jù),因此,這些數(shù)據(jù)的分布存在嚴(yán)重的差異。如果使用智能診斷模型同時(shí)從這些數(shù)據(jù)中學(xué)習(xí)特征,學(xué)習(xí)到的特征也會(huì)受到分布偏差的嚴(yán)重影響。從圖1(a)可以看出,通過最小化域共享分類器h( · )僅用源域樣本訓(xùn)練,這意味著基于所學(xué)習(xí)的特征可以實(shí)現(xiàn)分類任務(wù),該分類器也可以很好地用于目標(biāo)域。然而,域共享分類器h( · )在目標(biāo)域上的泛化誤差卻很大,即分類器h( · )由于分別從源域和目標(biāo)域中的樣本中學(xué)習(xí)到的特征之間存在嚴(yán)重的分布差異,因此對(duì)目標(biāo)域樣本的分類結(jié)果基本上是錯(cuò)誤的。因此,這里目標(biāo)是建立一個(gè)智能診斷模型,從收集的數(shù)據(jù)中提取可遷移的特征,以減少跨域差異,然后強(qiáng)制域共享分類器h( · )以最小化的目標(biāo)域風(fēng)險(xiǎn)。如圖1(b)所示,智能診斷模型期望學(xué)習(xí)具有相似分布的可遷移特征。因此,域共享分類器可以根據(jù)源域提供的診斷信息正確識(shí)別目標(biāo)域樣本。
圖1 基于特征的轉(zhuǎn)移學(xué)習(xí)智能故障診斷Fig.1 Intelligent Fault Diagnosis Based on Feature Transfer Learning
最大平均差異(Maximum Mean Discrepancy,MMD)是一種非參數(shù)距離度量,用于度量?jī)蓚€(gè)數(shù)據(jù)集之間的分布差異。如果數(shù)據(jù)集和分別遵循概率分布p和q,則數(shù)據(jù)集X和Y之間的MMD定義如下。
式中:sup( · )—輸入集合的上界;H—再生核Hilbert 空間(Reproducing Kernel Hilbert Space,RKHS);Φ( · )—原始特征空間到RKHS的非線性映射[9]。
通過分布的核平均嵌入,RKHS由拉普拉斯核和高斯核等特征核生成。因此,基于核均值嵌入的MMD經(jīng)驗(yàn)估計(jì)的計(jì)算表達(dá)式如下:
式中:k(·,· )—特征核。
目的是建立一個(gè)基于特征遷移方法的智能診斷模型。該方法包括四個(gè)步驟:域劃分、特征提取、域自適應(yīng)和故障識(shí)別,如圖2所示。
圖2 提出方法的總體結(jié)構(gòu)Fig.2 The Overall Structure of the Proposed Method
在域劃分的一步中,源域包含標(biāo)記樣本以提供診斷信息,而目標(biāo)域中的未標(biāo)記樣本則期望利用源域中的診斷信息進(jìn)行分類。對(duì)于特征提取,采用非線性特征映射從源域和目標(biāo)域的數(shù)據(jù)中提取可遷移的特征。注意,源域和目標(biāo)域中的數(shù)據(jù)同時(shí)由相同的非線性特征映射處理。在域自適應(yīng)方面,首先用一個(gè)非參數(shù)距離指標(biāo)MMD來度量學(xué)習(xí)的可遷移特征的分布差異。然后,以學(xué)習(xí)到的可遷移特征的分布差異作為優(yōu)化目標(biāo),反向傳播,訓(xùn)練非線性特征映射的參數(shù)。優(yōu)化的目的是使學(xué)習(xí)到的可遷移特征的分布差異最小化,從而得到具有較小跨域差異的特征。在故障識(shí)別中,最后利用域共享分類器對(duì)目標(biāo)域中未標(biāo)記樣本進(jìn)行正確分類。分類器充分地從源域樣本中學(xué)習(xí)特征的分布?;谟蜃赃m應(yīng)訓(xùn)練,目標(biāo)域樣本的學(xué)習(xí)特征分布與源域樣本相似。因此,域共享分類器還能夠正確地對(duì)目標(biāo)域中未標(biāo)記的樣本進(jìn)行分類。
3.2.1 域共享CNN
FTNN的結(jié)構(gòu),如圖3所示。該模型利用一個(gè)域共享CNN從源域和目標(biāo)域的原始振動(dòng)數(shù)據(jù)中提取可遷移特征。然后,通過多層域自適應(yīng)來減小學(xué)習(xí)的可遷移特征的分布差異。最后,對(duì)目標(biāo)域中未標(biāo)記的樣本分配偽標(biāo)簽,訓(xùn)練域共享的CNN。當(dāng)同時(shí)處理源域和目標(biāo)域中的樣本時(shí),域共享CNN需要根據(jù)參數(shù)集進(jìn)行訓(xùn)練網(wǎng)絡(luò)。參數(shù)設(shè)置,如表1所示。通常,域共享CNN由卷積層、池化層和全連接層組成。
圖3 提出的FTNN模型的體系結(jié)構(gòu)Fig.3 The Architecture of the Proposed FTNN Model
表1 域共享CNN的參數(shù)Tab.1 Parameters of Domain Shared CNN
在卷積層中,域共享CNN采用共享核kl∈RH×L×D對(duì)l- 1層的輸出向量進(jìn)行卷積,其中,H—核的高度;l和D—核的長(zhǎng)度和深度。由于原始振動(dòng)數(shù)據(jù)為一維(1D)矢量,因此L設(shè)為1。假設(shè)前一層的輸出特征是,則第l層的輸出特征如下所示。
式中:D={s,t}—源域和目標(biāo)域的索引—從上一層l- 1 的特征中學(xué)習(xí)到的可遷移特性;bl—C1層偏差;σr( · )—矩形線性單位(ReLU),是解決梯度消失問題的常用的激活函數(shù)。
在此基礎(chǔ)上,利用池化層的下采樣過程來減少訓(xùn)練參數(shù)的個(gè)數(shù),從而有效地克服過擬合問題。本研究采用最大池化的下采樣方式,將可遷移特征劃分為若干個(gè)不重疊的部分,并返回每個(gè)部分的最大值。源域和目標(biāo)域中的合并特征表示為:
式中:max( · )—返回向量的最大值;s—非重疊像素的高度。
可以根據(jù)層疊卷積層和池化層依次提取高層特征。然后將這些特征擴(kuò)展為一維向量。例如,層P2中的可遷移特征被擴(kuò)展成一維特征向量,作為全連接層F1的輸出。與多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)類似,F(xiàn)2層的輸出如下所示。
分類過程中,最后一個(gè)全連接層F3中使用softmax函數(shù)來預(yù)測(cè)樣本xsi和xti的類別。層F3的輸出表示樣本類別的概率分布,其表示如下:
3.2.2 多層域自適應(yīng)
為了減少分布差異,通過最小化學(xué)習(xí)到的可遷移特征的MMD 來訓(xùn)練域共享CNN 的參數(shù)。相關(guān)研究證明高層次特征在全連接層中的分布不一致,因此,最后一層神經(jīng)網(wǎng)絡(luò)除了用于分類外,還有必要調(diào)整學(xué)習(xí)的可遷移特征在層F1和F2中的分布。此外,在域共享CNN的訓(xùn)練過程中,學(xué)習(xí)特征的分布隨網(wǎng)絡(luò)參數(shù)的更新而變化,定義為內(nèi)部協(xié)變量偏移。為了緩解此問題,還需要調(diào)整卷積層C1和C2中學(xué)習(xí)到的可遷移特征的分布。因此,學(xué)習(xí)到的可遷移特征的多層MMD計(jì)算公式如下:
域共享CNN有利于學(xué)習(xí)具有特定域特性的可遷移特征,這使多層MMD值的變化較大。具體來說,高層特征的MMD值遠(yuǎn)大于淺層特征的MMD 值,因此,使用一個(gè)權(quán)衡參數(shù)Kl來平衡多層MMD的大小。該權(quán)衡參數(shù)是動(dòng)態(tài)的,以擴(kuò)大淺層特征的貢獻(xiàn)度,降低高層特征的貢獻(xiàn)度。
式(7)表明,核寬和時(shí)間復(fù)雜度嚴(yán)重影響MMD。一方面,以高斯核為例,式中:γ—核寬。如果γ→0,MMD會(huì)趨于0;同樣,如果選擇較大帶寬,也會(huì)降到0,比如γ→∞。為了解決這一問題,通過選取核帶寬γ作為所有樣本對(duì)之間的中值距離。另一方面,式(7)的時(shí)間復(fù)雜度為O(n2×l),在共享域CNN的訓(xùn)練過程中消耗了大量的時(shí)間,為了解決這個(gè)問題,引入了的無偏估計(jì)來計(jì)算MMD。因此,式(7)可簡(jiǎn)化為:
其中,2n=ns=nt。式(8)的時(shí)間復(fù)雜度減小到O( )n×l,有效地加快了模型的訓(xùn)練速度。
最后通過最小化代價(jià)函數(shù)來減小學(xué)習(xí)的可遷移特征的分布差異。
式中:θc—C1,C2,F(xiàn)1和F2的參數(shù)集合。
3.2.3 偽標(biāo)簽學(xué)習(xí)
基于可遷移特征的多層自適應(yīng)可以減少可遷移特征的差異分布。然而,由于缺乏標(biāo)記的樣本,目標(biāo)域中的未標(biāo)記樣本不能用于訓(xùn)練F3層中的參數(shù)。為此,引入偽標(biāo)簽學(xué)習(xí)來解決這一問題。一個(gè)樣本的偽標(biāo)簽就是把預(yù)測(cè)概率最大的標(biāo)簽當(dāng)作真標(biāo)簽來選取,偽標(biāo)簽的生成包括兩個(gè)步驟:標(biāo)簽的概率預(yù)測(cè)和偽標(biāo)簽的轉(zhuǎn)換。F3層中的softmax函數(shù)預(yù)測(cè)目標(biāo)域中樣本的標(biāo)簽概率分布。因此,結(jié)合等式(6),偽標(biāo)簽可由下式計(jì)算:
源域和目標(biāo)域的樣本都是用來訓(xùn)練共享域CNN,因此,偽標(biāo)簽學(xué)習(xí)的優(yōu)化目標(biāo)表示為:
式中:J( ·,· )—損失函數(shù);yis—源域中第i個(gè)樣本的真實(shí)標(biāo)簽;α—權(quán)衡參數(shù);θ—域共享CNN的參數(shù)集合。
提出的FTNN 模型通過三個(gè)正則項(xiàng)最小化來訓(xùn)練:(1)源域樣本的預(yù)測(cè)標(biāo)簽與真實(shí)標(biāo)簽之間的誤差;(2)目標(biāo)域樣本的預(yù)測(cè)標(biāo)簽與偽標(biāo)簽之間的誤差;(3)從跨域數(shù)據(jù)中學(xué)習(xí)可遷移特征的多層MMD。通過式(9)和式(11),F(xiàn)TNN 模型最終的計(jì)算表達(dá)式如下:
式中:β—權(quán)衡參數(shù);n—梯度下降的最小批量樣本數(shù)。
本研究采用交叉熵?fù)p失函數(shù),定義如下:
利用式(12)中的三個(gè)正則化項(xiàng),提出的FTNN也會(huì)有相應(yīng)特征。首先,F(xiàn)TNN能夠?qū)W習(xí)可遷移特征,并根據(jù)這些特征對(duì)輸入樣本進(jìn)行分類。對(duì)源域中的標(biāo)記樣本進(jìn)行訓(xùn)練,得到診斷信息。其次,偽標(biāo)簽學(xué)習(xí)將目標(biāo)域樣本中的學(xué)習(xí)特征按預(yù)測(cè)的類別集合起來,擴(kuò)大了學(xué)習(xí)特征的類間距離,便于識(shí)別。最后一個(gè)階段,訓(xùn)練后的FTNN能夠在最小化學(xué)習(xí)到的可遷移特征的分布差異后,學(xué)習(xí)到服從相似分布的可遷移特征。通過同時(shí)訓(xùn)練FTNN以及這三個(gè)正則化項(xiàng),可以將來自源域的診斷信息應(yīng)用于目標(biāo)域中的相關(guān)診斷任務(wù)。
在FTNN模型的訓(xùn)練過程中,采用Adam優(yōu)化算法對(duì)式(12)進(jìn)行優(yōu)化,有效地加快了訓(xùn)練過程,解決了參數(shù)量大的問題,F(xiàn)TNN模型的訓(xùn)練過程的流程圖,如圖4所示。在域劃分階段,分別將BLMs和BRMs采集的數(shù)據(jù)集作為源域和目標(biāo)域。在特征提取過程中,源域和目標(biāo)域的樣本向前傳播到域共享CNN中,從而逐層獲得可遷移的特征。對(duì)于域自適應(yīng),學(xué)習(xí)的可遷移特征的多層MMD由式(8)計(jì)算。其次,由式(10)生成目標(biāo)域中未標(biāo)記樣本的偽標(biāo)簽。然后,正則化項(xiàng)對(duì)域共享CNN的參數(shù)集合進(jìn)行約束。最后對(duì)提出的FTNN模型進(jìn)行訓(xùn)練,直到滿足停止條件為止。在故障識(shí)別階段,利用FTNN模型對(duì)BRMs中的樣本進(jìn)行訓(xùn)練。
圖4 FTNN訓(xùn)練流程圖Fig.4 FTNN Training Flow Chart
通過兩個(gè)軸承故障診斷實(shí)例,驗(yàn)證了所提出的FTNN模型的有效性。在案例研究中,嘗試分別利用實(shí)驗(yàn)室電機(jī)軸承和實(shí)驗(yàn)室齒輪箱軸承的診斷信息來識(shí)別機(jī)車軸承的工作狀況。這三種數(shù)據(jù)集的介紹如下:實(shí)驗(yàn)室中使用的電機(jī)軸承的數(shù)據(jù)集由凱斯西儲(chǔ)大學(xué)提供,軸承(SKF6205)的振動(dòng)數(shù)據(jù)是通過放置在實(shí)驗(yàn)室電機(jī)驅(qū)動(dòng)端的加速度計(jì)獲得的[10]。在實(shí)驗(yàn)室用電火花加工技術(shù)模擬了軸承的單點(diǎn)故障,得出軸承的工作狀態(tài)包括正常(N)、內(nèi)圈故障(IF)、滾子故障(RF)和外圈故障(OF)。此外,還指出,每種斷層的直徑為0.0014英寸。實(shí)驗(yàn)中,采樣頻率設(shè)為12kHz。如表2所示,數(shù)據(jù)集A是在無負(fù)載(電機(jī)轉(zhuǎn)速約為1797r∕min)的情況下采集的,數(shù)據(jù)集B是在電機(jī)負(fù)載為3HP(電機(jī)轉(zhuǎn)速約為1730r∕min)的情況下采集的。數(shù)據(jù)集A和B共有404個(gè)樣本,每個(gè)樣本有1200個(gè)采樣點(diǎn)。
表2 數(shù)據(jù)集介紹Tab.2 Introduction of Data Sets
實(shí)驗(yàn)室齒輪箱軸承的數(shù)據(jù)集是從一個(gè)試驗(yàn)臺(tái)上收集的,該試驗(yàn)臺(tái)包括一臺(tái)電動(dòng)機(jī)、一個(gè)兩級(jí)固定軸齒輪箱、一個(gè)行星齒輪箱和一個(gè)磁力制動(dòng)器。電機(jī)的輸出轉(zhuǎn)速和轉(zhuǎn)矩依次通過定軸齒輪箱和行星齒輪箱傳遞,然后驅(qū)動(dòng)磁力制動(dòng)器帶負(fù)荷運(yùn)行。試驗(yàn)軸承(LDK UER204)安裝在固定軸齒輪箱的第一級(jí)輸入軸上,振動(dòng)數(shù)據(jù)由安裝在齒輪箱殼體軸承座上的加速度計(jì)采集。實(shí)驗(yàn)中,測(cè)試軸承包括N、IF、RF 和OF 四種工作狀態(tài),采樣頻率設(shè)定為12.8kHz,采集不同工作狀態(tài)下的振動(dòng)數(shù)據(jù)。同時(shí),電機(jī)轉(zhuǎn)速設(shè)定為1200r∕min,如表2所示。數(shù)據(jù)集C包含404個(gè)樣本,每個(gè)樣本有1200個(gè)采樣點(diǎn)。
另一個(gè)數(shù)據(jù)集來自機(jī)車軸承,測(cè)試軸承(552732QT)安裝在液壓馬達(dá)驅(qū)動(dòng)系統(tǒng)中。此外,試驗(yàn)軸承還包括正常、內(nèi)圈碰摩故障、滾子碰摩故障和外圈碰摩故障四種工作狀態(tài)。振動(dòng)數(shù)據(jù)由安裝在試驗(yàn)軸承外圈的加速計(jì)收集,在測(cè)試中,采樣頻率設(shè)置為12.8kHz。試驗(yàn)軸承由液壓缸加載,載荷為9800N(軸轉(zhuǎn)速約500r∕min)。如表2所示,數(shù)據(jù)集D包含四個(gè)故障類別和404個(gè)樣本,每個(gè)樣本有1200個(gè)采樣點(diǎn)。
根據(jù)表2,創(chuàng)建了三個(gè)遷移學(xué)習(xí)任務(wù),即A→D、B→D、還有C→D、數(shù)據(jù)集A、B和C為提供診斷信息的源域,而數(shù)據(jù)集D為目標(biāo)域。這些遷移學(xué)習(xí)任務(wù)的目標(biāo)是盡可能準(zhǔn)確地對(duì)數(shù)據(jù)集D中的樣本進(jìn)行分類。
4.2.1 FTNN的遷移結(jié)果
本小節(jié)驗(yàn)證了FTNN 模型對(duì)遷移學(xué)習(xí)任務(wù)A→D的有效性。在該方法中,α和β是重要的權(quán)衡參數(shù),嚴(yán)重影響了FTNN的遷移效果,因此,應(yīng)該分析參數(shù)的選取。分類精度與F2層中學(xué)習(xí)到的可遷移特征有關(guān),這些特征是分類前的最高層次特征。因此,在選取不同參數(shù)后,利用F2層學(xué)習(xí)到的可遷移特征的MMD來分析FTNN的遷移結(jié)果。參數(shù)α的取值范圍為{0,0.01,0.05,0.1,0.5,1},參數(shù)b的取值范圍為{0.01,0.05,0.1,0.5,1,5,10,50}。注意,每個(gè)實(shí)驗(yàn)進(jìn)行10次,計(jì)算平均值。
如圖5所示,當(dāng)參數(shù)α和β分別設(shè)為0.01和5時(shí),有效地減小了學(xué)習(xí)的可遷移特征的MMD。具體地說,當(dāng)權(quán)衡參數(shù)β小于0.5時(shí),MMD明顯大于其他情況下的MMD,這表明學(xué)習(xí)的可遷移特征的分布是欠適應(yīng)的。一旦權(quán)衡參數(shù)α較大時(shí),例如大于0.5,跨域差異也很難被校正。因此,偽標(biāo)記學(xué)習(xí)的性能與跨域差異有關(guān),較大的權(quán)衡參數(shù)α將限制學(xué)習(xí)的可遷移特征的分布適應(yīng)性。解決這一問題的一個(gè)有效途徑是選擇一個(gè)小的權(quán)衡參數(shù),它能夠平衡偽標(biāo)簽學(xué)習(xí)和分布適應(yīng)在代價(jià)函數(shù)中的影響程度。
圖5 不同折衷參數(shù)下學(xué)習(xí)的可轉(zhuǎn)移特征的MMDFig.5 MMD of Transferable Features Learned under Different Compromise Parameters
在用不同的權(quán)衡參數(shù)訓(xùn)練FTNN模型后,數(shù)據(jù)集D的分類精度,如圖6所示。當(dāng)參數(shù)α小于0.1,參數(shù)β大于1時(shí),F(xiàn)TNN在數(shù)據(jù)集D上的分類準(zhǔn)確率在(80~85)%之間。特別是當(dāng)α和β分別設(shè)為0.01和5時(shí),分類精度可以達(dá)到最大值。結(jié)合圖5和圖6中所示的結(jié)果,可以發(fā)現(xiàn)分類精度隨學(xué)習(xí)的可遷移特征的MMD而變化??蛇w移特征的MMD越小,分類精度越高。
圖6 不同折衷參數(shù)下數(shù)據(jù)集D的分類精度Fig.6 Classification Accuracy of Data set Dwith Different Compromise Parameters
4.2.2 與其他方法的比較
將該方法與CNN[11]、TCA[12]、DAFD[13]、DDC[14]和多層自適應(yīng)CNN(MACNN)[15]的遷移結(jié)果和遷移性能進(jìn)行了比較。CNN的模型結(jié)構(gòu)與FTNN相同,TCA是一種常用的遷移學(xué)習(xí)方法,正則項(xiàng)的權(quán)衡參數(shù)的取值范圍為{0.01,0.1,1,10,100},子空間維數(shù)的取值范圍為{2,4,8,16,32,64,128}。DAFD是一種能夠成功地完成軸承在不同工況下的遷移學(xué)習(xí)任務(wù)的智能診斷模型。對(duì)于正則化項(xiàng),有兩個(gè)重要的權(quán)衡參數(shù),它們的取值范圍均為10-5到105。DDC的模型結(jié)構(gòu)與FTNN相同,但它只是通過最小化F2層學(xué)習(xí)特征的MMD來減小分布差異。MACNN是FTNN的簡(jiǎn)化版本,不進(jìn)行偽標(biāo)簽學(xué)習(xí)。TCA和DAFD的輸入是頻譜數(shù)據(jù),而其它方法的輸入是原始振動(dòng)數(shù)據(jù)。研究表明,每種方法都有適合遷移學(xué)習(xí)任務(wù)的最優(yōu)參數(shù)。此外,每個(gè)實(shí)驗(yàn)進(jìn)行10次,平均值,如表3所示。從表3中可知,F(xiàn)TNN的平均分類準(zhǔn)確率為84.32%,是六種方法中分類準(zhǔn)確率最高的一種。由于缺乏域自適應(yīng),CNN的平均準(zhǔn)確率達(dá)到51.04%,低于FTNN 的準(zhǔn)確率。 TCA 的平均準(zhǔn)確率為46.04%,DAFD的準(zhǔn)確率為55.05%。這兩種方法的精度比FTNN差,因?yàn)樗鼈儫o法從樣本中提取高層特征,并且可能不適合處理跨域差異嚴(yán)重的任務(wù)。對(duì)于DDC,它的平均準(zhǔn)確率為76.23%,低于FTNN 的精度,因?yàn)镈DC 只是通過最小化最高層次特征的MMD 來減小分布差異。對(duì)于MACNN,其平均分類準(zhǔn)確率為80.55%,比FTNN小,但高于其它方法。實(shí)驗(yàn)結(jié)果驗(yàn)證了引入多層域自適應(yīng)和偽標(biāo)簽學(xué)習(xí)的有效性。
表3 遷移學(xué)習(xí)的分類精度(%)Tab.3 Classification Accuracy of Transfer Learning
通過引入遷移損耗和遷移比來比較FTNN與其他方法的遷移性能。在得到遷移損耗和遷移比的度量標(biāo)準(zhǔn)之前,需要考慮兩個(gè)指標(biāo),即遷移誤差err(S,T)和基線域內(nèi)誤差errb(T,T)。傳遞誤差是一種在源域S上訓(xùn)練并在目標(biāo)域T上進(jìn)行測(cè)試得到的誤差。如果一個(gè)基線模型在目標(biāo)域上訓(xùn)練并在同一個(gè)域上進(jìn)行測(cè)試,則將其測(cè)試誤差定義為基線域內(nèi)誤差?;谶@些定義,遷移損耗是遷移誤差與域內(nèi)基線誤差之間的差值。對(duì)于特定的遷移學(xué)習(xí)任務(wù),較小的遷移損失會(huì)產(chǎn)生更好的遷移性能,遷移率的計(jì)算公式為用于評(píng)價(jià)一種方法在m個(gè)遷移學(xué)習(xí)任務(wù)上的整體遷移性能,遷移比越大,表示遷移性能越好。CNN作為指標(biāo)計(jì)算的基線模型,數(shù)據(jù)集D分為訓(xùn)練集和測(cè)試集,訓(xùn)練集包含數(shù)據(jù)集D中50%的樣本,其余用于測(cè)試的樣本用于計(jì)算域內(nèi)基線誤差。CNN的體系結(jié)構(gòu)與FTNN相同,經(jīng)過10次試驗(yàn),基線模型在數(shù)據(jù)集D上的平均分類準(zhǔn)確率為99.02%,因此,域內(nèi)基線誤差誤差T為0.98%。然后對(duì)各種方法的遷移損耗和遷移比進(jìn)行了計(jì)算結(jié)果,如表4 所示。對(duì)于任務(wù)A→D、FTNN 的遷移損耗為15.33%,低于其它方法。在任務(wù)B→D的所有方法中,F(xiàn)TNN的遷移損耗最低,為14.07%。另外,F(xiàn)TNN 的遷移率為0.84,是這六種方法中最高的。結(jié)果表明,F(xiàn)TNN模型比其他方法具有更好的遷移性能。
表4 不同遷移任務(wù)A→D和B→D的遷移效果Tab.4 Migration Effects of Different Migration Tasks A→Dand B→D
為了直觀地理解遷移學(xué)習(xí)過程,引入了t分布隨機(jī)鄰域嵌入(t-SNE)算法。該算法能夠降低學(xué)習(xí)特征的維數(shù),并能直接繪制學(xué)習(xí)特征的分布圖。以任務(wù)BD為例,F(xiàn)TNN學(xué)習(xí)的可遷移特征,如圖7(f)所示。為了方便觀察比較結(jié)果,圖7(a)~圖7(e)中分別顯示了由CNN、TCA、DAFD、DDC 和MACNN 等其他方法提取的可遷移特征。
從圖7(a)所示的結(jié)果來看,由CNN學(xué)習(xí)的可遷移特征存在嚴(yán)重的分布差異。此外,目標(biāo)域中的特征集合效果差,類間距離小。因此,當(dāng)只利用源域中的樣本訓(xùn)練模型時(shí),CNN無法有效地對(duì)目標(biāo)域中未標(biāo)記的樣本進(jìn)行分類。從圖7(b)和圖7(c)可以看出,通過使用TCA和DAFD不能有效地適應(yīng)所學(xué)習(xí)的可遷移特征的分布。具體地說,在正常情況下和滾筒故障情況下,樣本的可遷移特征仍然存在嚴(yán)重的分布差異。結(jié)果表明,TCA和DAFD的分類準(zhǔn)確率在50%左右。對(duì)于圖7(d),DDC在層F2中調(diào)整學(xué)習(xí)的可遷移特征的分布,并且跨域差異明顯減小。因此,與CNN、TCA 和DAFD 相比,DDC 在數(shù)據(jù)集C上獲得了更高的診斷準(zhǔn)確率。至于圖7(e),學(xué)習(xí)到的可遷移特征比圖7(d)所示的分布差異小。這一結(jié)果直觀地解釋了多層域自適應(yīng)的有效性。圖7(f)表明,F(xiàn)TNN不僅有效地適應(yīng)了學(xué)習(xí)可遷移特征的分布,而且擴(kuò)大了學(xué)習(xí)可遷移特征的類間距離。因此,可以很容易區(qū)分它們,而且分布差異很小,因此,可以對(duì)目標(biāo)域中的樣本進(jìn)行正確的分類。
圖7 數(shù)據(jù)集B和數(shù)據(jù)集D上學(xué)習(xí)特征的可視化Fig.7 Visualization of Learning Features on Dataset Band Dataset D
希望利用實(shí)驗(yàn)室齒輪箱軸承的診斷知識(shí)來識(shí)別機(jī)車軸承的健康狀態(tài),即遷移學(xué)習(xí)任務(wù)C→D,對(duì)于這項(xiàng)任務(wù)同樣進(jìn)行了10次試驗(yàn),數(shù)據(jù)集D的平均診斷準(zhǔn)確率,如表5所示。根據(jù)表5的結(jié)果,F(xiàn)TNN的平均精度為74.81%,任務(wù)C→D的FTNN遷移性能也可以通過遷移損耗和遷移比來評(píng)估。從表5的結(jié)果來看,F(xiàn)TNN的遷移損耗和遷移比分別為24.21和0.76。
表5 遷移任務(wù)C→D的遷移效果Tab.5 Migration Effect of Migration Task C→D
將所提出的FTNN用于任務(wù)C→D的遷移結(jié)果和遷移性能與Case I中的其他5種方法進(jìn)行了比較,結(jié)果表明,每種方法的遷移結(jié)果和遷移性能都是在最優(yōu)參數(shù)選擇下獲得的。根據(jù)表5的比較結(jié)果發(fā)現(xiàn),在這六種方法中,所提出的FTNN 對(duì)數(shù)據(jù)集D的診斷精度最高。此外,F(xiàn)TNN的遷移損耗比其它方法低,遷移比也比其他方法高。與其他方法相比,這些結(jié)果也顯示了該方法的優(yōu)越性。通過t-SNE算法,CNN、DDC和FTNN學(xué)習(xí)到的可遷移特征,如圖8所示。根據(jù)學(xué)習(xí)特征的可視化,數(shù)據(jù)集D上遷移結(jié)果的混淆矩陣,如圖9所示。
圖8 數(shù)據(jù)集C和數(shù)據(jù)集D上學(xué)習(xí)特征的可視化Fig.8 Visualization of Learning Features on Data set Cand Data set D
圖9 數(shù)據(jù)集D的傳輸結(jié)果的混淆矩陣Fig.9 Confusion Matrix of Data set D
從圖8(a)可以看出,CNN 學(xué)習(xí)到的可遷移特征存在嚴(yán)重的分布差異。結(jié)果,當(dāng)CNN用數(shù)據(jù)集C訓(xùn)練時(shí),其對(duì)數(shù)據(jù)集D的分類精度接近預(yù)測(cè)值,即25%,如圖9(a)所示。對(duì)于DDC,可以通過最小化學(xué)習(xí)到的高級(jí)可遷移特征的MMD來調(diào)整跨域數(shù)據(jù)中可遷移特征的分布。因此,從圖8(b)的結(jié)果在一定程度上校正了跨域差異。此外,數(shù)據(jù)集D的DDC 分類精度高于CNN,如圖9(b)所示。從圖8(c)可以看出,所提出的FTNN 能夠修正不同方位數(shù)據(jù)的學(xué)習(xí)可遷移特征之間的分布差異。此外,由于源域和目標(biāo)域的子類別樣本之間的可遷移性不同,子類別樣本的分布差異得到了非對(duì)稱校正。例如,經(jīng)過遷移學(xué)習(xí)后,帶射頻的跨域樣本的分布差異仍然嚴(yán)重,而其他三類故障的分布差異得到了有效的修正。因此,根據(jù)圖9(c)所示的結(jié)果,F(xiàn)TNN 模型能夠正確地分類N、IF 和RF 的類別,但是對(duì)于未標(biāo)記的目標(biāo)域樣本錯(cuò)誤地識(shí)別類別RF。
為了提升傳統(tǒng)遷移學(xué)習(xí)故障診斷中信息挖掘深度,實(shí)現(xiàn)不同機(jī)器間的遷移學(xué)習(xí),提出了一種基于特征的遷移神經(jīng)網(wǎng)絡(luò)軸承智能故障診斷方法。
通過多個(gè)實(shí)驗(yàn)結(jié)果可以得出如下結(jié)論:
(1)FTNN模型能夠在無標(biāo)記數(shù)據(jù)的情況下更好地識(shí)別軸承的狀態(tài),與其他方法相比,該方法具有更高的分類精度。
(2)FTNN模型比其他方法具有更好的傳輸性能,具有更低的遷移損耗,更高的遷移率。
(3)引入多層域自適應(yīng)能夠自適應(yīng)學(xué)習(xí)可遷移特征的分布,從而校正跨域差異,引入偽標(biāo)簽學(xué)習(xí)能夠擴(kuò)大可遷移特征的類間距離。