基于特征的遷移神經(jīng)網(wǎng)絡(luò)軸承智能故障診斷

2022-08-19 10:58王業(yè)統(tǒng)吳海威

機(jī)械設(shè)計(jì)與制造 2022年8期

王業(yè)統(tǒng)，吳海威，李美，蘇明

（1.海南科技職業(yè)大學(xué)信息工程學(xué)院，海南海口 571126；2.海南大學(xué)機(jī)電工程學(xué)院，海南 ?？?570228；3.海南科技職業(yè)大學(xué)機(jī)電工程學(xué)院，海南海口 571126）

1 引言

滾動(dòng)軸承是旋轉(zhuǎn)機(jī)械的重要組成部分，軸承的失效直接影響機(jī)械的性能，甚至導(dǎo)致嚴(yán)重的事故［1］。實(shí)際機(jī)器中使用的軸承（Bearings in Real-Case Machines，BRMS）大多在健康狀態(tài)下運(yùn)行，故障很少發(fā)生，因此，故障數(shù)據(jù)比健康數(shù)據(jù)更難收集。另外，數(shù)據(jù)量持續(xù)增長(zhǎng)，由于噪聲大、知識(shí)依賴性強(qiáng)，用信號(hào)處理的方法來表示數(shù)據(jù)是不合適的［2］。

因此，提出在實(shí)驗(yàn)室中模擬各種故障，然后從軸承試驗(yàn)機(jī)（Bearings in Laboratory Machines，BLM）上收集足夠的標(biāo)記數(shù)據(jù)，然而，由于測(cè)量環(huán)境的多樣性、運(yùn)行條件的多樣性、振動(dòng)傳遞路徑的多樣性等因素的影響，BLM和BRMS采集到的數(shù)據(jù)分布存在很大差異［3］。

遷移學(xué)習(xí)的目標(biāo)是使用源域中包含的知識(shí)來減少分布差異并提高目標(biāo)域預(yù)測(cè)模型的性能。為了實(shí)現(xiàn)這一目標(biāo)，基于特征的學(xué)習(xí)方法作為一種常用的遷移學(xué)習(xí)方法得到了廣泛的研究，該方法致力于從源域和目標(biāo)域的數(shù)據(jù)中提取可轉(zhuǎn)換特征，以減少跨域差異。文獻(xiàn)［4］提出了一種基于域自適應(yīng)的軸承故障診斷深度神經(jīng)網(wǎng)絡(luò)，利用源域的頻譜數(shù)據(jù)和目標(biāo)域的部分標(biāo)記數(shù)據(jù)對(duì)其進(jìn)行訓(xùn)練。文獻(xiàn)［5］采用稀疏自動(dòng)編碼器從不同運(yùn)行條件下的軸承中提取頻譜數(shù)據(jù)的特征，然后最小化最大平均偏差（MMD）以適應(yīng)學(xué)習(xí)到的可遷移特征的分布。文獻(xiàn)［6］采用基于域自適應(yīng)的深度卷積神經(jīng)網(wǎng)絡(luò)（CNN）完成不同噪聲環(huán)境下的軸承故障診斷。

雖然上述方法取得了一定效果，但是存在三個(gè)缺點(diǎn)：

（1）它們是在同一臺(tái)機(jī)器上進(jìn)行的診斷知識(shí)的遷移學(xué)習(xí)任務(wù)，能否在不同的機(jī)器之間進(jìn)行遷移學(xué)習(xí)還需探討。（2）上述方法存在性能下降的問題，并且忽略了振動(dòng)數(shù)據(jù)的平移不變性。（3）上述方法部分地利用了目標(biāo)域數(shù)據(jù)的分布信息，由于缺乏標(biāo)記信息，沒有充分利用目標(biāo)域中未標(biāo)記的數(shù)據(jù)來訓(xùn)練智能診斷模型［7-8］。

為了克服上述缺點(diǎn)，提出了一種基于特征的遷移神經(jīng)網(wǎng)絡(luò)軸承智能故障診斷方法，該方法能夠?qū)W習(xí)跨域差異小、類間距離小的可遷移特征。實(shí)驗(yàn)結(jié)果證明了提出方法的有效性。

2 基本理論

2.1 問題描述

令Ds和Dt分別表示源域和目標(biāo)域，如果將樣本空間表示Xs∈Ds和Xt∈Dt，源域和目標(biāo)域的數(shù)據(jù)樣本分別為xs∈Xs和xt∈Xt。將標(biāo)簽樣本表示為y={1 ，2，3，...，k} ，其中，包含k種正常工作狀態(tài)。假設(shè)從BLM和BRM采集的數(shù)據(jù)樣本服從邊際概率分布P(xs)和Q(xt)。

（1）利用Ds={Xs，P(xs)}的ns標(biāo)記樣本構(gòu) 建源域Xs=，以提供診斷信息。

（3）源域應(yīng)該為目標(biāo)域提供足夠的診斷信息，即yt?ys?y，其中ys和yt分別是源域和目標(biāo)域中的標(biāo)簽空間。

由于從不同的方位采集源域和目標(biāo)域的振動(dòng)數(shù)據(jù)，因此，這些數(shù)據(jù)的分布存在嚴(yán)重的差異。如果使用智能診斷模型同時(shí)從這些數(shù)據(jù)中學(xué)習(xí)特征，學(xué)習(xí)到的特征也會(huì)受到分布偏差的嚴(yán)重影響。從圖1（a）可以看出，通過最小化域共享分類器h( · )僅用源域樣本訓(xùn)練，這意味著基于所學(xué)習(xí)的特征可以實(shí)現(xiàn)分類任務(wù)，該分類器也可以很好地用于目標(biāo)域。然而，域共享分類器h( · )在目標(biāo)域上的泛化誤差卻很大，即分類器h( · )由于分別從源域和目標(biāo)域中的樣本中學(xué)習(xí)到的特征之間存在嚴(yán)重的分布差異，因此對(duì)目標(biāo)域樣本的分類結(jié)果基本上是錯(cuò)誤的。因此，這里目標(biāo)是建立一個(gè)智能診斷模型，從收集的數(shù)據(jù)中提取可遷移的特征，以減少跨域差異，然后強(qiáng)制域共享分類器h( · )以最小化的目標(biāo)域風(fēng)險(xiǎn)。如圖1（b）所示，智能診斷模型期望學(xué)習(xí)具有相似分布的可遷移特征。因此，域共享分類器可以根據(jù)源域提供的診斷信息正確識(shí)別目標(biāo)域樣本。

圖1 基于特征的轉(zhuǎn)移學(xué)習(xí)智能故障診斷Fig.1 Intelligent Fault Diagnosis Based on Feature Transfer Learning

2.2 MMD

最大平均差異（Maximum Mean Discrepancy，MMD）是一種非參數(shù)距離度量，用于度量?jī)蓚€(gè)數(shù)據(jù)集之間的分布差異。如果數(shù)據(jù)集和分別遵循概率分布p和q，則數(shù)據(jù)集X和Y之間的MMD定義如下。

式中：sup( · )—輸入集合的上界；H—再生核Hilbert 空間（Reproducing Kernel Hilbert Space，RKHS）；Φ( · )—原始特征空間到RKHS的非線性映射［9］。

通過分布的核平均嵌入，RKHS由拉普拉斯核和高斯核等特征核生成。因此，基于核均值嵌入的MMD經(jīng)驗(yàn)估計(jì)的計(jì)算表達(dá)式如下：

式中：k(·，· )—特征核。

3 提出方法

3.1 整體結(jié)構(gòu)

目的是建立一個(gè)基于特征遷移方法的智能診斷模型。該方法包括四個(gè)步驟：域劃分、特征提取、域自適應(yīng)和故障識(shí)別，如圖2所示。

圖2 提出方法的總體結(jié)構(gòu)Fig.2 The Overall Structure of the Proposed Method

在域劃分的一步中，源域包含標(biāo)記樣本以提供診斷信息，而目標(biāo)域中的未標(biāo)記樣本則期望利用源域中的診斷信息進(jìn)行分類。對(duì)于特征提取，采用非線性特征映射從源域和目標(biāo)域的數(shù)據(jù)中提取可遷移的特征。注意，源域和目標(biāo)域中的數(shù)據(jù)同時(shí)由相同的非線性特征映射處理。在域自適應(yīng)方面，首先用一個(gè)非參數(shù)距離指標(biāo)MMD來度量學(xué)習(xí)的可遷移特征的分布差異。然后，以學(xué)習(xí)到的可遷移特征的分布差異作為優(yōu)化目標(biāo)，反向傳播，訓(xùn)練非線性特征映射的參數(shù)。優(yōu)化的目的是使學(xué)習(xí)到的可遷移特征的分布差異最小化，從而得到具有較小跨域差異的特征。在故障識(shí)別中，最后利用域共享分類器對(duì)目標(biāo)域中未標(biāo)記樣本進(jìn)行正確分類。分類器充分地從源域樣本中學(xué)習(xí)特征的分布?；谟蜃赃m應(yīng)訓(xùn)練，目標(biāo)域樣本的學(xué)習(xí)特征分布與源域樣本相似。因此，域共享分類器還能夠正確地對(duì)目標(biāo)域中未標(biāo)記的樣本進(jìn)行分類。

3.2 FTNN

3.2.1 域共享CNN

FTNN的結(jié)構(gòu)，如圖3所示。該模型利用一個(gè)域共享CNN從源域和目標(biāo)域的原始振動(dòng)數(shù)據(jù)中提取可遷移特征。然后，通過多層域自適應(yīng)來減小學(xué)習(xí)的可遷移特征的分布差異。最后，對(duì)目標(biāo)域中未標(biāo)記的樣本分配偽標(biāo)簽，訓(xùn)練域共享的CNN。當(dāng)同時(shí)處理源域和目標(biāo)域中的樣本時(shí)，域共享CNN需要根據(jù)參數(shù)集進(jìn)行訓(xùn)練網(wǎng)絡(luò)。參數(shù)設(shè)置，如表1所示。通常，域共享CNN由卷積層、池化層和全連接層組成。

圖3 提出的FTNN模型的體系結(jié)構(gòu)Fig.3 The Architecture of the Proposed FTNN Model

表1 域共享CNN的參數(shù)Tab.1 Parameters of Domain Shared CNN

在卷積層中，域共享CNN采用共享核kl∈RH×L×D對(duì)l- 1層的輸出向量進(jìn)行卷積，其中，H—核的高度；l和D—核的長(zhǎng)度和深度。由于原始振動(dòng)數(shù)據(jù)為一維（1D）矢量，因此L設(shè)為1。假設(shè)前一層的輸出特征是，則第l層的輸出特征如下所示。

式中：D={s，t}—源域和目標(biāo)域的索引—從上一層l- 1 的特征中學(xué)習(xí)到的可遷移特性；bl—C1層偏差；σr( · )—矩形線性單位（ReLU），是解決梯度消失問題的常用的激活函數(shù)。

在此基礎(chǔ)上，利用池化層的下采樣過程來減少訓(xùn)練參數(shù)的個(gè)數(shù)，從而有效地克服過擬合問題。本研究采用最大池化的下采樣方式，將可遷移特征劃分為若干個(gè)不重疊的部分，并返回每個(gè)部分的最大值。源域和目標(biāo)域中的合并特征表示為：

式中：max( · )—返回向量的最大值；s—非重疊像素的高度。

可以根據(jù)層疊卷積層和池化層依次提取高層特征。然后將這些特征擴(kuò)展為一維向量。例如，層P2中的可遷移特征被擴(kuò)展成一維特征向量，作為全連接層F1的輸出。與多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)類似，F(xiàn)2層的輸出如下所示。

分類過程中，最后一個(gè)全連接層F3中使用softmax函數(shù)來預(yù)測(cè)樣本xsi和xti的類別。層F3的輸出表示樣本類別的概率分布，其表示如下：

3.2.2 多層域自適應(yīng)

為了減少分布差異，通過最小化學(xué)習(xí)到的可遷移特征的MMD 來訓(xùn)練域共享CNN 的參數(shù)。相關(guān)研究證明高層次特征在全連接層中的分布不一致，因此，最后一層神經(jīng)網(wǎng)絡(luò)除了用于分類外，還有必要調(diào)整學(xué)習(xí)的可遷移特征在層F1和F2中的分布。此外，在域共享CNN的訓(xùn)練過程中，學(xué)習(xí)特征的分布隨網(wǎng)絡(luò)參數(shù)的更新而變化，定義為內(nèi)部協(xié)變量偏移。為了緩解此問題，還需要調(diào)整卷積層C1和C2中學(xué)習(xí)到的可遷移特征的分布。因此，學(xué)習(xí)到的可遷移特征的多層MMD計(jì)算公式如下：

域共享CNN有利于學(xué)習(xí)具有特定域特性的可遷移特征，這使多層MMD值的變化較大。具體來說，高層特征的MMD值遠(yuǎn)大于淺層特征的MMD 值，因此，使用一個(gè)權(quán)衡參數(shù)Kl來平衡多層MMD的大小。該權(quán)衡參數(shù)是動(dòng)態(tài)的，以擴(kuò)大淺層特征的貢獻(xiàn)度，降低高層特征的貢獻(xiàn)度。

式（7）表明，核寬和時(shí)間復(fù)雜度嚴(yán)重影響MMD。一方面，以高斯核為例，式中：γ—核寬。如果γ→0，MMD會(huì)趨于0；同樣，如果選擇較大帶寬，也會(huì)降到0，比如γ→∞。為了解決這一問題，通過選取核帶寬γ作為所有樣本對(duì)之間的中值距離。另一方面，式（7）的時(shí)間復(fù)雜度為O(n2×l)，在共享域CNN的訓(xùn)練過程中消耗了大量的時(shí)間，為了解決這個(gè)問題，引入了的無偏估計(jì)來計(jì)算MMD。因此，式（7）可簡(jiǎn)化為：

其中，2n=ns=nt。式（8）的時(shí)間復(fù)雜度減小到O( )n×l，有效地加快了模型的訓(xùn)練速度。

最后通過最小化代價(jià)函數(shù)來減小學(xué)習(xí)的可遷移特征的分布差異。

式中：θc—C1，C2，F(xiàn)1和F2的參數(shù)集合。

3.2.3 偽標(biāo)簽學(xué)習(xí)

基于可遷移特征的多層自適應(yīng)可以減少可遷移特征的差異分布。然而，由于缺乏標(biāo)記的樣本，目標(biāo)域中的未標(biāo)記樣本不能用于訓(xùn)練F3層中的參數(shù)。為此，引入偽標(biāo)簽學(xué)習(xí)來解決這一問題。一個(gè)樣本的偽標(biāo)簽就是把預(yù)測(cè)概率最大的標(biāo)簽當(dāng)作真標(biāo)簽來選取，偽標(biāo)簽的生成包括兩個(gè)步驟：標(biāo)簽的概率預(yù)測(cè)和偽標(biāo)簽的轉(zhuǎn)換。F3層中的softmax函數(shù)預(yù)測(cè)目標(biāo)域中樣本的標(biāo)簽概率分布。因此，結(jié)合等式（6），偽標(biāo)簽可由下式計(jì)算：

源域和目標(biāo)域的樣本都是用來訓(xùn)練共享域CNN，因此，偽標(biāo)簽學(xué)習(xí)的優(yōu)化目標(biāo)表示為：

式中：J( ·，· )—損失函數(shù)；yis—源域中第i個(gè)樣本的真實(shí)標(biāo)簽；α—權(quán)衡參數(shù)；θ—域共享CNN的參數(shù)集合。

3.3 訓(xùn)練過程

提出的FTNN 模型通過三個(gè)正則項(xiàng)最小化來訓(xùn)練：（1）源域樣本的預(yù)測(cè)標(biāo)簽與真實(shí)標(biāo)簽之間的誤差；（2）目標(biāo)域樣本的預(yù)測(cè)標(biāo)簽與偽標(biāo)簽之間的誤差；（3）從跨域數(shù)據(jù)中學(xué)習(xí)可遷移特征的多層MMD。通過式（9）和式（11），F(xiàn)TNN 模型最終的計(jì)算表達(dá)式如下：

式中：β—權(quán)衡參數(shù)；n—梯度下降的最小批量樣本數(shù)。

本研究采用交叉熵?fù)p失函數(shù)，定義如下：

利用式（12）中的三個(gè)正則化項(xiàng)，提出的FTNN也會(huì)有相應(yīng)特征。首先，F(xiàn)TNN能夠?qū)W習(xí)可遷移特征，并根據(jù)這些特征對(duì)輸入樣本進(jìn)行分類。對(duì)源域中的標(biāo)記樣本進(jìn)行訓(xùn)練，得到診斷信息。其次，偽標(biāo)簽學(xué)習(xí)將目標(biāo)域樣本中的學(xué)習(xí)特征按預(yù)測(cè)的類別集合起來，擴(kuò)大了學(xué)習(xí)特征的類間距離，便于識(shí)別。最后一個(gè)階段，訓(xùn)練后的FTNN能夠在最小化學(xué)習(xí)到的可遷移特征的分布差異后，學(xué)習(xí)到服從相似分布的可遷移特征。通過同時(shí)訓(xùn)練FTNN以及這三個(gè)正則化項(xiàng)，可以將來自源域的診斷信息應(yīng)用于目標(biāo)域中的相關(guān)診斷任務(wù)。

在FTNN模型的訓(xùn)練過程中，采用Adam優(yōu)化算法對(duì)式（12）進(jìn)行優(yōu)化，有效地加快了訓(xùn)練過程，解決了參數(shù)量大的問題，F(xiàn)TNN模型的訓(xùn)練過程的流程圖，如圖4所示。在域劃分階段，分別將BLMs和BRMs采集的數(shù)據(jù)集作為源域和目標(biāo)域。在特征提取過程中，源域和目標(biāo)域的樣本向前傳播到域共享CNN中，從而逐層獲得可遷移的特征。對(duì)于域自適應(yīng)，學(xué)習(xí)的可遷移特征的多層MMD由式（8）計(jì)算。其次，由式（10）生成目標(biāo)域中未標(biāo)記樣本的偽標(biāo)簽。然后，正則化項(xiàng)對(duì)域共享CNN的參數(shù)集合進(jìn)行約束。最后對(duì)提出的FTNN模型進(jìn)行訓(xùn)練，直到滿足停止條件為止。在故障識(shí)別階段，利用FTNN模型對(duì)BRMs中的樣本進(jìn)行訓(xùn)練。

圖4 FTNN訓(xùn)練流程圖Fig.4 FTNN Training Flow Chart

4 提出算法研究

4.1 數(shù)據(jù)集

通過兩個(gè)軸承故障診斷實(shí)例，驗(yàn)證了所提出的FTNN模型的有效性。在案例研究中，嘗試分別利用實(shí)驗(yàn)室電機(jī)軸承和實(shí)驗(yàn)室齒輪箱軸承的診斷信息來識(shí)別機(jī)車軸承的工作狀況。這三種數(shù)據(jù)集的介紹如下：實(shí)驗(yàn)室中使用的電機(jī)軸承的數(shù)據(jù)集由凱斯西儲(chǔ)大學(xué)提供，軸承（SKF6205）的振動(dòng)數(shù)據(jù)是通過放置在實(shí)驗(yàn)室電機(jī)驅(qū)動(dòng)端的加速度計(jì)獲得的［10］。在實(shí)驗(yàn)室用電火花加工技術(shù)模擬了軸承的單點(diǎn)故障，得出軸承的工作狀態(tài)包括正常（N）、內(nèi)圈故障（IF）、滾子故障（RF）和外圈故障（OF）。此外，還指出，每種斷層的直徑為0.0014英寸。實(shí)驗(yàn)中，采樣頻率設(shè)為12kHz。如表2所示，數(shù)據(jù)集A是在無負(fù)載（電機(jī)轉(zhuǎn)速約為1797r∕min）的情況下采集的，數(shù)據(jù)集B是在電機(jī)負(fù)載為3HP（電機(jī)轉(zhuǎn)速約為1730r∕min）的情況下采集的。數(shù)據(jù)集A和B共有404個(gè)樣本，每個(gè)樣本有1200個(gè)采樣點(diǎn)。

表2 數(shù)據(jù)集介紹Tab.2 Introduction of Data Sets

實(shí)驗(yàn)室齒輪箱軸承的數(shù)據(jù)集是從一個(gè)試驗(yàn)臺(tái)上收集的，該試驗(yàn)臺(tái)包括一臺(tái)電動(dòng)機(jī)、一個(gè)兩級(jí)固定軸齒輪箱、一個(gè)行星齒輪箱和一個(gè)磁力制動(dòng)器。電機(jī)的輸出轉(zhuǎn)速和轉(zhuǎn)矩依次通過定軸齒輪箱和行星齒輪箱傳遞，然后驅(qū)動(dòng)磁力制動(dòng)器帶負(fù)荷運(yùn)行。試驗(yàn)軸承（LDK UER204）安裝在固定軸齒輪箱的第一級(jí)輸入軸上，振動(dòng)數(shù)據(jù)由安裝在齒輪箱殼體軸承座上的加速度計(jì)采集。實(shí)驗(yàn)中，測(cè)試軸承包括N、IF、RF 和OF 四種工作狀態(tài)，采樣頻率設(shè)定為12.8kHz，采集不同工作狀態(tài)下的振動(dòng)數(shù)據(jù)。同時(shí)，電機(jī)轉(zhuǎn)速設(shè)定為1200r∕min，如表2所示。數(shù)據(jù)集C包含404個(gè)樣本，每個(gè)樣本有1200個(gè)采樣點(diǎn)。

另一個(gè)數(shù)據(jù)集來自機(jī)車軸承，測(cè)試軸承（552732QT）安裝在液壓馬達(dá)驅(qū)動(dòng)系統(tǒng)中。此外，試驗(yàn)軸承還包括正常、內(nèi)圈碰摩故障、滾子碰摩故障和外圈碰摩故障四種工作狀態(tài)。振動(dòng)數(shù)據(jù)由安裝在試驗(yàn)軸承外圈的加速計(jì)收集，在測(cè)試中，采樣頻率設(shè)置為12.8kHz。試驗(yàn)軸承由液壓缸加載，載荷為9800N（軸轉(zhuǎn)速約500r∕min）。如表2所示，數(shù)據(jù)集D包含四個(gè)故障類別和404個(gè)樣本，每個(gè)樣本有1200個(gè)采樣點(diǎn)。

根據(jù)表2，創(chuàng)建了三個(gè)遷移學(xué)習(xí)任務(wù)，即A→D、B→D、還有C→D、數(shù)據(jù)集A、B和C為提供診斷信息的源域，而數(shù)據(jù)集D為目標(biāo)域。這些遷移學(xué)習(xí)任務(wù)的目標(biāo)是盡可能準(zhǔn)確地對(duì)數(shù)據(jù)集D中的樣本進(jìn)行分類。

4.2 從實(shí)驗(yàn)室電機(jī)軸承向機(jī)動(dòng)車軸承遷移學(xué)習(xí)

4.2.1 FTNN的遷移結(jié)果

本小節(jié)驗(yàn)證了FTNN 模型對(duì)遷移學(xué)習(xí)任務(wù)A→D的有效性。在該方法中，α和β是重要的權(quán)衡參數(shù)，嚴(yán)重影響了FTNN的遷移效果，因此，應(yīng)該分析參數(shù)的選取。分類精度與F2層中學(xué)習(xí)到的可遷移特征有關(guān)，這些特征是分類前的最高層次特征。因此，在選取不同參數(shù)后，利用F2層學(xué)習(xí)到的可遷移特征的MMD來分析FTNN的遷移結(jié)果。參數(shù)α的取值范圍為｛0，0.01，0.05，0.1，0.5，1｝，參數(shù)b的取值范圍為｛0.01，0.05，0.1，0.5，1，5，10，50｝。注意，每個(gè)實(shí)驗(yàn)進(jìn)行10次，計(jì)算平均值。

如圖5所示，當(dāng)參數(shù)α和β分別設(shè)為0.01和5時(shí)，有效地減小了學(xué)習(xí)的可遷移特征的MMD。具體地說，當(dāng)權(quán)衡參數(shù)β小于0.5時(shí)，MMD明顯大于其他情況下的MMD，這表明學(xué)習(xí)的可遷移特征的分布是欠適應(yīng)的。一旦權(quán)衡參數(shù)α較大時(shí)，例如大于0.5，跨域差異也很難被校正。因此，偽標(biāo)記學(xué)習(xí)的性能與跨域差異有關(guān)，較大的權(quán)衡參數(shù)α將限制學(xué)習(xí)的可遷移特征的分布適應(yīng)性。解決這一問題的一個(gè)有效途徑是選擇一個(gè)小的權(quán)衡參數(shù)，它能夠平衡偽標(biāo)簽學(xué)習(xí)和分布適應(yīng)在代價(jià)函數(shù)中的影響程度。

圖5 不同折衷參數(shù)下學(xué)習(xí)的可轉(zhuǎn)移特征的MMDFig.5 MMD of Transferable Features Learned under Different Compromise Parameters

在用不同的權(quán)衡參數(shù)訓(xùn)練FTNN模型后，數(shù)據(jù)集D的分類精度，如圖6所示。當(dāng)參數(shù)α小于0.1，參數(shù)β大于1時(shí)，F(xiàn)TNN在數(shù)據(jù)集D上的分類準(zhǔn)確率在（80～85）%之間。特別是當(dāng)α和β分別設(shè)為0.01和5時(shí)，分類精度可以達(dá)到最大值。結(jié)合圖5和圖6中所示的結(jié)果，可以發(fā)現(xiàn)分類精度隨學(xué)習(xí)的可遷移特征的MMD而變化?？蛇w移特征的MMD越小，分類精度越高。

圖6 不同折衷參數(shù)下數(shù)據(jù)集D的分類精度Fig.6 Classification Accuracy of Data set Dwith Different Compromise Parameters

4.2.2 與其他方法的比較

將該方法與CNN［11］、TCA［12］、DAFD［13］、DDC［14］和多層自適應(yīng)CNN（MACNN）［15］的遷移結(jié)果和遷移性能進(jìn)行了比較。CNN的模型結(jié)構(gòu)與FTNN相同，TCA是一種常用的遷移學(xué)習(xí)方法，正則項(xiàng)的權(quán)衡參數(shù)的取值范圍為｛0.01，0.1，1，10，100｝，子空間維數(shù)的取值范圍為｛2，4，8，16，32，64，128｝。DAFD是一種能夠成功地完成軸承在不同工況下的遷移學(xué)習(xí)任務(wù)的智能診斷模型。對(duì)于正則化項(xiàng)，有兩個(gè)重要的權(quán)衡參數(shù)，它們的取值范圍均為10-5到105。DDC的模型結(jié)構(gòu)與FTNN相同，但它只是通過最小化F2層學(xué)習(xí)特征的MMD來減小分布差異。MACNN是FTNN的簡(jiǎn)化版本，不進(jìn)行偽標(biāo)簽學(xué)習(xí)。TCA和DAFD的輸入是頻譜數(shù)據(jù)，而其它方法的輸入是原始振動(dòng)數(shù)據(jù)。研究表明，每種方法都有適合遷移學(xué)習(xí)任務(wù)的最優(yōu)參數(shù)。此外，每個(gè)實(shí)驗(yàn)進(jìn)行10次，平均值，如表3所示。從表3中可知，F(xiàn)TNN的平均分類準(zhǔn)確率為84.32%，是六種方法中分類準(zhǔn)確率最高的一種。由于缺乏域自適應(yīng)，CNN的平均準(zhǔn)確率達(dá)到51.04%，低于FTNN 的準(zhǔn)確率。 TCA 的平均準(zhǔn)確率為46.04%，DAFD的準(zhǔn)確率為55.05%。這兩種方法的精度比FTNN差，因?yàn)樗鼈儫o法從樣本中提取高層特征，并且可能不適合處理跨域差異嚴(yán)重的任務(wù)。對(duì)于DDC，它的平均準(zhǔn)確率為76.23%，低于FTNN 的精度，因?yàn)镈DC 只是通過最小化最高層次特征的MMD 來減小分布差異。對(duì)于MACNN，其平均分類準(zhǔn)確率為80.55%，比FTNN小，但高于其它方法。實(shí)驗(yàn)結(jié)果驗(yàn)證了引入多層域自適應(yīng)和偽標(biāo)簽學(xué)習(xí)的有效性。

表3 遷移學(xué)習(xí)的分類精度（%）Tab.3 Classification Accuracy of Transfer Learning

通過引入遷移損耗和遷移比來比較FTNN與其他方法的遷移性能。在得到遷移損耗和遷移比的度量標(biāo)準(zhǔn)之前，需要考慮兩個(gè)指標(biāo)，即遷移誤差err(S，T)和基線域內(nèi)誤差errb(T，T)。傳遞誤差是一種在源域S上訓(xùn)練并在目標(biāo)域T上進(jìn)行測(cè)試得到的誤差。如果一個(gè)基線模型在目標(biāo)域上訓(xùn)練并在同一個(gè)域上進(jìn)行測(cè)試，則將其測(cè)試誤差定義為基線域內(nèi)誤差?；谶@些定義，遷移損耗是遷移誤差與域內(nèi)基線誤差之間的差值。對(duì)于特定的遷移學(xué)習(xí)任務(wù)，較小的遷移損失會(huì)產(chǎn)生更好的遷移性能，遷移率的計(jì)算公式為用于評(píng)價(jià)一種方法在m個(gè)遷移學(xué)習(xí)任務(wù)上的整體遷移性能，遷移比越大，表示遷移性能越好。CNN作為指標(biāo)計(jì)算的基線模型，數(shù)據(jù)集D分為訓(xùn)練集和測(cè)試集，訓(xùn)練集包含數(shù)據(jù)集D中50%的樣本，其余用于測(cè)試的樣本用于計(jì)算域內(nèi)基線誤差。CNN的體系結(jié)構(gòu)與FTNN相同，經(jīng)過10次試驗(yàn)，基線模型在數(shù)據(jù)集D上的平均分類準(zhǔn)確率為99.02%，因此，域內(nèi)基線誤差誤差T為0.98%。然后對(duì)各種方法的遷移損耗和遷移比進(jìn)行了計(jì)算結(jié)果，如表4 所示。對(duì)于任務(wù)A→D、FTNN 的遷移損耗為15.33%，低于其它方法。在任務(wù)B→D的所有方法中，F(xiàn)TNN的遷移損耗最低，為14.07%。另外，F(xiàn)TNN 的遷移率為0.84，是這六種方法中最高的。結(jié)果表明，F(xiàn)TNN模型比其他方法具有更好的遷移性能。

表4 不同遷移任務(wù)A→D和B→D的遷移效果Tab.4 Migration Effects of Different Migration Tasks A→Dand B→D

為了直觀地理解遷移學(xué)習(xí)過程，引入了t分布隨機(jī)鄰域嵌入（t-SNE）算法。該算法能夠降低學(xué)習(xí)特征的維數(shù)，并能直接繪制學(xué)習(xí)特征的分布圖。以任務(wù)BD為例，F(xiàn)TNN學(xué)習(xí)的可遷移特征，如圖7（f）所示。為了方便觀察比較結(jié)果，圖7（a）～圖7（e）中分別顯示了由CNN、TCA、DAFD、DDC 和MACNN 等其他方法提取的可遷移特征。

從圖7（a）所示的結(jié)果來看，由CNN學(xué)習(xí)的可遷移特征存在嚴(yán)重的分布差異。此外，目標(biāo)域中的特征集合效果差，類間距離小。因此，當(dāng)只利用源域中的樣本訓(xùn)練模型時(shí)，CNN無法有效地對(duì)目標(biāo)域中未標(biāo)記的樣本進(jìn)行分類。從圖7（b）和圖7（c）可以看出，通過使用TCA和DAFD不能有效地適應(yīng)所學(xué)習(xí)的可遷移特征的分布。具體地說，在正常情況下和滾筒故障情況下，樣本的可遷移特征仍然存在嚴(yán)重的分布差異。結(jié)果表明，TCA和DAFD的分類準(zhǔn)確率在50%左右。對(duì)于圖7（d），DDC在層F2中調(diào)整學(xué)習(xí)的可遷移特征的分布，并且跨域差異明顯減小。因此，與CNN、TCA 和DAFD 相比，DDC 在數(shù)據(jù)集C上獲得了更高的診斷準(zhǔn)確率。至于圖7（e），學(xué)習(xí)到的可遷移特征比圖7（d）所示的分布差異小。這一結(jié)果直觀地解釋了多層域自適應(yīng)的有效性。圖7（f）表明，F(xiàn)TNN不僅有效地適應(yīng)了學(xué)習(xí)可遷移特征的分布，而且擴(kuò)大了學(xué)習(xí)可遷移特征的類間距離。因此，可以很容易區(qū)分它們，而且分布差異很小，因此，可以對(duì)目標(biāo)域中的樣本進(jìn)行正確的分類。

圖7 數(shù)據(jù)集B和數(shù)據(jù)集D上學(xué)習(xí)特征的可視化Fig.7 Visualization of Learning Features on Dataset Band Dataset D

4.3 從實(shí)驗(yàn)室齒輪箱軸承到機(jī)動(dòng)車軸承的遷移學(xué)習(xí)

希望利用實(shí)驗(yàn)室齒輪箱軸承的診斷知識(shí)來識(shí)別機(jī)車軸承的健康狀態(tài)，即遷移學(xué)習(xí)任務(wù)C→D，對(duì)于這項(xiàng)任務(wù)同樣進(jìn)行了10次試驗(yàn)，數(shù)據(jù)集D的平均診斷準(zhǔn)確率，如表5所示。根據(jù)表5的結(jié)果，F(xiàn)TNN的平均精度為74.81%，任務(wù)C→D的FTNN遷移性能也可以通過遷移損耗和遷移比來評(píng)估。從表5的結(jié)果來看，F(xiàn)TNN的遷移損耗和遷移比分別為24.21和0.76。

表5 遷移任務(wù)C→D的遷移效果Tab.5 Migration Effect of Migration Task C→D

將所提出的FTNN用于任務(wù)C→D的遷移結(jié)果和遷移性能與Case I中的其他5種方法進(jìn)行了比較，結(jié)果表明，每種方法的遷移結(jié)果和遷移性能都是在最優(yōu)參數(shù)選擇下獲得的。根據(jù)表5的比較結(jié)果發(fā)現(xiàn)，在這六種方法中，所提出的FTNN 對(duì)數(shù)據(jù)集D的診斷精度最高。此外，F(xiàn)TNN的遷移損耗比其它方法低，遷移比也比其他方法高。與其他方法相比，這些結(jié)果也顯示了該方法的優(yōu)越性。通過t-SNE算法，CNN、DDC和FTNN學(xué)習(xí)到的可遷移特征，如圖8所示。根據(jù)學(xué)習(xí)特征的可視化，數(shù)據(jù)集D上遷移結(jié)果的混淆矩陣，如圖9所示。

圖8 數(shù)據(jù)集C和數(shù)據(jù)集D上學(xué)習(xí)特征的可視化Fig.8 Visualization of Learning Features on Data set Cand Data set D

圖9 數(shù)據(jù)集D的傳輸結(jié)果的混淆矩陣Fig.9 Confusion Matrix of Data set D

從圖8（a）可以看出，CNN 學(xué)習(xí)到的可遷移特征存在嚴(yán)重的分布差異。結(jié)果，當(dāng)CNN用數(shù)據(jù)集C訓(xùn)練時(shí)，其對(duì)數(shù)據(jù)集D的分類精度接近預(yù)測(cè)值，即25%，如圖9（a）所示。對(duì)于DDC，可以通過最小化學(xué)習(xí)到的高級(jí)可遷移特征的MMD來調(diào)整跨域數(shù)據(jù)中可遷移特征的分布。因此，從圖8（b）的結(jié)果在一定程度上校正了跨域差異。此外，數(shù)據(jù)集D的DDC 分類精度高于CNN，如圖9（b）所示。從圖8（c）可以看出，所提出的FTNN 能夠修正不同方位數(shù)據(jù)的學(xué)習(xí)可遷移特征之間的分布差異。此外，由于源域和目標(biāo)域的子類別樣本之間的可遷移性不同，子類別樣本的分布差異得到了非對(duì)稱校正。例如，經(jīng)過遷移學(xué)習(xí)后，帶射頻的跨域樣本的分布差異仍然嚴(yán)重，而其他三類故障的分布差異得到了有效的修正。因此，根據(jù)圖9（c）所示的結(jié)果，F(xiàn)TNN 模型能夠正確地分類N、IF 和RF 的類別，但是對(duì)于未標(biāo)記的目標(biāo)域樣本錯(cuò)誤地識(shí)別類別RF。

5 結(jié)論

為了提升傳統(tǒng)遷移學(xué)習(xí)故障診斷中信息挖掘深度，實(shí)現(xiàn)不同機(jī)器間的遷移學(xué)習(xí)，提出了一種基于特征的遷移神經(jīng)網(wǎng)絡(luò)軸承智能故障診斷方法。

通過多個(gè)實(shí)驗(yàn)結(jié)果可以得出如下結(jié)論：

（1）FTNN模型能夠在無標(biāo)記數(shù)據(jù)的情況下更好地識(shí)別軸承的狀態(tài)，與其他方法相比，該方法具有更高的分類精度。

（2）FTNN模型比其他方法具有更好的傳輸性能，具有更低的遷移損耗，更高的遷移率。

（3）引入多層域自適應(yīng)能夠自適應(yīng)學(xué)習(xí)可遷移特征的分布，從而校正跨域差異，引入偽標(biāo)簽學(xué)習(xí)能夠擴(kuò)大可遷移特征的類間距離。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡