張 釗,李新宇,高 亮
(華中科技大學(xué) 機(jī)械科學(xué)與工程學(xué)院,湖北 武漢 430000)
故障診斷對于機(jī)械設(shè)備的健康管理十分重要,也是智能制造領(lǐng)域的研究熱點(diǎn)之一。目前,常用的故障診斷方法主要有3類[1]:基于模型的方法、基于信號處理的方法和基于數(shù)據(jù)驅(qū)動的方法。由于制造業(yè)信息化與數(shù)字化的不斷進(jìn)步,基于數(shù)據(jù)驅(qū)動的故障診斷方法已成為了當(dāng)前的研究熱點(diǎn),該類方法包括貝葉斯網(wǎng)絡(luò)(Bayes)[2-3]、支持向量機(jī)(Support Vector Machine,SVM)[4-5]、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)[6-9]等。CAI等[10]介紹了近幾十年來使用貝葉斯網(wǎng)絡(luò)進(jìn)行故障診斷的應(yīng)用研究;YIN等[11]介紹了基于支持向量機(jī)的故障診斷與監(jiān)測方法的研究現(xiàn)狀;ALI等[12]提出了選擇最重要固有模式函數(shù)(Intrinsic Mode Functions, IMF)的數(shù)學(xué)分析方法,將所選特征用于人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,完成對軸承缺陷的分類任務(wù)。
上述基于數(shù)據(jù)驅(qū)動的故障診斷方法一般采用傳統(tǒng)機(jī)器學(xué)習(xí)方法,它們大部分建立在訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)分布相同的假設(shè)上。然而,當(dāng)訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)的數(shù)據(jù)分布不同時(shí),傳統(tǒng)機(jī)器學(xué)習(xí)方法往往表現(xiàn)不佳[13]。實(shí)際生產(chǎn)過程中,機(jī)械設(shè)備的工作狀態(tài)與條件往往是動態(tài)變化的,設(shè)備所產(chǎn)生的故障診斷數(shù)據(jù)分布也會隨之改變。另外,在故障診斷中,高質(zhì)量的帶標(biāo)簽的數(shù)據(jù)通常較少,這給故障診斷帶來了較大的挑戰(zhàn)。
為了解決故障診斷數(shù)據(jù)不足的問題,無監(jiān)督的故障診斷方法受到了廣泛關(guān)注,LIU等[14]提出一種分類對抗自編碼器(Categorical Adversarial Autoencoder, CatAAE),用于滾動軸承的無監(jiān)督故障診斷。該模型通過對抗訓(xùn)練過程訓(xùn)練自動編碼器,嘗試對數(shù)據(jù)進(jìn)行聚類;HE等[15]提出一種基于深度信念網(wǎng)絡(luò)(Deep Belief Network, DBN)的人工智能方法,用于齒輪傳動鏈的無監(jiān)督故障診斷,并采用遺傳算法對網(wǎng)絡(luò)的結(jié)構(gòu)參數(shù)進(jìn)行優(yōu)化;SONG等[16]提出了一種基于迭代多流形譜聚類(Iterative Multi-manifold Spectral Clustering, IMMSC)的無監(jiān)督故障診斷方法,采用基于局部切線空間構(gòu)造親和矩陣的IMMSC來提高多流形分布數(shù)據(jù)的譜聚類性能;ZHANG等[17]提出一種稱為通用歸一化稀疏濾波(General Normalized Sparse Filtering, GNSF)的新型無監(jiān)督學(xué)習(xí)方法,用于智能故障診斷,該算法通過基于特征矩陣的廣義范數(shù)優(yōu)化目標(biāo)函數(shù),實(shí)現(xiàn)了特征稀疏度的度量。以上無監(jiān)督故障診斷方法大多采用聚類的方法對故障數(shù)據(jù)進(jìn)行分析,從而實(shí)現(xiàn)無監(jiān)督,沒有針對故障診斷數(shù)據(jù)分布不同這一類問題進(jìn)行無監(jiān)督故障診斷的討論。
由于大多數(shù)無監(jiān)督故障診斷方法對故障診斷數(shù)據(jù)分布變化這類問題討論較少,為了解決機(jī)械設(shè)備因工作狀態(tài)變化導(dǎo)致數(shù)據(jù)分布變化,標(biāo)簽故障數(shù)據(jù)較少的問題,考慮到遷移學(xué)習(xí)的主要任務(wù)是將一個(gè)領(lǐng)域所學(xué)習(xí)到的知識遷移到另外一個(gè)領(lǐng)域中,輔助另外一個(gè)領(lǐng)域的模型學(xué)習(xí)。其中的域適應(yīng)方法可以解決源域與目標(biāo)域的數(shù)據(jù)分布不同的問題。因此,將遷移學(xué)習(xí)與深度學(xué)習(xí)結(jié)合,可以在獲得深度學(xué)習(xí)模型較好特征表現(xiàn)能力的同時(shí),在一定程度上解決故障診斷中數(shù)據(jù)分布變化的問題。
基于遷移學(xué)習(xí)的故障診斷研究也有一些成果,GUO等[18]提出一種由條件識別模塊和域自適應(yīng)模塊組成的深度卷積遷移學(xué)習(xí)網(wǎng)絡(luò)(Deep Convolutional Transfer Learning Network, DCTLN);YANG等[19]提出一種基于特征的遷移學(xué)習(xí)網(wǎng)絡(luò)(Feature-based Transfer Neural Network, FTNN),設(shè)計(jì)了卷積神經(jīng)網(wǎng)絡(luò)模型損失函數(shù)的正則化項(xiàng),以減少數(shù)據(jù)分布差異;SHEN等[20]提出一種基于遷移學(xué)習(xí)的軸承故障診斷方法,利用輔助數(shù)據(jù)來輔助目標(biāo)域的數(shù)據(jù)分類;馮毅雄等[21]提出一種集成遷移學(xué)習(xí)的軸件表面缺陷實(shí)時(shí)檢測方法,建立了高速生產(chǎn)狀態(tài)下的軸件表面缺陷實(shí)時(shí)檢測模型;LI等[22]提出使用域適應(yīng)深度自編碼器方法來實(shí)現(xiàn)故障診斷,首先使用自動編碼器結(jié)構(gòu)將不同設(shè)備的特征投影到相同的子空間中,然后采用域自適應(yīng)算法,最大程度地減少來自不同機(jī)器的數(shù)據(jù)之間的分布差異;LU等[23]提出了域自適應(yīng)性的深度神經(jīng)網(wǎng)絡(luò)模型,用于故障診斷,并探索出模型最佳超參數(shù)的幾種策略。目前,現(xiàn)有的遷移學(xué)習(xí)與域自適應(yīng)方法更多傾向于解決加速模型訓(xùn)練、輔助數(shù)據(jù)分類、學(xué)習(xí)特征的域不變性的問題,對于如何更好地提取數(shù)據(jù)的特征與分層次的學(xué)習(xí)特征的域不變性缺乏討論。
針對故障診斷中數(shù)據(jù)分布變化的問題,本文提出了基于域適應(yīng)的神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)的無監(jiān)督故障診斷方法,重點(diǎn)解決源域有標(biāo)簽。而目標(biāo)域沒有標(biāo)簽的情況,則考慮通過源域的標(biāo)簽直接將模型遷移至目標(biāo)域,完成無監(jiān)督分類任務(wù)。將域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)方法相結(jié)合,可以很好地在利用好域適應(yīng)神經(jīng)網(wǎng)絡(luò)的深度網(wǎng)絡(luò)的特征提取與遷移能力的同時(shí),進(jìn)一步利用聯(lián)合分布自適應(yīng)方法的遷移能力,在提取的特征上進(jìn)行遷移。該方法采用了信號轉(zhuǎn)圖像方法,并使用卷積神經(jīng)網(wǎng)絡(luò)的方法對診斷數(shù)據(jù)進(jìn)行特征提取,分層次地采用了深度遷移學(xué)習(xí)與傳統(tǒng)淺層遷移學(xué)習(xí)方法,對診斷數(shù)據(jù)進(jìn)行了深度與淺層的特征域遷移。在深度網(wǎng)絡(luò)中,將由深度網(wǎng)絡(luò)所生成的源域與目標(biāo)域特征通過最小化最大均值差異(Maximum Mean Discrepancy, MMD)損失,使得兩個(gè)域的特征分布靠近;在淺層網(wǎng)絡(luò)中,聯(lián)合分布自適應(yīng)方法通過減少源域與目標(biāo)域的邊緣分布與條件分布的差異,達(dá)到遷移學(xué)習(xí)效果。
目前,基于數(shù)據(jù)驅(qū)動的故障診斷方法大部分使用的是傳統(tǒng)的機(jī)器學(xué)習(xí)方法。傳統(tǒng)機(jī)器學(xué)習(xí)方法是解決訓(xùn)練數(shù)據(jù)與測試數(shù)據(jù)的數(shù)據(jù)分布相同且訓(xùn)練任務(wù)和測試任務(wù)也相同的問題,但無法解決故障診斷數(shù)據(jù)分布發(fā)生變化的情況;而遷移學(xué)習(xí)是解決不同數(shù)據(jù)分布,或者不同學(xué)習(xí)任務(wù)的問題。PAN等[13]總結(jié)了遷移學(xué)習(xí)有3種類型,分別是源域與目標(biāo)域數(shù)據(jù)有分布差異、源任務(wù)與目標(biāo)任務(wù)有差異或兩者兼而有之。而其中域自適應(yīng)方法[24]作為一種遷移學(xué)習(xí),主要解決源域任務(wù)與目標(biāo)域任務(wù)相同,源域數(shù)據(jù)分布與目標(biāo)域數(shù)據(jù)分布不同的問題。故障診斷問題中,數(shù)據(jù)分布變化的診斷數(shù)據(jù)可以看作是遷移學(xué)習(xí)中的數(shù)據(jù)分布不同的源域與目標(biāo)域,因此域自適應(yīng)方法就可以解決數(shù)據(jù)分布變化的故障診斷問題。
在域自適應(yīng)方法中,有兩個(gè)域:具有足夠標(biāo)記數(shù)據(jù){Xs,Ys}的源域和沒有標(biāo)記數(shù)據(jù){Xt}的目標(biāo)域。根據(jù)CSURKA等[25]的觀點(diǎn),深度域適應(yīng)可以概括為3種情況:基于差異的深度域自適應(yīng)方法[26]、基于對抗網(wǎng)絡(luò)的深度域自適應(yīng)方法[27]和基于重構(gòu)的深度域自適應(yīng)方法[28]。
域適應(yīng)神經(jīng)網(wǎng)絡(luò)方法由GHIFARY等[29]提出,該方法屬于域自適應(yīng)方法,在給定分別屬于不同數(shù)據(jù)分布的源域Ds={Xs,Ys}與目標(biāo)域{Xt}下,能夠準(zhǔn)確地對無標(biāo)簽數(shù)據(jù)的目標(biāo)域數(shù)據(jù)進(jìn)行分類。該方法采用了一個(gè)簡單的神經(jīng)網(wǎng)絡(luò)模型來處理領(lǐng)域自適應(yīng)問題。將最大平均差異度量作為源域監(jiān)督學(xué)習(xí)中的正則化方法,以減少特征空間中源域和目標(biāo)域之間的數(shù)據(jù)分布不匹配性。
所用到的最大平均差異度量是衡量兩個(gè)樣本中概率分布之間差異的方法。給定源域與目標(biāo)域之間的條件概率分布分別為p與q,則最大平均差異度量(MMD)定義如下:
(1)
式中:X′S和X′T是XS和XT的映射,X′S={x′Si}={?(xSi)},X′T={x′Ti}={?(xTi)} ;?(·)是映射函數(shù),該映射函數(shù)主要是將源域與目標(biāo)域映射至高維希爾伯特空間上,在該空間里,源域與目標(biāo)域的數(shù)據(jù)分布差距能夠減少。
這種MMD方法在域適應(yīng)與遷移學(xué)習(xí)方法中已經(jīng)被廣泛使用,PAN等[30]提出了基于主成分分析(Principal Components Analysis, PCA)模型的遷移成分分析(Transfer Component Analysis, TCA)方法,采用MMD來衡量樣本間的差異;CHEN等[31]提出了具有數(shù)據(jù)分布自適應(yīng)功能的屬性網(wǎng)絡(luò)嵌入(Attributed Network Embedding with Data Distribution Adaptation, ANEDDA)方法,利用TCA方法來識別通用特征。實(shí)驗(yàn)證明該度量函數(shù)的確可以有效地度量兩個(gè)樣本分布的情況,減小MMD的方法能夠有效地進(jìn)行遷移學(xué)習(xí)。
域適應(yīng)神經(jīng)網(wǎng)絡(luò)方法將MMD度量方法作為正則化方法嵌入到有監(jiān)督的反向傳播訓(xùn)練中。 通過這種正則化方法,旨在訓(xùn)練網(wǎng)絡(luò)參數(shù),從而優(yōu)化監(jiān)督準(zhǔn)則,使得源域與目標(biāo)域的隱藏層特征表示數(shù)據(jù)分布差異減少。其方法的損失函數(shù)如下:
JDANN=JNNs+γMMD。
(2)
式中:JNNs表示域適應(yīng)神經(jīng)網(wǎng)絡(luò)中由源域數(shù)據(jù)訓(xùn)練得到的分類損失;MMD表示源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)在網(wǎng)絡(luò)隱藏層特征之間的分布差異;γ為對兩個(gè)損失之間的權(quán)重平衡參數(shù)。
聯(lián)合分布自適應(yīng)方法由LONG等[32]提出。在該方法中,源域Ds={Xs,Ys},目標(biāo)域Dt={Xt},包括兩個(gè)假設(shè):①源域和目標(biāo)域邊緣分布不同:Ps(xs)≠Pt(xt);②源域和目標(biāo)域條件分布不同:Qs(ys|xs)≠Q(mào)t(yt|xt) 。聯(lián)合分布自適應(yīng)方法的目標(biāo)就是尋找一個(gè)變換A,使經(jīng)過變換后的邊緣分布Ps(ATxs)與Pt(ATxt)、條件分布Ps(ys|ATxs)與Pt(yt|ATxt)同時(shí)相近。
首先減小邊緣概率分布差異,使得Ps(ATxs)與Pt(ATxt)盡可能相近,同TCA方法一樣,仍然采用最大均值化差異MMD距離來衡量兩個(gè)分布的邊緣概率分布差異。其中ns與nt分別表示源域與目標(biāo)域的樣本個(gè)數(shù)。
(3)
(4)
然后對源域與目標(biāo)域的條件概率分布進(jìn)行適配,使得Ps(ys|ATxs)與Pt(yt|ATxt)的距離也盡可能的小。得到總的優(yōu)化目標(biāo)為:
(5)
式中:Θ為拉克朗日乘子;H為中心矩陣;I為單位矩陣。
該無監(jiān)督故障診斷方法包括信號預(yù)處理階段、基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)模型深度訓(xùn)練階段和聯(lián)合分布自適應(yīng)淺層訓(xùn)練3個(gè)階段,方法整體流程框架如圖1所示。該方法主要包括3個(gè)步驟:①將源域有標(biāo)簽的故障診斷數(shù)據(jù)與目標(biāo)域無標(biāo)簽的故障的數(shù)據(jù)均轉(zhuǎn)化為RGB圖像。②將源域所轉(zhuǎn)化的RGB圖像訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)構(gòu)成特征生成器與Softmax分類器,與源域標(biāo)簽一起訓(xùn)練得到一個(gè)源域的特征生成器與分類器,再將目標(biāo)域所轉(zhuǎn)化的RGB圖像也參與原始特征生成器與分類器的訓(xùn)練,在分類損失函數(shù)的基礎(chǔ)上加入MMD最大平均差異度量損失函數(shù),最終實(shí)現(xiàn)基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練。③源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)經(jīng)過深度域適應(yīng)網(wǎng)絡(luò)模型得到的源域特征與目標(biāo)域特征,將所得到的特征作為聯(lián)合分布自適應(yīng)方法的輸入,構(gòu)建MMD矩陣,尋求自適應(yīng)矩陣,將源域特征與目標(biāo)域特征進(jìn)一步映射至域相近的高維空間,然后使用K-近鄰方法,最終完成目標(biāo)域的預(yù)測。
該方法主要適用于機(jī)械設(shè)備工作環(huán)境經(jīng)常發(fā)生變化、故障數(shù)據(jù)分布發(fā)生改變的情況,機(jī)械設(shè)備在某一工作條件下,已經(jīng)獲得了較多的振動信號的標(biāo)簽故障數(shù)據(jù),當(dāng)機(jī)械設(shè)備工作環(huán)境發(fā)生變化,能夠獲得該機(jī)械設(shè)備的相同類型的振動故障數(shù)據(jù)時(shí),可以通過該方法,在無需任何該工作條件下的帶標(biāo)簽故障數(shù)據(jù),就能提高機(jī)械設(shè)備在這一工作條件下的故障診斷的精度。
由于故障診斷信號一般為一維的時(shí)序振動信號,而卷積神經(jīng)網(wǎng)絡(luò)在對圖像進(jìn)行特征提取上具有杰出的表現(xiàn),為了使卷積神經(jīng)網(wǎng)絡(luò)能對故障診斷信號進(jìn)行較好的特征提取,將一維的時(shí)序信號轉(zhuǎn)化為圖像信號。
假設(shè)圖像的大小為n×n,截取的步長為a,則第m個(gè)截取部分應(yīng)為L(m×a+x)。 對截取部分使用快速傅立葉變換(Fast Fourier Transform, FFT),abs(·)函數(shù)對FFT變換結(jié)果取絕對值。然后,使用round(·)對信號進(jìn)行四舍五入,最后將信號轉(zhuǎn)換為RGB圖像。
L(m×a+x)=abs(FFT(L(m×a+x))),
(6)
(7)
如圖2所示,神經(jīng)網(wǎng)絡(luò)中特征生成器由3個(gè)卷積層、3個(gè)批標(biāo)準(zhǔn)化(Batch Normalization, BN)層、兩個(gè)Max_poll2d層和一個(gè)全連接層組成,激活函數(shù)為線性整流函數(shù)(Rectified Linear Unit, ReLU)。分類器部分包括兩個(gè)完全連接層和兩個(gè)BN層。特征生成器部分生成的源域特征與目標(biāo)域特征將用于計(jì)算源域與目標(biāo)域之間的MMD損失,并將損失直接加入模型的分類損失中。域適應(yīng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練步驟如下:
輸入:源域Ds={Xs,Ys},目標(biāo)域Dt={Xt}; 輸出:特征生成器G,分類器F,源域與目標(biāo)域特征。 開始 前向傳播: 使用源域Ds={Xs,Ys},目標(biāo)域Dt={Xt},獲得源域特征與目標(biāo)域特征 反向傳播: 計(jì)算MMD損失,與源域的分類損失JNNs,總損失JDANN=JNNs+γMMD,對模型進(jìn)行反向傳播直到收斂 返回特征生成器G,分類器F1,F2,源域與目標(biāo)域特征。
將基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)方法與聯(lián)合分布自適應(yīng)方法在著名的滾動軸承數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)。該實(shí)驗(yàn)在目標(biāo)域沒有任何標(biāo)簽樣本數(shù)據(jù)下,對目標(biāo)域進(jìn)行無監(jiān)督故障診斷,通過與其他實(shí)驗(yàn)進(jìn)行對比,來討論該方法在處理由于工作條件變化而帶來的故障診斷無監(jiān)督問題上的有效性與適用性。另外,為了模擬故障診斷問題在實(shí)際生產(chǎn)過程中的情況,逐步降低源域中標(biāo)簽樣本數(shù)量,討論源域中標(biāo)簽樣本數(shù)量變化對該方法所產(chǎn)生的影響,進(jìn)一步討論該方法在無監(jiān)督故障診斷問題上的有效性與適用性。
本實(shí)驗(yàn)采用Python編程,程序的運(yùn)行環(huán)境是Win10系統(tǒng),Inter i7處理器,9 750H CPU,主頻2.6 GHz。
凱斯西儲大學(xué)(Case Western Reserve University, CWRU)數(shù)據(jù)集[33]是著名的機(jī)械設(shè)備故障診斷數(shù)據(jù)集,由Reliance電動機(jī)驅(qū)動,驅(qū)動軸上安裝扭矩傳感器,將故障植入到驅(qū)動和風(fēng)扇端軸承。故障類型有內(nèi)圈斷層、外圈斷層和球斷層,這3種故障均有3種不同的尺寸大小,分別是0.007英尺、0.014英尺和0.021英尺。加上健康類型,因此CWRU數(shù)據(jù)集的故障診斷數(shù)據(jù)有10種故障類型。這10種故障類型在0~3馬力的負(fù)載下都有記錄。因此,整個(gè)CWRU故障診斷數(shù)據(jù)集可以獲得4個(gè)不同的工作條件下的實(shí)驗(yàn)數(shù)據(jù)。如圖3所示為CWRU數(shù)據(jù)集試驗(yàn)臺。
CWRU數(shù)據(jù)集有4種工作狀態(tài)下的數(shù)據(jù),為了驗(yàn)證所提方法是否能夠處理故障診斷的數(shù)據(jù)分布不同的問題,本節(jié)將討論CWRU數(shù)據(jù)集在不同工作狀態(tài)下的數(shù)據(jù)以及其數(shù)據(jù)分布是否會發(fā)生變化為了更加直觀地體現(xiàn)CWRU數(shù)據(jù)集的數(shù)據(jù)分布,采用隨機(jī)近鄰嵌入(T-distributed Stochastic Neighbor Embedding, TSNE)的方法,先對不同工作狀態(tài)下的1 024維特征的數(shù)據(jù)進(jìn)行聚類,投射到二維空間,然后再根據(jù)真實(shí)標(biāo)簽,畫出其數(shù)據(jù)分布,如圖4~圖7所示。圖4~圖7中橫縱坐標(biāo)分別代表該聚類后二維空間的坐標(biāo),圖中不同顏色代表在該工作狀態(tài)下數(shù)據(jù)的真實(shí)標(biāo)簽。總共10種類別,分別對應(yīng)10種顏色。
從圖4~圖7可以看出,CWRU數(shù)據(jù)集中,不同馬力負(fù)載下,不同類別的數(shù)據(jù)經(jīng)過TSNE聚類后,在二維空間的分布情況發(fā)生了不同程度的變化,證明其原始數(shù)據(jù)的數(shù)據(jù)分布均發(fā)生了不同程度的變化,若直接將在某一馬力負(fù)載下訓(xùn)練出來的模型運(yùn)用在另一負(fù)載下,其模型性能將會大大降低,因此所提的方法在該情況下具有較大意義,使用CWRU數(shù)據(jù)集完成所提方法有效性驗(yàn)證具有較大說服力。
CWRU數(shù)據(jù)集是著名的滾動軸承數(shù)據(jù)集,數(shù)據(jù)集內(nèi)采集了不同工作狀態(tài)的機(jī)械振動信號,3.2節(jié)也證明了不同工作狀態(tài)的機(jī)械振動信號,其數(shù)據(jù)分布也不同。因此,本節(jié)將基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)方法用于該數(shù)據(jù)集進(jìn)行無監(jiān)督故障診斷的方法驗(yàn)證,將某一工作狀態(tài)下的數(shù)據(jù)作為源域數(shù)據(jù),將另一工作狀態(tài)下的數(shù)據(jù)作為目標(biāo)域數(shù)據(jù)??紤]到在實(shí)際生產(chǎn)過程中,源域的數(shù)據(jù)也可能會較少,為了進(jìn)一步驗(yàn)證所提方法的有效性與可行性,在目標(biāo)域無任何標(biāo)簽數(shù)據(jù)的情況下,減少源域的標(biāo)簽數(shù)據(jù),討論源域訓(xùn)練樣本數(shù)據(jù)量變化對該方法所產(chǎn)生的影響。本部分實(shí)驗(yàn)將原始源域訓(xùn)練數(shù)量從16 000幅降低為1 600幅。為了保證實(shí)驗(yàn)的一般性,每組實(shí)驗(yàn)均連續(xù)運(yùn)行了10次,并將4種不同狀態(tài)的數(shù)據(jù)分別當(dāng)作源域和目標(biāo)域進(jìn)行了實(shí)驗(yàn)。如表1所示,L0、L1、L2與L3分別代表0馬力負(fù)載、1馬力負(fù)載、2馬力負(fù)載與3馬力負(fù)載的情況。例如L0-L1代表將0馬力負(fù)載的數(shù)據(jù)作為源域、1馬力負(fù)載的數(shù)據(jù)作為目標(biāo)域而進(jìn)行的實(shí)驗(yàn),表中給出的為95%的置信區(qū)間。表1給出了源域標(biāo)簽數(shù)量為16 000時(shí),目標(biāo)域作為測試集的實(shí)驗(yàn)準(zhǔn)確率,表2給出了源域標(biāo)簽數(shù)量為1 600時(shí),目標(biāo)域作為測試集的實(shí)驗(yàn)準(zhǔn)確率。
表1 源域標(biāo)簽數(shù)據(jù)量為16 000時(shí)目標(biāo)域?qū)嶒?yàn)準(zhǔn)確率
表2 源域標(biāo)簽數(shù)據(jù)量為1 600時(shí)目標(biāo)域?qū)嶒?yàn)準(zhǔn)確率
從表1和表2可以看出,在未經(jīng)過任何域自適應(yīng)遷移學(xué)習(xí)方法的處理下,只利用源域數(shù)據(jù)訓(xùn)練的CNN模型在目標(biāo)域上的準(zhǔn)確率較低,分別經(jīng)過域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)方法處理過的模型,可以適當(dāng)?shù)靥岣吣繕?biāo)域無監(jiān)督故障診斷的準(zhǔn)確性與穩(wěn)定性,同時(shí)經(jīng)過域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)方法處理過的模型,能夠達(dá)到更高的準(zhǔn)確性與穩(wěn)定性。另外,在面臨更為嚴(yán)峻的故障診斷條件下,即源域的標(biāo)簽數(shù)據(jù)減少到1 600時(shí),只利用CNN模型的方法準(zhǔn)確率下降明顯,分別只利用域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)方法的模型,準(zhǔn)確性也下降較多,基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)的方法均優(yōu)于其他方法。
為了進(jìn)一步說明所提方法的優(yōu)勢,證明所提方法的有效性與可行性,將基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)的方法與已有的其他遷移學(xué)習(xí)模型方法進(jìn)行比較(如表3),分別為:由ZHANG等[34]提出的自適應(yīng)批量歸一化方法(Adaptive Batch Normalization, AdaBN)方法,LI等[35]提出的多層最大平均化差異方法(Maximum Mean Discrepancies-Multiple Layers, MMD-ML),ZHANG等[36]提出的對抗域適應(yīng)卷積神經(jīng)網(wǎng)絡(luò)(Adversarial Adaptive Convolutional Neural Networks,A2CNN)方法。表3中,其他方法在文獻(xiàn)中只給出了部分遷移學(xué)習(xí)情況的數(shù)據(jù)結(jié)果,并且只有平均值,未給出置信區(qū)間。本文所提方法給出了全部測試情況的95%的置信區(qū)間結(jié)果。
表3 所提的方法與其他模型比較
由表3可以看出,所提方法在平均準(zhǔn)確率上高于其他方法,這是因?yàn)樗岱椒ㄊ褂昧颂卣魈崛∧芰^強(qiáng)的CNN網(wǎng)絡(luò),并多次使用域適應(yīng)方法,使得源域與目標(biāo)域的特征能夠在高維空間維度上盡可能地相近,從而進(jìn)一步證明了所提方法的有效性。
綜上所述,基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)方法在目標(biāo)域的無監(jiān)督故障診斷上可以達(dá)到較高的準(zhǔn)確率,因此基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)的方法可以有效地對知識進(jìn)行遷移,所提方法能夠處理由于數(shù)據(jù)分布改變造成的無監(jiān)督故障診斷問題,該方法可以訓(xùn)練出更高的準(zhǔn)確率與更具魯棒性的無監(jiān)督深度學(xué)習(xí)故障診斷模型。
為了解決由于工件狀態(tài)經(jīng)常發(fā)生變化,訓(xùn)練集與測試集數(shù)據(jù)分布不同,導(dǎo)致的目標(biāo)域中無標(biāo)簽樣本的故障診斷問題,本文提出一種基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)的無監(jiān)督故障診斷方法,通過CNN卷積神經(jīng)網(wǎng)絡(luò)模型從預(yù)先轉(zhuǎn)化為圖片的故障振動信號數(shù)據(jù)中提取深度特征,利用域適應(yīng)神經(jīng)網(wǎng)絡(luò)模型將不同數(shù)據(jù)分布的數(shù)據(jù)在深度特征維度上進(jìn)行數(shù)據(jù)分布的拉近,再利用聯(lián)合分布自適應(yīng)方法,再次將訓(xùn)練得到的深度特征映射至高維特征空間,使得源域與目標(biāo)域的邊緣數(shù)據(jù)分布與條件分布進(jìn)一步靠近,最后得到分類結(jié)果。在凱斯西儲大學(xué)的數(shù)據(jù)集上完成了實(shí)驗(yàn)驗(yàn)證,對故障診斷條件進(jìn)一步限制,逐步降低源域中標(biāo)簽樣本數(shù)量,以驗(yàn)證模型的有效性與可行性。結(jié)果表明,基于域適應(yīng)神經(jīng)網(wǎng)絡(luò)與聯(lián)合分布自適應(yīng)方法的模型能夠在無監(jiān)督故障診斷問題上得到更高準(zhǔn)確率與更具魯棒性的結(jié)果,從而驗(yàn)證了算法具有可行性與有效性。
本研究只對故障診斷中的故障振動信號進(jìn)行了討論,未討論其他類別的故障診斷信號,因此未來可以針對不同類別的故障診斷信號提出合適的模型。