葉禹含,鄭小霞,王 靜,楊爽勉
(上海電力大學(xué)自動(dòng)化工程學(xué)院,上海 200090)
軸承是機(jī)械裝備中至關(guān)重要的組件,其狀態(tài)會(huì)影響整個(gè)系統(tǒng)的穩(wěn)定性[1-2]。不僅本身容易發(fā)生故障,因其與其他部件緊密相連,隨著軸承故障程度加深會(huì)影響其他元器件的正常運(yùn)行,可能會(huì)使整個(gè)系統(tǒng)停機(jī),甚至?xí)斐扇藛T傷亡[3]。
實(shí)際采集到的軸承信號(hào)由多種模態(tài)混疊在一起,通常包含大量環(huán)境噪聲,需要實(shí)施降噪。王普等[4]利用小波分解對(duì)軸承信號(hào)進(jìn)行處理后,對(duì)高頻段的小波系數(shù)設(shè)置閾值分層自適應(yīng)處理,但是小波變換的冗余度較大。ZHENG等[5]提出一種自適應(yīng)均勻相位經(jīng)驗(yàn)?zāi)B(tài)分解法,可以自適應(yīng)的疊加正弦波的幅值大小,該方法對(duì)模態(tài)混疊現(xiàn)象處理有一定的成效,但是計(jì)算量比較大。粒子濾波(particle filter,PF)作為一種強(qiáng)適應(yīng)性濾波方法,在信號(hào)降噪等方面有非常明顯的優(yōu)勢(shì)[6-7]。劉云濤[8]提出一種蝴蝶算法優(yōu)化的粒子濾波算法。CHEN等[9]提出一種用帶變異算子的粒子群改進(jìn)粒子濾波算法,改善了粒子多樣性。但是以上智能算法的參數(shù)相對(duì)較多,增加了算法復(fù)雜程度。
經(jīng)過(guò)降噪處理后,選取合適的方法才能對(duì)故障類型準(zhǔn)確分類。CNN(convolutional neural network,CNN)具有強(qiáng)大的非線性數(shù)據(jù)處理能力,可直接對(duì)信號(hào)進(jìn)行特征提取。王琦等[10]利用1D-CNN網(wǎng)絡(luò)中利用1×1卷積核增強(qiáng)1D-CNN的非線性表達(dá)能力,并將全連接層用全局平均池化層取代。NISHAT等[11]提出一種EEMN結(jié)合CNN的故障診斷方法。以上方法雖能取得較高的準(zhǔn)確率,但是在實(shí)際的工程應(yīng)用中不同型號(hào)、工況下的軸承存在一定差異,實(shí)際運(yùn)行狀態(tài)復(fù)雜多變,不能使用同一深度學(xué)習(xí)模型進(jìn)行診斷。
遷移學(xué)習(xí)可以將在某個(gè)領(lǐng)域中訓(xùn)練到的模型應(yīng)用到另一個(gè)不同但是相關(guān)的領(lǐng)域問(wèn)題中,因此可以實(shí)現(xiàn)不同工況的故障診斷[12]。廖玉波等[13]以DBN為遷移框架對(duì)旋轉(zhuǎn)機(jī)械進(jìn)行遷移故障診斷,對(duì)沒(méi)有標(biāo)簽的目標(biāo)域數(shù)據(jù)進(jìn)行分類識(shí)別。該方法中源域、目標(biāo)域的模型差異仍然有提升的空間,且實(shí)現(xiàn)起來(lái)較為困難。張根保等[14]建立一種以稀疏自動(dòng)編碼器為框架的遷移故障診斷,將HKL散度用于域適應(yīng)訓(xùn)練中。從以上文獻(xiàn)可以看出,遷移學(xué)習(xí)技術(shù)主要以深度神經(jīng)網(wǎng)絡(luò)為架構(gòu),提取源域和目標(biāo)域的特征,將源域分類損失進(jìn)行優(yōu)化的同時(shí),對(duì)源域和目標(biāo)域的分布進(jìn)行約束。
基于此,本文提出一種基于改進(jìn)粒子濾波和卷積神經(jīng)網(wǎng)絡(luò)的軸承遷移故障診斷方法。利用天牛須改進(jìn)的粒子濾波進(jìn)行降噪處理,對(duì)于不同工況下軸承故障識(shí)別復(fù)雜的問(wèn)題,將深度學(xué)習(xí)與遷移學(xué)習(xí)相結(jié)合,在全連接層通過(guò)多層多核域適應(yīng)的方法縮短源域和目標(biāo)域的樣本分布差異,完成軸承的故障診斷。
粒子濾波的主體思想是在狀態(tài)空間種隨機(jī)產(chǎn)生一組粒子模擬當(dāng)前狀態(tài),近似系統(tǒng)隨機(jī)變量的概率密度函數(shù),遞推對(duì)粒子的權(quán)重、位置來(lái)改變和更新,獲得狀態(tài)最小方差估計(jì)。但是當(dāng)一個(gè)粒子的權(quán)重接近1而所有其他粒子的權(quán)重接近零時(shí),傳統(tǒng)粒子濾波算法容易發(fā)生粒子退化,進(jìn)而影響粒子濾波的效果。
天牛須算法(beetle antennae search,BAS)是受天牛覓食行為啟發(fā)提出的一種高效的智能優(yōu)化算法[15]。BAS算法參數(shù)少,運(yùn)算量小。
設(shè)在k維解空間中隨機(jī)生成天牛個(gè)體的朝向,并作歸一化處理。天牛左、右須的坐標(biāo)為:
(1)
式中,t為當(dāng)前迭代的次數(shù);xl、xr分別為左、右觸角的坐標(biāo);xt、dt分別為第t次迭代天牛的質(zhì)心位置和兩觸角間的距離。
判斷天牛左右須的氣味強(qiáng)度,進(jìn)而確定t+1時(shí)刻天牛質(zhì)心位置。
xt+1=xt-δt*b*sign(f(xr)-f(xl))
(2)
式中,sign為符號(hào)函數(shù);f(·)為適應(yīng)度函數(shù);fl和fr分別左右須感受到的氣味強(qiáng)弱大小,即為適應(yīng)度大?。沪膖為第t次迭代的移動(dòng)步長(zhǎng)。
更新左右兩須的距離和步長(zhǎng):
(3)
式中,ηd、ηδ分別為距離d和步長(zhǎng)δ的衰減系數(shù),通常δt=α*δt-1;α為步長(zhǎng)因子,一般情況下取0.95。
針對(duì)粒子多樣性匱乏問(wèn)題,本文采用BAS對(duì)PF重要性采樣進(jìn)行優(yōu)化,以此提高PF的性能。將天??闯闪W訛V波中的粒子,模擬天牛尋找食物過(guò)程,天牛不斷地更新自己的位置并向適應(yīng)度最高的最優(yōu)位置區(qū)域的移動(dòng),使粒子不斷地逼近真實(shí)系統(tǒng)狀態(tài)的后驗(yàn)概率的高似然區(qū),提高粒子分布合理性。
將最新量測(cè)值引入采樣中,定義適應(yīng)度函數(shù)為:
(4)
式中,Rk為觀測(cè)噪聲方差;yt、yperd分別為當(dāng)前觀測(cè)值和預(yù)測(cè)觀測(cè)值。f值越大說(shuō)明天牛所處的位置越好,粒子離真實(shí)最優(yōu)位置越近。
采用一維非線性非高斯經(jīng)典模型來(lái)驗(yàn)證不同參數(shù)下PF與BAS-PF的有效性并進(jìn)行對(duì)比分析,其狀態(tài)方程和觀測(cè)方程為:
(5)
式中,x(t)為狀態(tài)值;y(t)為量測(cè)值;系統(tǒng)噪聲、觀測(cè)噪聲u(t)、v(t)均是0均值噪聲,服從u(t)~N(0,5),觀測(cè)噪聲v(t)~N(0,1),初始狀態(tài)x0=0.1,仿真時(shí)間t=100。天牛須參數(shù):初始步長(zhǎng)為10,迭代次數(shù)n=50;α=0.95,按比例縮小步長(zhǎng)。
以RMSE作為算法穩(wěn)定性判斷的依據(jù),RMSE越小準(zhǔn)確率越高。粒子數(shù)量分別取100、200、500,最終平均結(jié)果為10次運(yùn)行的平均值?;綪F和BAS-PF的對(duì)比如表1所示。
表1 粒子數(shù)量不同時(shí)RMSE結(jié)果對(duì)比
可以看出,BAS-PF的均方根誤差總明顯小于PF的值。隨著粒子數(shù)量增多,兩種方法的均方根誤差值隨之變小,粒子數(shù)量增加會(huì)使運(yùn)算量大量提高,影響算法的時(shí)效性。本文方法在粒子數(shù)量為100時(shí)就有較高的精度,說(shuō)明了本文算法的準(zhǔn)確性。標(biāo)準(zhǔn)PF由于在運(yùn)算時(shí)舍棄大量權(quán)重低的粒子,粒子的多樣性低,而BAS-PF可以驅(qū)使粒子向后驗(yàn)概率高似然區(qū)移動(dòng),通過(guò)不斷調(diào)整粒子的位置使粒子分布更加合理,改善了粒子權(quán)值退化,降低了估計(jì)值與真實(shí)值之間的誤差。
以N=500為例,PF與BAS-PF的誤差絕對(duì)值對(duì)比如圖1所示。
圖1 誤差絕對(duì)值對(duì)比
可以看出,PF依然在一些點(diǎn)存在著極大的誤差,BAS-PF只有3個(gè)點(diǎn)的誤差較大,其他采樣點(diǎn)的誤差相對(duì)較小。實(shí)驗(yàn)結(jié)果表明,BAS-PF在信號(hào)重構(gòu)比PF具有更高的準(zhǔn)確率。
卷積神經(jīng)網(wǎng)絡(luò)通過(guò)多次卷積、池化,可獲取數(shù)據(jù)深層特征。但是隨著網(wǎng)絡(luò)的運(yùn)行,可能會(huì)發(fā)生過(guò)擬合現(xiàn)象,影響后續(xù)訓(xùn)練分類的準(zhǔn)確率。
為了增強(qiáng)對(duì)有效信息的利用率,可以在網(wǎng)絡(luò)中添加注意力機(jī)制(attention mechanism,AM)結(jié)構(gòu),其核心是尋找網(wǎng)絡(luò)中最重要的一部分信息進(jìn)行處理,增加對(duì)有效信息的利用率[16]。本文采用注意力機(jī)制中的通道注意力機(jī)制(squeezeand excitation Net,SE Net),增強(qiáng)通道之間的依賴關(guān)系。
各通道首先執(zhí)行最大池化和平均池化過(guò)程,再輸入到MPL感知器中處理變換,分別應(yīng)用于兩個(gè)通道中,最后進(jìn)行元素求和。
因軸承的故障振動(dòng)信號(hào)具有局部突變性的特點(diǎn),將注意力機(jī)制的思想引入到CNN網(wǎng)絡(luò)結(jié)構(gòu)獲取大量特征后,利用SE建立網(wǎng)絡(luò)中各通道間特征的映射聯(lián)系,可增強(qiáng)有用的特征,實(shí)現(xiàn)對(duì)軸承故障特征的準(zhǔn)確提取,將網(wǎng)絡(luò)模型的特征識(shí)別性能提高。
領(lǐng)域自適應(yīng)可通過(guò)增強(qiáng)兩個(gè)域之間的關(guān)聯(lián)性,使用帶有標(biāo)簽的源域?qū)Σ粠?biāo)簽的目標(biāo)域數(shù)據(jù)進(jìn)行分類。一般通過(guò)縮小源域和目標(biāo)域的距離,使兩域共享子空間,慣用手段如MMD、KL散度、布雷格曼散度。
最大均值差異(MMD)對(duì)樣本的兩個(gè)概率分布差異進(jìn)行評(píng)估,是一種核學(xué)習(xí)方法[17]。xs、xt利用核學(xué)習(xí)映射到希爾伯特空間,減少兩域的邊緣概率分布差異性,計(jì)算公式為:
(6)
式中,xs、xt分別為源域和目標(biāo)域的樣本域;φ為RKHS中xs、xt的一個(gè)非線性映射函數(shù);k(·)為高斯核函數(shù)。
(7)
式中,σ為核函數(shù)的帶寬。
MMD值越大,兩域間的數(shù)據(jù)分布差異性越大。采用多核最大均值差異(multi kernel-maximum mean discrepancies,MK-MMD)測(cè)量相關(guān)域的分布差異,使得兩域在希爾伯特空間的距離最小化。MK-MMD即在原MMD的基礎(chǔ)上用多個(gè)不同的高斯核函數(shù)構(gòu)造一個(gè)總和k,計(jì)算方式是用不同的σ計(jì)算MMD的距離和總核K的定義為:
(8)
式中,βu為多核的權(quán)重系數(shù)。
在兩個(gè)工況不同的域中,故障診斷的任務(wù)是相同的,即分類的類別是相同的。由于源域標(biāo)簽已知的,可以通過(guò)最小化訓(xùn)練樣本的分類誤差。利用交叉熵?fù)p失函數(shù),結(jié)合MK-MMD進(jìn)行約束構(gòu)建損失函數(shù)。損失函數(shù)公式為:
(9)
式中,θ為網(wǎng)絡(luò)中參數(shù);n為批量樣本數(shù)量;Dk為MK-MMD的大??;J(·)為交叉熵函數(shù);λ為MK-MMD的權(quán)重。
以1D-CNN為架構(gòu),構(gòu)建故障分類模型,整體結(jié)構(gòu)如圖2所示,整體架構(gòu)由數(shù)據(jù)處理、包括特征提取和領(lǐng)域自適應(yīng)3部分構(gòu)成。
圖2 故障診斷網(wǎng)絡(luò)
本文采用重疊采樣技術(shù)對(duì)數(shù)據(jù)進(jìn)行擴(kuò)充處理,以此提高樣本數(shù)據(jù)的數(shù)量。為了提升網(wǎng)絡(luò)的性能,在網(wǎng)絡(luò)中添加Dropout機(jī)制。利用BN技術(shù)對(duì)除了輸出層的卷積層及全連接層隱含層進(jìn)行優(yōu)化處理,加快模型的訓(xùn)練過(guò)程,減少梯度彌散的發(fā)生,增強(qiáng)網(wǎng)絡(luò)模型的泛化能力。
輸入的軸承信號(hào)首先經(jīng)過(guò)BAS-PF和數(shù)據(jù)增強(qiáng)技術(shù),得到一系列較為純凈的軸承信號(hào)。通過(guò)加入注意力機(jī)制的CNN模型實(shí)現(xiàn)特征提取。在每一層網(wǎng)絡(luò)后添加注意力機(jī)制結(jié)構(gòu),通過(guò)逐層通道注意力機(jī)制獲取更具判別性的故障特征。領(lǐng)域自適應(yīng)遷移診斷網(wǎng)絡(luò)通過(guò)在源域和目標(biāo)域之間使用MK-MMD,通過(guò)多層領(lǐng)域適配,減小遷移特征的分布差異,使學(xué)習(xí)的特征具有域差異最小化的特點(diǎn),本文在全連接層實(shí)現(xiàn)域適應(yīng)。具體操作如下:
(1)預(yù)處理:首先利用改進(jìn)的粒子濾波算法處理原始軸承信號(hào),然后利用重疊采樣處理降噪后的振動(dòng)信號(hào),擴(kuò)充其樣本的數(shù)量;
(2)將源域、目標(biāo)域同時(shí)輸入到網(wǎng)絡(luò)中,進(jìn)行加入注意力機(jī)制的卷積池化操作,提取高級(jí)故障特征;
(3)源域數(shù)據(jù)與目標(biāo)數(shù)據(jù)通過(guò)MK-MMD多層適配,構(gòu)建MK-MMD與交叉熵?fù)p失函數(shù)組合的損失函數(shù);
(4)輸?shù)絪oftmax分類器中,得到故障分類結(jié)果。
訓(xùn)練結(jié)束,CNN可以有效地獲得源域數(shù)據(jù)對(duì)應(yīng)健康狀態(tài)之間的關(guān)系,同時(shí)可以通過(guò)域自適應(yīng)最小化任務(wù)特定層中的分布差異。因此,可以獲得領(lǐng)域不變特征,并從相關(guān)但是不同的目標(biāo)域中獲得不同工況下相對(duì)滿意的特征。
本文采用(CWRU)軸承數(shù)據(jù)集驗(yàn)證提出方法的有效性。故障數(shù)據(jù)由內(nèi)圈、外圈和滾動(dòng)體故障組成,損傷直徑分別為:0.007 mm、0.014 mm、0.021 mm,每種轉(zhuǎn)速下共有10類軸承信號(hào),軸承故障信息如表2所示。
表2 軸承故障信息
針對(duì)實(shí)際軸承信號(hào),根據(jù)軸承的狀態(tài)空間描述,利用自回歸滑動(dòng)平均模型建立軸承振動(dòng)信號(hào)的離散狀態(tài)空間模型,獲得狀態(tài)方程和觀測(cè)方程。本文采用最終預(yù)報(bào)誤差準(zhǔn)則對(duì)軸承狀態(tài)空間模型定階。
軸承階數(shù)定位4階,以工況為軸承內(nèi)圈故障直徑0.007 mm為例,降噪實(shí)驗(yàn)結(jié)果如圖3所示。
圖3 降噪實(shí)驗(yàn)結(jié)果
經(jīng)過(guò)BAS-PF處理后的信號(hào)有了一定的改善,處理后信號(hào)峰值明顯變小,說(shuō)明BAS-PF對(duì)于軸承振動(dòng)信號(hào)的降噪具有一定的有效性。
利用4.2節(jié)處理后的數(shù)據(jù),根據(jù)上一章中的網(wǎng)絡(luò)模型進(jìn)行軸承變工況故障診斷實(shí)驗(yàn)。設(shè)計(jì)6個(gè)遷移任務(wù),選取表中一類工況作為源域數(shù)據(jù),目標(biāo)域?yàn)榱硪徊煌D(zhuǎn)速下數(shù)據(jù)。經(jīng)過(guò)重采樣數(shù)據(jù)擴(kuò)充處理后,每784個(gè)數(shù)據(jù)點(diǎn)作為一個(gè)樣本,每種轉(zhuǎn)速下有4000個(gè)樣本,每一工況10種類別,每類狀態(tài)有400樣本數(shù)據(jù)。訓(xùn)練集選取帶標(biāo)簽的源域數(shù)據(jù)和80%的無(wú)標(biāo)簽?zāi)繕?biāo)域數(shù)據(jù),在測(cè)試階段用無(wú)標(biāo)簽?zāi)繕?biāo)域剩余無(wú)標(biāo)簽數(shù)據(jù)驗(yàn)證網(wǎng)絡(luò)的分類性能。
為了驗(yàn)證本文方法的有效性,在相同的CNN結(jié)構(gòu)下用同一數(shù)據(jù)集選用以下方法進(jìn)行對(duì)比分析。
方法一SE:加入注意力機(jī)制的無(wú)遷移CNN網(wǎng)絡(luò),用有標(biāo)記的源域進(jìn)行訓(xùn)練,然后之間用于目標(biāo)域樣本進(jìn)行測(cè)試;
方法二DAN:加入單層MMD的域適應(yīng)遷移網(wǎng)絡(luò),其中FC3層網(wǎng)絡(luò)學(xué)習(xí)到的特征用于域自適應(yīng);
方法三SEDAN:加入注意力機(jī)制和單層MMD的域自適應(yīng)遷移網(wǎng)絡(luò),用FC3層網(wǎng)絡(luò)學(xué)習(xí)到的特征用于域自適應(yīng),取k=2,λ=0.1。
CNN網(wǎng)絡(luò)初始化參數(shù)為:學(xué)習(xí)率0.001,BatchSize批量大小100,迭代次數(shù)40次。選擇不同的負(fù)載,采用以上方法進(jìn)行遷移分類。
以A→B為例,本文方法在A→B的遷移任務(wù)中混淆矩陣、準(zhǔn)確率、損失函數(shù)曲線,如圖4、圖5所示。比較方法的結(jié)果對(duì)比如表3所示。
圖4 混淆矩陣 圖5 準(zhǔn)確率曲線
表3 分類結(jié)果對(duì)比 (%)
從圖4可以看出,在遷移任務(wù)中,一種類型的軸承特征幾乎都能被很好的識(shí)別,所有類型的準(zhǔn)確率都大于90%;從圖5中可以看出,在訓(xùn)練初始階段誤差較高,隨后迭代次數(shù)增加,準(zhǔn)確率急劇提升,最終趨于平穩(wěn),說(shuō)明此時(shí)兩域分布差異性達(dá)到理想化的目標(biāo),同時(shí)說(shuō)明說(shuō)明該方法有較強(qiáng)的學(xué)習(xí)能力。
從表3可以看出,加SE的多層MK-MMD網(wǎng)絡(luò)在幾種方法中準(zhǔn)確率最高,具有較強(qiáng)的學(xué)習(xí)能力,更適用于軸承的故障遷移診斷,能夠?qū)?shù)據(jù)進(jìn)行有效處理,適應(yīng)性更強(qiáng),最終平均準(zhǔn)確率為98.53%;與不加遷移的CNN相比,加入域適應(yīng)的遷移網(wǎng)絡(luò)準(zhǔn)確率明顯更高,都取得了比較好的分類結(jié)果;由于方法三、四僅僅只用了單層域適應(yīng)估計(jì)源域和目標(biāo)域之間分布差異性,而SE+MK-MMD利用兩層域適應(yīng)網(wǎng)絡(luò)更能拉近兩域希爾伯特空間的距離,學(xué)習(xí)到更多特征,可以使網(wǎng)絡(luò)的遷移學(xué)習(xí)能力更強(qiáng)。
為了進(jìn)一步證明所提方法的性能,更直觀的解釋本文方法在不同工況下分類性能優(yōu)于其他診斷方法的原因,利用T-分布式隨機(jī)領(lǐng)域嵌入法(t-distribution stochastic neighbor embedding,T-SNE)進(jìn)行降維處理,對(duì)網(wǎng)絡(luò)進(jìn)行可視化分析。以A→B為例,各個(gè)方法的T-SNE特征分布圖如圖6所示。
(a) 方法一 (b) 方法二
從圖6a可以看出不加入遷移學(xué)習(xí)的CNN網(wǎng)絡(luò)無(wú)法學(xué)習(xí)到有效特征,無(wú)法對(duì)故障特征進(jìn)行有效分離,特征大量重疊在一起;加入遷移學(xué)習(xí)后,不同狀態(tài)下軸承的故障特征不會(huì)大量重疊在一起,從圖6b和圖6c中可以看出,加入域適應(yīng)的遷移網(wǎng)絡(luò)能夠減小源域和目標(biāo)域的分布差異性,可將不同種類的特征大致區(qū)分,與前兩種方法相比,分類性能在一定程度上有所改善。對(duì)比其他幾種方法,圖6d能更好的分離故障特征,通過(guò)多層域適配進(jìn)一步縮小了兩域分布的差異性,證明本文方法能夠?qū)⒂?xùn)練好的源域模型直接應(yīng)用到目標(biāo)域中進(jìn)行訓(xùn)練。
本文以軸承為研究目標(biāo),基于粒子濾波和深度學(xué)習(xí)針對(duì)多工況下的軸承故障進(jìn)行研究,提出了一種用天牛須改進(jìn)的粒子濾波子和域適應(yīng)卷積神經(jīng)網(wǎng)絡(luò)的軸承故障診斷方法。實(shí)驗(yàn)結(jié)果表明:
(1)相比于標(biāo)準(zhǔn)PF,本文提出的BAS-PF的穩(wěn)定性和準(zhǔn)確性更好,能夠?qū)S承原始信號(hào)進(jìn)行有效處理。
(2)本文采用1D-CNN為框架遷移學(xué)習(xí)模型,通過(guò)添加注意力機(jī)制模塊對(duì)軸承故障特征進(jìn)行有效利用提升網(wǎng)絡(luò)的性能,并在全連接層添加MK-MMD縮短兩域分布差異,進(jìn)行變工況軸承故障診斷時(shí),能夠有效識(shí)別軸承的各類狀態(tài),具有很強(qiáng)的可靠性。