馬航宇, 周 笛, 衛(wèi)宇杰, 吳 偉, 潘爾順
(1. 上海交通大學(xué) 機(jī)械與動力工程學(xué)院, 上海 200240; 2. 上海電機(jī)學(xué)院 凱撒斯勞滕智能制造學(xué)院, 上海 201306)
故障診斷是對機(jī)械設(shè)備故障原因的追溯,通常包括特征信號采集、信號提取處理、故障類別判斷3個環(huán)節(jié).伴隨互聯(lián)網(wǎng)技術(shù)發(fā)展和以神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)興起,部分學(xué)者將神經(jīng)網(wǎng)絡(luò)融合多領(lǐng)域技術(shù)用于故障識別、分類和診斷[1-6].孫旺等[1]將蟻群算法和神經(jīng)網(wǎng)絡(luò)相結(jié)合,解決神經(jīng)網(wǎng)絡(luò)在關(guān)鍵設(shè)備性能檢測時收斂速度慢、容易陷入最小值的問題;雷亞國等[2]利用頻域信號訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),擺脫對信號處理技術(shù)與診斷經(jīng)驗(yàn)的依賴,完成故障特征自適應(yīng)提取與健康狀況智能診斷;Wen等[3]將主成分分析法與神經(jīng)網(wǎng)絡(luò)相結(jié)合,通過降低數(shù)據(jù)特征冗余度以提高診斷準(zhǔn)確性;Hashim等[4]將離散小波變換和神經(jīng)網(wǎng)絡(luò)相結(jié)合,有效提升故障狀態(tài)聚類和分類的速度效果.隨著統(tǒng)計分析、信號處理、啟發(fā)式算法等各類方法的融入,神經(jīng)網(wǎng)絡(luò)在故障診斷領(lǐng)域的應(yīng)用愈發(fā)普及且取得較好效果.
軸承是旋轉(zhuǎn)機(jī)械的重要組成零件,也是故障高發(fā)零件之一.在旋轉(zhuǎn)機(jī)械故障中,僅軸承故障就高達(dá)30%[7].同時,在工程實(shí)際過程中,由于生產(chǎn)環(huán)境和工況條件不斷變化,設(shè)備服役工況并非恒定不變,定工況的神經(jīng)網(wǎng)絡(luò)故障診斷方法不足以有效識別所有故障類型,誤診率較高,所以需考慮變工況下系統(tǒng)運(yùn)轉(zhuǎn)過程與服役特征.結(jié)合部件服役的工況變化提取變工況特征信息和軸承故障信息,開展變工況下軸承故障診斷研究具有重要理論研究價值和工程應(yīng)用意義.
變工況故障診斷主要難點(diǎn)之一在于如何提取保留故障深層特征,使其在不同工況下依然能被有效識別.圍繞該問題的故障特征提取方法大致可分為信號處理、遷移學(xué)習(xí)(Transfer Learning, TL)和神經(jīng)網(wǎng)絡(luò)等.在信號處理過程中,通常采用多尺度熵從振動信號提取故障特征,以時間序列動態(tài)變化表征變工況.Minhas等[8]借助互補(bǔ)集成經(jīng)驗(yàn)?zāi)B(tài)分解法處理原始信號,采用加權(quán)多尺度熵提取故障特征;Ma等[9]針對故障多元信號問題,提出多元多尺度模糊分布熵提取故障特征,并用支持向量機(jī)識別工作狀態(tài).兩者均實(shí)現(xiàn)了對變工況振動信號的處理和故障診斷.在遷移學(xué)習(xí)方面,主要通過降低源域和目標(biāo)域的故障提取特征差異,實(shí)現(xiàn)不同工況下故障特征遷移.沈飛等[10]針對變工況需要建立不同模型的問題,提出譜質(zhì)心遷移學(xué)習(xí)模型,通過最小化源工況和目標(biāo)工況領(lǐng)域質(zhì)心均值距離實(shí)現(xiàn)特征遷移,減少后者的建模代價并增強(qiáng)模型通用性;Li等[11]提出基于知識映射的對抗域適應(yīng)法,將知識從目標(biāo)域泛化到源域,提取領(lǐng)域不變特征.而神經(jīng)網(wǎng)絡(luò)則是憑借其優(yōu)秀的自學(xué)習(xí)能力完成深層故障特征提取.Zhao等[12]針對設(shè)備頻繁改變工況的問題,設(shè)計了歸一化卷積神經(jīng)網(wǎng)絡(luò),通過批量歸一化消除特征分布差異,并結(jié)合卷積神經(jīng)網(wǎng)絡(luò)提取故障特征;趙小強(qiáng)等[13]針對軸承多工況下時域信號時變性較強(qiáng)等問題設(shè)計改進(jìn)殘差神經(jīng)網(wǎng)絡(luò),采用小卷積層串聯(lián)和堆疊以及加入殘差連接方式構(gòu)建數(shù)據(jù)池化層,有效提取深層特征信息.基于所提取深層特征,結(jié)合深度學(xué)習(xí)等各類方法進(jìn)一步完成變工況智能故障診斷.
在提取數(shù)據(jù)特征方面,作為典型神經(jīng)網(wǎng)絡(luò)之一的深度置信網(wǎng)絡(luò)(Deep Belief Network, DBN)[14],基于貝葉斯思想,通過找出數(shù)據(jù)的聯(lián)合概率分布,自動獲取潛藏在數(shù)據(jù)中難以解讀的深層信息.當(dāng)樣本數(shù)量較多時,DBN擁有強(qiáng)大的故障深層特征信息提取能力,是變工況智能故障診斷的有力工具.李艷峰等[15]將奇異值分解和DBN結(jié)合,通過把高維相關(guān)變量壓縮為低維獨(dú)立特征矢量完成故障特征提??;Ma等[16]將卷積殘差網(wǎng)絡(luò)、深層自動編碼器和DBN進(jìn)行加權(quán)集成,提出多目標(biāo)多工況的整體深度學(xué)習(xí)診斷方法;Wang等[17]提出基于半監(jiān)督受限玻爾茲曼機(jī)的DBN以縮減不同工況間的分類差距,提高故障分類準(zhǔn)確性;Che等[18]將時頻域特征輸入DBN,通過遷移學(xué)習(xí)將不同工況間數(shù)據(jù)差異最小化,實(shí)現(xiàn)變工況軸承故障診斷.通過融合各領(lǐng)域相關(guān)技術(shù),DBN提取深層故障特征的優(yōu)勢得到進(jìn)一步增強(qiáng),在變工況故障診斷中具有更優(yōu)越的泛化性和更高的準(zhǔn)確率.
上述對于DBN故障診斷的相關(guān)研究主要通過統(tǒng)計分析或信號處理等方法對輸入?yún)?shù)進(jìn)行降噪優(yōu)化預(yù)處理,特征提取過程均基于預(yù)處理數(shù)據(jù)進(jìn)行,雖在一定程度上提高了故障診斷正確率,但也導(dǎo)致原始數(shù)據(jù)深層特征和信息并未被完全保留.為更好發(fā)揮DBN在變工況下特征提取和故障診斷的優(yōu)勢,考慮系統(tǒng)運(yùn)轉(zhuǎn)的變工況特征,以滾動軸承為分析案例,通過有機(jī)融合DBN、遷移學(xué)習(xí)、數(shù)據(jù)丟失技術(shù)等提出考慮平移不變特征的自適應(yīng)深度置信網(wǎng)絡(luò)(Domain Adaptive Deep Belief Network with Shift-Invariant Features, SIF-DADBN),實(shí)現(xiàn)變工況智能故障診斷,具體如下:①針對變工況故障特征提取困難,設(shè)計固定學(xué)習(xí)步長的特征提取方法,結(jié)合DBN優(yōu)勢充分提取原始數(shù)據(jù)的平移不變特征,是變工況故障診斷的基礎(chǔ);②針對變工況同類故障難以被有效識別并分類,引入領(lǐng)域自適應(yīng)方法并加以改進(jìn),增強(qiáng)提取特征的普適性,是變工況故障診斷的關(guān)鍵;③針對本文特征提取方法導(dǎo)致的參數(shù)維度過高問題,結(jié)合數(shù)據(jù)丟失技術(shù)簡化網(wǎng)絡(luò)結(jié)構(gòu)的同時避免過擬合現(xiàn)象,最終提升變工況智能故障診斷的泛化性和準(zhǔn)確性.
DBN是由多個受限玻爾茲曼機(jī)(Restricted Boltzmann Machine, RBM)堆疊而成.如圖1所示,RBM是由顯層和隱層組成的隨機(jī)神經(jīng)網(wǎng)絡(luò)[19],顯層表征輸入數(shù)據(jù),通過訓(xùn)練完成權(quán)重計算形成隱層并作為第2個RBM的顯層,依次進(jìn)行堆疊,形成完整DBN網(wǎng)絡(luò).
為實(shí)現(xiàn)進(jìn)一步判別,需在DBN頂層加入數(shù)據(jù)標(biāo)簽和Softmax函數(shù)等進(jìn)行分類.在此基礎(chǔ)上,Hinton等[14]在Softmax之前添加多層前饋神經(jīng)網(wǎng)絡(luò),通過反向微調(diào)優(yōu)化網(wǎng)絡(luò)權(quán)值以提高判別準(zhǔn)確率,這就是經(jīng)典的DBN-深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)模型,也是DBN改進(jìn)的重要基礎(chǔ).
圖1 DBN結(jié)構(gòu)示意圖Fig.1 Schematic diagram of DBN structure
DBN-DNN運(yùn)行主要包含兩個關(guān)鍵步驟:基于RBM和對比散度(Contrastive Divergence, CD)算法的無監(jiān)督訓(xùn)練;基于反向傳播(Back Propagation,BP)算法的有監(jiān)督微調(diào).
1.2.1基于RBM和CD算法的無監(jiān)督訓(xùn)練 在訓(xùn)練過程中,需對RBM逐層訓(xùn)練最終完成對DBN整體的無監(jiān)督訓(xùn)練.考慮最底層RBM(記為第1層),顯層節(jié)點(diǎn)v1=(v1,v2, …,vi)(i=1, 2, …,I)和隱層節(jié)點(diǎn)h1=(h1,h2, …,hj)(j=1, 2, …,J)的聯(lián)合狀態(tài)能量函數(shù)表示為[20]
(1)
式中:ai和bj為顯、隱層的偏置;I和J為顯、隱層的節(jié)點(diǎn)數(shù);wij為顯隱層的連接權(quán)重.第j個隱層節(jié)點(diǎn)激活函數(shù)為
(2)
第i個顯層節(jié)點(diǎn)激活函數(shù)為
(3)
考慮軸承振動信號作為顯層向量v1輸入,利用式(2)可對隱層狀態(tài)函數(shù)求解,利用式(3)重構(gòu)顯層狀態(tài)函數(shù).因此,RBM通過調(diào)節(jié)參數(shù)w1、a1=(a1,a2, …,ai)和b1=(b1,b2, …,bj),使重構(gòu)誤差達(dá)到最小值實(shí)現(xiàn)信號特征提取和降維.其中
基于Hinton[21]提出的CD算法,權(quán)重和偏置變化量如下:
(4)
式中:ε為學(xué)習(xí)率;γ為采樣階次;〈 〉0為原始數(shù)據(jù)期望值;〈 〉γ為經(jīng)過γ次采樣并重構(gòu)后的數(shù)據(jù)期望值.基于式(4)進(jìn)一步可得權(quán)重和偏置更新公式為
(5)
式中:η為迭代次數(shù).
結(jié)合式(4)和(5),迭代計算各層RBM的參數(shù),用于下一步有監(jiān)督微調(diào).
(6)
式中:Xl為第l層理想輸出;wl和bl為該層待更新的權(quán)重和隱層偏置.采用梯度下降法進(jìn)行微調(diào)和更新,通過有監(jiān)督反向微調(diào)提高DBN分類準(zhǔn)確率,完成DBN訓(xùn)練和調(diào)優(yōu)過程.
在DBN軸承故障診斷相關(guān)研究中,為提升診斷正確率,通常對信號數(shù)據(jù)進(jìn)行預(yù)處理從而導(dǎo)致原始信號一定程度特征損失.因此,本文從盡可能保留原始數(shù)據(jù)特征的角度出發(fā),按固定學(xué)習(xí)步長(S)將原始信號進(jìn)行分解后充分學(xué)習(xí).
考慮包含M個數(shù)據(jù)的軸承振動信號,基于固定學(xué)習(xí)步長S將其分解成N段,每段表示為yn(t),n=1, 2, …,N,N=
M/S
,其中“
”表示向下取整.將分解后各段信號輸入到RBM網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,結(jié)合式(1),得到此時RBM的能量函數(shù)如下:
(7)
fn=sigmoid(wnyn(t)+bn),fn∈R1×J1
參照GB-T14452-93標(biāo)準(zhǔn)A型試樣,將釬焊后試樣線切割為長約34 mm、寬5±0.25 mm、高5±0.25 mm的條狀小試樣進(jìn)行三點(diǎn)彎曲試驗(yàn),測定釬焊接頭的抗彎強(qiáng)度。
(8)
式中:wn和bn為第n段信號的權(quán)重和偏置.將每段信號均做訓(xùn)練計算并進(jìn)行堆疊,得到原始信號特征向量矩陣,進(jìn)一步獲得該RBM層的輸出特征,表示為
(9)
F1∈R1×J1
式中:colmax表示對矩陣每一列求取最大值.具體平移不變特征提取過程如圖2所示.
圖2 基于固定學(xué)習(xí)步長的平移不變特征提取示意圖Fig.2 Schematic diagram of shift-invariant feature extraction based on fixed learning step size
基于提取并訓(xùn)練強(qiáng)化后的深層數(shù)據(jù)特征,進(jìn)一步和變工況特征進(jìn)行比對遷移,完成對同一故障不同工況特征的淡化.此處引入遷移學(xué)習(xí)中的領(lǐng)域自適應(yīng)方法,以多核最大平均差異(Multi-Kernel Maximum Mean Discrepancies, MK-MMD)概念表征不同工況下兩種數(shù)據(jù)樣本差異:針對存在于再生核希爾伯特空間Hk的概率分布p和q之間的距離,其MK-MMD的平方公式[22]為
(10)
式中:k為空間Hk中的特征核;xs~p和xt~q分別表示數(shù)據(jù)來源為源域的概率分布p和目標(biāo)域的q.在特征映射Φ當(dāng)中,核映射表示為k(xs,xt)=〈Φ(xs),Φ(xt)〉,可進(jìn)一步被定義為由m個內(nèi)核組合成的凸組合K,具體[23]表示為
(11)
式中:ku和αu為第u個內(nèi)核和對應(yīng)的權(quán)重,且所有權(quán)重之和為1.相比傳統(tǒng)單一核的最大平均差異,MK-MMD區(qū)別在于通過多核來構(gòu)造總的大核,使其能夠在運(yùn)算過程中擁有更多內(nèi)核選擇,提高特征差異計算準(zhǔn)確性.
考慮在變工況下進(jìn)行智能故障診斷,需使不同工況特征差異最小化,將領(lǐng)域自適應(yīng)和DBN相結(jié)合,采用MK-MMD計算不同工況間特征差異;另一方面,為保證故障診斷分類準(zhǔn)確率,需使DBN損失函數(shù)最小化.結(jié)合式(6)和(10),得到新的最小化目標(biāo)函數(shù)如下:
E=EDBN+EMK-MMD=
(12)
利用式(12)對目標(biāo)函數(shù)進(jìn)行調(diào)整,可使BP算法在更新網(wǎng)絡(luò)參數(shù)過程中,兼顧故障分類準(zhǔn)確率和變工況特征差異.如圖3所示,在2.1節(jié)中采用固定學(xué)習(xí)步長的特征提取,已實(shí)現(xiàn)軸承原始數(shù)據(jù)的各類深層特征提取(特征A~C),此時如果將工況三的測試集樣本直接輸入到由工況一訓(xùn)練好的DBN中,不同工況差異可能導(dǎo)致相同故障難以正確歸類,生成新故障種類(故障D~F);但若先將工況一和二的數(shù)據(jù)通過領(lǐng)域自適應(yīng)進(jìn)行學(xué)習(xí)調(diào)整,生成更具泛化性的訓(xùn)練集,在該情況下將工況三的測試集輸入到訓(xùn)練好的DBN中,就能準(zhǔn)確輸出故障種類,完成變工況下智能故障診斷.
圖3 基于領(lǐng)域自適應(yīng)法的特征遷移示意圖Fig.3 Schematic diagram of feature migration based on domain adaptive method
基于固定學(xué)習(xí)步長的特征提取方法能夠充分保留原始數(shù)據(jù)有效信息,雖更好地發(fā)揮了DBN優(yōu)勢,但同時也存在維數(shù)過高的弊端.結(jié)合神經(jīng)網(wǎng)絡(luò)運(yùn)作模式不難發(fā)現(xiàn),維度過高不僅會增加神經(jīng)網(wǎng)絡(luò)處理時間,也會增大網(wǎng)絡(luò)過擬合可能性,嚴(yán)重影響故障診斷準(zhǔn)確率.為保證所提方法有效性,在基于固定學(xué)習(xí)步長的特征提取上,引入數(shù)據(jù)丟失技術(shù)應(yīng)對上述兩個問題.
數(shù)據(jù)丟失技術(shù)是Hinton針對過擬合問題提出的有效技術(shù)之一[24].該技術(shù)核心在于訓(xùn)練過程中隨機(jī)將部分隱層節(jié)點(diǎn)舍棄.其中,舍棄節(jié)點(diǎn)并非永久移除,只是暫時不參與本次迭代和權(quán)值更新,從而完成訓(xùn)練過程中的網(wǎng)絡(luò)精簡,提高各隱層節(jié)點(diǎn)獨(dú)立性.集成數(shù)據(jù)丟失技術(shù)優(yōu)化DBN結(jié)構(gòu),能夠在提升運(yùn)行效率的同時,一定程度上規(guī)避過擬合問題.
結(jié)合所設(shè)計的DBN網(wǎng)絡(luò),在無監(jiān)督訓(xùn)練過程中,式(2)給出隱層節(jié)點(diǎn)激活函數(shù),加入數(shù)據(jù)丟失技術(shù)二進(jìn)制隨機(jī)變量r后如下所示:
(13)
式中:r服從參數(shù)為P的伯努利分布.當(dāng)r=1時概率為P,表示該隱層單元正常工作;當(dāng)r=0時概率為1-P,表示該單元暫時失效.
在后續(xù)有監(jiān)督微調(diào)中,計算節(jié)點(diǎn)誤差項(xiàng)時也以隨機(jī)概率將該節(jié)點(diǎn)舍棄并完成DBN訓(xùn)練.在測試階段,需將隱層節(jié)點(diǎn)輸出按照數(shù)據(jù)丟失技術(shù)設(shè)置的比例對應(yīng)減少.集成數(shù)據(jù)丟失技術(shù)的本文DBN訓(xùn)練過程如圖4所示.圖中:“×”代表該單元暫時失效.
圖4 集成數(shù)據(jù)丟失技術(shù)的DBN示意圖Fig.4 Schematic diagram of DBN in combination with dropout
融合DBN、遷移學(xué)習(xí)和數(shù)據(jù)丟失技術(shù)等方法,設(shè)計搭建DBN網(wǎng)絡(luò)架構(gòu)如圖5所示.圖中:w1~w5為第一輪訓(xùn)練時的權(quán)重;w1F~wF5為基于第1輪訓(xùn)練結(jié)果在第2輪訓(xùn)練時的權(quán)重.其中第1層(v0)為特征提取層,第2、3層(h1和h2)為訓(xùn)練優(yōu)化層,第4、5層(h3和h4)為自適應(yīng)訓(xùn)練層,第6層(Softmax)為分類輸出層.
圖5 DBN整體設(shè)計架構(gòu)示意圖Fig.5 Schematic diagram of DBN overall design architecture
在故障診斷過程中,首先結(jié)合DBN優(yōu)勢充分且有效提取故障特征,在提升診斷準(zhǔn)確率同時確保故障特征在變工況下依然能被有效識別;進(jìn)一步結(jié)合領(lǐng)域自適應(yīng)方法,通過變工況下的特征遷移學(xué)習(xí)減少特征差異,淡化工況特征,強(qiáng)化故障特征,最終實(shí)現(xiàn)變工況下智能故障診斷.具體診斷流程如圖6所示.圖中:η1~η4為各工況最大迭代次數(shù).
圖6 變工況診斷流程圖Fig.6 Diagnosis flow chart under variable working conditions
作為故障高發(fā)零件,軸承在工程實(shí)際中受變化服役工況的影響,故障診斷困難程度大大增加.對于變工況下軸承智能故障診斷,確保診斷方法正確率和泛化性尤為重要.
為驗(yàn)證所設(shè)計方法在變工況下故障診斷的有效性,采用凱斯西儲大學(xué)驅(qū)動端軸承公開數(shù)據(jù)集作為樣本.基于電機(jī)轉(zhuǎn)速建立4個不同工況樣本數(shù)據(jù)集A、B、C、D,如表1所示,其中空白表示無此項(xiàng).軸承故障位置分別有內(nèi)圈、外圈和滾動體3處,每處故障均包含3種損傷直徑,組合后共計9種故障類型.每個數(shù)據(jù)集選取1組正常樣本與9組不同類型故障樣本的組合,共計400個樣本,每個樣本包含 2 000 數(shù)
表1 數(shù)據(jù)集劃分情況Tab.1 Data set division
據(jù)點(diǎn),且均從原始數(shù)據(jù)的隨機(jī)位置開始提取,但在48 kHz采樣頻率下需保證提取至少1個周期的信號數(shù)據(jù).在此基礎(chǔ)上,進(jìn)一步劃分訓(xùn)練和測試集.其中,訓(xùn)練和測試集分別包含500和100個樣本,具體選取規(guī)則如下:訓(xùn)練集應(yīng)包括至少兩種工況,例如將數(shù)據(jù)集A的400個樣本作為源域進(jìn)行訓(xùn)練,將數(shù)據(jù)集B的100個樣本作為目標(biāo)域協(xié)助遷移學(xué)習(xí);測試集任取某一工況的100個樣本(如數(shù)據(jù)集C),此時組合記為A-B~C,表1中訓(xùn)練集和測試集劃分以A-B~C組合為例.
由圖5可知,所提網(wǎng)絡(luò)共由6層組成,節(jié)點(diǎn)數(shù)設(shè)置依次為200、200、160、100、50、10.RBM訓(xùn)練、BP算法微調(diào)的學(xué)習(xí)率均設(shè)為0.1,迭代次數(shù)分別設(shè)為100和150,訓(xùn)練批次為20,初始動量為0.1,持續(xù)動量為0.5.參數(shù)設(shè)置與傳統(tǒng)DBN無明顯差異.
本文搭建的DBN增加了固定學(xué)習(xí)步長S、領(lǐng)域自適應(yīng)法中的懲罰因子β和數(shù)據(jù)丟失概率P等3個參數(shù).其中,S是對原始信號數(shù)據(jù)的分解程度,設(shè)置大小應(yīng)適宜具體情況(本文設(shè)定為10).β在目標(biāo)能量函數(shù)中直接影響診斷結(jié)果,需進(jìn)行重點(diǎn)選擇.以A-B~B為例,令P=1(保留所有節(jié)點(diǎn)),β∈[0, 6](步進(jìn)0.3)且每組參數(shù)輸入DBN后重復(fù)10次,取其平均值和標(biāo)準(zhǔn)偏差,得到β和診斷正確率(Q)的關(guān)系如圖7所示.由圖可知,初始階段診斷正確率隨β增大而提升,說明遷移學(xué)習(xí)在變工況故障診斷中逐漸發(fā)揮重要作用.當(dāng)β=2.4,診斷正確率達(dá)到最高點(diǎn)并開始下降,說明β設(shè)置過高覆蓋了故障分類差異的能量函數(shù).
圖7 不同β取值下的診斷正確率Fig.7 Diagnostic accuracy rate at different β values
為配合數(shù)據(jù)丟失技術(shù)尋找最佳組合參數(shù),令β∈[1.6, 3.2](步進(jìn)0.2),與P∈[0.1, 1.0](步進(jìn)0.1)進(jìn)行交叉組合實(shí)驗(yàn),結(jié)果如圖8所示.由圖可知,β整體趨勢無明顯變化,診斷率最高點(diǎn)仍集中在2.4附近;P值較小時,由于舍棄網(wǎng)絡(luò)單元過多,導(dǎo)致正確率明顯下滑,隨著P值增長至0.4并逐漸接近1時(所有單元幾乎重新被激活),正確率逐漸提升.當(dāng)0.6≤P≤0.8且β=2.2時,故障診斷正確率達(dá)到峰值且附近幾乎為平面,說明此時正確率無明顯差異.令P取最小值0.6,可有效簡化網(wǎng)絡(luò)結(jié)構(gòu)(暫時舍棄盡可能多的單元).綜上,參數(shù)選擇β=2.2,P=0.6,可在有效提升診斷正確率的同時提升診斷速率.
圖8 β和P的交叉組合實(shí)驗(yàn)曲面圖Fig.8 Curved surface diagram of cross combination experiment of β and P values
基于3.2節(jié)參數(shù)設(shè)置,仍以A-B~B組合為例得到重構(gòu)誤差,如圖9所示(第1層RBM經(jīng)分解后重構(gòu)誤差較復(fù)雜,未在圖中表示).由圖可知,隨著迭代次數(shù)增加,每層重構(gòu)誤差逐漸減少,最后一層穩(wěn)定后接近0.05,說明提取特征已得到充分訓(xùn)練強(qiáng)化.
圖9 各層RBM重構(gòu)誤差圖Fig.9 RBM reconstruction error of each layer
試驗(yàn)發(fā)現(xiàn),集成數(shù)據(jù)丟失技術(shù)后損失函數(shù)能更快下降(見圖10).當(dāng)?shù)螖?shù)約大于150時,損失函數(shù)便提前進(jìn)入平穩(wěn)低值,神經(jīng)網(wǎng)絡(luò)已得到充分訓(xùn)練,說明數(shù)據(jù)丟失技術(shù)能有效提升分類正確率和運(yùn)算速率.
圖10 最終損失函數(shù)變化趨勢圖Fig.10 Trend chart of final loss function
在此基礎(chǔ)之上進(jìn)一步探究所提網(wǎng)絡(luò)運(yùn)行過程的故障分類效果,借助t分布隨機(jī)近鄰嵌入算法(t-distributed Stochastic Neighbor Embedding,t-SNE)[24]將訓(xùn)練過程關(guān)鍵節(jié)點(diǎn)可視化,如圖11所示.圖中僅展示內(nèi)圈故障(Inner race Fault, IF)、滾動體故障(Roller Fault, RF)、外圈故障(Outer race Fault, OF)和正常4類樣本.如圖11(a)所示,經(jīng)過基于固定學(xué)習(xí)步長的信號特征提取,4種樣本基本已相互分離,但各自并未完全聚集在一起,以IF為例就有多個聚集中心點(diǎn).通過多層RBM反復(fù)強(qiáng)化訓(xùn)練,得到輸出情況如圖11(b)所示,各類故障逐漸圍繞某一中心點(diǎn)開始聚攏,說明該DBN已經(jīng)基本能夠完成定工況下故障診斷.進(jìn)一步結(jié)合遷移學(xué)習(xí)后,由圖11(c)可知,此時DBN仍有較好的故障分類效果,且已具備變工況下故障診斷能力.圖中:t1和t2分別表示不同的t-SNE尺寸.
對A-B~B組合重復(fù)實(shí)驗(yàn)10次取均值,測得診斷正確率為97.8%,說明該方法已成功實(shí)現(xiàn)變工況故障診斷.為進(jìn)一步探究該方法的準(zhǔn)確性和泛化性,分別取數(shù)據(jù)集A-B和C-D作為訓(xùn)練集,并取數(shù)據(jù)集A~D作為測試集,獲取變工況故障診斷正確率如圖12所示.由圖可見,測試集選擇對故障診斷率有較大影響,正確率高低依次為源域>目標(biāo)域>其他.然而從A-B~C、A-B~D、C-D~A和C-D~B也能發(fā)現(xiàn),即便相較于其他4組診斷率較低,但正確率也均在90%以上.8個組合平均故障診斷正確率高達(dá)95.65%,說明所提網(wǎng)絡(luò)能有效實(shí)現(xiàn)變工況的故障診斷.
圖12 不同工況組合下的故障診斷正確率Fig.12 The diagnostic accuracy rate with different combinations of working conditions
為進(jìn)一步證明所提方法的準(zhǔn)確性和泛化性,選取另外5種方法進(jìn)行實(shí)驗(yàn)且相關(guān)參數(shù)設(shè)置如表2所示.其中,方法1為考慮平衡不變特性(Shift-Invariant Features, SIF)的自適應(yīng)DBN(SIF-DADBN),采用本文所提出的DBN:方法2(Raw-DBN)采用傳統(tǒng)DBN,以所有信號數(shù)據(jù)作為顯層直接輸入網(wǎng)絡(luò);方法3則參照文獻(xiàn)[18]采用快速傅里葉變換(Fast Fourier Transform, FFT)對數(shù)據(jù)進(jìn)行預(yù)處理,提取12個時頻域特征輸入DBN;方法4參照文獻(xiàn)[25],將遷移學(xué)習(xí)和支持向量機(jī)(Support Vector Machine, SVM)相結(jié)合,通過遷移高相似度樣本到源空間進(jìn)行訓(xùn)練并以SVM識別和分類;方法5僅以傳統(tǒng)SVM方法進(jìn)行診斷;方法6為基于遷移學(xué)習(xí)的生長型DBN(TL-GDBN),參照文獻(xiàn)[26]同樣將遷移學(xué)習(xí)和DBN結(jié)合形成自適應(yīng)DBN進(jìn)行診斷.各方法相關(guān)參數(shù)(如學(xué)習(xí)率、迭代次數(shù)等)盡量與本文保持一致,同樣集成數(shù)據(jù)丟失技術(shù),且方法4~6采用本文固定學(xué)習(xí)步長的信號分解方法提取故障特征作為輸入.
表2 不同方法的參數(shù)設(shè)置和比較Tab.2 Parameter setting and comparison of different methods
通過實(shí)驗(yàn),定工況下(測試集與源域相同,如A-B~A、B-C~B組合等)各方法故障診斷正確率如圖13所示.由圖可見,采用DBN的深度學(xué)習(xí)方法能更好提取數(shù)據(jù)特征并完成故障診斷,正確率穩(wěn)定在90%以上;進(jìn)一步對比方法1~3,發(fā)現(xiàn)本文所提方法的診斷正確率均相對較高,說明采用固定學(xué)習(xí)步長的特征提取方法更好地保留數(shù)據(jù)深層特點(diǎn),具有更高準(zhǔn)確率.
圖13 定工況下不同方法的故障診斷正確率Fig.13 Comparison of diagnostic accuracy of different methods under invariable working conditions
變工況下(測試集和源域不同)各方法診斷正確率如圖14所示.比較圖13和14發(fā)現(xiàn),變工況下未結(jié)合遷移學(xué)習(xí)的方法2、3、5正確率下降較為嚴(yán)重,基本難以達(dá)到90%.而結(jié)合遷移學(xué)習(xí)的方法1、4、6正確率僅呈小幅度下降,說明遷移學(xué)習(xí)在變工況故障診斷中發(fā)揮重要作用.進(jìn)一步觀察方法1和6,發(fā)現(xiàn)將深度學(xué)習(xí)和遷移學(xué)習(xí)結(jié)合后,無論是定工況和變工況下均有良好的表現(xiàn),診斷正確率均高于其他方法.
圖14 變工況下不同方法的故障診斷正確率Fig.14 Comparison of diagnostic accuracy of different methods under variable working conditions
綜合來看,SIF-DADBN在各類工況的故障診斷正確率均能穩(wěn)定高達(dá)90%,平均正確率接近95%,說明該方法能有效實(shí)現(xiàn)變工況故障診斷.此外,相較其他5種方法,該方法在變工況下具有更高的故障診斷正確率和泛化水平.
本文通過DBN、遷移學(xué)習(xí)和數(shù)據(jù)丟失技術(shù)等方法的有機(jī)融合,提出考慮平移不變特征的自適應(yīng)深度置信網(wǎng)絡(luò),并用于軸承智能故障診斷,網(wǎng)絡(luò)共由4部分組成.特征提取層考慮固定學(xué)習(xí)步長對原始信號進(jìn)行分解,提取數(shù)據(jù)平移不變的深層特征,并集成數(shù)據(jù)丟失技術(shù)進(jìn)行全網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化以規(guī)避過擬合問題;強(qiáng)化訓(xùn)練層基于RBM逐層堆疊對提取特征進(jìn)行反復(fù)強(qiáng)化;自適應(yīng)學(xué)習(xí)層結(jié)合MK-MMD完成變工況特征差異計算并進(jìn)行特征遷移,淡化工況特征,強(qiáng)化故障特征;分類輸出層基于特征和工況差異對網(wǎng)絡(luò)參數(shù)進(jìn)行二次微調(diào)更新,輸出變工況故障診斷結(jié)果.該方法對變工況故障識別率較高,實(shí)驗(yàn)樣本診斷正確率能穩(wěn)定在90%以上,平均診斷正確率高達(dá)95.65%;通過與其他方法的比較,進(jìn)一步驗(yàn)證所提方法在變工況下具有更高的準(zhǔn)確率和泛化性.未來,針對該方法樣本需求量較大和診斷對象單一的局限性,將通過結(jié)合標(biāo)記樣本擴(kuò)充方法研究小樣本下智能故障診斷,并應(yīng)用于齒輪等其他零部件故障診斷.