袁洪芳, 張曉寧, 王華慶
(1. 北京化工大學(xué) 信息科學(xué)與技術(shù)學(xué)院,北京 100029; 2. 北京化工大學(xué) 機(jī)電工程學(xué)院,北京 100029)
滾動軸承是機(jī)械設(shè)備中至關(guān)重要的零部件,其工作狀態(tài)和機(jī)械設(shè)備的運(yùn)行狀態(tài)密切相關(guān),對軸承進(jìn)行故障診斷研究具有重要意義。最初,常常通過傳統(tǒng)信號處理方法來判斷故障是否存在[1-3]。隨著機(jī)器學(xué)習(xí)的發(fā)展,開始將傳統(tǒng)的信號處理方法與機(jī)器學(xué)習(xí)方法如支持向量機(jī)、K近鄰算法等相結(jié)合實(shí)現(xiàn)故障信號的特征提取和識別[4-5]。近些年來,作為人工智能領(lǐng)域的前沿技術(shù),深度學(xué)習(xí)被廣泛地應(yīng)用到旋轉(zhuǎn)機(jī)械的故障診斷領(lǐng)域中,取得了突出的成果。經(jīng)典的深度學(xué)習(xí)方法包括自編碼器(autoencoder,AE)[6]、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)[7]和門控循環(huán)神經(jīng)網(wǎng)絡(luò)(gate recurrent unit,GRU)[8]等,其中CNN最為常用,并出現(xiàn)了Alexnet[9]、Resnet[10]等多種網(wǎng)絡(luò)結(jié)構(gòu)。Wang等[11]將擠壓激勵模塊和CNN相結(jié)合,對軸承的對稱點(diǎn)模式特征進(jìn)行識別。吳晨芳等[12]用軸承信號的二維灰度圖作為輸入,并對LeNet-5進(jìn)行改進(jìn),可以在不完備故障樣本中學(xué)習(xí)故障共性特征。牛銳祥等[13]針對模型泛化性能不足的問題,提出一種改進(jìn)的Densenet實(shí)現(xiàn)端到端的診斷。
然而,由于實(shí)際工業(yè)環(huán)境復(fù)雜,軸承的不同部位往往同時損壞并相互影響,這就導(dǎo)致復(fù)合故障的產(chǎn)生。這時,常常會出現(xiàn)某一種故障的嚴(yán)重程度遠(yuǎn)遠(yuǎn)大于另一種故障的情況,復(fù)合故障的特征受到更嚴(yán)重故障的影響,嚴(yán)重性較弱的故障很容易被忽略[14]。因此,復(fù)合故障診斷的難度大大增加。
針對復(fù)合故障的檢測,目前的研究大致有兩個方向。一是通過傳統(tǒng)分離提取方法分離不同類型的信號:Li等[15]提出了一種多重稀疏表示算法,有效地實(shí)現(xiàn)了軸承和齒輪箱復(fù)合故障的分離和檢測;齊詠生等[16]對故障信號進(jìn)行解卷積運(yùn)算,用Teager能量算子增強(qiáng)信號,并作傅里葉變換分析故障特征頻率,有效分離復(fù)合故障特征。二是結(jié)合多標(biāo)簽分類,通過深度學(xué)習(xí)方法自動識別分類:Huang等[17]首次提出了一種基于多標(biāo)簽學(xué)習(xí)的一維深度卷積神經(jīng)網(wǎng)絡(luò),可以實(shí)現(xiàn)旋轉(zhuǎn)機(jī)械復(fù)合故障的識別和解耦;Liang等[18]用小波變換提取二維時頻特征,建立多標(biāo)簽卷積神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)齒輪箱的復(fù)合故障診斷。
但是,要保證CNN的學(xué)習(xí)能力,往往需要大量的樣本用于訓(xùn)練,在實(shí)際工程中可能無法滿足。并且,它對不同特征的相對位置并不關(guān)注,缺少可用的空間信息,會不可避免的導(dǎo)致錯誤結(jié)果。2017年,Sabour等[19]提出了一種新型的網(wǎng)絡(luò)架構(gòu)——膠囊網(wǎng)絡(luò),其核心思想是構(gòu)造向量神經(jīng)元代替?zhèn)鹘y(tǒng)神經(jīng)網(wǎng)絡(luò)的標(biāo)量神經(jīng)元,保留空間信息,提高模型的特征提取能力。楊平等[20]提出了一種卷積膠囊網(wǎng)絡(luò),在噪聲污染和載荷變化的情況下得到了較好的診斷效果。Li等[21]提出一種雙卷積膠囊網(wǎng)絡(luò),用于小樣本條件下的旋轉(zhuǎn)機(jī)械故障診斷。Ke等[22]將膠囊網(wǎng)絡(luò)和長短期記憶網(wǎng)絡(luò)(long short-term memory, LSTM)相結(jié)合用于檢測模塊化多電平換流器發(fā)生子模塊產(chǎn)生的復(fù)合故障,證明了其用于復(fù)合故障診斷的可行性。然而,以上研究中所用的膠囊網(wǎng)絡(luò)通過動態(tài)路由算法進(jìn)行膠囊層之間的信息傳遞,常常需要耗費(fèi)大量的資源。Mazzia等[23]提出了一種高效的膠囊網(wǎng)絡(luò),用自注意路由代替動態(tài)路由,相較于原始膠囊網(wǎng)絡(luò)性能有了明顯提升。本文對膠囊網(wǎng)絡(luò)進(jìn)行改進(jìn),在網(wǎng)絡(luò)的前端特征提取部分中增加了關(guān)注通道特征信息的擠壓激勵模塊,并使用自注意路由進(jìn)行膠囊層之間信息的傳遞,提出了一種改進(jìn)的膠囊網(wǎng)絡(luò)用于復(fù)合故障診斷。利用實(shí)驗(yàn)室數(shù)據(jù)進(jìn)行驗(yàn)證,結(jié)果表明該方法可以有效地實(shí)現(xiàn)復(fù)合故障診斷。
卷積神經(jīng)網(wǎng)絡(luò)是一種前饋式神經(jīng)網(wǎng)絡(luò)模型,具有稀疏連接和權(quán)重共享的特性。它主要包括卷積層、池化層和全連接層。
卷積層通過對輸入信號進(jìn)行卷積運(yùn)算來提取特征。對于輸入x,卷積運(yùn)算可表示為
h=f(w*x+b)
(1)
式中:w為卷積核的權(quán)重;b為偏置項(xiàng);符號*為卷積運(yùn)算;f(·)為非線性激活函數(shù),常用的有relu函數(shù),可以寫成
f(x)=max(0,x)
(2)
池化層也稱為下采樣層,主要作用是降維,也可以加快訓(xùn)練。常用的方式為最大池化
h=f[max(x)+b]
(3)
式中:x和h分別為輸入和輸出特征;b為偏置項(xiàng);max(·)為取最大值函數(shù);f(·)為激活函數(shù)。
全連接層起到一個分類器的作用,可以實(shí)現(xiàn)所提取特征和樣本標(biāo)簽的映射,完成分類任務(wù)。
擠壓激勵模塊是Hu等[24]首次提出的一種新結(jié)構(gòu),該模塊專注于通道信息,通過學(xué)習(xí)的方式自動獲取每個特征通道的重要程度,并根據(jù)學(xué)習(xí)到的重要程度提升有用特征抑制用處不大的特征。它主要包括擠壓和激勵兩種操作,網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 擠壓激勵模塊網(wǎng)絡(luò)結(jié)構(gòu)圖
擠壓操作通過全局平均池化將每個特征通道的空間信息壓縮為一個代表通道全局特征信息的值。統(tǒng)計(jì)信息z∈Rc在空間維度W×H上壓縮成,z的第c個元素可以通過式(4)計(jì)算
(4)
式中:Fsq(·)為壓縮操作;uc為第c個特征。
激勵操作通過兩個全連接層實(shí)現(xiàn):第一個全連接層將特征維度壓縮到輸入的1/r,并使用relu函數(shù)激活;第二個全連接層進(jìn)行升維操作來恢復(fù)原始特征維度,再利用sigmoid函數(shù)控制得到歸一化權(quán)重。該操作可表示為
s=Fex(z,W)=σ[g(z,W)]=σ[W2δ(W1,z)]
(5)
式中:Fex(·)為激勵操作;σ(x)為sigmoid激活函數(shù);δ(x)為relu激活函數(shù);降維層參數(shù)W1∈R(c/r)×c,升維層參數(shù)W2∈Rc×(c/r),r為維度縮減率。
最后,通過加權(quán)操作將歸一化后的權(quán)重加權(quán)到每個通道的特征上
(6)
式中,Fscale(uc,sc)為特征映射uc∈RH×W和標(biāo)量sc之間的對應(yīng)通道乘積。
膠囊網(wǎng)絡(luò)的核心思想是將傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的標(biāo)量神經(jīng)元組合為向量,以向量的形式保存更豐富的信息,減少特征信息的丟失,提高模型的特征提取能力。
膠囊網(wǎng)絡(luò)通常包含卷積層、初級膠囊層和高級膠囊層。網(wǎng)絡(luò)首先和卷積神經(jīng)網(wǎng)絡(luò)一樣通過卷積運(yùn)算進(jìn)行特征提取,所提取的特征被輸入到初級膠囊層。
1.3.1 初級膠囊層
初級膠囊層首先進(jìn)行卷積運(yùn)算,然后將神經(jīng)元組合為向量。經(jīng)過初級膠囊層的操作后,網(wǎng)絡(luò)的基本元素不再是單個的神經(jīng)元,而是一個膠囊向量。在這一層中,使用squash函數(shù)[25]對向量進(jìn)行激活
(7)
式中,s為單個膠囊。該函數(shù)既能使向量保持方向,又能確保短向量收縮到幾乎為0的長度,長向量收縮到略小于1的長度。而且該函數(shù)對接近0的小變化更加敏感,在訓(xùn)練過程中可以實(shí)現(xiàn)梯度提升。
1.3.2 高級膠囊層
高級膠囊層以初級膠囊層的輸出作為輸入,通過自注意路由算法以聚類的方式建立低層膠囊到高層膠囊之間的非線性映射。兩個膠囊層之間的整體架構(gòu)和全連接網(wǎng)絡(luò)非常相似,只是增加了一個由自注意路由帶來的分支,如圖2所示。
圖2 自注意路由
在圖2中:Un1,d1為初級膠囊層有n1個膠囊,每個膠囊的維度為d1;Un2,d2為高級膠囊層有n2個膠囊,每個膠囊的維度為d2;W為權(quán)重矩陣,包含前后兩層膠囊的仿射變換;Bn1,n2為先驗(yàn)矩陣;Cn1,n2為系數(shù)矩陣。
(8)
高級膠囊層中的膠囊可以用式(9)來計(jì)算
(9)
式中:先驗(yàn)矩陣Bn1,n2包含所有權(quán)重的判別信息;Cn1,n2為耦合系數(shù)矩陣。不同于傳統(tǒng)膠囊網(wǎng)絡(luò)使用的動態(tài)路由算法,Cn1,n2自注意路由算法生成的。在該網(wǎng)絡(luò)中,每個膠囊都包含一個自注意張量A(:,:,n2),計(jì)算如下
(10)
(11)
將該耦合系數(shù)應(yīng)用于式(9)中,便可計(jì)算得到高級膠囊層中的膠囊向量,由此完成膠囊層之間的映射。
本文提出了一種改進(jìn)的膠囊網(wǎng)絡(luò)模型用于滾動軸承的復(fù)合故障診斷。它以原始一維振動信號作為輸入,無需手動特征提取和選擇,可以自動完成識別分類。其核心部分由卷積層、擠壓激勵模塊、初級膠囊層和高級膠囊層組成,網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 改進(jìn)膠囊網(wǎng)絡(luò)結(jié)構(gòu)圖
由圖3可知,改進(jìn)的模型共有8層結(jié)構(gòu)。首先,用卷積層提取輸入信號的特征,使用寬卷積核增加模型的感受野,保留更多的特征信息,同時減小噪聲的影響。其次通過最大池化層降低特征維度,提高運(yùn)算效率。中間重復(fù)使用兩個卷積層,用小卷積核充分提取底層特征。隨后添加了一個擠壓激勵模塊,可以充分考慮不同通道特征的重要性,實(shí)現(xiàn)通道維度特征的重新校正,并將加權(quán)后的特征信息傳遞到初級膠囊層。為了進(jìn)一步優(yōu)化模型,在特征提取部分的每一個卷積層后都使用了批標(biāo)準(zhǔn)化層,防止梯度消失,增強(qiáng)泛化能力。模型中所有的卷積層均使用了L2正則化來防止過擬合。
初級膠囊層首先進(jìn)行卷積運(yùn)算,將卷積結(jié)果構(gòu)造成向量形式作為高級膠囊層的輸入。高級膠囊層通過自注意路由算法計(jì)算膠囊層之間的相關(guān)度以實(shí)現(xiàn)對所提取特征的歸類,得到x個輸出向量,其中x表示單一信號類別數(shù),在本文中為4。輸出層對輸出向量分別求模長,即得到樣本的預(yù)測結(jié)果。
如圖4所示,傳統(tǒng)分類器與多標(biāo)簽分類器有明顯區(qū)別。傳統(tǒng)的深度學(xué)習(xí)分類器將概率最大的類別作為預(yù)測結(jié)果,只能識別單一故障,而多標(biāo)簽分類器可以同時輸出單個類別或多個類別預(yù)測單一或復(fù)合故障。在本研究中,每個樣本的標(biāo)簽是一個允許多個索引同時為1的向量,而不是獨(dú)熱碼。同時,選擇支持多種類別同時存在的二元交叉熵函數(shù)作為損失函數(shù),最終得以實(shí)現(xiàn)軸承復(fù)合故障的解耦和識別。
圖4 傳統(tǒng)分類器和多標(biāo)簽分類器的區(qū)別
軸承的復(fù)合故障診斷是一個多標(biāo)簽分類問題,評價(jià)指標(biāo)不同于傳統(tǒng)的二分類和多分類。本文通過計(jì)算樣本準(zhǔn)確率(Accuracy)對模型的性能進(jìn)行評估[26],定義如下
(12)
試驗(yàn)所用數(shù)據(jù)采集自如圖5所示滾動軸承診斷試驗(yàn)臺。該試驗(yàn)臺主要由感應(yīng)電動機(jī)、滾動軸承和加速度傳感器組成。軸承型號為NTN N204,采樣頻率為100 kHz。在此條件下共采集了軸承六種狀態(tài)下的振動數(shù)據(jù),分別為:健康狀態(tài)數(shù)據(jù)、內(nèi)圈故障數(shù)據(jù)、外圈故障數(shù)據(jù)、滾動體故障數(shù)據(jù)、內(nèi)圈和滾動體復(fù)合故障數(shù)據(jù)、外圈和滾動體復(fù)合故障數(shù)據(jù)。
1.電機(jī); 2.加速度傳感器; 3.軸承; 4.主軸
分別采集轉(zhuǎn)速為1 300 r/min,900 r/min和500 r/min三種條件下的振動信號。以轉(zhuǎn)速1 300 r/min為例,圖6展示了六種類型信號的時域波形。將所采集的振動信號以每1 024個數(shù)據(jù)點(diǎn)劃分為一個樣本,選擇每種類型的樣本各800個用于試驗(yàn),不同類型信號和其對應(yīng)標(biāo)簽如表1所示。隨機(jī)選取70%的數(shù)據(jù)用于訓(xùn)練,30%用于測試。為了避免試驗(yàn)結(jié)果受隨機(jī)性的影響,本文中所有數(shù)據(jù)都是試驗(yàn)10次取均值的結(jié)果。
表1 信號類型和對應(yīng)標(biāo)簽
圖6 不同類型的時域信號圖
在模型的訓(xùn)練過程中,使用Adam優(yōu)化器進(jìn)行優(yōu)化,學(xué)習(xí)率采用指數(shù)衰減的方式,初始學(xué)習(xí)率為0.001,衰減率為0.9。模型的具體參數(shù)設(shè)置如表2所示,輸入維度為(1 024,1)。Batchsize設(shè)置為30,卷積層使用relu函數(shù)作為激活函數(shù),膠囊層使用squash函數(shù)激活。初級膠囊層膠囊向量的維度為4,高級膠囊層膠囊向量維度為16。本試驗(yàn)在Linux環(huán)境下進(jìn)行,使用的編程語言為Python,深度學(xué)習(xí)框架為Tensorflow,GPU為NVIDIA Tesla V100。
表2 改進(jìn)膠囊網(wǎng)絡(luò)的模型參數(shù)
首先驗(yàn)證了所提出的模型在不同轉(zhuǎn)速數(shù)據(jù)集上的性能。用轉(zhuǎn)速分別為1 300 r/min,900 r/min和500 r/min三種狀態(tài)下的數(shù)據(jù)集進(jìn)行測試,當(dāng)轉(zhuǎn)速為1 300 r/min時訓(xùn)練集和測試集的準(zhǔn)確率曲線,如圖7所示。由圖7可以看出,隨著迭代次數(shù)的增加,兩者的準(zhǔn)確率都不斷提高,后期趨于穩(wěn)定。
圖7 轉(zhuǎn)速為1 300 r/min時訓(xùn)練集和測試集的準(zhǔn)確率曲線
為了驗(yàn)證模型改進(jìn)部分對試驗(yàn)結(jié)果的影響,設(shè)置了一些對比試驗(yàn)。模型一為和本文方法具有相同結(jié)構(gòu)、但使用動態(tài)路由算法的膠囊網(wǎng)絡(luò),其中動態(tài)路由迭代3次;模型二未使用擠壓激勵模塊;模型三為和本文方法結(jié)構(gòu)相似的卷積神經(jīng)網(wǎng)絡(luò),將膠囊層換為兩個全連接層,第一個全連接層神經(jīng)元個數(shù)為32,第二個全連接層為分類層,輸出個數(shù)為4,并使用sigmoid函數(shù)作為分類函數(shù)。四種方法在三種數(shù)據(jù)集上的分類準(zhǔn)確率如表3所示。
表3 不同轉(zhuǎn)速下的試驗(yàn)結(jié)果
由表3可知,本文方法在三種數(shù)據(jù)集上分別達(dá)到了98.70%,98.04%和94.72%的準(zhǔn)確率,說明該方法在軸承復(fù)合故障診斷方面取得了令人滿意的成果。與此同時,對于三種不同轉(zhuǎn)速的數(shù)據(jù)集,本文方法與模型一幾乎達(dá)到了相同的診斷效果。但是由表4可以發(fā)現(xiàn),本文方法迭代100次僅需要144.30 s,而模型一需要582.98 s,訓(xùn)練速度大幅度提升。這是因?yàn)槟P鸵恢惺褂玫膭討B(tài)路由算法在計(jì)算耦合系數(shù)的過程中需要不斷地迭代以實(shí)現(xiàn)從低級膠囊到高級膠囊的轉(zhuǎn)化。這個過程涉及到大量的運(yùn)算,必然會消耗大量的時間和資源。而自注意路由的過程是非迭代且高度并行的,比動態(tài)路由更高效。與模型三相比,本文方法的性能并未有明顯提升。
表4 兩種膠囊網(wǎng)絡(luò)所需時間對比
綜合來看,起到最明顯的提升作用的是擠壓激勵模塊。與模型二相比,改進(jìn)的方法在三種數(shù)據(jù)集上的準(zhǔn)確率分別提高了3.15%,2.21%和3.04%。為了直觀地對比本文方法和模型二的特征提取能力,用t-SNE可視化來觀察其特征分布情況。模型二的聚類結(jié)果如圖8(a)和圖8(c)所示,本文方法的聚類結(jié)果如圖8(b)和圖8(d)所示。
圖8 t-SNE特征可視化
圖8中每個點(diǎn)代表一個樣本,不同形狀表示不同類型的樣本。從初級膠囊層的可視化結(jié)果可以看出,模型二只將外圈滾動體復(fù)合故障樣本成功地聚類,其他類型的樣本混合在一起難以區(qū)分。但是改進(jìn)的網(wǎng)絡(luò)中各種類型的樣本已經(jīng)逐漸聚類到一起。由高級膠囊層的可視化結(jié)果可知,模型二中多個內(nèi)圈、外圈和內(nèi)圈滾動體復(fù)合故障樣本被錯誤的歸類。相比之下,改進(jìn)的方法只有少量樣本被錯誤聚類??偟膩碚f,本文方法的表現(xiàn)優(yōu)于模型二。這表明擠壓激勵模塊聚焦于通道間的關(guān)系,自動學(xué)習(xí)每個通道特征的權(quán)重,選擇性地增強(qiáng)有用的特征,可以有效地提高故障診斷的分類準(zhǔn)確率。
為了檢驗(yàn)樣本量不同時本文方法的診斷能力,使用轉(zhuǎn)速為1 300 r/min的數(shù)據(jù)集進(jìn)行測試,四種方法的表現(xiàn)如表5所示。
表5 四種方法在不同樣本量下的準(zhǔn)確率
由表5可知,隨著樣本量的增加,各個模型的分類準(zhǔn)確率也隨之增加。當(dāng)每種類別樣本只有100個時,使用膠囊網(wǎng)絡(luò)結(jié)構(gòu)的模型一和本文方法的準(zhǔn)確率分別達(dá)到了94.03%和94.12%,表現(xiàn)出優(yōu)異的診斷能力。相比之下使用卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的模型三只達(dá)到了81.51%,比本文方法和模型一分別減少了12.61%和12.52%。當(dāng)每種類別的樣本分別增加到200個、400個和600個時,本文方法的準(zhǔn)確率分別比模型三提升了1.89%,0.53%和0.27%,差距逐漸減小。當(dāng)每種類別樣本增加至800個時,本文方法和模型三達(dá)到了幾乎相同的診斷效果。可以發(fā)現(xiàn),卷積神經(jīng)網(wǎng)絡(luò)往往需要大量的訓(xùn)練樣本才能得到比較好的診斷效果,而膠囊網(wǎng)絡(luò)用向量神經(jīng)元代替標(biāo)量神經(jīng)元,可以保留更豐富的信息,在小樣本故障診斷方面有更突出的表現(xiàn)。
由于軸承的實(shí)際工作環(huán)境復(fù)雜,所采集到的信號會不可避免的受到噪聲的干擾,因此驗(yàn)證改進(jìn)模型在噪聲環(huán)境下的魯棒性非常必要。向原始振動信號中添加不同信噪比(signal-noise radio,SNR)的高斯白噪聲來評估模型的抗噪性能,SNR的計(jì)算公式為
(13)
式中:PS為原始信號的功率;PN為噪聲功率。
以轉(zhuǎn)速1 300 r/min條件下的外圈故障信號為例,向該信號中加入信噪比為-10 dB的高斯白噪聲,原始信號和含噪信號的時域波形如圖9所示。由圖9可以看出,加入噪聲后信號的幅值發(fā)生了改變,原始信號中的故障特征被淹沒,難以單純通過觀察時域波形來確定信號類型。選擇轉(zhuǎn)速1 300 r/min條件下每種信號類型樣本各200個,分別驗(yàn)證網(wǎng)絡(luò)第一層寬卷積核大小以及模型改進(jìn)部分對抗噪性能的影響。
圖9 原始信號和含噪信號
3.5.1 第一層寬卷積核大小對抗噪性能的影響
首先驗(yàn)證第一層寬卷積核大小對模型抗噪性能的影響,將其分別設(shè)置為16,32,64,96和128。信噪比為-3~10 dB時不同卷積核大小的分類結(jié)果如表6所示。由表6可以發(fā)現(xiàn),當(dāng)卷積核為96時,本文方法在信噪比為-3 dB和10 dB時分別達(dá)到了86.22%和96.89%的準(zhǔn)確率。但當(dāng)卷積核為16時,準(zhǔn)確率只有84.67%和93.95%??偟膩碚f,卷積核大小為96時比其他小卷積核的表現(xiàn)更好。這表明,第一層使用寬卷積核有助于保留更多的特征信息,減少噪聲的影響。但是,卷積核并不是越大越好。當(dāng)卷積核為128時,該模型在不同信噪比下準(zhǔn)確率都有所降低。因此,第一層寬卷積核的大小最終設(shè)置為96。
表6 不同信噪比下的準(zhǔn)確率
3.5.2 改進(jìn)部分對抗噪性能的影響
在這一部分,使用含信噪比為-10~25 dB的數(shù)據(jù)集對四種模型進(jìn)行評估,結(jié)果如表7所示。顯而易見,隨著信噪比的減小,四種方法的準(zhǔn)確率都明顯降低。本文方法在不同的信噪比環(huán)境下平均準(zhǔn)確率達(dá)到了93.37%,分別比其他方法高出0.11%,5.54%和1.66%,其抗噪性能與模型一相當(dāng),明顯優(yōu)于模型二和模型三。在-10 dB的強(qiáng)噪聲下,本文方法仍然可以達(dá)到85.51%的準(zhǔn)確率,比模型二和模型三分別高出6.07%和3.42%。
表7 四種方法在不同信噪比下的準(zhǔn)確率
通過對比試驗(yàn)可以充分說明,改進(jìn)后的膠囊網(wǎng)絡(luò)在未經(jīng)過任何去噪預(yù)處理的情況下依然表現(xiàn)出優(yōu)越的抗噪性能和泛化性能。
為了進(jìn)一步說明本文方法的優(yōu)越性,與其他方法如Resnet18、改進(jìn)的LeNet-5、深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural networks, DCNN)、雙卷積膠囊網(wǎng)絡(luò)(dual convolutional capsule network, DCCN)、和Capsnet+LSTM等進(jìn)行了比較。為了更好地適應(yīng)數(shù)據(jù)集,對這些網(wǎng)絡(luò)的參數(shù)進(jìn)行了微調(diào),五種方法均以一維時域振動信號作為輸入,網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)設(shè)置如下:
(1)Resnet18——He等提出的經(jīng)典方法,包括8個常規(guī)殘差模塊,輸出層節(jié)點(diǎn)改為4,分類函數(shù)使用sigmoid函數(shù),損失函數(shù)使用二元交叉熵函數(shù);
(2)改進(jìn)LeNet-5——吳晨芳等人提出的改進(jìn)方法,將其中的二維卷積改為一維卷積,輸出層節(jié)點(diǎn)為4,分類函數(shù)改為sigmoid函數(shù),損失函數(shù)為二元交叉熵?fù)p失函數(shù),其他參數(shù)相同;
(3)DCNN——Huang等提出的方法,將輸出層節(jié)點(diǎn)改為4,其他結(jié)構(gòu)和參數(shù)均相同;
(4)DC-CN——Li等提出的方法,輸出層參數(shù)為4,其他參數(shù)相同;
(5)Capsnet+LSTM——Ke等提出的方法,包括兩個卷積層,一個池化層,一個LSTM模塊和兩個膠囊層。其中兩個卷積層卷積核大小分別為64×1和6×1,步長均為2,第一個膠囊層向量維度為8,第二個膠囊層向量個數(shù)為4,其他參數(shù)相同。
在轉(zhuǎn)速為1 300 r/min的數(shù)據(jù)集上進(jìn)行試驗(yàn),結(jié)果如圖10??梢钥闯霰疚奶岢龅姆椒ū绕渌宸N方法的準(zhǔn)確率分別提高了1.52%,8.44%,6.19%,1.85%和4.12%,證明該方法在軸承復(fù)合故障診斷方面有更好的表現(xiàn)。
圖10 不同方法的結(jié)果
為了充分驗(yàn)證所提出方法的泛化性,采用帕德博恩數(shù)據(jù)集[27]進(jìn)行試驗(yàn),其中滾動軸承型號為6203。選取其中的健康狀態(tài)數(shù)據(jù)、內(nèi)圈故障數(shù)據(jù)、外圈故障數(shù)據(jù)和內(nèi)外圈復(fù)合故障數(shù)據(jù)等四種類型進(jìn)行試驗(yàn),本文方法在不同大小數(shù)據(jù)集上的表現(xiàn)如表8所示。由表8可知,本文方法在總樣本量僅為200的情況下分類準(zhǔn)確率可以達(dá)到93.25%,說明其可以有效地診斷不同型號的滾動軸承復(fù)合故障,具有良好的泛化性能。
表8 帕德博恩數(shù)據(jù)集試驗(yàn)結(jié)果
本文提出了一種基于改進(jìn)膠囊網(wǎng)絡(luò)的智能復(fù)合故障診斷方法。該模型直接將原始振動信號作為輸入,利用卷積層和擠壓激勵模塊自適應(yīng)地提取故障特征,構(gòu)建膠囊向量并通過自注意路由進(jìn)行膠囊層之間的信息傳遞,最終實(shí)現(xiàn)多標(biāo)簽分類。利用實(shí)驗(yàn)室采集的數(shù)據(jù)進(jìn)行試驗(yàn),結(jié)果表明本文方法中改進(jìn)的部分均起到了積極作用:擠壓激勵模塊幫助自適應(yīng)提取更有用的特征,提高了識別準(zhǔn)確率;與同樣結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)對比,本文方法用向量代替?zhèn)鹘y(tǒng)神經(jīng)元保留更細(xì)節(jié)更豐富的信息,在小樣本情況下表現(xiàn)出了明顯的優(yōu)勢;與使用動態(tài)路由的膠囊網(wǎng)絡(luò)相比,本文方法的診斷效率大大提高。綜合來看,本文方法可以高效地實(shí)現(xiàn)復(fù)合故障診斷。在后續(xù)的研究中將考慮更復(fù)雜的復(fù)合故障診斷,如包含更多故障類別的復(fù)合故障等,以便更好的應(yīng)用于實(shí)際工業(yè)場景中。