高丙坤,丁春陽,孫 雙
(東北石油大學(xué)電氣信息工程學(xué)院,大慶 163318)
齒輪箱是一種被廣泛應(yīng)用于各種機(jī)械設(shè)備中的傳動裝置,在多個(gè)領(lǐng)域發(fā)揮著關(guān)鍵作用。然而由于其復(fù)雜的工作環(huán)境和長時(shí)間的負(fù)荷運(yùn)轉(zhuǎn),齒輪箱常常會發(fā)生故障,造成巨大的經(jīng)濟(jì)損失。因此,對齒輪箱早起的故障進(jìn)行診斷具有重要的意義,以便能夠及時(shí)發(fā)現(xiàn)問題、排除故障,進(jìn)而降低損失[1-2]。
隨著機(jī)器學(xué)習(xí)的發(fā)展,對于齒輪箱故障診斷的研究也更加智能化,形成了人工特征提取與淺層學(xué)習(xí)分類相結(jié)合的故障診斷模式。在上述的診斷模式中,首先利用信號處理方法,如傅里葉變換(fourier transform,FT)[3]、經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)[4]、小波分解(wavelet transform)[5]、小波包分解(wavelet packet decomposition)[6]等,提取時(shí)域或時(shí)頻域特征;然后,將這些統(tǒng)計(jì)參數(shù)輸入機(jī)器學(xué)習(xí)算法中進(jìn)行診斷,包括支持向量機(jī)(SVM)[7]、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)[8]、隨機(jī)森林(random forest,RF)[9]、決策樹(decision trees,DT)[10]等。PANG等[11]為驗(yàn)證機(jī)器學(xué)習(xí)在齒輪箱故障診斷中的可行性,實(shí)現(xiàn)了包括決策樹、隨機(jī)森林、支持向量機(jī)等在內(nèi)的算法,以進(jìn)行結(jié)果分類,實(shí)驗(yàn)表明決策樹和隨機(jī)森林在訓(xùn)練和測試樣本的表現(xiàn)都更好。RAFIEE等[12]開發(fā)了一種基于ANN的故障診斷系統(tǒng),可以識別出故障齒輪,該系統(tǒng)在齒輪箱故障診斷方面有著廣泛的應(yīng)用。雖然機(jī)器學(xué)習(xí)在機(jī)械故障診斷方面取得了不錯(cuò)的成就,但是人工提取時(shí)域、頻域以及時(shí)頻域特征在這些方法中具有依賴性,并且其淺層的網(wǎng)絡(luò)結(jié)構(gòu)很難學(xué)習(xí)到故障信號高維度、非線性的數(shù)據(jù)特征[13]。
近年來,深度學(xué)習(xí)方法[14-16],已經(jīng)在機(jī)械故障診斷中廣泛運(yùn)用并發(fā)揮出優(yōu)良性能。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)作為深度學(xué)習(xí)的代表,具有很強(qiáng)的特征提取和表達(dá)能力,被廣泛的運(yùn)用于機(jī)械故障診斷中。郭俊峰等[17]建立了基于一維卷積神經(jīng)網(wǎng)絡(luò)和動態(tài)路由相結(jié)合的故障診斷模型,該模型采用多個(gè)全連接層,導(dǎo)致模型的可學(xué)習(xí)參數(shù)多,訓(xùn)練時(shí)間和測試時(shí)間較長;葉壯等[18]提出了多通道卷積神經(jīng)網(wǎng)絡(luò)的故障診斷模型,雖然該方法能全面提取特征細(xì)節(jié),訓(xùn)練精度相較于傳統(tǒng)1D-CNN也有提升,但是該模型加深了網(wǎng)絡(luò)寬度,導(dǎo)致訓(xùn)練時(shí)間長,運(yùn)算效率低;姚齊水、 LIU等[19-20]根據(jù)目前的輕量化網(wǎng)絡(luò)結(jié)構(gòu)Inception、ShuffleNet搭建網(wǎng)絡(luò)模型,但是為了達(dá)到理想的訓(xùn)練效果加深了網(wǎng)絡(luò)深度,相對于傳統(tǒng)CNN來說,模型輕量化并沒有很明顯。
針對傳統(tǒng)故障診斷模型參數(shù)量大,訓(xùn)練、檢測時(shí)間長的問題,本文提出了一種基于殘差模塊和局部二進(jìn)制卷積的輕量化故障診斷方法(1D-RSLBCNN)。該方法利用局部二進(jìn)制卷積搭建網(wǎng)絡(luò),在保證準(zhǔn)確率的同時(shí),減少了模型參數(shù),加快了訓(xùn)練速度和收斂速度,并通過QPZZ-Ⅱ型故障模擬試驗(yàn)臺的數(shù)據(jù)對模型進(jìn)行了驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,該模型可有效應(yīng)用于齒輪箱故障診斷,具有較好的工程應(yīng)用價(jià)值。
如圖1所示,所提出的1D-RSLBCNN架構(gòu)由6個(gè)重要部分組成,即局部二進(jìn)制卷積層(LBC)、兩個(gè)殘差模塊、全局平均池化層(1D-GAP)、全連接(FC)層和log_softmax層。首先,局部二進(jìn)制卷積層提取一維齒輪箱故障信號的低維特征;然后,兩個(gè)殘差模塊依次對該低維特征向量進(jìn)行嵌入和融合,得到深層特征,所提取的深層特征向量由1D-GAP層進(jìn)行降維和維度變換等操作,利用FC層對提取的特征映射進(jìn)行非線性擬合;最后,利用log_softmax層獲得不同條件下的故障類別。
圖1 1D-RSLBCNN模型結(jié)構(gòu)
1.1.1 殘差結(jié)構(gòu)
如圖2所示,殘差連接允許獲得齒輪箱故障信號中任何深層的特征信息。輸出y為輸入x和殘差映射輸出F(x)的疊加值。其中F(x)是通過對x進(jìn)行卷積核激活運(yùn)算所得,然后通過激活函數(shù),形成整個(gè)一維殘差塊。
圖2 殘差模塊 圖3 改進(jìn)的殘差模塊
殘差塊可以表示為:
xl+1=xl+F(xl,wl)
(1)
式中:xl+1為第l+1層的輸出,xl為第l層的輸入,F(xl,wl)為第l層的殘差。
為了減少模型參數(shù),提高模型的訓(xùn)練效率,本文對殘差模塊進(jìn)行改進(jìn)。如圖3所示,該殘差模型有兩個(gè)殘差塊,以局部二進(jìn)制卷積層和傳統(tǒng)的一維卷積層相結(jié)合構(gòu)成殘差模塊主體,通過兩次跳躍連接構(gòu)成整個(gè)殘差連接部分。局部二進(jìn)制卷積將權(quán)重和激活都約束為二進(jìn)制,因此利用改進(jìn)的殘差模塊不僅能避免由于網(wǎng)絡(luò)深度而引起的分類精度飽和問題[21-22],同時(shí)能減少模型參數(shù),提高運(yùn)行效率。
1.1.2 局部二進(jìn)制卷積層(LBCNN)
在LBCNN層,以局部二進(jìn)制模式(LBP)為基礎(chǔ),將LBP算法和一維卷積相結(jié)合來替代傳統(tǒng)的卷積運(yùn)算,提高了訓(xùn)練速度的同時(shí),加快了收斂速度[23]。
LBP將相鄰元素的強(qiáng)度與斑紋內(nèi)中心元素的強(qiáng)度進(jìn)行比較[24-26]。假設(shè)一個(gè)矩陣的元素分布如圖4所示,與中心元素相比,具有較高強(qiáng)度值的相鄰元素的值為1,否則為0。然后,按順序讀取這些二進(jìn)制數(shù),并通過由基數(shù)2構(gòu)成的設(shè)計(jì)運(yùn)算符將其轉(zhuǎn)換為十進(jìn)制數(shù),例如預(yù)定義的權(quán)重向量v=[27,26,25,24,23,22,21,20]。最后的結(jié)果可以通過將這些矩陣的相應(yīng)元素的乘積求和得到。此時(shí),中心(xc,yc)的LBP特征提取可以表示為:
(a) 3×3原始矩陣 (b) LBP編碼
(2)
式中:in表示第N個(gè)相鄰元素的值,ic表示中心元素的值,N表示原始矩陣的大小,如果in≥ic,s(·)=1,否則,s(·)=0。
(3)
美國教育家約翰·杜威曾提出過“教育即生活”。口語交際的內(nèi)容,即在日常生活。交際內(nèi)容生活化,最好的口語交際內(nèi)容就是在學(xué)生的日常生活中,在鮮活真實(shí)的情境中,孩子們才能感受言語者的意圖??谡Z是我們?nèi)粘I钪兄苯拥臏贤ń涣鞴ぞ撸瑢⒖谡Z交際延伸到日常生活中的各個(gè)角落,讓學(xué)生在生活中實(shí)踐和體會口語交際的規(guī)律。
LBCNN層的可學(xué)習(xí)參數(shù)明顯少于標(biāo)準(zhǔn)卷積層,卷積核的大小以及輸入和輸出維度的數(shù)量相同。假設(shè)卷積核沒有偏置項(xiàng),卷積層和LBCNN層中可學(xué)習(xí)參數(shù)的數(shù)量之比[23]為:
(P·H·W)/K
(4)
式中:H和W為卷積核的大小,P為輸入通道的數(shù)量。
全局平均池化(global average pooling,GAP)[27]相對于傳統(tǒng)卷積網(wǎng)絡(luò)中的全連接層,直接實(shí)現(xiàn)了降維,極大的減少了網(wǎng)絡(luò)的參數(shù)。并且為了防止過擬合,GAP對整個(gè)網(wǎng)絡(luò)在結(jié)構(gòu)上進(jìn)行了正則化處理。具體計(jì)算過程為:
(5)
傳統(tǒng)全連接層和全局平均池化層的詳細(xì)說明如圖5所示。全連接層將卷積層生成的特征映射壓平(flatten)之后再對特征映射進(jìn)行分類,而GAP直接將上述過程合二為一。設(shè)計(jì)1D-GAP層替代全連接層,減少了模型的可學(xué)習(xí)參數(shù),有效的縮短了訓(xùn)練時(shí)間。
(a) 全連接層 (b) 全局平均池化層
為了采集大量的齒輪下故障信號,搭建了如圖6所示的實(shí)驗(yàn)臺。
該實(shí)驗(yàn)臺是由電機(jī)、齒輪箱、軸承座組成。實(shí)驗(yàn)中待診斷的齒輪箱內(nèi)部分別有行星輪齒和太陽輪齒兩種齒輪。其中太陽輪齒分別有正常、磨損和缺齒3種狀態(tài);行星輪齒分別為正常和磨損兩種狀態(tài)。具體齒輪故障如圖7所示。
圖6 齒輪箱故障信號采集實(shí)驗(yàn)臺圖7 齒輪箱故障
表1 實(shí)驗(yàn)數(shù)據(jù)集
圖8 齒輪箱6類故障信號
1D-RSLBCNN模型的詳細(xì)參數(shù)如表2所示,該模型的總參數(shù)為2456。由表可知,傳統(tǒng)一維卷積的可學(xué)習(xí)參數(shù)為784個(gè),而局部二進(jìn)制卷積層的可學(xué)習(xí)參數(shù)為262個(gè)。在這里,我們將輸入通道設(shè)置為16,卷積核大小設(shè)置為3,一共產(chǎn)生16位映射,可知局部二進(jìn)制的可學(xué)習(xí)參數(shù)為傳統(tǒng)一維卷積的。
表2 1D-RSLBCNN 模型參數(shù)
根據(jù)上述方法,將表1中數(shù)據(jù)輸入1D-RSLBCNN模型中進(jìn)行訓(xùn)練,本實(shí)驗(yàn)采用Adam優(yōu)化器,對模型進(jìn)行300次迭代訓(xùn)練,迭代訓(xùn)練精度和損失如圖9所示。由圖可見,10次迭代后訓(xùn)練精度接近85%,之后的訓(xùn)練模型準(zhǔn)確率總體呈上升趨勢,損失值也呈下降趨勢。最終模型在45次迭代之后趨于穩(wěn)定。由此可知,模型的診斷精度較高,同時(shí)具有較好的穩(wěn)定性。
圖9 訓(xùn)練過程曲線 圖10 測試結(jié)果的混淆矩陣
完成1D-LBCNN的訓(xùn)練后,進(jìn)行網(wǎng)絡(luò)測試,測試的混淆矩陣如圖10所示,結(jié)果顯示該方法在每一類故障上都獲得很好的識別效果。
(1)配備不同優(yōu)化器的1D-RSLBCNN模型的訓(xùn)練精度如圖11所示??梢杂^察到,4個(gè)優(yōu)化器實(shí)現(xiàn)了1D-RSLBCNN模型的優(yōu)化。Adam優(yōu)化器在迭代45次的時(shí)候,訓(xùn)練精度已經(jīng)接近100%,并且趨于平穩(wěn)。而其他3種優(yōu)化器在迭代45次時(shí)最高的訓(xùn)練精度才接近80%,并且在后面的迭代中仍有上升或下降的趨勢。由此可見,與其他優(yōu)化器相比,Adam具有更快的收斂速度和訓(xùn)練效率。因此,在1D-RSLBCNN模型中采用Adam作為優(yōu)化器。
圖11 使用不同優(yōu)化器的訓(xùn)練 圖12 相同網(wǎng)絡(luò)結(jié)構(gòu)對比
(2)ResNet網(wǎng)絡(luò)作為一個(gè)經(jīng)典的CNN網(wǎng)絡(luò),用來和提出的1D-RSLBCNN網(wǎng)絡(luò)進(jìn)行對比,其中ResNet中的殘差塊數(shù)量與本文模型相同。由圖12可知,在迭代前50次的時(shí)候,1D-RSLBCNN的收斂速度比ResNet快。在迭代45次的時(shí)候,所提出的網(wǎng)絡(luò)的結(jié)構(gòu)的訓(xùn)練精度已經(jīng)接近100%,而ResNet的訓(xùn)練精度為88%,這證明了1D-RSLBCNN的快速訓(xùn)練能力。通過詳細(xì)比較兩個(gè)網(wǎng)路的結(jié)構(gòu)和參數(shù),可以發(fā)現(xiàn),ResNet中的卷積層中包含784個(gè)可學(xué)習(xí)參數(shù),1D-LBCNN的LBC層中僅包含262個(gè)可學(xué)習(xí)參數(shù)。
(3)為了驗(yàn)證所提方法的優(yōu)越性,使用不同深度學(xué)習(xí)和機(jī)器學(xué)習(xí)的方法,包括CNN(ResNet-18,LeNet-5)、文獻(xiàn)[28]、SVM、KNN等進(jìn)行對比。實(shí)驗(yàn)結(jié)果如表3所示,表3中的實(shí)驗(yàn)結(jié)果是迭代100次后的訓(xùn)練精度,與其他5種方法相比,所提出的方法實(shí)現(xiàn)了最高的準(zhǔn)確率,這表明所提出1D-RSLBCNN比其他方法具有更好的診斷性能。此外,1D-RSLBCNN的模型訓(xùn)練時(shí)間為112 s,低于LeNet-5,ResNet-18以及文獻(xiàn)[28](分別為470 s,272 s,630 s),可學(xué)習(xí)參數(shù)為2456,遠(yuǎn)低于LeNet-5,ResNet-18以及文獻(xiàn)[28](分別為34372,14820,85540),圖13也說明了所提網(wǎng)絡(luò)具有更快的收斂速度和訓(xùn)練效率。同時(shí),每類樣本取50萬個(gè)采樣點(diǎn)進(jìn)行預(yù)測,所提網(wǎng)絡(luò)預(yù)測318次僅需0.28 s,而LeNet-5,ResNet-18以及文獻(xiàn)[28]分別需要1 s,0.95 s以及1.56 s。
表3 不同模型測試結(jié)果對比
圖13 不同模型對比
針對傳統(tǒng)故障模型參數(shù)多,訓(xùn)練和檢測時(shí)間長的問題,提出了一種基于1D-LBCNN的齒輪箱故障診斷方法,基于齒輪箱故障數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn),經(jīng)過分析和對比驗(yàn)證了該方法的有效性和可靠性。主要結(jié)論為:
(1)相對于傳統(tǒng)的卷積層,LBC層的可學(xué)習(xí)參數(shù)僅為傳統(tǒng)卷積層的1/3,并且利用LBC層,模型在訓(xùn)練速度和收斂速度方面都有較大提升。
(2)由實(shí)驗(yàn)結(jié)果可知,所提出的基于1D-LBCNN的齒輪箱故障診斷方法在識別的準(zhǔn)確性和穩(wěn)定性方面均優(yōu)于本文其他對比方法,并且檢測時(shí)長也優(yōu)于其他對比方法,具備應(yīng)用于實(shí)際場景的潛力。