許 理, 李 戈, 余 亮, 姚 毅
(四川理工學(xué)院a.自動(dòng)化與信息工程學(xué)院; b.物理與電子工程學(xué)院, 四川 自貢 643000)
滾動(dòng)軸承故障診斷的常用方法是振動(dòng)分析法,而采集的軸承振動(dòng)信號(hào)具有非平穩(wěn)性等特點(diǎn),使得對(duì)其進(jìn)行特征提取變得比較困難。小波包(Wavelet Packet,WP)時(shí)頻分析方法能有效提取非平穩(wěn)信號(hào)的時(shí)頻特征,具有精細(xì)的時(shí)頻分辨率,可以克服小波變換高頻低分辨率的缺陷[1]。小波包已經(jīng)被廣泛應(yīng)用在機(jī)械設(shè)備故障診斷[2]、地震檢測(cè)[3]、醫(yī)學(xué)[4]等領(lǐng)域。文獻(xiàn)[5]使用小波包對(duì)軸承振動(dòng)信號(hào)進(jìn)行頻譜分析,有效提取了軸承的故障特征,且在復(fù)合故障中采用小波包分析效果明顯優(yōu)于小波分析。傳統(tǒng)的智能識(shí)別方法如反向傳播(Back Propagation, BP)神經(jīng)網(wǎng)絡(luò)等淺層網(wǎng)絡(luò)隱含層數(shù)量少,特征學(xué)習(xí)的表達(dá)能力有限,訓(xùn)練易陷入局部極值[6]。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)通過引入權(quán)值共享、局部感知以及池化層對(duì)傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行優(yōu)化,具有深層次的體系結(jié)構(gòu)和強(qiáng)大的特征學(xué)習(xí)能力[7-9]。CNN目前在醫(yī)學(xué)、認(rèn)知科學(xué)和人工智能等領(lǐng)域得到了廣泛應(yīng)用[10]。Zhang[11]等使用卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了滾動(dòng)軸承的故障診斷,表明當(dāng)用足夠的訓(xùn)練樣本進(jìn)行訓(xùn)練時(shí),CNN的故障識(shí)別效果優(yōu)于其他方法。張晴晴[12]等將CNN用于語音識(shí)別,相比于目前普遍使用的深層神經(jīng)網(wǎng)絡(luò),CNN的識(shí)別性能更好,而且降低了模型的復(fù)雜度。Chen等[13]將變速箱振動(dòng)信號(hào)的統(tǒng)計(jì)特征組成一特征圖,作為CNN的輸入,通過CNN實(shí)現(xiàn)了變速箱故障的診斷識(shí)別,并表現(xiàn)出優(yōu)于其他方法的識(shí)別率和效率。
鑒于小波包精細(xì)的時(shí)頻分辨率和CNN強(qiáng)大的特征學(xué)習(xí)與識(shí)別能力,本文提出了一種基于小波包和CNN的滾動(dòng)軸承故障診斷方法(WPD_CNN)。
小波變換對(duì)信號(hào)中的高頻段不再進(jìn)行分解,具有高頻低分辨率的缺陷。而小波包對(duì)信號(hào)的低、高頻部分同時(shí)進(jìn)行分解,提高了總體時(shí)頻分辨率,解決了小波分解存在的問題。小波包的具體算法如下[14]:
對(duì)于給定的正交小波函數(shù)Φ(t)與正交尺度函數(shù)Φ(t),那么它們之間的二尺度方程為:
其中,hk為φ(t)對(duì)應(yīng)的低通濾波器,gk為φ(t)對(duì)應(yīng)的高通濾波器。則小波包的分解算法為:
小波包分解的實(shí)質(zhì)就是將信號(hào)通過一組正交的低通與高通濾波器,分解得到低頻部分與高頻部分。然后對(duì)分解后得到的兩組信號(hào)進(jìn)行進(jìn)一步的分解,實(shí)現(xiàn)信號(hào)的均勻分解。
訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)一般都要求樣本量在1萬以上,如果樣本量太少,那么訓(xùn)練出來的模型精度就會(huì)比較低,容易出現(xiàn)過擬合現(xiàn)象。Fine-tuning技術(shù)解決了少量樣本訓(xùn)練分類模型的問題;CaffeNet模型結(jié)構(gòu)如圖1所示,它是caffe團(tuán)隊(duì)使用大量圖片迭代30多萬次訓(xùn)練產(chǎn)生的,實(shí)現(xiàn)了對(duì)1000類圖片的識(shí)別分類,具有很好的圖片分類效果。本文在caffeNet模型的基礎(chǔ)上,采用fine-tuning技術(shù)訓(xùn)練自己的模型,在深度學(xué)習(xí)框架caffe的基礎(chǔ)上實(shí)現(xiàn)CNN模型的訓(xùn)練。
影響模型預(yù)測(cè)精度的因素有很多,主要有學(xué)習(xí)率、卷積核的個(gè)數(shù)與大小、一次用于測(cè)試的樣本大小batchsize以及dropout層的dropoutratio參數(shù)。本文選取的卷積核的個(gè)數(shù)與大小與caffeNet模型保持一致,不作改變。而deploy.prototxt文件中的基礎(chǔ)學(xué)習(xí)率base_lr要設(shè)置很小,本文base_lr設(shè)置為0.001。輸出層fc8控制著樣本的分類數(shù),從圖1可看出,caffeNet的分類數(shù)為1000,本文修改為5(因?yàn)槭菍?shí)現(xiàn)5分類),為了著重學(xué)習(xí),該層的學(xué)習(xí)率應(yīng)該設(shè)置比較大,包括權(quán)重系數(shù)w_lr和偏置系數(shù)b_lr的兩個(gè)學(xué)習(xí)率,本文w_lr的學(xué)習(xí)率設(shè)為10,偏置系數(shù)b_lr的學(xué)習(xí)率設(shè)為20。剩下的兩個(gè)參數(shù)batchsize和dropoutratio對(duì)于防止過擬合起著關(guān)鍵性的作用,本文重點(diǎn)對(duì)這兩個(gè)參數(shù)進(jìn)行尋優(yōu)以獲得比較理想的模型。
圖1 caffeNet模型結(jié)構(gòu)
本文使用的實(shí)驗(yàn)數(shù)據(jù)為凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)庫(Case Western Reserve University, CWRU)的滾動(dòng)軸承振動(dòng)加速度數(shù)據(jù)[15]。采樣頻率為12000 Hz。實(shí)驗(yàn)數(shù)據(jù)包括軸承四種工況下的振動(dòng)信號(hào),分為正常信號(hào)、滾動(dòng)體故障信號(hào)、內(nèi)圈故障信號(hào)和外圈故障信號(hào)。由于軸承運(yùn)行時(shí)經(jīng)常有復(fù)合故障的發(fā)生,本文將內(nèi)、外圈故障信號(hào)進(jìn)行疊加生成內(nèi)外圈復(fù)合故障信號(hào),所以共有五種軸承運(yùn)行狀態(tài)。
每類收集1420個(gè)樣本,每個(gè)樣本包含1024個(gè)采樣點(diǎn),共收集7100個(gè)樣本。
訓(xùn)練集:每類信號(hào)隨機(jī)選出1000個(gè)樣本作為訓(xùn)練集,訓(xùn)練集共包括5000個(gè)樣本。
驗(yàn)證集:在訓(xùn)練集剩余的樣本中,每類信號(hào)隨機(jī)360個(gè)樣本作為驗(yàn)證集,驗(yàn)證集共包括1800個(gè)樣本。
測(cè)試集:剩余的樣本作為測(cè)試集,每類60個(gè)樣本,共包括300個(gè)樣本。
(1) 采用小波包對(duì)樣本集進(jìn)行時(shí)頻分析,得到各個(gè)樣本的特征時(shí)頻圖。
(2) 時(shí)頻圖預(yù)處理:調(diào)整時(shí)頻圖的尺寸為256×256像素。
(3) 預(yù)處理后的時(shí)頻圖作為CNN的輸入,采用soft-max作為分類器,訓(xùn)練模型。
(4) 根據(jù)模型的測(cè)試準(zhǔn)確率對(duì)CNN網(wǎng)絡(luò)的參數(shù)進(jìn)行調(diào)整,選出一個(gè)性能最優(yōu)的模型,實(shí)現(xiàn)故障的分類識(shí)別。
機(jī)械振動(dòng)信號(hào)大都屬于非平穩(wěn)信號(hào),時(shí)頻分析在處理非平穩(wěn)信號(hào)方面具有獨(dú)特的優(yōu)勢(shì),通過時(shí)頻分析得到的時(shí)頻圖能直觀地反映信號(hào)時(shí)域和頻域的綜合信息,使振動(dòng)信號(hào)包含的特征信息得到充分展現(xiàn)。本文使用短時(shí)傅里葉變換(STFT)、連續(xù)小波變換(CWT)和小波包分解(WPD)三種時(shí)頻分析方法對(duì)故障信號(hào)進(jìn)行分析。以外圈故障信號(hào)為例,四種分析方法的時(shí)頻圖如圖2所示(取1024個(gè)采樣點(diǎn),縱軸范圍:0~6000 Hz(下同))。
圖2 三種時(shí)頻分析方法的效果圖
從圖2可以看出,采用STFT得到的時(shí)頻圖,其時(shí)間分辨率較低。CWT得到的時(shí)頻圖雖然具有較好的時(shí)間分辨率,但其頻率分辨率不理想。而采用WPD得到的時(shí)頻圖,其綜合的時(shí)頻分辨率明顯優(yōu)于其他兩種分析方法,所以本文采用WPD對(duì)滾動(dòng)軸承信號(hào)進(jìn)行故障特征圖提取。預(yù)處理后的WPD時(shí)頻圖如圖3所示。
圖3 預(yù)處理后的WPD時(shí)頻圖
2.5.1 dropout參數(shù)對(duì)結(jié)果的影響
分別設(shè)置dropoutratio為0.1、0.3、0.5、0.7、0.9進(jìn)行試驗(yàn)(兩個(gè)dropout層參數(shù)設(shè)置相同),這里batchsize暫取150。圖4給出了dropoutratio取不同值時(shí)驗(yàn)證集的識(shí)別準(zhǔn)確率(5次試驗(yàn)取平均值,下同)。從圖4可知,當(dāng)dropoutratio為0.3時(shí)收斂速度最快,效果最好。表1給出了測(cè)試集的真實(shí)識(shí)別準(zhǔn)確率,從中可知,dropoutratio取0.3識(shí)別準(zhǔn)確率最高,達(dá)到了92%,而dropoutratio取0.1時(shí)的外圈故障、取0.7時(shí)的內(nèi)外圈復(fù)合故障以及取0.9時(shí)的多種故障(內(nèi)圈、外圈和內(nèi)外圈復(fù)合故障)都出現(xiàn)了嚴(yán)重的過擬合現(xiàn)象。
圖4 dropoutratio取值對(duì)結(jié)果影響的效果圖
0.10.30.50.70.9正常1.0001.0001.0001.0001.000滾動(dòng)體故障1.0001.0001.0001.0000.500內(nèi)圈故障0.9380.9070.4920.7840.000外圈故障0.0611.000.8921.000.031內(nèi)外圈復(fù)合故障0.9530.6920.7530.0920.000整體準(zhǔn)確率0.7910.920.8270.7750.307
2.5.2 批量尺寸batchsize對(duì)結(jié)果的影響
由2.5.1節(jié)可知,dropoutratio取值為0.3時(shí)效果最好,所以這里設(shè)置dropoutratio為0.3。由于驗(yàn)證集的樣本總數(shù)為1800,為了使其得到充分利用,選擇的batchsize要能被1800整除,因此本文分別取batchsize為90,100,120,150,180,200,225,300進(jìn)行模型訓(xùn)練。圖5給出了驗(yàn)證集的識(shí)別結(jié)果(為了圖片便于觀察,僅顯示5個(gè)效果較好的batchsize),圖6是圖5的局部放大圖。從中可知,5種情況下訓(xùn)練的模型都能迅速收斂,batchsize取200時(shí)收斂速度最快(圖中黑色實(shí)線),準(zhǔn)確率最高。表2給出了對(duì)五種工況進(jìn)行測(cè)試的真實(shí)準(zhǔn)確率,當(dāng)batchsize=200時(shí),識(shí)別的準(zhǔn)確率最高,達(dá)到了99.1%。
綜上所述,參數(shù)dropoutratio和batchsize對(duì)故障識(shí)別的準(zhǔn)確率有很大的影響,本文采用網(wǎng)格法對(duì)這兩個(gè)參數(shù)進(jìn)行尋優(yōu),尋優(yōu)后參數(shù)dropoutratio值為0.3(兩dropout層一樣),batchsize值為200.最終滾動(dòng)軸承故障診斷的識(shí)別率為99.1%.
圖5 batchsize取值對(duì)結(jié)果影響的效果圖
圖6 圖5的局部放大圖
150180200225300正常1.0001.0001.0001.0001.000滾動(dòng)體故障1.0001.0001.0001.0001.000內(nèi)圈故障0.9230.9230.9690.8610.784外圈故障1.0000.9691.0001.0000.861內(nèi)外圈復(fù)合故障0.6920.9230.9840.8000.969整體準(zhǔn)確率0.9230.9630.9910.9320.923
2.5.3 PCA_SVM與CNN識(shí)別結(jié)果對(duì)比
PCA_SVM故障診斷用到的訓(xùn)練集和測(cè)試集同2.3小節(jié),每個(gè)樣本包含1024個(gè)采樣點(diǎn)。采用PCA算法對(duì)樣本進(jìn)行壓縮降維,為了使主成分的貢獻(xiàn)率在 95% 以上,每個(gè)樣本由1024維降到了15維。最后采用SVM對(duì)樣本進(jìn)行訓(xùn)練和故障識(shí)別,識(shí)別結(jié)果見表3(5次實(shí)驗(yàn)取均值)。
表3給出了多種識(shí)別算法的識(shí)別準(zhǔn)確率,采用CNN算法分別與STFT、CWT和WPD相結(jié)合,模型的準(zhǔn)確率都明顯優(yōu)于PCA_SVM。采用CWT和WPD對(duì)滾動(dòng)軸承信號(hào)進(jìn)行時(shí)頻分析,得出的CNN識(shí)別率高于STFT。而采用WPD_CNN算法對(duì)軸承的故障識(shí)別率最好,達(dá)到了99.1%。
表3 多種識(shí)別算法的預(yù)測(cè)準(zhǔn)確率對(duì)比
利用WPD綜合時(shí)頻分辨率優(yōu)于STFT和CWT的特性,結(jié)合CNN強(qiáng)大的特征提取能力,提出了一種基于WPD與CNN相結(jié)合的滾動(dòng)軸承故障診斷方法。通過參數(shù)尋優(yōu)和模型訓(xùn)練,找到了比較理想的用于軸承故障診斷的模型。通過與多種故障識(shí)別算法對(duì)比分析可知,本文提出的WPD_CNN算法對(duì)軸承的故障識(shí)別的準(zhǔn)確率最高。
參考文獻(xiàn):
[1] 王紅軍,萬鵬.基于EEMD和小波包變換的早期故障敏感特征獲取[J].北京理工大學(xué)學(xué)報(bào),2013,33(9):945-950.
[2] 肖順根,宋萌萌.基于小波包能量神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障診斷方法[J].機(jī)械強(qiáng)度,2014,36(3):340-346.
[3] SU W C,HUANG C S.Identification of structural stiffness parameters via wavelet packet from seismic response[J].Procedia Engineering,2017,199:1032-1037.
[4] SILVEIRA T L T D,KOZAKEVICIUS A J,RODRIGUES C R.Automated drowsiness detection through wavelet packet analysis of a single EEG channel[J].Expert Systems with Applications,2016,55:559-565.
[5] YANG Z,GAO L.Wavelet analysis and fault feature extraction of rolling bearing[M].London:Springer London,2014.
[6] 劉春艷,凌建春,寇林元,等.GA-BP神經(jīng)網(wǎng)絡(luò)與 BP神經(jīng)網(wǎng)絡(luò)性能比較[J].中國衛(wèi)生統(tǒng)計(jì),2013,30(2):173-176.
[7] 陳銳,林達(dá).基于級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉關(guān)鍵點(diǎn)定位[J].四川理工學(xué)院學(xué)報(bào):自然科學(xué)版,2017,30(1):32-37.
[8] ABDEL-HAMID O,MOHAMED A R,JIANG H,et al.Convolutional Neural Networks for Speech Recognition[J].IEEE/ACM Transactions on Audio Speech & Language Processing,2014,22(10):1533-1545.
[9] KIM Y.Convolutional Neural Networks for Sentence Classification[J].Eprint Arxiv,2014.DOI: 10.3115/v1/D14-1181.
[10] 龍飛,王永興.深度學(xué)習(xí)入門與實(shí)踐[M].北京:清華大學(xué)出版社,2017.
[11] ZHANG W,PENG G,LI C.Rolling element bearings fault intelligent diagnosis based on convolutional neural networks using raw sensing signal[M].Berlin:Springer International Publishing,2017.
[12] 張晴晴,劉勇,潘接林,等.基于卷積神經(jīng)網(wǎng)絡(luò)的連續(xù)語音識(shí)別[J].工程科學(xué)學(xué)報(bào),2015,37(9):1212-1217.
[13] CHEN Z Q,LI C,SANCHEZ R V.Gearbox fault identification and classification with convolutional neural networks[J].Shock and Vibration,2015(2):1-10.
[14] FEI M,PENG C,SU Z,et al.Computational Intelligence,Networked Systems and Their Application[M].Berlin:Springer Publishing Company,2014.
[15] LOPARO K. Bearing vibration data set[D].Cleveland:Case Western Reserve University,2003.