楊蘭柱,劉文廣
(1.內(nèi)蒙古科技大學(xué)工程訓(xùn)練中心,內(nèi)蒙古包頭 014010;2.內(nèi)蒙古科技大學(xué)機(jī)械工程學(xué)院,內(nèi)蒙古包頭 014010)
軸承是旋轉(zhuǎn)機(jī)械的基本部件之一,45%~55%的機(jī)器停機(jī)是由軸承故障引起的[1],所以,有效的軸承故障診斷方法是保證機(jī)器正常工作的重中之重。但軸承故障診斷一直是故障診斷領(lǐng)域中的難題。
到目前為止,大多數(shù)基于數(shù)據(jù)驅(qū)動(dòng)的智能診斷方法已被應(yīng)用于軸承故障診斷領(lǐng)域中。如人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN),隨機(jī)森林和支持向量機(jī)(Support Vector Machine,SVM)。利用這些淺層機(jī)器學(xué)習(xí)模型進(jìn)行軸承故障診斷需要手工提取一系列的振動(dòng)信號(hào)特征(例如方差、能量熵、均方根等),將所提取的特征作為模型輸入從而利用分類器進(jìn)行故障分類。以往的研究結(jié)果表明,特征提取是達(dá)到理想診斷準(zhǔn)確率的重要前提。但實(shí)際上,人為的提取很難準(zhǔn)確表征軸承故障特性的有效特征,主要有以下3個(gè)難以解決的問題[2]:(1)需要足夠的專業(yè)知識(shí)和經(jīng)驗(yàn)知識(shí);(2)在難以消除的硬件干擾及多變的機(jī)械系統(tǒng)環(huán)境下,提取的特征也應(yīng)該是多變的;(3)手工提取特征可能對(duì)數(shù)據(jù)利用率較低,從而導(dǎo)致有效信息缺失。因此,上述經(jīng)典的淺層模型不適用于軸承故障診斷。
為了避免上述問題,近年來,各種基于模式識(shí)別[3]的深度學(xué)習(xí)方法被提出,其中CNN受到各個(gè)領(lǐng)域的廣泛關(guān)注。與其他深度學(xué)習(xí)模型相比,CNN采用權(quán)值共享、局部感知和子采樣策略,可以顯著減少待優(yōu)化參數(shù)數(shù)量,使網(wǎng)絡(luò)訓(xùn)練速度大大提升。同時(shí),由于CNN卷積過程中對(duì)局部變化不敏感的特點(diǎn),使CNN具有了較強(qiáng)的抗噪能力。CNN作為主要的深度學(xué)習(xí)模型之一,已經(jīng)成功應(yīng)用于許多領(lǐng)域。
但由于傳統(tǒng)CNN網(wǎng)絡(luò)自身特性,在用于軸承振動(dòng)信號(hào)深層次特征提取時(shí),在提取過程中往往會(huì)產(chǎn)生過擬合現(xiàn)象,導(dǎo)致測試集準(zhǔn)確率較低且訓(xùn)練速度較慢?;诖?,本文在原有的CNN網(wǎng)絡(luò)架構(gòu)基礎(chǔ)上對(duì)網(wǎng)絡(luò)進(jìn)行了改進(jìn),增加了一個(gè)批歸一化(batch normalization,BN)層[4],一個(gè)指數(shù)線性單元層(exponential linear unit,ELU)[5],并通過實(shí)驗(yàn)表明提出的網(wǎng)絡(luò)更具有有效性及泛化性。
改進(jìn)的CNN網(wǎng)絡(luò)目的是完善傳統(tǒng)CNN在提取信號(hào)局部特征時(shí)的一些弊端。改進(jìn)的CNN網(wǎng)絡(luò)信號(hào)提取層由一個(gè)卷積層(Convolution),一個(gè)BN層,一個(gè)ELU層和一個(gè)最大池化層(Max Pooling,MP)構(gòu)成,結(jié)構(gòu)如圖1所示。其中,卷積層和池化層是改進(jìn)的CNN網(wǎng)絡(luò)的核心層。BN層提高了深度網(wǎng)絡(luò)的性能和穩(wěn)定性。ELU層加快了設(shè)計(jì)網(wǎng)絡(luò)的學(xué)習(xí)速度,提高了的識(shí)別精度。最大池化層可以減少噪聲對(duì)提取故障特征的干擾[6]。它將輸入劃分為一組互不重疊的區(qū)域,并輸出每個(gè)子區(qū)域的最大值[7]。改進(jìn)的CNN網(wǎng)絡(luò)是由對(duì)輸入噪聲具有魯棒性的層構(gòu)建而成,因此改進(jìn)的CNN網(wǎng)絡(luò)學(xué)習(xí)到的特征具有一定的魯棒性。
圖1 改進(jìn)的CNN網(wǎng)絡(luò)
將信號(hào)x(n)作為輸入輸入到大小為l的卷積核w(n)中進(jìn)行卷積來獲得結(jié)果z(n),實(shí)驗(yàn)中隨機(jī)初始化卷積核w(n)。
然后將卷積得到的特征輸入到BN層,使這些特征在激活后得以歸一化。歸一化后,這些特征的平均值接近于0,標(biāo)準(zhǔn)差接近于1。歸一化的特征可以表示為:
經(jīng)過函數(shù)BN(?)的處理后,卷積層獲得的特征已被規(guī)范化,函數(shù)σ(?)為ELU層的激活函數(shù),可表示為:
將所得特征傳遞給最大池化層,池化層具有非線性下采樣功能,可以降低特征分辨率,最大池化層生成的特征可表示為:式中:Ωk為索引為j的池化區(qū)域。
本文構(gòu)建了改進(jìn)的CNN網(wǎng)絡(luò)來對(duì)軸承振動(dòng)信號(hào)進(jìn)行處理,通過疊加4個(gè)特征提取層來提取軸承振動(dòng)信號(hào)深層次特征。其流程圖如下,其中每一個(gè)LFLB為一個(gè)特征提取層,每個(gè)LFLB層由一個(gè)卷積層,一個(gè)BN層,一個(gè)ELU層及一個(gè)最大池化層組成。4個(gè)LFLB組成的LFLBS層提取出了信號(hào)的深層次特征如圖2所示。該網(wǎng)絡(luò)目的是從軸承振動(dòng)信號(hào)中學(xué)習(xí)深層特征,軸承振動(dòng)信號(hào)是一維的,因此,每個(gè)LFLB模塊的卷積核和池化內(nèi)核都是一維的,且每個(gè)LFLB模塊的卷積核大小都為3,步長都為1,填充方式都為SAME。其中LFLB1與LFLB2卷積核數(shù)量為64,LFLB3和LFLB4卷積核數(shù)量為128。每個(gè)LFLB模塊中的最大池化內(nèi)核大小與步長都為4。網(wǎng)絡(luò)參數(shù)如表1所示。網(wǎng)絡(luò)頂層使用softmax分類器,分類器根據(jù)學(xué)習(xí)到的深層次特征來判別軸承故障類型。
然后將學(xué)習(xí)到的深層次特征輸入到全連接中,全連接層輸出的故障特征可表示為:
圖2 改進(jìn)的CNN網(wǎng)絡(luò)流程圖
表1 改進(jìn)的網(wǎng)絡(luò)參數(shù)(C為卷積層,P為池化層)
全連接層輸出輸入到Softmax分類器中進(jìn)行分類。Softmax是一種分類器,在多分類問題中,標(biāo)簽z包含兩個(gè)以上的值。Softmax函數(shù)可以定義為:式中:zi為softmax的輸入;hj為倒數(shù)第二層的激活;Wji為倒數(shù)第二層和softmax層之間的權(quán)重。
因此,預(yù)測類標(biāo)簽為:
西儲(chǔ)大學(xué)軸承數(shù)據(jù)集被認(rèn)為是檢驗(yàn)機(jī)械故障診斷方法的基準(zhǔn)。所用故障軸承故障為正常軸承;內(nèi)圈故障軸承,外圈故障軸承,滾動(dòng)體故障軸承。該試驗(yàn)使用電火花加工技術(shù)分別在軸承外圈(3點(diǎn)鐘、6點(diǎn)鐘、12點(diǎn)鐘方向)、內(nèi)圈、滾動(dòng)體上布置了單點(diǎn)故障,故障直徑分別為0.007英寸(1英寸=2.54 cm)、0.014英寸、0.021英寸、0.028英寸、0.040英寸,轉(zhuǎn)速分別對(duì)應(yīng)于 1 797 r/min、1 772 r/min、1 750 r/min、1 730 r/min。信號(hào)的采樣頻率為12 000 Hz。將西儲(chǔ)大學(xué)正常軸承振動(dòng)數(shù)據(jù)及3種故障軸承振動(dòng)數(shù)據(jù)每類故障下的每個(gè)樣本裁剪為10個(gè)大小為12 000個(gè)點(diǎn)的子樣本,隨機(jī)性的將子樣本集以8∶2∶2的比例分割為訓(xùn)練集、驗(yàn)證集及測試集。
圖3 HZXT-DS-003雙跨雙轉(zhuǎn)子滾動(dòng)軸承試驗(yàn)臺(tái)簡圖
表2 6205軸承參數(shù)
2.2.1 傳統(tǒng)CNN在該數(shù)據(jù)集上的應(yīng)用
使用傳統(tǒng)的CNN來對(duì)該數(shù)據(jù)集數(shù)據(jù)進(jìn)行處理,網(wǎng)絡(luò)架構(gòu)如圖4所示,網(wǎng)絡(luò)參數(shù)如表3所示。
圖4 傳統(tǒng)CNN架構(gòu)圖
表3 CNN參數(shù)
實(shí)驗(yàn)結(jié)果如圖5所示。從結(jié)果可以看出,使用傳統(tǒng)CNN來對(duì)該數(shù)據(jù)集數(shù)據(jù)進(jìn)行分析,要達(dá)到模型最優(yōu)需要的迭代次數(shù)有230次左右,且驗(yàn)證集準(zhǔn)確率最高僅有76.33%,使用測試集對(duì)訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行測試,準(zhǔn)確率為75.26%,顯然,傳統(tǒng)的CNN并不適合處理軸承原始振動(dòng)信號(hào)。
2.2.2 改進(jìn)的CNN在該數(shù)據(jù)集上的應(yīng)用
使用改進(jìn)的CNN網(wǎng)絡(luò)來對(duì)數(shù)據(jù)集進(jìn)行處理,網(wǎng)絡(luò)架構(gòu)如圖2 所示,網(wǎng)絡(luò)參數(shù)與表1參數(shù)相同。處理結(jié)果如圖6所示,當(dāng)?shù)螖?shù)達(dá)到34次時(shí)模型達(dá)到最優(yōu),此時(shí)驗(yàn)證集準(zhǔn)確率最高為98.75%。使用測試集對(duì)模型進(jìn)行測試,得到的軸承故障混淆矩陣如表4所示,測試集準(zhǔn)確率為97.35%。結(jié)果表明,與使用傳統(tǒng)CNN實(shí)驗(yàn)結(jié)果相比較,網(wǎng)絡(luò)達(dá)到最優(yōu)所用迭代次數(shù)大大減少,表明改進(jìn)的CNN運(yùn)算成本大大降低。且準(zhǔn)確率方面,改進(jìn)后的CNN性能明顯優(yōu)于傳統(tǒng)CNN。
圖5 傳統(tǒng)CNN訓(xùn)練準(zhǔn)確率和驗(yàn)證準(zhǔn)確率隨迭代次數(shù)的變化圖
圖6 改進(jìn)的CNN訓(xùn)練正確率和驗(yàn)證準(zhǔn)確率隨迭代次數(shù)的變化圖
表4 軸承故障混淆矩陣準(zhǔn)確率%
使用改進(jìn)的CNN網(wǎng)絡(luò)來對(duì)軸承進(jìn)行故障診斷,可以避開人工提取特征過程,減少診斷成本。又由于是在海量數(shù)據(jù)中尋找特征,所以具有更高的泛化性。本文提出的改進(jìn)的CNN網(wǎng)絡(luò)可以有效地學(xué)習(xí)到軸承振動(dòng)信號(hào)深層次特征,相比于使用傳統(tǒng)CNN網(wǎng)絡(luò),其提取的特征更具有代表性,診斷效果遠(yuǎn)好于使用傳統(tǒng)CNN神經(jīng)網(wǎng)絡(luò)。