朱會杰, 王新晴, 芮 挺, 張欲保, 李艷峰
(1. 近地面探測技術(shù)重點實驗室,無錫 214035; 2. 無錫科研一所,無錫 214035; 3. 上海交通大學(xué) 自動化系,上海 200240; 4. 陸軍工程大學(xué) 野戰(zhàn)工程學(xué)院,南京 210007; 5. 陸軍軍事交通學(xué)院汽車士官學(xué)校,蚌埠 230001)
隨著經(jīng)濟(jì)的發(fā)展,機(jī)械設(shè)備朝著大型化與集成化發(fā)展,結(jié)構(gòu)也越來越復(fù)雜,比如高鐵、航空飛機(jī)、核電站等。這些設(shè)備對可靠性提出了很高的要求,如果不能及時檢測出機(jī)械故障,可能導(dǎo)致機(jī)器停機(jī),造成經(jīng)濟(jì)損失,甚至導(dǎo)致事故發(fā)生。因此,開展機(jī)械故障診斷研究具有重要意義?;谛盘柼幚砗湍J阶R別的故障診斷方法可以在機(jī)器運行時實時監(jiān)測機(jī)器狀態(tài),在效率和準(zhǔn)確度都有明顯優(yōu)勢,一直是故障診斷領(lǐng)域研究的重點[1-3]。使用信號處理的方式識別機(jī)械故障,需要知道機(jī)器的故障特征頻率,對于復(fù)雜的機(jī)器或者模型未知的設(shè)備,這個條件是很難滿足的[4]。當(dāng)多種故障并存、故障特征微弱或者噪聲污染嚴(yán)重時,信號分析也常常無法奏效[5]。隨著人工智能技術(shù)的飛速發(fā)展,基于機(jī)器學(xué)習(xí)的智能診斷方法得到越來越多的關(guān)注[6]。Liu等[7]使用小波包提取振動信號特征,采用最小冗余—最大相關(guān)算法選擇最優(yōu)特征,借助于Ellipsoid-ARTMAP神經(jīng)網(wǎng)絡(luò)實現(xiàn)故障的識別。Kankar等使用統(tǒng)計方法對滾動軸承振動信號提取特征和特征降維,結(jié)合人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)判斷軸承的狀態(tài)。隨著大數(shù)據(jù)時代的來臨,稀疏編碼和深度學(xué)習(xí)被逐漸應(yīng)用到機(jī)械故障診斷,Liu等[8]使用移不變稀疏編碼自動提取軸承故障特征,降低了特征提取的難度。然后將特征輸入到分類器中以識別軸承狀態(tài),實驗顯示這種方法的準(zhǔn)確率優(yōu)于常規(guī)故障診斷方法。Zhu等使用K-SVD對軸承振動信號頻譜進(jìn)行訓(xùn)練,實現(xiàn)特征的自動提取和故障識別。這種方法減少了人工工作量,相對于Liu的方法提高了準(zhǔn)確率和計算效率,而且參數(shù)也容易設(shè)置。Tran等[9]將深度信念網(wǎng)絡(luò)(Deep Belief Network, DBN)引入到故障診斷中,首先對信號的時域、頻域和回歸估計進(jìn)行特征統(tǒng)計,然后通過廣義判別分析降維后輸入到DBN進(jìn)行訓(xùn)練和識別。
雖然基于機(jī)器學(xué)習(xí)的智能診斷方法已經(jīng)取得了豐碩的果實,但仍然存在一些問題。比如,常規(guī)的智能診斷流程一般包括信號采集、信號預(yù)處理、特征提取、特征選擇和模式識別等過程,步驟繁瑣、參數(shù)眾多,需要大量的經(jīng)驗、調(diào)節(jié)合適的參數(shù)才能使用。機(jī)器工作的時候負(fù)載常常會發(fā)生較大幅度的變化,轉(zhuǎn)速也會在一定范圍內(nèi)改變,但常規(guī)方法很難同時對負(fù)載與轉(zhuǎn)速具有魯棒性。此外,訓(xùn)練樣本的獲取非常困難,小樣本情況下泛化能力不強(qiáng)也限制了這些故障診斷方法的發(fā)展。
作為深度學(xué)習(xí)方法的一種,卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)通過構(gòu)建多層神經(jīng)網(wǎng)絡(luò),組合低層特征形成更加抽象的高層表示(屬性類別或特征)。使得學(xué)習(xí)到的特征對數(shù)據(jù)有更本質(zhì)的刻畫,從而有利于分類[10]。CNN可以直接對原始數(shù)據(jù)進(jìn)行特征學(xué)習(xí)和分類,減少了人工工作量,降低了實際應(yīng)用的難度。CNN通過卷積層和下采樣層的組合,能一定程度上對特征移動、縮放和干擾具有魯棒性[11],適合于機(jī)械故障診斷。直接使用傳感器采集的原始數(shù)據(jù)進(jìn)行故障診斷,不僅要求識別算法具有很強(qiáng)的學(xué)習(xí)能力與抗干擾能力,也要解決時域特征的平移不變性。盡管CNN對平移特征具有一定的不變性,但仍然無法滿足機(jī)械信號時移性特征。為此提出了一種權(quán)值求和和最大值池化的策略,解決了特征的平移不變性,也增強(qiáng)了抗干擾的能力。為實現(xiàn)在負(fù)載、轉(zhuǎn)速變化的情況下,使用盡量少的人工參與和盡量簡單的步驟實現(xiàn)精確的機(jī)械故障診斷進(jìn)行了研究。
淺層機(jī)器學(xué)習(xí)算法主要依靠人工經(jīng)驗預(yù)先提取出樣本的特征,主要任務(wù)是分類或預(yù)測。使用淺層機(jī)器學(xué)習(xí)算法時,為了提取表征目標(biāo)本質(zhì)的特征,獲得良好的分類效果,需要人們花費大量時間深入研究對象的模型和本質(zhì),而且還需要使用者反復(fù)嘗試參數(shù)設(shè)置,以及豐富的經(jīng)驗和運氣。這種人工設(shè)計特征的方式是一個不可擴(kuò)展的途徑,面對一個新的對象又需要重新設(shè)計。相對淺層學(xué)習(xí),深度學(xué)習(xí)通過學(xué)習(xí)一種深層非線性網(wǎng)絡(luò)結(jié)構(gòu),可以使用較少的權(quán)值實現(xiàn)對復(fù)雜函數(shù)的表達(dá),具有更好的泛化能力。深度學(xué)習(xí)強(qiáng)調(diào)了特征學(xué)習(xí)的重要性,通過逐層特征變換,將原始樣本從不易區(qū)分的原始空間變換到一個新的空間,不需要人工提取特征,并且提高了分類或預(yù)測的準(zhǔn)確率。深度學(xué)習(xí)主要包括DBN、堆棧式自編碼和CNN三種模型。CNN的權(quán)值共享網(wǎng)絡(luò)結(jié)構(gòu)使之更類似于生物神經(jīng)網(wǎng)絡(luò),降低了網(wǎng)絡(luò)模型的復(fù)雜度,減少了權(quán)值的數(shù)量,在一個深層的CNN網(wǎng)絡(luò)結(jié)果中,假設(shè)池化的尺度為2,網(wǎng)絡(luò)使用了兩次池化,那么最后一層的特征相當(dāng)于輸入信號按1/4分辨率進(jìn)行抽象化,原始信號的伸縮、平移帶來的變化在特征層會大大降低,CNN具有一定的伸縮、平移、扭曲不變性適合于具有伸縮、平移性的機(jī)械信號。
受Hubel和Wiesel對貓視覺皮層細(xì)胞研究的感受野的啟發(fā),LeCun等[12]提出了一種針對局部特征具有平移不變性的CNN。CNN的隱含層由交替出現(xiàn)的卷積層和下采樣層所構(gòu)成,上一層的信息被更高層所利用,通過逐層抽象提取更具意義的特征表示,最后通過一個全連接層輸出結(jié)果。一維信號的CNN結(jié)構(gòu)如圖1所示。
圖1 一維信號CNN結(jié)構(gòu)框圖
(1)
式中,b表示偏置,f為激活函數(shù),常選用Sigmoid函數(shù)、雙曲正切函數(shù)(Hyperbolic Tangent Function)。Mj表示對輸入特征圖的一種選擇,本文采用全連接方式。卷積層的主要任務(wù)是使用不同性能的濾波器對上一層各個位置的局部特征進(jìn)行處理,從不同角度得到具有平移不變性的特征。卷積層后面一般跟著一個下采樣層,池化的方式一般采用平均值池化和最大值池化,本文采用最大值池化方式
(2)
(u1,u2)表示選擇上一層池化的元素尺度,圖1中的尺度為2,即將兩個元素下采樣為一個元素。池化的作用是降低分辨率和提高計算效率,以增強(qiáng)網(wǎng)絡(luò)對縮放、扭曲的不變性,這種方式非常簡單有效。
經(jīng)過交替出現(xiàn)的卷積層和下采樣層,特征圖的大小逐漸減小,將最后一個下采樣層的特征合并為一個列向量Xl,與輸出標(biāo)簽進(jìn)行全連接。輸出層第j個標(biāo)簽的值為
(3)
輸出函數(shù)f(·)可以選擇Logistics函數(shù)和Softmax函數(shù),本文以Logistics函數(shù)為例進(jìn)行說明。由于整個數(shù)據(jù)集的誤差是所有樣例的誤差之和,對于Logistics函數(shù)只考慮第n個樣例的誤差為
(4)
式中,C為輸出節(jié)點的個數(shù)。
卷積神經(jīng)網(wǎng)絡(luò)采用誤差反傳,然后通過梯度下降法(或共軛梯度法、L-BFGS法)進(jìn)行優(yōu)化。將殘差δ定義為該節(jié)點對最終輸出值的誤差產(chǎn)生的影響,所以輸出層L的殘差δL為
δL=f′(zL)°(yn-on)
(5)
式中“° ”表示逐點乘積。因此輸出層的權(quán)值和偏置的梯度分別為
(6)
卷積層后面跟著一個下采樣層,因此計算其殘差時需要首先進(jìn)行上采樣
(7)
(8)
(9)
對于下一層連接卷積層的下采樣層,計算殘差時需要考慮共享權(quán)重
(10)
通過上述方法計算完梯度后,對卷積核、偏置和最后一層的全連接參數(shù)進(jìn)行更新,實現(xiàn)了卷積核的自動學(xué)習(xí),從而能夠完成對信號的表達(dá)和識別。
CNN獨特的拓?fù)浣Y(jié)構(gòu)使其對于特征平移、縮放具有一定的不變性,CNN已經(jīng)被廣泛應(yīng)用于數(shù)字識別、人臉識別、聲音識別、行人檢測等多個領(lǐng)域[13-16]。但機(jī)械故障診斷與這些問題有很大的差異。機(jī)械故障時往往會產(chǎn)生一些沖擊,這些沖擊的模式是判斷機(jī)器狀態(tài)的重要依據(jù)。由于截取信號樣本的起點隨機(jī)性,沖擊隨機(jī)分布于樣本的時域內(nèi)。CNN雖然對于特征的平移具有一定的不變性,但當(dāng)特征平移的尺度很大時,效果仍不理想。因此,需要采用更好的優(yōu)化策略來解決特征的平移不變性。機(jī)械故障設(shè)置需要做大量的實驗,投入很多資金和時間,并需要專業(yè)的人員才能操作,因此訓(xùn)練樣本很難獲得。要想成功運用CNN進(jìn)行故障診斷,首先要解決小樣本的學(xué)習(xí)問題。機(jī)械故障特征常被各種干擾所污染,尤其是早期故障的特征更不明顯。如何減少其他干擾的影響,提取能反映機(jī)器狀態(tài)的沖擊特征,是有效的故障診斷的關(guān)鍵。針對這些問題,考慮到CNN的優(yōu)勢與缺點,對其進(jìn)行了改進(jìn),使其能夠適合于周期性、帶有沖擊的機(jī)械信號。
機(jī)械振動信號的平移性一直是特征提取和識別的難點,平移不變性也是聲音識別、視頻跟蹤等研究領(lǐng)域的存在的共性問題,解決這類問題具有重要意義。在故障診斷領(lǐng)域,為了解決平移不變性,對信號進(jìn)行統(tǒng)計量分析是一種經(jīng)常使用且簡單易行的方法[17-18]。對機(jī)械振動信號進(jìn)行頻譜分析也是一種有效的方法,傅里葉變換的性質(zhì)說明了將信號轉(zhuǎn)化到頻域后可以減輕平移帶來的影響,但頻譜本質(zhì)也是一種統(tǒng)計量。還有學(xué)者使用一些具有平移不變性的信號處理方法進(jìn)行特征提取,比如小波變換、匹配追蹤、基追蹤等方法提取特征。但要人工選擇合適的特征需要對其運行模型、原理充分了解,而且通用性不強(qiáng),每個新對象都重新選擇,費時費力。
為此Liu等使用移不變稀疏編碼來進(jìn)行振動信號特征的自動提取,能根據(jù)信號自身特點自適應(yīng)地學(xué)習(xí)到信號的本質(zhì)特征,并將樣本的稀疏表示作為特征輸入分類器中進(jìn)行故障識別。但移不變稀疏編碼計算量很大,對他實驗中相同的數(shù)據(jù)分別使用移不變稀疏編碼和CNN進(jìn)行訓(xùn)練和識別,耗費時間分別為12 h和5 min,效率差異巨大。并且移不變稀疏編碼是一種淺層學(xué)習(xí),對復(fù)雜問題的表達(dá)能力有限,識別準(zhǔn)確率還待提高。Zhu等先將信號轉(zhuǎn)化到頻域,然后使用常規(guī)稀疏編碼方法——K-SVD進(jìn)行訓(xùn)練和識別。在綜合多尺度特征的基礎(chǔ)上,在效率和準(zhǔn)確率都較Liu等的方法有所提高,但該方法對轉(zhuǎn)速的魯棒性不強(qiáng)。Tran等提取了信號的時域、頻域的多個統(tǒng)計量,然后使用DBN進(jìn)行學(xué)習(xí)和識別。DBN的深度結(jié)構(gòu)具有很強(qiáng)的學(xué)習(xí)和表達(dá)能力,提高了識別的效果。但由于這些統(tǒng)計特征相對于原始信號已經(jīng)損失了不少有用信息,限制了診斷效果的進(jìn)一步提升。
直接使用原始信號進(jìn)行學(xué)習(xí)和識別將會大大減少人工工作量和主觀因素的影響。任何特征提取方法都會損失一定的有用信息,使用原始信號則能緩解這一問題。但如果直接使用原始信號進(jìn)行機(jī)械故障的識別,要求分類器具有強(qiáng)大的表達(dá)和學(xué)習(xí)能力才能從高維數(shù)據(jù)中自動獲取信號的本質(zhì)表達(dá)。還必須具有很強(qiáng)的平移不變性,以及具有在小樣本條件下的優(yōu)異泛化能力。CNN一定程度上具備了這種能力,但最后全連接層的節(jié)點仍然保留了信號的相對位置信息,在平移不變性方面仍有不足。如圖2所示,最后一層下采樣層中第一個特征圖中的深色元素,是由與之相連的其他深色元素運算得到的。而淺色標(biāo)注的元素,則表示在求解該節(jié)點時未參與運算。可以看出該節(jié)點本質(zhì)上是輸入信號上半部分的函數(shù)。類似地,末端節(jié)點則是輸入信號的下半部分的函數(shù)。由此可以推出,CNN提取的特征(最后一層下采樣層)的節(jié)點包含了一定的位置信息,本質(zhì)上這些位置信息有助于模式識別,但降低了平移不變性。對于具有特征平移和周期性的機(jī)械振動信號而言,如果使用少量樣本進(jìn)行訓(xùn)練,訓(xùn)練樣本中的特征位置只能涵蓋少數(shù)情況,容易導(dǎo)致網(wǎng)絡(luò)過學(xué)習(xí),最終導(dǎo)致網(wǎng)絡(luò)泛化能力不強(qiáng)。因此需要采取一些措施來減少CNN提取的特征位置信息。
為此,本節(jié)提出了權(quán)值求和策略以增強(qiáng)特征的平移不變性。如圖3所示,在最后一層下采樣層中,將同一特征圖中的元素取和,然后再與輸出節(jié)點相連。在圖3中,采用權(quán)值求和策略后,與輸出層連接的權(quán)值個數(shù)減少為3個。這種方式將整個最后一層下采樣層中的每個特征圖作為一個特征,消除了特征圖中元素的相對位置的影響,從網(wǎng)絡(luò)結(jié)構(gòu)上具有平移的不變性。與常規(guī)的CNN相比,有效增強(qiáng)了算法的泛化能力,在軸承的故障診斷中將識別準(zhǔn)確率提高了10%以上,實驗詳見下節(jié)。權(quán)值求和策略將卷積核看作濾波器,相當(dāng)于將信號通過不同的濾波器后的差異作為判斷信號類別的依據(jù)。但權(quán)值取和策略忽略了同一特征圖中的不同節(jié)點的權(quán)重多樣性,減少了特征的相對個數(shù)。為了克服這一缺陷,可以適當(dāng)增大最后一層特征圖的個數(shù),以增加從多個角度對原始信號的描述,增強(qiáng)網(wǎng)絡(luò)的表達(dá)和識別能力。
圖2 CNN平移性示意圖
圖3 權(quán)值求和
在CNN中,池化是一種簡單高效的操作,能夠?qū)σ欢ǔ潭鹊钠揭?、扭曲和伸縮保持不變性。池化還提高了計算的效率,增強(qiáng)了算法魯棒性。常用的池化算法有平均值池化和最大值池化,如果使用平均值池化方式,會將沖擊特征與干擾的能量進(jìn)行平均化,使得特征更加不明顯。因此,本文采用最大值池化,通過選擇最大值的方式無損保留沖擊特征信息。但沖擊特征在不同樣本中的位置是不同的,并且沖擊特征受到了噪聲和正常振動的干擾,影響了診斷效果。本文在最后一層下采樣層中使用了一種大尺度的最大值池化策略以解決這些問題,如圖4所示。由于一個沖擊往往包含許多元素,而且幅值很大。經(jīng)過大尺度最大值池化后,一個池化尺度的所有元素被下采樣為一個元素,沖擊由于幅值較大更容易被保留下來,并將其他干擾濾除。由池化的原理也可以知道,只要一個沖擊在池化的尺度內(nèi),無論該沖擊位于什么位置,都被池化為具有相同幅值的元素,因此這種方式對沖擊的平移也有良好的不變性。
圖4 大尺度最大化
大尺度最大值池化還大大減少了節(jié)點數(shù)目,在反向誤差傳播時,僅對少量的節(jié)點進(jìn)行了誤差傳播,降低了計算量。對特征圖進(jìn)行大尺度最大值池化后,每次被保留下來的節(jié)點的位置是隨機(jī)的,與近幾年提出的Dropout機(jī)制有些相似之處。Dropout是在模型訓(xùn)練時隨機(jī)讓網(wǎng)絡(luò)某些隱含層節(jié)點的權(quán)重置零,這種方法因為不能保證每2個隱含節(jié)點每次都同時出現(xiàn),權(quán)值的更新不再依賴于有固定關(guān)系的隱含節(jié)點的共同作用,阻止了某些特征僅僅在其它特定特征激活下才有效果的情況。從而Dropout能夠有效地提升小樣本時的過擬合現(xiàn)象,并且已經(jīng)被大量實驗證明。而大尺度最大值池化所保留下來的權(quán)值的位置也是不固定的,也具有與Dropout類似的提升小樣本時的過擬合的能力。
3.1.1 實驗介紹
軸承是典型的機(jī)械零件之一,研究軸承的故障識別對機(jī)械故障診斷具有指導(dǎo)意義。本文使用西儲大學(xué)軸承數(shù)據(jù),該數(shù)據(jù)被認(rèn)為是檢驗機(jī)械故障診斷方法的基準(zhǔn)。該試驗使用電火花加工技術(shù)分別在軸承外圈(3點鐘、6點鐘、12點鐘方向)、內(nèi)圈、滾動體上布置了單點故障,故障直徑分別為0.007、0.014、0.021、0.028、0.040英寸(1英寸=2.54厘米),每種狀態(tài)都分別在負(fù)載為0、1、2、3 HP(1 HP=746 W)的工況下進(jìn)行測試,轉(zhuǎn)速分別對應(yīng)于1 797、1 772、1 750、1 730 r/min。信號的采樣頻率為12 kHz。由于在工程應(yīng)用中,故障數(shù)據(jù)的獲取比較困難,因此希望在使用較少的數(shù)據(jù)時仍能獲得良好的故障診斷效果。本文主要研究在負(fù)載變化、轉(zhuǎn)速波動的條件下,通過使用少量的樣本對故障進(jìn)行準(zhǔn)確、快速的識別。為了能夠同時區(qū)分故障類型和故障程度,我們將數(shù)據(jù)分為10類,每一類數(shù)據(jù)都包含負(fù)載為0、1、2、3 HP四種工況,分別對應(yīng)的轉(zhuǎn)速為1 797、1 772、1 750、1 730 r/min,數(shù)據(jù)與類別的對應(yīng)關(guān)系見表1。Normal表示正常狀態(tài),IR、B與OR分別表示內(nèi)圈、球和外圈故障,其后的數(shù)字代表了故障程度,@后面表示故障點所處方位。比如,OR007@6表示軸承有外圈故障,故障直徑為0.007英寸,故障點位于6點鐘方向。每個樣本的長度為1 024點,訓(xùn)練樣本僅從負(fù)載為0 HP的數(shù)據(jù)中截取,相應(yīng)的轉(zhuǎn)速為1 797 r/min。測試樣本則從每個數(shù)據(jù)中不重疊的依次截取,能夠全面反映診斷方法的性能。正常狀態(tài)下的一個信號大約可以分割為236個樣本,故障工況下的每個信號大約可以分割為118個樣本。共獲得不同負(fù)載、不同轉(zhuǎn)速下的5 239個測試樣本。
從負(fù)載為0 HP(對應(yīng)的轉(zhuǎn)速為1 797 r/min)的每個類別的信號中,等間距抽取100個訓(xùn)練樣本,共有1 000個訓(xùn)練樣本作為訓(xùn)練集。平移不變CNN的網(wǎng)絡(luò)設(shè)置中,選用兩個卷積層、兩個下采樣層。由于沖擊的共振波形以及沖擊的周期都反映了軸承的狀態(tài),因此希望CNN能將這些信息都能進(jìn)行提取。一個沖擊的周期約等價于90個點所對應(yīng)的時長,因此第一層卷積核的尺寸為89個點,共選用5個,用于提取沖擊的共振波形信息,其后的下采樣層中池化的尺寸為2。經(jīng)過池化后,原始信號被壓縮為原來的一半。第二層卷積核尺寸仍為89個點,共選用10個。但此時的卷積核相當(dāng)于第一層中兩個沖擊的大小,主要用于提取沖擊的周期特征。其后的下采樣層池化尺寸為大尺寸95,經(jīng)過這個大尺寸最大值池化后,每個特征圖減少為4個元素的特征,提高了計算效率。激活函數(shù)選為tanh函數(shù),輸出函數(shù)為Softmax分類器。每個樣本要歸一化到[-1,+1]之間。
為了全面反映平移不變CNN的性能,還與其他使用該數(shù)據(jù)的學(xué)者的診斷方法進(jìn)行了對比,Liu等使用移不變稀疏編碼提取信號特征后,輸入分類器中進(jìn)行識別。Zhu等使用K-SVD對信號的包絡(luò)譜進(jìn)行學(xué)習(xí)和識別,并使用小波提取多尺度的頻譜,然后使用證據(jù)理論綜合多個尺度的識別結(jié)果。這三種方法的識別結(jié)果,如圖5所示。
從結(jié)果上看,平移不變CNN的準(zhǔn)確率幾乎在每類上的準(zhǔn)確率都是最高的,即使在最差的IR014類別中的準(zhǔn)確率也達(dá)到97%以上,穩(wěn)定性很好。三種方法的綜合對比見表2,可以看出,本文方法不僅在準(zhǔn)確率上有優(yōu)勢,而且所需預(yù)處理最簡單,人工參數(shù)設(shè)置步驟簡單,計算效率較高。這些結(jié)果也說明平移不變CNN的深度學(xué)習(xí)結(jié)構(gòu)具有很強(qiáng)的學(xué)習(xí)能力,適用于機(jī)械故障診斷,具有良好的工程應(yīng)用價值。
圖5 準(zhǔn)確率
表2 三種算法的性能對比
3.1.2 與其他機(jī)器學(xué)習(xí)算法的對比
為了更加全面驗證本文方法的性能,還使用上述數(shù)據(jù)與其他機(jī)器學(xué)習(xí)算法進(jìn)行了對比,同時繼續(xù)與Liu、Zhu的方法進(jìn)行了深入對比。由于Zhu的方法、堆棧式自動編碼器(Stacked Autoencoders, SAE)、BP神經(jīng)網(wǎng)絡(luò)和DBN這幾類方法不具有平移不變性,直接使用時域信號作為輸入效果太差,這里使用包絡(luò)譜進(jìn)行訓(xùn)練和識別。此外,這些算法對轉(zhuǎn)速的魯棒性較差,需要采取其他措施。由于重采樣后不同轉(zhuǎn)速下的信號能有相同的等價轉(zhuǎn)速,可以消除轉(zhuǎn)速變化帶來的干擾,還對這些方法采用重采樣后進(jìn)行測試以提高準(zhǔn)確率,*表示對信號進(jìn)行了重采樣操作。得益于平移不變CNN的拓?fù)浣Y(jié)構(gòu)與機(jī)械振動信號的特征一致,平移不變CNN對時移、伸縮都具有很強(qiáng)的不變性,能直接對原始時域信號進(jìn)行分析,深度網(wǎng)絡(luò)的抽象性也能對轉(zhuǎn)速波動、負(fù)載變化具有優(yōu)異的魯棒性。各種方法的準(zhǔn)確率如圖6所示,平移不變CNN具有準(zhǔn)確率較高,優(yōu)于稀疏編碼和BP神經(jīng)網(wǎng)絡(luò),以及深度學(xué)習(xí)方法SAE和DBN。此外,本文方法直接使用原始時域樣本進(jìn)行學(xué)習(xí)和識別,操作簡單。
圖6 與其他機(jī)器學(xué)習(xí)算法的性能對比
3.1.3 與常規(guī)CNN算法的對比
為了驗證權(quán)值求和和大尺度最大值池化策略的有效性,還與常規(guī)CNN進(jìn)行了對比,為了表述方便,定義CNN1為常規(guī)CNN+權(quán)值求和,CNN2為常規(guī)CNN+大尺度最大值池化,常規(guī)CNN中最后一層下采樣層的池化尺度為4,其中四種方法對訓(xùn)練樣本進(jìn)行訓(xùn)練的準(zhǔn)確率全部為100%,測試結(jié)果如圖7所示。從結(jié)果可以看出,添加權(quán)值求和或大尺度最大值池化策略都可以增強(qiáng)算法的泛化能力,提升準(zhǔn)確率。隨著樣本數(shù)量的增加,CNN1或CNN2的性能與同時采用兩種策略的CNN的性能越來越接近,而且常規(guī)CNN的效果也得到了提升。這是因為隨著樣本的增多,有更多的樣本,一定程度彌補了常規(guī)CNN對小樣本機(jī)械信號泛化能力的不足。這些結(jié)果說明了平移不變CNN更適合機(jī)械故障診斷。
圖7 權(quán)值求和和大尺度最大值池化的性能測試
本文還對多點軸承故障進(jìn)行了診斷。試驗臺如圖8所示,試驗臺包括調(diào)速電動機(jī)、齒輪增速器、測試軸承、轉(zhuǎn)子、振動傳感器以及綜合電子控制系統(tǒng)(圖中沒顯示)。軸承的型號為HRB6304,損傷是用電火花加工的,分別模擬了單點故障和多點故障,單點故障如圖9所示,多點故障如圖10所示。每種故障的直徑都為0.533 4 mm,故障深度為2.1 mm。信號采樣頻率為10 kHz,轉(zhuǎn)速在1 800~2 000 r/min,軸承共有7種狀態(tài),將信號截取成長度為1 024點的樣本,每種狀態(tài)下訓(xùn)練樣本隨機(jī)選擇100個,測試樣本從剩余樣本中隨機(jī)選擇200個。
圖8 軸承試驗臺
圖9 單點故障軸承示意圖
在平移不變CNN網(wǎng)絡(luò)設(shè)置中,第一個卷積層的卷積核大小為137個點,共有5個卷積核。其后的下采樣層的尺度為2。第二個卷積層的卷積核大小也為137個點,共有10個卷積核。其后的下采樣層為大尺度池化,尺度為77。輸出層選用Logistics分類器,共有四個輸出節(jié)點,每個節(jié)點的值為0或1(0表示假,1表示真)。四個節(jié)點依次表示正常狀態(tài)、外圈故障、內(nèi)圈故障和滾動體故障。識別準(zhǔn)確率如圖11所示。為了詳細(xì)的反映實驗結(jié)果,使用了兩種故障率統(tǒng)計方式,在計算故障準(zhǔn)確率1時,對于多點故障的軸承,只要有一個故障被預(yù)測出來,就按正確對待。在計算故障準(zhǔn)確率2時,對于多點故障,只有所有的故障都被正確預(yù)測出來,才按正確對待。從結(jié)果上看,平移不變CNN對于多點耦合故障仍然能有不錯的識別效果,適合于周期性的機(jī)械沖擊信號。
圖11 識別準(zhǔn)確率
本文將CNN引入到智能機(jī)械故障診斷,并針對機(jī)械振動信號的特點提出了權(quán)值求和和大尺度最大值池化策略。CNN是一種深層結(jié)構(gòu)網(wǎng)絡(luò),能夠自動學(xué)習(xí)到原始數(shù)據(jù)的本質(zhì)表示,具有很強(qiáng)的表達(dá)能力?;贑NN的機(jī)械故障診斷不需要對原始信號進(jìn)行復(fù)雜的預(yù)處理、特征提取、特征選擇等人工操作,簡化了診斷步驟,降低了對使用者的技術(shù)要求,提高了工程應(yīng)用效率。本文提出的權(quán)值求和和大尺度最大值池化策略,有效解決了時域振動信號的平移不變性。實驗驗證了這些策略能有效增強(qiáng)算法的泛化能力,尤其是小樣本的時候。最后,分別通過單點故障和多點故障的軸承進(jìn)行驗證,證明了平移不變CNN較常規(guī)診斷方法有更高的識別準(zhǔn)確率和計算效率,對負(fù)載變化和轉(zhuǎn)速波動都有很強(qiáng)的魯棒性,所需額外處理少,是一種優(yōu)異的機(jī)械故障診斷方案。此外,本文提出的解決平移不變性的方案對圖像和聲音處理也有啟發(fā)意義。