蔣麗英,劉桂金,崔建國,杜文友,于明月
(沈陽航空航天大學(xué) 自動化學(xué)院,沈陽 110136)
齒輪是工程設(shè)備運行重要部件之一,若齒輪發(fā)生故障,輕則導(dǎo)致工程設(shè)備運行不正常,重則威脅到工作人員的人身安全。因此,對齒輪的故障診斷方法進行研究是十分必要的[1]。但是齒輪發(fā)生的故障通常難以直接監(jiān)測,通過對其產(chǎn)生的振動信號進行分析,進而判斷發(fā)生故障的類型是一種有效的方法。
對振動信號的處理主要包括特征提取、特征選擇[2]、利用選擇后的特征進行故障分類。特征提取的目的是提取原始振動信號中與故障狀態(tài)有關(guān)的特征。通常采用一些基于信號處理的方法,例如小波變換[3]、快速傅里葉變換[4]、經(jīng)驗?zāi)B(tài)分解[5]等特征提取完成后,需要對提取的特征進行篩選,目的是將故障信息不明顯的特征去除,以此來進一步減少特征的數(shù)目。通常采用的方法有主成分分析法[6],獨立分量分析法[7]等。最后一個階段是將篩選后的特征作為網(wǎng)絡(luò)模型的輸入,通過訓(xùn)練網(wǎng)絡(luò)模型完成故障的模式識別。
近年來,隨著大數(shù)據(jù)時代的到來,深度學(xué)習(xí)被廣泛應(yīng)用于機械部件故障診斷領(lǐng)域。卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)中的一種,其優(yōu)勢在于強大的特征自學(xué)習(xí)性能,能夠避免人為因素的干擾,實現(xiàn)故障分類。目前,已有一些研究者將CNN應(yīng)用到齒輪箱故障診斷領(lǐng)域。Chen等[8]通過將振動信號的特征統(tǒng)計圖輸入CNN,實現(xiàn)了故障分類。吳春志等[9]直接將原始振動信號作為1D-CNN的輸入,證明了1DCNN模型對單一和復(fù)合故障的診斷性能均優(yōu)于傳統(tǒng)診斷方法。這種方法雖然能夠簡化診斷流程,但是原始振動信號中存在的大量干擾信息會對診斷結(jié)果造成不良影響。
三軸振動傳感器在大型旋轉(zhuǎn)機械的在線監(jiān)測與故障診斷中應(yīng)用越來越廣泛,3D振動信號的采集工作也變得簡單易行。因此,尋找能夠有效利用3D振動信號實現(xiàn)齒輪故障診斷的方法是當(dāng)前亟待解決的問題。為此,本文提出了一種基于1D-CNN的齒輪3D振動信號故障診斷方法。首先,采用1D-CNN對3D振動信號時域特征進行選擇;然后,根據(jù)獲得的最優(yōu)時域特征參數(shù)集提取3D振動信號的相關(guān)特征,并將3D特征數(shù)據(jù)橫向排列重構(gòu)成1D特征向量;最后,利用1D-CNN實現(xiàn)對齒輪的故障診斷。通過實驗驗證,與基于1D振動信號的診斷結(jié)果相比,診斷準(zhǔn)確率得到提高,并對本文的網(wǎng)絡(luò)模型在不同工況的泛化性能進行了分析。
作為旋轉(zhuǎn)機械中常用的部件,齒輪長時間處于運轉(zhuǎn)狀態(tài),容易引起點蝕、斷齒及裂紋等類型的故障。由于互動效應(yīng),甚至?xí)鸩考g的復(fù)合型故障,導(dǎo)致機械系統(tǒng)局部陷入癱瘓。因此,對齒輪的運行狀態(tài)進行監(jiān)測十分必要。
在復(fù)雜的工作條件下,齒輪振動信號具有非線性、非平穩(wěn)的特點[10],該特點會使故障信息不明顯,無法反映出齒輪的運行狀態(tài)。齒輪的振動信號一般為與時間相關(guān)的序列,因此,采用時域分析,通過提取振動信號的時域特征參數(shù)精準(zhǔn)地反映齒輪的運行狀態(tài)。時域特征分為有量綱和無量綱兩種[11]。其中,有量綱特征能夠有效跟蹤齒輪的運行狀態(tài),但是易受到外界條件的干擾。相比較而言,無量綱特征能夠排除外界因素的干擾,更加穩(wěn)定地跟蹤齒輪的運行狀態(tài)。因此,為了更全面地表征齒輪的運行狀態(tài),本文將有量綱與無量綱特征組合使用。
卷積神經(jīng)網(wǎng)絡(luò)具備強大的特征自提取能力,能夠更加深入地挖掘時域特征中表征齒輪工作狀態(tài)的深層次信息,特征的利用率更高。因此,對特征進行分類的效果進一步得到提高。CNN通常分為1D-CNN、2D-CNN和3DCNN。1D-CNN主要用于處理序列類的數(shù)據(jù),2D-CNN常應(yīng)用于識別圖像類文件,3D-CNN主要用于醫(yī)學(xué)領(lǐng)域內(nèi)的圖像識別[12]。1D-CNN模型一般由卷積層、池化層、全連接層等組成[13],網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 1D-CNN模型網(wǎng)絡(luò)結(jié)構(gòu)圖
卷積層通過卷積核權(quán)值共享對輸入進行卷積運算[14]。卷積運算可以表示為
卷積層之后一般是池化層,應(yīng)用較多的是最大池化[15],該方式能夠保留特征圖中的最大局部特征。其函數(shù)表達式為
全連接層通常位于池化層之后,將池化層最后一層的輸出進行首尾連接后轉(zhuǎn)化為一維向量[16]。之后利用Soft-max分類器執(zhí)行故障分類的任務(wù),其運算過程如式(3)所示
式中:j代表k類中的某一類別,該類別的值用zj表示。
在眾多的時域特征參數(shù)中,并不是每個特征都能有效地表征齒輪的故障狀態(tài)。因此,本文采用1D-CNN網(wǎng)絡(luò),以平均故障診斷率作為篩選準(zhǔn)則,對時域特征進行篩選。具體步驟如下:
步驟1:使用三軸振動加速度傳感器采集P種已知故障(包含正常齒輪)的振動信號,其中每種故障的3D振動信號記為q={sx(t),sy(t),sz(t)},下標(biāo)x、y、z分別表示3D振動信號的x軸(徑向)、y軸(軸向)和z軸(周向)。設(shè)置樣本長度為m,每種故障的樣本數(shù)為Np(p=1,2,…,P),構(gòu)建樣本數(shù)據(jù)。顯然,樣本q為m×3的數(shù)據(jù)。
步驟2:確定時域特征參數(shù)集F={Fj},j=1,2,…,J;設(shè)置1D-CNN網(wǎng)絡(luò)結(jié)構(gòu)參數(shù),并令j=1。
步驟3:分別對P種樣本數(shù)據(jù)提取第j種時域特征,構(gòu)建特征集。其中,的第i行為、第p種故障的第i個樣本的時域特征值。
步驟4:將第j種時域特征的特征集{Xj p}(p=1,2,…,P)分為訓(xùn)練集和測試集。訓(xùn)練集用來訓(xùn)練第j種時域特征的1D-CNN模型;測試集用來計算1D-CNN模型的故障診斷準(zhǔn)確率。
步驟5:若平均故障診斷準(zhǔn)確率大于給定閾值σ%,則該時域特征參數(shù)Fj為最優(yōu)參數(shù),并加入最優(yōu)參數(shù)集F*。
步驟6:令j=j+1,重復(fù)步驟3~5,直到特征參數(shù)Fj被篩選完為止。
本文提出的基于1D-CNN的齒輪3D振動信號故障診斷流程如圖2所示。該方法的具體步驟如下:
圖2 面向3D振動信號的1D-CNN故障診斷模型
步驟1:最優(yōu)特征提取。按照3.1節(jié)確定的包含l個時域特征參數(shù)的最優(yōu)參數(shù)集F*,對P種故障樣本數(shù)據(jù)提取最優(yōu)特征。對于樣本x∈Rm×3,按3個軸記為Fx、Fy、Fz、對x、y和z軸長度為m的振動信號提取時域特征。
步驟2:特征重組。將每個樣本的最優(yōu)特征向量按行的方向重組為一維特征向量F∈R3l×1,即F=,如圖2所示。
步驟3:設(shè)置1D-CNN故障診斷模型結(jié)構(gòu)參數(shù),輸入層為重組后的特征向量F,輸出層為P種故障類別。將樣本數(shù)據(jù)分為訓(xùn)練集和測試集,按步驟1對訓(xùn)練集和測試集提取最優(yōu)特征,按步驟2分別對訓(xùn)練集和測試集的最優(yōu)特征進行重組,從而構(gòu)建訓(xùn)練特征集和測試特征集。訓(xùn)練特征集用來訓(xùn)練神經(jīng)網(wǎng)絡(luò),得到1D-CNN故障診斷模型。
步驟4:測試時,利用訓(xùn)練好的1D-CNN故障模型對測試特征集進行分類,最后用故障診斷準(zhǔn)確率評價所提出方法的性能。
本文的實驗數(shù)據(jù)是用江蘇千鵬QPZZ - II型旋轉(zhuǎn)機械故障模擬實驗臺測得。該實驗臺如圖3所示,齒輪箱由55齒的主動齒輪和75齒的從動齒輪組成。采用電子放電的方法將裂紋和斷齒故障分別引入從動齒輪。齒輪箱頂部安裝B&K 4056三軸加速度傳感器,以獲取齒輪徑向(x軸)、軸向(y軸)和周向(z軸)的三軸振動信號。將徑向(x軸)的振動信號作為單軸振動信號。
圖3 QPZZ-II旋轉(zhuǎn)機械故障模擬實驗臺
本實驗臺的數(shù)據(jù)采樣頻率設(shè)置為5kHz。將齒輪3種工作狀態(tài)設(shè)置為1、2、3這3種標(biāo)簽。每種工作狀態(tài)中選取150組樣本數(shù)據(jù),每組樣本包括1 024個采樣點。將150組樣本按照1:2分成訓(xùn)練集樣本和測試集樣本,即選取其中50組樣本作為訓(xùn)練集,100組樣本作為測試集。
本文從原始3D振動中提取了10個時域特征參數(shù),利用1D-CNN模型對每個特征參數(shù)進行診斷分類。計算齒輪3種工作狀態(tài)的平均故障診斷準(zhǔn)確率,按照從高到低的順序排列,如表1所示。
表1 時域特征診斷準(zhǔn)確率
為提高1D-CNN模型的故障診斷準(zhǔn)確率,在以上特征中選取平均故障診斷準(zhǔn)確率在85%以上的時域特征,即方差值、峭度、峰峰值、峰值組成時域特征集,則篩選出的最優(yōu)特征參數(shù)集為F*={方差值,峭度,峰峰值,峰值}。以上4個時域指標(biāo)在齒輪3種運行狀態(tài)下的分布如圖4所示。
圖4 齒輪3種運行狀態(tài)下4種時域特征分布圖
本文提出的1D-CNN模型的主要結(jié)構(gòu)參數(shù)如表2所示。卷積層1的卷積核(11×1)較大,較大的卷積核能夠充分挖掘時域特征中代表齒輪工作狀態(tài)的信息;卷積層2的卷積核(7×1)較小,較小的卷積核可以更好地挖掘隱藏的故障特征信息。激活函數(shù)采用ReLU。為避免過擬合,在池化層的最后一層添加Dropout層。
表2 1D-CNN模型的主要結(jié)構(gòu)參數(shù)
采用轉(zhuǎn)速為30 r/min、徑向載荷為50%的齒輪3D振動信號,提取三軸時域最優(yōu)特征參數(shù)集作為訓(xùn)練樣本,對1D-CNN故障診斷模型進行訓(xùn)練,與將單軸時域最優(yōu)特征參數(shù)集作為訓(xùn)練樣本的1D-CNN模型進行對比。準(zhǔn)確率隨迭代次數(shù)的變化趨勢如圖5所示。
圖5 單軸和三軸故障診斷準(zhǔn)確率變化趨勢
由圖5可知,在前10次的迭代過程中,以三軸信號為基礎(chǔ)的故障診斷模型與以單軸信號為基礎(chǔ)的模型診斷準(zhǔn)確率相差不大。但隨著迭代次數(shù)的增加,其準(zhǔn)確率遠遠高于以單軸信號為基礎(chǔ)的模型。并且在迭代過程中,以三軸信號為基礎(chǔ)的模型穩(wěn)定性更優(yōu)。
進一步采用測試集的故障診斷準(zhǔn)確率來判斷模型的診斷性能,表3為將單軸時域最優(yōu)特征參數(shù)集和三軸時域最優(yōu)特征參數(shù)集作為診斷模型的輸入得到的診斷準(zhǔn)確率。
表3 1D-CNN模型對不同維度齒輪信號診斷準(zhǔn)確率
由表3可知,本文采用三軸振動信號進行故障診斷時,正常狀態(tài)和斷齒故障診斷準(zhǔn)確率均達到了100%,相較于單軸振動信號,分別提高了4%和20%;采用三軸振動信號對裂紋故障進行診斷時,診斷準(zhǔn)確率為96%,相較于采用單軸振動信號,提高了48%。可見,采用三軸振動信號與采用單軸振動信號相比,1DCNN模型對齒輪3種類別的故障診斷準(zhǔn)確率均有所提高。
將轉(zhuǎn)速為30 r/min、徑向載荷為滿載和轉(zhuǎn)速為50 r/min、徑向載荷為滿載的兩種工況下篩選出的三軸時域最優(yōu)特征參數(shù)集作為測試集,進行故障診斷,診斷結(jié)果如表4所示。經(jīng)計算可知,這兩種工況下,對齒輪不同狀態(tài)類型的平均診斷準(zhǔn)確率分別為96%和94.7%??梢?,本文所提出的模型在齒輪不同工況下仍舊具有較高的故障診斷準(zhǔn)確率。因此,本文提出的方法在面向齒輪3D振動信號的故障診斷領(lǐng)域有很好的適應(yīng)度。
表4 不同轉(zhuǎn)速下齒輪3D信號的診斷準(zhǔn)確率
為驗證本文提出的故障診斷方法的有效性,將本文提出的輸入為3D振動信號的最優(yōu)特征參數(shù)集、輸入為1D振動信號最優(yōu)特征參數(shù)集的1D-CNN模型、輸入為原始1D振動信號的傳統(tǒng)1D-CNN模型,以及文獻[2]中的算法進行對比試驗。
以上4種算法的診斷結(jié)果如表5所示。由表5可以得出,以1D振動信號的最優(yōu)特征參數(shù)集作為輸入與以原始1D振動信號直接作為輸入的傳統(tǒng)1D-CNN算法相比,平均故障診斷率有所提高。文獻[2]構(gòu)建的自適應(yīng)一維卷積神經(jīng)網(wǎng)絡(luò)(ACNN-FD)故障診斷模型,與以1D振動信號的最優(yōu)特征參數(shù)集作為輸入的1DCNN模型相比,平均故障診斷率大幅提高。但由于該算法利用原始1D振動信號構(gòu)建訓(xùn)練集和測試集,保留了原始振動信號中的干擾信息,因此其平均故障診斷率低于本文提出的將3D振動信號最優(yōu)特征參數(shù)集作為輸入的1DCNN模型。
表5 不同算法齒輪故障診斷結(jié)果
針對1D振動信號不能全面表征齒輪工作狀態(tài)的問題,本文提出了一種基于1D-CNN的齒輪3D振動信號故障診斷方法。經(jīng)實驗驗證得到以下結(jié)論。
(1) 與傳統(tǒng)算法采用其他類型輸入數(shù)據(jù)相比,本文利用3D振動信號最優(yōu)特征參數(shù)集進行故障診斷的準(zhǔn)確率更高。
(2) 本文提出的方法在齒輪不同工況下,均具有較高的故障診斷準(zhǔn)確率。說明本文提出的方法適應(yīng)度較高,在面向齒輪3D振動信號的故障診斷領(lǐng)域具有較大的推廣價值。