趙志宏 李樂豪 楊紹普 李 晴
1.省部共建交通工程結(jié)構(gòu)力學行為與系統(tǒng)安全國家重點實驗室,石家莊,0500432.石家莊鐵道大學信息科學與技術(shù)學院,石家莊,050043
目前,故障診斷的傳統(tǒng)方法以信號處理技術(shù)為基礎(chǔ),分別在時域、頻域、時頻域上提取故障特征信息以實現(xiàn)診斷[1-3]。傳統(tǒng)方法的特征需要人工提取,并且提取到的往往是淺層故障特征。
2006年HINTON等[4]提出了深度學習理論,深度神經(jīng)網(wǎng)絡(luò)具有強大的自動特征提取能力,能夠擬合復(fù)雜映射關(guān)系,在很多領(lǐng)域掀起了研究浪潮,在計算機視覺[5]和自然語言處理[6]領(lǐng)域的發(fā)展尤為迅速。近年來,深度學習在機械故障診斷方面的研究越來越得到專家學者的關(guān)注,取得了不少研究成果。已經(jīng)用于故障診斷的深度網(wǎng)絡(luò)模型有卷積神經(jīng)網(wǎng)絡(luò)[7-8]、循環(huán)神經(jīng)網(wǎng)絡(luò)[9-10]、深度信念網(wǎng)絡(luò)[11-12]、降噪自編碼器[13-14]等。降噪自編碼器是一種改進的自編碼器,在輸入信號被損壞的情況下,可以重構(gòu)出無噪聲的輸入,以此提高特征提取的魯棒性。降噪自編碼器的主要優(yōu)勢在于它是一種無監(jiān)督學習模型,可以提取輸入數(shù)據(jù)的本質(zhì)特征。在降噪自編碼器訓練的過程中由于輸入數(shù)據(jù)較為復(fù)雜,重構(gòu)難度較大,會導致神經(jīng)網(wǎng)絡(luò)不容易收斂,同時缺少標簽信息的參與,使得模型很難提取到低維且富含類別信息的特征[15],這也是自編碼器普遍存在的問題。
為了解決網(wǎng)絡(luò)訓練不收斂問題,一些專家學者使用信號的頻譜代替時域信號作為自編碼器的輸入,取得了較好的特征提取能力,在故障分類和壽命預(yù)測任務(wù)中均取得了比較好的效果。雷亞國等[16]使用堆疊自編碼方法提取行星齒輪故障特征,實現(xiàn)了行星齒輪故障100%的分類準確率。 LI等[17]使用深度卷積自編碼器網(wǎng)絡(luò),將距離度量學習和k-means聚類方法集成到神經(jīng)網(wǎng)絡(luò)模型中,在標簽數(shù)據(jù)較少的半監(jiān)督學習任務(wù)上取得了良好的故障診斷性能,另外也適用于無監(jiān)督的情況。唐守強等[18]使用改進的稀疏自編碼器提取能夠表征軸承退化趨勢的特征,然后利用Bi-LSTM進行滾動軸承壽命預(yù)測。這些工作都是將頻譜作為自編碼器網(wǎng)絡(luò)的輸入以提取頻域特征,需要對原始信號進行傅里葉變換,能否直接從時域信號中提取頻域特征是一個非常有價值的研究課題。本文提出一種直接從原始時域信號提取頻域特征的降噪自編碼器方法,與傳統(tǒng)自編碼器以利用原始信號作為目標輸出不同,這里使用頻譜作為目標輸出訓練網(wǎng)絡(luò)模型,訓練后的自編碼器可以從時域信號中提取頻域特征信息。為了便于敘述,將本文提出的以提取頻域特征為目標的降噪自編碼器稱為頻域自編碼器。
圖1 降噪自編碼器結(jié)構(gòu)Fig.1 Structure of denoising auto-encoder
傳統(tǒng)自編碼器的目標輸出為重構(gòu)原始信號,編碼器的任務(wù)是擬合從原始信號到特征的映射關(guān)系,解碼器的任務(wù)為擬合從特征到原始信號的映射關(guān)系,因此傳統(tǒng)自編碼器為對稱結(jié)構(gòu)。為了能夠從時域信號中提取頻域特征,本文在降噪自編碼器的基礎(chǔ)上設(shè)計了一種提取頻域特征非對稱的自編碼器。模型結(jié)構(gòu)如圖2所示,主要由卷積層和全連接層組成。
圖2 頻域自編碼器模型結(jié)構(gòu)Fig.2 Model structure of frequency domain auto-encoder
編碼器第一層為卷積層,使用大尺度卷積核對受損壞的信號進行特征提取,并且擁有一定程度上的降噪效果。在卷積層后使用批標準化層緩解梯度消失,加快訓練速度[19]。選取LeakyReLU作為編碼器各個網(wǎng)絡(luò)層的激活函數(shù),以避免由于特征稀疏導致的表征能力下降[20]。然后通過兩個全連接層來實現(xiàn)降維。解碼器由兩個全連接層組成,兩個全連接層分別使用激活函數(shù)LeakyReLU和ReLU,并在之間使用批標準化。
編碼器加上分類器后的故障診斷模型如圖3所示,分類器使用兩層全連接神經(jīng)網(wǎng)絡(luò),激活函數(shù)分別為ReLU和Softmax。
圖3 故障診斷模型結(jié)構(gòu)Fig.3 Structure of fault diagnosis model
本文頻域自編碼器網(wǎng)絡(luò)模型中的重要參數(shù)如表1所示,其中LeakyReLU激活函數(shù)中alpha的取值為0.3。
表1 網(wǎng)絡(luò)參數(shù)
頻域自編碼器特征提取流程圖如圖4所示,步驟如下:
圖4 頻域特征提取流程圖Fig.4 Flow chart of feature extraction infrequency domain
(1)采集原始振動信號。
(2)將原始信號劃分為訓練集和測試集。
(3)使用傅里葉變換獲取訓練集的頻譜。
(4)采用文獻[13]的方法對訓練集中的振動信號以一定的概率P置零得到受損信號作為頻域自編碼器的輸入,這里置零的概率為20%。將振動信號對應(yīng)的頻譜作為重構(gòu)目標,損失函數(shù)為
(2)
使用Adam優(yōu)化器訓練得到頻域自編碼器網(wǎng)絡(luò)的參數(shù),學習率設(shè)置為0.003。
(5)去掉頻域自編碼器網(wǎng)絡(luò)中的解碼器。將測試集中的診斷信號輸入編碼器得到的輸出即為原始信號的頻域特征信息 。
(6)在編碼器后面接上分類器,固定編碼器參數(shù),利用訓練集中的振動信號和對應(yīng)的故障類型標簽訓練得到分類器的參數(shù)。
(7)將測試集中的振動信號輸入網(wǎng)絡(luò)進行故障分類。
本文選取凱斯西儲大學公開滾動軸承數(shù)據(jù)[21]進行驗證。滾動軸承型號為SKF6205-RS JEM SKF。數(shù)據(jù)采集系統(tǒng)由電機、矩陣傳感器、功率計和電子控制設(shè)備組成,采樣頻率為48 kHz。使用電火花在軸承的滾動體、內(nèi)圈和外圈加工出故障,故障大小為0.1778 mm。包含正常狀態(tài)的軸承在內(nèi),共計4種不同狀態(tài)的軸承,在1HP、2HP和3HP 3種負載下采集振動信號。
為了避免神經(jīng)網(wǎng)絡(luò)過擬合,同時減輕相位對特征提取造成的影響,使用滑動窗口采樣分別對訓練集和測試集擴充樣本。采樣過程如圖5所示,采樣窗口長度為2000個采樣點,窗口滑動的步長為28個采樣點。使用滑動窗口采樣法分別對3種負載下的4種故障類型的軸承振動數(shù)據(jù)各采集2000個樣本,對故障類型使用One-Hot編碼。
圖5 滑動窗口采樣Fig.5 Sliding window sampling
根據(jù)樣本的負載不同數(shù)據(jù)集劃分為3個,其中數(shù)據(jù)集A負載為1HP,數(shù)據(jù)集B負載2HP,數(shù)據(jù)集C負載3HP。每個數(shù)據(jù)集均包含4類故障數(shù)據(jù),即滾動體故障、內(nèi)圈故障、外圈故障和正常狀態(tài)故障,每個數(shù)據(jù)集的每類數(shù)據(jù)樣本均為2000個。
為驗證頻域自編碼器的特征提取效果,與傳統(tǒng)降噪自編碼器進行對比實驗。本文設(shè)計的傳統(tǒng)自編碼器網(wǎng)絡(luò)參數(shù)與頻域編碼器中的網(wǎng)絡(luò)參數(shù)大致相同,不同的是,傳統(tǒng)自編碼器FC_3的神經(jīng)元個數(shù)為600,F(xiàn)C_4的神經(jīng)元個數(shù)為2000,該層不使用激活函數(shù)。
3.2.1特征提取實驗
將數(shù)據(jù)集A、B和C混合,從每類樣本中取75%作為訓練集用于訓練自編碼器,剩余25%作為測試集。為了直觀地展示提取到的特征,利用t-SNE降維可視化方法[22]對特征進行降維聚類,并與傳統(tǒng)自編碼器方法進行對比。
頻域自編碼器對測試集進行特征提取后通過t-SNE降至二維的結(jié)果如圖6所示,其中特征1、特征2分別為頻域自編碼器特征經(jīng)過t-SNE降低后獲取的2個特征值。從圖中可以看到不同類別的故障信號之間有著清晰的界限,可以有效的區(qū)分不同類別的故障信號。
圖6 頻域自編碼器特征降維結(jié)果Fig.6 Feature dimension reduction results of frequencydomain auto-encoder
傳統(tǒng)自編碼器對測試集進行特征提取后通過t-SNE降至二維的結(jié)果如圖7所示,從圖中可以看到對外圈故障和正常軸承有一定的聚類效果,但是滾動體故障和內(nèi)圈故障混雜在了一起,并且正常軸承中也摻雜了部分外圈故障和滾動體故障,不足以有效區(qū)分不同故障信號。
圖7 傳統(tǒng)自編碼器特征降維結(jié)果Fig.7 Feature dimension reduction results oftraditional auto-encoder
頻域自編碼器和傳統(tǒng)自編碼器提取到的特征在三維空間中的分布分別如圖8和圖9所示,從圖中可以看到頻域自編碼器提取的不同類別軸承特征之間存在著清晰的界限。正常軸承、滾動體故障和內(nèi)圈故障的類內(nèi)間距比較小,外圈故障的類內(nèi)間距較大但是與其他類別可以準確區(qū)分。傳統(tǒng)自編碼器提取到的特征在空間中的分布規(guī)律則較差,只能看到外圈故障和內(nèi)圈故障軸承,滾動體故障和正常軸承被它們包圍而無法看到。另外,正常軸承、滾動體故障和內(nèi)圈信號之間的界限不清晰,無法區(qū)分4種類別軸承。
圖8 頻域自編碼器特征在三維空間中的分布Fig.8 Distribution of frequency domain auto-encoderfeatures in three dimensional space
圖9 傳統(tǒng)自編碼器特征在三維空間中的分布Fig.9 Distribution of traditional auto-encoder featuresin three dimensional space
3.2.2頻譜重構(gòu)實驗
測試集中4類振動信號的頻譜和頻域自編碼器重構(gòu)的頻譜如圖10所示,從圖中可以看到頻域自編碼器可以較好地重構(gòu)信號的頻譜。滾動體故障、內(nèi)圈故障、外圈故障和正常狀態(tài)的頻譜中幅值較高的頻率都進行了重構(gòu),其中外圈故障的頻譜和重構(gòu)頻譜相似度最高,其他重構(gòu)頻譜雖然頻率較低的部分有所丟失,但是保留了主要的頻譜特征,驗證了本文的頻域自編碼器方法可以在不經(jīng)過傅里葉變換的情況下就可以提取信號的頻域特征。
在機械設(shè)備的運轉(zhuǎn)過程中,負載的變化會影響時域波形,常常會造成故障的誤報和漏報,對網(wǎng)絡(luò)模型的特征提取能力提出了更高的要求[23]。在實際生產(chǎn)環(huán)境中,很難判斷軸承發(fā)生故障的時間,因此對實際工作環(huán)境下收集的軸承振動信號添加標簽有一定難度。一個好的特征提取方法應(yīng)該對故障類型敏感,對負載不敏感,并且需要的標簽數(shù)量盡量少。為進一步驗證本文所提頻域自編碼器的特征提取能力,進行故障診斷泛化實驗,設(shè)計訓練集與測試集為不同負載,分別在不同標簽數(shù)量的情況下進行實驗。
(a)滾動體故障頻譜 (b)重構(gòu)的滾動體故障頻譜 (c)內(nèi)圈故障頻譜
(d)重構(gòu)的內(nèi)圈故障頻譜 (e)外圈故障頻譜 (f)重構(gòu)的外圈故障頻譜
(g)正常狀態(tài)頻譜 (h)重構(gòu)的正常狀態(tài)頻譜圖10 頻譜與重構(gòu)頻譜的對比Fig.10 Comparison of spectrum and reconstructed spectrum
使用兩種負載下的數(shù)據(jù)集中全部的振動信號作為訓練集,使用剩余負載的全部振動信號作為測試集。
方法1為上文使用的傳統(tǒng)自編碼器,分類器參數(shù)設(shè)置和訓練流程與頻域自編碼器保持一致。方法2為端到端訓練的深度神經(jīng)網(wǎng)絡(luò),使用有標簽樣本進行訓練,網(wǎng)絡(luò)組成為編碼器拼接上分類器,網(wǎng)絡(luò)參數(shù)設(shè)置與頻域自編碼器一致。
分別使用訓練集中100%、10%和1%的有標簽樣本訓練頻域自編碼器方法和方法1中的分類器,分別使用訓練集中100%、10%和1%的有標簽樣本端到端訓練方法2中的深度神經(jīng)網(wǎng)絡(luò)。訓練頻域自編碼器時迭代訓練300代,訓練分類器時迭代訓練2000代。方法1中自編碼器和分類器訓練代數(shù)和頻域自編碼器方法保持一致;方法2中深度神經(jīng)網(wǎng)絡(luò)迭代訓練2000代。
頻域自編碼器、方法1和方法2分別在100%、10%和1%的有標簽樣本訓練分類器時的故障分類準確率如圖11~圖13所示。圖中“AB→C”的意思為使用數(shù)據(jù)集A和B作為訓練集,使用C作為測試集,其他情況以此類推。由不同方法的故障診斷準確率可以看出,方法1的故障診斷性能最差,故障分類準確率不到70%。方法2中在標簽充足時,故障診斷準確率也較高,但是在少量標簽的情況下,故障診斷準確率下降到了80%以下。本文提出的頻域自編碼器方法不管是在標簽充足還是在少量標簽的情況下,都可以保持較好的故障診斷準確率。
圖11 使用100%有標簽樣本訓練分類器的準確率對比Fig.11 Accuracy comparison of training classifierswith all labeled samples
圖12 使用10%有標簽樣本訓練分類器的準確率對比Fig.12 Accuracy comparison of training classifierswith 10% labeled samples
圖13 使用1%有標簽樣本訓練分類器的準確率對比Fig.13 Accuracy comparison of training classifierswith 1% labeled samples
方法1、方法2和頻域自編碼器方法在進行故障分類時所使用的模型結(jié)構(gòu)是一樣的,但是最終的結(jié)果相差較大。分析其原因,方法1在自編碼器訓練的階段沒有訓練出可以有效提取故障特征的編碼器,影響到了最終的故障診斷準確率。方法2由于是直接端到端訓練出全部參數(shù),整個網(wǎng)絡(luò)提取的特征是為了擬合從振動信號到故障標簽的映射關(guān)系,當樣本較少時,由于噪聲和相位的影響,網(wǎng)絡(luò)不能充分學習故障特征,最終導致故障診斷準確率不高。頻域自編碼器方法可以提取故障信號更本質(zhì)的特征,因此在標簽較少的情況下也可以取得較好的故障分類準確率。
(1)頻域自編碼器經(jīng)過訓練后可以直接從時域信號中提取頻域特征,無需對原始信號進行傅里葉變換。
(2)與傳統(tǒng)自編碼器相比,頻域自編碼器在軸承振動信號中的特征提取能力更強,可以更好地區(qū)分不同故障類型的軸承。
(3)頻域自編碼器方法與其他方法相比具有更好的泛化能力,可以提取軸承故障信號更本質(zhì)的特征,僅需少量有標簽樣本訓練分類器就可以實現(xiàn)更好的故障分類準確率。