黃重謙
(廣西科技師范學院 機械與電氣工程學院 , 廣西 來賓 546199)
滾動軸承是煤礦旋轉(zhuǎn)機械的重要部件,其工作狀態(tài)直接影響著整機的工作性能。因此,及時對煤礦旋轉(zhuǎn)機械滾動軸承進行狀態(tài)監(jiān)測與故障識別,具有重要意義[1]。煤礦旋轉(zhuǎn)機械工作環(huán)境惡劣,實際采集到的滾動軸承振動信號受環(huán)境噪聲干擾明顯,且由于傳遞路徑比較復雜,信號呈現(xiàn)出明顯的非線性和非平穩(wěn)性,導致軸承故障特征提取較困難。
多隱層自動編碼網(wǎng)絡[2]能自動地從滾動軸承振動信號中學習有價值的特征,克服了傳統(tǒng)基于“人工特征提取+模式識別”方法受主觀影響大的缺陷[3],在滾動軸承故障識別領(lǐng)域取得了較大突破。文獻[4]在缺少滾動軸承故障信息的情況下,利用多隱層玻爾茲曼網(wǎng)絡取得了較高的識別準確率;文獻[5]提出的融合多隱層自動編碼網(wǎng)絡能更有效、更穩(wěn)健地對滾動軸承的多種故障進行識別。自動編碼網(wǎng)絡[6]不需要標記數(shù)據(jù),其訓練過程為非監(jiān)督過程,因此,可將自動編碼網(wǎng)絡的思想應用到極限學習網(wǎng)絡[7],得到極限學習自動編碼器(Extreme Learning Auto-Encoder,ELAE)。利用ELAE的特征表達能力,將其作為多隱層極限學習自動編碼神經(jīng)網(wǎng)絡的基本單元[8]。但ELAE為全連接網(wǎng)絡,需要學習的參數(shù)眾多,訓練時間較長,學習到的信號特征的平移不變性較差,受噪聲影響較大,且標準ELAE使用sigmoid激活函數(shù),泛化能力較弱[9]。針對上述問題,本文提出一種基于多隱層小波卷積極限學習神經(jīng)網(wǎng)絡(Multi Hidden Layers Wavelet Convolution Extreme Learning Neural Network,MHLWCELNN)的滾動軸承故障識別方法,實驗結(jié)果表明該方法具有較高的可行性和有效性。
一維卷積神經(jīng)網(wǎng)絡(1D-CNN)[10]具有局部連接和權(quán)值共享特性,可有效降低網(wǎng)絡過擬合風險,其工作原理如圖1所示。
圖1 1D-CNN工作原理Fig.1 The working principle of 1D-CNN
以卷積層為例,設(shè)輸入的軸承振動信號為x,則卷積層輸出為
Ccn=f(x*Wcn+bcn)
(1)
式中:Ccn為輸出特征圖;f為激活函數(shù);“*”為卷積符號;Wcn為濾波器權(quán)重;bcn為偏置向量。
1D-CNN為有監(jiān)督模型,需要大量的帶標簽樣本,而實際工業(yè)應用中軸承振動信號無標簽樣本多。自動編碼器(Auto-Encoder,AE)為無監(jiān)督模型,訓練過程只需要無標簽樣本,AE結(jié)構(gòu)如圖2所示,包括輸入層、隱層和輸出層,其單元個數(shù)分別為m,L,m。
圖2 AE結(jié)構(gòu)Fig.2 The structure of AE
AE隱層的輸出h為
h=sigmoid(W·x+b)
(2)
式中:W為隱層的權(quán)重;b為隱層的偏置。
AE輸出層的輸出y為
y=sigmoid(W′·h+b′)
(3)
式中:W′為輸出層的權(quán)重;b′為輸出層的偏置。
AE的損失函數(shù)E一般為
(4)
AE的參數(shù)更新策略為
(5)
式中:R為AE訓練時的迭代次數(shù);η為AE的學習率。
AE為全連接網(wǎng)絡,訓練參數(shù)較多,且其激活函數(shù)為sigmoid函數(shù),泛化能力較弱,另外,AE的參數(shù)訓練采用BP算法,很容易陷入局部最優(yōu)。
極限學習機(Extreme Learning Machine,ELM)是一種單隱層神經(jīng)網(wǎng)絡,通過求解矩陣的Moore-Penrose廣義逆,進而確定輸出權(quán)重,訓練速度較快。因此,綜合1D-CNN,AE,ELM和小波函數(shù)的優(yōu)勢,構(gòu)造小波卷積極限學習神經(jīng)網(wǎng)絡(Wavelet Convolution Extreme Learning Neural Network,WCELNN)。
(1) 將AE和ELM結(jié)合,構(gòu)造ELAE。ELAE為3層無監(jiān)督網(wǎng)絡,其結(jié)構(gòu)與圖2類似。ELAE隱層的輸出與AE隱層的輸出相同,ELAE輸出層的輸出為
y=hT·β
(6)
式中β為隱層到輸出層的輸出權(quán)重向量。
ELAE的優(yōu)化函數(shù)為
(7)
(8)
式中:I為單位矩陣;A為常數(shù);H為隱層矩陣。
(2) 將ELAE和1D-CNN結(jié)合,構(gòu)造卷積極限學習神經(jīng)網(wǎng)絡(Convolution Extreme Learning Neural Network,CELNN),其結(jié)構(gòu)如圖3所示。
CELNN隱層第k個節(jié)點的輸出hk為
hk=sigmoid(Wk*x+bk)
(9)
式中:Wk為隱層第k個節(jié)點的卷積核權(quán)重矩陣;bk為隱層第k個節(jié)點的偏置。
(3) 將CELNN和小波函數(shù)結(jié)合,構(gòu)造WCELNN。由于高斯小波函數(shù)在時域、頻域均具有良好的分辨率,故激活函數(shù)使用高斯小波函數(shù):
(10)
圖3 CELNN結(jié)構(gòu)Fig.3 The structure of CELNN
式中t為時間。
WCELNN隱層第k個節(jié)點的輸出hk為
hk=ψ[(x*Wk-ck)./ak]
(11)
式中:ak和ck分別為小波節(jié)點的尺度向量和平移向量;“./”表示按元素相除。
WCELNN輸出層的輸出為
(12)
根據(jù)ELM訓練方法,WCELNN的優(yōu)化函數(shù)可表示為
(13)
(14)
WCELNN不使用BP算法,其輸出權(quán)重計算較為簡單,運算速度較快。
MHLWCELNN堆疊多個WCELNN,能進一步提高網(wǎng)絡學習到的特征的質(zhì)量。利用無標簽的滾動軸承振動信號樣本訓練第1層WCELNN,得到第1隱層特征;將第1隱層特征輸入第2層WCELNN,得到第2隱層特征;依此類推。MHLWCELNN結(jié)構(gòu)如圖4所示。
圖4 MHLWCELNN結(jié)構(gòu)Fig.4 The structure of MHLWCELNN
基于MHLWCELNN滾動軸承故障識別步驟如下:① 采集不同工況下的滾動軸承振動信號并進行樣本劃分。② 將訓練樣本輸入MHLWCELNN進行訓練。③ 使用測試樣本對訓練好的網(wǎng)絡進行測試。
為驗證MHLWCELNN的有效性,以XJTU-SY滾動軸承數(shù)據(jù)集[11]為對象進行實驗。實驗軸承為LDK UER204滾動軸承。限于計算資源,在XJTU-SY數(shù)據(jù)集中選取9種不同的軸承工況數(shù)據(jù):正常(a,b)、內(nèi)圈輕微故障(c)、內(nèi)圈中度故障(d)、內(nèi)圈重度故障(e)、外圈輕微故障(f)、外圈中度故障(g)、外圈重度故障(h)、滾珠輕微故障(i)、滾珠中度故障(j),最后得到每種工況下的8 000個樣本,隨機選取70%作為訓練樣本,其余作為測試樣本,每個樣本1 024個采樣點,即1 024維。
各種工況下的軸承時域信號如圖5所示,可見振動信號受噪聲干擾嚴重,難以進行有效區(qū)分。
(a) 工況a
(c) 工況c
(e) 工況e
(g) 工況g
(i) 工況i
為驗證MHLWCELNN的優(yōu)勢,采用多隱層自動編碼神經(jīng)網(wǎng)絡(Multi Hidden Layers Auto Encoder Neural Network,MHLAENN)、多隱層稀疏自動編碼神經(jīng)網(wǎng)絡[12](Multi Hidden Layers Sparse Auto Encoder Neural Network,MHLSAENN)、多隱層降噪自動編碼神經(jīng)網(wǎng)絡[13](Multi Hidden Layers Denoising Auto Encoder Neural Network,MHLDAENN)、多隱層收縮自動編碼神經(jīng)網(wǎng)絡[14](Multi Hidden Layers Contractive Auto Encoder Neural Network,MHLCAENN)和多隱層極限學習自動編碼神經(jīng)網(wǎng)絡(Multi Hidden Layers Extreme Learning Auto Encoder Neural Network,MHLELAENN)等方法進行對比分析,輸入均為1 024維信號樣本,各網(wǎng)絡結(jié)構(gòu)均為1 024-512-256-128-64-32-10。共進行10次試驗,不同方法的識別結(jié)果見表1。
表1 不同方法的識別結(jié)果(基于XJTU-SY數(shù)據(jù)集)Table 1 Identification results of different methods (based on XJTU-SY data set)
由表2可知,MHLWCELNN具有更高的識別準確率和更小的標準差,能較為穩(wěn)定地識別出滾動軸承的故障類型。這幾種方法中,MHLAENN方法的故障識別率最低,僅81.13%;MHLSAENN加入了稀疏項限制,可捕捉輸入數(shù)據(jù)中較重要的信息;MHLDAENN加入了降噪機制,一定程度上提高了網(wǎng)絡對噪聲的魯棒性;MHLCAENN加入了收縮項限制,使網(wǎng)絡對輸入信號的小擾動具有一定的抗干擾性。MHLSAENN,MHLDAENN和MHLCAENN較MHLAENN都取得了更高的故障識別率。MHLELAENN 利用ELAE優(yōu)秀的特征表達能力和快速的網(wǎng)絡收斂能力,故障識別率達到了95.62%,訓練時間僅129.19 s。本文提出的MHLWCELNN采用局部連接和權(quán)值共享機制,大大減少了需要學習的參數(shù),故訓練時間較短,受噪聲影響較小,且使用小波激活函數(shù),具備一定的時頻聚焦特性,能有效學習軸承振動信號的時頻特征,故障識別率高于其他方法。
為驗證MHLWCELNN對不平衡故障樣本的有效性,設(shè)計了一種不平衡數(shù)據(jù)集,正常與故障工況的訓練樣本比例為8 000∶4 000,實驗共進行10次,采用MHLCAENN,MHLELAENN方法作為對比。
準確率、召回率、F1值作為評估指標,經(jīng)常被用到分類效果的評測上。其中F1值可在準確率和召回率之間取得平衡,讓兩者同時達到最高。因此,采用F1值定量評價3種方法基于不平衡數(shù)據(jù)集的分類效果,F1值計算公式為
(15)
式中:F1值在[0,1]之間,0代表最差,1代表最好;P為準確率;Q為召回率。
不同方法的F1值見表2。
表2 不同方法的F1值Table 2 F1 values of different methods
由表2可知,MHLWCELNN的F1值較高,驗證了MHLWCELNN對不平衡數(shù)據(jù)集的有效性。
激活函數(shù)對MHLWCELNN的故障識別率有一定影響,采用不同激活函數(shù)時MHLWCELNN的識別率見表3。從表3可知,高斯小波、Morlet小波和Mexican hat小波的故障識別效果好于其他激活函數(shù),高斯小波在時域、頻域均有較高的分辨率。
表3 不同激活函數(shù)對MHLWCELNN識別率的影響Table 3 Effects of different activation functions on identification accuracy of MHLWCELNN
以西儲大學軸承數(shù)據(jù)集為對象,在測試軸承上通過電火花加工形成不同故障尺度的凹坑,限于計算資源,從西儲大學軸承數(shù)據(jù)集中選取7種不同的軸承故障工況數(shù)據(jù):正常(A)、內(nèi)圈輕微故障(B)、內(nèi)圈中度故障(C)、外圈輕微故障(D)、外圈中度故障(E)、滾動體輕微故障(F)、滾動體中度故障(G),每種工況的樣本數(shù)量為8 000。7種軸承故障工況下的時域信號及相應的頻域信號如圖6所示。從圖6可知,故障信號受噪聲干擾嚴重,難以直接從時域圖中對滾動軸承的故障類型及程度進行有效區(qū)分。
(a) 工況A,時域信號
(c) 工況B,時域信號
(e) 工況C,時域信號
(g) 工況D,時域信號
(i) 工況E,時域信號
(k) 工況F,時域信號
(m) 工況G,時域信號
采用MHLWCELNN等6種方法進行對比實驗,結(jié)果見表4。
從表4可知,MHLWCELNN具有更高的識別準確率和更小的標準差,能較為穩(wěn)定地識別出滾動軸承的不同故障類型,進一步驗證了MHLWCELNN的優(yōu)越性。
表4 不同方法的識別結(jié)果(基于西儲大學數(shù)據(jù)集)Table 4 Identification results of different methods (based on the data set of Western Reserve University)
訓練集和測試集的樣本比例對MHLWCELNN的軸承故障識別準確率有一定影響。若訓練集樣本比例過低,會引起MHLWCELNN欠擬合;若訓練集樣本比例過高,則會引起MHLWCELNN過擬合。欠擬合和過擬合均會影響網(wǎng)絡的識別準確率。訓練集樣本占比為60%~90%時,MHLWCELNN的故障識別率如圖7所示。
圖7 訓練集樣本占比對故障識別準確率的影響Fig.7 Effect of proportions of training set on fault identification accuracy
從圖7可知,訓練集樣本占比為60%~80%時, MHLWCELNN的故障識別率隨訓練集樣本所占比例增加而增加;當訓練集樣本占比超過80%時,故障識別率不再上升,故設(shè)置訓練集樣本占比為80%較合適。
提出了一種基于MHLWCENN的滾動軸承故障識別方法,該方法學習能力和泛化能力強,且具有局部連接特性和權(quán)值共享特性,更適用于非線性和非平穩(wěn)性軸承振動信號?;赬JTU-SY數(shù)據(jù)集和西儲大學數(shù)據(jù)集的實驗結(jié)果表明:
(1) 與MHLAENN,MHLSAENN等相比,MHLWCELNN能有效學習軸承振動信號的時頻特征,具有更高的識別準確率和更小的標準差。
(2) MHLWCELNN的F1值高于MHLCAENN,MHLELAENN,驗證了MHLWCELNN對不平衡數(shù)據(jù)集的有效性。
(3) 高斯小波、Morlet小波和Mexican hat小波的故障識別效果好于其他激活函數(shù),高斯小波在時域、頻域均有較高的分辨率。
(4) MHLWCELNN的故障識別率隨訓練集樣本所占比例增加而增加,當訓練集樣本占比超過80%時,故障識別率不再上升,故設(shè)置訓練集樣本占比為80%較合適。