杜小磊, 肖龍, 周慶輝, 陳志剛
(1.電子科技大學 機械與電氣工程學院,四川 成都 611731; 2.北京理工大學 前沿技術研究院,山東 濟南 250300; 3.北京建筑大學 機電與車輛工程學院,北京 100044)
電機被廣泛應用于數控機床和航空航天等領域,而電機滾動軸承是電機的重要部件,對電機軸承工況狀態(tài)進行監(jiān)測與識別具有重要意義[1]。
傳統(tǒng)基于“特征提取—特征選擇—模式識別”的軸承工況識別方法[2]已得到廣泛應用,但軸承振動信號由于多個振源的激勵與響應相互耦合,非線性和非平穩(wěn)性較為強烈[3],從振動信號中選擇敏感特征較難;而且在大數據時代,淺層分類器面臨維數災難問題[4]。深度學習[5]能自動從振動信號中進行特征學習,一定程度上擺脫了對繁瑣的特征提取和選擇技術的依賴。目前基于“振動信號時頻譜圖—深度學習”的軸承工況識別方法研究較多,Verstraete等[6]將3種時頻譜輸入深層卷積網絡,以較少的學習參數獲得了較好的識別結果;Ma等[7]將軸承振動信號的小波時頻譜圖輸入深度信念網絡實現了對軸承工況的有效識別;Xu等[8]將電機軸承振動信號的Stockwell變換時頻譜圖輸入深度降噪自動編碼器進行工況識別,識別準確率達96%。上述研究均利用“時頻譜圖—深度學習”模型實現了電機軸承工況識別,但小波變換和Stockwell變換等時頻譜圖的時頻分辨率較低,時頻譜聚集性較差,難以給深度學習模型提供優(yōu)秀的訓練樣本[9],同步擠壓Stockwell變換(synchrosqueezed stockwell transform,SST)[10]改進了Stockwell變換的時頻能量發(fā)散狀況,但抗噪能力較差;且單一的深度學習模型存在泛化能力低的缺陷[11]。
在前述研究的基礎上,本文提出一種基于增強同步擠壓Stockwell變換(enhanced synchrosqueezing stockwell transform,ESST)結合改進集成深層極限學習機(improved ensemble deep extreme learning machine,IEDELM)的電機軸承工況識別方法。所提ESST方法有效改善傳統(tǒng)時頻分析時頻譜聚集性差和抗噪能力差的缺陷,為深度學習模型提供了優(yōu)秀的訓練樣本;而IEDELM在深層極限學習機的基礎上引入自組織策略、卷積策略和集成學習策略,有效提高模型的魯棒性,并通過實驗驗證ESST-IEDELM方法的可行性和有效性。
為克服SST抗噪能力差的缺陷,本文提出一種更精確、抗噪能力更強的瞬時頻率估計ESST方法。ESST首先利用譜重排算子計算局部瞬時調制算子,然后在頻率方向進行同步擠壓變換,進而修正瞬時頻率。定義信號x(t)的Stockwell變換為
(1)
式中:τ為時間;f為頻率。SST對Stockwell變換的瞬時頻率進行精確估計,瞬時頻率計算為
(2)
式中R{}取實數算子。由此可得
(3)
SST通過將Stockwell變換頻率方向的模糊能量“擠壓”到瞬時頻率脊線附近,有效提高了時頻分辨率。但SST只在頻率方向進行重分配,存在時域能量溢出和抗噪能力差的缺陷,因此本文提出ESST。
首先,定義高階局部調制系數
(4)
其中:
(5)
(6)
高階瞬時頻率估計計算為
(7)
因此,x(t)的ESST變換計算為
(8)
采用下面的仿真信號進行分析:
(9)
其中:f1(t)為余弦信號;f2(t)、f3(t)為調頻信號;f4(t)為調幅-調頻信號;f5(t)為高斯白噪聲。
分別采用小波變換、Stockwell變換、SST和ESST對f(t)進行時頻分析,時頻譜分別如圖1~圖4所示。
圖1 仿真信號的小波變換時頻譜圖
圖2 仿真信號的Stockwell變換時頻譜圖
圖3 仿真信號的SST時頻譜圖
圖4 仿真信號的ESST時頻譜圖
由圖可以看出:小波變換和Stockwell變換時頻分辨率較低;SST時頻譜瞬時頻率變化趨勢較清晰,但受噪聲干擾嚴重,仍存在一定程度的模糊現象;ESST時頻譜更有效地捕捉了信號的頻率變化信息,抗噪能力更強,時頻譜聚集性和時頻分辨率更高。
深層極限學習機(deep extreme learning machine,DELM)[12]將深層自動編碼器與極限學習機結合,兼具深度學習方法自動特征提取和極限學習機訓練速度快的優(yōu)勢。
設DELM輸入層神經元個數為m,第1隱層的神經元個數為L,第一步是將輸入x通過sigmoid函數轉換為隱層特征h=[h1,h2,…,hL]T,有
h=sigmoid(Wx+b)。
(10)
式中:W為輸入層到第1隱層之間的權值向量;b為偏置向量,第1隱層的輸出為
y=hTβ。
(11)
式中β為隱層到輸出層的權重向量。
第一層損失函數表示如下:
(12)
式中β為第1隱層的輸出權重,計算如下:
(13)
式中:H為隱層映射矩陣;I為單位矩陣。DELM的詳細訓練步驟見文獻[12]。
DELM為全連接網絡,受噪聲影響較大;卷積神經網絡(convolutional neural network,CNN)具有稀疏連接與權值共享特性,可減少網絡間的連接,抗噪能力較強。因此本文將DELM與CNN結合,構造改進深層極限學習機(improved deep extreme learning machine,IDELM),IDELM的基本單元如圖5所示。
圖5 IDELM基本單元結構
設IDELM基本單元輸入為x,以高斯小波激活函數為例,隱層第k個神經元輸出如下:
hk=ψ[(x*Wk-ck)./ak];
(14)
(15)
式中:ψ為高斯小波函數;Wk為卷積核權重;ak為尺度向量;ck為平移向量;*為卷積符號;./為按元素相除符號。則基本單元結構輸出如下:
(16)
圖6 自組織策略
在網絡訓練階段將隱層節(jié)點激活強度作為節(jié)點的“貢獻度”,并根據“貢獻度”大小對節(jié)點進行增加或刪減;并將損失函數的梯度下降率作為隱層的刪減標準,當損失函數梯度下降率首次出現遞減時刪掉一個隱層,否則增加一個隱層,激活強度為
(17)
式中:α>0為常數;oi.l為第l個隱層的第i個節(jié)點的輸出,Nl為第l個隱層節(jié)點個數;si.l為第l個隱層的第i個節(jié)點的輸入權值之和,計算如下:
(18)
式中:rij為第i個節(jié)點的第j個輸入;wij為第j個節(jié)點和第i個節(jié)點的連接權重。
單一的IDELM泛化能力較差,IEDELM通過集成多個IDELM可獲得比單一IDELM更好的工況識別結果。本文利用 9個具有不同激活函數的IDELM完成電機軸承工況識別,9種激活函數的方程列于表1。
表1 不同激活函數的方程
當第i個IDELM的識別結果為outi時,IEDELM的集成學習結果Y計算如下:
(19)
(20)
式中pi為9個IDELM的識別精度排序序號,pi由F1確定,F1的計算公式為
(21)
其中:
(22)
(23)
式中:TP為正樣本中被模型判斷為正的個數;FP為在負樣本中被模型判斷為正的個數;FN為正樣本中被模型判斷為負的個數,F1在[0,1]之間,反映查準率和召回率的信息,0代表最差,1代表最好。綜上,ESST-IEDELM算法流程如圖7所示,步驟如下:
圖7 工況識別流程圖
1)采集不同工況的電機軸承振動信號樣本,隨機選取80%作為訓練樣本,剩余作為測試樣本;
2)對訓練樣本和測試樣本進行ESST變換得到時頻譜圖并進行向量化操作;
3)將ESST時頻列向量訓練樣本輸入IEDELM進行訓練,訓練完成后使用測試樣本對訓練好的模型進行測試。
為驗證ESST-IEDELM方法的有效性,以電機軸承試驗臺為對象,如圖8所示。
圖8 電機軸承測試實驗臺
實驗臺由電機、測試電機軸承、轉速控制器、轉軸等組成,可調節(jié)工況包括轉速與徑向力,測試電機軸承參數如表2所示,工況設置如表3所示。采用加速度傳感器和信號采集器采集電機軸承振動數據,采樣頻率20 kHz。
表2 測試軸承參數
表3 工況設置
使用電火花技術在電機軸承內圈、外圈和滾動體上加工尺寸為 0.15、0.32 mm的環(huán)槽損傷以模擬輕微故障和中度故障。參考文獻[14]的工況設置方法,選取8種工況進行研究,如表4所示。每種工況8 000個樣本,每個樣本1 024個采樣點,圖9為軸承運行工況時域圖。
表4 8種軸承運行工況
由圖9可知,故障工況a~h的振動信號的故障沖擊信息被環(huán)境噪聲淹沒,故障脈沖特征極其微弱,因此難以直接在時域波形圖中對滾動軸承的運行工況進行有效區(qū)分,有必要進一步對各工況振動信號進行時-頻譜分析。
圖9 電機軸承8種運行工況的時域圖
以工況e為例,其故障特征頻率計算如下:
(24)
式中:fr為轉頻;d和D為滾珠和節(jié)圓直徑;Z為滾珠個數;α為接觸角,因此求得電機軸承外圈故障特征頻率約107.8 Hz,轉頻35 Hz。圖10~圖12分別為工況e振動信號的ESST時頻譜、Stockwell變換時頻譜和SST時頻譜。
圖10 實際信號的ESST時頻譜圖
圖11 實際信號的Stockwell變換時頻譜圖
圖12 實際信號的SST時頻譜圖
由圖可知:Stockwell時頻譜圖的時頻分辨率低,時頻譜雜亂;雖然SST時頻譜較ST清晰,但時頻譜能量發(fā)散,受噪聲干擾較嚴重;而ESST時頻譜脊線較明顯,故障特征頻率較清晰,時頻分辨率較高,進一步驗證了ESST的優(yōu)越性。
本試驗訓練的硬件環(huán)境為i7-10700 CPU、GTX1050Ti顯卡、16G內存,編程環(huán)境為MATLAB R2021b。用于工況識別的每個IDELM網絡的參數如表5。
表5 IDELM參數
首先驗證IEDELM的效果,采用文獻[15]的深層稀疏自編碼器(DSAE)、文獻[16]提出的深層降噪自編碼器(DDAE)和文獻[17]提出的和深層極限學習機(DELM)進行對比分析。各網絡結構均為2500-1200-600-400-200-100-50-8,信號前處理方法均為ESST變換。表6列出了不同的網絡10次實驗平均工況識別率。
表6 不同網絡的工況識別結果
由表6可知,ESST -IEDELM方法具有更高的識別準確率(99.87%),更小的標準差(0.12),即更高的訓練穩(wěn)定性,但其訓練時間約413 s,略高于其他深層網絡,這是因為IEDELM的自組織策略和集成學習方法一定程度增加了網絡的訓練時間,綜上由于IEDELM的多種改進措施,工況識別率和識別穩(wěn)定性均優(yōu)于其他幾種網絡。其次驗證ESST的效果,采用經驗模態(tài)分解(empirical mode decomposition,EMD)、集合經驗模態(tài)分解(ensemble empirical mode decomposition,EEMD)、完備集合經驗模態(tài)分解(complete ensemble empirical mode decomposition,CEEMD)、Stockwell變換(stockwell transform,ST)、經驗小波變換(empirical wavelet transform,EWT)、變分模態(tài)分解(variational mode decomposition,VMD)、同步擠壓小波變換(synchrosqueezing wavelet transform,SWT)和SST等不同的信號前處理方法進行對比。表7列出不同信號前處理方法10次實驗的工況識別率。
由表7,基于ESST前處理方法的電機軸承工況識別率較其他方法更高,基于EMD、EEMD和CEEMD的前處理方法受噪聲干擾嚴重,模態(tài)混疊嚴重,時頻譜雜亂,導致工況識別率較低;ST、EWT和VMD一定程度上改進了模態(tài)混疊的缺陷,識別效果略優(yōu)于EWD、EEMD和CEEMD;SWT和SST一定程度上改進了傳統(tǒng)時頻分析方法的時頻能量發(fā)散狀況,效果優(yōu)于ST、EWT和VMD,但抗噪能力較弱;而ESST方法使用高階瞬時頻率估計,提升了抗噪能力,識別效果最好。
表7 不同前處理方法的電機軸承工況識別結果
ESST-IEDELM模型在每次迭代中的損失值如圖13所示,可見模型的損失函數已得到收斂。
圖13 ESST-IEDELM模型的訓練進度圖
以測試結果的假陽率和真陽率作為橫、縱坐標繪制ROC曲線,AUC為ROC曲線下的面積,其值越大,代表模型的性能越好,準確率更高。以第一次測試結果為例,ROC曲線如圖14所示,可知ESST-IEDELM算法模型的AUC值為0.982,具有較高的準確性,驗證了提出方法的優(yōu)越性。
圖14 第1次測試結果的ROC曲線
本節(jié)進一步研究在噪聲干擾下ESST-IEDELM的性能,通過添加不同信噪比(signal-to-noise ratio,SNR)的高斯白噪聲進行對比實驗,設置了取15、10、5 dB下的4組實驗,如表8所示。相應的對比結果如表9所示,隨信噪比的降低,不同模型的工況識別準確率均有所降低,但本文提出的ESST-IEDELM模型在添加不同信噪比的高斯白噪聲后相比于其他方法識別率更高,進一步驗證了ESST-IEDELM的優(yōu)越性。
表8 實驗名稱及方法
表9 對比結果
在實際工業(yè)中,通常正常工況下樣本所占比例較故障工況樣本高,因此本文進一步研究ESST-IEDELM方法在面對不平衡工況樣本時的有效性,比較3種不同方法(ESST-IEDELM、SST-IEDELM、ESST-IDELM)的識別性能。設置正常與各故障工況的訓練樣本比例為8 000∶8 000、8 000∶6 400、8 000∶4 800和8 000∶4 000,實驗共進行10次。以組4為例,定量計算3種模型在不平衡樣本數據集的F1值,結果如表10所示。
由表10可知,組4中ESST-IEDELM模型的F1值較高,類似的結果在其他組中也有較為明顯的體現,對比結果進一步驗證了ESST-IEDELM在面對不平衡數據集的有效性。
表10 組4不同方法的F1值
本節(jié)進一步評價IEDELM所學習到的深層特征的質量,首先計算類間協(xié)方差Bc和類內協(xié)方差Ic。其中:Bc代表不同工況間的離散程度,Ic代表同一工況內的聚類程度,Bc越大及Ic越小表明特征具有較強的類區(qū)分度,Bc和Ic的詳細計算見文獻[18]。并采用文獻[19]的3個評價指標對深層網絡學習到的頂層特征質量進行定量描述,如下:
(25)
(26)
(27)
式中:tr()為取跡操作。3個指標結合了Bc和Ic的綜合信息,計算結果如表11所示。根據評價標準,Ji(i=1,2,3)越大代表更好的工況識別結果。由表10可知,基于IEDELM模型的頂層特征的3個評價指標分別為2.914、0.813和3.869,均大于其他3種深層模型,表明IEDELM學習到的頂層特征存在著較大的Bc和最小的Ic,即存在較大的工況特征可區(qū)分度,因此更有利于工況識別。
表11 不同深層模型頂層特征的定量評價
本文提出一種基于ESST-IEDELM的電機軸承工況識別方法,能有效地對電機軸承信號進行自動特征提取與工況辨識,主要結論如下:
1)提出的ESST通過高階瞬時頻率估計有效提高了時頻譜抗噪聲能力,所提取的時頻譜脊線較明顯,故障特征頻率較清晰,時頻分辨率較高,為IEDELM提供了優(yōu)秀的訓練樣本;
2)提出的IEDELM對DELM進行了有效改進,使用卷積策略,使網絡學習到的特征更具魯棒性;引入自組織策略,使網絡結構在訓練過程中自適應動態(tài)變化,更適用于電機軸承工況識別;將多個IDELM進行集成,獲得了比單一深度學習模型更好的工況識別效果。