潘成龍, 應雨龍
(上海電力大學 能源與機械工程學院, 上海 200090)
滾動軸承作為旋轉機械設備(如渦輪機、發(fā)電機等)的重要零部件,由于其本身的磨損、變形等損傷所引起的設備故障占機械設備故障的50%[1]。在設備實時運行中,實時故障診斷可以在最大程度上減少重大事故的發(fā)生[2]。軸承故障診斷方法的基本原理就是從軸承設備端所采集到的數據中提取信號的特征并且進行分類,從而實現對設備的故障檢測。
2016年之前,基于應用統(tǒng)計學的傳統(tǒng)機器學習方法,例如基于支持向量機的風險最小化原理的故障診斷方法[3]、基于人工神經網絡的故障診斷系統(tǒng)[4],作為當時極其有效且流行的方法,得到了廣泛的應用[5]。
近年來,隨著機械設備的監(jiān)測傳感器所采集的數據變得越來越多樣化、抽象化和復雜化[6]。以往傳統(tǒng)故障診斷方法在時效性和識別準確率方面差強人意,但基于深度學習[7]的神經網絡,例如深度置信網絡、堆疊稀疏自編碼器[8]和卷積神經網絡,有著眾多隱含層,具有很強的自主學習能力,在復雜數據集上有很大的優(yōu)勢[9]。其中,卷積神經網絡可以通過逐層學習故障信號,自適應提取特征值[10-12],并且隨著模型網絡深度的提升,特征學習和故障分類的效果也會相應地提高,但在時效性上可能會略有損失[13]。卷積神經網絡以原始信號作為輸入,不需要進行特征提取,從而達到端到端的故障診斷,不需要額外進行去噪聲處理,解決了工作噪聲對故障識別的影響[14]。卷積神經網絡在故障識別方面可以極大地減少人為提取信號特征的步驟,但是以往的卷積網絡故障診斷模型在滾動軸承的運行載荷發(fā)生改變的情況下,故障診斷的準確率與實時性并不理想。
因此,本文提出了一種在軸承運行載荷發(fā)生改變時,可以對其故障進行準確且有效診斷的二維卷積神經網絡模型。該模型可以實現對故障進行端到端檢測,僅需輸入原始數據,無需人工提取特征向量,減少了特征提取過程中的損失,提高了模型診斷的準確性,整個故障診斷過程都是在模型當中進行自適應學習、訓練和診斷。該模型的數據預處理方法在原始一維信號轉化為二維信號時,無需額外定義任何參數,減少了以往專家經驗對數據信號轉化過程的損失。另外,構建模型時,可以使特征信號在梯度下降后自適應優(yōu)化權重參數,增加故障診斷的識別準確率。最后,根據多次試驗數據和結果證明該故障診斷模型的有效性和準確性。
在一維卷積神經網絡中,往往需要至少1 024或2 048個數據點[15]來完成特征提取和數據識別,使得其在故障診斷的時效性方面略有不足,而且在運行載荷發(fā)生變化的變工況狀態(tài)下,無法進行有效且準確的診斷。
相對于普通一維卷積神經網絡,二維卷積神經網絡可以通過較少的樣本量全面反映滾動軸承的故障狀態(tài),而且耗時也會減少。為了在軸承的運行載荷發(fā)生改變時對軸承故障進行有效及準確的診斷,對變工況下的二維卷積神經網絡進行構造。二維卷積神經網絡結構如圖1所示。
圖1 二維卷積神經網絡結構
該故障診斷模型僅需要420個數據點作為一個樣本點,大大縮短了故障診斷的時間。將軸承工況變量作為輸入信號,包含在420個數據點當中,增加其對變工況故障診斷的有效性和準確性。在模型中設置5層卷積層,最后3層卷積與池化層逐步完善特征信號的提取,其中輸入層的尺寸為20×21。為了提取數據集中的特征信號,降低信號維度,模型中5層卷積層與3層池化層互相交替,在輸入層與第1層卷積層之間的卷積核大小設置為5×5×1,在自適應提取特征信號的同時降低維度,減少模型的學習和訓練時間,第2層卷積層中的卷積核大小為5×5×32,從第4層卷積層開始,模型當中的卷積核從第3層卷積層中的3×3×32變成為3×3×64;3層池化層的尺寸與步長相同,分別為3×3和2;在進入全連接層和最后一層激活函數Softmax之前,通過過渡層,形狀(4,4,64)的輸出被展平為形狀64的向量,第11層為全連接層,其中包含了64個節(jié)點;通過模型最后一層的Softmax分類器完成對變工況下4種故障類型、3種嚴重程度共44種故障類型的分類。
本文構建的二維卷積神經網絡模型的結構參數如表1所示。
表1 變工況下模型結構參數
模型采用RMSProp優(yōu)化器。其數學模型可表達為
(1)
式中:vt——梯度平方在t時刻的指數平均值;
t——時刻;
ρ——衰減速率;
gt——參數更新之后在各個梯度方向上的投影向量。
RMSProp優(yōu)化算法中的參數優(yōu)化公式如下
ωt+1=ωt+Δωt
(2)
(3)
式中:ωt——t時刻的原始步長;
Δωt——更新過后的步長變量;
η——初始學習率;
等式右邊的負號表示它與梯度移動的方向相反。RMSProp算法與一般梯度下降算法最大的不同就是把學習率這個超參數從原來的標量變成了一個向量。
通過消除梯度下降時的擺動從而加速梯度下降的過程,就能設置較大的學習率,使得訓練加快[16]。為了防止模型運行過程中出現過擬合,并加強神經網絡的泛化能力,在全連接層后加入一個Dropout層,采用Dropout正則化,將其參數大小設置為0.5,以此加強網絡節(jié)點的魯棒性。該二維卷積網絡模型可以實現對于故障端到端的診斷,即從原始信號到故障識別,同時完成自適應學習,不需要定義額外參數。網絡模型的流程圖如圖2所示。
圖2 卷積神經網絡流程
本文使用的數據集來自美國凱斯西儲大學軸承數據中心在4種載荷情況下所收集到的數據。該數據集是當前軸承振動信號處理、故障診斷方面應用最為廣泛的標準數據集[17-18]。
在12 kHz采樣頻率下,電機載荷分別為0 W,735 W,1 471 W,2 206 W,電機近似轉速為1 797 r/min時,采用了4組內圈故障、滾動體故障和外圈損傷點在6點方向上的10類故障數據集和1類正常數據集。故障分類如表2所示。
表2 故障分類
由于本文所構建的故障診斷模型是二維卷積網絡模型,所以需要將原始的一維數據集進行二維轉化處理。首先,對44類原始信號采集400個一維原始數據作為一個樣本,并將工況變量加入樣本信號中,共計420個數據點,采集300個樣本;由于原始數據是一維數據,需要將44類數據集通過reshape函數將其轉化為二維矩陣,并將數據集打亂;最后,將標簽轉化為一位有效編碼,即每一次有且僅有一種狀態(tài)存在。
通過數據預處理,所得到的訓練集和測試集樣本數據總數量為13 200,根據實驗需要將其按照一定比例隨機分配。實驗測試采用基于Tensor Flow深度學習架構,運行環(huán)境為Windows 7,處理器采用的是英特爾公司的i7-4720HQ。將300個樣本按照4∶1的比例隨機分成訓練集和測試集的情況下,在變工況下對該模型進行100次迭代模擬實驗,實驗的訓練準確率、損失曲線及可視化的混淆矩陣如圖3、圖4、圖5所示。其中:訓練準確率是指在訓練過程中模型的成功率;損失曲線中的損失值代表了預測值和實際值的相似程度,損失值越小,表示相似程度越高;混淆矩陣是以矩陣形式將模型的故障診斷結果進行匯總表示,矩陣中的行表示預測值,列表示真實值,對角線上的值越高表示診斷結果越好。
圖3 訓練準確率曲線
圖4 損失曲線
圖5 混淆矩陣
模型的診斷結果如表3所示。模型測試耗時466 s,單個診斷算列時間約為598 μs,由于選取的420個數據點少于傳統(tǒng)一維卷積神經網絡所采用的1 024個,實驗耗時大大減少。由于通過5層卷積和3層池化的特征提取,基于較少的訓練樣本,經過Python軟件模擬得到軸承故障診斷的識別準確率可達99.6%,損失值維持在2.3%。
表3 故障診斷結果
測試集樣本數為60,通過圖5和表3的模型診斷結果可以看出,在60次的故障識別中,其中載荷為735 W時的內圈故障、載荷為735 W時的外圈故障,載荷為1 471W時的滾動體故障分別有1次未能識別,其余均正確識別。
隨著迭代次數的增加,準確率與損失值在迭代次數為40之后趨于平穩(wěn),變化幅度不超過千分之一,基本可以忽略。在變工況下對該模型進行40次迭代模擬,模型測試耗時299 s,單個診斷算列時間約為598 μs,軸承故障診斷的識別準確率為99.7%,損失維持在2.4%。與圖3和圖4的結果相符。
同時將本文所提的變工況下二維卷積神經網絡(2DCNN)與傳統(tǒng)一維卷積神經網絡(1DCNN)、未將工況變量作為輸入信號的二維神經卷積網絡(2DCNN無變量)進行10次軸承故障診斷的實驗對比。將信號直接輸入到傳統(tǒng)一維卷積神經網絡和未將工況變量加入樣本信號的二維卷積神經網絡中,樣本同樣包含420個數據點,模型的結構為表2 所示的12層,進行40次迭代。識別準確率與實驗耗時的對比情況如圖6和圖7所示。實驗數據對比如表4所示。
圖7 不同工況下實驗耗時的對比
表4 實驗數據對比
通過圖6和圖7可以看出:一維卷積神經網絡在迭代次數和樣本容量較小的情況下,無法完成對多工況、多故障的有效診斷,在40次的迭代后,故障診斷的識別準確率僅為70%~88%;但在另外兩種二維卷積神經網絡模型中,在相同的迭代次數和樣本量情況下,故障診斷的識別準確分別在99%和90%左右,均高于一維卷積神經網絡;在故障診斷的時間方面,相同參數的情況下,一維卷積神經網絡的單個診斷算列的識別時間遠遠多于另外兩種二維卷積神經網絡模型,均超過780 μs。
通過對比實驗結果得出,在較少的迭代次數和樣本量的情況下,本文所提方法在變工況下的識別準確率和故障診斷識別時間上都更有優(yōu)勢。
本文提出了一種適用于軸承運行載荷發(fā)生改變時,可以對其故障進行準確且有效診斷的二維卷積神經網絡模型。通過變工況的模擬實驗,證明了該模型的有效性以及可行性,并得出了以下結論。
(1) 本文原始一維信號的處理與轉化方式更能完整且有效地保留軸承故障的特征信號,無需額外定義任何參數,盡量消除了專家經驗所帶來的影響,提高了模型的識別準確率。
(2) 本文提出的變工況下二維卷積神經網絡在軸承載荷發(fā)生改變的情況下,實現了對44種故障類型及其嚴重程度的端到端故障診斷,軸承故障診斷的識別準確率達到了99.6%。
(3) 本文所提方法模型測試總耗時為466 s,單個診斷算列時間約為598 μs,模型的故障識別準確率和診斷的實時性均優(yōu)于傳統(tǒng)卷積神經網絡。