馬海寧 何鑫 陳競競 汪卉
摘要:如今,滾動軸承在機械領域應用廣泛,而滾動軸承是容易發(fā)生故障的零件。在滾動軸承故障診斷中,傳統(tǒng)經(jīng)驗分析法受人工經(jīng)驗的影響局限性較大。鑒于此,文章設計了以長短時記憶(LongShort-Term Memory,LSTM)和卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)為基礎的軸承故障診斷模型,通過故障數(shù)據(jù)對兩種模型進行訓練,在TensorFlow框架下,對LSTM和CNN兩種不同方法進行了仿真對比。實驗發(fā)現(xiàn),基于CNN的軸承故障診斷模型在各方面性能都更為優(yōu)異,準確率比基于LSTM的軸承故障診斷模型高出8%。實驗結果表明,應用CNN模型能夠提高滾動軸承故障診斷準確率,具有較高的應用價值。
關鍵詞:滾動軸承;故障診斷;LSTM;CNN
中圖法分類號:TP183文獻標識碼:A
Application of convolutional neural network in fault diagnosis ofrolling bearings
MA Haining,HEXin,CHENJingjing,WANG Hui
(School of Electrical and Control Engineering,ShenyangJianzhuUniversity,Shenyang 110168,China)
Abstract:In modern society, rolling bearings are widely used in the field of machinery,and rolling bearings are components prone to failure. In the fault diagnosis of rolling bearing, the traditional empirical analysis method is greatly limitedby manual experience. To solve this problem, this paper designs a bearing fault diagnosis model based on Long Short-Term Memory and Convolutional Neural Networks. The two models are trained using fault data of rolling bearings. Under the framework of TensorFlow,two different methods for LSTM and CNN are simulated and compared. Experiments show that the bearing fault diagnosis model based on CNN has better performance in all aspects, and the accuracy is 8% higher than that based on LSTM.The experimental results show that the application of the CNN model can improve the accuracy of rolling bearing fault diagnosis and has high application value.
Key words: rolling bearings, fault diagnosis,LSTM,CNN
1引言
滾動軸承在機械領域占據(jù)重要地位,受工作環(huán)境和負載變化等因素影響,滾動軸承極易受到磨損、沖擊、震動、操作錯誤等影響導致?lián)p壞,從而帶來重大損失。滾動軸承發(fā)生故障之后,較難確定故障產(chǎn)生的原因以及具體位置。傳統(tǒng)的診斷方法很大程度上依賴人工干預和經(jīng)驗判斷,無法準確、高效定位和識別故障點[1]。因此,優(yōu)化軸承故障診斷網(wǎng)絡模型,解決故障識別率低的問題,進行有效的故障診斷有重要意義。
2 LSTM 和 CNN 的基本原理
2.1長短時記憶網(wǎng)絡的基本原理
長短時記憶( Long Short?Term Memory,LSTM )是一種可以持續(xù)很長時間的短期記憶模型,是遞歸神經(jīng)網(wǎng)絡的一個變種,其基本組成單元是神經(jīng)元。不同的是,LSTM 為了解決梯度消失的問題,采用了節(jié)點激活法,理論上可以在任何時間段“記憶”,LSTM 是由 LSTM 神經(jīng)元為基本組成單元的遞歸神經(jīng)網(wǎng)絡[2]。 LSTM 開創(chuàng)了人工神經(jīng)元"門"的概念。LSTM 結構在隱藏層中包含由一個儲蓄單元和幾個門結構組成的神經(jīng)元細胞或記憶單元,每個門類似于一個“正?!钡娜斯ど窠?jīng)元。典型的 LSTM 的基本神經(jīng)單元如圖1所示。
2.2卷積神經(jīng)網(wǎng)絡的基本原理
卷積神經(jīng)網(wǎng)絡( Convolutional Neural Network, CNN)是一種前饋神經(jīng)網(wǎng)絡,由 Yann LeCun等[3]提出,靈感來自于動物視覺皮層細胞的感受機制。卷積神經(jīng)網(wǎng)絡能夠解決大量的模型數(shù)據(jù)圖像識別并檢測提取有效信息,這是由于卷積神經(jīng)網(wǎng)絡學習特征的強大能力。CNN 還具有很強的容錯性和魯棒性,對縮放和扭曲不敏感。其基本結構如圖2所示。這是一個擁有兩個以上隱含層的卷積神經(jīng)網(wǎng)絡,也是一種深度神經(jīng)網(wǎng)絡,一般包括兩部分:濾波級通常由卷積層和池化層組成,其主要功能是對輸入數(shù)據(jù)進行過濾,以消除噪音和降低維度,并得到所需的特征;分類級可以進行分類處理,通常由一些全連接層組成。
3 LSTM 和 CNN 網(wǎng)絡結構
3.1 LSTM 網(wǎng)絡結構
本文設計的網(wǎng)絡結構要能夠處理每一個信號,因為滾動軸承的故障是成周期變化的[4]。長短時記憶既包含了長時記憶又包含了短時記憶,解決了循環(huán)神經(jīng)網(wǎng)絡的長期依賴問題。
LSTM 模型計算過程先輸入上一時刻和當前時刻數(shù)據(jù),通過三個門進行計算后再使用遺忘門和輸入門進行記憶單元的更新,通過輸出門將內(nèi)部狀態(tài)同步到外部。之后設計一個 Sequential 容器,該容器是可以自定義添加網(wǎng)絡層。首先,設置 LSTM 層,該層以 Tanh 函數(shù)為激活函數(shù),Sigmoid 函數(shù)作為用來循環(huán)時間步的函數(shù),設置門控單元輸出維度為32。其次,設置 Flatten 層。最后,設置全連接層,并通過Softmax函數(shù)為激活函數(shù)進行分類診斷。
3.2 CNN 網(wǎng)絡結構
通常在處理圖像樣本時,CNN 網(wǎng)絡性能會隨著神經(jīng)元數(shù)量、網(wǎng)絡層數(shù)等參數(shù)的增加而提高。但隨著神經(jīng)元數(shù)量的不斷增加,CNN 網(wǎng)絡卷積運算速度也會相應放慢,從而降低網(wǎng)絡效率[5]。因此設計的卷積神經(jīng)網(wǎng)絡基礎模型如下:首先,是一個窗口大小為64×1,步長16×1的卷積層,該卷積層用于提取特征;接下來是窗口大小為2×1,縮小比例因數(shù)為2的池化層,越多的網(wǎng)絡層非線性映射越多,可以抑制過擬合;接下來是全連接層,神經(jīng)元數(shù)是32;最后輸出層的激活函數(shù)為Softmax函數(shù)。
4軸承故障診斷實驗
4.1數(shù)據(jù)來源
實驗數(shù)據(jù)來自凱斯西儲大學( CWRU)滾動軸承數(shù)據(jù)中心的軸承故障診斷數(shù)據(jù),該數(shù)據(jù)收集了正常軸承以及單點驅動端和風扇端缺陷的數(shù)據(jù)。對于驅動端軸承實驗,以12K 個樣本點/秒、48K 個樣本點/秒為數(shù)據(jù)收集的速度。同時,以12K 個樣本點/秒的速度收集所有風扇端軸承數(shù)據(jù)。數(shù)據(jù)集包括正常情況下的數(shù)據(jù)、采樣頻率為12kHz 的驅動端軸承故障數(shù)據(jù)、采樣頻率為48kHz 的驅動端軸承故障數(shù)據(jù)、風扇端故障數(shù)據(jù)。每類樣本都有十幾萬個數(shù)據(jù),實際使用時進行了自行抽樣,劃分為訓練集、驗證集、測試集。仿真所用的數(shù)據(jù)為部分軸承數(shù)據(jù),即正常振動數(shù)據(jù)和滾動體、內(nèi)圈、外圈故障在三種故障等級下的振動數(shù)據(jù),共九種故障加上一種正常狀態(tài),即10組數(shù)據(jù)。
4.2診斷模型訓練與測試
(1)LSTM 模型訓練
首先,進行數(shù)據(jù)集的整理,整理完成后設置網(wǎng)絡結構,為網(wǎng)絡訓練做準備。在網(wǎng)絡結構設置中,網(wǎng)絡每個 batch 包含128個樣本,共記10組數(shù)據(jù),每類樣本數(shù)量為1000,同時將數(shù)據(jù)標準化,對 x 和 y 的訓練數(shù)據(jù)和有效數(shù)據(jù)以及測試數(shù)據(jù)進行初始化。每類樣本數(shù)量為1000,長度為2048,并且進行標準化,訓練、驗證、測試集劃分比例為7:2:1。其次,構建 LSTM 網(wǎng)絡模型并編譯。最后,對模型進行訓練,并評估模型。使用基于 LSTM 模型的軸承進行故障診斷模型進行故障診斷,訓練和測試結果如表1所列。其中,全程故障診斷運行時間為10分鐘左右;在測試集上,故障診斷準確率可以達到92.00%;損失率為17.23%。
(2)CNN 模型
數(shù)據(jù)進行預處理后,設置網(wǎng)絡結構,其中網(wǎng)絡結構是以128個樣本為一批進行處理的,共有10類數(shù)據(jù),每類樣本數(shù)量為1000,數(shù)據(jù)進行標準化,訓練參數(shù)設置和數(shù)據(jù)預處理,之后構建 CNN 網(wǎng)絡模型并編譯。
最后,對 CNN 模型進行訓練,并評估模型。使用基于 CNN 的軸承故障檢測模型進行故障檢測,訓練和測試結果如表2所列。其中,全程故障檢測運行時間為2分鐘左右,時間很短;在準確率方面識別率可以達到99.90%;損失率僅為1.22%。
5結論
本文探討了深度學習網(wǎng)絡在軸承故障診斷中的應用,采用 LSTM 和 CNN 兩種網(wǎng)絡原型設計了兩種軸承故障診斷網(wǎng)絡模型,在凱斯西儲大學軸承數(shù)據(jù)中心完成了訓練和測試。實驗結果表明,當使用 LSTM 網(wǎng)絡模型對滾動軸承進行故障診斷時,準確率相對較低,通過對比分析實驗結果發(fā)現(xiàn),應用 CNN 網(wǎng)絡模型對滾動軸承故障診斷的準確率更高,可達到99.96%,訓練用時更短,只需要2分鐘。由此可知,CNN 網(wǎng)絡模型可以帶來更高的診斷效率和準確率。
參考文獻:
[1]洪騰蛟,丁鳳娟,王鵬,等.深度學習在軸承故障診斷領域的應用研究[ J].科學技術與工程,2021,21(22):9203?9211.
[2]陳偉.深度學習在滾動軸承故障診斷中的應用研究[D].成都:西南交通大學,2018.
[3]舒陶.基于深度學習的滾動軸承故障診斷方法研究[D].廣州:廣東工業(yè)大學,2020.
[4]莊雨璇,李奇,楊冰如.基于 LSTM 的軸承故障診斷端到端方法[J].噪聲與振動控制,2019,39(6):187?193.
[5]許愛華,杜洋,袁濤.基于深度學習的電機軸承故障診斷研究[J].組合機床與自動化加工技術,2020(3):45?48,54.
作者簡介:
馬海寧(1999—),本科,研究方向:機器學習、軸承故障診斷。