馬海寧 何鑫 陳競(jìng)競(jìng) 汪卉
摘要:如今,滾動(dòng)軸承在機(jī)械領(lǐng)域應(yīng)用廣泛,而滾動(dòng)軸承是容易發(fā)生故障的零件。在滾動(dòng)軸承故障診斷中,傳統(tǒng)經(jīng)驗(yàn)分析法受人工經(jīng)驗(yàn)的影響局限性較大。鑒于此,文章設(shè)計(jì)了以長(zhǎng)短時(shí)記憶(LongShort-Term Memory,LSTM)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)為基礎(chǔ)的軸承故障診斷模型,通過(guò)故障數(shù)據(jù)對(duì)兩種模型進(jìn)行訓(xùn)練,在TensorFlow框架下,對(duì)LSTM和CNN兩種不同方法進(jìn)行了仿真對(duì)比。實(shí)驗(yàn)發(fā)現(xiàn),基于CNN的軸承故障診斷模型在各方面性能都更為優(yōu)異,準(zhǔn)確率比基于LSTM的軸承故障診斷模型高出8%。實(shí)驗(yàn)結(jié)果表明,應(yīng)用CNN模型能夠提高滾動(dòng)軸承故障診斷準(zhǔn)確率,具有較高的應(yīng)用價(jià)值。
關(guān)鍵詞:滾動(dòng)軸承;故障診斷;LSTM;CNN
中圖法分類號(hào):TP183文獻(xiàn)標(biāo)識(shí)碼:A
Application of convolutional neural network in fault diagnosis ofrolling bearings
MA Haining,HEXin,CHENJingjing,WANG Hui
(School of Electrical and Control Engineering,ShenyangJianzhuUniversity,Shenyang 110168,China)
Abstract:In modern society, rolling bearings are widely used in the field of machinery,and rolling bearings are components prone to failure. In the fault diagnosis of rolling bearing, the traditional empirical analysis method is greatly limitedby manual experience. To solve this problem, this paper designs a bearing fault diagnosis model based on Long Short-Term Memory and Convolutional Neural Networks. The two models are trained using fault data of rolling bearings. Under the framework of TensorFlow,two different methods for LSTM and CNN are simulated and compared. Experiments show that the bearing fault diagnosis model based on CNN has better performance in all aspects, and the accuracy is 8% higher than that based on LSTM.The experimental results show that the application of the CNN model can improve the accuracy of rolling bearing fault diagnosis and has high application value.
Key words: rolling bearings, fault diagnosis,LSTM,CNN
1引言
滾動(dòng)軸承在機(jī)械領(lǐng)域占據(jù)重要地位,受工作環(huán)境和負(fù)載變化等因素影響,滾動(dòng)軸承極易受到磨損、沖擊、震動(dòng)、操作錯(cuò)誤等影響導(dǎo)致?lián)p壞,從而帶來(lái)重大損失。滾動(dòng)軸承發(fā)生故障之后,較難確定故障產(chǎn)生的原因以及具體位置。傳統(tǒng)的診斷方法很大程度上依賴人工干預(yù)和經(jīng)驗(yàn)判斷,無(wú)法準(zhǔn)確、高效定位和識(shí)別故障點(diǎn)[1]。因此,優(yōu)化軸承故障診斷網(wǎng)絡(luò)模型,解決故障識(shí)別率低的問(wèn)題,進(jìn)行有效的故障診斷有重要意義。
2 LSTM 和 CNN 的基本原理
2.1長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的基本原理
長(zhǎng)短時(shí)記憶( Long Short?Term Memory,LSTM )是一種可以持續(xù)很長(zhǎng)時(shí)間的短期記憶模型,是遞歸神經(jīng)網(wǎng)絡(luò)的一個(gè)變種,其基本組成單元是神經(jīng)元。不同的是,LSTM 為了解決梯度消失的問(wèn)題,采用了節(jié)點(diǎn)激活法,理論上可以在任何時(shí)間段“記憶”,LSTM 是由 LSTM 神經(jīng)元為基本組成單元的遞歸神經(jīng)網(wǎng)絡(luò)[2]。 LSTM 開(kāi)創(chuàng)了人工神經(jīng)元"門"的概念。LSTM 結(jié)構(gòu)在隱藏層中包含由一個(gè)儲(chǔ)蓄單元和幾個(gè)門結(jié)構(gòu)組成的神經(jīng)元細(xì)胞或記憶單元,每個(gè)門類似于一個(gè)“正?!钡娜斯ど窠?jīng)元。典型的 LSTM 的基本神經(jīng)單元如圖1所示。
2.2卷積神經(jīng)網(wǎng)絡(luò)的基本原理
卷積神經(jīng)網(wǎng)絡(luò)( Convolutional Neural Network, CNN)是一種前饋神經(jīng)網(wǎng)絡(luò),由 Yann LeCun等[3]提出,靈感來(lái)自于動(dòng)物視覺(jué)皮層細(xì)胞的感受機(jī)制。卷積神經(jīng)網(wǎng)絡(luò)能夠解決大量的模型數(shù)據(jù)圖像識(shí)別并檢測(cè)提取有效信息,這是由于卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)特征的強(qiáng)大能力。CNN 還具有很強(qiáng)的容錯(cuò)性和魯棒性,對(duì)縮放和扭曲不敏感。其基本結(jié)構(gòu)如圖2所示。這是一個(gè)擁有兩個(gè)以上隱含層的卷積神經(jīng)網(wǎng)絡(luò),也是一種深度神經(jīng)網(wǎng)絡(luò),一般包括兩部分:濾波級(jí)通常由卷積層和池化層組成,其主要功能是對(duì)輸入數(shù)據(jù)進(jìn)行過(guò)濾,以消除噪音和降低維度,并得到所需的特征;分類級(jí)可以進(jìn)行分類處理,通常由一些全連接層組成。
3 LSTM 和 CNN 網(wǎng)絡(luò)結(jié)構(gòu)
3.1 LSTM 網(wǎng)絡(luò)結(jié)構(gòu)
本文設(shè)計(jì)的網(wǎng)絡(luò)結(jié)構(gòu)要能夠處理每一個(gè)信號(hào),因?yàn)闈L動(dòng)軸承的故障是成周期變化的[4]。長(zhǎng)短時(shí)記憶既包含了長(zhǎng)時(shí)記憶又包含了短時(shí)記憶,解決了循環(huán)神經(jīng)網(wǎng)絡(luò)的長(zhǎng)期依賴問(wèn)題。
LSTM 模型計(jì)算過(guò)程先輸入上一時(shí)刻和當(dāng)前時(shí)刻數(shù)據(jù),通過(guò)三個(gè)門進(jìn)行計(jì)算后再使用遺忘門和輸入門進(jìn)行記憶單元的更新,通過(guò)輸出門將內(nèi)部狀態(tài)同步到外部。之后設(shè)計(jì)一個(gè) Sequential 容器,該容器是可以自定義添加網(wǎng)絡(luò)層。首先,設(shè)置 LSTM 層,該層以 Tanh 函數(shù)為激活函數(shù),Sigmoid 函數(shù)作為用來(lái)循環(huán)時(shí)間步的函數(shù),設(shè)置門控單元輸出維度為32。其次,設(shè)置 Flatten 層。最后,設(shè)置全連接層,并通過(guò)Softmax函數(shù)為激活函數(shù)進(jìn)行分類診斷。
3.2 CNN 網(wǎng)絡(luò)結(jié)構(gòu)
通常在處理圖像樣本時(shí),CNN 網(wǎng)絡(luò)性能會(huì)隨著神經(jīng)元數(shù)量、網(wǎng)絡(luò)層數(shù)等參數(shù)的增加而提高。但隨著神經(jīng)元數(shù)量的不斷增加,CNN 網(wǎng)絡(luò)卷積運(yùn)算速度也會(huì)相應(yīng)放慢,從而降低網(wǎng)絡(luò)效率[5]。因此設(shè)計(jì)的卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)模型如下:首先,是一個(gè)窗口大小為64×1,步長(zhǎng)16×1的卷積層,該卷積層用于提取特征;接下來(lái)是窗口大小為2×1,縮小比例因數(shù)為2的池化層,越多的網(wǎng)絡(luò)層非線性映射越多,可以抑制過(guò)擬合;接下來(lái)是全連接層,神經(jīng)元數(shù)是32;最后輸出層的激活函數(shù)為Softmax函數(shù)。
4軸承故障診斷實(shí)驗(yàn)
4.1數(shù)據(jù)來(lái)源
實(shí)驗(yàn)數(shù)據(jù)來(lái)自凱斯西儲(chǔ)大學(xué)( CWRU)滾動(dòng)軸承數(shù)據(jù)中心的軸承故障診斷數(shù)據(jù),該數(shù)據(jù)收集了正常軸承以及單點(diǎn)驅(qū)動(dòng)端和風(fēng)扇端缺陷的數(shù)據(jù)。對(duì)于驅(qū)動(dòng)端軸承實(shí)驗(yàn),以12K 個(gè)樣本點(diǎn)/秒、48K 個(gè)樣本點(diǎn)/秒為數(shù)據(jù)收集的速度。同時(shí),以12K 個(gè)樣本點(diǎn)/秒的速度收集所有風(fēng)扇端軸承數(shù)據(jù)。數(shù)據(jù)集包括正常情況下的數(shù)據(jù)、采樣頻率為12kHz 的驅(qū)動(dòng)端軸承故障數(shù)據(jù)、采樣頻率為48kHz 的驅(qū)動(dòng)端軸承故障數(shù)據(jù)、風(fēng)扇端故障數(shù)據(jù)。每類樣本都有十幾萬(wàn)個(gè)數(shù)據(jù),實(shí)際使用時(shí)進(jìn)行了自行抽樣,劃分為訓(xùn)練集、驗(yàn)證集、測(cè)試集。仿真所用的數(shù)據(jù)為部分軸承數(shù)據(jù),即正常振動(dòng)數(shù)據(jù)和滾動(dòng)體、內(nèi)圈、外圈故障在三種故障等級(jí)下的振動(dòng)數(shù)據(jù),共九種故障加上一種正常狀態(tài),即10組數(shù)據(jù)。
4.2診斷模型訓(xùn)練與測(cè)試
(1)LSTM 模型訓(xùn)練
首先,進(jìn)行數(shù)據(jù)集的整理,整理完成后設(shè)置網(wǎng)絡(luò)結(jié)構(gòu),為網(wǎng)絡(luò)訓(xùn)練做準(zhǔn)備。在網(wǎng)絡(luò)結(jié)構(gòu)設(shè)置中,網(wǎng)絡(luò)每個(gè) batch 包含128個(gè)樣本,共記10組數(shù)據(jù),每類樣本數(shù)量為1000,同時(shí)將數(shù)據(jù)標(biāo)準(zhǔn)化,對(duì) x 和 y 的訓(xùn)練數(shù)據(jù)和有效數(shù)據(jù)以及測(cè)試數(shù)據(jù)進(jìn)行初始化。每類樣本數(shù)量為1000,長(zhǎng)度為2048,并且進(jìn)行標(biāo)準(zhǔn)化,訓(xùn)練、驗(yàn)證、測(cè)試集劃分比例為7:2:1。其次,構(gòu)建 LSTM 網(wǎng)絡(luò)模型并編譯。最后,對(duì)模型進(jìn)行訓(xùn)練,并評(píng)估模型。使用基于 LSTM 模型的軸承進(jìn)行故障診斷模型進(jìn)行故障診斷,訓(xùn)練和測(cè)試結(jié)果如表1所列。其中,全程故障診斷運(yùn)行時(shí)間為10分鐘左右;在測(cè)試集上,故障診斷準(zhǔn)確率可以達(dá)到92.00%;損失率為17.23%。
(2)CNN 模型
數(shù)據(jù)進(jìn)行預(yù)處理后,設(shè)置網(wǎng)絡(luò)結(jié)構(gòu),其中網(wǎng)絡(luò)結(jié)構(gòu)是以128個(gè)樣本為一批進(jìn)行處理的,共有10類數(shù)據(jù),每類樣本數(shù)量為1000,數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,訓(xùn)練參數(shù)設(shè)置和數(shù)據(jù)預(yù)處理,之后構(gòu)建 CNN 網(wǎng)絡(luò)模型并編譯。
最后,對(duì) CNN 模型進(jìn)行訓(xùn)練,并評(píng)估模型。使用基于 CNN 的軸承故障檢測(cè)模型進(jìn)行故障檢測(cè),訓(xùn)練和測(cè)試結(jié)果如表2所列。其中,全程故障檢測(cè)運(yùn)行時(shí)間為2分鐘左右,時(shí)間很短;在準(zhǔn)確率方面識(shí)別率可以達(dá)到99.90%;損失率僅為1.22%。
5結(jié)論
本文探討了深度學(xué)習(xí)網(wǎng)絡(luò)在軸承故障診斷中的應(yīng)用,采用 LSTM 和 CNN 兩種網(wǎng)絡(luò)原型設(shè)計(jì)了兩種軸承故障診斷網(wǎng)絡(luò)模型,在凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)中心完成了訓(xùn)練和測(cè)試。實(shí)驗(yàn)結(jié)果表明,當(dāng)使用 LSTM 網(wǎng)絡(luò)模型對(duì)滾動(dòng)軸承進(jìn)行故障診斷時(shí),準(zhǔn)確率相對(duì)較低,通過(guò)對(duì)比分析實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),應(yīng)用 CNN 網(wǎng)絡(luò)模型對(duì)滾動(dòng)軸承故障診斷的準(zhǔn)確率更高,可達(dá)到99.96%,訓(xùn)練用時(shí)更短,只需要2分鐘。由此可知,CNN 網(wǎng)絡(luò)模型可以帶來(lái)更高的診斷效率和準(zhǔn)確率。
參考文獻(xiàn):
[1]洪騰蛟,丁鳳娟,王鵬,等.深度學(xué)習(xí)在軸承故障診斷領(lǐng)域的應(yīng)用研究[ J].科學(xué)技術(shù)與工程,2021,21(22):9203?9211.
[2]陳偉.深度學(xué)習(xí)在滾動(dòng)軸承故障診斷中的應(yīng)用研究[D].成都:西南交通大學(xué),2018.
[3]舒陶.基于深度學(xué)習(xí)的滾動(dòng)軸承故障診斷方法研究[D].廣州:廣東工業(yè)大學(xué),2020.
[4]莊雨璇,李奇,楊冰如.基于 LSTM 的軸承故障診斷端到端方法[J].噪聲與振動(dòng)控制,2019,39(6):187?193.
[5]許愛(ài)華,杜洋,袁濤.基于深度學(xué)習(xí)的電機(jī)軸承故障診斷研究[J].組合機(jī)床與自動(dòng)化加工技術(shù),2020(3):45?48,54.
作者簡(jiǎn)介:
馬海寧(1999—),本科,研究方向:機(jī)器學(xué)習(xí)、軸承故障診斷。