孫晉錳 于忠清 王海崖
摘要:針對傳統(tǒng)故障診斷方法耗時長、人工成本高且工作效率低以及現(xiàn)代故障診斷過于復(fù)雜的問題,提出了一種直接對振動信號進(jìn)行關(guān)鍵特征篩選提取的方法,并結(jié)合經(jīng)典的C45算法、Cart算法、BP算法和SVM算法對滾動軸承進(jìn)行在線的故障診斷。研究結(jié)果表明,基于C45算法、Cart算法、BP算法和SVM算法模型的診斷方法均可對滾動軸承在運(yùn)行過程中是否出現(xiàn)了故障以及出現(xiàn)了什么故障進(jìn)行較為精準(zhǔn)的識別和分類,且具有較高的準(zhǔn)確率,可以達(dá)到很好的故障監(jiān)測效果以及故障診斷效果?;赟VM算法的故障診斷模型診斷準(zhǔn)確率優(yōu)于其他三種算法,更加適用于滾動軸承的故障診斷。
關(guān)鍵詞:滾動軸承;故障診斷;機(jī)器學(xué)習(xí)算法;C45算法;Cart算法;BP算法;SVM算法;預(yù)測性維護(hù)
中圖分類號:TH212;TH213.3
文獻(xiàn)標(biāo)志碼:A
收稿日期:2020-12-23
基金項(xiàng)目:2019年度山東省重點(diǎn)研發(fā)計(jì)劃(批準(zhǔn)號:2019JZZY020101)資助。
通信作者:于忠清,男,博士,教授,主要研究方向?yàn)楣I(yè)大數(shù)據(jù)、預(yù)測性維護(hù)等。E-mail: haiersoft@163.com
滾動軸承在工業(yè)中起著至關(guān)重要的作用,運(yùn)行狀態(tài)直接關(guān)系到整臺工業(yè)設(shè)備能否正常工作,進(jìn)而關(guān)系到整條生產(chǎn)線能否正常運(yùn)行[1]。近幾十年以來,國內(nèi)外眾多學(xué)者對滾動軸承的故障診斷進(jìn)行了大量研究,只為能進(jìn)一步更加高效以及更加精準(zhǔn)的實(shí)現(xiàn)實(shí)時的滾動軸承故障診斷。穆麗蓉[2]提出了一種軸承振動信號自適應(yīng)診斷建模方法。Borghesani等[3]提出了一種在不同速度和負(fù)荷下診斷軸承故障的方法。呂楠等[4]提出了一種基于BP神經(jīng)網(wǎng)絡(luò)的滾動軸承故障診斷。李從志等[5]提出一種基于經(jīng)驗(yàn)?zāi)B(tài)分解與DE相結(jié)合的自適應(yīng)多尺度散布熵滾動軸承故障診斷方法。Janssens等[6]基于軸承振動信號的振幅用CNN實(shí)現(xiàn)了滾動軸承故障診斷。以上解決方案要么實(shí)驗(yàn)樣本過少,要么特征提取方法過于復(fù)雜,要么故障分類的準(zhǔn)確率不夠高,有的甚至沒有給出具體的診斷準(zhǔn)確率。機(jī)器學(xué)習(xí)算法能準(zhǔn)確感知不同樣本集中的數(shù)據(jù)的細(xì)微差別,如決策樹(DecisionTree) [7]、支持向量機(jī)(SVM) [8]、BP神經(jīng)網(wǎng)絡(luò)(BP) [9])等算法。在線故障診斷技術(shù)能及時檢測到故障的發(fā)生,及時進(jìn)行故障處理,從而大大減少因停機(jī)時間過久而造成的巨大經(jīng)濟(jì)損失。為了能夠更加簡單直觀且高效的實(shí)現(xiàn)滾動軸承的在線故障診斷,本文一次性的提取了大小不同的兩個數(shù)據(jù)集作為實(shí)驗(yàn)樣本,同時對大量實(shí)驗(yàn)樣本經(jīng)過上百次的實(shí)驗(yàn)對比驗(yàn)證,最終選取出7種有效的特征值,作為基于機(jī)器學(xué)習(xí)算法的滾動軸承故障診斷模型的輸入?yún)?shù),最后達(dá)成準(zhǔn)確識別滾動軸承什么時候發(fā)生了故障,以及發(fā)生的是何種故障。
1 滾動軸承故障診斷模型的構(gòu)建
滾動軸承的故障診斷模型構(gòu)建主要包括兩部分:一是對滾動軸承的原始振動信號預(yù)處理,然后再對預(yù)處理后的信號進(jìn)行特征提取,從而為后期的故障診斷提供良好的依據(jù);二是將提取后的各特征值輸入到基于不同機(jī)器學(xué)習(xí)算法的滾動軸承故障診斷模型中,然后通過模型訓(xùn)練不斷的調(diào)整各關(guān)鍵參數(shù),不斷得對模型進(jìn)行優(yōu)化,從而獲得最佳的滾動軸承故障診斷模型。
1.1 數(shù)據(jù)預(yù)處理
本文對原始的振動數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理。首先選取數(shù)據(jù),由于原始的數(shù)據(jù)集中包含大量的數(shù)據(jù),考慮到計(jì)算機(jī)算力有限的問題,于是有針對性地提取了40萬個數(shù)據(jù)點(diǎn)和4萬個數(shù)據(jù)點(diǎn)的數(shù)據(jù)作為本文的兩個樣本數(shù)據(jù)集。其次,對實(shí)驗(yàn)樣本進(jìn)行分類操作,因滾動軸承的故障類型有三種,分別是內(nèi)圈故障、滾動體故障和外圈故障,加上滾軸軸承的正常狀態(tài),所以數(shù)據(jù)樣本共分為四類,分別以1、2、3、4作為滾動軸承四種不同狀態(tài)的類型標(biāo)記。最后對樣本數(shù)據(jù)集進(jìn)行特征提取,每種特征值都有著與之對應(yīng)的數(shù)學(xué)公式,通過對每個固定數(shù)量的小樣本中數(shù)據(jù)進(jìn)行公式運(yùn)算,最終得出每一個小樣本的不同特征值。本文數(shù)據(jù)的特征提取主要包含以下7個指標(biāo):兩個有量綱指標(biāo),即平均值和均方根值(有效值);5個無量綱指標(biāo),即峰值指標(biāo)、脈沖指標(biāo)、裕度指標(biāo)、波形指標(biāo)、峭度指標(biāo)[10]。
1.2 模型生成
本文滾動軸承故障診斷模型的生成包括基于歷史數(shù)據(jù)的模型訓(xùn)練和模型優(yōu)化。
1.2.1 基于C4.5算法的模型生成 C4.5算法由ID3算法衍生而來,利用信息增益率來作為屬性選擇的重要衡量標(biāo)準(zhǔn),是一種比較經(jīng)典的決策樹算法,亦是分類算法中的一員[11]。
(1) 信息熵,設(shè)第 k類樣本在當(dāng)前樣本集S中的占比為pkk=1,2,3,…,y,則S 的信息熵為
Info_Ent(S)=-∑yk=1pklog2pk(1)
(2) 信息增益,樣本集S被屬性a劃分所得
Info_Gain(S,a)=Info_Ent(S)-∑Vv=1SvSInfo_EntSv(2)
(3) 信息增益率,C45算法使用增益率來選擇最優(yōu)劃分屬性,增益率為
Info_Gain_ratioS,a=Info_Gain(S,a)Info_V(a) (3)
Info_V(a)=-∑Vv=1SvSlog2SvS (4)
根據(jù)C45算法的原理以及滾動軸承的歷史數(shù)據(jù),生成基于C45算法的滾動軸承故障診斷模型。
1.2.2 基于BP算法的模型生成 BP神經(jīng)網(wǎng)絡(luò)是一種按誤差逆?zhèn)鞑ニ惴▽W(xué)習(xí)的多層前饋神經(jīng)網(wǎng)絡(luò),通過反向傳播進(jìn)行不間斷的訓(xùn)練,同時對網(wǎng)絡(luò)的權(quán)值和偏差進(jìn)行不斷的調(diào)整,最終使網(wǎng)絡(luò)輸出層的誤差平方和最小[12]。BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)主要由輸入層、隱含層和輸出層組成,如圖1所示[13]。
(1) 網(wǎng)絡(luò)的初始化,初始化權(quán)值和偏差,同時確定輸入輸出向量,采用Sigmoid激勵函數(shù)
gx=11+e-x (5)
(2) 計(jì)算網(wǎng)絡(luò)隱含層的輸出Hj、網(wǎng)絡(luò)輸出層的輸出Ok
Hj=g∑mi=1wijxi+bj (6)
Ok=∑lj=1Hiwjk+bk (7)
其中,wij指代輸入層-隱含層的權(quán)重、隱含層-輸出層的權(quán)重表示為wjk,bj指代輸入層-隱含層的偏置、隱含層-輸出層的偏置表示為bk。
(3) 計(jì)算預(yù)測輸出與期望輸出之間的誤差,期望輸出用Yk表示,記Yk-Ok=ek,誤差E為
E=12∑nk=1e2k (8)
以上公式中,i=1,2,…,m,j=1,2,…,l, k=1,2,…,n。
(4) 權(quán)重更新
wij=wij+ηHj1-HjxiΣnk=1wjkek (9)
wjk=wjk+ηHjek (10)
(5)偏置更新
bj=bj+ηHj1-HjΣnk=1wjkek (11)
bk=bk+ηek (12)
為了使BP神經(jīng)網(wǎng)絡(luò)發(fā)揮出最優(yōu)的性能,本文在進(jìn)行網(wǎng)絡(luò)訓(xùn)練之前對數(shù)據(jù)進(jìn)行了歸一化處理,以此來消除數(shù)據(jù)特征之間的量綱影響。根據(jù)BP算法的原理以及滾動軸承的歷史數(shù)據(jù),生成基于BP算法的滾動軸承故障診斷模型。
1.2.3 基于SVM算法的模型生成 SVM算法是一種經(jīng)典的分類算法。SVM是一種分類器,可以有效解決非線性分類問題[14]。對于集合 S=x1,y1,x2,y2,…,xk,yk,yi∈-1,+1,SVM算法就是在基于集合S的樣本空間中找到一個可以將不同類別的樣本分開的劃分超平面[15]。
(1) 劃分超平面的公式為
wTx+b=0 (13)
其中,w=w1,w2,…,wj為法向量,決定超平面的方向;b為位移項(xiàng),決定超平面與原點(diǎn)之間的距離。
(2)將超平面記為w,b,w-法向量,b-位移項(xiàng),樣本空間中任意點(diǎn)x到超平面w,b的距離d
d=wTx+bw(14)
(3) 假定超平面w,b可以對所有訓(xùn)練的樣本進(jìn)行一個正確的分類,即對于xi,yi∈D,若yi=+1,則有wTxi+b>0; 若yi=-1,則有wTxi+b<0。令
wTxi+b+1,yi=+1
wTxi+b≤-1,yi=-1 (15)
當(dāng)?shù)忍柍闪r,滿足條件的樣本點(diǎn)即為支持向量,支持向量與超平面間的間隔m
m=2w (16)
(4) 獲得劃分超平面的最大間隔,使m最大即可,只需找到滿足條件的的法向量w和位移b
maxω,b2ws.t. yiwTxi+b)1,i=1,2,…,n. (17)
只要w-1最大化,間隔亦能最大化,也就是只需最小化w2。支持向量機(jī)的基本型
minω,b12w2s.t. yiwTxi+b)1,i=1,2,…,n (18)
根據(jù)SVM算法的原理以及滾動軸承的歷史數(shù)據(jù),生成基于SVM算法的滾動軸承故障診斷模型。
2 滾動軸承在線故障診斷
用預(yù)處理后的滾動軸承的歷史數(shù)據(jù),生成并優(yōu)化滾動軸承的故障診斷模型,使其能夠有效實(shí)現(xiàn)滾動軸承在線故障診斷。滾動軸承在線故障診斷流程如圖2所示。
3 實(shí)驗(yàn)驗(yàn)證
為了驗(yàn)證基于機(jī)器學(xué)習(xí)算法的滾動軸承在線故障診斷模型方法的可行性,采用了兩組數(shù)據(jù)集和四種算法進(jìn)行對比驗(yàn)證。本文實(shí)驗(yàn)數(shù)據(jù)由西儲大學(xué)數(shù)據(jù)中心網(wǎng)站獲取,選用了故障直徑為0007英寸的軸承驅(qū)動端數(shù)據(jù),軸承驅(qū)動端的 4 種狀態(tài)數(shù)據(jù),分別是正常狀態(tài)、內(nèi)圈故障、滾動體故障及外圈故障。試驗(yàn)臺如圖3所示,測試臺由一臺2馬力的電機(jī)(左)、一個扭矩傳感器/編碼器(中)、一個測功機(jī)(右)和控制電子裝置(未顯示)組成。
數(shù)據(jù)集1:選取12 k(故障直徑0007 inches;負(fù)載2HP;電機(jī)轉(zhuǎn)速1 750 r/min)驅(qū)動端軸承故障數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),實(shí)驗(yàn)數(shù)據(jù)分為4種類型,即軸承四種狀態(tài)(正常狀態(tài)、內(nèi)圈故障、滾動體故障、外圈故障),每種狀態(tài)數(shù)據(jù)各提取前10萬條,并對數(shù)據(jù)進(jìn)行預(yù)處理,100條原始數(shù)據(jù)作為一個樣本,共計(jì)4 000個樣本。滾動軸承正常狀態(tài)、內(nèi)圈故障、滾動體故障、外圈故障的樣本量均為1 000個。
3.1 振動信號
以下各圖是分別基于滾動軸承原始振動數(shù)據(jù)的時域圖、頻域圖。滾動軸承四種狀態(tài)的時域和頻域信號分別如圖4、5、6、7所示。
3.2 數(shù)據(jù)預(yù)處理
實(shí)驗(yàn)數(shù)據(jù)包括滾動軸承內(nèi)圈、滾動體、外圈三種故障以及處于正常狀態(tài)下共4種類型的數(shù)據(jù),分別從這4種狀態(tài)的滾動軸承振動數(shù)據(jù)中每種狀態(tài)數(shù)據(jù)各提取前10萬條,以此作為每種軸承狀態(tài)的實(shí)驗(yàn)數(shù)據(jù),同時以每100條原始數(shù)據(jù)標(biāo)記為一個樣本作為劃分樣本的標(biāo)準(zhǔn),即滾動軸承每種狀態(tài)的樣本量均為1 000個,4種狀態(tài)的樣本量共計(jì)4 000個。每種狀態(tài)的樣本按4∶1的比例劃分為訓(xùn)練樣本和測試樣本,即訓(xùn)練數(shù)據(jù)占全部實(shí)驗(yàn)樣本的80%,剩余的20%樣本全部作為算法模型的測試數(shù)據(jù)。
由于時域特征更適用于在線監(jiān)測[16],故本文主要通過計(jì)算原始數(shù)據(jù)共提取出了7種有效的時域特征值,并以此作為本文機(jī)器學(xué)習(xí)算法模型的輸入?yún)?shù)。特征如表1所示,分別為平均值、均方根值、峰值指標(biāo)、脈沖指標(biāo)、裕度指標(biāo)、波形指標(biāo)、峭度指標(biāo)。仔細(xì)觀察表1,不難發(fā)現(xiàn),不同的故障類型對應(yīng)著不同的特征值,相互之間都存在著一定的差異,這些數(shù)據(jù)間的差異恰恰是故障診斷的重要依據(jù)。
表1中,故障類型數(shù)字1代表軸承處于正常態(tài)度,故障類型數(shù)字2表示軸承發(fā)生了內(nèi)圈故障,故障類型數(shù)字3表示軸承的滾動體發(fā)生了故障,故障類型數(shù)字4表示軸承發(fā)生了外圈故障。
3.3 滾動軸承在線故障診斷
3種算法模型的訓(xùn)練樣本和測試樣本按4∶1的比例進(jìn)行劃分,即訓(xùn)練數(shù)據(jù)占全部實(shí)驗(yàn)樣本的80%,剩余的20%樣本全部作為本文3種算法模型的測試數(shù)據(jù)。圖8是基于C45算法和CART算法的滾動軸承在線故障診斷模型準(zhǔn)確率統(tǒng)計(jì)圖;圖9是基于BP算法的滾動軸承在線故障診斷模型準(zhǔn)確率統(tǒng)計(jì)圖;圖10是基于SVM算法的滾動軸承在線故障診斷模型效果圖。
根據(jù)該滾動軸承的時域圖、頻域圖和歷史數(shù)據(jù)以及故障診斷的準(zhǔn)確率對比,3種機(jī)器學(xué)習(xí)算法均可實(shí)現(xiàn)對滾動軸承進(jìn)行在線的故障診斷。但相比之下,基于SVM算法生成的滾動軸承在線故障診斷模型準(zhǔn)確率最高,效果最好。為了進(jìn)一步驗(yàn)證本文故障診斷方法的有效性以及實(shí)用性,重新整理了另一組滾動軸承的數(shù)據(jù)集進(jìn)行了再次診斷效果實(shí)驗(yàn)驗(yàn)證。
數(shù)據(jù)集2:選取12 k(故障直徑0007inches;負(fù)載2HP;電機(jī)轉(zhuǎn)速1 750 r/min)驅(qū)動端軸承故障數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),實(shí)驗(yàn)數(shù)據(jù)分為4種類型,即軸承四種狀態(tài)(正常狀態(tài)、內(nèi)圈故障、滾動體故障、外圈故障),每種狀態(tài)數(shù)據(jù)各提取前1萬條,并對數(shù)據(jù)進(jìn)行預(yù)處理,100條原始數(shù)據(jù)作為一個樣本,共計(jì)400個樣本。滾動軸承正常狀態(tài)、內(nèi)圈故障、滾動體故障、外圈故障的樣本量均為100個。
3種算法模型的訓(xùn)練樣本和測試樣本按4∶1的比例進(jìn)行劃分,即訓(xùn)練數(shù)據(jù)占全部實(shí)驗(yàn)樣本的80%,剩余的20%樣本全部作為本文3種算法模型的測試數(shù)據(jù),如圖11、圖12和圖13。
根據(jù)該滾動軸承的時域圖、頻域圖和歷史數(shù)據(jù)以及故障診斷的準(zhǔn)確率對比,進(jìn)一步驗(yàn)證了基于機(jī)器學(xué)習(xí)算法的滾動軸承在線故障診斷方法的可行性。
3.4 對比分析
表2 表3分別統(tǒng)計(jì)了2個數(shù)據(jù)集,4個故障診斷模型的診斷結(jié)果。
通過對比表2和表3,基于SVM算法模型的滾動軸承故障診斷準(zhǔn)確率均高于C45算法、CART算法和BP算法,豐富完善的歷史數(shù)據(jù),有利于滾動軸承故障診斷模型的優(yōu)化。
4 結(jié)論
本文提出的直接對振動信號進(jìn)行關(guān)鍵特征篩選提取同時結(jié)合經(jīng)典的C4.5算法、Cart算法、BP算法和SVM算法的滾動軸承故障診斷方法,可準(zhǔn)確實(shí)現(xiàn)對滾動軸承的故障在線進(jìn)行診斷,并且基于SVM算法的故障診斷模型診斷準(zhǔn)確率均優(yōu)于基于C45算法、Cart算法的滾動軸承診斷模型和基于BP算法的滾動軸承故障診斷模型。基于SVM算法的滾動軸承在線故障診斷方法,更適合滾動軸承的故障診斷;對工業(yè)上滾動軸承的在線故障診斷具有較強(qiáng)的實(shí)際應(yīng)用意義。
參考文獻(xiàn)
[1]何玲. 面向故障診斷的異構(gòu)特征融合與在線不均衡分類研究[D]. 新鄉(xiāng):河南師范大學(xué),2017.
[2]穆麗蓉,胡磊.軸承振動信號自適應(yīng)診斷建模方法[J].船海工程,2020,49(03):97-100.
[3]BORGHESANI P, RICCI R, CHATTERTON S, et al. A new procedure for using envelope analysis for rolling element bearing diagnostics in variable operating conditions[J]. Mechanical Systems and Signal Processing,2013,38(1): 23-35.
[4]呂楠,姚平喜.基于BP神經(jīng)網(wǎng)絡(luò)的滾動軸承故障診斷[J].煤礦機(jī)械,2020,41(8):172-173.
[5]李從志,鄭近德,潘海洋,等.基于自適應(yīng)多尺度散布熵的滾動軸承故障診斷方法[J].噪聲與振動控制,2018,38(5):173-179.
[6]JANSSENS O, SLAVKOVIKJ V,VERVISCH B, et al. Convolutional neural network based fault detection for rotating machinery[J]. Journal of Sound and Vibration,2016,377:331-345.
[7]趙慶恩,黃宏偉,馮坤,等.基于小波包能量-決策樹的滾動軸承混合故障診斷[J].軸承,2016(6):43-46.
[8]梁治華,曹江濤,姬曉飛.基于EEMD和CS-SVM的滾動軸承故障診斷研究[J].機(jī)電工程,2019,36(6):622-627.
[9]馮玉芳,盧厚清,殷宏,等.基于BP神經(jīng)網(wǎng)絡(luò)的故障診斷模型研究[J].計(jì)算機(jī)工程與應(yīng)用,2019,55(6):24-30.
[10] 程曉涵,汪愛明,花如祥,等.24種特征指標(biāo)對軸承狀態(tài)識別的性能研究[J].振動.測試與診斷,2016,36(2):351-358+406.
[11] 韓存鴿,葉球?qū)O.決策樹分類算法中C4.5算法的研究與改進(jìn)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2019,28(6):198-202.
[12] 張磊. 基于BP神經(jīng)網(wǎng)絡(luò)的齒圈插齒工藝參數(shù)預(yù)測與優(yōu)化[D]. 包頭:內(nèi)蒙古科技大學(xué),2020.
[13] 丁雪紅,石莉,李敏,等.基于BP神經(jīng)網(wǎng)絡(luò)的智能制造能力成熟度評價研究[J].青島大學(xué)學(xué)報(自然科學(xué)版),2019,32(3):20-25+30.
[14] WANG Z Y, YAO L G, CAI Y W. Rolling bearing fault diagnosis using generalized refined composite multiscale sample entropy and optimized support vector machine[J]. Measurement,2020,156.
[15] 肖雅靜. 基于支持向量機(jī)的滾動軸承故障診斷與預(yù)測方法研究[D].北京:中國礦業(yè)大學(xué)(北京),2019.
[16] 于婷婷. 基于BP神經(jīng)網(wǎng)絡(luò)的滾動軸承故障診斷方法[D].大連:大連理工大學(xué),2008.
Online Fault Diagnosis of Rolling Bearing Based
on Machine Learning Algorithm
SUN Jin-meng, YU Zhong-qing, WANG Hai-ya
(School of Data Science and Software Engineering, Qingdao University, Qingdao 266071, China)
Abstract:
To addresses the problems of time-consuming, high labour cost and low efficiency of traditional fault diagnosis methods as well as the problem that modern fault diagnosis is too complex. In view of the time-consuming,high labor cost and low officiency of traditional fault diagonosis methods and the complexity of modern fault diagonosis, a method is proposed to directly extract key features from vibation signals and combine the classical C4.5 algorithm,Cart algorithm,BP algorithm and SVM algorithm to perform online fault diagonosis of rolling bearings. The research results show that the diagnosis methods based on C4.5 algorithm, Cart algorithm, BP algorithm and SVM algorithm model can identify and classify whether and what faults occur in the rolling bearing during operation with high accuracy, and can achieve good fault monitoring and fault diagnosis effect. The diagnosis accuracy of the fault diagnosis model based on SVM algorithm is better than the other three algorithms and is more suitable for the fault diagnosis of rolling bearings.
Keywords:
rolling bearing; fault diagnosis; machine learning algorithm; C4.5 algorithm; Cart algorithm; BP algorithm; SVM algorithm; predictive maintenance