楊路航 李寶慶 王 平 王 健 楊 宇
1. 湖南大學(xué)機(jī)械與運(yùn)載工程學(xué)院,長(zhǎng)沙,410082 2. 中國(guó)航發(fā)湖南動(dòng)力機(jī)械研究所,株洲,412002 3. 中國(guó)航空發(fā)動(dòng)機(jī)集團(tuán)航空發(fā)動(dòng)機(jī)振動(dòng)技術(shù)重點(diǎn)實(shí)驗(yàn)室,株洲,412002
滾動(dòng)軸承故障智能診斷在本質(zhì)上都是模式識(shí)別問題,最常用的就是反向傳播神經(jīng)網(wǎng)絡(luò)[1](back propagation neural network,BPNN)和支持向量機(jī)[2](support vector machine,SVM)?;谏疃葘W(xué)習(xí)的故障診斷模型[3-4]能直接從原始信號(hào)中提取特征并具有自適應(yīng)學(xué)習(xí)能力,但是它們都有共同的缺陷,即網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)需要人為設(shè)定并需要大量訓(xùn)練樣本和較長(zhǎng)的訓(xùn)練時(shí)間,限制了這些方法在工程實(shí)際中的應(yīng)用。SVM作為一種簡(jiǎn)單有效的分類方法,有著良好的泛化能力,其本質(zhì)可以看作基于凸包的最大邊距分類算法[5-8],即用凸包逼近每個(gè)類區(qū)域,根據(jù)兩個(gè)凸包之間最近的點(diǎn)來構(gòu)造分類超平面,只不過這類凸包的邊界趨于無(wú)窮,以一個(gè)分類超平面將兩個(gè)凸包分開。ZENG[6]對(duì)凸包邊界進(jìn)行約束,提出了彈性凸包(flexible convex hull,F(xiàn)CH)分類方法,通過改變彈性因子對(duì)凸包進(jìn)行緊致或?qū)捤傻墓烙?jì)來提高凸包的分類精度。但該方法在進(jìn)行分類超平面優(yōu)化時(shí),忽略了凸包內(nèi)部大部分樣本點(diǎn)的決策貢獻(xiàn),導(dǎo)致測(cè)試集分類精度降低。因此,筆者對(duì)彈性凸包輸出進(jìn)行改進(jìn),提出了概率輸出彈性凸包 (probability output flexible convex hull,POFCH)分類方法。該方法使用凸包頂點(diǎn)優(yōu)化分類超平面,然后計(jì)算所有樣本點(diǎn)到超平面的距離,借助于概率輸出的思想[5,9]進(jìn)行稀疏映射,最小化交叉熵極大似然函數(shù),將分類器的距離輸出轉(zhuǎn)化成對(duì)正負(fù)類的概率估計(jì)輸出,形成比距離更為合適的類別判斷方法。該方法在處理多分類問題時(shí),采用一對(duì)一原則,同時(shí)對(duì)多個(gè)分類器的輸出概率進(jìn)行成對(duì)耦合,進(jìn)一步提高了多分類的精度和魯棒性。
滾動(dòng)軸承故障的識(shí)別精度不僅受模式識(shí)別方法有效性的影響,還與故障特征提取的準(zhǔn)確性有關(guān)。傳統(tǒng)時(shí)域或頻域分析方法所能獲得的信息比較有限[10],而滾動(dòng)軸承原始振動(dòng)信號(hào)構(gòu)成的時(shí)頻圖像包含不同條件下滾動(dòng)軸承的豐富特征信息。振動(dòng)信號(hào)時(shí)頻圖的紋理信息不僅可以保留振動(dòng)信號(hào)的周期特性,還能夠保留時(shí)域和頻域聯(lián)合作用信息。軸承發(fā)生故障時(shí),其時(shí)頻圖包含了豐富的紋理特征?;叶裙采仃?gray level co-occurrence matrix,GLCM)可充分描述圖像紋理信息,廣泛用于圖像識(shí)別[11-12]和故障診斷[13-15]。本研究使用比較成熟的連續(xù)小波變換[16-17]來獲得時(shí)頻分布,通過計(jì)算時(shí)頻圖的灰度共生矩陣,選取灰度共生矩陣統(tǒng)計(jì)參數(shù)來構(gòu)造特征集,以充分反映時(shí)頻圖紋理特征(time-frequency image texture,TFIT)。然后,將紋理特征集作為概率輸出彈性凸包的輸入樣本,識(shí)別滾動(dòng)軸承的不同故障。實(shí)驗(yàn)結(jié)果表明基于概率輸出彈性凸包和紋理特征的滾動(dòng)軸承故障診斷方法具有較高的準(zhǔn)確性和魯棒性。
在實(shí)數(shù)向量空間H中,空間中任意一點(diǎn)用x表示,給定的樣本集X={x1,x2,…,xn}在空間H的凸集C稱為X的凸包,可以表示為
(1)
式中,αi為第i個(gè)樣本的組合系數(shù)。
引入彈性因子λ∈(1, ∞)并結(jié)合樣本數(shù)n,給凸包的組合系數(shù)設(shè)定新的上下限,形成新的模型——彈性凸包:
F(X)=
(2)
通過簡(jiǎn)單推導(dǎo)得出樣本集X的彈性凸包可以等價(jià)地表示為新的樣本集:
(3)
彈性凸包分類的原理就是尋找一個(gè)最優(yōu)超平面,該平面垂直平分兩個(gè)凸包最近點(diǎn)連接線段,使得該平面在正負(fù)類樣本凸包之間產(chǎn)生最大的間隔。
正類樣本集的所有點(diǎn)滿足〈w,x〉+b>0,負(fù)類樣本集的點(diǎn)滿足〈w,x〉+b<0,其中,w為分類超平面的法向量,x為樣本點(diǎn),b為偏置。分類超平面的確定就是兩個(gè)凸包最近點(diǎn)的求解問題:
(4)
i=1,2,…,n+j=1,2,…,n-
式中,n+、n-分別為正類樣本和負(fù)類樣本的個(gè)數(shù);λ+、λ-分別為正類凸包和負(fù)類凸包的彈性系數(shù)。
展開式(4)得到:
(5)
式(5)是一個(gè)凸二次規(guī)劃問題,本文采用標(biāo)準(zhǔn)的優(yōu)化算法進(jìn)行求解,同時(shí)借助核函數(shù)進(jìn)行核空間映射,將輸入空間的線性不可分問題轉(zhuǎn)化為特征空間的線性可分問題。本文采用高斯核作為核函數(shù):
(6)
其中,σ為高斯核函數(shù)的寬度參數(shù),控制函數(shù)徑向作用范圍。記式(5)的最優(yōu)解為α*,根據(jù)α*可確定最優(yōu)分類超平面的法向量w*和偏置b*:
(7)
法向量和偏置確定后,凸包上的點(diǎn)x與最優(yōu)分類超平面的距離為
f(x)=〈w*,x〉+b*
(8)
決策函數(shù)定義為
y=sgn(〈w*,x〉+b*)
(9)
如圖1所示,凸包邊界點(diǎn)可以實(shí)現(xiàn)對(duì)一類樣本集的凸估計(jì),分類超平面的優(yōu)化求解過程只考慮凸包頂點(diǎn)的決策貢獻(xiàn),忽略了凸包內(nèi)部大部分點(diǎn),因此不宜直接采用距離輸出決策。
圖1 彈性凸包分類原理Fig.1 Classification principle of flexible convex hull
(10)
(11)
當(dāng)F的梯度為零向量時(shí),對(duì)應(yīng)式(11)的解為最優(yōu)解。
圖2 凸包樣本分布不均勻Fig.2 Uneven distribution of convex hull samples
參數(shù)A和B的優(yōu)化求解實(shí)際上可以看做分類超平面的平移。對(duì)于二分類問題,可以獲得x屬于正類和負(fù)類的概率估計(jì)P+和P-(P++P-=1)。改進(jìn)后的決策函數(shù)定義為
(12)
rij+rji=1
(13)
rij≈Pi(Pi+Pj)
對(duì)式(13)變換求和得
(14)
為使式(14)的等價(jià)誤差盡可能小,對(duì)式(14)移項(xiàng)求最小值,則式(14)轉(zhuǎn)化為以下模型:
(15)
將式(15)展開寫成矩陣形式:
(16)
式中,P為樣本屬于某一類的概率;[Qij]n×n為二次型矩陣。
對(duì)式(16)的求解是一個(gè)凸二次規(guī)劃問題,本文采用標(biāo)準(zhǔn)算法進(jìn)行求解,得到樣本所屬第i類的概率Pi。概率輸出彈性凸包多分類的決策函數(shù)定義為
y=argmax{P1,P2,…,Pn}
(17)
概率輸出彈性凸包多分類采用概率輸出決策,原始的彈性凸包多分類采用投票原則進(jìn)行決策。
灰度共生矩陣Pd(m,n)表示從灰度等級(jí)為m的點(diǎn)沿水平方向向右移動(dòng)dx、豎直方向向下移動(dòng)dy,到達(dá)灰度等級(jí)為n的點(diǎn)的概率,其中,m,n=1,2,…,L-1;L為灰度級(jí),如圖3所示?;叶裙采仃嚨纳煞较蛴洖棣?,常取角度為0°、45°、90°和135°。一般來說,d確定后,θ也確定,且存在
(18)
圖3 灰度共生矩陣生成原理圖(dx=1, dy=0)Fig.3 Generating principle diagram of gray level co-occurrence matrix (dx=1, dy=0)
基于概率輸出彈性凸包和紋理特征的滾動(dòng)軸承故障診斷的流程如下:首先對(duì)加速度傳感器采集到的滾動(dòng)軸承原始振動(dòng)信號(hào)進(jìn)行連續(xù)小波變換,得到小波時(shí)頻圖;然后根據(jù)時(shí)頻圖的灰度共生矩陣獲得對(duì)應(yīng)的紋理特征,并把特征集劃分為訓(xùn)練集和測(cè)試集;最后根據(jù)訓(xùn)練集訓(xùn)練概率輸出彈性凸包模型對(duì)測(cè)試集進(jìn)行識(shí)別驗(yàn)證,實(shí)現(xiàn)故障診斷。特征提取的詳細(xì)步驟如下:
(1) 故障信號(hào)通常伴有較強(qiáng)的沖擊,根據(jù)morlet小波的沖擊適應(yīng)性[18],將morlet小波作為小波基函數(shù)進(jìn)行連續(xù)小波變換,獲得時(shí)域振動(dòng)信號(hào)的時(shí)頻圖,并將時(shí)頻圖轉(zhuǎn)化為256像素×256像素的灰度圖。
(2) 將時(shí)頻圖分成4個(gè)128像素×128像素的圖像,它們分別對(duì)應(yīng)2個(gè)高頻區(qū)域和2個(gè)低頻區(qū)域。
(3) 分別求出時(shí)頻圖每個(gè)區(qū)域4個(gè)方向(0°、45°、90°和135°)上的灰度共生矩陣。
(4) 綜合考慮4個(gè)方向的特征,按照2.1節(jié)計(jì)算出4個(gè)區(qū)域不同方向上的紋理特征,并求其對(duì)應(yīng)的均值和方差,形成32維特征向量,記為TFIT。
實(shí)驗(yàn)1數(shù)據(jù)來自美國(guó)凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)中心。軸承為型號(hào)6205-2RS的SKF深溝球軸承,采樣頻率為48 kHz,每12 000個(gè)采樣點(diǎn)劃分為一個(gè)樣本,得到1 400個(gè)樣本。故障狀態(tài)類型如表1所示。
表1 軸承數(shù)據(jù)樣本
按照2.2節(jié)步驟提取時(shí)頻圖紋理特征,并與文獻(xiàn)[3]的特征提取方法進(jìn)行對(duì)比,文獻(xiàn)[3]提取22個(gè)時(shí)域和頻域統(tǒng)計(jì)參數(shù)作為特征,記為TTF(traditional time frequency);將概率輸出彈性凸包分類器與原始彈性凸包和支持向量機(jī)進(jìn)行對(duì)比。數(shù)據(jù)集A用來識(shí)別故障類型及故障程度,數(shù)據(jù)集B用來識(shí)別故障類型。對(duì)于概率輸出彈性凸包,需要優(yōu)化的參數(shù)有高斯核參數(shù)σ和彈性因子λ。采用5折交叉驗(yàn)證進(jìn)行網(wǎng)格搜索最優(yōu)參數(shù),σ的搜索范圍為2-8~28,指數(shù)步長(zhǎng)為0.2,λ搜索范圍為20~24,指數(shù)步長(zhǎng)為0.2。圖4所示為采用紋理特征和概率輸出彈性凸包方法的網(wǎng)格搜索準(zhǔn)確率分布,實(shí)驗(yàn)數(shù)據(jù)集為B,得出最優(yōu)的σ、λ分別為1.136和2。
圖4 TFIT+POFCH網(wǎng)格搜索最優(yōu)參數(shù)Fig.4 Grid search optimal parameters based on TFIT and POFCH
采用網(wǎng)格搜索算法確定原始彈性凸包分類器和支持向量機(jī)分類器的參數(shù)。通過網(wǎng)格搜索算法確定最優(yōu)參數(shù)后,在最優(yōu)化參數(shù)下進(jìn)行20次五折交叉驗(yàn)證,得到故障識(shí)別準(zhǔn)確率,見表2,其中,模型為通過不同的特征集和不同的分類器進(jìn)行組合得到的故障分類模型
表2 識(shí)別準(zhǔn)確率
通過特征不變和分類器不變的比較可以看出,本文方法比原始的彈性凸包分類方法和支持向量機(jī)有更高的識(shí)別精度。在故障識(shí)別上,時(shí)頻圖紋理特征比傳統(tǒng)時(shí)頻特征有更高的識(shí)別精度。觀察數(shù)據(jù)集A上分類模型的識(shí)別精度,以支持向量機(jī)為例,采用TFIT的故障識(shí)別精度較TTF有很大的提高,這說明時(shí)頻圖紋理特征能很好地反映各類故障。這是因?yàn)闀r(shí)頻圖像同時(shí)保留了時(shí)域和頻域的聯(lián)合作用信息,對(duì)滾動(dòng)軸承的故障特征保留更加完全。
為使本文方法更具說服力并驗(yàn)證概率輸出彈性凸包的泛化能力,在數(shù)據(jù)集B上以時(shí)頻圖紋理特征為故障特征進(jìn)行實(shí)驗(yàn)。采用不同數(shù)量的樣本作為訓(xùn)練集,并將其余樣本作為測(cè)試集,隨機(jī)獨(dú)立重復(fù)實(shí)驗(yàn)20次,分類結(jié)果如圖5所示。
圖5 試驗(yàn)1的測(cè)試集識(shí)別準(zhǔn)確率與訓(xùn)練集占比關(guān)系Fig.5 Curve of test set-recognition accuracy-proportion of training set of test 1
由圖5可以看出,TFIT特征在訓(xùn)練樣本較少的情況下仍保持93%以上的準(zhǔn)確率;當(dāng)訓(xùn)練集樣本僅占10%時(shí),概率輸出彈性凸包也能保證測(cè)試集準(zhǔn)確率接近95%,說明概率輸出彈性凸包有良好的泛化能力。從識(shí)別精度變化曲線也可以看出,概率輸出彈性凸包的分類精度最高。
實(shí)驗(yàn)2的數(shù)據(jù)為湖南大學(xué)旋轉(zhuǎn)機(jī)械故障試驗(yàn)臺(tái)的滾動(dòng)軸承數(shù)據(jù)。試驗(yàn)臺(tái)架如圖7所示,滾動(dòng)軸承型號(hào)為6205-2RS SKF,通過激光切割獲得內(nèi)圈故障、外圈故障和滾動(dòng)體故障,每類故障的切割深度都為0.2 mm。電機(jī)轉(zhuǎn)速為986.1 r/min,采樣頻率為10 kHz。獲取的樣本如表3所示。
圖6 旋轉(zhuǎn)機(jī)械故障試驗(yàn)臺(tái)Fig.6 Rotating machinery failure test device
表3 軸承數(shù)據(jù)樣本
采用實(shí)驗(yàn)1的方法在最優(yōu)化參數(shù)下進(jìn)行20次5折交叉驗(yàn)證,將時(shí)頻紋理特征作為故障特征,概率輸出彈性凸包分類器的最優(yōu)參數(shù)為σ=2.2129,λ=1.7411。實(shí)驗(yàn)過程中,記錄每個(gè)模型的訓(xùn)練時(shí)間和測(cè)試時(shí)間。實(shí)驗(yàn)平臺(tái)的處理器型號(hào)為Intel Xeon E3-1231 v3@3.40GHz,軟件環(huán)境為MATLAB2018b。實(shí)驗(yàn)結(jié)果如表4所示。
表4 識(shí)別準(zhǔn)確率及平均運(yùn)行時(shí)間
由表4可以看出,基于概率輸出彈性凸包的分類方法依舊表現(xiàn)出了最高的準(zhǔn)確率,并在兩個(gè)特征集上提高了原始彈性凸包的分類精度,雖然訓(xùn)練時(shí)間和測(cè)試時(shí)間相較于原始彈性凸包和SVM有所延長(zhǎng),但均在0.1 s以內(nèi),能夠滿足實(shí)時(shí)診斷的要求。進(jìn)行20次隨機(jī)獨(dú)立重復(fù)試驗(yàn),觀察測(cè)試集準(zhǔn)確率隨訓(xùn)練集樣本量變化的曲線。由圖7可以看出,概率輸出彈性凸包有著最好的分類效果,并且測(cè)試集的識(shí)別精度隨著訓(xùn)練樣本的增多而提高。在紋理特征集上,概率輸出彈性凸包分類器在僅有10%的樣本作為訓(xùn)練集時(shí),測(cè)試集的識(shí)別精度超過96%,而原始彈性凸包識(shí)別精度不到94%。概率輸出彈性凸包分類方法提高了原始彈性凸包的識(shí)別精度,能夠較好地識(shí)別故障。
圖7 試驗(yàn)2的測(cè)試集識(shí)別準(zhǔn)確率與訓(xùn)練集占比關(guān)系Fig.7 Curve of test set recognition accuracy-proportion of training set of test 2
為了驗(yàn)證POFCH的魯棒性,對(duì)數(shù)據(jù)集B和C先按照8∶2比例拆分為訓(xùn)練集和測(cè)試集,對(duì)于每種類型的訓(xùn)練集,從其他類別的訓(xùn)練集中選擇2個(gè)樣本(作為當(dāng)前類別的離群點(diǎn))添加到當(dāng)前類別的訓(xùn)練集中,再進(jìn)行訓(xùn)練,驗(yàn)證測(cè)試集的準(zhǔn)確率,隨機(jī)獨(dú)立重復(fù)20次,實(shí)驗(yàn)結(jié)果如表5所示。
表5 魯棒性測(cè)試準(zhǔn)確率和識(shí)別精度下降率
表5中計(jì)算識(shí)別精度下降率的計(jì)算公式為
(19)
其中,c1為不加離群點(diǎn)時(shí)的識(shí)別精度,即表2和表4中20次五折交叉驗(yàn)證(即訓(xùn)練集和測(cè)試集按8∶2劃分)的結(jié)果,c為添加離群點(diǎn)后的識(shí)別精度??梢钥闯鲈诓煌臄?shù)據(jù)集上,概率輸出彈性凸包的準(zhǔn)確率依舊最高,并且從識(shí)別精度下降率來看,離群點(diǎn)對(duì)概率輸出彈性凸包的影響最小,說明概率輸出彈性凸包有更好的抗噪性和魯棒性。
本文提出的概率輸出彈性凸包分類方法在處理多分類時(shí),對(duì)不同分類器的輸出概率進(jìn)行成對(duì)耦合,以概率輸出彌補(bǔ)距離輸出的不足,消除了原始彈性凸包的缺點(diǎn);利用數(shù)字圖像處理技術(shù),以振動(dòng)信號(hào)時(shí)頻圖紋理特征為故障特征來構(gòu)建故障診斷模型。實(shí)驗(yàn)結(jié)果表明,概率輸出彈性凸包的分類精度和魯棒性高于距離輸出彈性凸包,且能準(zhǔn)確區(qū)分滾動(dòng)軸承的不同故障,有較高的魯棒性。