李雪原, 陳 品, 陳 劍,2, 孫太華
(1.合肥工業(yè)大學 噪聲振動工程研究所,安徽 合肥 230009; 2.安徽省汽車NVH工程技術(shù)研究中心,安徽 合肥 230009)
滾動軸承是機電設(shè)備中重要的零部件,也是設(shè)備的易損件之一[1],其狀況好壞對整個系統(tǒng)的安全運行和功能實現(xiàn)有著決定性的影響[2],對滾動軸承進行有效的故障診斷不但可以防止機械精度下降,杜絕安全事故發(fā)生,而且可以提高機電設(shè)備的性能、穩(wěn)定性和使用壽命[3-4]。因此,滾動軸承的故障診斷對工業(yè)生產(chǎn)的安全性和可靠性意義重大[5]。
在工作條件下,故障特征受載荷、潤滑條件、零部件間的振動等各種因素的影響,周圍復雜噪聲振動環(huán)境會影響滾動軸承微弱的故障特征提取。滾動軸承故障診斷的關(guān)鍵在于故障特征的提取和故障類型的識別[6]。近年來,數(shù)字圖像處理和計算機視覺技術(shù)應用不斷成熟,在智能監(jiān)控[7]和行人檢測技術(shù)[8]等各領(lǐng)域中有著廣泛的應用,因其較強的直觀性和包含豐富的狀態(tài)信息,在滾動軸承故障診斷模式識別領(lǐng)域也開始得到應用。國內(nèi)外已有不少將圖像處理方法引入故障診斷領(lǐng)域以實現(xiàn)對軸承故障類型自動判定的研究。文獻[9]通過將采集的振動信號轉(zhuǎn)化為振動頻譜圖像進行處理,并利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)方法進行圖像處理分類以實現(xiàn)軸承故障診斷,但該方法缺少自適應能力且需要大量原始數(shù)據(jù);文獻[10]提出一種使用InceptionV3模型基于振動信號波形圖像識別的故障診斷方法,但該方法穩(wěn)定性較差;文獻[11]通過連續(xù)小波變換將振動信號轉(zhuǎn)化為圖像,利用圖像識別網(wǎng)絡(luò)提取信號的時頻域特征實現(xiàn)準確分類,但步驟繁雜。
針對滾動軸承故障數(shù)據(jù)處理方法存在計算量大、步驟繁雜、用時長以及特征提取不全面的問題,本文提出一種基于梯度直方圖(histogram of oriented gradient,HOG)圖像處理算法的軸承故障識別與診斷方法。滾動軸承發(fā)生故障時會產(chǎn)生周期性的振動,分析故障數(shù)據(jù)時發(fā)現(xiàn)有明顯的故障頻率成分,由于是周期性的振動數(shù)據(jù),采用圖像處理算法可以有效地進行特征識別。該方法先使用變分模態(tài)分解(variational mode decomposition,VMD)分解采集的原始振動信號,生成二維圖像;然后利用HOG算法[12]提取該二維圖像的灰度、紋理、邊緣等特征信息,HOG算法是通過計算圖像梯度的大小和方向并統(tǒng)計各個塊之間的數(shù)據(jù)信息,它對偏移敏感性不高且魯棒性強,能夠有效地刻畫圖像特征。為了解決二維圖像處理數(shù)據(jù)維度過大的問題,采用多維尺度分析(multi-dimensional scaling,MDS)對上述特征數(shù)據(jù)進行降維處理,既提高了所述方法的識別能力又減少了圖像處理的運算時間,使識別效率得到有效提升。
HOG算法是一種檢測物體特征的描述特征方式,常用在計算機視覺和圖像處理領(lǐng)域中[13],該算法特征提取過程如圖1所示。
圖1 圖像特征提取過程
HOG特征提取步驟描述如下。
1) 首先將整個圖像縮放成一定大小的規(guī)范圖像,方便后期提取特征,然后將圖像轉(zhuǎn)化為灰度圖。
2) 通過Gamma校正法對待分類圖像進行灰度化,然后歸一化處理,這里取γ=1/2,即
I(x,y)=I(x,y)γ
(1)
3) 使用梯度表示圖像像素值變化最快的方向,設(shè)某一像素點的坐標為(x,y),則該點的梯度大小、方向計算方法為:
Gx(x,y)=H(x+1,y)-H(x-1,y)
(2)
Gy(x,y)=H(x,y+1)-H(x,y-1)
(3)
其中:Gx(x,y)、Gy(x,y)分別表示像素點的水平方向梯度值和垂直方向梯度值;H(x,y)表示像素值大小。
4) 像素點(x,y)處的梯度幅值和梯度方向分別為:
(4)
(5)
5) 分別計算每個劃分cell單元內(nèi)像素點的梯度大小及其方向,即可得到每個cell單元的方向梯度直方圖,直方圖區(qū)間bin表示cell單元內(nèi)梯度幅值和方向的映射。其中圖像塊block由cell單元構(gòu)成,然后聯(lián)合全部圖像塊的HOG特征得到整體圖像的HOG特征,這就是該圖像對應的特征描述,對圖像進行分塊處理可以有效降低圖像局部變化帶來的影響。
HOG特征提取算法流程如圖2所示。
圖2 HOG特征提取流程
MDS算法是對目標分析對象的差異性(或相似性)信息進行調(diào)度,在高維到低維的空間映射過程中能夠保留樣本點相似性的關(guān)鍵信息,使其盡可能與原先的相似性匹配[14]。MDS的本質(zhì)是尋找一個低維空間矩陣,使得低維空間矩陣能夠保持高維矩陣數(shù)據(jù)點之間的聯(lián)系。
設(shè)原始高維空間有n個樣本點x1,x2,x3,…,xn組成的樣本空間,其MDS降維步驟描述如下。
1) 計算高維空間中的距離矩陣Dn×n,其中dij表示樣本點xi與xj的距離,則D是對角線全都為0的實對稱矩陣。此時dij可以表示為:
(6)
(7)
由于在k維空間中點可以進行平移和旋轉(zhuǎn),因此會有多種分布要求,為便于討論,一般希望降維后的數(shù)據(jù)X均值中心化,即
(8)
由式(7)和式(8)可以推出:
(9)
(10)
(11)
根據(jù)式(9)可得:
(12)
根據(jù)式(11)~(13),將Sii和Sjj轉(zhuǎn)化為用dij表示的形式,可以得到:
Sij=
(13)
則點積矩陣S中Sij為:
(14)
3) 對矩陣S進行特征值分解,計算特征值及其對應的特征向量,即
S=QΣ2QT
(15)
Σ2=diag[λ1λ2…λn]
(16)
選取前k個較大的特征值的根號值和特征向量用于數(shù)據(jù)降維,至此實現(xiàn)了高維空間的n個距離可用k維空間的n個坐標描述,即
X=QkΣk
(17)
支持向量機(support vector machines,SVM)主要思想是找到一個超平面進行數(shù)據(jù)集分類,并以此超平面為標準正確分類出所有的訓練樣本,同時使訓練樣本中離超平面有“最大間隔”[15],如圖3所示。
圖3 SVM分類示意圖
1) 給定訓練樣本集yi∈{-1,1},D={(x1,y1),(x2,y2),…,(xm,ym)},劃分超平面的方程為:
wTx+b=0
(18)
其中:w=(w1,w2,…,wd)表示法向量,決定了超平面的方向;b為位移項,決定了超平面與原點之間的距離。
2) 由圖3可知,最優(yōu)分類線為直線P,直線P1和直線P2為距離最優(yōu)分類線最近的數(shù)據(jù)點同時平行于直線P,在直線P1和直線P2上的點滿足條件:
wTx+b=1
(19)
wTx+b=-1
(20)
這些線上的點稱為“支持向量”,支持向量與超平面之間的距離為|1/w2|,支持向量之間的距離為|2/w|,由線性優(yōu)化理論可知,該最優(yōu)超平面的問題可表示為:
(21)
s.t.yi(wTxi+b)≥1,i=1,2,…,m
(22)
3) 式(22)是一個凸二次規(guī)劃問題,通常引入拉格朗日乘子法,將約束條件問題轉(zhuǎn)化為對偶問題:
(23)
(24)
最終可以得到最優(yōu)分類函數(shù)為:
f(x)=sgn(wTx+b)=
(25)
4) 在現(xiàn)實問題中訓練樣本常存在線性不可分的問題,低維空間中的線性不可分問題通常采用非線性變化,將其轉(zhuǎn)化到高維空間中使其線性可分。轉(zhuǎn)化到高維空間中的方法是引入核函數(shù)K(xi,x),因此在非線性SVM的最優(yōu)分類函數(shù)為:
(26)
這里使用高斯徑向基核函數(shù)得:
(27)
其中,σ>0為高斯核的帶寬。
5) 遺傳算法(genetic algorithm,GA)起源于對生物系統(tǒng)所進行的模擬研究,是借鑒生物界自然選擇和進化機制發(fā)展的一種全局優(yōu)化概率搜索算法。GA算法借鑒了達爾文的進化論和孟德爾的遺傳學說,本質(zhì)上是一種高效、并行、全局搜索的方法,能在搜索過程中自動獲取和積累有關(guān)搜索空間的知識,并自適應地控制搜索過程以求得最佳解。
使用GA算法優(yōu)化SVM關(guān)鍵參數(shù)懲罰因子c和核函數(shù)參數(shù)g,得到最優(yōu)的分類模型,具體步驟如下:
1) 對上述降維處理后的數(shù)據(jù)構(gòu)建SVM參數(shù)集。
2) 設(shè)置終止迭代次數(shù)和精度,對每個樣本進行編碼并初始化種群。
3) 對訓練集中的所有數(shù)據(jù)計算種群適應度進行評估。
4) 當種群最優(yōu)個體適應度達到給定的精度或者達到最大迭代次數(shù)則進入步驟6),否則執(zhí)行下一步。
5) 對當前種群進行選擇、交叉、變異產(chǎn)生子代種群,轉(zhuǎn)到步驟3)繼續(xù)。
6) 終止迭代得到最優(yōu)懲罰因子cbest和核函數(shù)參數(shù)gbest,并通過訓練得到最佳軸承故障分類模型。
采集不同故障模式的時域信號構(gòu)建樣本集,直接對原始信號進行分段,選取每段采樣點數(shù)需要考慮樣本至少覆蓋1個周期,本文選取每段點數(shù)為5 120個采樣點,然后采用變分模態(tài)分解(variational mode decomposition,VMD)[16]對樣本進行分解,得到多個固有模態(tài)分量(intrinsic mode functions,IMF),生成各種工況下的二維圖像。
VMD是通過變分問題的構(gòu)造和求解使每個模式分量的中心頻率和帶寬不斷更新,從而獲得最佳的分量和中心頻率,本質(zhì)上是將經(jīng)典維納濾波器推廣到多個自適應頻段,將信號分解成指定數(shù)量的有限帶寬模式分量,并最小化每個模式分量的估計帶寬之和[17]。因此與直接使用原信號相比,使用VMD分解后生成的圖像可以增加圖像所包含的特征信息,同時減少噪聲干擾。對采集到的原始數(shù)據(jù)進行處理,其分解層數(shù)均為K,本文所用數(shù)據(jù)集中K=4,具體分解示意圖如圖4所示。
圖4 軸承振動信號單個樣本VMD分解圖
采用HOG算法對上述二維圖像提取特征數(shù)據(jù),根據(jù)1.1節(jié)理論可知在其他條件不變的情況下,若在對圖像縮放的像素大小選擇較大時,則圖像在表達二維振動信號的局部細節(jié)信息會更加清楚,但是block在圖像內(nèi)的滑動次數(shù)會增加,進而增加特征數(shù)據(jù)的維數(shù),在特征矩陣內(nèi)增加許多元素,使數(shù)據(jù)出現(xiàn)冗余的情況;對滑動步長進行選擇時,滑動步長的增加會同時引起cell單元增大和滑框block尺寸變大,在整個圖像內(nèi)的滑動次數(shù)會減小,HOG特征矩陣的維數(shù)會減小,但是映射到直方圖中會模糊局部細節(jié)的表現(xiàn)。因此圖像的大小和滑動步長的選擇都會影響HOG特征數(shù)據(jù)的描述。
經(jīng)過多次驗證發(fā)現(xiàn),當選取圖像像素大小為64×64時,檢測窗口的尺寸為16×16,窗口的滑動步長為(8,8),其運行速度快且實現(xiàn)效率高,此時提取特征維數(shù)結(jié)果計算如下所述。
block在一個圖像內(nèi)行和列的滑動次數(shù)分別為:
(28)
(29)
因此整個圖像內(nèi)的滑動次數(shù)為7×7=49次,在一個檢測窗口中給出的cell單元的尺寸為8×8,則一個檢測窗口中一共有2×2=4個cell單元。這里bin(直方圖區(qū)間)將梯度方向劃分成9個區(qū)間,將幅值填充到對應的梯度方向區(qū)間內(nèi),則每個cell單元上都可以由一個9維的直方圖向量用來表示梯度幅值和方向。
由以上分析可知,在一個像素大小為64×64的圖像內(nèi),其HOG特征的維數(shù)為49×4×9=1 764維。
圖像處理方法所提取出的特征向量存在維度高的問題,在高維空間中會給計算帶來很大的麻煩,尤其本文中振動圖像構(gòu)成簡單,提取圖像的特征矩陣會出現(xiàn)樣本稀疏的問題。而在高維空間中更容易找到一個超平面將目標分開,但是高維空間中訓練分類器相當于在低維空間中構(gòu)建一個復雜的分類器,會過于注重結(jié)果的正確性,甚至把一些錯誤數(shù)據(jù)當成正確數(shù)據(jù)參與分類,再對新數(shù)據(jù)進行預測時容易出現(xiàn)過擬合的情況,缺乏對新數(shù)據(jù)的泛化能力,這種現(xiàn)象被稱為“維數(shù)災難”(curse of dimensionality)。
使用降維方法可以有效地降低以上危害,在低維空間中有效提高樣本的密度,提高對新數(shù)據(jù)的泛化能力,在計算難度下降的同時保留關(guān)鍵信息,便于后續(xù)進行特征識別,從而進一步縮短特征運算時間。
由2.2節(jié)獲得低維圖像特征數(shù)據(jù)后,采用GA算法優(yōu)化的SVM分類模型進行訓練,提高分類模型的精度,其流程描述如下:
1) 采集原始數(shù)據(jù),分段后經(jīng)VMD處理構(gòu)建一定大小的二維振動信號圖像。
2) 使用數(shù)字圖像處理方法HOG提取圖像特征。
3) 利用MDS算法進行特征數(shù)據(jù)降維處理,對處理后的數(shù)據(jù)集添加標簽,建立分類模型,劃分訓練集與測試集。
4) 導入訓練集,采用GA優(yōu)化SVM懲罰因子c和核函數(shù)參數(shù)g,得到最優(yōu)參數(shù)。
5) 以最優(yōu)參數(shù)建立最佳分類模型,輸入測試集得到分類結(jié)果。
為驗證所提方法的有效性,數(shù)據(jù)采集使用軸承型號為NU1010EM和N1010EM的單列圓柱滾子軸承,軸承參數(shù)見表1所列。其中:NU1010EM拆卸方式為內(nèi)圈可拆;N1010EM拆卸方式為外圈可拆。
表1 滾動軸承參數(shù)
采用合肥工業(yè)大學航空發(fā)動機主軸軸承試驗機采集不同類別故障軸承振動數(shù)據(jù)。
試驗前使用線切割加工方式分別加工出包括內(nèi)圈故障、內(nèi)圈滾子故障、外圈故障、外圈滾子故障、滾動體故障以及正常軸承在內(nèi)的6種故障參數(shù)的軸承數(shù)據(jù),加工示意圖如圖5所示,試驗裝置如圖6所示。
圖5 滾動軸承滾動體和內(nèi)圈單點故障圖
圖6 軸承信號采集試驗裝置
上述故障尺寸均為9×0.2 mm,信號采集試驗裝置以20.48 kHz采樣頻率分別采集3種工況的軸承故障振動信號用于分析。
各工況參數(shù)見表2所列。
表2 工況參數(shù)
數(shù)據(jù)集選取在一種工況下每種故障類型的124個樣本,則一種工況下的不同故障共6×124個數(shù)據(jù)集,對不同類型的故障添加類別標簽,分別為[1 0 0 0 0 0]、[0 1 0 0 0 0]、[0 0 1 0 0 0]、[0 0 1 0 0 0]、[0 0 0 1 0 0]、[0 0 0 0 1 0]、[0 0 0 0 0 1]。選取其中70%劃分訓練集,并且使用五折交叉驗證法劃分驗證集,其余30%作為測試集,用來驗證模型的診斷分類能力。
采集到工況1下6種故障類型部分時域數(shù)據(jù)信號,如圖7所示。
圖7 軸承振動信號部分時域圖
驗證實驗使用的計算機配置及其軟件版本為:Windows 10 64位操作系統(tǒng),處理器為AMD R7-4750u@1.7 GHz,內(nèi)存為16 GiB,使用的軟件版本為MATLAB 2021a。
為了驗證本文方法的優(yōu)越性,將本文方法與方法1(未使用VMD預處理的方法)、方法2(使用VMD方法)處理統(tǒng)計每個IMF分量的峭度、峰值因子、裕度因子、方差、均方根5個特征參數(shù),共計20個數(shù)據(jù)作為輸入向量,并對這3種方法進行對比實驗(對比方法除所述之處不同外,其他過程均相同)。
為了更加直觀地反映3種方法的特征數(shù)據(jù)分布情況,結(jié)合T-SNE高維數(shù)據(jù)可視化(T-stochastic neighbor embedding)方法,對工況1下的特征數(shù)據(jù)進行低維可視化展示。
3種方法下的數(shù)據(jù)集在低維空間中的映射視圖如圖8所示,其中不同類別標簽使用不同的顏色表示。
圖8 T-SNE數(shù)據(jù)可視化視圖
從圖8可以看出:圖8a和圖8b中的部分數(shù)據(jù)點混合在一起,使得后續(xù)分類效果容易出錯;而圖8c中的類別分離明顯,各種特征之間可以得到有效的分隔。
3種方法的實驗結(jié)果對比見表3所列。
表3 實驗結(jié)果對比
由表3可知:采用本文所提出的基于圖像處理故障診斷方法準確率最高;采用方法2 VMD預處理比方法1直接使用原始時域信號生成的圖像效果高2%~3%,預處理可以使圖像更加規(guī)范化同時增強時域信號數(shù)據(jù)特征,在不同故障類型下表達的圖像特征更加明顯,同時去除了降噪處理這一流程;本文方法比采用統(tǒng)計IMF特征參數(shù)的準確率提高2%~5%,與使用有限個特征參數(shù)相比,本文方法可以更加有效地利用時域振動信號故障特征進行診斷,同時方法2在計算特征參數(shù)時需要對每個IMF分量分別計算特征數(shù)據(jù),需要全部數(shù)據(jù)參與運算,該方法運算數(shù)據(jù)量太高,運行速度緩慢,耗時較長。
以上結(jié)果驗證了圖像識別技術(shù)在故障診斷領(lǐng)域能夠得到有效的利用,能有效快速識別在噪聲干擾下的故障特征,避免了使用復雜信號分解的手工特征提取方法帶來的故障信息丟失,降低了診斷過程的操作難度,減少了運行時間。
本文提出了一種利用圖像處理的軸承故障診斷方法,基于航空發(fā)動機主軸軸承試驗機采集不同類別故障軸承振動數(shù)據(jù),將圖像處理的計算方法引入故障診斷領(lǐng)域,對于使用振動信號的旋轉(zhuǎn)機械結(jié)構(gòu)的故障診斷有一定的借鑒意義。該方法流程簡單,操作步驟少。實驗結(jié)果表明,該方法可以提高模型魯棒性和泛化能力,同時保證分類結(jié)果的準確性。
1) 將故障檢測問題轉(zhuǎn)換為圖像識別問題,將傳統(tǒng)的特征參數(shù)運算過程轉(zhuǎn)化為灰度圖像的灰度值運算過程,整個故障診斷流程不需要任何手動的特征提取,有效地縮短了特征提取時間,減少了處理步驟。
2) 由實驗對比結(jié)果可知,采用VMD方法對時域數(shù)據(jù)處理后生成數(shù)字圖像,增加了圖像表達的信息數(shù)據(jù),增強了圖像特征之間的差異性。
3) 采用MDS方法對數(shù)字圖像特征數(shù)據(jù)進行降維,不但可以保留原始數(shù)據(jù)中的有效信息,而且進一步縮短了特征運算時間。