海波,姚海龍,孟叢叢
(蘭州城市學(xué)院 電子與信息工程學(xué)院,蘭州 730070)
使用軸承振動(dòng)信號(hào)進(jìn)行故障診斷是常用的故障診斷方式,振動(dòng)信號(hào)的特征提取和故障識(shí)別則是滾動(dòng)軸承故障診斷的重要步驟[1-3]。
在特征提取方面,近似熵(Approximate Entropy,AE)與樣本熵(Sample Entropy,SE)對(duì)信號(hào)數(shù)據(jù)的長(zhǎng)度較為敏感,且在熵值的計(jì)算過程中需對(duì)信號(hào)進(jìn)行2次重構(gòu),算法較為復(fù)雜[4-7];排列熵(Permutation Entropy,PE)雖然僅需對(duì)信號(hào)進(jìn)行1次重構(gòu),但計(jì)算過程中仍需要復(fù)雜的排序運(yùn)算[8-10];基本尺度熵(Base-Scale Entropy,BSE)計(jì)算簡(jiǎn)單、效率高,且具有一定的抗干擾能力,在齒輪故障診斷中有一定的應(yīng)用[11-13];然而,上述方法只能檢測(cè)時(shí)間序列信號(hào)在單一尺度上的復(fù)雜性,而多尺度熵(Multiscale Entropy,ME)能衡量時(shí)間序列信號(hào)在不同尺度下的復(fù)雜性[14-15],其中多尺度排列熵(Multiscale Permutation Entropy,MPE)模型在滾動(dòng)軸承信號(hào)特征提取中的效果較好[16-17]。
在故障識(shí)別方面,GK(Gustafson-Kessel)和GG(Gath-Geva)聚類算法比較常用,但均需要事先劃分聚類數(shù)目[18-22];CFS(Clustering by Fast Search)聚類算法[23]簡(jiǎn)單明快,其根據(jù)數(shù)據(jù)點(diǎn)的局部密度和截?cái)嗑嚯x對(duì)具有跳躍性的數(shù)據(jù)點(diǎn)進(jìn)行聚類中心點(diǎn)的選定,不需要聚類數(shù)目的劃分。
綜上所述,雖然ME可獲得多尺度的信息,但卻存在數(shù)據(jù)維數(shù)高,無法可視化等問題,可采用主成分分析法(Principal Component Analysis,PCA)進(jìn)行數(shù)據(jù)降維,從而作為CFS的輸入。因此,將多尺度基本熵(Multiscale Base-scale Entropy,MBSE)與CFS聚類算法結(jié)合,嘗試用于滾動(dòng)軸承的故障診斷。
BSE的計(jì)算步驟如下:
1)對(duì)于一個(gè)給定數(shù)據(jù)長(zhǎng)度的時(shí)間序列u()i(1≤i≤N),數(shù)據(jù)集 Xmi(1≤i≤N-m+1)需進(jìn)行如下重構(gòu)
3)對(duì)得到的BS值進(jìn)行符號(hào)劃分,將轉(zhuǎn)變?yōu)榉?hào)序列 Si(X(i))={s(i),…,s(i+m-1)},s∈ A(1,2,3,4),轉(zhuǎn)換方式為
4)統(tǒng)計(jì)符號(hào)序列Si的概率分布情況P(π),由于Si(X(i))由m維時(shí)間序列Xmi形成,且存在4種符號(hào),所以共有4m種不同組合狀態(tài)π,則統(tǒng)計(jì)概率 P(π)為
5)計(jì)算BSE,其計(jì)算式為
BSE確定的是時(shí)間序列在單一尺度上的復(fù)雜度和無規(guī)則程度,MBSE反映的則是時(shí)間序列在不同尺度下的復(fù)雜性程度,其定義為時(shí)間序列在不同尺度下的BSE,其中多尺度通過粗?;^程獲得,具體的計(jì)算步驟如下:
1)對(duì)于原始數(shù)據(jù)Xmi,建立新的粗粒向量為
式中:τ為尺度因子(τ=1,2,…),若 τ=1則為原始數(shù)據(jù);M為樣本總數(shù)。對(duì)于非零原始序列Xmi,其被分為τ個(gè)每段長(zhǎng)M/τ的粗粒序列yj(τ)。
2)分別計(jì)算τ個(gè)粗粒序列為yj(τ)的 BSE,形成MBSE。
MBSE模型提取的信號(hào)維度較高,存在數(shù)據(jù)冗余、計(jì)算效率低、無法可視化等問題,而PCA可以抽取數(shù)據(jù)的主要成分,對(duì)特征向量進(jìn)行降維以作為CFS聚類算法的輸入。
對(duì)于一個(gè)給定的MBSE或MPE矩陣X=[x1,x2,…,xN],其中N為樣本數(shù)量,n為樣本的維數(shù),且滿足n<N。其計(jì)算步驟為:
3)使用奇異值方法分解協(xié)方差矩陣,則Rx=ATΛA,ATA=AAT=I。A=[A1,A2,…,An]T為矩陣X對(duì)應(yīng)的特征值矩陣,其中Λ=diag(λ1,λ2,…,λn),是矩陣A按照降序排列的對(duì)角矩陣。
4)使用累積貢獻(xiàn)率θk確定X的主要成分個(gè)數(shù),即
式中:θk為從第1到第k個(gè)主要成分的百分比。
CFS聚類算法的核心思想在于對(duì)聚類中心的刻畫上,聚類中心點(diǎn)的特點(diǎn)為:1)自身密度大,即被密度均不超過自己的近鄰數(shù)據(jù)點(diǎn)包圍;2)與其他密度更大數(shù)據(jù)點(diǎn)之間的距離更大。
CFS聚類的詳細(xì)計(jì)算過程[23]如下:
1)設(shè)具有N個(gè)數(shù)據(jù)點(diǎn)的數(shù)據(jù)集合X={x1,x2,…,xN},該集合中的任何數(shù)據(jù)點(diǎn)xi與xj之間的距離為
式中:當(dāng)xi具有最大局部密度時(shí),δi表示數(shù)據(jù)集合X中與數(shù)據(jù)點(diǎn)xi距離最大的數(shù)據(jù)點(diǎn)與xi之間的距離;否則δi表示在所有局部密度大于xi的數(shù)據(jù)點(diǎn)中與xi距離最小數(shù)據(jù)點(diǎn)之間的距離。
4)計(jì)算每個(gè)數(shù)據(jù)點(diǎn)的γ值并進(jìn)行降序排列
5)根據(jù)γ確定其聚類中心,γi越大表示成為聚類中心點(diǎn)的可能性越大。故對(duì)γ進(jìn)行降序排列,依次選取γ較大且具有跳躍性的數(shù)據(jù)點(diǎn)作為聚類中心點(diǎn),即聚類中心點(diǎn)過渡到非聚類中心點(diǎn)時(shí)γ值具有明顯的跳躍性。
6)統(tǒng)計(jì)每個(gè)數(shù)據(jù)點(diǎn)與聚類中心的距離小于截?cái)嗑嚯xdc的個(gè)數(shù)(即ρi),從而實(shí)現(xiàn)分類。
試驗(yàn)軸承為6205-2RS JEM-SKF深溝球軸承,使用電火花技術(shù)分別在軸承內(nèi)圈、外圈、球上設(shè)置單點(diǎn)故障[24]。本試驗(yàn)選用的故障直徑為0.177 8 mm,電動(dòng)機(jī)功率為1 496W,轉(zhuǎn)速為1 750 r/min,采樣頻率為12 kHz。在此情況下采集到正常(NR),內(nèi)圈故障(IRF),外圈故障(ORF)和球故障(BF)4種狀態(tài)的振動(dòng)信號(hào)。
BSE:嵌入維數(shù) m的取值范圍一般為3~7[11-13],且要滿足 4m≤ N條件(N為序列的長(zhǎng)度);參數(shù) a一般取值為0.1~0.4[11-13];根據(jù)軸承振動(dòng)信號(hào)的特性,選擇m=4,a取值為0.2或0.3。
MBSE:尺度因子 τ一般設(shè)置為 20[15-17],振動(dòng)信號(hào)的長(zhǎng)度統(tǒng)一取為N=2 048。
CFS:需選取一個(gè)階段距離參數(shù)dc,使得每個(gè)數(shù)據(jù)點(diǎn)的平均近鄰數(shù)據(jù)點(diǎn)(即距離不超過dc的數(shù)據(jù)點(diǎn))約占數(shù)據(jù)點(diǎn)總數(shù)的1%~2%。dc設(shè)置太大,會(huì)使每個(gè)數(shù)據(jù)點(diǎn)xi的局部密度數(shù)值ρi較大,導(dǎo)致區(qū)分度不高;若dc設(shè)置過小,則會(huì)導(dǎo)致同一個(gè)簇類被拆分成多個(gè)[23]。綜合考慮,設(shè)置dc為比例k/M=1.5%情況下的數(shù)值。
試驗(yàn)流程如圖1所示,主要步驟為:
圖1 試驗(yàn)流程Fig.1 Experimental flow chart
1)預(yù)先設(shè)置模型的參數(shù);
2)使用MBSE模型對(duì)采集的振動(dòng)信號(hào)進(jìn)行多尺度分解,得到不同尺度因子下的MBSE值;
3)統(tǒng)計(jì)MBSE的計(jì)算總時(shí)間和平均時(shí)間,進(jìn)行計(jì)算效率對(duì)比;
4)使用PCA方法進(jìn)行數(shù)據(jù)降維,選擇(9)式中的參數(shù)k=2時(shí)的主要成分作為CFS聚類模型的輸入;
5)與MPE模型進(jìn)行對(duì)比分析。
對(duì)采集到4種狀態(tài)的實(shí)際振動(dòng)信號(hào)進(jìn)行編號(hào):NR為 1~50,IRF為51~100,BF為 101~150,ORF為151~200。每種狀態(tài)下振動(dòng)信號(hào)某一樣本的幅值如圖2所示。從圖中可以看出:NR和BF的信號(hào)沒有明顯的周期性,這是由于NR和BF振動(dòng)信號(hào)的隨機(jī)性較強(qiáng),故兩者的自相似性較低,兩者難以區(qū)分;IRF和ORF信號(hào)具有較為明顯的振動(dòng)規(guī)律,這是由于兩者的自相似性較高,特別是內(nèi)圈固定、外圈轉(zhuǎn)動(dòng)時(shí)的振動(dòng)規(guī)律更加明顯,但這2種信號(hào)的振動(dòng)規(guī)律相似,也難以區(qū)分。
圖2 軸承不同故障狀態(tài)下的振動(dòng)信號(hào)Fig.2 Vibration signals of rolling bearing under different faults
為準(zhǔn)確進(jìn)行故障識(shí)別,需進(jìn)一步提取信號(hào)的特征向量,根據(jù)預(yù)先設(shè)置的參數(shù),使用MPE/MBSE模型對(duì)實(shí)際振動(dòng)信號(hào)進(jìn)行多尺度分解,得到的不同尺度因子下的熵值,如圖3所示。
圖3 多尺度分解結(jié)果Fig.3 Multi-scale decomposition results
從圖3中可以看出,MBSE與MPE值整體上呈現(xiàn)減小的趨勢(shì),因?yàn)檎駝?dòng)信號(hào)在分解之后,頻率依此從高到低,故呈現(xiàn)減小趨勢(shì),表明其信息主要包含在尺度因子較小的MBSE與MPE值中。經(jīng)過統(tǒng)計(jì)得到:MBSE模型計(jì)算用時(shí)22.219 8 s,MPE模型計(jì)算用時(shí)38.246 7 s,即MBSE模型的計(jì)算效率較高。主要原因是由于PE模型在統(tǒng)計(jì)每種符號(hào)序列出現(xiàn)的概率前需要對(duì)N-m+1個(gè)m維矢量進(jìn)行升序排序[9-10],但 BSE模型在統(tǒng)計(jì)概率P(π)前只需要計(jì)算相鄰點(diǎn)數(shù)間隔的差值方均根值,不需要進(jìn)行復(fù)雜的排序運(yùn)算[11-13];另外,在劃分到多尺度上時(shí),需要計(jì)算尺度從1~20情況下的PE/BSE值,會(huì)加大MPE/MBSE模型的計(jì)算時(shí)間落差。
由于上述熵值特征矩陣的維度為20,在進(jìn)行故障識(shí)別時(shí)會(huì)造成數(shù)據(jù)不易可視化和信息冗余等問題。故使用PCA模型進(jìn)行降維,根據(jù)(9)式計(jì)算所得的累計(jì)貢獻(xiàn)率結(jié)果見表1,表中λ1與λ2代表原始數(shù)據(jù)經(jīng)過PCA降維后第1~2個(gè)特征數(shù)值。由表可知,前2個(gè)特征數(shù)值之和約占總特征數(shù)值的80%左右,這是由于特征數(shù)值在計(jì)算過程中按降序排列,故λ1與λ2基本包含了信號(hào)的大部分信息,可選作故障特征向量。
表1 累計(jì)貢獻(xiàn)率θ隨k的數(shù)值變化表Tab.1 The value of θ changes with k
隨后使用CFS模型對(duì)故障特征向量進(jìn)行聚類,依據(jù)(11)~(13)式計(jì)算得到200個(gè)樣本的的聚類中心點(diǎn)的局部密度ρ、距離δ以及γ,結(jié)果如圖4和圖5所示。
圖4 局部密度ρ與距離δFig.4 Local density ρ and distance δ
圖5 樣本點(diǎn)的γ值Fig.5 Sample point of γ
從圖中可以看出:1)聚類中心點(diǎn)的局部密度ρ與距離δ的數(shù)值明顯大于非聚類中心點(diǎn);2)聚類中心點(diǎn)的γ整體上明顯大于非聚類中心點(diǎn)。
其中,γ最小為0.818 4,最大為8.851 4,而非聚類中心點(diǎn)的γ數(shù)值幾乎為0,其原因如下:
1)對(duì)于聚類中心點(diǎn)而言,利用(10)式計(jì)算任意樣本之間的距離時(shí),聚類中心點(diǎn)之間的距離最大,而(11)式為ρ的減函數(shù),即計(jì)算所有樣本的局部密度ρ時(shí),聚類中心點(diǎn)之間的距離是最大。設(shè)置的階段距離為1.5%,因此(11)式中的 -(dij/dc)2較小,局部密度數(shù)值ρ偏大,非聚類中心點(diǎn)的局部密度ρ與距離δ數(shù)值接近于0,與圖4的結(jié)果相符。
2)利用(13)式計(jì)算γ時(shí),由于聚類中心點(diǎn)的局部密度ρ與距離δ遠(yuǎn)大于非聚類中心點(diǎn),故得到的γ也大于非聚類中心點(diǎn)。而且圖中的聚類中心點(diǎn)具有明顯的跳躍性,而非聚類中心點(diǎn)則無此特點(diǎn),說明應(yīng)該選擇γ數(shù)值較大且有跳躍性這些數(shù)據(jù)點(diǎn)作為聚類中心點(diǎn)。最后的2維聚類結(jié)果如圖6所示,從圖中可以看出,4種故障狀態(tài)得到了較好的區(qū)分,各樣本點(diǎn)之間幾乎沒有重疊現(xiàn)象,聚類中心點(diǎn)被周圍樣本點(diǎn)圍繞的密度較大,中心點(diǎn)相互之間的距離也較大。且樣本點(diǎn)與其他中心點(diǎn)之間的距離比與自身中心點(diǎn)之間的距離大,統(tǒng)計(jì)數(shù)據(jù)也表明,CFS模型對(duì)試驗(yàn)信號(hào)的區(qū)分程度近似100%,具有較好的區(qū)分效果。
圖6 2維聚類結(jié)果Fig.6 The 2D clustering results
提出了一種MBSE與CFS相結(jié)合的故障診斷方法,并將其應(yīng)用于滾動(dòng)軸承的故障診斷。與MPE模型相比,使用MBSE模型對(duì)軸承振動(dòng)信號(hào)進(jìn)行特征提取的計(jì)算效率更高,而通過選用不同故障尺寸的軸承樣本數(shù)據(jù)進(jìn)行試驗(yàn),表明經(jīng)過PCA降維處理后,CFS聚類算法可對(duì)不同故障類型進(jìn)行有效的區(qū)分。
但也存在不足之處,如CFS聚類算法在選擇聚類中心點(diǎn)時(shí)選擇局部密度ρ與距離δ的乘積作為標(biāo)準(zhǔn),雖然綜合考慮了這2個(gè)參數(shù),但兩者的數(shù)值可能處于不同數(shù)量級(jí),是否能通過其他方式綜合考慮這2個(gè)參數(shù),更好的選擇聚類中心抉擇則需要進(jìn)行更深入的研究。