劉 文 周智勇 蔡 巍 楊理華
(海軍潛艇學(xué)院 青島 266000)
異步電動(dòng)機(jī)故障類型主要包括軸承故障、定子匝間短路、轉(zhuǎn)子斷條和氣隙偏心等。其中,軸承故障占比最高,約占異步電動(dòng)機(jī)故障統(tǒng)計(jì)的40%~50%。因此對(duì)異步電動(dòng)機(jī)的軸承實(shí)施故障診斷具有重要的現(xiàn)實(shí)意義。
傳統(tǒng)的軸承故障診斷方法主要是依靠故障特征頻率進(jìn)行判斷,但易受到其他高頻信號(hào)干擾,對(duì)使用環(huán)境有一定限制。近年來(lái),數(shù)據(jù)驅(qū)動(dòng)技術(shù)的發(fā)展,為電機(jī)軸承故障診斷提供了新思路,即通過(guò)電動(dòng)機(jī)的運(yùn)行數(shù)據(jù)分析軸承狀態(tài),而運(yùn)行數(shù)據(jù)的特征選擇正是該類診斷算法的核心內(nèi)容。適當(dāng)?shù)奶卣鬟x擇算法能夠?qū)Ω呔S故障特征集進(jìn)行有效降維,篩選得到與電機(jī)狀態(tài)高度相關(guān)的特征集,從而大幅降低故障診斷算法運(yùn)行時(shí)間。
本文通過(guò)引入信息論中互信息的基本概念,以運(yùn)行數(shù)據(jù)統(tǒng)計(jì)量與設(shè)備狀態(tài)的互信息為評(píng)價(jià)準(zhǔn)則,提出基于異步電動(dòng)機(jī)振動(dòng)信號(hào)的軸承故障特征選擇算法。試驗(yàn)表明:該算法能夠在降維條件下,有效篩選數(shù)據(jù)特征集,提高診斷效率。
互信息以信息論為背景,能夠衡量?jī)蓚€(gè)變量的相互依賴程度,表示兩個(gè)變量間共同擁有信息的含量[1]。下面對(duì)基于互信息的特征選擇算法涉及基本概念進(jìn)行介紹。
概念1信息熵。信息熵是通過(guò)統(tǒng)計(jì)學(xué)的方法,反映隨機(jī)變量?jī)?nèi)部不確定程度的量,體現(xiàn)隨機(jī)變量所蘊(yùn)含信息量的大小。假設(shè)X={x1,x2,…,xn} 為一個(gè)隨機(jī)變量,則其信息熵H(X)表達(dá)式為
其中,p(xi)為xi發(fā)生概率。
p(xi)在極限情況下,當(dāng)隨機(jī)變量X中的變量均為x 時(shí),p(xi)=1。此時(shí)信息熵H(X)=0,表明樣本集包含的信息量為零。
概念2條件熵。條件熵H(X|Y)表示在給定Y變量的條件下X變量的不確定程度,定義如下:
概念3互信息。對(duì)于兩個(gè)隨機(jī)變量X、Y,它們的互信息定義如下:
互信息還可以表示為
I(X;Y)=H(Y)-H(Y|X)
當(dāng)X 與Y 相互獨(dú)立時(shí),則H(Y|X)與H(Y)相等,此時(shí)I(X;Y)=0。
概念4相關(guān)性。假設(shè)Xm為待選特征集合,C為類標(biāo)簽集合。相關(guān)性用于表征特征集中的特征與標(biāo)簽集中的標(biāo)簽的關(guān)聯(lián)程度,通過(guò)互信息I(Xm;C)直觀體現(xiàn)。I(Xm;C)越大,則特征向量與類標(biāo)簽關(guān)聯(lián)度越高。
概念5冗余性。假設(shè)S 為已選擇的特征集合,則冗余性表示待選的特征向量與S 的相關(guān)性,同樣以互信息為衡量標(biāo)準(zhǔn)。
數(shù)據(jù)驅(qū)動(dòng)算法,是由電動(dòng)機(jī)運(yùn)行原始數(shù)據(jù)提取的統(tǒng)計(jì)特征,反映設(shè)備運(yùn)行狀態(tài)。對(duì)應(yīng)不同故障類別時(shí),可將其特征劃分為強(qiáng)相關(guān)性特征、無(wú)關(guān)特征和冗余特征[2]。依據(jù)數(shù)據(jù)特征進(jìn)行故障診斷時(shí),高維數(shù)據(jù)特征集可以提高故障診斷的識(shí)別能力,但同時(shí)不可避免引入的計(jì)算冗余和非顯著信息,會(huì)降低后驗(yàn)故障檢測(cè)和識(shí)別性能。因此,在數(shù)據(jù)驅(qū)動(dòng)算法中進(jìn)行特征選擇,其目的就是要按照某種評(píng)價(jià)原則,篩選出最具有代表性的特征量,排除無(wú)關(guān)特征和冗余特征,降低特征集維度,避免出現(xiàn)故障檢測(cè)效率低下和結(jié)果過(guò)擬合等問(wèn)題。數(shù)據(jù)特征選擇的基本流程參見(jiàn)圖1。
圖1 數(shù)據(jù)特征選擇的基本流程圖
特征選擇即是在原有特征集中,篩選出強(qiáng)相關(guān)性的特征,形成一個(gè)新的集合,降低特征集維度,但又不過(guò)分減少信息量。數(shù)據(jù)特征選擇的選擇過(guò)程是通過(guò)評(píng)價(jià)準(zhǔn)則來(lái)實(shí)現(xiàn)的,目前主要有主元分析法(Principle Component Analysis,PCA)、線性判別分析法(Linear Discriminate Analysis,LDA)等,但PCA不適用于處理非線性關(guān)系,LDA則會(huì)產(chǎn)生新的特征量,可解釋性差。而基于互信息的特征選擇算法以互信息為評(píng)價(jià)準(zhǔn)則,能夠衡量變量間的相互依賴程度,提取有效特征,對(duì)非線性問(wèn)題的處理也同樣適用。
基于互信息的特征選擇算法一般是通過(guò)遍歷特征集合,選擇與類標(biāo)簽相關(guān)性最大的特征,形成新的集合,該方法稱為最大互信息算法(Mutual Information Maximum,MIM)。
假設(shè)F為原始特征集合,S為已選特征集合,Xm為待選特征集合,C為標(biāo)簽集,則MIM 的評(píng)價(jià)準(zhǔn)則為
JMIM(F,C)=I(fi;c)
通過(guò)遍歷F,尋找與C相關(guān)度最高的特征向量,放入S中,并從F中刪除;重復(fù)上述過(guò)程,直到找到m個(gè)最優(yōu)特征向量。該方法計(jì)算量小,能夠很好地找到與類標(biāo)簽高度相關(guān)的特征量,但沒(méi)有考慮到已選特征量xs與待選特征量xm之間的相關(guān)性。
基于MIM算法的不足,修改其評(píng)價(jià)準(zhǔn)則為
即得到了最大相關(guān)最小冗余算法[3](Feature selection based on maximum-relevance and minimum-redundancy,mRMR)。
與MIM 算法不同,該方法引入了冗余度的概念,其評(píng)價(jià)準(zhǔn)則分為兩部分,前半部分I(xm;c)為待選擇特征與類標(biāo)簽的相關(guān)性,后半部分為待選擇特征與已選特征間的冗余度。通過(guò)遍歷F,找到與類標(biāo)簽高度相關(guān),同時(shí)與已選擇特征低冗余的特征向量,也即是使評(píng)價(jià)準(zhǔn)則最大化的特征向量,放入S中,并從F中刪除,重復(fù)上述過(guò)程,直到找到m個(gè)最優(yōu)特征向量。mRMR算法流程如圖2所示。
圖2 mRMR算法流程框圖
由圖2可見(jiàn),mRMR 算法在計(jì)算冗余度時(shí)采用加權(quán)的方法,能夠?qū)崿F(xiàn)評(píng)價(jià)準(zhǔn)則的動(dòng)態(tài)調(diào)整,使運(yùn)算結(jié)果更加合理。
當(dāng)異步電動(dòng)機(jī)發(fā)生軸承故障時(shí),其振動(dòng)特性將發(fā)生改變,因此通過(guò)分析電機(jī)振動(dòng)信號(hào)時(shí)域統(tǒng)計(jì)特征量可對(duì)軸承故障進(jìn)行診斷。常用的時(shí)域統(tǒng)計(jì)特征包括方差(Variance,σ2)、均方根(Root mean square,RMS)、偏度(Skewness,Sk)、峰度(Kurtosis,Ku)、最大值(Maximum,Max)等,表1中列舉了本文中使用的13 種時(shí)域統(tǒng)計(jì)量及其計(jì)算公式,它們?cè)诠收显\斷領(lǐng)域中得到廣泛使用[4~5]。
表1 時(shí)域統(tǒng)計(jì)特征及其計(jì)算公式
不同的統(tǒng)計(jì)特征量可以從不同角度反映異步電動(dòng)機(jī)振動(dòng)信號(hào)的變化趨勢(shì),如方差和標(biāo)準(zhǔn)差可以用于描述振動(dòng)信號(hào)數(shù)值的集中和分散程度;均方根可以反映振動(dòng)信號(hào)的有效值;偏度能夠判定振動(dòng)數(shù)據(jù)分布的不對(duì)稱程度及其方向;峰度能夠判定數(shù)據(jù)分布是更陡峭還是平緩。傳統(tǒng)的診斷方法可以根據(jù)某種統(tǒng)計(jì)量的變化程度判別軸承故障,但這種方法比較粗糙,且易受外界環(huán)境因素的影響。通過(guò)基于互信息的特征選擇算法,找到與類標(biāo)簽相關(guān)度最高的那部分統(tǒng)計(jì)量,可以很好地解決該問(wèn)題,且可避免計(jì)算冗余和結(jié)果過(guò)擬合。
對(duì)采集得到的振動(dòng)信號(hào)按照表1中的公式提取13種時(shí)域統(tǒng)計(jì)特征量,形成原始特征集。從表1中可以看出各統(tǒng)計(jì)量的量綱各不相同,在圖3中以Sk1和Ku1為例,描繪了二者的幅值對(duì)比圖,可以明顯看出其幅值大小上存在明顯差異?;谏鲜鰡?wèn)題,在進(jìn)行互信息值計(jì)算前,首先需要對(duì)各統(tǒng)計(jì)量進(jìn)行歸一化處理,以便得出更為準(zhǔn)確的結(jié)論。區(qū)分健康和軸承故障兩種類標(biāo)簽,分別計(jì)算各特征向量與類標(biāo)簽的互信息值。通過(guò)mRMR算法,計(jì)算得到特征量與類標(biāo)簽的相關(guān)度,并依照互信息大小排序。排名越靠前,則代表相關(guān)度越高且具有較低的冗余度。采用排名靠前的特征形成特征集,從而可在低數(shù)據(jù)維度條件下,對(duì)軸承故障進(jìn)行診斷判別。
圖3 Sk1、Ku1 幅值對(duì)比圖
將本文算法在試驗(yàn)平臺(tái)予以驗(yàn)證。試驗(yàn)平臺(tái)主要包括異步電動(dòng)機(jī)、直流發(fā)電機(jī)、電阻負(fù)載箱、信號(hào)采集儀和上位機(jī)等。其中,異步電動(dòng)機(jī)功率為7.5kW,型號(hào)Y132M-4;直流發(fā)電機(jī)與異步電動(dòng)機(jī)同軸連接,作為拖動(dòng)負(fù)載使用;直流發(fā)電機(jī)輸出連接電阻負(fù)載箱,從而實(shí)現(xiàn)功率調(diào)整。試驗(yàn)裝置如圖4所示。
圖4 試驗(yàn)裝置平臺(tái)
為獲取電機(jī)運(yùn)行過(guò)程中的振動(dòng)信號(hào),試驗(yàn)安裝有2 個(gè)LC0104 型振動(dòng)加速度傳感器,量程0~50g。其中,1 號(hào)傳感器布置于故障軸承端的近端蓋基腳位置,2 號(hào)傳感器布置于故障軸承端的端蓋徑向側(cè),如圖5所示。信號(hào)采集和存儲(chǔ)由一臺(tái)16通道信號(hào)采集儀完成,型號(hào)為INV3062A2,采樣頻率10kHz。
圖5 傳感器布置圖
在異步電動(dòng)機(jī)內(nèi)模擬軸承外圈故障,軸承型號(hào)為6308A,在軸承外圈處開(kāi)貫穿型凹槽,開(kāi)槽寬度為5.0mm,深度為1.5mm,如圖6所示。
圖6 故障軸承圖
分別在健康和軸承故障狀態(tài)下,采集2 處測(cè)點(diǎn)的振動(dòng)信號(hào),采集時(shí)間寬度50s,如圖7所示(圖中僅顯示1024個(gè)采樣點(diǎn))。從圖中可以明顯看出,當(dāng)發(fā)生軸承故障時(shí),振動(dòng)信號(hào)幅值明顯增大,且端蓋徑向側(cè)振動(dòng)信號(hào)明顯強(qiáng)于近端蓋基腳位置振動(dòng)信號(hào)。
圖7 振動(dòng)信號(hào)圖
為進(jìn)行對(duì)比分析,首先采用MIM 算法計(jì)算各特征量與類集合C 的互信息值,其排序情況如下式(下標(biāo)代表對(duì)應(yīng)的傳感器代號(hào)):
SRMsf2>RMS2>SD2>SRM2>σ22>Ku1>SD1>RMS1>SRMsf1>RMSsf1>Max2>σ21>SRM1>Max1>IF1>LF2>CF1>LF1>Ku2>Xˉ2>RMSsf2>Sk1>CF2>IF2>Sk2>
經(jīng)過(guò)排序后的特征向量,排名越靠前的特征量與類的相關(guān)度越高。選取SRMsf2、IF1、進(jìn)行對(duì)比分析,如圖8中所示,可以看出三者的數(shù)據(jù)分布存在明顯差異,SRMsf2、IF1具有更好的數(shù)據(jù)集中度,且在健康和軸承故障狀態(tài)下有明顯的區(qū)分度。
圖8 SRMsf2、IF1 與 對(duì)比圖
再使用mRMR 算法對(duì)特征向量與類集合C 的互信息值進(jìn)行計(jì)算,得出排序情況如下:
SRMsf2>SRM2>RMSsf1>Max2>CF1>σ22>RMS2>SD2>SD1>Ku1>LF1>RMS1>IF1>LF2>SRMsf1>Max1>σ21>SRM1>Ku2>Sk1>RMSsf2>CF2>>IF2>Sk2>
通過(guò)對(duì)比mRMR 算法和MIM 算法排序結(jié)果,SRMsf2始終排在所有特征向量的第一位,這說(shuō)明不論MIM 或mRMR 算法,在初次遍歷原始特征集后得到的結(jié)果一致,SRMsf2與類標(biāo)簽的相關(guān)度最高。
結(jié)合MIM 和mRMR 算法的排序結(jié)果也可以看出,在mRMR 算法中,RMS2的排名發(fā)生了明顯的變化。這是因?yàn)?,SRMsf2與RMS2的圖形走勢(shì)幾乎完全一致(參見(jiàn)圖9),其特征量分布情況高度集中,反映其與類標(biāo)簽擁有高相關(guān)度,但同時(shí)也說(shuō)明兩特征間的冗余性很高,即MIM 算法無(wú)法避免數(shù)據(jù)冗余。而mRMR 算法可以有效避免這一問(wèn)題,SRM2因其與SRMsf2冗余度低,且同樣具有較高的類標(biāo)簽相關(guān)度,排名得到提升。
圖9 SRMsf2、RMS2 與SRM2 對(duì)比圖
此外,通過(guò)觀察兩類互相關(guān)算法結(jié)果,端蓋徑向側(cè)的特征向量排名比較靠前,其與類標(biāo)簽相關(guān)度更高,在傳感器布設(shè)數(shù)量受限的條件下,可優(yōu)先考慮在端蓋徑向側(cè)位置布設(shè)振動(dòng)傳感器。
針對(duì)異步電動(dòng)機(jī)軸承故障診斷中對(duì)數(shù)據(jù)降維的需要,從互信息基本概念出發(fā),就其在特征選擇算法中的實(shí)際應(yīng)用進(jìn)行了研究。以異步電動(dòng)機(jī)振動(dòng)時(shí)域信號(hào)的統(tǒng)計(jì)量為樣本,并進(jìn)行歸一化處理。經(jīng)MIM、mRMR 算法排序后的試驗(yàn)結(jié)果表明:MIM算法可以有效區(qū)分?jǐn)?shù)據(jù)樣本與類標(biāo)簽的關(guān)聯(lián)程度,但無(wú)法避免數(shù)據(jù)冗余;而進(jìn)行mRMR 算法排序時(shí),若樣本擁有相似數(shù)據(jù)分布趨勢(shì),則其冗余度較高,算法會(huì)將其推后。因此,mRMR算法中排名靠前的特征量,其與類標(biāo)簽的相關(guān)度高,且特征間的冗余度低。因此,基于互信息的軸承故障特征選擇算法,能夠在異步電動(dòng)機(jī)軸承故障診斷中實(shí)施有效降維,提高計(jì)算效率。