李麗敏 溫宗周 宋玉琴
(西安工程大學(xué)電子信息學(xué)院 西安 710048)
隨著信號(hào)處理技術(shù)在機(jī)械故障診斷領(lǐng)域的應(yīng)用越來(lái)越頻繁,許多隱藏在振動(dòng)信號(hào)中的特征被挖掘出來(lái),為精確地診斷某種機(jī)械故障提供了研究基礎(chǔ)[1~2]。近年來(lái),由信號(hào)處理技術(shù)提取的特征包括時(shí)域特征、頻域特征和時(shí)-頻域特征。時(shí)域特征如偏度、峭度和根均值方差等,可以反映信號(hào)在整個(gè)周期內(nèi)的變化情況[3];頻域特征如傅里葉變換和快速傅里葉變換,能夠獲得振幅譜和功率譜的分析結(jié)果[4];時(shí)頻域特征如小波包能量和希爾伯特邊緣譜能夠在時(shí)域和頻域共同交叉的方面分析信號(hào)[5]。上述特征可以通過(guò)組合為高維特征集合共同決策當(dāng)前的故障類型,能夠提高診斷精度,但由此帶來(lái)的嚴(yán)重問(wèn)題是隨著特征的增多,計(jì)算復(fù)雜度越來(lái)越大,訓(xùn)練分類器的難度增加,而且訓(xùn)練出來(lái)的分類器魯棒性變差。因此目前,怎么樣平衡計(jì)算復(fù)雜度和診斷精度之間的矛盾成為研究熱點(diǎn)。
為了減少計(jì)算復(fù)雜度,傳統(tǒng)的方法是直接減少特征的維數(shù),相關(guān)的方法包括局部線性嵌入(LLE)[6]、局部保留投影(LPP)[7]和主成分分析(PCA)[8]。這些方法通過(guò)空間映射降低特征的維數(shù),但在本源特征集合中,有些特征本身就對(duì)診斷起到相反的作用,對(duì)于得到診斷結(jié)果是不利的,這也會(huì)降低診斷精度,特別是當(dāng)使用支持向量機(jī)方法(SVM)[9]用于機(jī)械故障診斷的分類器時(shí),對(duì)特征的依賴性很強(qiáng),因此特征集合的優(yōu)劣影響SVM分類器的性能。
為了解決上述問(wèn)題,本文從特征集合本身出發(fā),采用基于K 均值聚類[10]的冗余特征剔除方法,將對(duì)診斷作用不大或者相反的特征剔除掉,保留最有利于診斷的那些特征,剔除冗余特征后的特征集合再用于訓(xùn)練分類器時(shí),即能保持原多個(gè)特征用于診斷時(shí)對(duì)精度的提高,同時(shí)能夠降低時(shí)間復(fù)雜度,有效地平衡時(shí)間和精度之間的矛盾。
K 均值聚類能夠?qū)琻 個(gè)數(shù)據(jù)的數(shù)據(jù)集合X={X1,X2,…,Xn}分 割為k 類,其中Xi=(xi,1,xi,2,…,xi,m)表示每個(gè)數(shù)據(jù)被提取了m維特征[11~14]。
K均值聚類的目標(biāo)函數(shù)如下:
式(1)中,U(n*k 維)是由優(yōu)化上述目標(biāo)函數(shù)計(jì)算出的分割矩陣,U 中的元素ui,l=1 表明第i 個(gè)數(shù)據(jù)屬于l 類。 Z={Z1,Z2,…,Zk}是由K 均值聚類計(jì)算出的聚類中心,d(xi,j,zl,j)是第i 個(gè)數(shù)據(jù)和第j 個(gè)數(shù)據(jù)之間的距離,可由式(2)計(jì)算得出。
式(1)的約束條件為式(3)。
式(3)的約束條件指數(shù)據(jù)集X 中的每個(gè)數(shù)據(jù)只能歸屬于1 類。優(yōu)化式(1)的目的是通過(guò)最小化目標(biāo)函數(shù)P求解出U和Z。
為了計(jì)算出每個(gè)特征的權(quán)值,本文中,在K 均值聚類的目標(biāo)函數(shù)P 中加入了這個(gè)權(quán)值W,因此獲得了一個(gè)新的K均值目標(biāo)函數(shù):
其中β 為ωj的系數(shù)。
通過(guò)式(4),可以計(jì)算出K 均值聚類出的每個(gè)特征的權(quán)重。
通過(guò)K 均值聚類方法獲取到所有特征的權(quán)值后,剔除冗余特征的步驟如下:
1)設(shè)置權(quán)值閾值η;
2)將求出的每個(gè)權(quán)值wi(1 ≤i ≤m)與設(shè)置的閾值η 比較;
3)如果wi≤η,則剔除該特征;
4)如果wi>η,保留該特征;
5)將數(shù)據(jù)集合按照保留下來(lái)的特征重新組合。
SVM 的基本思想是通過(guò)非線性變化將數(shù)據(jù)從原始空間映射到高維特征空間,從而找到最優(yōu)的分割超平面,該超平面擁有最大的邊界從而將數(shù)據(jù)集合進(jìn)行分類。一般的SVM 分類器主要用于1 對(duì)1或者1 對(duì)多的分類情況,但現(xiàn)實(shí)情況是,同一條件下可能有各種故障都需要分類出來(lái),因此本文針對(duì)該種情況,選擇1 對(duì)多的分類器。具體操作步驟如下:
1)采集機(jī)械設(shè)備的振動(dòng)信號(hào),提取特征,按照序列排序;
2)從上述信號(hào)中取部分信號(hào)xi(xi∈RD,i=1,2,…,l)作為訓(xùn)練樣本,同時(shí)為這些樣本設(shè)置訓(xùn)練標(biāo)簽;將xi和yi輸入給SVM 的目標(biāo)函數(shù),如式(5)所示。
通過(guò)解式(5),可以獲得權(quán)值ω ∈Rn,b ∈R,松弛變量ξi和懲罰因子C。
上述函數(shù)的約束函數(shù)如式(6)所示。
由此,xi被映射到高維的特征空間,在這個(gè)特征空間中,找到優(yōu)化的分類超平面,決策函數(shù)如式(7)所示。
3)該函數(shù)設(shè)置的初衷是用于二分類的,因此當(dāng)用于K 分類時(shí),具體做法是將K 個(gè)二分分類器組合起來(lái)。
為驗(yàn)證本文方法的有效性,利用凱斯西儲(chǔ)大學(xué)軸承實(shí)驗(yàn)室的實(shí)驗(yàn)數(shù)據(jù)作為測(cè)試數(shù)據(jù)[15]。選擇軸承的型號(hào)為6203-2RS JEM SKF,選取其中的正常狀態(tài)、內(nèi)圈故障和外圈故障的振動(dòng)加速度數(shù)據(jù),這些數(shù)據(jù)采集于電機(jī)運(yùn)行于1797r/s 的速度下,內(nèi)圈故障和外圈故障的損失程度為0.1778mm,采樣頻率為12kHz,如圖1所示,為本文選取的三組測(cè)試數(shù)據(jù)原始采樣值的曲線,橫坐標(biāo)(Sample point)表示采樣點(diǎn),縱坐標(biāo)(Amplitude)表示每個(gè)采樣點(diǎn)的振動(dòng)幅值。
圖1 三組用于測(cè)試的振動(dòng)加速度原始信號(hào)曲線
對(duì)三種原始振動(dòng)信號(hào)分別提取了32 種特征,這些特征既包含時(shí)域特征、頻域特征,還包含時(shí)頻域混合特征,利用第2 節(jié)中所述方法,計(jì)算出每種特征用于3分類時(shí)的權(quán)值,即貢獻(xiàn)率,結(jié)果如下:
根據(jù)上述計(jì)算出的權(quán)值,當(dāng)分別將閾值設(shè)置為 η(1)=4.9386e-06 ,η(2)=5.6806e-05 ,η(3)=0.0002,和η(4)=0.0034 時(shí),會(huì)分別剔除掉2 個(gè)、7個(gè)、12個(gè)和22個(gè)冗余特征,則剩余有用特征分別為30 維、25 維、20 維和10 維。為比較本文方法與一般的LLE、LPP 和PCA 方法的性能,對(duì)相同的振動(dòng)數(shù)據(jù)的32 維特征,利用上述三種方法也分別選擇出30維、25維、20維和10維特征。
利用SVM 多分類器對(duì)每種故障的100 個(gè)多維故障數(shù)據(jù)樣本進(jìn)行訓(xùn)練,得到多分類器;將三種類型數(shù)據(jù)的50 個(gè)樣本點(diǎn)混合后輸入給訓(xùn)練好的SVM多分類器中,觀察診斷誤差和診斷所需時(shí)間。如圖2所示為本文方法剔除冗余特征后,剩余25維特征時(shí),與利用LLE、LPP和PCA提取25維特征后,進(jìn)行多分類的結(jié)果,從圖中可以直觀看出,本文方法在對(duì)正常、軸承內(nèi)圈故障和軸承外圈故障進(jìn)行分類時(shí),分錯(cuò)的數(shù)據(jù)點(diǎn)僅有1 個(gè),說(shuō)明本文方法優(yōu)于其他三種方法。
圖2 本文方法與LLE、LPP和PCA方法在降維后利用同一多分類器進(jìn)行故障診斷的性能比較
為全面驗(yàn)證,其他相關(guān)實(shí)驗(yàn)開(kāi)展了對(duì)30 維、20維和10 維特征下故障診斷性能的比較,比較結(jié)果如表1所示。
表1 本文方法與LLE、LPP和PCA方法在分類準(zhǔn)確率性能方面的比較
表1 所示,本文方法在4 種維度下,采用SVM多分類器診斷的結(jié)果表明,本文方法的診斷準(zhǔn)確率均高于其他三種方法,甚至在利用本文方法將特征維數(shù)降低到10 維后,其診斷準(zhǔn)確率仍高于其他三種方法,從而驗(yàn)證了本文所提方法的有效性。為驗(yàn)證本文方法在解決時(shí)間復(fù)雜度和診斷準(zhǔn)確率之間的矛盾所做工作的有效性,冗余特征剔除后,進(jìn)行SVM 多分類時(shí),記錄了其運(yùn)行時(shí)間。前提條件為,采用計(jì)算機(jī)主機(jī)頻率為2.5GHz。比較結(jié)果如表2所示,很明顯維度越低,時(shí)間耗費(fèi)越小,32 維和10維之間時(shí)間消耗相差約4倍。
表2 時(shí)間復(fù)雜度性能比較
綜合分析表1和表2的結(jié)果,可以總結(jié)出,基于K 均值聚類方法的冗余特征剔除方法,當(dāng)采用SVM多分類器進(jìn)行故障診斷時(shí),診斷準(zhǔn)確率優(yōu)于PCA、LPP和PCA 方法,同時(shí)冗余特征剔除帶來(lái)的最直觀的性能提升是時(shí)間復(fù)雜度大大降低,但沒(méi)有影響診斷準(zhǔn)確率,因此本文達(dá)到了平衡時(shí)間復(fù)雜度和診斷準(zhǔn)確率之間的矛盾的目的。
本文提出了一種基于優(yōu)化K 均值聚類的冗余故障特征剔除方法,針對(duì)旋轉(zhuǎn)機(jī)械的軸承故障診斷,有效地解決了多維特征造成的時(shí)間復(fù)雜度高的問(wèn)題,同時(shí)通過(guò)與其他常用三種方法比較發(fā)現(xiàn),本文方法并沒(méi)有降低診斷準(zhǔn)確率。通過(guò)對(duì)凱斯西儲(chǔ)大學(xué)軸承實(shí)驗(yàn)室的測(cè)試數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證,結(jié)果表明本文方法有效地改善了多維特征用于診斷時(shí),時(shí)間復(fù)雜度和診斷準(zhǔn)確率之間的矛盾,為信號(hào)處理技術(shù)更好的服務(wù)于機(jī)械故障診斷領(lǐng)域提供重要參考。