呂維宗 王海瑞 舒 捷
(昆明理工大學(xué)信息工程與自動化學(xué)院 云南 昆明 650500)
由于工業(yè)生產(chǎn)的不斷發(fā)展,大型復(fù)雜機械設(shè)備安全可靠的運轉(zhuǎn)引起了社會的逐漸重視,相關(guān)故障診斷技術(shù)也得到了迅猛的進展。滾動軸承是大型機械設(shè)備的關(guān)鍵組成部分,因此大型機械滾動軸承的故障特征診斷相關(guān)技術(shù)有著十分重要的作用,而這是屬于模式識別方面的問題。平時高負荷運轉(zhuǎn)時產(chǎn)生的安全故障,安裝、拆卸等多種情況下都會產(chǎn)生故障。所以,滾動軸承運作、維護等工作及其相關(guān)故障的診斷工作顯得尤為重要。故障主要包括外圈出現(xiàn)裂紋、內(nèi)圈點蝕、滾動體點蝕三類[1]。而以上故障是很多因素共同作用所導(dǎo)致的,但是故障及其成因并不是一一對應(yīng),且往往對應(yīng)關(guān)系較為復(fù)雜。目前復(fù)雜機械設(shè)備故障診斷的方法中,人工神經(jīng)網(wǎng)絡(luò)和模糊綜合評價法等較為常見[2-6]。后者在體現(xiàn)模糊觀點方面效果十分突出,缺點是它設(shè)定評價因子的權(quán)重時要不斷地依賴有關(guān)專家的以往經(jīng)驗,進而導(dǎo)致上述結(jié)果將產(chǎn)生一定程度的偏差。人工神經(jīng)網(wǎng)絡(luò)更擅長自學(xué)和對任何非線性函數(shù)有更好的逼近,并且更為形象地擬構(gòu)了人類腦神經(jīng)系統(tǒng)方面的物理結(jié)構(gòu)以及多種多樣的網(wǎng)絡(luò)結(jié)構(gòu),但其在呈現(xiàn)模糊信息方面的表現(xiàn)不好,甚至相對較差[7-9]。
大型機械故障狀態(tài)下的訓(xùn)練樣本的獲得,是一件非常不易的工作。原因是實際過程中能訓(xùn)練的樣本并不多,這就導(dǎo)致很難展開一系列的訓(xùn)練,這時便有處于故障隱患樣本數(shù)據(jù)出現(xiàn)。進行識別時選取分類器必須以這種樣本數(shù)據(jù)特征來著重注意是否能對小樣本展開明確分類,并且得到的分類結(jié)果有著較高的不定性。針對上述情況,文獻[10-11]運用SVM方法將故障數(shù)據(jù)進行高維投影以達到確定故障產(chǎn)生的原因,且準(zhǔn)確率較高。
綜上所述,本文把諧波小波包和改進自適應(yīng)遺傳算法的SVM相結(jié)合,將滾動軸承數(shù)據(jù)用諧波小波包分解后便可知各頻段的小波分解系數(shù),獲得的特征能量做相應(yīng)的歸一化處理后成為特征向量。把上述向量輸入到SVM模型并展開訓(xùn)練,此時再將SVM的參數(shù)通過IAGA去優(yōu)化,進而對搗固車滾動軸承故障類型進行診斷[12]。通過與其他方法對比可知此模型效率更高且更加準(zhǔn)確。
支持向量機是將有關(guān)統(tǒng)計學(xué)習(xí)的方法和結(jié)構(gòu)風(fēng)險的理論兩者結(jié)合的方法,其處理小樣本、非線性和高維的模式識別時便突顯出優(yōu)勢[13]。它可以從有限的樣本信息中學(xué)習(xí)并獲取訓(xùn)練樣本特征并展開相關(guān)預(yù)測,所以得出的結(jié)果往往有著很強的泛化能力,在處理過學(xué)習(xí)問題時,是神經(jīng)網(wǎng)絡(luò)所不能比擬的。
支持向量分類機運用支持向量機模型與復(fù)雜變換非線性相結(jié)合,對低維數(shù)據(jù)進行高維空間投影并在高維空間中產(chǎn)生最優(yōu)分類面。SVM的核心就是將結(jié)構(gòu)風(fēng)險最小化的思想在分類領(lǐng)域中得以體現(xiàn)。處理線性可分的相關(guān)分類問題時,SVM可以尋出符合條件的最優(yōu)超平面,分類結(jié)果距離分類界面要遠,也就是空白區(qū)域最大,如圖1所示。
圖1 SVM的最優(yōu)分界面
圖中圓圈和方塊分別為兩類樣本,實線為樣本分類線。兩條虛線是穿過全部樣本里距離分類線最近的樣本點,由此可知,不僅要使兩條虛線間的空白區(qū)域最大,同時還必須使兩類樣本能被分類樣本準(zhǔn)確區(qū)分出來。這里,ω·xi+b=0代表分類線,經(jīng)歸一化處理后,其對線性可分樣本集(xi,yi),i=1,2,…,l,x∈Rd,y∈{1,-1},滿足:
(1)
s.t.yi[(ω·xi)+b]≥1i=1,2,…,l
(2)
s.t.yi[(ω·xi)+b]≥1-ξii=1,2,…,l
ξi≥0i=1,…,l
式中:C>0為懲罰系數(shù)。因為往往不能找到超平面,所以只要用可以準(zhǔn)確劃分樣本的所有超曲面中最優(yōu)的那個來頂替超平面。但是因為超曲面并不像超平面那樣存在可以間隔的特點,要找出來符合條件的超曲面的難度也比較大。因此在此類最優(yōu)求解中添加能將數(shù)據(jù)從低維映射到高維特征空間的核函數(shù)K(x,x′),再展開線性分析,便可篩選懲罰系數(shù)C>0。以下為最優(yōu)求解模型:
(3)
式中:αi、αj為拉格朗日乘子,K(x,xi)為滿足Mercer條件的核函數(shù)。
由此可求得分類決策函數(shù)為:
(4)
本文采用基于“一對多”算法的多值分類SVM模型,其基本思想是:對N類分類問題建立N個SVM,在每個類和余下其他類之間訓(xùn)練1個SVM將彼此分開。整個過程中測試樣本通過所在分類器識別失敗時就要再依次通過接下來的分類器,重復(fù)整個過程尋找出可以將故障識別出來的分類器并輸出診斷結(jié)果。
由于核函數(shù)對SVM來說非常關(guān)鍵,因此支持向量機的核函數(shù)及參數(shù)選擇不同時會造成相關(guān)性能有著較大差別[14]。核函數(shù)構(gòu)造的合理程度會對支持向量機的分類泛化性能有著很大的影響。所以在此所用的徑向基核函數(shù)有助于故障分類準(zhǔn)確度的提升。在最優(yōu)求解中添加可以將數(shù)據(jù)從低維特征空間映射到高維特征空間的核函數(shù):
(5)
用K(x,x′)代替式(4)中的K(x,xi),此時支持向量機分類決策函數(shù)如下式:
(6)
遺傳算法把解空間用相關(guān)編碼變換成相關(guān)染色體空間,把決策變量也隨之變成某一結(jié)構(gòu)的染色體個體并構(gòu)成群體,此群體經(jīng)選擇、交叉及變異之后從中篩取高適應(yīng)度部分用來產(chǎn)生下代個體,再組成下代的群體[15]。滿足終止條件后遺傳尋優(yōu)過程結(jié)束,從而得到適應(yīng)度最佳的個體,整個流程如圖2所示。
圖2 遺傳算法處理流程
這里所涉及的交叉概率及變異概率大多是不變的,而次優(yōu)解使得到最優(yōu)解的時間加長。一旦遺傳算法出現(xiàn)局部最優(yōu)或全局最優(yōu)時,隨著交叉及變異概率的上升也將導(dǎo)致近似的最優(yōu)解有一定損失[16]。上述原因會使遺傳算法失掉很大一部分性能,所以這里選用自適應(yīng)遺傳算法,使用該算法后便可以根據(jù)輸入值來更正交叉概率及變異概率,如下式所示:
(7)
(8)
式中:f1是兩交叉?zhèn)€體中相對大的個體的適應(yīng)度值,f2代表著變異的個體的適應(yīng)度值,Pc和Pm分別表示交叉概率和變異概率,favg和fmax分別為平均適應(yīng)度值、最大適應(yīng)度值。這就可以極大概率地留住群體中的優(yōu)秀個體,在此考慮交叉及變異的存在,所以k1及k2是提前定好的一個值且不超過1.0,它們的值根據(jù)之前經(jīng)驗可以設(shè)成0.4、0.1。
改進的自適應(yīng)遺傳算法可以針對某個解給出最佳交叉概率和變異概率。適應(yīng)度比平均適應(yīng)度低時就選取較大交叉率及變異率,若適應(yīng)度值比平均適應(yīng)度值高,則取對應(yīng)的交叉率及變異率[17]。由式(7)、式(8)可得,個體適應(yīng)度值和fmax近似時,交叉、變異概率越??;與fmax相等則交叉、變異概率為0。式(7)、式(8)并不完全適用于進化初期群體,相反會適用于進化后期群體。這是由于初期可基于自適應(yīng)遺傳算法給出改進,交叉概率及變異概率經(jīng)過更改后可由下式來做調(diào)整。
(9)
(10)
式中:fmax代表最大適應(yīng)度值,favg代表著平均適應(yīng)度值,f1、f2各代表兩交叉染色體其中相對大的一個的適應(yīng)度值及待突變個體的適應(yīng)度值。Pcmax、Pcmin表示最大、最小交叉概率,Pmmax、Pmmin表示最大、最小變異概率。λ為常數(shù),一般情況下λ=2。在人工經(jīng)驗的基礎(chǔ)上可令Pcmax=0.9、Pcmin=0.6、Pmmax=0.1、Pmmin=0.001。
綜上所述,交叉概率及變異概率能夠在染色體進行交叉變異時進行自適應(yīng)調(diào)節(jié),算法才可以尋找全局最優(yōu)解,保證群體的多樣性及遺傳算法的收斂性。
Newland根據(jù)諧波小波的信號分析的具體特征構(gòu)建出了諧波小波,并依次每層都展示出小波所處的頻段,由于信號細化的原因,所有頻段并不能出現(xiàn)在同一分解層上,所以再進行細分即可獲得某部分頻段。諧波小波在頻域有著優(yōu)良的盒形譜特性,其相應(yīng)頻域表達式如下:
(11)
時域內(nèi)表達式可如下表示:
ωm,n(x)=[exp(in2πx)-exp(im2πx)]/[i2π(n-m)x]
(12)
式中:i為諧波小波在相應(yīng)時域中的相關(guān)系數(shù)。
小波變換中的層次取決于式(12)的m、n,根據(jù)諧波小波的濾波功能可以對待分析的所需頻段進行保存。
但諧波小波包的最終分析并不能進行選擇,對頻段的細分不能滿足要求,對時域振動信號進行篩選時有局限性。運用二進制小波包細化的原理來進行無限細分的自適應(yīng)分解,公式如下:
(13)
式中:B表示分析頻帶的寬度,等價于2-jfh;其中fh是最高頻率表達式。
由諧波小波核心思想可得諧波小波包的頻域分析圖如圖3所示。
圖3 諧波小波包的頻域分析圖
上述可知信號一旦分解到了特定程度的層,再結(jié)合m、n值就能得到頻段的上下限,以下是變換算法完成的流程:
(1) 結(jié)合信號的先驗知識、帶寬及頻段寬度將其所對應(yīng)的頻段值及層數(shù)求出來,頻段值和層數(shù)j可從B及下式得出:
m=sBn=(s+1)Bs=0,1,2,…,2j-1
(14)
(2) 算出頻段值:
(15)
(3) 對離散信號的時間序列fd(r)經(jīng)快速傅氏變換處理便可得處于頻域的離散值fd(ω);
(4) 當(dāng)前涉及的頻段小波變換可由下式獲得:
Wf(m,n,ω)=fd(ω)φm,n[(n-m)ω]
(16)
(5) 如果要對時域上的信號特征展開分析,則進行逆快速傅氏變換。
因為諧波小波包在進行特征提取時具有很大的優(yōu)勢,所以它是特征提取這一部分的良好手段。這一過程用以下步驟表示:
(1) 求小波系數(shù),利用諧波小波包將測試數(shù)據(jù)做分解處理即可;
(2) 利用下式求出不同尺度時的小波系數(shù)能量值:
(17)
式中:N、M分別為頻帶個數(shù)及各頻帶的小波系數(shù)所擁有的數(shù)量。
(3) 將所獲得的能量做如下式標(biāo)準(zhǔn)化相關(guān)的操作:
(18)
式中:mean和Dσ分別為小波頻帶的能量的均值及其標(biāo)準(zhǔn)差。
從而由下式可知特征向量:
(19)
諧波小波包的分解、定位能力相對強一些,它的表達式以及運算過程也比較簡易,并可以更加細化分析信號的任何一個頻段。
進行支持向量分類機建立時,適用的懲罰系數(shù)C及核函數(shù)參數(shù)σ顯得尤為重要。而傳統(tǒng)的經(jīng)驗或梯度下降法將對支持向量分類器的泛化效果造成影響[18],而本文設(shè)計基于諧波小波包和IAGA-SVM的滾動軸承故障診斷模型。首先利用諧波小波包得到特征向量,再把特征值輸入SVM模型中訓(xùn)練并對核函數(shù)和懲罰系數(shù)進行優(yōu)化,增強 SVM分類器的泛化及學(xué)習(xí)能力,再根據(jù)其識別方法來構(gòu)造相應(yīng)的診斷的算法,這樣才能使識別的速度和正確率得到提升。
多值分類問題是由二值分類問題提出來的,它是將多個數(shù)目的兩類SVM分類器結(jié)合在一起再進行分類的。該算法首先根據(jù)改進的自適應(yīng)遺傳算法來設(shè)立N類故障分類器;當(dāng)建立到第i個分類器的時候,將這類SVM訓(xùn)練樣本劃分成為同類,類別標(biāo)號為1;接下來把上述故障之外的全部訓(xùn)練樣本統(tǒng)稱一類并記作-1。圖4給出本文所述多值分類SVM故障診斷模型。
圖4 基于IAGA優(yōu)化的多值分類SVM故障診斷模型
綜上所述,提出基于改進的自適應(yīng)遺傳算法優(yōu)化SVM的搗固車滾動軸承故障診斷方法,過程實現(xiàn)如下步驟:
(1) 尋找本模型中待優(yōu)化的參數(shù),也就是徑向基核函數(shù)參數(shù)σ及懲罰系數(shù)C。
(2) 確定個體編碼方式,在SVM分類機中的待優(yōu)化參數(shù)有兩個,數(shù)量少,所以實施二進制編碼可使優(yōu)化搜索速度得到提升。
(3) 隨機產(chǎn)生個體數(shù)量為M個的初代種群。
(4) 用諧波小波包處對各狀態(tài)下的多組訓(xùn)練數(shù)據(jù)進行信號分解,計算出能量。經(jīng)過歸一化處理小波頻帶能量均值及標(biāo)準(zhǔn)差后可得各故障狀態(tài)時的滾動軸承特征向量。
(5) 在訓(xùn)練數(shù)據(jù)集基礎(chǔ)上對種群中全部個體在多值SVM模型中展開訓(xùn)練,訓(xùn)練樣本故障類型是第i類SVM時,標(biāo)號為1,反之為-1。
(6) 檢驗訓(xùn)練后的各SVM模型,并以此為依據(jù)評判種群中全部個體的適應(yīng)度值。
(7) 判斷是否滿足算法的終止條件。若滿足則轉(zhuǎn)(9),不滿足轉(zhuǎn)(8)。
(8) 當(dāng)前種群進行無回放最大值選擇、均勻交叉和變異的相關(guān)操作,轉(zhuǎn)(5)。
(9) 從種群中選一個適應(yīng)度最高的個體,并把該個體的表現(xiàn)型參數(shù)當(dāng)作經(jīng)過IAGA算法處理過的SVM模型的參數(shù)C*和σ*。
(10) 以優(yōu)化處理后的懲罰系數(shù)C*及徑向基函數(shù)參數(shù)σ*為基礎(chǔ),構(gòu)造支持向量機診斷模型。
(11) 運用構(gòu)建的SVM故障診斷模型進行診斷。
本文選取美國西儲大學(xué)的實驗數(shù)據(jù),特征提取方法為諧波小波包,其過程為: 把測試數(shù)據(jù)多層諧波小波包分解后得出各個尺度的小波系數(shù),再算出全部尺度的小波系數(shù)能量并做相關(guān)歸一化處理,求出特征向量。當(dāng)故障的直徑以及轉(zhuǎn)速分別是7 mil和1 750 r/min時,圖5為某一組時域波形。這里選用美國凱斯西儲的滾動軸承數(shù)據(jù)文件,內(nèi)圈故障107.mat,滾動體故障120.mat,外圈故障132.mat,正常99.mat。
(a) 正常數(shù)據(jù)時域波形
(b) 滾動體故障時域波形
(c) 內(nèi)圈故障時域波形
(d) 外圈故障時域波形圖5 各種狀態(tài)下的時域波形
用諧波小波包對此實驗數(shù)據(jù)做相應(yīng)處理操作后可得出4種不同特征能量如圖6所示。
圖6 不同狀態(tài)的特征提取能量分布圖
由此可得諧波小波包可完整細分全部分析頻帶,在滾動軸承故障頻率特征的提取中表現(xiàn)得更好,因此諧波小波包提取特征時會對要診斷的故障進行更好的細分。
因此,只要將諧波小波包對不同故障下的振動信號展開分解及重構(gòu)后所提取的頻帶能量作為特征向量輸入到已構(gòu)造好的IAGA-SVM模型中,便知是哪種類型的故障。這里把提取出來的故障特征分為訓(xùn)練樣本及測試樣本,將訓(xùn)練樣本通過SVM模型訓(xùn)練、測試;再經(jīng)過改進的自適應(yīng)遺傳算法去尋優(yōu)得到SVM的最佳核參數(shù)σ及懲罰系數(shù)C,把測試樣本輸入到經(jīng)過優(yōu)化的SVM當(dāng)中,便可知滾動軸承故障診斷的結(jié)果。此實驗由100 ×4組特征樣本,選取各狀態(tài)下的前50組,也就是200組當(dāng)作訓(xùn)練數(shù)據(jù)。在有了判別4種不同狀態(tài)的能力的情況下,再運用剩余200組數(shù)據(jù)展開相應(yīng)測試。其中的一組測試數(shù)據(jù)和判別情況如表1所示。
表1 搗固車滾動軸承各故障類型對應(yīng)的特征樣本和診斷結(jié)果
進化到最終代數(shù)就會終止尋優(yōu)并記錄最優(yōu)參數(shù)。在此將改進的自適應(yīng)遺傳SVM、自適應(yīng)遺傳SVM、簡單遺傳SVM三種模型相互對比,分別將滾動軸承故障的樣本數(shù)據(jù)用這三種方法做相應(yīng)的處理,再根據(jù)展現(xiàn)出來的收斂效果及診斷誤差來判斷此實驗中IAGA-SVM的抗變換性。圖7反映出三種不同算法對SVM參數(shù)進行優(yōu)化時的迭代次數(shù)和平均適應(yīng)度兩者的具體對應(yīng)情況。圖8反映出三種不同算法對SVM參數(shù)進行優(yōu)化時訓(xùn)練的次數(shù)和誤差平方和兩者的具體對應(yīng)情況。
圖7 不同算法對SVM參數(shù)優(yōu)化時的迭代次數(shù)和平均適應(yīng)度的關(guān)系曲線
圖8 不同算法對SVM參數(shù)進行優(yōu)化時的訓(xùn)練次數(shù)和誤差平方和的關(guān)系曲線
由圖7、圖8可知,用IAGA處理SVM參數(shù)時可使收斂情況呈現(xiàn)出的效果最好且誤差最小,原始算法GA表現(xiàn)最差,出現(xiàn)全局最優(yōu)的結(jié)果并不理想。確保分類準(zhǔn)確率的同時,IAGA在第70代就可以尋找到最優(yōu)值且之后基本有平緩的趨勢,那么可得最優(yōu)懲罰系數(shù)和核參數(shù)分別為C=0.0573、σ=0.4105。AGA和原始的GA算法還要繼續(xù)進化到上百代才可以尋找出最優(yōu),且兩者皆沒有IAGA的好。
需要說明的是:懲罰系數(shù)C可將系統(tǒng)的學(xué)習(xí)能力體現(xiàn)出來,核參數(shù)σ體現(xiàn)的是樣本所處的高維空間里的呈現(xiàn)情況的復(fù)雜程度,分類器泛化能力就與此相關(guān)。分類正確率與兩者的關(guān)系如圖9所示,此時核函數(shù)為徑向基函數(shù)。
圖9 樣本分類正確率和核函數(shù)參數(shù)、懲罰系數(shù)三者之間的關(guān)系圖
在圖9三維曲面中可得,由于核參數(shù)及懲罰系數(shù)的取值的多樣性,使得分類時的準(zhǔn)確程度會出現(xiàn)局部最優(yōu)的情況,恰好由于IAGA使這種情況不會存在,這展現(xiàn)出IAGA優(yōu)良的全局尋優(yōu)能力。并且因為支持向量機良好的分類識別性能使得分類正確率大多在最佳識別精度上下。因此IAGA算法和SVM的有效結(jié)合是有很大的運用價值。
將獲得的最優(yōu)參數(shù)運用在建立好的分類器上,從而給出關(guān)于測試樣本在判別分類完成后的效果如圖10所示。
圖10 IAGA最優(yōu)參數(shù)建立的多值SVM分類效果圖
從圖10效果可以看出此模型分類效果優(yōu)良且判別準(zhǔn)度高。為了使本文所提模型更有說服力,在同樣的訓(xùn)練及測試樣本的條件下,用本文的方法與BP及RBF神經(jīng)網(wǎng)絡(luò)故障識別的效果展開對比,得出3種算法分類性能的詳細對比如表2所示。
表2 三種算法分類性能比較
由表2看出,SVM參數(shù)經(jīng)過IAGA尋優(yōu)后的診斷準(zhǔn)確率可以到100%,完全符合工程中所涉及的實際需求,BP和 RBF測試結(jié)果都相對較低。說明針對小樣本集時SVM的分類性能要強于BP及RBF神經(jīng)網(wǎng)絡(luò),且小樣本問題可用本文提出的模型展開處理。
本文將諧波小波包在特征提取方面的優(yōu)良性能、IAGA出色的全局尋優(yōu)能力以及SVM在模式識別時展現(xiàn)出的優(yōu)良性能相結(jié)合。用改進的遺傳算法對SVM模型中的參數(shù)做自適應(yīng)優(yōu)化,再根據(jù)多值SVM模型對搗固車滾動軸承故障進行分類,可提升診斷精度、效率及泛化性能。實驗表明,諧波小波包有著將所有分析頻帶細化的特性,且本文所提出的IAGA-SVM搗固車滾動軸承多值診斷技術(shù)相對AGA-SVM和GA-SVM可以更迅速尋找出最優(yōu)參數(shù),同時其診斷結(jié)果相對BP及RBF神經(jīng)網(wǎng)絡(luò)準(zhǔn)確性更高,可靠性更強,抗變換性也更強。所以此模型有著突出的優(yōu)越性以及實際運用價值。