馮 新
(福州大學(xué)至誠學(xué)院 計算機工程系, 福建 福州 350002)
滾動軸承是軌道工程機械設(shè)備的關(guān)鍵組成元件,如果可以在滾動軸承性能衰退的過程中及時檢測出故障部位及故障類型,就可以變被動維修到主動維修[1]。一方面提高了滾動軸承的使用壽命,另一方面也大大降低了因故障發(fā)現(xiàn)不及時而造成的各種不良后果。所以,對軌道工程機械設(shè)備滾動軸承進(jìn)行故障分類和故障預(yù)測具有重大的工程價值。
文中提出一種基于小波變化和改進(jìn)的自適應(yīng)遺傳算法優(yōu)化SVM分類的滾動軸承故障診斷模型。首先對采集到的數(shù)據(jù)進(jìn)行預(yù)處理并做去噪處理,其次利用小波變換對去噪后的信號進(jìn)行特征提取,繼而對提取獲得的特征向量做進(jìn)一步的歸一化處理,并使用改進(jìn)的自適應(yīng)遺傳算法對SVM的相關(guān)參數(shù)進(jìn)行優(yōu)化處理,建立了IAGA-SVM故障診斷模型,最后采用仿真實驗來說明筆者所提方法的優(yōu)越性。
支持向量機是Vapnik等[2]在統(tǒng)計學(xué)理論的結(jié)構(gòu)風(fēng)險最小化和VC維的基礎(chǔ)上提出的一種新的機器學(xué)習(xí)方法[3]。SVM能夠在有限特征信息情況下較好地解決小樣本集的回歸和分類問題,它比神經(jīng)網(wǎng)絡(luò)具有更強的泛化能力[4]。鑒于SVM自身的優(yōu)越性,現(xiàn)已成為目前最常用、最有效的分類器之一。
假設(shè)n個訓(xùn)練樣本的樣本集表示為:
x∈Rn,y∈{-1,1}
當(dāng)樣本集D為線性可分時,則式(1)為樣本的某一超平面方程:
ω·x+b=0(1)
其最優(yōu)分類超平面必須滿足如下方程:
yi(ω·xi+b)≥1(2)
i=1,2,…,n
此時可采用下式對訓(xùn)練樣本數(shù)據(jù)進(jìn)行分類:
(3)
利用拉格朗日函數(shù)來對上述問題進(jìn)行求解:
(4)
式中:αi----Lagrange乘子,αi≥0,i=1,2,…,n。
(5)
f(x)= sgn(ω*·xi+b*)=
當(dāng)訓(xùn)練樣本為線性不可分時,則需要尋求一個合適的映射函數(shù)對數(shù)據(jù)進(jìn)行非線性映射。用字母表達(dá)為:
φ:Rn→H
x→φ(x)
由Mercer條件可知,若核函數(shù)K(xi,xj)可以寫成
K(xi,xj)=φ(xi)·φ(xj)
那么問題就轉(zhuǎn)化為在約束條件
αi≥0,i=1,2,…,n
求解二次規(guī)劃問題:
(7)
求解所得的最優(yōu)分類函數(shù)式為:
(8)
從上述表達(dá)式可以看出,核函數(shù)的選擇對SVM性能的優(yōu)劣起關(guān)鍵作用。文中選擇徑向基核函數(shù)RBF,即
K(xi,xj)=exp(-γ*‖xi,xj‖2)
γ是描述核函數(shù)的作用范圍,決定了模型的復(fù)雜程度。引入松弛變量ξi≥0,則此時的約束條件由
yi(ωxi+b)≥1
i=1,2,…,n
變?yōu)?/p>
yi(ω·xi+b)≥1-ξi(9)
i=1,2,…,n
相對應(yīng)的二次凸規(guī)劃問題變?yōu)?/p>
(10)
式中:C----大于零的懲罰因子,用來權(quán)衡對錯樣本的懲罰力度。
SVM分類模型最初被提出來的時候僅僅是用來實現(xiàn)二值分類問題,但實際工程應(yīng)用中二值分類是非常少有的,往往是多分類問題更加常見。目前使用較多的則為“一對一”、“一對多”和二叉樹結(jié)構(gòu)的多分類方法[5],文中選取基于二叉樹結(jié)構(gòu)的支持向量機多分類方法(DT-SVM)。
自適應(yīng)遺傳算法(Adaptive Genetic Algorithm, AGA)的改進(jìn)之處是將遺傳算法中固定的交叉概率和變異概率進(jìn)行線性的自適應(yīng)調(diào)整[6]。交叉概率Pc決定了遺傳算法的全局搜索能力,變異概率Pm決定了遺傳算法的局部搜索能力,所以Pc和Pm對遺傳算法的尋優(yōu)能力起決定性作用。兩者的適應(yīng)度調(diào)整公式為:
(11)
式中:λ1、λ2、λ3、λ4----在[0,1]內(nèi)隨機取值的常數(shù);
fmax----群體中最大的適應(yīng)度值;
fhigger----參與交叉運算的兩個個體中較大的適應(yīng)度值;
farg----群體的平均適應(yīng)度值;
f----當(dāng)前變異個體的適應(yīng)度值。
由式(11)和式(12)可知,如果fmax=farg,則式(11)和式(12)的分母都變?yōu)榱?,這樣的表達(dá)在數(shù)學(xué)中是不成立的。此外fmax=farg表示群體中所有個體的基因組成都是一樣的,這時候的優(yōu)良個體有很大可能是局部最優(yōu)解而不是全局最優(yōu)解,從而導(dǎo)致進(jìn)化無法繼續(xù)進(jìn)行下去。
為了盡可能地避免群體陷入停滯不前的境況,文中對上述自適應(yīng)遺傳算法的公式進(jìn)行改進(jìn):
(13)
式中:Pmax1,Pmin1----分別表示交叉概率的上限和下限;
Pmax2,Pmin2----分別表示變異概率的上限和下限。
這樣的設(shè)置使得Pc和Pm的適應(yīng)度值在fmax和farg之間進(jìn)行非線性的調(diào)整,在很大程度上規(guī)避了局部收斂的弊端。
文中考慮到支持向量機和遺傳算法各自的優(yōu)缺點,提出一種利用改進(jìn)的自適應(yīng)遺傳算法優(yōu)化支持向量機核函數(shù)參數(shù)和懲罰因子的方法,以此來提高支持向量機的分類能力和泛化能力。采用二進(jìn)制和實數(shù)混合編碼的方式對SVM中的相關(guān)參數(shù)進(jìn)行遺傳編碼,以此來提高算法的求解精度,將最終搜索得到的最優(yōu)結(jié)果作為SVM模型的參數(shù)進(jìn)行建模?;诟倪M(jìn)的自適應(yīng)遺傳算法優(yōu)化SVM的故障診斷流程如圖1所示。
圖1 IAGA-SVM故障診斷模型流程圖
為了證明文中所提IAGA-SVM故障診斷模型的有效性,設(shè)計如下實驗進(jìn)行驗證。實驗數(shù)據(jù)源自美國凱斯西儲大學(xué)(Case Western Reserve University)[7]所提供的滾動軸承數(shù)據(jù)。傳感器數(shù)據(jù)采樣頻率為12 000 Hz,轉(zhuǎn)速為1 730 r/min,故障損傷直徑選用0.053 cm。實驗中將滾動軸承故障分為4種狀態(tài),分別是正常狀態(tài)、軸承內(nèi)圈故障、軸承外圈故障和軸承球體故障[8]。
文中通過小波對信號進(jìn)行去噪后提取特征向量,再選取各狀態(tài)下80組樣本作為訓(xùn)練樣本(共320組),用于訓(xùn)練模型,選取各狀態(tài)下20組特征向量為測試樣本(共80組)作為測試所用。根據(jù)經(jīng)驗設(shè)置懲罰系數(shù)為[0.005,100],RBF徑向基函數(shù)的參數(shù)為[0.05,100],最大迭代次數(shù)設(shè)置為200次。
為了證明文中所提模型的高效性,特設(shè)計對比模型來進(jìn)行實驗。遺傳算法對支持向量機參數(shù)尋優(yōu)(GA-SVM)、自適應(yīng)遺傳算法對支持向量機參數(shù)尋優(yōu)(AGA-SVM)、改進(jìn)自適應(yīng)遺傳算法對支持向量機參數(shù)尋優(yōu)(IAGA-SVM)的適應(yīng)度曲線如圖2所示。
圖2 GA-SVM、AGA-SVM和IAGA-SVM的適應(yīng)度曲線
三種模型的適應(yīng)度函數(shù)均取支持向量機最終的分類準(zhǔn)確率。由圖2可以看出,GA-SVM于102代左右時適應(yīng)度變化趨于平穩(wěn),但容易造成最終收斂速度慢,甚至存在早熟現(xiàn)象;AGA能夠自適應(yīng)調(diào)整交叉率以及變異率,使得其收斂速度加快,因此,可以看到AGA-SVM在63代左右已趨于收斂,相對于GA-SVM而言,它的收斂速度已經(jīng)加快不少,但AGA算法在種群進(jìn)化初期容易導(dǎo)致進(jìn)化停滯不前,陷入局部最優(yōu)且不利于增強算法的魯棒性;IAGA-SVM模型僅迭代45次便趨于收斂,明顯優(yōu)于前兩種尋優(yōu)模型,從而使得改進(jìn)的自適應(yīng)遺傳算法能夠更高效的完成收斂,驗證了文中所提模型的高效性。
為了測試IAGA-SVM模型對滾動軸承4種狀態(tài)的辨識度,現(xiàn)對每種故障狀態(tài)分別選取20個測試樣本,使用經(jīng)過訓(xùn)練之后的IAGA-SVM分類模型對滾動軸承進(jìn)行測試,測試結(jié)果如圖3所示。
圖3 IAGA-SVM模型的分類結(jié)果圖
由圖3可以看出,正常狀態(tài)、內(nèi)環(huán)故障、外環(huán)故障20個測試樣本均確診,其分類準(zhǔn)確率分別達(dá)到100%,但滾動體故障20個測試樣本只有19個測試樣本確診,一個測試樣本誤診為正常軸承,分類準(zhǔn)確率達(dá)到95%。由此可以得到該模型的平均準(zhǔn)確率約高達(dá)98.75%??梢奍AGA-SVM模型作用于滾動軸承故障診斷識別率高,效果明顯,具有較大的工程意義。
在對滾動軸承的原始數(shù)據(jù)進(jìn)行去噪處理之后,進(jìn)一步對處理后的信號進(jìn)行特征提取。針對SVM方法的弊端,特選用自適應(yīng)遺傳算法對SVM的相關(guān)參數(shù)進(jìn)行優(yōu)化處理。但由于自適應(yīng)遺傳算法自身所存在的缺陷,并不能達(dá)到預(yù)期的分類結(jié)果,故而對自適應(yīng)遺傳算法進(jìn)行改進(jìn)。
實驗結(jié)果可以看出,所提出的IAGA-SVM模型對滾動軸承進(jìn)行故障分類識別,無論在收斂速度上還是在分類的準(zhǔn)確率上,優(yōu)于其他兩種實驗?zāi)P停瑥亩炞C了文中所提的故障診斷模型對軸承故障分類的優(yōu)越性,具有可觀的工程價值。