時培明, 梁 凱, 趙 娜, 安淑君
(燕山大學 電氣工程學院, 河北 秦皇島 066004)
由于風機受無規(guī)律的變向、變速和變載荷的風力作用以及強陣風的沖擊,工況極不穩(wěn)定。復雜工況下的風機齒輪箱軸承故障診斷難度很大,誤診率很高。近年來,很多學者應用支持向量機對機械故障進行診斷取得了很好的效果[1~7]。
本文提出一種基于遺傳算法自動求解支持向量機的最佳參數的支持向量機模型(genetic algorithm support vector machine,GA-SVM)。根據分形維數理論、盒維數的計算和常用的時域特征參數的計算,采用河北省張家口某風場的風電機組齒輪箱軸承數據進行故障診斷,通過實驗對比論證:盒維數能夠提高支持向量機故障診斷的準確率;基于GA-SVM的模型能有效提升分類的準確率。
基于Vapnik等人提出的統(tǒng)計學習理論的支持向量機(support vector machine,SVM)方法是一種比較好地實現(xiàn)了結構風險最小化思想的方法,為解決小樣本分類、非線性問題提供了思路。
假設給定的m個樣本訓練集為:
T={(xi,yi)|i=1,2,…,m}
式中:xi∈RN為N維樣本坐標向量;yi∈{-1,1}。
假設樣本訓練集能被某個超平面H:w·x+b=0(w為權重系數向量;x為樣本坐標向量;b為偏置項)沒有錯誤地分開,并且離超平面最近的向量與超平面之間的距離是最大的,該超平面就稱為最優(yōu)超平面。
yi[(w·xi)+b]≥1
(1)
因此,支持向量機的目的是采用式(2)構建能對所有樣本正確分類的分類超平面:
(2)
由于目標函數和約束條件都是凸的,根據最優(yōu)化理論,這一問題存在唯一的全局最小解。應用Lagrange乘子并考慮滿足KKT條件:
αi·{yi[(x·xi)+b]-1}=0
(3)
式中:αi為拉格朗日乘子。
可求得最優(yōu)超平面決策函數為:
M(x)=sgn[(w*·x)+b*]
(4)
式中:w*為權重系數向量;b*為偏置項;αi*為拉格朗日乘子。
對于線性不可分情況,通過引入松弛變量ξi≥0,修改目標函數和約束條件,應用完全類似的方法求解。
(5)
式中:C為懲罰系數。
在訓練數據不可分的情況下,由于允許錯分,因此相當于在刨除那些錯分樣本的情況下,最大化分類間隔超平面。
對非線性情況,支持向量機利用了特征空間中的非線性映射算法,即通過事先選擇的某種非線性映射將輸入的向量x映射到一個高維特征空間Z,即φ:RN→Z,x→φ(x)。而后在此高維空間中使用線性支持向量機進行分類。
GA-SVM模型見圖1。
圖1 GA-SVM模型
SVM能否出色完成訓練測試任務,構造SVM的核函數參數g、懲罰因子c有重要影響。因為很難預先確定合適的參數c、g,所以本文中采用GA算法對SVM中的參數進行優(yōu)化,其具體步驟如圖1所示。這樣可以有效彌補在構造核函數參數及懲罰因子時因經驗不足而導致分類準確率偏低。GA的基本思路是從一個群體出發(fā),然后通過自然選擇、交叉和變異等遺傳操作產生新一代群體。群體中包含多個個體,每個個體代表優(yōu)化問題的一個解,即遺傳學中的染色體。在進行選擇操作時,采用適應度函數方式對每個個體代表優(yōu)化問題的一個解,即遺傳學中的染色體。在進行選擇操作時,采用適應度函數方式對每個個體進行適應度評價,通過適應度函數值來決定適用于產生下一代的父代個體,適應度函數值較小的則被淘汰。然后將選擇出的個體經過交叉和變異等操作產生新的一代。新一代群體繼承了上一代中優(yōu)良特性,這樣遺傳操作使優(yōu)化朝著更優(yōu)解方向進化[8~11]。
3.1.1 時域特征參數提取
要實現(xiàn)故障智能診斷首先需要故障特征提取。以下是常用的時域特征參數及計算方法。
峰值:xF=|xmax|
峰峰值:xF-F=|xmax-xmin|
裕度指標:CLf=xF/xr
3.1.2 盒維數提取
將分形維數作為反映系統(tǒng)故障的特征量,通過系統(tǒng)分形維數的變化來判斷系統(tǒng)是否偏離了正常狀態(tài),即是否出現(xiàn)了故障。盒維數在眾多分形維數中是最簡單且應用最廣的一種[12],因此本文采用盒維數作為故障的特征參量。
設X是n維歐式空間Rn上的閉集,將Rn劃分成盡可能細的δ網格,若N(δ)是網格寬度為δ的集合X的網格計數,盒維數定義為:
(6)
本文利用GA-SVM模型對風電機組齒輪箱軸承的故障進行模式識別分類,風電機組齒輪箱軸承的振動數據作為該診斷模型的輸入變量,輸出為風電機組齒輪箱軸承的故障狀態(tài),建立診斷模型?;贕A-SVM的風電機組齒輪箱軸承故障診斷流程圖如圖2所示。
圖2 基于GA-SVM的風電機組齒輪箱 軸承故障診斷流程
(1)分別采集齒輪箱軸承在正常以及故障狀態(tài)下的原始振動數據為樣本。
(2)求解原始振動數據的時域特征參數及盒維數。利用式(7)對提取的特征參量行歸一化:
(7)
式中,xig表示歸一化的特征參量;xi表示各特征參量的能量值;xmax,xmin表示xi中的最大最小值。
(3)將提取的特征參量數據集進行劃分,分別為用于訓練的數據集和用于測試的數據集。
(4)對GA的參數選項進行初始化設置:遺傳算法參數設置為進化代數為200,種群數為20,交叉概率為0.9,變異概率為0.01,懲罰因子c的取值范圍為(0,100],徑向基參數g的取值范圍為[0,1 000], 以支持向量機的平均相對誤差作為適應度函數。
(5)利用遺傳算法選擇出最佳參數c和g。
(6)利用訓練數據通過上述步驟生成風電機組齒箱軸承故障診斷模型。
(7)將測試數據集輸入到訓練好的風電機組齒輪箱軸承故障診斷模型中,進行故障診斷,輸出測試結果。
選取河北省張家口某風電場的風力發(fā)電機組發(fā)電機前軸承垂直方向測點的振動數據,一共選取了63組數據:故障數據(1~23)和正常數據(24~63)。故障類型定為標簽一,正常類型定為標簽二。隨機選取故障數據中的10組和正常數據中的20組為訓練集;剩余的為測試集。對振動信號故障特征進行提取,限于篇幅,故障軸承與正常軸承各列舉2組數據,見表1。
為了證明分形維數對于提升SVM性能的有效性,分兩組實驗進行對比論證:第一組,選取9項時域指標作為特征參數;第二組,選取9項時域指標外加盒維數作為特征參數。結果見圖3和圖4。
表1 兩種類別的特征參量
圖3 不含盒維數的GA適應度曲線及不含盒維數的GA-SVM測試結果
圖4 含盒維數的GA適應度曲線及含盒維數的GA-SVM測試結果
對比圖3和圖4可知含盒維數的GA適應度曲線明顯好于不含盒維數的GA適應度曲線,并且含盒維數的GA-SVM測試結果93.75%(30/32)好于不含盒維數的GA-SVM測試結果87.5%(28/32)。易知,盒維數特征參數能提升支持向量機的性能,提高故障診斷準確率。
為了證明遺傳算法能有效找到最優(yōu)參數,提高SVM的分類準確率,分3組實驗進行對比論證:第一組選取c=1,g=1;第二組選取c=2,g=2;第三組應用遺傳算法求出最優(yōu)參數。故障診斷結果見表2。
由表2可知,不同的徑向基核參數和懲罰因子影響SVM的適應度曲線和分類準確率;GA-SVM模型能通過遺傳算法找出最佳參數,從而提高故障分類的準確性。
表2 不同支持向量機故障診斷結果
(1)引入遺傳算法對SVM核函數參數、懲罰因子進行優(yōu)化,建立GA-SVM模型,能有效提升分類的準確率,能更好地識別故障。
(2)結果表明:通過對比實驗可知添加盒維數特征參量能提升SVM的性能,提高支持向量機的故障診斷準確率。 這表明變工況條件下,盒維數能夠表征齒輪箱軸承的特征,盒維數是有效的特征參數。
(3)提升故障診斷的準確率關鍵在兩個方面:支持向量機的核函數參數、懲罰因子的選取和有效特征參數的選取。
[參考文獻]
[1] Saravanan N. Gear Box Fault Diagnosis using Hilbert Transform and Study on Classification of Features by Support Vector Machine [J]. InternationalJournalofHybridInformationTechnology, 2014, 7 (4): 69-82.
[2] Zhang L B. Gear Fault Diagnosis Using Empirical Mode Decomposition, Genetic Algorithm and Support Vector Machine [J].JournalofVibrationMeasurement&Diagnosis, 2009, 29 (4): 445-448.
[3] Chen F, Tang B, Chen R. A novel fault diagnosis model for gearbox based on wavelet support vector machine with immune genetic algorithm [J].Measurement, 2013, 46 (1):220-232.
[4] 王凱, 張永祥, 李軍. 遺傳算法和支持向量機在機械故障診斷中的應用研究[J]. 機械強度, 2008, 30(3): 349-353.
[5] 陳果, 周伽. 小樣本數據的支持向量機回歸模型參數及預測區(qū)間研究[J]. 計量學報, 2008, 29(1): 92-96.
[6] 王凱, 張永祥, 李軍. 基于支持向量機的齒輪故障診斷方法研究[J]. 振動與沖擊, 2006, 25 (6): 97-99.
[7] 孟宗,季艷,谷偉明,等. 基于支持向量機和窗函數的DEMD端點效應抑制方法[J]. 計量學報, 2016, 37(2):180-184.
[8] 嚴剛峰, 黃顯核, 譚航,等. 基于遺傳算法的振蕩器諧振回路的參數選擇[J]. 計量學報, 2010, 31(2): 165-169.
[9] 南國芳, 王化祥, 王超. 基于BP神經網絡和遺傳算法的電阻抗圖像重建算法[J]. 計量學報, 2003, 24(4): 337-340.
[10] 田社平, 韋紅雨, 顏德田. 基于遺傳算法的lp數據擬合及其應用[J]. 計量學報, 2005, 26(3): 284-288.
[11] 盧桂馥, 王勇, 竇易文. 基于遺傳算法和最小二乘支持向量機的織物剪切性能預測[J]. 計量學報, 2009, 30(6) :543-546.
[12] 于德介, 程軍圣, 楊宇. 機械故障診斷的Hilbert-Huang變換方法[M]. 北京:科學出版社, 2007: 137-138.