張 亮,陳志剛,楊建偉,汪耀林
(1.北京建筑大學 北京市建筑安全監(jiān)測工程技術(shù)研究中心,北京 100044;2.中原輸油氣分公司,山東 德州 253052)
?
基于決策樹與多元支持向量機的齒輪箱早期故障診斷方法
張亮1,陳志剛1,楊建偉1,汪耀林2
(1.北京建筑大學 北京市建筑安全監(jiān)測工程技術(shù)研究中心,北京100044;2.中原輸油氣分公司,山東 德州253052)
齒輪箱部件的故障形式多樣,典型故障訓練樣本數(shù)量有限;為了提高齒輪箱故障診斷的精度和效率,提出了基于決策樹與多元支持向量機的齒輪箱早期故障診斷方法;利用決策樹分類速度快、效率高的優(yōu)點和支持向量機在小樣本二元分類方面突出的特點構(gòu)建多元分類識別模型,在不同故障情形下提取齒輪箱振動信號典型特征參數(shù)作為故障特征向量訓練模型,并對樣本進行測試;實驗結(jié)果表明,該方法在小樣本情況下識別效果明顯優(yōu)于神經(jīng)網(wǎng)絡方法,同時在識別效率方面比常規(guī)多元支持向量機方法有了較大的提高。
齒輪箱; 決策樹; 支持向量機; 故障識別; 神經(jīng)網(wǎng)絡
齒輪箱作為傳遞動力的常用裝置廣泛地應用于各種工程機械上。在絕大多數(shù)工程施工場合下,由于設備工作強度大、環(huán)境惡劣,齒輪箱容易受到損傷,發(fā)生故障的概率較大[1]。齒輪、軸、軸承都是齒輪箱中的易損零件,據(jù)統(tǒng)計約有80%的機械故障是由它們的損壞而引起[2]。其中,齒輪是較早容易出現(xiàn)損壞的零件。由于早期故障的特征信號能量變化微弱,特征參數(shù)的提取困難和表征不明顯對診斷模型的要求更嚴格。
目前,齒輪箱故障診斷的傳統(tǒng)方法并不適用于支持向量機數(shù)量大、故障樣本數(shù)目有限,甚至缺少的情況[3]。在非線性、小樣本問題中,支持向量機(Support Vector Machine,SVM)理論因為在樣本訓練以及泛化能力方面表現(xiàn)出色而被廣泛地運用到醫(yī)學、診斷等諸多領域[4]。決策樹(Decision Tree)方法的基礎是對數(shù)據(jù)進行科學的歸納、學習,并從無規(guī)則的數(shù)據(jù)中得出能對數(shù)據(jù)進行分類的規(guī)則。形成的分類模型不僅可以減少支持向量機的訓練數(shù)量,而且還可以提高向量機的分類效率和準確率[5]。采用決策樹和支持向量機相結(jié)合的方法來構(gòu)建多元分類器,在識別效果和效率方面比傳統(tǒng)神經(jīng)網(wǎng)絡方法和常規(guī)多元支持向量機更具優(yōu)勢。
1.1決策樹基本思想
決策樹是一個代表對象屬性與對象值之間映射關系的預測模型[6]。如圖1所示決策樹包含三部分,根節(jié)點、分支節(jié)點和葉節(jié)點分別表示不同屬性的對象,分叉路徑代表某個可能的屬性值。決策樹分類過程包含兩個步驟:首先是建立合理的決策樹模型。第二步是利用上一步中的決策樹模型對新的數(shù)據(jù)進行逐級分類[7]。
圖1 決策樹結(jié)構(gòu)
在分類階段,決策樹結(jié)構(gòu)中每個節(jié)點都可以完成一個分類子任務。決策樹的邏輯結(jié)構(gòu)有兩種,一是自下而上的凝聚結(jié)構(gòu),二是自上而下的劃分結(jié)構(gòu)[8]。因為只需遍歷部分分類器,所以分類效率和精度比較高。
1.2支持向量機基本理論
支持向量機的基本思想:通過定義適當?shù)膬?nèi)積核函數(shù),將輸入空間的數(shù)據(jù)通過非線性變換,首先轉(zhuǎn)換到一個高維空間,然后在這個新空間中就可以對數(shù)據(jù)進行最優(yōu)線性分類面的求取。
支持向量機方法的最優(yōu)分類面是在線性可分的情況下提出的。圖2為最優(yōu)分類面,圖中的五角星和圓圈圖案分別表示兩種數(shù)據(jù)樣本,H為兩種樣本的分類線,H1、H2分別為各類中離分類線H最近且平行的直線,H1、H2之間的距離稱為分類間隔(margin)[9]。最優(yōu)分類線即為分類間隔最大的分類線,而且能使兩類樣本正確分開。
圖2 最優(yōu)分類面示意圖
在線性不可分的情況下,圖2所示的最優(yōu)分類面在實際應用中可能存在某些樣本不能被超平面正確分類,超平面約束條件為:
式中, b為閾值;ω為分類面的法向量。對于非線性最優(yōu)分類面的求解需要引入拉格朗日乘子
其中:ai≥0,i=1,2,…,l;L的極值點為鞍點,可取L對ω和b的最小值ω=ω*,b=b*,以及對a的最大值a=a*。
在線性可分條件下,原問題經(jīng)過變換成為對偶問題,即求解如下對偶式的極大值
(2)
針對線性不可分問題,首先把測試樣本x映射到某個高維的特征空間H,并且在H中使用線性分類器。因此,選取適當?shù)膬?nèi)積函數(shù)K(xi,xj),就可以在最優(yōu)分類面中把非線性分類變換為線性分類,這時目標函數(shù)轉(zhuǎn)變?yōu)椋?/p>
其中:常量C是對越界樣本的懲罰系數(shù),控制對錯分樣本的懲罰程度。
若ai*為最優(yōu)解,則決策函數(shù)可表達為
(4)
其中:
詳細推導過程參見文獻[10]。
選擇核函數(shù)的形式與得到的支持向量存在因果關系。常用的核函數(shù)有4種,其中最為常用的Gauss徑向基核函數(shù)[11]。
1.3多元分類支持向量機
1.3.1一對多支持向量機
支持向量機“一對多”算法是多值分類最早使用的方法[12]。該方法用二分類支持向量機依次將每一類從其他所有的類別中區(qū)分開。一對多方法在對n類問題進行分類時,需要訓練n個支持向量機。
一對多方法的分類過程思路清晰,但存在著如下不足:①采用一對多方法,每個分類器的正樣本的數(shù)量一般遠遠小于負樣本的數(shù)量,這會大大的降低分類的準確率;②每個支持向量機的訓練都要用到所有的訓練樣本,計算效率較低。
1.3.2一對一支持向量機
對于一個n類問題,一對一方法對樣本中的每一個類別對都需構(gòu)造一個支持向量機,所以共需訓練n(n-1)/2個支持向量機。雖然一對一方法需要訓練的支持向量機的個數(shù)多于一對多方法,然而,訓練每一個支持向量機僅需所有樣本中的兩類樣本。這種方法的訓練速度較“一對多”方法更快。
文獻[13]對上面所提到的幾種多值支持向量機分類算法進行了比較,認為一對一的方法分類效果較好,但是其計算代價大,一對多的方法計算代價較小,但是其分類效果一般。
1.4基于決策樹的支持向量機
支持向量機在小訓練樣本情況下具有很好的泛化性能,但對于多分類問題往往需要構(gòu)造多個分類器,而且診斷時間長。本文采用決策樹和支持向量機相結(jié)合的方法建立齒輪箱多類故障識別模型。
基于決策樹的支持向量機將多分類問題分解為一序列的二值分類問題,這些二值分類分布于決策樹的各個節(jié)點上。分類時,決策樹根節(jié)點和分支節(jié)點按不同屬性逐級劃分為若干個子集合,直到得到所有的葉節(jié)點,在按屬性劃分子集合的時候根據(jù)實際情況選用一對多或一對一支持向量機分類模型。以劃分6類為例,圖3即為其中一種決策樹分類示意圖,逐級地把6類輸入樣本劃分到所屬類別。
從圖3可以看出,基于決策樹的支持向量機綜合考慮了一對多分類模型向量機數(shù)目少,一對一多分類識別準確率較高和決策樹分類效率高的優(yōu)點。
本文實驗對象主要是齒輪箱齒輪故障,在上述原理基礎上構(gòu)建基于決策樹的多分類支持向量機故障診斷模型。以正常齒輪、齒面磨損、齒面膠合和齒根裂紋四類故障識別為例,其分類模型如圖4所示,由于設備多數(shù)情況下處于正常運行狀態(tài),
圖3多分類支持向量機決策樹結(jié)構(gòu)示意圖
實際測試中較易獲取齒輪箱正常運行狀態(tài)樣本,同時,判別齒輪箱正常運行與發(fā)生其他故障相對容易,因此,第一層決策以排除非故障樣本為主要目的,所以采用一對多分類器,可快速判別非故障樣本;第二層決策中再采用一對一算法對3類故障進行識別,此時僅需構(gòu)造3個一對一分類器。該模型僅需構(gòu)造4個支持向量機,比2.3.2中一對一方法4*(4-1)/2=6減少了2個支持向量機,理論上訓練和測試用時會減少,從而提高診斷效率。
圖4多分類支持向量機的決策樹分類效果示意圖
齒輪箱發(fā)生故障的位置可能涉及齒輪、軸、軸承等關鍵部件。由于各部件又都有其不同的故障類型,因此在對齒輪箱進行診斷時,為提高診斷效率,應先判斷其故障所在部件,而后再針對該部件判斷具體的故障類型。因此,對于齒輪箱故障未知情況下,第一層決策可設計為判別故障發(fā)生部件 ,第二層決策再對具體部件故障形式進行再判別。
2.1實驗平臺
實驗采用DDS動力傳動故障診斷綜合實驗平臺。該齒輪箱由滾動軸承支撐的2級平行軸齒輪箱和一個勵磁制動器組成??捎糜邶X輪箱動力學和聲學行為、健康維護、基于振動的診斷技術(shù)、潤滑調(diào)節(jié)或磨損顆粒分析等方面的研究工作。
圖5中根據(jù)實際使用情況,將加速度傳感器安裝在輸入軸與輸出軸的軸承端蓋處,徑向、軸向方向共4個測點同時采集振動數(shù)據(jù)。
圖5 齒輪箱故障信號采集系統(tǒng)示意圖
在該實驗臺齒輪箱上分別模擬1正常齒輪、2齒輪齒面磨損故障、3齒輪齒面膠合故障和4齒輪齒根裂紋故障。每種齒輪的典型故障進行多次實驗,把能反映故障規(guī)律的多組特征向量作為該種故障訓練的樣本。
先測得在正常工況下振動信號,然后對故障齒輪進行測試。實驗中,采用壓電式IEPE加速度傳感器采集振動數(shù)據(jù),設置采樣頻率為10 kHz。提取每種狀態(tài)下原始樣本各20組,每組樣本連續(xù)采樣。
2.2齒輪箱特征的提取
振動信號的各種特征參量對故障信息的表達能力各有側(cè)重,本文參考文獻[14]選取了峰值系數(shù)、峭度指標、偏度指標、有效值、標準差來描述信號的波形特征。由于這些時頻域參量存在著量綱差別,因此,在建模之前先進行歸一化處理,使之轉(zhuǎn)化為[0, 1]的數(shù)據(jù)。故障特征向量如表1所示。
表1 信號樣本特征向量表
2.3學習訓練
選取齒輪箱4類樣本每類5組,共20組信號樣本對圖4中的模型進行學習訓練并構(gòu)造對應的支持向量機決策函數(shù)。
結(jié)合所構(gòu)建的多分類支持向量機的齒輪箱故障診斷模型,經(jīng)過分析本文選用徑向基核函數(shù),訓練步驟如下:
(1)將信號數(shù)據(jù)轉(zhuǎn)化為Libsvm軟件包要求的可識別格式[11];
(2)將訓練樣本進行尺度變換,將樣本集映射至[-1,1]上 ;
(3)模型參數(shù)訓練(懲罰因子C與核函數(shù)參數(shù));
(4)利用步驟(3)中得出的C與為模型參數(shù),將步驟(2)中縮放后的訓練樣本用此模型進行訓練;
(5)向訓練好的模型中輸入測試樣本,檢測分類結(jié)果;
依次利用上述樣本數(shù)據(jù)對支持向量機分類器進行訓練獲得最優(yōu)分類函數(shù),最終獲得分類器參數(shù)優(yōu)化得懲罰因子C=2,核函數(shù)的徑向基參數(shù)。
2.4測試
為了測試上述分類器識別效果,用8組已知待測試樣本對分類器進行驗證測試,以驗證該分類器的泛化能力及準確率。表2給出了不同的支持向量機決策函數(shù)對待診斷樣本的輸出結(jié)果。第一列數(shù)據(jù)中,把正常齒輪①從故障齒輪②③④快速判別出來,其結(jié)果為正值則判斷為正樣本,即正常齒輪,識別結(jié)束;為負則歸為另外三組類型中,屬故障齒輪,則需要進行一對一分類識別,如表中第二、三、四列。
表2 待測樣本的輸出結(jié)果
根據(jù)決策結(jié)構(gòu)中各獨立支持向量機的輸出結(jié)果隸屬度,判斷待診斷樣本的歸屬,當其中某一個SVMi,j對故障樣本x判斷為第i類故障時,第i類的票數(shù)加1,反之,第j類的票數(shù)加1。依據(jù)樣本在各類故障模式的綜合得分來判斷其故障類型,各測試樣本的最終得票情況如表3所示。
表3 基于決策樹支持向量機的分類結(jié)果
由表3可得,根據(jù)本文所提的診斷決策規(guī)則得出的診斷結(jié)果與設置的樣本故障類型完全吻合。
2.5與常規(guī)方法比較
為了進一步比較基于決策樹支持向量機與傳統(tǒng)神經(jīng)網(wǎng)絡和常規(guī)多元支持向量機的分類效果,采用20組樣本對不同模型進行實驗,分類效果如下表4所示。
表4 支持向量機與BP神經(jīng)網(wǎng)絡的識別結(jié)果比較
由表4可以看出,根據(jù)實際故障構(gòu)建相應的決策樹支持向量機識別效果與常規(guī)多元支持向量機方法相同,都明顯由于傳統(tǒng)神經(jīng)網(wǎng)絡方法,但是使用決策樹支持向量機的分類識別時間比常規(guī)支持向量機方法縮短了約35%。
(1)本文結(jié)合決策樹決策效率高和SVM中“一對一”以及“一對多”多值分類方法的優(yōu)點設計出了基于決策樹和支持向量機的齒輪箱故障識別模型。將該模型應用于小樣本數(shù)目的齒輪箱的故障識別,從測試結(jié)果和訓練分類結(jié)果可以看出采用決策樹支持向量機診斷方法在小樣本情況下和齒輪箱早期故障方面具有較強的識別能力和分類效果,明顯優(yōu)于傳統(tǒng)神經(jīng)網(wǎng)絡方法。
(2)采用決策樹和支持向量機相結(jié)合的方法構(gòu)建決策樹形式的支持向量機模型,其識別效果與一對一多元支持向量機相當,但在學習訓練和測試用時方面比常規(guī)支持向量機更短,隨著分類數(shù)量的增加,效果更為明顯,因而比常規(guī)支持向量機更有效率。
[1] 艾延廷,費成巍.基于支持向量機的轉(zhuǎn)子振動故障融合診斷技術(shù)[J].沈陽工業(yè)大學學報,2010,32(5):527-531.
[2] 吳德會. 一種基于支持向量機的齒輪箱故障診斷方法[J]. 振動、測試與診斷,2008,04:338-342.
[3] Schlkopf B, Smola A J. Learning with Kernels, Support Vector Machines,Regularization, Optimization and Beyond[J].The MIT Press,2001.
[4] 何學文,趙海鳴.支持向量機及其在機械故障診斷中的應用[J].中南大學學報,2005,36(1):98-101.
[5] Matthias Rychetsky, Stefan Ortmann, Manfred Glesner. Support vector approaches for engine knock detection [C]. International Joint Conference on Neural Networks, Washington DC, 1999:969-974.
[6] 馮少榮.決策樹算法的研究與改進[J].廈門大學學報(自然科學版),2007(4):496-500.
[7] 程珩,黃超勇,張永剛.基于粒子群優(yōu)化決策樹的齒輪箱故障診斷[J].振動.測試與診斷,2013(1):153-156.
[8] 孫昌兒,劉秉瀚. 一種新的SVM決策樹[J]. 福州大學學報(自然科學版),2007(3):361-364.
[9] Vapnik V N. The nature of statistical learning theory[M].New York: Spring-Verlag,1999.
[10] 王宏漫,歐宗瑛.采用PCA/ICA特征和SVM分類的人臉識別[J].計算機輔助設計與圖形學學,2003,15(4):417-420.
[11] 鄭勇濤,劉玉樹.支持向量機解決多分類問題研究[J].計算機工程與應用,2005,41 (23): 190-192.
[12] 王國鵬,翟永杰,王東風,等.模糊支持向量機在汽輪機故障診斷中的應用[J].華北電力大學學報,2003,30(4): 47-50.
[13] 王華忠,張雪申,俞金壽.基于支持向量機的故障診斷方法[J].華東理工大學學報,2004,30(2):179-182.
[14] Saravanan N, Kumar Siddabattuni V N S, Ramachandran K I. Fault diagnosis of spur bevel gear box using artificial neural network (ANN), and proximal support vector machine (PSVM) [J]. Applied Soft Computing, 2010, 10(1):344-360.
Early Fault Diagnosis of Gearbox Based on Multiclass Support Vector Machine and Decision Tree
Zhang Liang1,Chen Zhigang1,Yang Jianwei1,Wang Yaolin2
(1.Beijing Engineering Research Center of Monitoring for Construction Safety, Beijing University of Civil Engineering Architecture, Beijing100044,China; 2.Zhongyuan Oil & Gas Transportation Sub-Company, Dezhou253052, China)
Failure form of gear box parts is varied, and typical faults have limited training samples. In order to improve the accuracy and efficiency of gearbox fault diagnosis, decision tree with multiple support vector machine (SVM) was proposed based on the early gearbox fault diagnosis methods. Classification based on decision tree on the advantage of fast speed, high efficiency and support vector machine (SVM) in binary classification has outstanding characteristics of small sample build multivariate classification model, in different typical fault case to extract the gearbox vibration signal characteristic parameters as the fault feature vector training model, and testing samples. The results show that this method not only can complete the model learning training in the case of small samples ,but also has been greatly improved over the neural network method in terms of the recognition performance,and can be effectively applied to gearbox fault diagnoisis. The results show that this method not only can complete the model learning training in the case of small samples,but also ha.
automatic transmission;decision tree;support vector machine;fault identification;neural network
2015-09-22;
2015-11-09。
國家自然科學基金項目(51004005);北京市優(yōu)秀人才培養(yǎng)資助項目(2013D005017000013);北京市屬高等學校高層次人才引進與培養(yǎng)計劃項目。
張亮,男(1990-),北京人,研究生,主要從事物流自動化技術(shù)與裝備方向的研究。
陳志剛,男,博士,副教授,碩士生導師,主要從事機電設備狀態(tài)監(jiān)測與故障診斷、城市地下管道安全檢測方向的研究。
1671-4598(2016)01-0012-04
10.16526/j.cnki.11-4762/tp.2016.01.004
TP274.2
A