費(fèi)成巍,白廣忱
隨著航空發(fā)動(dòng)機(jī)的推力、轉(zhuǎn)速、動(dòng)強(qiáng)度等日益提高,發(fā)動(dòng)機(jī)零部件的振動(dòng)載荷不斷增加,振動(dòng)引起的故障越來(lái)越受到關(guān)注,對(duì)于航空發(fā)動(dòng)機(jī)整機(jī)而言,振動(dòng)故障診斷問(wèn)題一直是學(xué)術(shù)界和工程技術(shù)領(lǐng)域研究的熱點(diǎn)問(wèn)題之一[1-2]。在眾多故障診斷方法中,一直受歡迎的支持向量機(jī)(Support Vector Machine,SVM)理論的發(fā)展出現(xiàn)了瓶頸,因?yàn)楹性肼暸c野值干擾的樣本在特征空間中總位于分類(lèi)面附近,造成了最優(yōu)分類(lèi)面的確定模糊性,往往導(dǎo)致所獲得的分類(lèi)面不是真正的最優(yōu)分類(lèi)面[3-4]。為了解決該問(wèn)題,大量學(xué)者融合了模糊理論和SVM理論的優(yōu)點(diǎn),將隸屬度概念引入SVM,開(kāi)始研究模糊支持向量機(jī)(Fuzzy Support Vector Machine,F(xiàn)SVM)方法[4-7]。該方法是采用對(duì)不同的樣本賦予不同的懲罰權(quán)系數(shù),以便根據(jù)不同樣本有不同貢獻(xiàn)原則構(gòu)造目標(biāo)函數(shù),對(duì)含有噪聲與野值的樣本賦予較小的權(quán)值,這樣就可以大大降低了噪聲與野值的影響。然而,隸屬度函數(shù)的設(shè)計(jì)是整個(gè)FSVM理論算法的關(guān)鍵,不同的隸屬度函數(shù)會(huì)對(duì)算法的處理結(jié)果以及算法實(shí)現(xiàn)的難易程度產(chǎn)生不同的影響[4-5],這要求隸屬度函數(shù)必須能客觀(guān)、準(zhǔn)確、有效地反映系統(tǒng)中樣本存在的不確定性。目前,在FSVM方法中主要采用樣本到類(lèi)中心之間的距離來(lái)度量其隸屬度大小,該方法不能很好地區(qū)分有效樣本中含有噪聲或野值樣本[6-7]。
針對(duì)上述存在的問(wèn)題和航空發(fā)動(dòng)機(jī)整機(jī)振動(dòng)故障信息的特點(diǎn),本文在確定模糊隸屬度時(shí)不僅考慮了樣本與類(lèi)中心之間的關(guān)系,還考慮了類(lèi)中各個(gè)樣本之間的關(guān)系,能有效地將支持向量與含噪聲或野值樣本區(qū)分開(kāi)。通過(guò)實(shí)例計(jì)算與分析檢驗(yàn)該方法在航空發(fā)動(dòng)機(jī)整機(jī)振動(dòng)故障分析中的有效性和準(zhǔn)確性。
與常規(guī)SVM相比,F(xiàn)SVM的樣本除了特征與類(lèi)屬標(biāo)識(shí)外,還增加了隸屬度一項(xiàng)。下面對(duì)2類(lèi)分類(lèi)情況進(jìn)行討論。
設(shè)訓(xùn)練樣本集為{[x1,y1,μ(x1)],…,[xn,yn,μ(xn)]}和核函數(shù)為 K(xi,xj),其中,xi∈RN,類(lèi)標(biāo)識(shí)為yi∈{-1,1}及隸屬度為 0< μ(xi)≤1。K 對(duì)應(yīng)某特征空間 Z 的內(nèi)積,即 K(xi,xj)=〈 φ(xi),φ(xj)〉,變換 φ:X→Z將訓(xùn)練樣本從原始模式空間RN映射到高維特征空間Z之間的映射關(guān)系,μ(xi)為訓(xùn)練樣本xi屬于yi的隸屬度。
由于隸屬度μ(xi)表示該樣本屬于第i類(lèi)的可靠程度,ξi是SVM目標(biāo)函數(shù)中分類(lèi)的誤差項(xiàng),則μ(xi)ξi為帶權(quán)的誤差項(xiàng),由文獻(xiàn)[8]得到最優(yōu)分類(lèi)面為下面目標(biāo)函數(shù)的最優(yōu)解。
式中:ω為超平面的法向量,C為懲罰因子常數(shù),b為超平面的偏置,ξi是松弛變量。由式(1)可知,當(dāng)μ(xi)值變小時(shí)減小了ξi在式(1)中的影響,導(dǎo)致相應(yīng)的xi為不重要的樣本。
則相應(yīng)最優(yōu)分類(lèi)面的判別函數(shù)式(也稱(chēng)分類(lèi)器)為:
式中:K(xi,xj)稱(chēng)為核函數(shù),包括多項(xiàng)式函數(shù)、Sigmoid函數(shù)、高斯徑向基函數(shù)(Gaussian Radial Base Function,GRBF),其中GRBF對(duì)應(yīng)的特征空間是無(wú)窮維的,且比其它核函數(shù)有效,受到普遍使用。αi的條件為下式:
αi>0對(duì)應(yīng)樣本xi為支持向量,支持向量有兩種類(lèi)型:一種是滿(mǎn)足0≤αi≤μ(xi)C條件的支持向量xi位于分類(lèi)面附近;另一種是滿(mǎn)足αi=μ(xi)C條件的支持向量xi為錯(cuò)誤分類(lèi)樣本。FSVM與SVM方法的差別在于在FSVM中含有隸屬度μ(xi),若同一個(gè)αi值的樣本xi在兩種方法中可能屬于不同類(lèi)型的支持向量。參數(shù)C是一個(gè)自定義的懲罰因子,對(duì)不同樣本的隸屬度賦予不同的C值可以達(dá)到對(duì)不同的樣本采用不同程度的懲罰作用[8]。
在SVM方法中,最優(yōu)分類(lèi)面主要由支持向量決定,支持向量位于類(lèi)邊緣,而野值或含噪聲的樣本常常也位于類(lèi)邊緣附近,例如含有野值或噪聲樣本的支持向量如圖1所示。前人已經(jīng)研究了利用距離和S函數(shù)來(lái)解決以上問(wèn)題,確定有效的隸屬度函數(shù)[7,9],由于這兩種方法都是依據(jù)樣本到類(lèi)中心之間的距離確定樣本的隸屬度,對(duì)類(lèi)中每個(gè)樣本都要按照同一種方式進(jìn)行考慮,對(duì)有效樣本與含有異常信息樣本的分離效果不太好,故不能有效地反映樣本的不確定性。
圖1 含有野值或噪聲樣本示意圖Fig.1 Diagram of samples with outliers or noise
針對(duì)以上問(wèn)題,引入緊密度來(lái)改善隸屬度函數(shù),如圖2兩個(gè)不同類(lèi)中樣本之間緊密度的差別。在圖2(a)與(b)中,樣本x到它們所在類(lèi)中心之間的距離相等,若僅依據(jù)距離來(lái)確定隸屬度則兩者的隸屬度相同。然而,若考慮圖2(a)中樣本x與類(lèi)中其他樣本之間的距離遠(yuǎn)小于圖2(b)中的距離這一情況,那么圖2(a)中樣本x屬于所在類(lèi)的隸屬度應(yīng)大于圖2(b)中的。
圖2 兩個(gè)不同類(lèi)中樣本之間緊密度的差別示意圖Fig.2 Affinity contrast from two classified samples
針對(duì)以上情況,嘗試在確定樣本的隸屬度時(shí),充分考慮樣本到所在類(lèi)中心之間的距離和樣本與類(lèi)中其他樣本之間的關(guān)系,然而樣本與類(lèi)中其他樣本之間的關(guān)系可通過(guò)類(lèi)中樣本的緊密度來(lái)反映,每種類(lèi)別對(duì)應(yīng)一個(gè)球,于是可以得到訓(xùn)練支持向量機(jī)的k個(gè)球(am,Rm),其中am是包圍m類(lèi)樣本球的球心,Rm為球的半徑,稱(chēng)這種方法為球緊密度隸屬度確定方法。
由上述分析可得到球緊密度FSVM的隸屬度函數(shù)[10]定義如下:
式中:d(xi)= φ(xi-ayi),σ∈(0,1)。關(guān)于 σ 的取值,本文利用交叉確認(rèn)的方法獲得它的最優(yōu)值,即對(duì)應(yīng)FSVM分類(lèi)精度最高時(shí)的σ值。
航空發(fā)動(dòng)機(jī)整機(jī)振動(dòng)故障是多類(lèi)故障診斷問(wèn)題,需要建立多類(lèi)SVM分類(lèi)器。對(duì)于多分類(lèi)問(wèn)題,常用算法有一對(duì)多組合(one against rest,1-a-r)方法、一對(duì)一組合(one against one,1-a-l)方法和有向非循環(huán)圖法 SVM(Direeted Acyclic Graph SVM,DAGSVM)方法[11]。FSVM多分類(lèi)問(wèn)題是在這些方法的基礎(chǔ)上,構(gòu)造隸屬函數(shù)以減少不可分區(qū)域,達(dá)到解決問(wèn)題的目的。同理,將其推廣到FSVM的第一種形式,便得到了基于1-a-a的FSVM多分類(lèi)算法。
在這種算法中,對(duì)于一個(gè)k類(lèi)分類(lèi)問(wèn)題有訓(xùn)練樣本如下:
式中:xi∈RN;yi∈{1,2,…,k};0 < μ(xi)≤1。
定義1:對(duì)于 RN上的一類(lèi)點(diǎn){x1,x2,…,xn},記 xc為類(lèi)中心點(diǎn),r為類(lèi)半徑。其中:
根據(jù)一對(duì)多組合思想進(jìn)行分類(lèi),即依次訓(xùn)練k個(gè)兩類(lèi)分類(lèi)器,并且每次訓(xùn)練過(guò)程都是引入模糊性的(即事先為每個(gè)樣本xi生成一個(gè)模糊隸屬度μ(xi))。假如現(xiàn)在要將第l類(lèi)和剩余樣本分開(kāi),根據(jù)上述定義易得到第l類(lèi)的中心點(diǎn)(記為x+),類(lèi)半徑記為r+;將剩余樣本看做另一類(lèi),其中心點(diǎn)記為x-,類(lèi)半徑記為 r-。引入一個(gè)充分小的δ避免μ(xi)=0,因此,模糊隸屬度μ(xi)可定義為:
接下來(lái)進(jìn)行FSVM的訓(xùn)練過(guò)程,每次可得一個(gè)兩類(lèi)分類(lèi)器。當(dāng)所有訓(xùn)練結(jié)束時(shí),根據(jù)式(3)可以得到k個(gè)兩類(lèi)最優(yōu)分類(lèi)器:
對(duì)于新給的測(cè)試樣本x被分入:
依照上述步驟可以有效地對(duì)多類(lèi)的故障樣本進(jìn)行分析和分類(lèi)。
本文以航空發(fā)動(dòng)機(jī)整機(jī)為研究對(duì)象,振動(dòng)數(shù)據(jù)來(lái)源于某航空發(fā)動(dòng)機(jī)研究單位臺(tái)架試驗(yàn)數(shù)據(jù)庫(kù)里的5個(gè)典型截面的9個(gè)垂直和水平方向振動(dòng)數(shù)據(jù),5個(gè)典型截面劃分[2]如表1所示。
表1 航空發(fā)動(dòng)機(jī)整機(jī)振動(dòng)測(cè)點(diǎn)位置選擇Tab.1 Location choice of the Aero-engine whole-body vibration measuring point
這些振動(dòng)數(shù)據(jù)包括臺(tái)架松動(dòng)、動(dòng)靜碰磨、軸系不對(duì)中和轉(zhuǎn)子不平衡4種典型故障的大量數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行整理和分析之后,每個(gè)測(cè)點(diǎn)選取了包括4種典型故障的40組數(shù)據(jù),共360組數(shù)據(jù),有9個(gè)訓(xùn)練樣本集。將此數(shù)據(jù)經(jīng)過(guò)預(yù)處理后形成高維空間向量,利用信息增益的方法進(jìn)行特征降維,向量中的每個(gè)權(quán)重根據(jù)極值原理求得。FSVM模型中,本文選擇GRBF核函數(shù),高斯分布寬度參數(shù)δ取4,懲罰參數(shù)C取361。利用交叉確認(rèn)的方式找出σ的最優(yōu)值為0.8,此時(shí)對(duì)應(yīng) FSVM的最高診斷正確率為94.81%。圖3給出了不同的σ值對(duì)緊密度FSVM對(duì)數(shù)據(jù)樣本正確分類(lèi)的影響。
圖3 不同的σ值相對(duì)應(yīng)緊密度FSVM分類(lèi)的正確率Fig.3 Classified accurate rate of affinity FSVM to σ
在基于FSVM的航空發(fā)動(dòng)機(jī)整機(jī)振動(dòng)故障分析過(guò)程中,本文以故障的診斷為例進(jìn)行故障分析,先用9個(gè)測(cè)點(diǎn)的90組(即每個(gè)測(cè)點(diǎn)選取10組,包括4種典型故障的數(shù)據(jù))訓(xùn)練樣本建立FSVM診斷模型,再將每個(gè)測(cè)點(diǎn)剩余的30組測(cè)試樣本輸入FSVM網(wǎng)絡(luò)訓(xùn)練模型,然后采用決策規(guī)則對(duì)該模型的輸出進(jìn)行判斷,確定樣本所屬的類(lèi)別。為檢驗(yàn)基于緊密度FSVM故障診斷方法的有效性,基于相同的診斷樣本,分別采用BP神經(jīng)網(wǎng)絡(luò)、傳統(tǒng)SVM、基于類(lèi)中心距FSVM進(jìn)行了故障診斷,其結(jié)果如表2所示。
表2 航空發(fā)動(dòng)機(jī)整機(jī)振動(dòng)故障診斷結(jié)果及比較Tab.2 Diagnosis results and their comparison of aeroengine whole-body vibration fault
表3 有噪聲干擾條件下的診斷結(jié)果Tab.3 Diagnostic results with noise interference
從計(jì)算結(jié)果可以看出,BP神經(jīng)網(wǎng)絡(luò)診斷結(jié)果最差,正確率僅為81.85%,這說(shuō)明在小樣本情況下,神經(jīng)網(wǎng)絡(luò)診斷方法不如SVM診斷方法有效;其他三種方法診斷結(jié)果相比較,基于緊密度FSVM的故障診斷準(zhǔn)確率(90.37%)比常規(guī)SVM故障診斷準(zhǔn)確率(85.93%)和基于類(lèi)中心距FSVM診斷準(zhǔn)確率(87.41%)明顯提高,驗(yàn)證了基于緊密度隸屬度FSVM的故障診斷方法的有效性和可行性。
為了檢驗(yàn)基于緊密度FSVM診斷系統(tǒng)在有噪聲干擾條件下的診斷能力,給輸入數(shù)據(jù)疊加信噪比為2的高斯白噪聲信號(hào),經(jīng)診斷后得到分類(lèi)正確率為88.33%;為了體現(xiàn)出基于緊密度FSVM的抗噪聲能力,基于同樣的診斷樣本和疊加相同的噪聲,也分別利用SVM和類(lèi)中心距FSVM進(jìn)行故障分析,其結(jié)果如表3所示。由表3可以看出:在強(qiáng)噪聲干擾情況下,基于緊密度FSVM的診斷正確率能達(dá)到88.33%,而傳統(tǒng)SVM和類(lèi)中心距FSVM的診斷精確度分別為83.06%和85.83%。緊密度FSVM診斷精度雖然沒(méi)有無(wú)噪聲干擾情況下的診斷精確度高,但仍然明顯優(yōu)于SVM和類(lèi)中心距FSVM的診斷精確度,可見(jiàn)在強(qiáng)噪聲干擾情況下基于緊密度FSVM診斷系統(tǒng)仍能對(duì)輸入樣本很好地分類(lèi),這說(shuō)明FSVM具有很強(qiáng)的魯棒性和容錯(cuò)能力。
(1)針對(duì)航空發(fā)動(dòng)機(jī)整機(jī)振動(dòng)故障信息不確定性、模糊性和故障樣本缺乏的突出問(wèn)題,對(duì)FSVM傳統(tǒng)的隸屬度確定函數(shù)進(jìn)行改進(jìn),介紹了基于緊密度函數(shù)的隸屬度確定方法。
(2)將FSVM融合分析方法應(yīng)用到航空發(fā)動(dòng)機(jī)整機(jī)振動(dòng)故障診斷中。首先通過(guò)交叉驗(yàn)證的方法確定FSVM理論中σ的最優(yōu)值;再通過(guò)實(shí)例計(jì)算與分析,驗(yàn)證了無(wú)論在無(wú)噪聲干擾情況下還是在有強(qiáng)噪聲干擾下該方法故障診斷正確率比采用BP神經(jīng)網(wǎng)絡(luò)方法、SVM方法和類(lèi)中心距FSVM方法的正確率高,顯示了強(qiáng)大的分類(lèi)性能和抗噪性能力的優(yōu)點(diǎn)。在一定程度上為航空發(fā)動(dòng)機(jī)整機(jī)振動(dòng)故障有效、準(zhǔn)確地診斷與分析提供了一種新的方法。
[1]費(fèi)成巍,艾延廷.航空發(fā)動(dòng)機(jī)健康管理系統(tǒng)設(shè)計(jì)技術(shù)[J].航空發(fā)動(dòng)機(jī),2009,35(5):24-29.
[2]費(fèi)成巍,艾延廷,王 蕾,等.基于支持向量機(jī)的航空發(fā)動(dòng)機(jī)整機(jī)振動(dòng)故障診斷技術(shù)研究[J].沈陽(yáng)航空工業(yè)學(xué)院學(xué)報(bào),2010,27(2):29-33.
[3] Ding W D,Yuan J Q.Spike sorting based on multi-class support vector machine with super position resolution [J].Medical & Biological Engineering & Computing,2008,46(5):139-145.
[4] Liu Y H,Huang H P.Fuzzy support vector machines for pattern recognition and data mining[J].Internation Journal of Fuzzy Systems,2002,4(3):826-835.
[5]Mao Y,Xia Z,Yin Z,et al.Fault diagnosis based on fuzzy support vector machine with parameter tuning and feature selection[J].Chinese Journal of Chemical Engineering,2009,15(2):233-239.
[6]張 翔,肖小玲,徐光祐.模糊支持向量機(jī)中的隸屬度的確定與分析[J].中國(guó)圖像圖形學(xué)報(bào),2009,11(8):1188-1192.
[7] Lin CF,Wang SD.Fuzzy support vector machines[J].IEEE Transactions on Neural Networks,2002,13(2):464-471.
[8]張秋余,竭 洋,李 凱.模糊支持向量機(jī)中隸屬度確定新方法[J].蘭州理工大學(xué)學(xué)報(bào),2009,35(4):89-93.
[9] Bian Z Q,Zhang X G.Pattern recognition[M].Beijing:Tsinghua University Press,2000.
[10]艾 青,秦玉平,方 輝,等.一種擴(kuò)展的緊密度模糊支持向量機(jī)及其在文本分類(lèi)中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟件,2010,27(4):45-47.
[11]劉泰安,梁永全,薛 辛.一種新的模糊支持向量機(jī)多分類(lèi)算法[J].計(jì)算機(jī)應(yīng)用研究,2008,25(7):2041-204.