肖 軍,舒 悅,謝傳東,劉曉明,劉志龍
(1.合肥通用機(jī)械研究院有限公司 壓縮機(jī)技術(shù)國家重點(diǎn)實(shí)驗(yàn)室,合肥 230031;2.合肥通用環(huán)境控制技術(shù)有限責(zé)任公司,合肥 230031)
往復(fù)壓縮機(jī)是石油、化工等部門廣泛應(yīng)用的重要動力設(shè)備,而氣閥是往復(fù)壓縮機(jī)中最為重要的部件,也是最易損壞的部件之一,在所有故障類型中氣閥故障占比達(dá)36%[1]。因此,開展往復(fù)壓縮機(jī)氣閥故障的診斷方法研究十分必要。王朝暉等[2]應(yīng)用模糊聚類方法從實(shí)測故障數(shù)據(jù)中獲取故障特征,對往復(fù)壓縮機(jī)的氣閥故障進(jìn)行診斷,聚類結(jié)果與實(shí)際情況吻合較好。張思陽等[3]通過對正常、閥片缺口、彈簧失效的實(shí)測信號進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解、重構(gòu)和樣本熵分析,精確提取故障信息,實(shí)現(xiàn)了氣閥缺口和閥少彈簧的故障診斷。馬晉等[4]采用基于混沌分形理論的方法對往復(fù)壓縮機(jī)氣閥的沖擊變化信號進(jìn)行特征提取,把關(guān)聯(lián)維數(shù)作為特征參數(shù),實(shí)現(xiàn)了氣閥故障狀態(tài)的實(shí)時診斷。Ahmed等[5]采用主成分分析法從往復(fù)壓縮機(jī)的14個振動信號特征量中提取有效診斷特征,并通過對Q統(tǒng)計值貢獻(xiàn)的研究發(fā)現(xiàn)了兩個特征量,這兩個量的組合可以實(shí)現(xiàn)對包括吸氣閥故障在內(nèi)的多種故障模式準(zhǔn)確分類。然而,氣閥部件的振動信號十分復(fù)雜,常規(guī)的故障診斷多采用對振動信號進(jìn)行各種特征提取的方法識別故障狀態(tài),能夠準(zhǔn)確識別的故障類型有限。
支持向量機(jī)[6]作為一種基于統(tǒng)計學(xué)習(xí)理論的機(jī)器學(xué)習(xí)方法,在解決小樣本、非線性的問題上具有獨(dú)特的優(yōu)勢,經(jīng)過多年的完善和發(fā)展已經(jīng)在振動故障診斷領(lǐng)域獲得了一定的應(yīng)用。然而,傳統(tǒng)的支持向量機(jī)方法無法解決多故障模式分類的問題。郭創(chuàng)新等[7]提出一種基于多分類多核學(xué)習(xí)的支持向量機(jī)模型,并將其應(yīng)用于變壓器故障診斷,計算實(shí)例表明該模型具有較高的診斷準(zhǔn)確率。楊珮鑫等[8]針對分布式發(fā)電并網(wǎng)保護(hù)的功能需求,采用“一對一”方法建立多分類支持向量機(jī),實(shí)現(xiàn)了對擾動、孤島和故障事件的檢測。然而基于“一對一”或“一對多”[9]的多分類向量機(jī)存在不可分區(qū)域,相比之下,二叉樹支持向量機(jī)具有測試速度快、不存在不可分區(qū)域的優(yōu)點(diǎn)。二叉樹支持向量機(jī)的分類能力依賴于二叉樹結(jié)構(gòu)的生成原理。Govada等[10]實(shí)現(xiàn)了一種基于K均值聚類的二叉樹結(jié)構(gòu)支持向量機(jī)算法,結(jié)果表明,該算法具有與“一對一”方法相近的準(zhǔn)確度,與“一對多”方法相比,在降低訓(xùn)練和測試時間的同時準(zhǔn)確度更高。Qin等[11]對各類樣本構(gòu)造最小包圍超橢球,根據(jù)超橢球體積生成最優(yōu)二叉樹,并采用Statlog數(shù)據(jù)庫訓(xùn)練多分類向量機(jī),數(shù)值試驗(yàn)結(jié)果表明,該算法具有較高的分類精度和分類速度。
本文使用小波包分析方法提取往復(fù)壓縮機(jī)氣閥振動數(shù)據(jù)的特征量,運(yùn)用模糊C均值聚類(FuzzyC-Means Clustering)技術(shù)構(gòu)建二叉樹結(jié)構(gòu),結(jié)合支持向量機(jī)(Support Vector Machine)方法,構(gòu)建了基于二叉樹支持向量機(jī)的多分類器(FCM-SVM),對往復(fù)壓縮機(jī)氣閥的故障類型進(jìn)行準(zhǔn)確診斷。
模糊C均值聚類算法由Dunn[12]和 Bezdek[13]提出,其基本思想是使被劃分到同一聚類的對象之間相似度最大,根據(jù)隸屬度確定每個數(shù)據(jù)點(diǎn)屬于某個聚類的程度。設(shè)xi(i=1,2,…,n)是N個樣本組成的集合,M為聚類中心的數(shù)目,定義聚類損失函數(shù)。
式中m——加權(quán)指數(shù);
uij——第i個樣本對第j類的隸屬度;
cj——第j個聚類中心。
通過以下迭代,使目標(biāo)函數(shù)Jm達(dá)到最優(yōu)。
當(dāng)?shù)諗繒r,即得到各聚類中心及各數(shù)據(jù)點(diǎn)對各類的隸屬度,根據(jù)隸屬度值將樣本歸類。
應(yīng)用支持向量機(jī)方法解決數(shù)據(jù)集 {(xi,yi)|i=1,2,…,l}的非線性分類問題,可使用非線性映射將輸入樣本映射至高維特征空間,通過尋找最優(yōu)分類超平面來實(shí)現(xiàn)數(shù)據(jù)分類。分類超平面的優(yōu)化問題可表述為:
式中w——權(quán)向量;
b——偏置;
ξi——松弛量;
C——懲罰參數(shù);
φ——非線性映射函數(shù)。
引入Lanrange乘子αi和βi,與上述條件極值相應(yīng)的Lanrange函數(shù)為:
分別對w,b和ξi求偏導(dǎo)并令其等于零,得到上述優(yōu)化問題的對偶問題:
相應(yīng)的分類決策函數(shù)為:
其中K(xi,xj)=φT(xi)φ(xj) 為核函數(shù)。αi>0對應(yīng)的數(shù)據(jù)點(diǎn)稱為支持向量,通常支持向量的數(shù)目遠(yuǎn)小于樣本數(shù)。不同的核函數(shù)構(gòu)建不同的分類器,目前最常用的是徑向基核函數(shù)(RBF):
采用序列最小優(yōu)化算法求解對偶問題(5),具體算法參考文獻(xiàn)[14],其空間復(fù)雜度與訓(xùn)練樣本集大小呈線性關(guān)系,能夠有效實(shí)現(xiàn)支持向量機(jī)大樣本學(xué)習(xí)的問題。
結(jié)合模糊聚類分析和支持向量機(jī)的多分類方法可分為知識學(xué)習(xí)和故障識別兩個階段。在知識學(xué)習(xí)階段,采用模糊C均值聚類法構(gòu)建故障診斷完全二叉樹,其基本思想是:運(yùn)用模糊C均值聚類求出每類故障樣本的聚類中心,再對各聚類中心構(gòu)造一棵二叉樹,在二叉樹的各個節(jié)點(diǎn),根據(jù)聚類中心對應(yīng)的訓(xùn)練樣本構(gòu)造學(xué)習(xí)集,訓(xùn)練各個節(jié)點(diǎn)的支持向量機(jī)子分類器,得到基于完全二叉樹的多分類模型,該二叉樹結(jié)構(gòu)如圖1所示。
圖1 基于二叉樹支持向量機(jī)的多分類模型
具體步驟如下:
(1)對于具有N個樣本M個類別的樣本集S,根據(jù)初始隸屬度,利用模糊C均值聚類方法求出每個子集的聚類中心C={c1,c2,…,cM}。
(2)利用模糊C均值聚類法將C聚類為CP和CN兩類。
(3)正類樣本集P1,由屬于CP的各聚類中心對應(yīng)的訓(xùn)練樣本組成,負(fù)類樣本集N1由屬于CN的各聚類中心對應(yīng)的訓(xùn)練樣本組成,訓(xùn)練生成支持向量機(jī)SVM1,形成二叉樹的根節(jié)點(diǎn)。
(4)將CP聚為兩類,正類樣本P2和負(fù)類樣本N2由各聚類中心對應(yīng)的訓(xùn)練樣本組成;同理,將CN聚為兩類,正類樣本P3和負(fù)類樣本N3由各聚類中心對應(yīng)的訓(xùn)練樣本組成。
(5)由正類P2和負(fù)類N2訓(xùn)練生成支持向量機(jī)SVM2,由正類P3和負(fù)類N3訓(xùn)練生成支持向量機(jī)SVM3。
(6)重復(fù)步驟(4)和(5),直至構(gòu)造第M-1個支持向量機(jī)SVMM-1。
(7)由步驟(1)~(6)得到M-1個支持向量機(jī)SVM1,…,SVMM-1,生成二叉樹的中間節(jié)點(diǎn)。
為驗(yàn)證本文提出的二叉樹多分類器的準(zhǔn)確可靠性,首先在UCI機(jī)器學(xué)習(xí)數(shù)據(jù)庫[15]中選用了5組常用于算法性能對比的數(shù)據(jù)集進(jìn)行驗(yàn)證試驗(yàn)見表1,這幾組數(shù)據(jù)兼具了特征維度高和維度低的情況,對分類性能的評價更為客觀。每組數(shù)據(jù)集都被劃分為2部分,取其中2/3作為訓(xùn)練樣本,其余作為準(zhǔn)確性驗(yàn)證的測試樣本,重復(fù)多次劃分取計算的平均正確率。采用本文設(shè)計的算法(FCM-SVM)與各文獻(xiàn)采用的算法進(jìn)行對比,結(jié)果見表2。
表1 選擇的UCI數(shù)據(jù)集
表2 本文算法與其他文獻(xiàn)方法的分類正確率對比
由表2可知,本文算法對5組數(shù)據(jù)集的分類,其正確率均優(yōu)于其他文獻(xiàn)中的計算結(jié)果,特別是對于34維的Ionosphere數(shù)據(jù)集,本文算法的正確率高出近2%,而對于大樣本的Vehicle數(shù)據(jù)集,正確率高出4.3%。通過UCI數(shù)據(jù)集分類試驗(yàn),表明了本文算法用于數(shù)據(jù)分類的準(zhǔn)確性。
為采集不同狀態(tài)下的往復(fù)壓縮機(jī)振動試驗(yàn)數(shù)據(jù),在往復(fù)壓縮機(jī)故障診斷試驗(yàn)臺上安裝了正常狀態(tài)及4種故障狀態(tài)的氣閥閥片進(jìn)行故障模擬試驗(yàn),閥片的4種故障狀態(tài)分別為內(nèi)環(huán)鋸斷、內(nèi)環(huán)兩瓣、內(nèi)環(huán)中環(huán)兩瓣及三環(huán)兩瓣。加速度傳感器布置在氣閥的閥蓋上,采樣頻率為20 kHz,針對不同故障工況選取一個完整采樣周期0.1 s的振動信號繪制時域波形,圖2示出內(nèi)環(huán)兩瓣故障和正常工況采集的振動信號。對于往復(fù)壓縮機(jī)缸體,氣閥閥片撞擊閥座和升程限制器時產(chǎn)生的沖擊脈沖是一個重要的激振源,如果氣閥發(fā)生故障,沖擊激勵的變化必然引起閥蓋振動特性的變化。由圖可見,氣閥故障發(fā)生時的振動幅值要小于正常工況,但時域振動信號并不能很直觀地反映故障特征,如何區(qū)分各類故障還需要對振動信號做進(jìn)一步分析。
圖2 吸氣閥振動信號
往復(fù)壓縮機(jī)氣閥的振動信號具有非平穩(wěn)性和沖擊性,在特征提取過程中應(yīng)盡可能將信號的頻率成分進(jìn)行細(xì)分。小波包分析[20]能夠有效劃分信號頻帶,并進(jìn)行不同頻帶的能量譜分析,在保持小波分析優(yōu)良特性的基礎(chǔ)上實(shí)現(xiàn)了對信號高頻部分更加細(xì)致的刻畫。本文利用小波包方法對氣閥振動信號進(jìn)行分解,在不同頻帶下重構(gòu)得到信號的各頻帶波形,提取信號各頻帶的能量作為特征量。圖3示出閥片內(nèi)環(huán)兩瓣故障時,一個采樣周期其振動信號經(jīng)3層小波包分解后8個頻帶的重構(gòu)信號,小波類型采用dmey。由圖可見,除缸內(nèi)氣流脈動引起的低頻信號外,由閥片撞擊閥座和升程限制器引起的高頻信號能量亦非常顯著。
圖3 閥片內(nèi)環(huán)兩瓣時各頻帶重構(gòu)信號
采集閥片在4類故障狀態(tài)和1類正常狀態(tài)下的振動信號,對每組信號提取小波包分解后8個頻帶范圍的信號能量作為特征量,構(gòu)成氣閥故障診斷的高維樣本數(shù)據(jù)。每種狀態(tài)選取40組樣本數(shù)據(jù)共200組樣本數(shù)據(jù)構(gòu)成訓(xùn)練集,另選取每種狀態(tài)20組樣本數(shù)據(jù)共100組樣本數(shù)據(jù)構(gòu)成測試集,訓(xùn)練樣本和測試樣本的分布見表3。
表3 5類氣閥故障模式信息
應(yīng)用上述多分類器的故障診斷算法,編制Fortran95數(shù)值程序,實(shí)現(xiàn)了氣閥故障診斷流程。先求出5類樣本數(shù)據(jù)所對應(yīng)的聚類中心,再對各類的聚類中心繼續(xù)聚類生成二叉樹的各個節(jié)點(diǎn),最終得到形如圖4所示的完全二叉樹。圖中C~G分別代表5個樣本集,各類樣本的模式標(biāo)記見表3。
圖4 氣閥故障診斷的二叉樹
依據(jù)所確定的二叉樹結(jié)構(gòu),逐個訓(xùn)練4個支持向量機(jī)。在訓(xùn)練過程中,徑向基核函數(shù)參數(shù)γ和懲罰參數(shù)C的選擇十分重要,影響著向量機(jī)的分類性能。本文采用網(wǎng)格搜索的方法優(yōu)化這兩個參數(shù),以正確率最高時的參數(shù)值作為最優(yōu)值,各支持向量機(jī)的參數(shù)設(shè)置見表4。
表4 多分類向量機(jī)參數(shù)的設(shè)置
根據(jù)表中的參數(shù)分別對4個支持向量機(jī)進(jìn)行訓(xùn)練,根據(jù)得到的多分類向量機(jī)對測試樣本進(jìn)行診斷。內(nèi)環(huán)鋸斷故障的測試樣本有1個被識別為正常工況,內(nèi)環(huán)兩瓣故障的測試樣本均能正確識別,內(nèi)環(huán)中環(huán)兩瓣故障有2個樣本分別被識別為內(nèi)環(huán)兩瓣和三環(huán)兩瓣,三環(huán)兩瓣故障有2個樣本被識別為內(nèi)環(huán)中環(huán)兩瓣,正常工況的測試樣本有一個被識別為內(nèi)環(huán)鋸斷故障,各類樣本的識別準(zhǔn)確率見表5。
表5 不同故障的診斷結(jié)果 (%)
該診斷結(jié)果表明本文構(gòu)建的二叉樹向量機(jī)對基于振動監(jiān)測數(shù)據(jù)的氣閥故障診斷效果較好。另由表中結(jié)果,結(jié)合模糊聚類的二叉樹向量機(jī)比“一對多”向量機(jī)的診斷正確率更高。
本文引入模糊C均值聚類和支持向量機(jī)方法構(gòu)建了一種二叉樹結(jié)構(gòu)的多分類器,UCI數(shù)據(jù)集的分類結(jié)果表明其具有較高的分類準(zhǔn)確性。對某往復(fù)壓縮機(jī)氣閥故障模擬試驗(yàn)的振動數(shù)據(jù)進(jìn)行故障模式識別的結(jié)果表明,該方法有效實(shí)現(xiàn)了氣閥故障的準(zhǔn)確診斷。與傳統(tǒng)的“一對多”向量機(jī)方法相比,本文方法的準(zhǔn)確性更高。