韓亞洲,張 波,段禮祥,于興軍,范向增
(1.寶雞石油機(jī)械有限責(zé)任公司,陜西 寶雞 721000;2.中國(guó)石油大學(xué)(北京)機(jī)械與儲(chǔ)運(yùn)工程學(xué)院,北京 102249)
往復(fù)壓縮機(jī)是石油石化領(lǐng)域廣泛使用的關(guān)鍵設(shè)備,在油田現(xiàn)場(chǎng),占A類(lèi)設(shè)備總數(shù)的30%以上。由于往復(fù)壓縮機(jī)結(jié)構(gòu)復(fù)雜,運(yùn)動(dòng)零件多,激勵(lì)源多,故障率較高[1]。其中氣閥是發(fā)生故障最頻繁的部件,閥片斷裂、彈簧失效和閥片磨損是常見(jiàn)故障,占?xì)忾y故障的75%左右。氣閥故障[2]會(huì)引發(fā)連鎖反應(yīng),導(dǎo)致氣缸活塞系統(tǒng)進(jìn)一步損壞,因此,對(duì)往復(fù)壓縮機(jī)氣閥進(jìn)行狀態(tài)監(jiān)測(cè)與故障診斷具有十分重要的意義[3]。
目前人工神經(jīng)網(wǎng)絡(luò)[4-6]等智能算法在機(jī)電設(shè)備故障診斷中得到了大量的應(yīng)用。但對(duì)于壓縮機(jī)這種大型設(shè)備來(lái)說(shuō),獲得大量的故障樣本數(shù)據(jù)比較困難。因此,應(yīng)用人工神經(jīng)網(wǎng)絡(luò)算法具有一定的局限性,而SVM[7-10]能夠在現(xiàn)有的信息下尋找到最優(yōu)解,尤其在解決小樣本、非線性、局部極小等問(wèn)題上具有獨(dú)特的優(yōu)勢(shì),因此更適合應(yīng)用到壓縮機(jī)的故障診斷中。在SVM算法中,懲罰因子和核函數(shù)的選擇對(duì)診斷精度有很大的影響。目前參數(shù)優(yōu)化的算法主要有網(wǎng)格搜索法[11]、粒子群算法[12]、遺傳算法等,其中粒子群算法和遺傳算法屬于啟發(fā)式算法,優(yōu)點(diǎn)是尋優(yōu)速度快,但在算法后期易陷入局部極小點(diǎn);網(wǎng)格搜索法遍歷所有參數(shù)組合,在設(shè)定合適的搜索范圍和步距的前提下,可以快速搜索到最優(yōu)參數(shù)組合。本文將網(wǎng)格搜索法運(yùn)用到SVM參數(shù)尋優(yōu)中,對(duì)油田現(xiàn)場(chǎng)大量的歷史數(shù)據(jù)樣本進(jìn)行統(tǒng)計(jì),對(duì)往復(fù)壓縮機(jī)氣閥常見(jiàn)故障進(jìn)行分類(lèi)識(shí)別,可以快速準(zhǔn)確地診斷出壓縮機(jī)氣閥的故障。
支持向量機(jī)(SVM)是一種以統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ),以結(jié)構(gòu)風(fēng)險(xiǎn)最小化為原則的數(shù)據(jù)挖掘技術(shù),該技術(shù)是Vapnik在1995年提出的,在模式識(shí)別領(lǐng)域得到了廣泛應(yīng)用。
支持向量機(jī)在數(shù)據(jù)分類(lèi)時(shí)要求最優(yōu)的超平面,對(duì)于樣本集(xi,yi),x∈Rn,i=1,2,…,N,N是訓(xùn)練樣本數(shù)目,n是樣本空間維數(shù),y∈{-1,+1}是類(lèi)別號(hào),線性可分的超平面如圖1所示。
H為兩類(lèi)樣本線性可分的超平面,H1和H2為過(guò)兩類(lèi)樣本并且離超平面最近點(diǎn)的直線,它們之間的距離為分類(lèi)距離。超平面的方程為
w·x+b=0
(1)
H1和H2的直線方程為
w·x1+b=+1
(2)
w·x2+b=-1
(3)
其中w是超平面的法向量,b是超平面的常項(xiàng)。
聯(lián)立式(2)和式(3)可以得出分類(lèi)距離為
(4)
要使得分類(lèi)間隔最大,等價(jià)于求下式的最小值
(5)
同時(shí),還需要滿(mǎn)足以下方程,使得能夠?qū)⑺袠颖具M(jìn)行正確分類(lèi)
yi(w·xi+b)-1≥0i=1,2,…,n
(6)
式(5)和式(6)是最優(yōu)分類(lèi)超平面的2個(gè)基本條件,其中式(6)取等號(hào)的點(diǎn)為支持向量,直線H1和H2上的點(diǎn)就是支持向量。
根據(jù)相關(guān)理論,該問(wèn)題就轉(zhuǎn)化為在式(6)的約束下求式(5)的最小值,目標(biāo)函數(shù)Φ(w,b)是一個(gè)二次型函數(shù),有唯一的最小值,可以構(gòu)造拉格朗日函數(shù)進(jìn)行求解,拉格朗日函數(shù)如下
αi≥0,i=1,2,…,n
(7)
其中αi是拉格朗日系數(shù)。
對(duì)上式中的w、b、αi分別求偏導(dǎo)并令其等于零,可得
(8)
(9)
(10)
經(jīng)運(yùn)算整理后可得最優(yōu)化問(wèn)題轉(zhuǎn)化為下列問(wèn)題
(11)
(12)
αi≥0,i=1,2,…,n
(13)
(14)
(15)
其中x*(-1)和x*(1)分別表示兩類(lèi)的任意某個(gè)支持向量。
對(duì)于線性不可分問(wèn)題,一個(gè)超平面不能完全把樣本區(qū)分開(kāi)來(lái),于是引入了廣義超平面的概念,在超平面方程中加了松弛變量ξi,原方程變?yōu)?/p>
yi(w·xi+b)-1≥1-ξii=1,2,…,n
(16)
同時(shí)在目標(biāo)函數(shù)Φ(w,b)中引入了懲罰項(xiàng),其中c為懲罰因子
(17)
式中:c為常數(shù),它控制對(duì)錯(cuò)分樣本懲罰程度,若c過(guò)大,就會(huì)導(dǎo)致過(guò)學(xué)習(xí),影響分類(lèi)器的泛化能力,由此可見(jiàn)c是個(gè)重要參數(shù)。
與線性可分情況類(lèi)似,也是構(gòu)造拉格朗日函數(shù)求最優(yōu)解,在此不詳述。
對(duì)于非線性問(wèn)題,引入了核函數(shù),從而原空間中線性不可分的樣本通過(guò)核函數(shù)的非線性映射,在高維空間中就可以實(shí)現(xiàn)線性分類(lèi)。
核函數(shù)不同,就可以構(gòu)造不同的分類(lèi)決策函數(shù),核函數(shù)通常有以下幾種核函數(shù)
(1)多項(xiàng)式核函數(shù)
K(x,y)=[(x·y)+1]d
(18)
(2)徑向基核函數(shù)
(19)
(3)Sigmoid核函數(shù)
K(x,y)=tanh[v(x·y)+α]
(20)
式(18)、(19)、(20)中:參數(shù)d、σ、α分別是核函數(shù)的重要參數(shù),核函數(shù)的選擇會(huì)影響SVM的分類(lèi)性能,影響SVM分類(lèi)精度。
綜上所述,懲罰參數(shù)c和核函數(shù)參數(shù)d、σ、α是影響SVM分類(lèi)器性能的關(guān)鍵參數(shù),所以本文以(c,d)、(c,σ)、(c,α)作為尋優(yōu)參數(shù)組合。
采用網(wǎng)格搜索法對(duì)參數(shù)組合進(jìn)行尋優(yōu),該方法首先選定懲罰因子和核函數(shù)參數(shù)的取值范圍,設(shè)定搜索步距,形成一個(gè)二維網(wǎng)格,然后搜索網(wǎng)格,對(duì)參數(shù)組合進(jìn)行優(yōu)化,得到識(shí)別率最高的參數(shù)組合。
當(dāng)選擇多項(xiàng)式核函數(shù)時(shí),需要優(yōu)化懲罰因子c和多項(xiàng)式階次d,其中c取值20、24、25和26,d取正整數(shù)1、2、3、4、5。圖2為不同c值下核函數(shù)參數(shù)d和識(shí)別率的關(guān)系曲線,當(dāng)c=32,d=1和c=64,d=1時(shí),識(shí)別率最高為88.57%,但是c偏大,容易存在過(guò)訓(xùn)練問(wèn)題,所以最優(yōu)參數(shù)組合為c=32,d=1。
圖2 多項(xiàng)式核函數(shù)參數(shù)d和識(shí)別率的關(guān)系圖
當(dāng)選擇徑向基核函數(shù)時(shí),需要優(yōu)化懲罰因子c和核參數(shù)寬度σ,其中c取值20、24、25和26,σ取值0.125、0.25、0.5、1、2、3、4、5。圖3為不同c值下參數(shù)σ和識(shí)別率的關(guān)系曲線,當(dāng)c=1,σ取不同值時(shí),識(shí)別率都比較低,隨著c的不斷增大,識(shí)別率增大后又減小。其中當(dāng)c=32,σ=0.5和c=64,σ=0.5時(shí),識(shí)別率為94.29%,但是懲罰因子c值越大,對(duì)錯(cuò)分樣本的懲罰越大,會(huì)存在過(guò)訓(xùn)練的問(wèn)題。因此,最優(yōu)參數(shù)組合為c=32,σ=0.5。
圖3 徑向基核函數(shù)參數(shù)σ和識(shí)別率的關(guān)系
通過(guò)以上的分析和驗(yàn)證,選擇多項(xiàng)式、徑向基和Sigmoid核函數(shù)時(shí),對(duì)氣閥狀態(tài)識(shí)別的識(shí)別率分別為88.57%、94.29%和91.43%,同時(shí)多項(xiàng)式核函數(shù)比較復(fù)雜,局部性差,Sigmoid核函數(shù)并不常用。綜合考慮,對(duì)氣閥故障識(shí)別時(shí),選擇徑向基核函數(shù)(圖4)。
圖4 Sigmoid核函數(shù)參數(shù)γ和識(shí)別率的關(guān)系圖
以西部某油田一聯(lián)合站的一臺(tái)壓縮機(jī)為例進(jìn)行氣閥故障診斷研究,用某大學(xué)研制的MDES-5機(jī)械設(shè)備故障診斷儀采集氣閥閥蓋處的振動(dòng)信號(hào)。
對(duì)氣閥振動(dòng)信號(hào)進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解,將歸一化的固有模態(tài)分量作為特征參數(shù),輸入SVM訓(xùn)練。選取該壓縮機(jī)2005年到2010年采集的數(shù)據(jù)作為訓(xùn)練樣本,其中氣閥正常訓(xùn)練樣本30個(gè),閥片斷裂、彈簧失效和閥片磨損時(shí)訓(xùn)練樣本各8個(gè),部分訓(xùn)練樣本如表1所示。
通過(guò)表1中已知樣本特征向量的對(duì)比可以得出:閥片斷裂后,高頻分量增大,低頻分量減小,即E1/E增大,E8/E減??;彈簧失效后低頻分量增大,高頻分量減小,即E8/E增大,E1/E減小;閥片磨損后,高低頻分量同時(shí)有所增大,即E1/E和E8/E同時(shí)增大。因此可以考慮選擇E1/E和E8/E為2個(gè)主要特征,識(shí)別氣閥的4種運(yùn)行狀態(tài)。用svmplot函數(shù)繪制識(shí)別結(jié)果可視化圖形,然后分別對(duì)氣閥正常和閥片斷裂、氣閥正常和彈簧失效、氣閥正常和閥片磨損等三組問(wèn)題進(jìn)行分類(lèi)識(shí)別。
表1 氣閥各狀態(tài)下的部分訓(xùn)練樣本
圖5~7分別為氣閥正常和閥片斷裂、氣閥正常和彈簧失效、氣閥正常和閥片磨損的識(shí)別結(jié)果,其中閥片斷裂樣本分布在右下角,彈簧失效樣本分布在左上角,閥片磨損樣本分布在右上角,四類(lèi)樣本得到了很好的分離。
圖5 氣閥正常和閥片斷裂識(shí)別圖(訓(xùn)練樣本)
為了驗(yàn)證該方法識(shí)別的有效性,對(duì)2011年到2012年采集的16個(gè)未知樣本進(jìn)行預(yù)測(cè),預(yù)測(cè)樣本如表2所示。
表2 氣閥未知狀態(tài)下的預(yù)測(cè)樣本
從預(yù)測(cè)結(jié)果可以看出,支持向量機(jī)將16個(gè)未知樣本劃分為四類(lèi),和已知訓(xùn)練樣本的識(shí)別結(jié)果圖對(duì)比得出,11個(gè)為正常樣本,2個(gè)為彈簧失效,2個(gè)為閥片磨損,1個(gè)為閥片斷裂,該診斷結(jié)果和現(xiàn)場(chǎng)對(duì)比發(fā)現(xiàn),有1個(gè)樣本診斷錯(cuò)誤,誤將氣閥存在大量積碳診斷為正常,原因是氣閥訓(xùn)練樣本還不全面。但從現(xiàn)場(chǎng)應(yīng)用來(lái)講,該方法基本可以識(shí)別氣閥的4種基本狀態(tài),則訓(xùn)練樣本識(shí)別圖可以作為標(biāo)準(zhǔn)圖譜,為后續(xù)的診斷提供指導(dǎo)。
圖6 氣閥正常和彈簧失效識(shí)別圖(訓(xùn)練樣本)
氣閥故障的診斷和識(shí)別對(duì)于現(xiàn)場(chǎng)往復(fù)壓縮機(jī)的視情維修具有十分重要的意義。本文將固有模態(tài)分量的能量特征作為支持向量機(jī)的輸入,對(duì)已知的統(tǒng)計(jì)樣本進(jìn)行訓(xùn)練,建立分類(lèi)模型,繪制可視化識(shí)別圖形,作為后續(xù)診斷的標(biāo)準(zhǔn)和參照。在此基礎(chǔ)上對(duì)未知樣本進(jìn)行預(yù)測(cè),識(shí)別結(jié)果和現(xiàn)場(chǎng)驗(yàn)證基本保持一致。表明優(yōu)化的支持向量機(jī)方法可以有效識(shí)別往復(fù)壓縮機(jī)氣閥的常見(jiàn)故障,可以在油田現(xiàn)場(chǎng)推廣應(yīng)用(圖8)。
圖8 氣閥未知狀態(tài)識(shí)別圖(預(yù)測(cè)樣本)