,,,
(北京化工大學(xué) 化工安全教育部工程研究中心,北京 100029)
工藝管道中影響腐蝕的因素眾多,腐蝕速率與管道內(nèi)的介質(zhì)成分、環(huán)境條件以及管道運(yùn)行時(shí)間等息息相關(guān)[1]。一般情況下,腐蝕影響因素之間相互關(guān)聯(lián),這使得管道內(nèi)的腐蝕情況十分復(fù)雜。此外,管道內(nèi)影響腐蝕的諸多因素也是不斷發(fā)生變化的,這導(dǎo)致難以用函數(shù)表達(dá)式直接建立起影響因素與腐蝕速率之間的關(guān)系。
目前,國(guó)內(nèi)學(xué)者就管道腐蝕速率預(yù)測(cè)問(wèn)題,進(jìn)行了大量研究。喻西崇等[2]在灰色模型的基礎(chǔ)上進(jìn)行了改進(jìn),實(shí)現(xiàn)了管道腐蝕速率趨勢(shì)預(yù)測(cè);張鎮(zhèn)等[3]將灰色理論與人工神經(jīng)網(wǎng)絡(luò)、時(shí)間序列分析方法相結(jié)合,建立了灰色組合模型來(lái)預(yù)測(cè)管道腐蝕速率;王海濤等[4]采用三次指數(shù)平滑法,對(duì)已有的腐蝕速率統(tǒng)計(jì)數(shù)據(jù)進(jìn)行擬合,并對(duì)腐蝕速率進(jìn)行了預(yù)測(cè)分析?,F(xiàn)有研究中的預(yù)測(cè)方法各有特點(diǎn)并且都能夠?qū)艿栏g速率進(jìn)行預(yù)測(cè),但這些方法多從單一角度進(jìn)行分析,未能全面考慮管道腐蝕影響因素及其相關(guān)性和冗余性,這不可避免造成了預(yù)測(cè)誤差;另一方面,用于腐蝕速率預(yù)測(cè)的樣本數(shù)據(jù)有限,因而預(yù)測(cè)準(zhǔn)確性也在一定程度上受到了制約。
因此,為解決有限樣本數(shù)據(jù)條件下工藝管道中腐蝕速率難以估算的問(wèn)題,本工作采用核主成分分析方法對(duì)多種腐蝕影響因素進(jìn)行融合處理,摒棄核主成分分析結(jié)果中貢獻(xiàn)率低的主元變量,將貢獻(xiàn)率高即包含主要信息的主元變量作為輸入,腐蝕速率作為目標(biāo)輸出,建立支持向量機(jī)模型來(lái)對(duì)管道腐蝕速率進(jìn)行預(yù)測(cè)。
核主成分分析(KPCA)是PCA算法的改進(jìn),它采用非線性方法來(lái)提取主成分[5]。KPCA首先對(duì)樣本xk進(jìn)行非線性變換φ(xk),將其映射到高維特征空間F,此時(shí)協(xié)方差矩陣為
上述矩陣的特征值λ和特征向量V滿足以下條件
λV-CV=0(2)
引入非線性函數(shù)φ(xk),可得
λφ(xk)V-φ(xk)CV=0(3)
上式中的特征向量V可由φ(xi)線性表示,即
將式(2)和式(4)代入式(3),并引入核函數(shù)Kij=K(xi,xj)=φ(xi)φ(xj),簡(jiǎn)化后有
mλα-Kα=0(5)
式中:α為核矩陣K的特征向量。對(duì)于任意樣本,在特征空間F中主元φ(x)上的投影為
式中:L為m×m階單位矩陣,系數(shù)為1/m。
支持向量機(jī)(SVM)是一種以統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ),專門處理小樣本情況下非線性分類和回歸問(wèn)題的新穎算法[7],最早由Cortes和Vapnik于1995年提出。在處理回歸問(wèn)題時(shí),其基本思想是通過(guò)一個(gè)非線性映射將低維空間非線性回歸問(wèn)題轉(zhuǎn)換到一個(gè)高維特征空間(Hilbert空間),然后用數(shù)據(jù)集在此高維特征空間中建立模型來(lái)進(jìn)行回歸擬合[8-10]。
本工作選取工藝管道中腐蝕影響因素原始數(shù)據(jù)經(jīng)KPCA融合后累計(jì)貢獻(xiàn)率在85%以上的主元變量作為模型輸入,腐蝕速率為輸出,建立了一個(gè)如圖1所示的支持向量機(jī)模型,該模型為多輸入單數(shù)輸出結(jié)構(gòu)。
圖1 支持向量機(jī)模型結(jié)構(gòu)Fig. 1 Support vector machine model
利用支持向量機(jī)的基本思想,將數(shù)據(jù)集(x1,x2,…,xm)通過(guò)非線性映射φ(x),映射到一個(gè)高維的特征空間,然后用數(shù)據(jù)集X在該空間建立模型來(lái)進(jìn)行線性回歸,回歸函數(shù)形式如下:
f(xi)=ω·φ(xi)+b(8)
式中:ω,b是回歸因子,為模型中待確定參數(shù)。
為求得回歸函數(shù),將上述問(wèn)題轉(zhuǎn)換為下列規(guī)劃問(wèn)題:
約束條件為:
通過(guò)引入拉格朗日函數(shù),將上述的優(yōu)化問(wèn)題轉(zhuǎn)化為L(zhǎng)agrange對(duì)偶問(wèn)題,求解得
將式(11) 代入式(10) 中,可得下式
本工作數(shù)據(jù)源于四川石化某裝置三條精制柴油管道,各管道腐蝕影響因素值及實(shí)測(cè)腐蝕速率分別見表1。表中腐蝕速率由電阻探針在線監(jiān)測(cè)得到,部分影響因素?cái)?shù)據(jù)是經(jīng)采樣分析計(jì)算得出的,壓力和溫度由現(xiàn)場(chǎng)監(jiān)測(cè)儀表得到。
由表1可見:對(duì)于上述三條管道,均選取的影響管道內(nèi)腐蝕速率的主要因素有測(cè)試時(shí)間、壓力、溫度、總硫含量、氮含量、pH、氧含量、流速等8個(gè)。其中,構(gòu)成原始數(shù)據(jù)集的共3個(gè)數(shù)據(jù)集,每個(gè)數(shù)據(jù)集包含24組樣本。選取管道a的24組樣本數(shù)據(jù)作為訓(xùn)練樣本,管道b和c的樣本數(shù)據(jù)作為測(cè)試樣本。
核主成分分析中最關(guān)鍵的是核參數(shù)σ的確定,目前仍無(wú)統(tǒng)一的選擇標(biāo)準(zhǔn)。為研究不同核參數(shù)對(duì)最終預(yù)測(cè)誤差的影響,將KPCA核參數(shù)σ作為單一變量,選用不同的參數(shù)值對(duì)樣本進(jìn)行核主成分分析,建立SVM模型來(lái)預(yù)測(cè)腐蝕速率,并根據(jù)式(13)計(jì)算預(yù)測(cè)結(jié)果的平均相對(duì)誤差。圖2和表2分別為核參數(shù)與誤差的關(guān)系曲線圖及相應(yīng)的計(jì)算數(shù)據(jù)。
由圖2可知,預(yù)測(cè)誤差emape隨著核參數(shù)σ值的增大先減小后增大至不變,當(dāng)σ=100時(shí),emape最小。
利用KPCA對(duì)訓(xùn)練樣本進(jìn)行處理,提取貢獻(xiàn)率較大的前8個(gè)特征值和相對(duì)應(yīng)的貢獻(xiàn)率,各特征值的對(duì)應(yīng)貢獻(xiàn)率如圖3所示,根據(jù)各特征值的貢獻(xiàn)率計(jì)算累計(jì)貢獻(xiàn)率,結(jié)果如表3所示。
由表3可見:前3個(gè)特征值的累計(jì)貢獻(xiàn)率已達(dá)到85%,故選取前三個(gè)特征值所對(duì)應(yīng)的主元作為支持向量機(jī)模型的輸入,建立支持向量機(jī)模型。對(duì)比原始樣本發(fā)現(xiàn),KPCA方法在最大程度保留原始樣本信息的情況下,實(shí)現(xiàn)了樣本維數(shù)的縮減,將樣本維數(shù)由原來(lái)的8維縮減到3維,降低了影響因素間的冗余性,為建立SVM預(yù)測(cè)模型奠定了基礎(chǔ)。
表1 三條管道的腐蝕影響因素及對(duì)應(yīng)腐蝕速率Tab. 1 Corrosion influencing factors and corresponding corrosion rates of three pipes
圖2 核參數(shù)與預(yù)測(cè)誤差關(guān)系曲線Fig. 2 Relationship curve between kernel parameter and prediction error
序號(hào)核參數(shù)平均相對(duì)誤差/%1102.9821021.7131033.0041043.3151053.3261063.32
圖3 特征值貢獻(xiàn)率Fig. 3 Contribution rate of eigenvalues
序號(hào)特征值貢獻(xiàn)率/%累計(jì)貢獻(xiàn)率/%15.88365.8865.8821.4416.1382.0130.7728.6590.6640.4595.1495.8050.1691.9097.7060.0880.9998.6970.040.4599.1480.0280.3199.45
分別運(yùn)用同類型管道b和c的工程數(shù)據(jù),對(duì)管道a樣本數(shù)據(jù)建立的KPCA-SVM預(yù)測(cè)模型進(jìn)行檢驗(yàn),結(jié)果如圖4所示。
(a) 管道b
(b) 管道c圖4 管道腐蝕速率預(yù)測(cè)結(jié)果Fig. 4 Prediction results of corrosion rate of pipeline
由圖4可見:基于KPCA和SVM方法得到的預(yù)測(cè)腐蝕速率與真實(shí)腐蝕速率的趨勢(shì)基本一致,對(duì)管道b、管道c的24個(gè)樣本的腐蝕速率預(yù)測(cè)值均能良好地逼近真實(shí)值。為評(píng)定預(yù)測(cè)效果,根據(jù)式(13)~(15)分別計(jì)算預(yù)測(cè)結(jié)果的平均相對(duì)誤差、絕對(duì)平均誤差及方均根誤差,計(jì)算結(jié)果如表4所示。
表4數(shù)據(jù)表明,KPCA-SVM模型在預(yù)測(cè)同類型管道腐蝕速率時(shí)的三類預(yù)測(cè)誤差均較小,預(yù)測(cè)效果比較符合實(shí)際需求。
表4 腐蝕速率預(yù)測(cè)誤差Tab. 4 Corrosion rate prediction error
(1) 采用KPCA方法,降低了多種腐蝕影響因素間的冗余性,有效縮減了數(shù)據(jù)維數(shù),為后續(xù)腐蝕速率預(yù)測(cè)奠定了基礎(chǔ)。
(2) 當(dāng)KPCA選用徑向基核函數(shù)時(shí),KPCA-SVM模型的預(yù)測(cè)誤差隨著KPCA核參數(shù)σ的增大先減小后增大,最后穩(wěn)定不變。
(3) 由同類型管道實(shí)際工程數(shù)據(jù)對(duì)模型的預(yù)測(cè)效果的檢驗(yàn)結(jié)果可知,基于KPCA和SVM方法建立的模型得到的管道腐蝕速率的預(yù)測(cè)值與真實(shí)值的吻合程度較高,三類誤差均較小,符合實(shí)際要求。