靳文博,敬加強(qiáng),田震,孫娜娜,伍鴻飛
(西南石油大學(xué)油氣消防四川省重點(diǎn)實(shí)驗(yàn)室,四川 成都 610500)
基于最小二乘支持向量機(jī)的蠟沉積速率預(yù)測(cè)
靳文博,敬加強(qiáng),田震,孫娜娜,伍鴻飛
(西南石油大學(xué)油氣消防四川省重點(diǎn)實(shí)驗(yàn)室,四川 成都 610500)
考慮蠟沉積影響因素的復(fù)雜性和最小二乘支持向量機(jī)在小樣本預(yù)測(cè)方面的優(yōu)勢(shì),基于最小二乘支持向量機(jī)預(yù)測(cè)的原理,通過(guò)優(yōu)化最小二乘支持向量機(jī)的參數(shù),建立了蠟沉積速率的預(yù)測(cè)模型,并對(duì)蠟沉積速率進(jìn)行了預(yù)測(cè)。結(jié)果表明:該方法在樣本數(shù)量較小時(shí)仍具有較高的精度,蠟沉積速率的預(yù)測(cè)值和實(shí)驗(yàn)值的吻合程度較好;最小二乘支持向量機(jī)建模時(shí)可以得到直觀的函數(shù)表達(dá)式,而神經(jīng)網(wǎng)絡(luò)方法卻不能得到模型的顯式表達(dá)式,因此該方法具有明顯的優(yōu)勢(shì);應(yīng)用徑向基核(RBF)作為核函數(shù)時(shí),不同初值的正則化參數(shù)γ和核函數(shù)寬度σ對(duì)預(yù)測(cè)結(jié)果具有較大影響,使用時(shí)應(yīng)合理選擇。
最小二乘支持向量機(jī);蠟沉積速率;預(yù)測(cè);模型;模型精度
易凝高黏含蠟原油一般采用加熱輸送工藝,其目的主要是降低原油的黏度和改善原油的流動(dòng)性,減少摩阻損失。在加熱輸送的過(guò)程中,由于環(huán)境溫度低于管內(nèi)的原油溫度,因此原油的溫度將不斷降低,當(dāng)其達(dá)到原油的析蠟點(diǎn)時(shí),蠟分子析出,部分蠟分子會(huì)沉積到管壁上形成結(jié)蠟層。蠟沉積使得管道的有效流通面積減少,流動(dòng)阻力增大,給管道的安全經(jīng)濟(jì)運(yùn)行帶來(lái)了很多困難[1-3]。
國(guó)內(nèi)外學(xué)者對(duì)于蠟沉積的研究已開(kāi)展了很多年,目前環(huán)道實(shí)驗(yàn)裝置使用的較多,這為蠟沉積規(guī)律的認(rèn)識(shí)及蠟沉積模型的建立提供了大量的實(shí)驗(yàn)數(shù)據(jù)[4-6]。眾所周知,影響蠟沉積速率的因素多而復(fù)雜,不同的影響因素間又相互影響,這給蠟沉積的研究帶來(lái)了諸多困難。為了進(jìn)一步掌握各因素對(duì)蠟沉積速率的影響規(guī)律,一般要安排大量的實(shí)驗(yàn)才能確定。但是,蠟沉積實(shí)驗(yàn)一般要耗費(fèi)大量的時(shí)間和人力,這使得研究者所得的蠟沉積實(shí)驗(yàn)數(shù)據(jù)一般比較有限。因此,如何利用所得的實(shí)驗(yàn)數(shù)據(jù)建立可靠的預(yù)測(cè)方法和模型就顯得尤為重要。周詩(shī)崠等[7]采用逐步回歸分析法和人工神經(jīng)網(wǎng)絡(luò)法預(yù)測(cè)了蠟沉積速率,結(jié)果表明人工神經(jīng)網(wǎng)絡(luò)法的精度較高。逐步回歸分析法只能描述線性關(guān)系,但計(jì)算速度快且能反映蠟沉積速率與影響因素之間的親疏關(guān)系;人工神經(jīng)網(wǎng)絡(luò)法則可以描述多因素之間的非線性關(guān)系,但計(jì)算速度慢且不能得到蠟沉積速率模型的顯式表達(dá)式。從德勝等[8]利用L-M優(yōu)化方法來(lái)求解模型中的回歸參數(shù),通過(guò)算例證實(shí)了此方法得到的模型精度高于逐步回歸分析法。
管輸含蠟原油蠟沉積速率的影響因素較多,各因素間往往存在著一個(gè)復(fù)雜的非線性關(guān)系,故管道的蠟沉積速率預(yù)測(cè)應(yīng)是一個(gè)多因素的非線性預(yù)測(cè)問(wèn)題。神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線性映射能力和強(qiáng)大的自學(xué)習(xí)能力,可映射任意復(fù)雜的非線性關(guān)系。但是神經(jīng)網(wǎng)絡(luò)受網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性和樣本復(fù)雜性的影響較大,且有時(shí)會(huì)出現(xiàn)過(guò)學(xué)習(xí)、訓(xùn)練時(shí)間長(zhǎng)、低泛化能力以及易陷入局部極小值等問(wèn)題[9]。支持向量機(jī)(support vector machine,SVM) 是近年來(lái)發(fā)展起來(lái)的一種新型學(xué)習(xí)機(jī)器,是統(tǒng)計(jì)學(xué)習(xí)理論的一種通用學(xué)習(xí)方法。它通過(guò)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理來(lái)提高泛化能力,能較好地解決小樣本、非線性、高維數(shù)及局部極小點(diǎn)等實(shí)際問(wèn)題[10-11]。而最小二乘支持向量機(jī)(LS-SVM)是支持向量機(jī)的一種擴(kuò)展,該方法采用最小二乘線性系統(tǒng)作為損失函數(shù),用等式約束替代不等式約束,使得求解過(guò)程變成了解一組等式方程,從而降低了模型的復(fù)雜程度,提高了求解速度[12]?;诖耍疚膶⒆钚《酥С窒蛄繖C(jī)的思想引入到蠟沉積速率的預(yù)測(cè)中,通過(guò)優(yōu)化最小二乘支持向量機(jī)的參數(shù),預(yù)測(cè)了管道的蠟沉積速率,建立了蠟沉積速率的預(yù)測(cè)模型,這對(duì)于蠟沉積規(guī)律的研究具有一定的指導(dǎo)意義。
最小二乘支持向量機(jī)是支持向量機(jī)的一種改進(jìn),它將傳統(tǒng)支持向量機(jī)中的不等式約束改為等式約束,并將解二次規(guī)劃問(wèn)題轉(zhuǎn)化為求解線性方程組問(wèn)題,其基本原理如下:對(duì)于一個(gè)訓(xùn)練樣本集其中xi為輸入數(shù)據(jù),yi為輸出數(shù)據(jù)。用一非線性映射φ(·)把樣本從原空間Rn映射到特征空間φ(xi),這樣可使得非線性回歸問(wèn)題變成高維特征空間的線性回歸問(wèn)題,在這個(gè)高維特征空間中構(gòu)造最優(yōu)決策函數(shù),如式(1)。
基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,此回歸問(wèn)題可以表示為約束優(yōu)化問(wèn)題,如式(2)。
式中,γ為正則化參數(shù);ω為權(quán)向量;ei為誤差變量;b為偏差量。對(duì)于式(2)引入拉格朗日函數(shù),得式(3)。
式中,αi為lagrange乘子(支持向量),對(duì)式(3)優(yōu)化后可得式(4)。
對(duì)式(4)可進(jìn)一步消除變量ω、e,得如下式(5)矩陣方程。
式中,α與b可應(yīng)用最小二乘法從方程式(5)中求得。
Matlab的最小二乘支持向量機(jī)工具箱為蠟沉積速率的預(yù)測(cè)提供了便利,預(yù)測(cè)的步驟如下。①建立學(xué)習(xí)樣本和測(cè)試樣本:基于蠟沉積環(huán)道實(shí)驗(yàn)數(shù)據(jù)[13],以管壁處的剪切應(yīng)力(τ)、管壁處溫度梯度(T')、管壁處蠟分子濃度梯度(C')、原油的動(dòng)力黏度(μ)、流速(υ)、壁溫(TB)以及油溫(TY)這7個(gè)影響因素作為輸入向量,以蠟沉積速率(Wr)作為輸出向量。數(shù)據(jù)共計(jì)38組,取其中的20組作為學(xué)習(xí)樣本,其余樣本為測(cè)試樣本。②數(shù)據(jù)的導(dǎo)入和預(yù)處理:對(duì)讀入的數(shù)據(jù)進(jìn)行預(yù)處理,預(yù)處理的目的主要是可以加快訓(xùn)練速度。所用的函數(shù)為Prestd歸一化函數(shù)。③核函數(shù)的選擇:核函數(shù)有不同的形式,常用的有線性核、多項(xiàng)式核、徑向基核(RBF)等,RBF核只有一個(gè)待定參數(shù),擬合精度較高,文中選取RBF核。④參數(shù)的選?。簩?duì)于采用RBF核的最小二乘支持向量機(jī),其主要參數(shù)是選取正則化參數(shù)γ和核函數(shù)寬度σ,即尋找最優(yōu)的γ和σ組合,使得LS-SVM具有良好的預(yù)測(cè)能力。文中應(yīng)用Matlab工具箱中的Tunelssvm函數(shù)通過(guò)交叉驗(yàn)證尋優(yōu)的方法得到最佳的參數(shù)組合。⑤訓(xùn)練建立模型:利用最小二乘支持向量機(jī)對(duì)學(xué)習(xí)樣本進(jìn)行樣本學(xué)習(xí),得到輸入?yún)?shù)和輸出參數(shù)的關(guān)系。利用Trainlssvm函數(shù)來(lái)訓(xùn)練建立模型,訓(xùn)練結(jié)束后即可得到支持向量和偏差量。⑥測(cè)試樣本預(yù)測(cè):導(dǎo)入預(yù)測(cè)數(shù)據(jù),預(yù)處理后利用Simlssvm函數(shù)對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè),并分析其預(yù)測(cè)的精度。
利用文獻(xiàn)[13]的38組蠟沉積環(huán)道實(shí)驗(yàn)數(shù)據(jù),取其中的20組作為學(xué)習(xí)樣本,其余的18組為測(cè)試樣本來(lái)進(jìn)行預(yù)測(cè)。測(cè)試樣本的數(shù)據(jù)如表1所示。
從表1可見(jiàn),蠟沉積速率的影響因素錯(cuò)綜復(fù)雜,數(shù)據(jù)毫無(wú)任何規(guī)律,因此在多個(gè)影響因素下(7個(gè))建立蠟沉積速率的模型難度較大。此處利用最小二乘支持向量機(jī),依據(jù)上述預(yù)測(cè)步驟,預(yù)測(cè)了測(cè)試樣本的蠟沉積速率值,結(jié)果如圖1所示。
預(yù)測(cè)得到的相關(guān)系數(shù)為0.9832,故該方法的預(yù)測(cè)精度高。偏差量b為5.1577,得到最優(yōu)的參數(shù)組合為:[γ,σ]=[2756.55,208.44]。從圖1中蠟沉積速率的實(shí)驗(yàn)值與預(yù)測(cè)值的結(jié)果可見(jiàn),預(yù)測(cè)值和實(shí)驗(yàn)值的吻合程度較好,因此采用最小二乘支持向量機(jī)來(lái)預(yù)測(cè)蠟沉積速率是可行的。
表1 測(cè)試樣本
圖1 最小二乘支持向量機(jī)預(yù)測(cè)結(jié)果
通過(guò)對(duì)蠟沉積速率實(shí)驗(yàn)數(shù)據(jù)的回歸,可以得出蠟沉積速率與各影響因素間的對(duì)應(yīng)關(guān)系,由此可以得出蠟沉積速率的預(yù)測(cè)模型。
由前述最小二乘支持向量機(jī)的原理中式(6)可得到蠟沉積速率的預(yù)測(cè)式為式(7)。
所得的支持向量αi如表2所示,將其帶入式(7)中即可得到20組學(xué)習(xí)樣本訓(xùn)練后的蠟沉積速率預(yù)測(cè)模型。從該模型可以看出,最小二乘支持向量機(jī)在確定核函數(shù)的形式和相應(yīng)的參數(shù)后,就可以得到預(yù)測(cè)蠟沉積速率的直觀函數(shù)表達(dá)式。從訓(xùn)練的結(jié)果來(lái)看,最小二乘支持向量機(jī)每次訓(xùn)練時(shí)得到的解析式是唯一的,這也是最小二乘支持向量機(jī)的一個(gè)優(yōu)勢(shì)。
表2 支持向量
對(duì)于采用RBF作為核函數(shù)的最小二乘支持向量機(jī)而言,其主要考慮的是參數(shù)γ和σ,這兩個(gè)參數(shù)在很大程度上決定了最小二乘支持向量機(jī)的學(xué)習(xí)能力和泛化能力。文中在預(yù)測(cè)的過(guò)程中,發(fā)現(xiàn)這兩個(gè)參數(shù)取不同的初值對(duì)模型的預(yù)測(cè)結(jié)果具有較大的影響。此處取γ=500,σ=10,以相關(guān)系數(shù)為評(píng)定標(biāo)準(zhǔn),通過(guò)改變?chǔ)煤挺业娜≈祦?lái)分析這兩個(gè)參數(shù)對(duì)預(yù)測(cè)結(jié)果的影響。首先固定γ,變化σ,取其多次預(yù)測(cè)結(jié)果相關(guān)系數(shù)的平均值來(lái)分析σ對(duì)預(yù)測(cè)結(jié)果的影響;之后固定σ,變化γ,探討γ對(duì)預(yù)測(cè)結(jié)果的影響,所得的結(jié)果如圖2和圖3所示。
從圖2可見(jiàn),σ值的改變對(duì)于預(yù)測(cè)結(jié)果的影響很大。隨著σ值的增加,預(yù)測(cè)的精度提高。當(dāng)σ值為10時(shí),預(yù)測(cè)的精度高且相關(guān)系數(shù)變化較?。ǘ啻蔚念A(yù)測(cè)結(jié)果),因此此時(shí)的σ值適合用于最小二乘支持向量機(jī)的預(yù)測(cè)。從圖3可見(jiàn),當(dāng)σ值為10時(shí),預(yù)測(cè)的精度均較高。隨著γ值的增加,預(yù)測(cè)的精度有所提高。當(dāng)γ為100時(shí),預(yù)測(cè)的精度可達(dá)到很高的程度。
圖2γ=500時(shí)相關(guān)系數(shù)隨σ值的變化趨勢(shì)
圖3σ=10時(shí)相關(guān)系數(shù)隨γ值的變化趨勢(shì)
(1)基于室內(nèi)蠟沉積環(huán)道實(shí)驗(yàn)數(shù)據(jù),考慮了7個(gè)影響管輸含蠟原油蠟沉積速率的因素,并將最小二乘支持向量機(jī)的原理引入到蠟沉積速率的預(yù)測(cè)中。結(jié)果表明蠟沉積速率的實(shí)驗(yàn)值和預(yù)測(cè)值之間的吻合程度較好,因此最小二乘支持向量機(jī)可用來(lái)預(yù)測(cè)蠟沉積速率。
(2)利用最小二乘支持向量機(jī),建立了管壁處的剪切應(yīng)力、管壁處溫度梯度、管壁處蠟分子濃度梯度、原油的動(dòng)力黏度、流速、壁溫以及油溫這7個(gè)影響因素與蠟沉積速率之間的預(yù)測(cè)模型。該方法與神經(jīng)網(wǎng)絡(luò)法相比,可得到蠟沉積速率模型的直觀函數(shù)表達(dá)式;該方法與逐步回歸分析法相比,逐步回歸分析法只能描述線性關(guān)系,因此在此方面最小二乘支持向量機(jī)具有明顯的優(yōu)勢(shì)。
(3)當(dāng)采用RBF作為最小二乘支持向量機(jī)的核函數(shù)時(shí),不同初值的正則化參數(shù)γ和核函數(shù)寬度σ對(duì)于預(yù)測(cè)結(jié)果的影響較大,因此具體應(yīng)用時(shí)應(yīng)合理選擇最小二乘支持向量機(jī)的參數(shù),以便使其達(dá)到很好的預(yù)測(cè)效果。
[1] Huang Z Y,Lu Y D,Hoffmann R,et al. The effect of operating temperatures on wax deposition[J].Energy Fuels,2011,25:5180-5188.
[2] 孫百超,王岳,尤國(guó)武. 含蠟原油熱輸管道管壁結(jié)蠟厚度的計(jì)算[J]. 石油化工高等學(xué)校學(xué)報(bào),2003,16(4):48-51.
[3] Hoteit H,Banki R,F(xiàn)iroozabadi A. Wax deposition and aging in flowlines from irreversible thermodynamics[J].Energy Fuels,2008,22(4):2693-2706.
[4] 王霞光,蔡均猛. 模型環(huán)道的蠟沉積實(shí)驗(yàn)[J]. 石油化工高等學(xué)校學(xué)報(bào),2005,18(2):64-66.
[5] Bidmus H O,Mehrotra A K. Solids deposition during “Cold Flow” of wax-solvent mixtures in a flow-loop apparatus with heat transfer[J].Energy Fuels,2009,23:3184-3194.
[6] 黃啟玉,張勁軍,高學(xué)峰,等. 大慶原油蠟沉積規(guī)律研究[J]. 石油學(xué)報(bào),2006,27(4):125-129.
[7] 周詩(shī)崠,吳明. 管道輸送原油蠟沉積速率模型研究[J]. 遼寧石油化工大學(xué)學(xué)報(bào),2004,24(2):73-77.
[8] 從德勝,汪玉春. L-M方法優(yōu)化管輸原油蠟沉積速率模型[J]. 油氣儲(chǔ)運(yùn),2009,28(5):19-21.
[9] 朱家元,張喜斌,張恒喜,等. 多參數(shù)裝備費(fèi)用的支持向量機(jī)預(yù)測(cè)[J]. 系統(tǒng)工程與電子技術(shù),2003,25(6):701-703.
[10] Vapnik V N. An overview of statistical learning theory[J].IEEE Trans Neural Network,1999,10(5):988-999.
[11] 張全明,劉會(huì)金. 最小二乘支持向量機(jī)在電能質(zhì)量擾動(dòng)分類中的應(yīng)用[J]. 中國(guó)電機(jī)工程學(xué)報(bào),2008,28(1):106-110.
[12] 郭輝,劉賀平,王玲. 最小二乘支持向量機(jī)參數(shù)選擇方法及其應(yīng)用研究[J]. 系統(tǒng)仿真學(xué)報(bào),2006,18(7):2033-2036.
[13] 王雪亮. 華池作業(yè)區(qū)管輸原油蠟沉積現(xiàn)象預(yù)測(cè)分析研究[D]. 西安:西安石油大學(xué),2010.
Prediction of wax deposition rate based on least squares support vector machine
JIN Wenbo,JING Jiaqiang,TIAN Zhen,SUN Nana,WU Hongfei
(Oil and Gas Fire Protection Key Laboratory of Sichuan Province,Southwest Petroleum University,Chengdu 610500,Sichuan,China)
Considering the complexity of the influence factors of wax deposition and the advantage of least squares support vector machine in small sample prediction,based on the prediction principles of least squares support vector machine,by optimizing the parameters of least squares support vector machine,the prediction model of wax deposition rate was established and wax deposition rate was predicted. The method had higher accuracy when the samples were fewer,and the prediction results of wax deposition rate was in good agreement with the experimental data. The least squares support vector machine could get the intuitive function expression when it was used to establish the model of wax deposition rate,while neural network method could not get explicit expression. so this method has sufficient preponderance. When the RBF kernel function was used,different initial values of regularization parametersγand kernel bandwidthσhad a greater impact on the predicted results,so it should be used with care.
least squares support vector machine;wax deposition rate;prediction;model;model accuracy
TE83
A
1000-6613(2014)10-2565-05
10.3969/j.issn.1000-6613.2014.10.008
2014-02-17;修改稿日期:2014-04-08。
靳文博(1986—),男,博士研究生,主要從事油氣集輸技術(shù)與理論研究。E-mail jinwenbo725@163.com。聯(lián)系人:敬加強(qiáng),教授,博士生導(dǎo)師。E-mail believemetoo@sina.com。