国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于支持向量機-CV的天然氣水合物生成預測

2017-11-04 01:42:41宮清君馬貴陽劉培勝李存磊
石油化工高等學校學報 2017年5期
關(guān)鍵詞:水合物向量天然氣

宮清君, 馬貴陽, 潘 振, 劉培勝, 李存磊

(遼寧石油化工大學 石油與天然氣工程學院,遼寧 撫順 113001)

基于支持向量機-CV的天然氣水合物生成預測

宮清君, 馬貴陽, 潘 振, 劉培勝, 李存磊

(遼寧石油化工大學 石油與天然氣工程學院,遼寧 撫順 113001)

天然氣水合物的生成過程是一個多組分、多物態(tài)的系統(tǒng),存在著復雜的結(jié)晶成核過程,需要考慮壓力、溫度、促進劑、攪拌速度等因素的影響,不但涉及動力學問題還涉及熱力學問題,對其生成很難進行精確預測?;谥С窒蛄繖C理論,結(jié)合實驗數(shù)據(jù),建立支持向量機預測模型來進行天然氣水合物生成時的相平衡壓力預測,采用平均平方誤差、平方相關(guān)系數(shù),以及平方絕對百分比誤差和平均絕對誤差等四種誤差公式對預測精度進行評估,結(jié)果分別為8.370 08×10-5、99.897 6%、0.542 4%、1.990 0%,還對源數(shù)據(jù)進行了歸一化([1,2])預處理以及利用交叉驗證方法對核參數(shù)g(4)和懲罰因子c(1.414 2)進行了優(yōu)化。模擬結(jié)果顯示,由支持向量機預測模型得到的相平衡壓力與實際實驗獲得的相平衡壓力基本一致,預測效果較理想,證明該模型具有較高的準確性和可靠性。

天然氣水合物; 結(jié)晶; 成核; 熱力學; 支持向量機; 交叉驗證

目前,國內(nèi)外學者對NGH的形成條件做了大量的研究,擁有比較完善的預測模型,如國外的van der Waals和Platteeuw建立了具有統(tǒng)計熱力學基礎(chǔ)的vdW-P水合物模型等,國內(nèi)的陳光進和郭天明提出的Chen-Guo水合物模型[6]。BP神經(jīng)網(wǎng)絡(luò)模型預測天然氣水合物生成,是采用以經(jīng)驗風險最小化(Empirical Risk Minimize, ERM)的傳統(tǒng)統(tǒng)計學理論為基礎(chǔ),這樣容易降低BP神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性,甚至出現(xiàn)局部過優(yōu)情況,對于那些小樣本數(shù)據(jù)易導致學習機器泛化能力下降[7]。支持向量機(Support Vector Machine,SVM)是一種建立在VC維(Vapnik-Chervonenkis Dimension)理論和SRM準則基礎(chǔ)之上的預測方法,更具體地說,SVM是結(jié)構(gòu)風險最小化的近似實現(xiàn),適合研究有限樣本、非線性、高維度等方面的問題,比較適合于NGH的生成研究[8-10]。

本文在支持向量機引入天然氣水合物生成預測的研究工作中,構(gòu)建一個分類超平面作為決策曲面,使訓練和測試之間的隔離邊緣被最大化[11],通過非線性核函數(shù)將實驗所獲得的數(shù)據(jù)樣本空間映射到高維線性特征空間,并對模型進行訓練和檢驗,對SVM在天然氣水合物生成預測進行實用性研究,獲得了具有重要研究價值的天然氣水合物生成預測模型。

1 支持向量機的理論基礎(chǔ)

1.1統(tǒng)計學習理論

支持向量機的理論基礎(chǔ)是統(tǒng)計學習理論(SLT),其核心內(nèi)容是VC維、推廣性的界、結(jié)構(gòu)風險最小化(ERM)[12]。

(1) VC維 統(tǒng)計學習理論的核心部分是VC維,其定義是:如果函數(shù)集中的函數(shù)能夠?qū)⒁粋€指示函數(shù)集存在的b個樣本分開成2b種形式,則稱函數(shù)集能把b個樣本打散;函數(shù)集能打散的最大樣本數(shù)目b就是它的VC維。VC維反映的是函數(shù)集的學習能力。

(2)推廣性的界 統(tǒng)計學習理論研究了各種類型的函數(shù)集,其理論指出:在最壞的分布情況下,實際風險與經(jīng)驗風險之間至少以1-η的概率滿足以下關(guān)系式:

式中,R(W)是實際風險值,Remp(W)是經(jīng)驗風險值,b是函數(shù)集的VC維,n是樣本數(shù),η是顯著性水平,(1-η)是置信水平。式(1)表明,實際風險由經(jīng)驗風險和置信范圍兩部分組成。置信范圍受置信水平(1-η)、學習機器的VC維b和訓練樣本數(shù)目n的影響,所以式(1)可以記為:

以上研究經(jīng)驗風險與實際風險之間關(guān)系的系統(tǒng)就稱為推廣性的界。

(3) ERM 統(tǒng)計學習理論提出:在(1)式中,使Remp(W)最小,再折中考慮經(jīng)驗風險和置信范圍之間的關(guān)系進而獲得盡量小的b,最終使實際風險R(W)最小,即為結(jié)構(gòu)風險最小化原則(ERM)。

1.2支持向量機(SVM)的學習機制

(1)支持向量(SV)

支持向量機是統(tǒng)計學習理論(SLT)最新的內(nèi)容,也是目前最實用的部分。其研究最初是從線性可分問題開始的,即線性可分情況下的最優(yōu)分類面,基本原理如圖1所示[13]。圖1中,空心點和實心點分別代表兩類樣本;L為分類線(面),分別是過兩類樣本且離L最近的直線,L1、L2都平行于L,它們之間的距離叫做分類間隔。能保證Remp(W)最小的前提下將兩類樣本分開,且離兩類樣本的間隙最大的分類線(面),稱為最優(yōu)分類線(面),顯然最優(yōu)分類線的(1-η)最小。

圖1 線性可分下的SVM原理示意圖

Fig.1SchematicdiagramoftheSVMprincipleoflinearseparable

分類線(面)方程為:

針對本文的回歸問題,給定訓練樣本集為(Xi,yi),i=1,2,…,n,X∈Rn,y∈R,判別函數(shù)表示為:

式中,Φ(X)是從空間到高維特征空間的映射,ω為權(quán)值向量,h為一個偏量。將判別函數(shù)進行歸一化處理,使兩類樣本都滿足|g(X)|≥1,此時分類間隔為2/‖ω‖,進而求min(2/‖ω‖)即是求max(‖ω‖2),滿足|g(X)|=1的樣本點和滿足max(‖ω‖2) 的分類線(面)就稱之為最優(yōu)分類面[13],L1、L2上的訓練樣本點稱作支持向量(SV),圖1中四個帶四角形的點即是SV。

根據(jù)以上論述,可將求解最優(yōu)分類面問題轉(zhuǎn)化為優(yōu)化問題:

再利用Lagrange優(yōu)化方法將優(yōu)化問題轉(zhuǎn)化為對偶優(yōu)化問題:

最終得到最優(yōu)分類函數(shù)為:

約束條件為:

式中,βi是每個樣本對應(yīng)的Lagrange乘子;h*是分類閾值,可任選一個滿足式(5)中等號的支持向量。根據(jù)Karush-Kuhn-Tuckre定理可知:βi=0滿足非支持向量,因此βi≠0滿足支持向量。

(2) 支持向量機及其核函數(shù)的類型

在引入核函數(shù)以后,以上各式中的內(nèi)積形式全部用核函數(shù)代替,則(7)式中的最優(yōu)分類函數(shù)變?yōu)椋?/p>

約束條件變?yōu)椋?/p>

c是一個常數(shù)(懲罰因子),控制錯分樣本懲罰的程度,式(9)就是支持向量機。

2 支持向量機天然氣水合物生成預測模型

2.1支持向量機模型的建立及參數(shù)的確定

預測天然氣水合物生成的源數(shù)據(jù)由實驗所得,將源數(shù)據(jù)樣本通過一個非線性函數(shù)映射到高維空間,通過這個映射轉(zhuǎn)換可以進行數(shù)據(jù)序列的預測。整個算法可在MATLAB環(huán)境下編程實現(xiàn)。

源數(shù)據(jù)(18×8)記錄的是與天然氣水合物生成有關(guān)的各種指標,18行表示實驗組數(shù),8列分別表示每次影響天然氣水合物生成的平衡壓力、實驗溫度、實驗初始壓力、相平衡甲烷濃度、添加劑濃度、快速生成期時間、攪拌速度、注入水量。

根據(jù)模型編程可知天然氣水合物的生成與前一次實驗的平衡壓力、實驗溫度、實驗初始壓力、相平衡甲烷濃度、添加劑濃度、快速生成期時間、攪拌速度、注入水量相關(guān)聯(lián),即選取第1—18實驗組的實驗溫度、實驗初始壓力、相平衡甲烷濃度、添加劑濃度、快速生成期時間、攪拌速度、注入水量作為自變量,選取第2—18實驗組的平衡壓力作為因變量。

2.2數(shù)據(jù)預處理

在數(shù)據(jù)處理方面,首先對其進行歸一化[16]預處理,采用的歸一化映射如下。

式中,x,y∈Rn,xmin=min(x);xmax=max(x),即是使用mapminmax函數(shù)來實現(xiàn)。歸一化的效果是原始數(shù)據(jù)被規(guī)整到[1,2]范圍內(nèi),即yi∈[0,1],i=1,2,…,n,這種歸一化方式稱為[1,2]區(qū)間歸一化。歸一化方式有很多,而且不同的方式對最后預測結(jié)果的準確率也會有一定的影響,如表1所示。

由表1可知對數(shù)據(jù)采不采用歸一化處理對結(jié)果的準確度幾乎沒什么影響,但是不采用歸一化處理,無法讀取平均平方誤差數(shù)據(jù)。經(jīng)過對比這幾種歸一化處理方式可知:[-1,1]歸一化方式的c和g參數(shù)變化波動很大,不適合選用;[0,1]歸一化方式和[-1,0]歸一化方式差別很小,但是它們跟[1,2]歸一化方式相比CVMSE的精度沒有后者理想。綜合以上因素,歸一化方式選擇[1,2]區(qū)間比較合適。

表1 采用不同歸一化方式預處理數(shù)據(jù)結(jié)果對比Table 1 Comparison of data results with different normalization methods

說明:“—”是表示不存在。

2.3參數(shù)優(yōu)化和選擇

支持向量機的參數(shù)一般有SVM類型、核函數(shù)類型、不敏感損失函數(shù)、模型正規(guī)化參數(shù)以及核參數(shù)等[17]。筆者選用的SVM類型是epsilon-SVR(epsilon-Support Vector Regression),其需要事先確定參數(shù)-不敏感損失函數(shù)ε,此處設(shè)為0.01。又根據(jù)Vapnike的研究結(jié)果可知,核函數(shù)參數(shù)g和懲罰因子c是影響SVM性能的關(guān)鍵因素,通過交叉驗證(Cross Validation,CV)方法中的一種(K-fold Cross Validation,K-CV)對其進行優(yōu)化,得到最佳的參數(shù)g和c,之所以用K-CV優(yōu)化,是因為其可以有效地避免過學習和欠學習現(xiàn)象的發(fā)生。

因為RBF核函數(shù)只含有一個參數(shù)σ2,所以該模型選擇的核函數(shù)是RBF核函數(shù),其比p階多項式核函數(shù)和Sigmoid核函數(shù)的參數(shù)少一個,比較易于參數(shù)優(yōu)化;其次是因為01)或者趨近于0(γ(xi·xj)+fcoe<1)。

在對懲罰因子c和核參數(shù)g進行初始粗略選擇時,基于實驗的考慮將最佳c和g的搜索空間分別設(shè)為cmin=-23,cmax=23,gmin=-23,gmax=23,即c、g∈[-8,8],之后再利用SVMcgFor Regress進行精細選擇,直到最佳交叉驗證平均平方誤差(Best Cross Validation Mean Squared Error,CVMSE)達到最佳值為止,如圖2所示。

圖2 懲罰因子c和核參數(shù)g選擇結(jié)果

Fig.2Penaltyfactorcandkernelparametergselectionresults

圖2(a)是詳細選擇的CVMSE二維等高線圖,圖2(b)是其3D視圖,由圖2可以讀出CVMSE=0.002 727 6、c=4、g=1.414 2,具體數(shù)據(jù)見表2。

表2 SVM模型參數(shù)Table 2 SVM model parameters

3 模型預測結(jié)果及分析

對于支持向量機預測天然氣水合物生成的評價標準有很多,本文采用了平均平方誤差(MSE)、平方相關(guān)系數(shù)(r2),以及平方絕對百分比誤差(MAPE)和平均絕對誤差(MAE)來評價此模型的準確性,其方程式如下:

式中,n為樣本數(shù)。

通過利用建立的SVM預測模型,對利用KDSD-Ⅱ型水合物動力學實驗裝置獲得的影響天然氣水合物生成的數(shù)據(jù)進行了預測,得到了其在天然氣水合物生成達到相平衡時的平衡壓力,如圖3藍線所示。

圖3 原始數(shù)據(jù)與回歸預測數(shù)據(jù)對比

Fig.3Comparisonofrawdataandregressionforecastdata

由圖3可知,大部分預測點與實際值的相對預測誤差都比較小(見表3)。由表3可知,原始數(shù)據(jù)與預測數(shù)據(jù)的相對誤差均勻的分布在0附近,MAPE僅為0.542 4%,可見預測結(jié)果比較理想。

表3 天然氣水合物生成預測結(jié)果Table 3 Predicted results of NGH formation

利用SVM-CV預測天然氣水合物生成的評價數(shù)據(jù)如表4所示,可知此預測模型有較高的平方相關(guān)系數(shù),平均平方誤差、平均絕對百分比誤差,以及平均絕對誤差的值都比較低。

表4 預測評價表Table 4 Prediction evaluation table

4 結(jié)論

通過利用支持向量機模型對天然氣水合物生成進行了預測,得到以下結(jié)論:

(1) 利用支持向量機預測天然氣水合物生成,對NGH生成影響因素的源數(shù)據(jù)進行歸一化預處理,并對利用其它歸一化區(qū)間也進行了計算。得出此模型的歸一化區(qū)間在[1,2]時精度值(0.002 727 56)最高。由于此模型的源數(shù)據(jù)比較平緩,跳躍性不是特別大,所以歸一化的處理方式對預測天然氣水合物生成時的相平衡壓力影響并不明顯。結(jié)合歸一化計算結(jié)果,驗證了歸一化處理并不是絕對的,要根據(jù)具體情況分析。

(2) 選取的18組實驗數(shù)據(jù)均來自于實驗結(jié)果或者理論計算,利用這些數(shù)據(jù)對天然氣水合物生成時的相平衡壓力進行預測,預測結(jié)果與實驗結(jié)果非常接近(見表3),以及采用平均平方誤差、平方相關(guān)系數(shù)、平方絕對百分比誤差和平均絕對誤差四種誤差公式對預測精度進行評估,結(jié)果分別為8.370 08×10-5、99.897 6%、0.542 4%、1.990%,證明了支持向量機預測模型在天然氣水合物生成預測的可行性。

(3) 提出了基于支持向量機(SVM)和交叉驗證(CV)相結(jié)合的預測模型,說明支持向量機能夠很好地解決對于小樣本條件下的學習不足問題,并利用支持向量機理論對天然氣水合物生成進行了預測,有助于天然氣水合物的開采研究,為后續(xù)研究天然氣水合物儲存和運輸提供了方法和基礎(chǔ),為將來的工業(yè)化運用提供了途徑,有一定的實用價值。

[1] 趙洪偉,林君,業(yè)渝光. 海洋天然氣水合物相平衡條件模擬實驗及探測技術(shù)研究[D]. 吉林:吉林大學,2006.

[2] Naeiji P,Arjomandi A,Varaminian F. Optimization of inhibition conditions of tetrahydrofuran hydrate formation via the fractional design methodology[J]. Journal of Natural Gas Science and Engineering,2014,21:915-920.

[3] 車雯,梁海峰,孫國慶,等. 天然氣水合物沉積層滲流特性的模擬[J]. 化工進展,2015,34(6):1576-1581.

Che Wen,Liang Haifeng,Sun Guoqing,et al. Simulation study on the seepage characteristics of natural gas hydrate sediment[J]. Chemical Industry and Engineering Progress,2015,34(6):1576-1581.

[4] 張劉檣,師凌冰,周迎. 天然氣水合物生成預測及防治技術(shù)[J]. 天然氣技術(shù),2007,1(6):67-68.

Zhang Liuqiang,Shi Lingbing,Zhou Ying. Formation prediction and prevention technology of natural gas hydrate[J].Natural Gas Technology,2007,1(6):67-68.

[5] Dejean J P,Averbuch D,Gainville M. Intergrating flow assurance into risk management of deep offshore field[R]. OTC 17237,2005.

[6] 趙光華. CO2-N2-TBAB-H2O 體系水合物生成實驗和模型研究[J]. 石油化工高等學校學報, 2016, 29(6): 11-17.

Zhao Guanghua. The formation experiment and modeling study of CO2-N2-TBAB-H2O hydrate system[J]. Journal of Petrochemical Universities, 2016, 29(6): 11-17.

[7] 蔣華琴,劉興高. 免疫PSO-WLSSVM最優(yōu)聚丙烯熔融指數(shù)預報[J]. 化工學報,2012,63(3):866-872.

Jiang Huaqin,Liu Xinggao. Optional melt index prediction based on ICPSO-WLSSVM algorithm for industrial propylene polymerization[J]. CIESC Journal,2012,63(3):866-872.

[8] Vapnik V N. Statistical Learning Theory [M]. Nwe York:Wcley,1998.

[9] Wu C H,Tzeng G H,Lin R H. A novel hybrid genetic algorithm for kernel function and parameter optimization in support vector regression[J]. Expert Systems with Applications,2009,36(3):4725-4735.

[10] 張華,曾杰. 基于支持向量機的風速預測模型研究[J]. 太陽能學報,2010,31(7):928-932.

Zhang Hua,Zeng Jie. Wind speed forecasting model study based on support vector machine[J]. Acta Energiae Solaris Sinica,2010,31(7):928-932.

[11] 谷波,韓華,洪迎春,等. 基于SVM的制冷系統(tǒng)多故障并發(fā)檢測與診斷[J]. 化工學報,2011,62(S2):112-119.

Gu Bo,Han Hua,Hong Yingchun,et al. SVM-based FDD of multiple-simultaneous faults for chillers[J]. CIESC Journal,2011,62(S2):112-119.

[12] 黃嘯. 支持向量機核函數(shù)的研究[D]. 蘇州:蘇州大學,2008.

[13] Vapnik V著. 統(tǒng)計學習理論的本質(zhì)[M]. 張學工,譯.北京:清華大學出版社,2000.

[14] 奉國和. SVM分類核函數(shù)及參數(shù)選擇比較[J]. 計算機工程與應(yīng)用,2011,47(3):123-124.

Feng Guohe. Parameter optimizing for Support Vector Machines classification[J]. Computer Engineering and Applications,2011,47(3):123-124.

[15] 王強,田學民. 基于KPCA-LSSVM的軟測量建模方法[J]. 化工學報,2011,62(10):2813-2817.

Wang Qiang,Tian Xuemin. Soft sensing based on KPCA and LSSVM[J]. CIESC Journal,2011,62(10):2813-2817.

[16] 梁家政,薛質(zhì). 網(wǎng)絡(luò)數(shù)據(jù)歸一化處理研究[J]. 信息安全與通信保密,2010(7):47-51.

Liang Jiazheng, Xue Zhi. Standardized processing based on network data[J].Information Security and Communications Privacy,2010(7):47-51.

[17] 李紅英. 支持向量分類機的核函數(shù)研究[D]. 重慶:重慶大學,2009.

Prediction of Natural Gas Hydrate Formation Based on Support Vector Machine (SVM)-CV

Gong Qingjun, Ma Guiyang, Pan Zhen, Liu Peisheng, Li Cunlei

(PetroleumandNaturalGasEngineering,LiaoningShihuaUniversity,F(xiàn)ushunLiaoning113001,China)

Natural gas hydrate has the advantages of abundant reserves, large calorific value and low emission, which can mitigate the environmental pollution problems caused by traditional fossil energy. The generation process of natural gas hydrate form is a system with multi-components and multi-physical states. The nucleation process is complex, which needs to consider the effects of pressure, temperature, promoters, stirring speed and so on. It is difficult to accurately predict the hydrate formation, because the hydrate formation process not only involves thermodynamics problems but also dynamics problems. In our paper, the support vector machine theory combined with experimental data was used to establish support vector machine prediction model for predicting natural gas hydrate equilibrium pressure. The prediction accuracy was estimated by using the mean square error, the square correlation coefficient, the square absolute percentage error and the average absolute error. The results are 8.370 08×10-5,99.897 6%,0.542 4%,1.990 0%,respectively. The pre-treatment origin data were normalized ([1,2]) and the nuclear parameterg(4)and punishment factorc(1.414 2) were optimized by using cross validation methods. Simulation results show that the equilibrium pressure obtained by support vector prediction model is good in agreement with the equilibrium obtained by experiments. The better ideal prediction effects prove that the model has advantages of accuracy and reliability. It can provide certain reference for research on natural gas hydrate in future.

Natural gas hydrate; Nucleation; Dynamics; Thermodynamics; Support vector machine; Cross validation

1006-396X(2017)05-0080-06

投稿網(wǎng)址:http://journal.lnpu.edu.cn

TE89

A

10.3969/j.issn.1006-396X.2017.05.015

2017-02-06

2017-02-28

國家自然科學基金項目(41502100);遼寧省高等學校優(yōu)秀人才支持計劃項目(LJQ2014038)。

宮清君(1986-),男,碩士研究生,從事天然氣水合物研究;E-mail:1449611564@qq.com。

潘振(1981-),男,博士,副教授,從事油氣儲運方面研究;E-mail:28335719@qq.com。

(編輯 王亞新)

天然氣水合物(Natural Gas Hydrate,NGH)是由天然氣與水在高壓低溫條件下形成的類冰狀結(jié)晶物質(zhì)[1],主要分布于海底大陸架邊緣和凍土層中。1 m3的NGH大約可分解出160 m3天然氣(標準狀態(tài)下),其碳含量約為現(xiàn)有化石燃料總和的2倍,是最具商業(yè)開發(fā)前景的清潔能源之一[2-3]。NGH若在天然氣集輸中形成會增加管道的輸送阻力、減少輸送天然氣量甚至加大管件的毀壞程度;若在天然氣開采中形成很可能會造成井筒的堵塞,所以有必要對NGH的生成預測進行研究[4-5]。

猜你喜歡
水合物向量天然氣
向量的分解
氣井用水合物自生熱解堵劑解堵效果數(shù)值模擬
聚焦“向量與三角”創(chuàng)新題
第六章 意外的收獲——石油和天然氣
石油和天然氣
熱水吞吐開采水合物藏數(shù)值模擬研究
天然氣水合物保壓轉(zhuǎn)移的壓力特性
天然氣:LNG價格已經(jīng)開始預熱了么?
能源(2018年8期)2018-01-15 19:18:24
我國海域天然氣水合物試采成功
向量垂直在解析幾何中的應(yīng)用
拜城县| 焦作市| 十堰市| 新郑市| 绍兴市| 延安市| 义乌市| 桂平市| 乐亭县| 武夷山市| 兴业县| 阆中市| 西畴县| 民勤县| 佛坪县| 榆树市| 鄂尔多斯市| 全南县| 政和县| 海林市| 泽普县| 彝良县| 临颍县| 松江区| 独山县| 昔阳县| 梧州市| 鄂托克前旗| 乌兰浩特市| 满洲里市| 红安县| 泰和县| 富民县| 鹿邑县| 德钦县| 锡林郭勒盟| 胶南市| 商丘市| 安平县| 藁城市| 和硕县|