国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于偏最小二乘回歸分析的油田操作成本預(yù)測
——以DX油田為例

2019-01-22 12:09吳燾宏馬夢曉
關(guān)鍵詞:產(chǎn)液產(chǎn)油量因變量

陳 武,吳燾宏*,陳 塵,馬夢曉

1.西南石油大學(xué)經(jīng)濟管理學(xué)院,四川 成都 610500;2.中石油西南油氣田分公司勘探開發(fā)研究院,四川 成都 610041

引 言

油田操作成本也稱作業(yè)成本,它主要是指將地下的原油提升到地面所產(chǎn)生的相關(guān)費用,主要包括材料費、燃料費、動力費、人工費以及相關(guān)的管理費等[1]。操作成本在油田生產(chǎn)成本中占據(jù)了相當(dāng)大的比例,尤其是對于已進入高含水開發(fā)階段的水驅(qū)油田,開發(fā)難度不斷加大,產(chǎn)油量逐年下降而操作成本卻逐年上升。在產(chǎn)量遞減和高含水率的情況下,合理有效地預(yù)測油田操作成本,對油田企業(yè)控制生產(chǎn)成本、提高經(jīng)濟效益、實現(xiàn)可持續(xù)發(fā)展有著重要的意義。

國內(nèi)外諸多學(xué)者運用各種定性或定量的方法對油田操作成本的影響因素進行了分析。國內(nèi)李斌、吳晨洪運用灰色關(guān)聯(lián)分析方法對油氣生產(chǎn)成本進行分析,發(fā)現(xiàn)分項成本與操作費用密切相關(guān)的分別是油氣處理費、材料費、動力費、測井試井費、燃料費、工資福利費[2];李豐等運用主成分方法分析操作成本后發(fā)現(xiàn),含水率、居民消費指數(shù)、注水量、產(chǎn)液量對操作成本影響很大[3]。國外學(xué)者對操作成本影響因素的研究側(cè)重于通過建立模型來分析成本形成的原因。Balch認(rèn)為,油氣生產(chǎn)的成本越來越高,一方面原因是由于物價的上漲導(dǎo)致材料費用、燃料費用和外包作業(yè)費用的增加;另一方面是由于油田開發(fā)后期大多采用注水開采方式,注水、液體提升以及油氣處理等環(huán)節(jié)電力消耗都較大,電力成本的上升是導(dǎo)致油田生產(chǎn)成本增高的主要原因[4];Robert和Stiles也指出,電力成本是影響油氣生產(chǎn)成本最大的一項因素,油氣提升、油氣處理、氣體壓縮、脫水等生產(chǎn)環(huán)節(jié)都會增加電力消耗[5]。

綜上所述,油田操作成本受多種因素的影響,比如油藏地質(zhì)屬性、油田的開發(fā)階段和經(jīng)營管理水平等,因此,對油田操作成本進行預(yù)測需要考慮多個影響因素。目前已有多種方法和技術(shù)被應(yīng)用于油田成本的預(yù)測中,如:灰色關(guān)聯(lián)預(yù)測法、回歸分析法、組合預(yù)測法、神經(jīng)網(wǎng)絡(luò)預(yù)測法等?;貧w分析是應(yīng)用最為廣泛的預(yù)測方法之一,但在多元線性回歸分析中,自變量之間往往存在多重相關(guān)性。在油田操作成本實際預(yù)測中,樣本數(shù)據(jù)往往是有限的,在這些情況下建立的預(yù)測模型是不穩(wěn)定的,預(yù)測結(jié)果誤差較大[6-8]。

偏最小二乘回歸能很好地解決這些實際問題。偏最小二乘方法是Wold和Albano等在1983年首次提出,當(dāng)時是用于解決化學(xué)樣本分析中存在的變量多重相關(guān)性以及解釋變量多于樣本點等實際問題[9]。王惠文是最早將該方法引入我國的學(xué)者之一。他將該方法應(yīng)用于中國部分沿海城市及內(nèi)陸城市的經(jīng)濟發(fā)展比較分析中,建立了多因變量對多自變量的偏最小二乘回歸模型,以便找出影響兩類城市在經(jīng)濟發(fā)展中的動力因素[10]。由于其解決了普通多元回歸方法無法解決的難題,該方法目前已經(jīng)在諸多領(lǐng)域被廣泛應(yīng)用。基于此,筆者將該方法用于油田操作成本的預(yù)測建模中,并通過油田實際數(shù)據(jù)對建立的預(yù)測模型進行分析,檢驗該方法應(yīng)用于操作成本預(yù)測的可靠性。

1 偏最小二乘回歸的基本原理

1.1 偏最小二乘回歸的思路

記因變量集合為Y=(y1,y2,...,yq),yj∈Rn,自變量集合為X=(x1x2...xp),xj∈Rn。偏最小二乘回歸方法分別在X與Y中提取出成分t1和u1,t1是x1,x2,…,xp的線性組合,u1是 y1,y2,…,yq的線性組合。提取的這兩個成分應(yīng)滿足兩個要求:一是t1和u1應(yīng)最大程度地攜帶其各自數(shù)據(jù)表中的變異信息;二是t1和u1的相關(guān)程度最大。

在提取第一個成分t1和u1后,分別實施X對t1的回歸和Y對t1的回歸,如果回歸方程達到滿意精度,則終止計算;否則,用X被t1解釋后的殘余信息和Y被t1解釋后的殘余信息再度進行成分提取。如此反復(fù),直到達到滿意的精度。若最終對X共提取了m個成分t1,t2,…,tm,則實施yk(k=1,2,...,q)對t1,t2,…,tm的回歸分析,最后還原成yk關(guān)于原變量x1,x2,…,xp的回歸方程。

1.2 偏最小二乘回歸的算法

首先將X和Y做標(biāo)準(zhǔn)化處理,用E0=(E01,E02,...,E0p)n?p表示X標(biāo)準(zhǔn)化處理后的數(shù)據(jù)矩陣,F(xiàn)0表示Y經(jīng)標(biāo)準(zhǔn)化處理后的變量。

第一步,從E0中提取第一個成分t1,t1=E0w1,其中w1是E0的第一個軸,即||w1||=1。從F0中提取第一個成分u1,u1=F0c1,且||c1||=1。由于F0(F0∈Rn)只是一個變量,所以c1是個標(biāo)量,即c1=1,即有:u1=F0

根據(jù)前述需滿足的兩個要求以及主成分分析和典型相關(guān)分析原理,綜合起來即是求t1和u1的協(xié)方差達到最大,可以得到下列優(yōu)化問題:

推導(dǎo)可得

式中,θ1是目標(biāo)函數(shù)值,w1是矩陣E0TF0F0TE0最大特征值的單位特征向量,對應(yīng)的特征值為θ12。c1是對應(yīng)于矩陣F0TE0E0TF0最大特征值θ12的單位特征向量。則

式中:r(xj,y)是xj與y的相關(guān)系數(shù)。分別求E0、F0在t1上的回歸,即

然后進行偏最小二乘回歸的第二步,即:分別以E1、F1取代E0、F0,重復(fù)第一步得到 w2、t2,分別求E1、F1在t2上的回歸。依此類推得到m個成分t1,t2,…,tm,可以得到F0關(guān)于th的偏最小二乘回歸模型:

因為th均為E0的線性組合,所以

最后按照標(biāo)準(zhǔn)化的逆過程還原成因變量y關(guān)于x1,x2,…,xp的回歸方程。

1.3 交叉有效性

記yi為原始數(shù)據(jù),t1,t2,…,tm是提取的m個成分,?yhi是使用全部樣本點并取h個成分回歸建模后,第i個樣本點擬合值,?yh(-i)是在建模時刪去樣本點i,取h個成分回歸建模后,再用此模型計算的yi的擬合值[7]。記

當(dāng)Qh2≥0.097 5時,增加新的成分th,對所建模型的預(yù)測能力有明顯的改善,否則增加的新成分沒有顯著意義。

2 油田操作成本偏最小二乘回歸預(yù)測模型的建立

在求建油田操作成本偏最小二乘回歸預(yù)測模型時,筆者只將油田操作成本作為因變量,因變量只有一個,即q=1,因此該模型是一個單因變量的偏最小二乘回歸模型。

2.1 自變量的選取

李豐等在對高含水水驅(qū)油田操作成本預(yù)測分析時,針對水驅(qū)油田的特點,從生產(chǎn)控制、開發(fā)階段和宏觀經(jīng)濟形勢三個方面綜合考慮,選取了產(chǎn)油量、產(chǎn)液量、注水量、含水率、開井?dāng)?shù)、工作量、油價、價格指數(shù)和居民消費指數(shù)等9項操作成本影響因素作為主要影響指標(biāo)[3]。李萍等從油田開發(fā)生產(chǎn)和油田財務(wù)的角度,選取了措施增油比重、開井率、含水率、注采比、平均單井產(chǎn)油量、自然遞減率、可采儲量采出程度、平均泵掛深度、平均注水油壓、噸油單井集油線占比、噸油資產(chǎn)占比、資產(chǎn)新舊系數(shù)、噸油拉油費等13個影響因素作為主要影響指標(biāo),對操作成本和主要指標(biāo)進行多元線性回歸[11]。筆者在選取自變量指標(biāo)時,實際上是基于兩點:一是以上述研究選取的主要指標(biāo)作為參考,并結(jié)合DX油田的實際情況來確定自變量指標(biāo);二是根據(jù)DX油田數(shù)據(jù),充分考慮自變量指標(biāo)的可量化和可測度性質(zhì),因為難以量化和測度的指標(biāo)沒有統(tǒng)計數(shù)據(jù)支持,納入研究分析框架將影響預(yù)測模型的可靠性?;谝陨蟽牲c,針對特高含水水驅(qū)油田成本變化規(guī)律的自變量主控指標(biāo),筆者選取了7個自變量:產(chǎn)液量(x1)、產(chǎn)油量(x2)、注水量(x3)、含水率(x4)、措施工作量(x5)、工業(yè)品購進價格指數(shù)(x6)和電力價格(x7)。

2.2 原始數(shù)據(jù)的來源

DX油田是國內(nèi)最早進入以水驅(qū)為主的特高含水開發(fā)油田之一,以DX油田2010年至2016年的操作成本:產(chǎn)液量、產(chǎn)油量、注水量、含水率、措施工作量以及對應(yīng)年份的工業(yè)品購進價格指數(shù)和電力價格等實際數(shù)據(jù)為例(表1),運用前述方法建立該油田的操作成本預(yù)測模型。

2.3 相關(guān)性檢驗

通過計算,得到7個自變量和因變量之間的相關(guān)系數(shù),結(jié)果如表2。從表2中可以看出,自變量之間存在高度的多重相關(guān)性。

表1 DX油田操作成本及相關(guān)數(shù)據(jù)

表2 自變量及因變量的相關(guān)系數(shù)

2.4 模型建立

應(yīng)用SIMCA-P軟件建立偏最小二乘回歸模型。首先計算對因變量y的交叉有效性,Qh2表示成分th的交叉有效性,Qh2(cum)表示使用m個提取成分t1,t2,…,tm建模的累計交叉有效性。從表3可以看出,提取到第3個成分時,Q32=-0.414 4,小于0.097 5,且Q22(cum)=0.997 0,已經(jīng)達到滿意的精度,故提取2個偏最小二乘成分即可。

表3 對因變量y的交叉有效性

表 4 是 wh?(h=1,2)的取值。ph(h=1,2)是在利用Eh-1對th進行回歸時得到的回歸系數(shù),其取值如表5。

表4 wh?的取值

表5 回歸系數(shù)ph

由上述偏最小二乘算法的推導(dǎo)過程可知,F(xiàn)0可以表示為提取的成分th的回歸方程,因此,最終得到標(biāo)準(zhǔn)化變量F0與E0j(j=1,2,3,4,5,6,7)的回歸方程:

將標(biāo)準(zhǔn)化變量F0與E0j(j=1,2,3,4,5,6,7)分別還原為原始變量,最終得到的預(yù)測模型為:

3 油田操作成本偏最小二乘回歸預(yù)測模型的評價

3.1 精度分析

圖1能夠直觀反映回歸模型擬合的效果,顯示了提取的2個主成分對輸出變量y的累積解釋能力(R2(cum))和累計交叉有效性(Q2(cum))。從圖1中可以看出,2個主成分的累計解釋能力幾乎達到了 1(實際R2(cum)=0.999 02),已經(jīng)達到非常高的精度,說明上面建立的預(yù)測模型擬合程度非常好。

圖1 模型擬合結(jié)果圖

用建立的預(yù)測模型(公式13)對DX油田2010年至2016年的操作成本進行預(yù)測,將實際數(shù)據(jù)代入公式13計算出預(yù)測值與實際值的相對誤差,得到的預(yù)測值和相對誤差結(jié)果見表6。表6表明,預(yù)測值的平均相對誤差為0.003 162,且所有年份的預(yù)測值相對誤差都很小,證明預(yù)測精度檢驗的結(jié)果十分樂觀,建立的預(yù)測模型具有很強的可操作性。

表6 DX油田操作成本預(yù)測精度檢驗表

3.2 自變量與因變量的相關(guān)關(guān)系分析

在偏最小二乘回歸中,可以通過th和uh的線性關(guān)系來判斷自變量與因變量之間的關(guān)系。從圖2可以看出,DX油田的操作成本與解釋變量間存在明顯的線性關(guān)系,說明建立操作成本與解釋變量的線性回歸模型是合理的。

圖2 t[1]/u[1]平面圖

3.3 自變量在解釋因變量時的重要性

自變量在解釋因變量時的重要性可以通過VIPj值來反應(yīng)。表7是各個自變量的VIPj值,其中x1、x2、x4、x7四個變量的重要性指標(biāo)值均超過1,且差別不大,其他3個變量都低于1,說明產(chǎn)液量、產(chǎn)油量、含水率、電力價格4個因素對油田操作成本都有著較強的影響作用,是引起操作成本變動的主要因素。

表7 VIPj值表

圖3是在標(biāo)準(zhǔn)化數(shù)據(jù)下的回歸方程對應(yīng)自變量的回歸系數(shù)直方圖,它直觀地反映了各自變量指標(biāo)對DX油田操作成本的邊際貢獻。從圖3中可以看出,產(chǎn)液量、注水量、含水率、措施工作量以及工業(yè)品購進價格指數(shù)和電力價格對DX油田操作成本起正向作用。也就是說,這幾個因素的增長會導(dǎo)致DX油田操作成本的增長,其中措施工作量的回歸系數(shù)幾乎為0,對操作成本的增長影響不大。產(chǎn)油量與操作成本呈負(fù)相關(guān)關(guān)系。這里需要說明的是,并非增加產(chǎn)油量就能降低操作成本,而是因為DX油田早已進入特高含水開發(fā)期,產(chǎn)油量在逐年下降。為保持年產(chǎn)油量在一定的水平,需要采取有效措施,如增大注水量等,這勢必會導(dǎo)致操作成本的增加,因此產(chǎn)油量和操作成本才呈現(xiàn)出負(fù)相關(guān)關(guān)系。

圖3 回歸系數(shù)直方圖

通過對模型的分析評價,可見采用偏最小二乘回歸方法來進行油田操作成本的預(yù)測建模,能夠很好地解決自變量之間的多重共線性問題,建立的模型具備較強的預(yù)測能力。

4 結(jié) 語

筆者基于DX油田2010年至2016年的操作成本、產(chǎn)液量、產(chǎn)油量、注水量、含水率、措施工作量以及對應(yīng)年份的工業(yè)品購進價格指數(shù)和電力價格等實際數(shù)據(jù),建立了偏最小二乘回歸預(yù)測模型,并對模型進行了檢驗和評價,得到以下結(jié)論:

(1)油田操作成本受到產(chǎn)液量、產(chǎn)油量、注水量、含水率、工業(yè)品購進價格指數(shù)、電力價格等多種因素的影響,且根據(jù)相關(guān)性檢驗可知這些影響因素之間存在著高度的相關(guān)性,采用普通多元回歸將會遇到嚴(yán)重的多重共線性問題。

(2)通過偏最小二乘回歸方法建立的DX油田操作成本預(yù)測模型,其解釋變量對因變量的解釋能力達到了0.999 02,且將實際數(shù)據(jù)代入預(yù)測模型得到的預(yù)測值的平均誤差僅為0.003 162,預(yù)測精度非常高,表明偏最小二乘回歸方法能夠很好地解決自變量之間的多重相關(guān)性問題。因此,采用基于偏最小二乘回歸來預(yù)測油田操作成本不失為一種好的方法。

猜你喜歡
產(chǎn)液產(chǎn)油量因變量
考慮多因素的多層合采產(chǎn)液量劈分模式研究
調(diào)整有限因變量混合模型在藥物經(jīng)濟學(xué)健康效用量表映射中的運用
甘藍型油菜的產(chǎn)油量分析
靖邊畔溝長6油層采油制度效益研究
適應(yīng)性回歸分析(Ⅳ)
——與非適應(yīng)性回歸分析的比較
渤海J油田化學(xué)驅(qū)無因次產(chǎn)液指數(shù)的變化規(guī)律
考慮產(chǎn)液量變化的水驅(qū)油藏產(chǎn)量遞減規(guī)律研究
配方施肥對澳洲茶樹枝葉產(chǎn)量和產(chǎn)油量的影響
偏最小二乘回歸方法
不同海拔條件下春油菜光合生理和產(chǎn)油量的響應(yīng)
鄯善县| 咸宁市| 墨江| 金乡县| 陆川县| 辽阳市| 天峻县| 登封市| 德钦县| 诸城市| 六盘水市| 白城市| 金沙县| 乌兰察布市| 民丰县| 泾源县| 景泰县| 萨迦县| 五寨县| 宁德市| 吉安市| 翼城县| 北票市| 高雄县| 临夏县| 改则县| 丰城市| 曲周县| 拉孜县| 弋阳县| 昌吉市| 宜都市| 原平市| 淮阳县| 府谷县| 新巴尔虎右旗| 沐川县| 深泽县| 桃园市| 巴南区| 监利县|