国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于差分進化優(yōu)化的隨機森林產能預測

2024-12-09 00:00:00毛靖陳仲旭劉加元趙行
河南科技 2024年21期

摘 要:【目的】為了解決傳統(tǒng)的油藏產能預測方法存在考慮因素少、耗時長、計算過程復雜、在復雜地質條件下預測精度低等問題,有必要對基于差分進化優(yōu)化的隨機森林產能預測方法進行研究?!痉椒ā坎捎脵C器學習的方法,建立基于差分進化算法優(yōu)化的隨機森林產能預測模型。以某油藏為例,根據(jù)油田實際開發(fā)情況,從地質、開發(fā)和工程等方面選擇對產能影響比較大的6個因素,采用Person相關系數(shù)法分析各個影響因素之間的線性相關性,運用隨機森林算法計算各個因素對產能的影響程度并進行主控因素分析?!窘Y果】研究結果表明,孔隙度和含油飽和度之間的正相關性最強;對產能影響的程度從高到低分別為生產壓差、射孔段厚度、滲透率、初始含油飽和度、油層有效厚度、孔隙度。支持向量機、多元線性回歸、基于網(wǎng)格搜索優(yōu)化的隨機森林等方法中,采用基于差分進化優(yōu)化的隨機森林方法的預測精度最高?!窘Y論】研究成果為復雜油藏產能預測提供了新的思路。

關鍵詞:機器學習;產能預測;隨機森林;差分進化

中圖分類號:TE358.5 文獻標志碼:A 文章編號:1003-5168(2024)21-0032-06

DOI:10.19968/j.cnki.hnkj.1003-5168.2024.21.007

Productivity Prediction Based on Random Forest Optimized by

Differential Evolution

MAO Jing CHEN Zhongxu LIU Jiayuan ZHAO Xing

(Tazhong Oil and Gas Management Department of Tarim Oilfield, Kuerle 841000, China)

Abstract: [Purposes] In order to solve the problems of traditional reservoir productivity prediction methods, such as less consideration, long time consuming, complicated calculation process, low prediction accuracy under complex geological conditions, it is necessary to study the random forest productivity prediction method based on random forest optimized by differential evolution. [Methods] This paper adopted machine learning approach and proposed a method of productivity prediction based on random forest optimized by differential evolution. A reservoir was selected as the example. According to the actual development situation of the oilfield, six factors which have greater impacts on productivity were selected from aspects of geology, development, and engineering. Person correlation coefficient method was used to calculate the linear correlation among influencing factors while random forest algorithm was applied to calculate the influence degree of each factor on productivity and analyze the main controlling factors.[Findings] The results showed that the positive linear correlation between porosity and initial oil saturation was the strongest. The degree of influence on productivity from high to low was producing pressure differential, perforation thickness, permeability, initial oil saturation, effective oil layer thickness and porosity. Compared with support vector machine, multiple linear regression and random forest optimized by grid search, random forest optimized by differential evolution has highest prediction accuracy.[Conclusions] This paper provided other theoretical method for predicting the productivity of complex reservoir.

Keywords: machine learning; productivity prediction; random forest; differential evolution

0 引言

油田產能的預測對整個油田開發(fā)至關重要,是各種方案的設計和調整的基礎和依據(jù),準確的產能預測不僅能夠實現(xiàn)油田的高效合理開發(fā),而且能夠為將來新鉆井進行合理的經(jīng)濟評估。傳統(tǒng)的油藏產能預測方法對油氣藏資料的全面性要求高。在建立數(shù)學模型時,復雜的公式推導計算量大、耗時長[1-2],而且很難將各方面影響因素全部有效地結合在一起[3-5]。近年來,隨著人工智能的迅猛發(fā)展,機器學習方法在油氣田各領域得到了廣泛應用,如巖性識別[6-9]、產能分析和預測[10-12]、壓裂改造預測[13]、結垢預測[14]、瀝青質沉積預測[15]、剩余油分布預測和注采參數(shù)優(yōu)化[16-17]等。

在產能預測方面,機器學習方法可以對開發(fā)情況比較復雜的非常規(guī)油氣藏進行有效、高精度的預測。常用的主要方法有核嶺回歸、多元線性回歸[18]、支持向量機、隨機森林、隨機蕨、決策樹、神經(jīng)網(wǎng)絡[19]等。林霞等[20]采用3種機器學習方法來預測油的產量,但是并沒有綜合考慮實際影響產能的地質、工程、開發(fā)等因素,只是簡單地進行數(shù)據(jù)驅動。宋宣毅等[21]針對低滲油藏,采用隨機森林方法對產能影響因素進行主控因素分析,并采用灰狼算法優(yōu)化支持向量機來預測油井的初期產能,并與網(wǎng)格搜索優(yōu)化的支持向量機、多元線性回歸等方法進行了對比,該方法預測結果平均相對誤差較小且提高了算法的計算效率,但因其樣本數(shù)量過少,導致驗證集整體擬合程度不高。機器學習算法雖然可以快速深入地挖掘影響因素與預測目標之間的聯(lián)系,但算法中大量的參數(shù)如何進行合理的設置和調節(jié)仍是難題。目前,常用的方法將預測模型和優(yōu)化算法結合在一起,然而由于優(yōu)化算法本身的特性,不同的優(yōu)化算法適用于不同的模型,因此合理選擇優(yōu)化算法也異常重要。針對上述問題,本研究提出一種結合差分進化優(yōu)化算法的隨機森林產能預測模型,采用該方法對隨機森林的參數(shù)進行了優(yōu)化,可有效解決其陷入局部最優(yōu)的問題,大大提高了產能預測的準確率,縮短了計算時間。

1 影響產能的因素分析

研究單井產能影響因素對于單井乃至整個油藏的開發(fā)和調整具有重要意義。通過對影響產能的因素重要性進行程度評估,可以更好地幫助評估識別出影響因素對產能貢獻的程度,進而從眾多因素中分析出主控因素。對單井產能主控因素的分析,可以為老井接下來的開發(fā)進行合理有效的調整,最大程度提高單井產量,同時也為新井的鉆探提供科學依據(jù),以實現(xiàn)油田的高效益開發(fā)。

1.1 區(qū)塊概況

某油藏全區(qū)面積為2.432 km2,總體南西—北東向展布,目的層儲層物性好,共3層,均屬于高孔高滲儲層。其中目的層1儲層平均孔隙度為26.23%,平均滲透率為500.13 mD。目的層2較目的層1儲層物性好,平均孔隙度為29.56%,平均滲透率為700.58 mD。目的層3平均孔隙度為26.84%,平均滲透率為1 000.43 mD。油藏以注水開發(fā)方式為主,見水速度快。油藏巖石類型及巖性為組合發(fā)育有礫巖、砂礫巖、砂巖、粉砂巖、泥巖等巖石類型。

1.2 影響因素確定

影響單井產能的因素眾多,主要分為地質、開發(fā)、工程等3方面:①地質方面,如初始含油飽和度、孔隙度、油層滲透率、油層有效厚度等;②開發(fā)方面,如地層的壓力系統(tǒng)、井網(wǎng)系統(tǒng)、井間連通情況等;③工程方面,如射孔工藝、壓裂施工參數(shù)等。本研究以某砂巖油田為例,根據(jù)該油田實際生產開發(fā)情況,地質方面選擇滲透率、孔隙度、初始含油飽和度、油層有效厚度等4個影響因素;開發(fā)方面由于該油田以衰竭式和注水開發(fā)方式為主,影響產能大小的主要因素為地層的壓力系統(tǒng),因此選擇生產壓差作為影響因素;工程方面考慮到未對該井進行壓裂增產等措施,故選擇有效射孔厚度作為影響因素。統(tǒng)計該油田45口生產井開井一年的平均日產油量,并選取了以上6個影響單井產量的因素作為特征值,建立了模型的樣本集。通過上述方法對樣本集數(shù)據(jù)進行處理,處理數(shù)據(jù)結果見表1,將樣本集的80%作為訓練集,20%作為驗證集。

1.3 影響因素重要性分析

不同影響因素之間相互干擾情況以及對產能的敏感性各不相同。首先采用Person相關系數(shù)法分析兩個不同因素之間的線性相關性,相關系數(shù)的變化范圍為[-1,1],正數(shù)代表正相關,即兩個變量向相同的方向變化,其中一個變量增加,另一個

變量也增加;負相關則與正相關相反;0代表兩個變量之間無線性相關性。相關系數(shù)的計算見式(1)。

[ρX1,X2=cov(X1,X2)δX1δX2] (1)

式中:cov為協(xié)方差;[δ]為標準差。

利用上述方法計算6個影響因素每兩個之間以及各個影響因素與產量之間的相關系數(shù),并將其繪成相關系數(shù)熱力圖如圖1所示。由圖1可知,不同影響因素之間,孔隙度和含油飽和度之間的正相關性最強,相關系數(shù)為0.54,因此二者對于原始地質儲量的影響較大。油層有效厚度和孔隙度之間的負相關性最強,相關系數(shù)為-0.42。而在不同影響因素和產能之間,其相關性都比較弱,均低于0.5。由此可以推斷,不同影響因素與產能之間不是簡單的線性關系,且不是由某一個影響因素起決定性作用,是由所有因素共同作用。

因此,本研究采用隨機森林算法具體計算每一個影響因素對產能的重要程度,并進行主控因素分析。其原理是評價每個特征在隨機森林每一棵決策樹上所做貢獻的大小。貢獻值的大小通常采用基尼指數(shù)GI作為評價指標來衡量,變量的重要性評分使用VIM來表示,隨機森林中樹的個數(shù)為n。影響因素重要程度的計算過程見式(2)至式(6)。

[GIm=1-K=1KP2mK] (2)

[VIM(Gini)jm=GIm-GIl-GIr] (3)

[VIM(Gini)ij=m∈MVIM(Gini)jm] (4)

[VIM(Gini)j=i=1nVIM(Gini)ij] (5)

[VIMj=VIMji=1nVIMi] (6)

以上式中:K為特征的類別;[Pmk]為節(jié)點m中類別K所占的比例;[VIM(Gini)jm]為節(jié)點m前后基尼指數(shù)的變化量;GIl、GIr分別為m節(jié)點分支后兩個新節(jié)點的基尼指數(shù);[VIM(Gini)ij]為特征Xj在第i棵決策樹的重要程度;VIMj為Xj所有決策樹的重要程度之和。根據(jù)上述原理,得到各個影響因素對產能的重要程度,見表2。

對以上結果進行分析可以得出,主控因素分別為生產壓差、射孔段厚度、滲透率和初始含油飽和度,4個參數(shù)的各重要程度皆超過15%。因此對于老井而言,要控制好生產壓差,避免生產壓差過小,采油能力下降;對于新井而言,要打在初始含油飽和度比較高、滲透率比較大的區(qū)域,同時盡量增加射孔段數(shù),投產后要及時控制好井底流壓,從而最大程度地提高產油量,提高經(jīng)濟效益。

2 預測模型建立

2.1 隨機森林回歸原理

隨機森林模型為基于Bagging算法的一種集成學習方法,由多個決策樹集成而來。其既可以用來對數(shù)據(jù)進行分類,也可以用來回歸,回歸的結果為隨機森林中每一棵決策樹回歸結果的平均值。其回歸模型搭建流程如下。

①在大小為N的初始數(shù)據(jù)樣本庫中,以隨機有放回的方式重復m次抽樣,每次抽樣得到n個數(shù)據(jù),構建新的樣本子集[S1,S2,S3,…,Sn]。

②將每個子樣本集訓練成一棵決策樹,從所有特征中隨機選擇Q個,選出最優(yōu)的節(jié)點進行分裂,從而將一個節(jié)點分裂為左右兩個子節(jié)點。循環(huán)上述過程直至達到設定的終止條件,則停止分裂。

③對于分類問題,輸出的結果是多數(shù)決策樹表決的結果;對于回歸問題,輸出的結果是所有決策樹預測結果的平均。具體的隨機森林機器學習模型搭建的流程如圖2所示。

2.2 建立DE-RF模型

差分進化算法是在遺傳算法及其他進化思想的基礎上提出的。該算法可以有效降低操作和計算的復雜性,其專有的記憶能力可以根據(jù)目前的動態(tài)搜索情況,實現(xiàn)調整搜索的目的,具有極強的收斂能力和穩(wěn)健性,且不用借助問題的特征信息,經(jīng)常用于求解多維空間中整體最優(yōu)解,故用來優(yōu)化隨機森林模型中的重要參數(shù),從而建立一種新的基于差分進化優(yōu)化模型超參數(shù)的隨機森林回歸模型(DE-RF)。該模型不僅解決了人為設置模型超參數(shù)速度慢和精度的問題,而且為隨機森林模型與其他各種算法的融合提供了新的思路。DE-RF模型的產能預測詳細流程如下。

①收集各類數(shù)據(jù)樣本,前80%的數(shù)據(jù)為訓練集,剩下20%的數(shù)據(jù)為驗證集,對數(shù)據(jù)進行歸一化以消除各數(shù)據(jù)由于數(shù)量級不一致對模型訓練帶來的影響,處理結果見式(7)。

[X'i=xi?xminxmax?xmin] (7)

式中:[xmin]為數(shù)據(jù)最小值;[xmax]為數(shù)據(jù)最大值。

②從模型中選擇影響較大的5個參數(shù)分別為樹的個數(shù)n、樹的深度d、最大特征個數(shù)f、內部節(jié)點再劃分所需的最少樣本數(shù)s、葉子節(jié)點最小樣本數(shù)l。然后,將選定的5個參數(shù)設為差分進化優(yōu)化的變量,并確定其取值范圍,對這些參數(shù)進行基于差分進化迭代(初始化、變異、交叉和選擇),并將得到的參數(shù)取值代入隨機森林模型,采用預測數(shù)據(jù)與實際數(shù)據(jù)的均方誤差(MSE)作為目標函數(shù)并使其最小化。在達到迭代終止條件后輸出MSE最小值情況下5個參數(shù)的取值作為用于產能預測隨機森林模型的超參數(shù),具體見式(8)。

[MSE=1ni=1n(yi-yi)2] (8)

式中:[yi]為真實值;[yi]為預測值。

按照上述步驟,DE-RF模型搭建流程如圖3所示。

3 模型實例應用

以統(tǒng)計的45口生產井為例,將其中36口生產井作為訓練集,9口生產井作為驗證集,使用差分進化算法對隨機森林模型中的樹的個數(shù)n、最大特征值f、最大深度d、葉子節(jié)點最小樣本數(shù)l、內部節(jié)點再劃分所需的最少樣本數(shù)s等5個參數(shù)進行優(yōu)化。將差分進化算法中的縮放因子設為0.8,交叉概率設為0.2,迭代次數(shù)設為150,隨機森林狀態(tài)參數(shù)設為8。按照上述流程,最終得到基于差分進化優(yōu)化的隨機森林產能預測模型,優(yōu)化的參數(shù)見表3。

與此同時,本研究還采用基于網(wǎng)格搜索優(yōu)化的隨機森林模型(GS-RF)、基于網(wǎng)格搜索優(yōu)化的支持向量機(GS-SVM)、多元線性回歸(MLR)等3種方法進行了預測。不同方法預測驗證集的結果如圖4所示,相對誤差見表4。

由表4可知,基于差分進化優(yōu)化的隨機森林模型,其驗證集的預測結果相對誤差均低于10%,模型的精度較高;基于網(wǎng)格搜索優(yōu)化的隨機森林模型只有兩口井的相對誤差小于10%,B07井的相對誤差甚至超過了30%,平均誤差為14.2%,誤差較大的原因是采用網(wǎng)格搜索容易陷入局部優(yōu)化;基于網(wǎng)格搜索優(yōu)化的支持向量機模型的準確率不超過90%,這是由于支持向量機的計算量比較大,求解的是關于二次規(guī)劃的問題,雖然經(jīng)過了網(wǎng)格搜索優(yōu)化,但適應性還是不高;多元線性回歸方法的平均誤差為14.54%。

4 結論

①采用隨機森林方法對影響產能的6個因素進行重要程度分析得出,重要程度從大到小分別是生產壓差、射孔段厚度、滲透率、初始含油飽和度、油層有效厚度、孔隙度。主控因素為生產壓差、射孔段厚度、滲透率、初始含油飽和度,主控因素影響程度之和為93%。

②不同影響因素之間,孔隙度和含油飽和度之間的正相關性最強;不同影響因素與產能之間不是簡單的線性關系,也不存在某一個起決定性作用的影響因素,產能是由所有因素共同作用的。

③ 基于差分進化優(yōu)化隨機森林模型將優(yōu)化和預測結合一起,相較于其他模型,該模型的誤差更小。本研究為油氣田的產能預測提供了新的思路,具有重要意義。

參考文獻:

[1]張意超,陳民鋒,屈丹,等.X油田特低滲透油藏井網(wǎng)加密效果預測方法[J].巖性油氣藏, 2020, 32(1):144-151.

[2]李金池,胡明毅,李忠誠,等.基于三維地質建模的復雜斷塊致密氣藏產能預測[J].斷塊油氣田,2020,27(1):69-73.

[3]熊健,邱桃,郭平,等.非線性滲流下低滲氣藏壓裂井產能評價[J].石油鉆探技術,2012,40(3):92-96e93c355bdb30e7e5db0cfb6e7bf7aece.

[4]周德華,葛家理.應用等值滲流阻力法建立面積井網(wǎng)水平井產能方程[J].石油實驗地質,2004(6):594-596.

[5]祝志敏,黨勇杰,謝飛,等.分支水平井產能計算研究[J].石油地質與工程, 2012,26(3):82-84,119.

[6]JOBE T D, VITAL-BRAZIL E, KHAIT M. Geological feature prediction using image-based machine learning[J]. Petrophysics– The SPWLA Journal of Formation Evaluation and Reservoir Description, 2018, 59(6):750-760.

[7]SILVA A A, LIMA NETO I A, MISSAGIA R M, et al. Artificial neural networks to support petrographic classification of carbonate-siliciclastic rocks using wellogs and textural information[J].Journal of Applied Geophysic,2015,117:118-125.

[8]武中原,張欣,張春雷,等. 基于LSTM循環(huán)神經(jīng)網(wǎng)絡的巖性識別方法[J].巖性油氣藏,2021,33(3):120-128.

[9]孫予舒,黃蕓,梁婷,等.基于XGBoost算法的復雜碳酸鹽巖巖性測井識別[J].巖性油氣藏, 2020, 32(4):98-106.

[10]楊志成,劉月田,陳方園.改進的聚類法在水平井產能預測中的應用[J].石油地質與工程,2009,23(5):60-63.

[11]馬文禮,李治平,高闖,等.頁巖氣井初期產能主控因素“Pearson-MIC”分析方法[J].中國科技論文, 2018, 13(15):1765-1771.

[12]鐘儀華,張志銀,朱海雙.特高含水期油田產量預測新方法[J].斷塊油氣田,2011, 18(5):641-644.

[13]紀磊,李菊花,肖佳林.隨機森林算法在頁巖氣田多段壓裂改造中的應用[J].大慶石油地質與開發(fā),2020, 39(6):168-174.

[14]程翊珊,李治平,許龍飛,等 預測油層無機積垢的BP神經(jīng)網(wǎng)絡方法[J].大慶石油地質與開發(fā), 2021, 40(3):84-93.

[15]吳君達,李治平,孫妍,等.基于最小二乘支持向量機的二氧化碳驅油瀝青質沉積對儲層傷害的動態(tài)分析[J].科學技術與工程,2020, 20(24):9856-9863.

[16]吳君達,李治平,孫妍,等. 基于神經(jīng)網(wǎng)絡的剩余油分布預測及注采參數(shù)優(yōu)化[J].油氣地質與采收率,2020, 27(4):85-93.

[17]王鏈,張亮,賴楓鵬,等.基于替代模型的油藏注采參數(shù)多目標優(yōu)化設計[J].科學技術與工程, 2019,19(26):178-185.

[18]高明星.多元回歸法預測低滲透油藏壓后產能研究[J].石化技術, 2019, 26(10):371-372.

[19]王洪亮,穆龍新,時付更,等.基于循環(huán)神經(jīng)網(wǎng)絡的油田特高含水期產量預測方法[J].石油勘探與開發(fā),2020,47(5):1009-1015.

[20]林霞,武博宇,王洪亮,等.基于機器學習的油田產量預測的方法比較[J].信息系統(tǒng)工程,2019(8):120-122.

[21]宋宣毅,劉月田,馬晶,等.基于灰狼算法優(yōu)化的支持向量機產能預測[J].巖性油氣藏,2020,32(2):134-140.

石河子市| 杭州市| 富裕县| 营山县| 沙洋县| 田林县| 五常市| 时尚| 重庆市| 宿松县| 长治县| 施秉县| 龙游县| 崇左市| 城固县| 东乌| 平山县| 新绛县| 乾安县| 鄂托克前旗| 甘肃省| 会宁县| 家居| 搜索| 永寿县| 施甸县| 衡东县| 博乐市| 光山县| 镶黄旗| 轮台县| 榆中县| 南郑县| 肇源县| 堆龙德庆县| 霞浦县| 临夏市| 武乡县| 乡宁县| 卓资县| 苏州市|