廖璐璐,李根生,曾義金,宋先知,高啟超,周珺
1.中國(guó)石油大學(xué)(北京)石油工程學(xué)院,北京 102249
2.中國(guó)石化石油工程技術(shù)研究院有限公司,北京 102206
低滲儲(chǔ)層是非常規(guī)油氣儲(chǔ)層的重要組成部分,其在全球石油天然氣供應(yīng)中的地位日益凸顯。隨著我國(guó)油氣能源需求的不斷增加,提升儲(chǔ)量潛力巨大的低滲儲(chǔ)層產(chǎn)量對(duì)于保障我國(guó)經(jīng)濟(jì)發(fā)展和能源安全保障至關(guān)重要。然而,低滲儲(chǔ)層的區(qū)域延展性大、油氣生產(chǎn)效率低,以及鉆井和儲(chǔ)層改造作業(yè)頻繁等特點(diǎn)使得多年在常規(guī)油氣藏生產(chǎn)作業(yè)中所總結(jié)出的知識(shí)體系與開發(fā)方式不能很好的應(yīng)用于此。另一方面,我國(guó)石油公司在海外新區(qū)的勘探開發(fā)過程中缺乏實(shí)踐經(jīng)驗(yàn)。因此,借助以大數(shù)據(jù)和機(jī)器學(xué)習(xí)為代表的AI技術(shù)將是快速掌握儲(chǔ)層數(shù)據(jù)信息、提升認(rèn)知水平、高效制定工程措施,并實(shí)現(xiàn)致密儲(chǔ)層降本增效開發(fā)的重要契機(jī)。
油氣田的生產(chǎn)預(yù)測(cè)至關(guān)重要,需要包括地質(zhì)學(xué)家、油藏工程師、采油師和鉆完井工程師等多個(gè)石油領(lǐng)域?qū)<覀兊姆止ず献?。好的生產(chǎn)預(yù)測(cè)需要專業(yè)、高效和緊密的團(tuán)隊(duì)合作,每個(gè)領(lǐng)域的專家在一個(gè)項(xiàng)目的分析預(yù)測(cè)過程中不僅各有分工,且存在時(shí)間上的先后順序。針對(duì)油氣藏產(chǎn)量預(yù)測(cè),前人進(jìn)行了多方面的探索并得到了許多切實(shí)可行的方法,比如通過遞減分析和典型曲線分析方法[1];利用二元非線性或多元線性回歸出經(jīng)驗(yàn)公式[2];或者使用計(jì)算科學(xué)技術(shù)進(jìn)行綜合油藏?cái)?shù)值模擬[3]。區(qū)別于常規(guī)油氣藏,低滲油氣藏開發(fā)的成功與工程優(yōu)化和合同期內(nèi)的高效開發(fā)更加息息相關(guān)。因此,一個(gè)快速有效的、綜合了地理/油藏/工程參數(shù)的產(chǎn)量預(yù)測(cè)模型非常關(guān)鍵。
隨著數(shù)據(jù)量的爆炸式增長(zhǎng)、計(jì)算資源的日益豐富以及數(shù)學(xué)算法的不斷改善,以數(shù)據(jù)驅(qū)動(dòng)、機(jī)器學(xué)習(xí)技術(shù)等為代表的現(xiàn)代數(shù)據(jù)科學(xué)為傳統(tǒng)石油與天然氣行業(yè)提供了技術(shù)變革的可能性。許多國(guó)家(國(guó)際石油公司)都在此投入了大量的精力,希望發(fā)現(xiàn)新技術(shù)可以提高、改善甚至取代傳統(tǒng)的工業(yè)工藝流程。非常規(guī)頁巖儲(chǔ)層開發(fā)中產(chǎn)生的大量生產(chǎn)、物性和工程參數(shù)為數(shù)據(jù)挖掘的應(yīng)用提供了可能性[4]。加拿大非常規(guī)油氣藏資源豐富、布井密度高,可以提供充足的機(jī)器學(xué)習(xí)樣本。一些經(jīng)典的方法如利用基于圖形辨識(shí)的人工神經(jīng)網(wǎng)絡(luò)方法預(yù)測(cè)獨(dú)立變量的變化值大?。?-7];利用基于因變量與多元自變量的多元線性回歸方法預(yù)測(cè)產(chǎn)能[8-12];利用變量結(jié)構(gòu)回歸(非線性)方法自動(dòng)識(shí)別模型結(jié)構(gòu)等[13-14];利用支持向量機(jī)(SVM)預(yù)測(cè)巖石物性和提高油藏組分模型的運(yùn)行效率[15-16];基于隨機(jī)變量自由組合等原理,利用隨機(jī)森林(RF)回歸方法和梯度提升機(jī)方法(XGboost)通過疊加效果較差的初始預(yù)測(cè)模型最終建立集合優(yōu)化模型等[17-19]。
基于此,筆者提出了利用大數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)來解決中石化海外作業(yè)者項(xiàng)目中產(chǎn)量的快速預(yù)測(cè)和工程參數(shù)的綜合評(píng)估問題。該研究收集了來自加拿大Cardium致密儲(chǔ)層-Pembina油田的1 200多口油井?dāng)?shù)據(jù):利用敏感性測(cè)試確定了與產(chǎn)量相關(guān)的主控因素,在該基礎(chǔ)上建立多維數(shù)據(jù)庫,并為之后的機(jī)器學(xué)習(xí)模型建立打下基礎(chǔ)。根據(jù)敏感性分析結(jié)果,篩選出10種與Cardium低滲儲(chǔ)層累計(jì)產(chǎn)量最為相關(guān)的影響參數(shù)。通過測(cè)試基于不同機(jī)器學(xué)習(xí)技術(shù)的預(yù)測(cè)模型,隨機(jī)森林算法以其最低誤差值、穩(wěn)定的輸出和優(yōu)異的預(yù)測(cè)精度脫穎而出。這種以機(jī)器學(xué)習(xí)技術(shù)為基礎(chǔ)創(chuàng)建的預(yù)測(cè)流程在時(shí)效性和準(zhǔn)確度上均具備優(yōu)勢(shì)(精度可達(dá)85%),可以為現(xiàn)場(chǎng)壓裂施工設(shè)計(jì)優(yōu)化提供可靠的保障。
流程分為4個(gè)步驟:①針對(duì)研究目標(biāo)區(qū)域建立包含樣本、協(xié)變量和標(biāo)簽值的數(shù)據(jù)集合;②利用皮爾遜相關(guān)系數(shù)找尋主控因素和標(biāo)簽函數(shù)的關(guān)鍵節(jié)點(diǎn)時(shí)間;③建立多種機(jī)器學(xué)習(xí)模型,如梯度提升機(jī)(XGboost)、隨機(jī)森林(RF)、支持向量(SVM)和神經(jīng)網(wǎng)絡(luò)等,并計(jì)算預(yù)測(cè)模型精度;④利用k-Fold交叉驗(yàn)證方法進(jìn)一步提升優(yōu)選機(jī)器學(xué)習(xí)模型的預(yù)測(cè)精度,如圖1所示。
圖1 基于數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)技術(shù)的低滲儲(chǔ)層產(chǎn)量預(yù)測(cè)流程
以加拿大阿爾伯塔省的Cardium致密儲(chǔ)層為研究案例。Cardium致密儲(chǔ)層向東延伸至阿爾伯塔省邊界以東約200 km處。厚度從位于西部邊界150 m到平原地區(qū)的不足50 m不等。Cardium致密儲(chǔ)層深度從1 200~2 700 m不等。研究目標(biāo)位于Range 09-13 &Township45-49區(qū)塊,寬約50 km,長(zhǎng)50 km,平均儲(chǔ)層厚度10~20 m。根據(jù)預(yù)測(cè)方法步驟①,將研究區(qū)域內(nèi)的1 286口井經(jīng)過一系列除雜、清洗和篩選,得到可用的數(shù)據(jù)樣本井為612個(gè),每個(gè)樣本中包含50種協(xié)變量(井位/巖性/工程參數(shù))與5組標(biāo)簽值(3、6、9、12、18和36個(gè)月累計(jì)產(chǎn)量)。
根據(jù)預(yù)測(cè)方法步驟②篩選了10種與標(biāo)簽值相關(guān)系數(shù)最高的協(xié)變量:分別是井位坐標(biāo)、資源密度、垂直深度、水平井段長(zhǎng)度、總壓裂段級(jí)數(shù)、總泵入支撐劑量、單位泵入液量、加砂濃度、排量和有無泥隔層;相較于前人研究的標(biāo)簽參數(shù)僅局限在一個(gè)固定值上,選取了不同時(shí)間節(jié)點(diǎn)上的5個(gè)累計(jì)產(chǎn)量值,由此發(fā)現(xiàn)10個(gè)主控因素中的6種鉆完井工程參數(shù)的相關(guān)系數(shù)存在拐點(diǎn),即存在時(shí)間軸上的系數(shù)相關(guān)最大值。以水平井長(zhǎng)度段為例,如圖2(a)所示,不同時(shí)間節(jié)點(diǎn)上的累計(jì)產(chǎn)量值與其相關(guān)系數(shù)略有不同,計(jì)算值在12個(gè)月累計(jì)產(chǎn)量的分析中達(dá)到峰值,其他幾個(gè)工程參數(shù)表現(xiàn)出相類似的特點(diǎn),如圖2(b)所示,判斷“到底利用哪個(gè)時(shí)間節(jié)點(diǎn)為最終標(biāo)簽值”做好了數(shù)學(xué)理論基礎(chǔ)依據(jù)。
圖2 主控因素篩選
嘗試了多種機(jī)器學(xué)習(xí)模型,結(jié)果表明隨機(jī)森林算法在同等條件下所得到的誤差值最低,擁有最好的表現(xiàn)。圖3(a)為決策樹的邏輯表達(dá),圖3(b)為隨機(jī)森林的邏輯表達(dá)。
圖3 算法優(yōu)選
前文提到的運(yùn)算條件指的是數(shù)據(jù)庫總樣本量、訓(xùn)練集/測(cè)試集比例、協(xié)變量值、標(biāo)簽值和驗(yàn)證方法等,如表1所示,該模型建立涉及到的總數(shù)據(jù)量為3萬多個(gè),協(xié)變量包括27個(gè)工程參數(shù)與23個(gè)非工程參數(shù),標(biāo)簽值的最終選擇為12個(gè)月累計(jì)產(chǎn)量,驗(yàn)證方法為10-Fold交叉驗(yàn)證方法,最終的預(yù)測(cè)精度到達(dá)85%以上。對(duì)比不同的運(yùn)算條件可以看出:①總樣本數(shù)量的增加可以顯著減低誤差率;②訓(xùn)練集/測(cè)試集比例控制在80∶20~90∶10的區(qū)間比較合適,比例過大或過小可能造成過擬合和欠擬合;③協(xié)變量數(shù)量一定的情況下,標(biāo)簽值選擇累計(jì)產(chǎn)量為12個(gè)月的預(yù)測(cè)誤差值越低,這也與之前皮爾遜相關(guān)系數(shù)的分析相一致;④k-Fold交叉驗(yàn)證方法可以提高預(yù)測(cè)精度和穩(wěn)定性。
表1 隨機(jī)森林結(jié)果展示
在油藏地質(zhì)相似的情況下,認(rèn)為優(yōu)選6個(gè)工程主控因素將會(huì)對(duì)Cardium致密儲(chǔ)層開發(fā)產(chǎn)生積極的作用,研究的最后一項(xiàng)內(nèi)容則圍繞著如何利用數(shù)據(jù)挖掘解決工程參數(shù)優(yōu)化問題。首先對(duì)全區(qū)的620口井進(jìn)行了分類:類Ⅰ為RT-全區(qū),包含全部井的樣本(地質(zhì)油藏條件良莠不齊,水力壓裂技術(shù)方案多樣);類Ⅱ?yàn)镽T-對(duì)比區(qū)(該處地質(zhì)油藏條件較差,未采用改良水力壓裂技術(shù));類Ⅲ為RT-西南角(該處地質(zhì)油藏條件最差,但采用了改良的水力壓裂技術(shù)),并對(duì)此3類的3個(gè)月、6個(gè)月、9個(gè)月、12個(gè)月和36個(gè)月的平均累計(jì)產(chǎn)量進(jìn)行了對(duì)比。需要注意的是類Ⅱ?yàn)槲磥聿季难芯繀^(qū)域,分區(qū)和具體產(chǎn)值如表2所示。
對(duì)比類Ⅰ與類Ⅱ可以看出,在12個(gè)月前,RT-西南角的水平井的產(chǎn)量表現(xiàn)更為優(yōu)異。在地質(zhì)油藏條件更差的前提下,說明了類Ⅱ儲(chǔ)層改造的效果很好,12個(gè)月后,地質(zhì)油藏因素與產(chǎn)量的相關(guān)性增強(qiáng),產(chǎn)量開始更多的受到儲(chǔ)層本身性質(zhì)的影響。12個(gè)月產(chǎn)量?jī)深惍a(chǎn)值持平,而到36個(gè)月時(shí)全區(qū)平均累計(jì)產(chǎn)量比西南角僅高出了500 m3左右。另外,12個(gè)月這個(gè)轉(zhuǎn)折節(jié)點(diǎn)也與之前皮爾遜相關(guān)系數(shù)值的拐點(diǎn)相一致,相互印證。
對(duì)比類Ⅰ與類Ⅱ說明,RT-西南角相較于油藏地質(zhì)同等或稍好的RT-對(duì)比區(qū)有更高的平均累計(jì)產(chǎn)量,并且一直領(lǐng)先。從3個(gè)月到36個(gè)月累計(jì)產(chǎn)量,差值分別為338.02、655.67、822.40、909.42和1 258.18 m3,增速逐漸變緩。綜上所述,對(duì)比研究的儲(chǔ)層改造工藝有很大提高和優(yōu)化的空間,36個(gè)月產(chǎn)值提高可達(dá)到25%以上,如圖4所示。
圖4 RT全區(qū)、RT-對(duì)比區(qū)和RT-西南區(qū)在不同 時(shí)間上的平均產(chǎn)值對(duì)比
研究相應(yīng)總結(jié)與歸納了該6項(xiàng)工程主控參數(shù)在類Ⅰ、類Ⅱ和類Ⅲ的數(shù)學(xué)統(tǒng)計(jì)值。以尋求產(chǎn)量差異的工程因素差別,在不同的分區(qū)下,施工數(shù)據(jù)存在個(gè)性差別,可以通過對(duì)比區(qū)(需改進(jìn)區(qū)域)與西南角的工程參數(shù)的統(tǒng)計(jì)值的對(duì)比,為對(duì)比區(qū)的新井鉆完井工程參數(shù)設(shè)計(jì)提供參考意見。水平井段長(zhǎng)度方面,類Ⅱ的平均值為1 158.0 m,比類Ⅰ和類Ⅲ的均值小15%~16%,并且全區(qū)范圍內(nèi)的長(zhǎng)度最小值出現(xiàn)在類Ⅱ,最大值出現(xiàn)在類Ⅲ;壓裂級(jí)數(shù)方面,類Ⅱ的平均值為18.5級(jí),比類Ⅰ和類Ⅲ的均值小5%~12%,并且全區(qū)范圍內(nèi)的長(zhǎng)度最小值出現(xiàn)在類Ⅱ,最大值出現(xiàn)在類Ⅲ;每米加砂量方面,類Ⅱ的平均值為361.3 kg/m,比類Ⅰ和類Ⅲ的均值高13%~7%,對(duì)比各項(xiàng)統(tǒng)計(jì)結(jié)果為3種類型中的最高值;每米加液量方面,類Ⅱ的平均值為3.6 m3/m,與類Ⅰ持平,比類Ⅲ高出19%;加砂質(zhì)量濃度方面,類Ⅱ的平均值為481.0 kg/m3,與類Ⅰ持平,比類Ⅲ高出18%;排量方面,類Ⅱ的平均值為7.8 m3/min,與類Ⅰ和類Ⅲ幾乎持平(見表3)。
表3 Cardium致密儲(chǔ)層水平井-關(guān)鍵完井參數(shù)統(tǒng)計(jì)表
最終依據(jù)皮爾遜相關(guān)系數(shù)、累計(jì)產(chǎn)量對(duì)比和不同工程參數(shù)的統(tǒng)計(jì)情況,基于宏觀統(tǒng)計(jì)提出對(duì)比區(qū)域新井的施工改進(jìn)方案:在原有的基礎(chǔ)上將水平井段增加15%~20%;壓裂級(jí)數(shù)相應(yīng)增加10%~15%,即在原有的段間距基礎(chǔ)上保持不變甚至略微加大;每米加砂量和每米加液量保持不變或略微減少;加砂質(zhì)量濃度在原有基礎(chǔ)上減少10%~15%;排量在原有基礎(chǔ)上減少5%~10%。采用該改良工程施工方案,并通過本文提到的優(yōu)化隨機(jī)森林方法可以預(yù)測(cè)對(duì)比區(qū)的12個(gè)月或36個(gè)月累計(jì)產(chǎn)量,結(jié)果相較于研究區(qū)域的歷史平均產(chǎn)量提高15%~20%。考慮到壓裂技術(shù)水平井段長(zhǎng)度、級(jí)數(shù)和壓裂規(guī)模等費(fèi)用的增加,初步計(jì)算了基于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)改良鉆完井參數(shù)后的單井創(chuàng)收值,如表4所示。36個(gè)月累計(jì)提高產(chǎn)量為7185.85桶,考慮桶油操作成本為9.8美元/桶,36個(gè)月累計(jì)創(chuàng)收43.12萬美元,年增收利潤(rùn)約為5.5萬美金/井。
表4 Cardium致密儲(chǔ)層水平井-采用優(yōu)化鉆完井參數(shù)后的年創(chuàng)收效益
從大數(shù)據(jù)的角度出發(fā),在Cardium致密儲(chǔ)層建立了地理/物性/工程與生產(chǎn)數(shù)據(jù)的機(jī)器學(xué)習(xí)模型。完成了該儲(chǔ)層600多口水平井的單因素敏感分析,篩選了主控因素,建立并優(yōu)選了機(jī)器學(xué)習(xí)預(yù)測(cè)模型,優(yōu)化后的精度可以達(dá)到85%以上。該研究為Cardium致密儲(chǔ)層提供了一套切實(shí)可行的集數(shù)據(jù)庫建立、主控因素篩選和機(jī)器學(xué)習(xí)方法建立優(yōu)化等一體的產(chǎn)量預(yù)測(cè)方法,進(jìn)而可以更加快速合理地評(píng)估儲(chǔ)層和降低開發(fā)成本。
1)利用皮爾遜相關(guān)性分析,在50種協(xié)變量中甄選了10個(gè)主控因素,分別是井位坐標(biāo)、資源密度、垂直深度、水平井段長(zhǎng)度、總壓裂段級(jí)數(shù)、總泵入支撐劑量、單位泵入液量、加砂濃度、排量和有無泥隔層。參數(shù)不僅僅局限在一個(gè)固定值上,而是找到了不同時(shí)間節(jié)點(diǎn)上的5個(gè)累計(jì)生產(chǎn)產(chǎn)量值,并利用相關(guān)值的拐點(diǎn)找到時(shí)間軸上的系數(shù)最相關(guān)值。
2)眾多模型中隨機(jī)森林的預(yù)測(cè)模型具有最低的誤差值,預(yù)測(cè)精度可以達(dá)到85%以上。中小型數(shù)據(jù)庫中可以利用k-Fold交叉驗(yàn)證方法來提升模型預(yù)測(cè)精度和預(yù)測(cè)穩(wěn)定性。
3)訓(xùn)練集/測(cè)試集比例控制在80∶20~90∶10的區(qū)間比較合適,比例過大或過小可能造成過擬合和欠擬合,另外,通過降低葉子節(jié)點(diǎn)維數(shù)也可以解決過度擬合的問題。
4)結(jié)合皮爾遜相關(guān)性研究,Cardium致密儲(chǔ)層前12個(gè)月累計(jì)產(chǎn)量與工程參數(shù)更相關(guān),而之后則逐漸受到地質(zhì)油藏條件的影響。西南角在相同甚至更差的地質(zhì)油藏情況下,仍然可以通過增加水平井段長(zhǎng)度、每米加砂量、每米加液量和減少加砂質(zhì)量濃度來提高產(chǎn)量。預(yù)計(jì)在目標(biāo)區(qū)域,通過基于數(shù)據(jù)挖掘與機(jī)器學(xué)期技術(shù)優(yōu)化后的鉆完井參數(shù)將為目標(biāo)區(qū)域創(chuàng)造5~6萬美元/井的增收效益。