郭海峰,肖坤葉,程曉東,杜業(yè)波,杜旭東,倪國輝,李賢兵,計 然
(1.中國石油集團測井有限公司國際公司,北京 102206;2.中國石油集團科學技術研究院有限公司,北京 100083)
乍得Bongor 盆地花崗巖潛山儲層裂縫發(fā)育,目前學界對其研究重點主要是巖性識別和流體性質識別方面[1-2],而對儲層物性評價,尤其是滲透率定量計算方面的研究工作相對欠缺,這嚴重制約了該區(qū)基巖潛山油藏的開發(fā)。滲透率是油田開發(fā)所需的一個重要參數(shù),但其影響因素多、建模難度大,至今沒有形成統(tǒng)一的理論計算模型,尤其是對于含有裂縫的雙重孔隙介質的滲透率計算模型研究尚不成熟[3]。在實際應用中,一般采用間接方法將可以直接測量的巖石物理參數(shù)轉換為滲透率。例如,利用常規(guī)測井和成像測井資料,建立滲透率與裂縫孔隙度、裂縫開度及裂縫密度等參數(shù)的關系[4-5];基于陣列聲波資料,利用斯通利波能量衰減計算雙重介質滲透率[6]等。這些方法解釋參數(shù)多、人工干預程度大,因此計算結果精度不高。滲透率預測具有影響因素多、規(guī)律模糊、難以準確全面描述的特點,機器學習是解決此類問題的一種有效途徑。目前,機器學習已在儲層評價中展現(xiàn)出巨大的應用潛力[7-9],如有監(jiān)督學習、無監(jiān)督學習和半監(jiān)督學習等方法在復雜巖性/巖相識別[10-11]、曲線重構、物性參數(shù)計算等方面都取得了良好的應用效果。然而,在裂縫型儲層中,裂縫的延伸尺度比孔隙大,難以通過巖心分析獲得能充分表征地層滲流特征的巖石物理參數(shù),這直接導致缺乏機器學習所需的標簽數(shù)據(jù)。因此,無法直接使用上述機器學習方法對裂縫型儲層進行評價。與巖心分析相比,試油過程能反映壓力波及范圍內(包含裂縫)所有儲層特征對滲透率的影響,這就提供了解決機器學習應用問題的另外一種可能性,即將試油資料轉換為標簽數(shù)據(jù)。
針對乍得Bongor盆地花崗巖潛山裂縫型油藏,提出一種機理模型與機器學習數(shù)據(jù)驅動相融合的儲層有效滲透率計算方法,將試油資料轉換為機器學習所需的標簽數(shù)據(jù),挑選出有效的試油井段,并建立樣本庫,以期為該區(qū)裂縫型儲層有效滲透率計算探索新的途徑,指導油藏開發(fā)。
Bongor 盆地位于乍得西南部、中非剪切帶中段北側,是受中非剪切帶影響發(fā)育起來的中生代—新生代陸內拉分盆地。盆地在早白堊世經(jīng)歷了強烈的斷陷,具有典型的被動裂谷特征,晚白堊世強烈抬升反轉,古近紀統(tǒng)一成盆。盆地內沉積的中生界—新生界陸相碎屑巖地層厚度超過10 km,其中下白堊統(tǒng)泥巖是基巖潛山的油源和良好的區(qū)域蓋層。Bongor 盆地花崗質基巖潛山(下文簡稱潛山)[12]主要分布在盆地的北部斜坡區(qū)(圖1),其形成主要受構造背景和斷裂活動的影響,類型以單面山為主,控山斷層一般較陡,斷面傾角大于50°。潛山在裂谷作用早期才翹傾形成的,其圈閉的幅度、規(guī)模和平面展布特征受斷層控制?;鶐r是由巖漿巖和正變質巖構成的雜巖體,其中巖漿巖主要由花崗巖、正長巖和二長巖組成,變質巖主要為片麻巖和混合花崗巖,基巖形成或變質的時代為寒武紀紐芬蘭世—新元古代。
圖1 Bongor 盆地構造單元劃分和潛山油田分布(據(jù)文獻[12]和[13]修改)Fig.1 Division of tectonic units and distribution of buried-hill oil fields in Bongor Basin
潛山儲層主要有風化殼孔隙型儲層和內幕裂縫型儲層兩大類,儲集空間主要包括破碎粒間孔、構造裂縫、構造-溶解縫、解理縫及溶孔等。儲層縱向上具有明顯的分帶性,分為4 個區(qū)帶:風化殼、碎裂帶、半充填裂縫碎裂帶和致密帶,其中,風化殼和碎裂帶儲集條件較好,向下進入潛山內部逐步變差??紫缎蛢又饕l(fā)育在頂部風化殼,以破碎的粒間孔和溶蝕孔洞為主,向下過渡到以裂縫為主,局部沿裂縫發(fā)育溶蝕孔洞;裂縫型儲層以構造活動形成的大量構造縫和解理縫為主,沿裂縫周圍偶見裂縫的擴溶現(xiàn)象,發(fā)育溶蝕孔洞,裂縫和孔隙中常充填有絹云母、高嶺石、綠泥石、伊蒙混層黏土以及次生石英等。潛山儲層平面上分布廣泛,但非均質性強,不同構造部位儲層厚度和品質差異較大[13]。基巖儲層發(fā)育主要受古構造位置、基巖巖性以及構造活動的影響,有利儲層一般發(fā)育在局部構造高部位和主要斷裂帶附近。富含長英質礦物的基巖層段裂縫相對發(fā)育,沿裂縫風化淋濾作用強烈。頻繁的構造活動在基巖中形成了多期構造裂縫,主斷層附近裂縫更為發(fā)育。
由于Bongor 盆地花崗質基巖潛山巖性和儲集空間復雜,加上儲層縱向和橫向非均質性均較強,測井響應特征也復雜多變,幾乎是“一井一特征”,這大幅增加了測井資料解釋的難度,例如裂縫充填程度和地層礦物變化增加了分析電性曲線響應特征的復雜度。以X-10 井為例(圖2),取心段為花崗斑巖,黑云母和其他暗色礦物局部富集,裂縫極為發(fā)育,但大部分被綠泥石等礦物充填,單從電成像圖像上難以將張開縫與充填縫區(qū)分開來。多種原因導致研究區(qū)潛山油藏發(fā)現(xiàn)初期測井解釋與試油結果之間的矛盾一度非常突出,因此,劃分裂縫類型、準確計算滲透率,進而評價儲層有效性,成為提高潛山油藏解釋符合率面臨的主要難題。
滲透率計算問題一般通過有監(jiān)督機器學習(Supervised Machine Learning)[14]來解決,而訓練機器學習模型需要用到樣本庫(Sample Dataset),其由輸入曲線和標簽共同構成。其中,輸入曲線或特征(Feature)是指與滲透率變化相關的測井數(shù)據(jù),標簽(Label)是指某深度點地層對應的準確滲透率數(shù)據(jù)。有監(jiān)督機器學習的目標就是找到一個最優(yōu)函數(shù)或模型,將輸入曲線正確地映射到滲透率。
Bongor 盆地潛山具有相對豐富的試油數(shù)據(jù),而對于裂縫型儲層,通過試油過程可以獲取反映裂縫發(fā)育尺度下的滲流特性參數(shù),這是通過巖心分析難以實現(xiàn)的。因此,可以通過試油數(shù)據(jù)導出標簽數(shù)據(jù),但是試油數(shù)據(jù)并不能直接用作標簽數(shù)據(jù),需要有一個處理和轉換過程。
油藏流體向井流動的規(guī)律滿足達西定律,根據(jù)達西定律和徑向壓力擴散方程,對于圓形地質中心的一口井,供給邊緣壓力不變時,滿足如下公式(法定單位)[15]:
式中:Ke為儲層有效滲透率,m2(1 m2=1.013 25×1015mD);IP為生產(chǎn)指數(shù),m3/s/Pa(生產(chǎn)中常用單位為bbl/d/psi);?為儲層有效厚度,m;B為流體體積系數(shù);μ為流體黏度,Pa·s;re為泄油邊緣半徑,m;rw為井眼半徑,m;q為產(chǎn)量,m3/s為地層平均壓力,Pa;pwf為井筒流動壓力,Pa;TC代表組合流體黏度、體積系數(shù)、供給半徑、表皮系數(shù)等參數(shù)的試油條件。
對于同一試油井段,米生產(chǎn)指數(shù)(IP/h)與滲透率呈正比關系,地層系數(shù)K·h與IP也呈正比關系,下文中將稱K·h或IP稱為滲透率指示參數(shù)KIND。
定義由試井解釋求取的有效滲透率為。從上述公式可以看出,當TC一致時,不用計算,而是直接依據(jù)KIND就可以比較TC一致時不同試油井段之間的滲透性差異。將這些具有滲透率可比性的井段放在一起就可以構建樣本庫,此規(guī)律是本文方法的根本依據(jù)。此外,試井解釋模型需要較多的輸入?yún)?shù),其中就包含有效儲層厚度,而在不知道滲透率的前提下很難準確給出潛山儲層的有效厚度,這就形成了循環(huán)依賴,增加了計算的不確定性。KIND的計算相對容易,利用KIND直接比較TC一致井段的滲透性,將KIND作為樣本庫的標簽數(shù)據(jù)依據(jù),避開計算,這是本文方法的額外優(yōu)勢。
KIND為試油井段的單值標量參數(shù),為了應用機器學習方法,必須將其轉換為有效滲透率連續(xù)曲線Ke。轉換方法為:選取某條滲透率敏感的測井曲線作為滲透率指示曲線KIND-Log,將其曲線值視為單值滲透率分配權重,將KIND逐點分配形成Ke連續(xù)曲線:
式中:為第i個深度點的有效滲透率,mD;為第i個深度點的滲透率指示曲線值;和分別為試油井段滲透率指示曲線最小值和最大值;htop和hbottom分別為試油井段頂部和底部的深度,m;RS為深度采樣間隔,m。
挑選TC一致的試油井段是關鍵步驟之一。采用建模條件一致性指示交會圖(以下簡稱指示交會圖),即dh(滲透率指示曲線對深度積分)和KIND的交會圖。如果試油井段TC一致,KIND-Log選擇合理且其變化程度能夠指示滲透率大小,交會圖上的數(shù)據(jù)點將呈直線趨勢分布,這些數(shù)據(jù)點對應的井段稱為有效建模井段。將沿直線分布的試油井段挑選出來的過程命名為建模數(shù)據(jù)一致化過程,將所有有效建模井段的測井曲線聚合就可以形成樣本庫,其中Ke為標簽數(shù)據(jù)。針對非試油井段,采用有監(jiān)督機器學習方法可以得到TC條件下的視有效滲透率曲線。
該方法融合了機理模型與機器學習數(shù)據(jù)驅動模型[16],關注點并不是機器學習算法本身,而是標簽數(shù)據(jù)和樣本庫的構建過程。樣本庫構建方法也不是通過機理模型正演出訓練樣本[17],而是在巖石物理學、滲流力學等機理模型的指導下,依據(jù)現(xiàn)有研究成果和領域專家經(jīng)驗,通過上述建模數(shù)據(jù)一致化過程將學習樣本挑選出來。完整的方法流程如圖3 所示,共3 個階段:第一階段是利用建模數(shù)據(jù)一致化過程形成Ke標簽數(shù)據(jù),其中另一個重要環(huán)節(jié)生成和挑選KIND-Log會在下節(jié)詳細介紹。第二階段是特征工程,目標是尋找滲透率敏感的輸入曲線,與標簽數(shù)據(jù)一起組成樣本庫。第一階段和第二階段的主要目標都是建立樣本庫,也是本文方法的主要關注點。第三階段是利用樣本庫訓練機器學習模型,然后在待評價井上進行有效滲透率預測,這一階段是傳統(tǒng)機器學習應用所關注的環(huán)節(jié),涉及到了算法選擇、模型參數(shù)優(yōu)化和模型解釋等主題。
圖3 機理模型與機器學習數(shù)據(jù)驅動相融合的儲層有效滲透率計算方法流程框架Fig.3 Framework of effective permeability calculation method integrating mechanism model with machine learning data-driven techniques
本次研究共收集了來自Bongor 盆地B,L,M,P和R 共5 個潛山37 口井的47 層試油數(shù)據(jù)。潛山段一般為裸眼完井,試油方式為整段試油(油嘴128/64 in,1 in=2.54 cm),試油段厚度為200~800 m。試油統(tǒng)計結果顯示,生產(chǎn)指數(shù)為0.002~100.200 bbl/d/psi(0.04~2 311.90 m3/d/MPa)(1 bbl=0.159 m3,1 psi=0.006 895 MPa),高產(chǎn)油層產(chǎn)量可達5 576.74 bbl/d(886.70 m3/d),而低產(chǎn)油層產(chǎn)量只有2.55 bbl/d(0.41 m3/d)(抽汲)。
真正對試油產(chǎn)量有貢獻的是有效裂縫,無效裂縫主要有三大類,即后期被充填或者關閉的張開裂縫、不連續(xù)或無延伸導致的無滲透性裂縫、鉆井過程引發(fā)的各種誘導縫等。首先定性識別出完全無效裂縫,對應的無效儲層段對產(chǎn)量沒有貢獻,其有效滲透率可視為零;其次,采用KIND-Log來刻畫剩余儲層。
挑選KIND-Log需要用到常規(guī)測井、電成像測井、陣列聲波、錄井、鉆井、試油等多專業(yè)資料,并結合現(xiàn)有認識和專家經(jīng)驗,由人工進行分析,這是一個領域知識驅動的關鍵過程,屬于傳統(tǒng)測井解釋范疇。
傳統(tǒng)方法一般是通過由成像測井導出的裂縫密度、裂縫開度、傾角等參數(shù),對裂縫型地層進行定量評價,但這些參數(shù)與常規(guī)測井等曲線存在縱向深度分辨率不匹配的問題。本文方法不直接使用這些參數(shù)構建樣本庫,而是在假定因裂縫發(fā)育引發(fā)的滲透性改變程度在探測范圍為井筒周圍的測井曲線上具有反映這一認識的基礎上,將KIND-Log和輸入曲線的選擇范圍擴展到常規(guī)測井、錄井、鉆井等曲線中,這在很大程度上豐富了選擇范圍,而KIND-Log的選擇是否合理則由建模數(shù)據(jù)一致化過程來保證。
經(jīng)過研究發(fā)現(xiàn),乍得Bongor 盆地潛山對裂縫發(fā)育敏感的曲線有:自然伽馬(GR)、中子(CN)、密度(DEN)、聲波時差(DT)、電阻率(RD)、致密段和裂縫段電阻率比值(RFR)、常規(guī)測井計算孔隙度(φ)(曲線名記為POR)、測井視波阻抗Z'(曲線名記為Z_APP)、微電阻率掃描成像動態(tài)和靜態(tài)圖像(FMI_DYN,F(xiàn)MI_STAT)、微電阻率掃描成像次生孔隙度(VISO)、斯通利波反射系數(shù)(STRC)、錄井全烴(TG)、鉆速(ROP)、井溫導數(shù)(TEMP_D)等,這些曲線也稱為KIND-Log候選曲線。此外,測井解釋可獲得六大類“優(yōu)勢巖性”序列:混合花崗巖、酸性巖、混合片麻巖、中性巖、片麻巖、基性巖(代碼分別為MGRANITE,ACID,MGNEISS,INTERM,GNEISS,BASIC),優(yōu)勢巖性淺色礦物含量高、脆性高、塑性弱,同等構造應力條件下容易發(fā)育裂縫。
參照試油結果,總結得到有效裂縫發(fā)育段的特征:巖性為優(yōu)勢巖性、電成像圖像上可見裂縫發(fā)育、φ≥4%,Z'≤15.5 g/cm3·m/μs,RD≤2 000 Ω·m,RFR≥10,VISO>2%,STRC>0.1,ROP明顯變大、T' 出現(xiàn)正異常等。根據(jù)這些特征,可以將每個試油井段的有效儲層段劃分出來。
建模數(shù)據(jù)一致化的目標是挑選有效建模井段和確定KIND-Log,這是一個反復迭代過程,步驟如下:①從KIND-Log候選曲線中選擇出第i次迭代滲透率指示曲線;②對每個試油井段計算無效儲層段曲線值置0;③制作指示交會圖,IP計算相對簡單,所以多數(shù)情況下可以選用IP作為KIND;④轉到步驟①,繼續(xù)選擇下一條候選曲線;⑤從所有指示交會圖中挑選出數(shù)據(jù)點直線分布集中度最高的作為最優(yōu)結果,直線附近的試油井段作為有效建模井段,對應的滲透率指示曲線將用于生成Ke標簽數(shù)據(jù);⑥如有必要,可以調整有效裂縫發(fā)育段劃分結果,重復步驟①—⑤。
最終有效建模井段將是有效裂縫發(fā)育段劃分準確、KIND-Log選擇合理、TC條件一致的試油井段,生成的標簽數(shù)據(jù)Ke具有可比性。
經(jīng)過對比,本文選擇測井視波阻抗Z'和孔隙度φ作為主要的KIND-Log曲線,其中,Z'計算公式為
式中:Z'為視波阻抗,g/cm3·m/μs;DEN為密度測井值,g/cm3;DT為聲波時差測井值,μs/m。
Z'是儲層物性好壞的直接反映,與φ相比,Z'計算較為簡單直接,人工干預較少,指示交會圖中數(shù)據(jù)點分布更為集中。
指示交會圖分析結果如圖4 所示,采用φ和Z'作為滲透率指示曲線的有效建模井段分別有12 個和14 個,總共篩選出19 口井26 個有效建模井段。
圖4 建模條件一致性指示交會圖Fig.4 Crossplot of modeling consistency indication
圖4 中圓形虛線標注的為無效數(shù)據(jù)點,對應的是非有效建模井段,被排除的主要原因包括:①井眼擴徑嚴重,測井曲線尤其是孔隙度曲線失真嚴重;②數(shù)據(jù)的來源井為潛山兼探井,潛山段鉆井進尺較短;③試井解釋采用徑向復合模型,井筒周圍測井曲線特征與壓力波及范圍內地層動態(tài)滲流特征不完全一致;④縱向巖性變化快,難以準確建立KIND-Log曲線;⑤油質發(fā)生變化,與主趨勢線TC不一致;⑥是低產(chǎn)井段,IP計算誤差較大。
研究中并不追求將所有試油井段都納入樣本庫,而是在覆蓋了潛山不同部位、不同巖性、不同品質儲層的前提下,只挑選數(shù)據(jù)質量高的井段。最終TC取流體黏度為2.55~5.25 mPa·s、體積系數(shù)為1.02~1.16、表皮系數(shù)為1.01~5.09、供給半徑約為500 m,試井解釋模型為雙孔或雙滲模型。
從建模有效井段中選擇結果可靠的6 層,重新進行試井解釋,求取K·h,然后回歸得到IP與K·h的轉換公式,據(jù)此生成樣本庫的標簽數(shù)據(jù)Ke:
式中:K·h為地層系數(shù),mD·m;IP為生產(chǎn)指數(shù),bbl/d/psi。
特征工程是指挑選或構建輸入測井曲線的過程,其結果對最終模型的預測性能具有較大影響[18-19]??紤]到潛山測井資料采集情況,輸入曲線以常規(guī)測井曲線為主,但是僅僅使用原始測井曲線是不夠的,還需要構建新的特征曲線,增加輸入曲線信息的豐富程度。特征構建方法一般以領域知識和機理模型驅動為主,無監(jiān)督學習為輔,從以下3 個方面構建新特征。
(1)巖性敏感測井曲線。潛山巖石大致由淺色礦物系列和暗色礦物系列造巖礦物組成,兩者在中子、密度和自然伽馬曲線上的響應特征不同,同時由于后期變質作用和變質程度的影響,變質巖比巖漿巖具有更強的非均質性,變質巖測井曲線呈鋸齒狀,而巖漿巖測井曲線則呈平直狀,自然伽馬曲線尤為明顯。據(jù)此導出5 條新的巖性特征曲線:自然伽馬窗口標準差(GR_WSDEV)和窗口均值(GR_WAVG),視中子-密度孔隙度差(CDPD)、窗口標準差(CDPD_WSDEV)和窗口均值(CDPD_WAVG),深度窗長取3 m,CDPD定義如下:
式中:CDPD為視中子-密度孔隙度差,%;DEN為密度曲線值,g/cm3;DENmin為視流體密度,g/cm3,取2 g/cm3;DENmax為視骨架密度,g/cm3,取3 g/cm3;CN為中子曲線值,%;CNmin為視骨架中子孔隙度,%,取-18%;CNmax為視流體中子,%,取42%。視骨架密度和視骨架中子孔隙度均沒有采用習慣取值,是為了加大兩者之間的差異程度,以便更好地指示巖性差異。
(2)聚類-巖心標定相結合的方法得到測井巖性識別曲線。首先采用Geolog FacimageTM[20]模塊中的MRGC(Multi-Resolution Graph-Based Clustering)算法[21],輸入GR,GR_WSDEV,GR_WAVG,DEN,CN,DT,CDPD,CDPD_WSDEV和CDPD_WAVG共9 條曲線,聚類得到16 個巖性類別,曲線名為LITH_MRGC;然后根據(jù)巖心薄片鑒定結果對聚類結果進行標定,由于其中包含有混合花崗巖-酸性巖、片麻巖-中性巖、片麻巖-混合片麻巖等這些測井特征有所重疊的過渡巖性,因此聚類巖性類別要多于六大類。
(3)輔助表征潛山儲層縱向分帶特性的歸一化垂深曲線TVDSSnorm,定義為
式中:TVDSSnormi為第i個深度點的歸一化垂深;TVDSSi為第i個深度點的垂深,m;Basementtop和Basementbottom分別為整個潛山油藏的頂部垂深和底部垂深,m。
圖5 為試油井段TVDSSnorm和IP的交會圖,利用該交會圖可以檢查試油井段是否符合縱向分帶變化規(guī)律,建模有效井段主要來自交會點在主趨勢線上的試油井段。
圖5 歸一化垂深與生產(chǎn)指數(shù)交會圖(顏色代表不同井段)Fig.5 Crossplot of TVDSSnorm and IP
最終樣本庫由19口井的51 348 個深度點數(shù)據(jù)組成,視有效滲透率為0.01~1 601.50 mD,其中85%為非儲層樣本數(shù)據(jù)。特征曲線包含GR,GR_WSDEV,GR_WAVG,DEN,CN,DT,CDPD,CDPD_WSDEV,CDPD_WAVG,TVDSS_NORM,Z_APP,LITH_MRGC,RD(深電阻率),RS(淺電阻率)共14 條;LITH_MRGC經(jīng)過One-Hot 編碼得到16 條巖性編碼曲線,曲線名分別為LM_0,LM_1,…,LM_15。整個樣本庫具有足夠的代表性,基本覆蓋到了主要的潛山帶,包含不同巖性、不同儲層品質和不同試油產(chǎn)量井段的輸入曲線響應特征。
為了檢驗該方法的有效性,從樣本庫中挑選出X-5 井作為檢驗井,該井的2 875 個樣本點數(shù)據(jù)不參與建模過程,剩余的樣本點共48 473 個數(shù)據(jù)點作為模型選擇及最終模型訓練的訓練集。
由于滲透率為連續(xù)數(shù)值,所以使用監(jiān)督機器學習中的回歸算法來建模。上述過程形成的樣本庫屬于典型的“扁平表格數(shù)據(jù)”(Tabular Data),這也是測井解釋中經(jīng)常碰到的一大類數(shù)據(jù)。已有研究表明,采用集成學習中的梯度提升決策樹算法(Gradient Boosting Decision Tree,GBDT)處理“扁平表格數(shù)據(jù)”,比深度神經(jīng)網(wǎng)絡的性能表現(xiàn)更優(yōu)異[22-24],其基本原理是利用梯度增強方法將多個弱回歸樹結果累加起來得到最終預測結果。
回歸建模過程:①確定候選算法。k-最近鄰(k-Nearest Neighbors,KNN)[25]、支持向量機(Support Vector Machine,SVM)[26],LightGBM[27],XGBoost[28]共4 種回歸算法,其中LightGBM 和XGBoost 均為GBDT算法的增強實現(xiàn)。②模型評估。因為強調高滲層的預測準確率,選擇均方根對數(shù)誤差RMSLE作為模型選擇評估指標,采用10 折交叉檢驗(Cross Validation,CV)作為模型評估方法,均方根誤差RMSE 作為檢驗集準確率評估指標。③超參數(shù)優(yōu)化。梯度提升樹算法具有很多參數(shù),但實際使用時并不需要對每個參數(shù)進行調整[29],使用貝葉斯超參數(shù)優(yōu)化[30](Bayesian Optimization)方法獲得最優(yōu)模型參數(shù)。④編程實現(xiàn)。利用Python 編程實現(xiàn)整個建模和計算過程,其中用到了scikit-learn[31]和scikit-optimize[32]開源代碼庫。
從模型評估結果(表1)可以看出,XGBoost 算法無論是在訓練集還是檢驗集均表現(xiàn)最好。同時,研究中也使用了FLAML[33]庫進行了自動模型選擇,結果顯示XGBoost 算法仍然最優(yōu)。由于KNN算法計算過程直觀、易于理解,而且性能也滿足要求,因此選擇XGBoost+KNN 作為雙重預測模型參與視有效滲透率計算。
表1 不同算法回歸建模評估結果Table 1 Results of regression modeling and evaluation by different algorithms
利用上述模型預測得到的視有效滲透率為Kepred,可用于有效儲層段劃分和輔助進行裂縫類型解釋。經(jīng)過研究得到儲層有效性評價標準:Ke≥1 mD 為有效儲層、Ke≥50 mD為好儲層。
根據(jù)X-5 檢驗井的解釋成果(圖6),該井潛山段縱向巖性復雜多變,從電成像圖像上可以看到以破碎結構為主,裂縫較為發(fā)育;從Kepred可看出,有效儲層段位于潛山頂部的混合花崗巖和混合片麻巖段,裂縫以張開縫為主;下段有效滲透率很小,以充填程度較高的裂縫為主,為無效儲層。響應特征與試油結果一致,該井上段試油產(chǎn)油量為154.84 bbl/d(油嘴124/64 in),下段試油抽汲結果為干層。
圖6 Bongor 盆地X-5 井有效滲透率計算綜合成果Fig.6 Results of effective permeability calculation of well X-5 in Bongor Basin
對于測井解釋來說,僅僅計算出有效滲透率數(shù)值是不夠的,還需要獲得模型的預測細節(jié)。因此使用SHAP[34-35]值對XGBoost 這種黑箱模型的預測過程進行解釋。SHAP 采用合作博弈論方法計算樣本特征對模型預測輸出的影響程度,X-5 井XGBoost和KNN 模型的SHAP Beeswarm 圖如圖7 所示,圖中列出了前10 個重要的輸入曲線排序以及曲線值大小對于Ke計算結果高低的影響,SHAP 值為正表明增大Ke,為負表明減小Ke。
圖7 Bongor 盆地X-5 井SHAP Beeswarm 圖Fig.7 SHAP Beeswarm plot of well X-5 in Bongor Basin
對于XGBoost 模型來說,對視有效滲透率預測影響程度排名前10 的曲線是Z_APP,TVDSS_NORM,DEN,GR_WAVG,DT,CN,CDPD_WAVG,RS,RD和GR_WSDEV。對各曲線分析如下:①Z_APP。裂縫發(fā)育程度和溶蝕強度在井周處的綜合反映,也是樣本庫的曲線,與有效滲透率相關性最強。②TVDSS_NORM。潛山儲層縱向分帶性體現(xiàn),儲層埋藏越深,則滲透性越差。③DEN,GR_WAVG,DT,CN,CDPD_WAVG等,綜合反映巖性影響。④RS,RD。潛山有效儲層的基本特征是高阻背景下的低阻段,巖性相同時,電阻率下降幅度越大,指示儲層滲透性越好、裂縫充填程度越低,是巖性、滲透率和物性影響的綜合體現(xiàn)。XGBoost 模型充分利用了這些最主要的輸入曲線信息,與潛山儲層品質控制因素定性認識一致,說明模型預測是可靠的,也獲得了較高的預測精度。相比之下,KNN 模型主要利用了巖性、物性和儲層縱向分帶性等曲線進行預測,其計算精度不如XGBoost 模型。
由于測井巖性識別曲線LITH_MRGC為類別型數(shù)據(jù),經(jīng)過One-Hot 編碼后作為特征曲線,SHAP對此類曲線分析能力有限,為此建立一個不包含LITH_MRGC的模型XGBoost2。從表1 可看出,包含LITH_MRGC的XGBoost1的預測準確率更高,因此添加巖性聚類結果可以改善預測效果。
(1)在裂縫型儲層滲透率計算中應用有監(jiān)督機器學習的難點并不在于算法本身,而在于獲取能反映裂縫發(fā)育尺度滲流特征的標簽數(shù)據(jù),但其通過巖心資料獲取難度很大,利用試油數(shù)據(jù)轉換是另一種可行途徑。
(2)將試油數(shù)據(jù)轉換為機器學習所需的標簽數(shù)據(jù)的關鍵技術是利用建模條件一致性指示交會圖執(zhí)行建模數(shù)據(jù)一致化過程,挑選出有效的試油井段,并建立樣本庫。標簽為TC一致時的視有效滲透率,輸入曲線為反映潛山巖性、裂縫發(fā)育程度、儲層縱向分帶性等特征的原始或導出測井曲線。
(3)在機理模型與機器學習數(shù)據(jù)驅動相融合的儲層有效滲透率計算方法回歸建模中,XGBoost 模型計算的檢驗井視有效滲透率結果與試油結果一致,計算結果準確可靠。
(4)本文方法拓展了機器學習方法在測井解釋中的應用范圍,雖然計算得到的是視有效滲透率,與真實有效滲透率有差異,但具有相對比較意義和實用價值,可用于劃分裂縫類型、評價儲層有效性等。