国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隨機(jī)森林算法的復(fù)雜碳酸鹽巖巖性識別

2020-11-19 06:26:16楊添微劉永震張占松
工程地球物理學(xué)報 2020年5期
關(guān)鍵詞:白云巖決策樹灰?guī)r

王 啟,楊添微,劉永震,聶 昕,2,張占松,2,萬 宇,2

(1.長江大學(xué) 地球物理與石油資源學(xué)院,湖北 武漢 430100;2.長江大學(xué) 油氣資源與勘探技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430100)

1 引 言

隨著世界石油和天然氣的不斷深入勘探和開發(fā),具有良好物性的儲層日益減少,油氣儲量日益下降,復(fù)雜巖性的儲層開始進(jìn)入人們的視線,其中碳酸鹽巖儲層油氣藏已發(fā)展為國內(nèi)重要的新型油氣資源[1],也是目前中國石油化工企業(yè)在海內(nèi)外投資主要的油氣藏類型[2]。復(fù)雜碳酸鹽巖儲層具有非常強(qiáng)的非均質(zhì)性[3,4],因此在巖性識別上十分困難。地層巖性最直接的識別方法是采用鉆井取芯,但是由于井式取芯成本高昂,所以一般不采用這種方法?,F(xiàn)有巖性識別方法主要為通過少量測井巖芯來標(biāo)定測井曲線,并利用所得測井曲線數(shù)據(jù)進(jìn)行全井段的巖性識別。常見的測井巖性識別方法有:測井資料交會圖法、聚類分析識別方法及模式識別分析方法[5-7]。但是采用測井資料交會圖法仍然存在難以準(zhǔn)確識別礦物復(fù)雜,儲層的巖性條件變化多樣等問題,而聚類分析識別方法也同樣存在著在巖性識別中無法有效保證精度的重要缺陷[8]。因此為了解決復(fù)雜碳酸鹽巖儲層強(qiáng)非均質(zhì)性所帶來的測井曲線多解性的問題,目前人們常常采用支持向量機(jī)法[9]、神經(jīng)網(wǎng)絡(luò)及其衍生的方法[10]等非線性的智能信息處理技術(shù)來進(jìn)行復(fù)雜碳酸鹽巖儲層巖性的識別。但是由于支持向量機(jī)法在分類時過于依賴核函數(shù)和懲罰參數(shù)的選取,所以對缺失的數(shù)據(jù)非常敏感,因此在解決多分類問題存在缺陷;而神經(jīng)網(wǎng)絡(luò)及其衍生的方法則存在易于陷入局部最小和收斂速度慢等問題,其參數(shù)選取和網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)對識別結(jié)果的準(zhǔn)確率影響很大,常常不能得到理想的結(jié)果[11]。

隨機(jī)森林算法是利用多棵樹對樣本進(jìn)行訓(xùn)練并預(yù)測的集成算法[12],具有訓(xùn)練高度并行化,對于大數(shù)據(jù)的大樣本訓(xùn)練速度快,采用隨機(jī)抽樣,訓(xùn)練出來的模型方差小,泛化能力強(qiáng),對部分特征缺失不敏感和實(shí)現(xiàn)比較簡單等優(yōu)勢。且隨機(jī)森林會通過在每個節(jié)點(diǎn)處隨機(jī)選取特征值進(jìn)行分支,使得每棵分類樹間的相關(guān)性最小化,從而提高分類精確度[13-15]。本次研究利用隨機(jī)森林算法的特性與優(yōu)勢,將其應(yīng)用到復(fù)雜碳酸鹽巖儲層巖性的識別工作中。周雪晴等[16]將基于粗糙集-隨機(jī)森林算法運(yùn)用于伊拉克東南部某省的復(fù)雜巖性識別中,證明了該算法可提高復(fù)雜巖性儲層的巖性識別精度,在測井解釋問題中具有潛力。

本次研究首先從目的層中取得9口井的常規(guī)測井資料和巖性樣本數(shù)據(jù)并進(jìn)行整理,然后對測井曲線敏感性進(jìn)行分析,采用Matlab的機(jī)器學(xué)習(xí)算法,選用隨機(jī)森林算法分類器建立巖性預(yù)測算法模型,最后將訓(xùn)練好的隨機(jī)森林算法模型對每口井進(jìn)行全井段巖性分類預(yù)測。通過對研究區(qū)實(shí)際資料的處理結(jié)果進(jìn)行分析可知,該方法穩(wěn)定性高、回判率強(qiáng),符合地層真實(shí)情況。

2 地質(zhì)概況和資料收集

研究區(qū)目的層為中-下奧陶統(tǒng)碳酸鹽巖,包括中奧陶統(tǒng)一間房組,中-下奧陶統(tǒng)-鷹山組(鷹一段、鷹二段、鷹三段和鷹四段)、下奧陶統(tǒng)-蓬萊壩組。一間房組幾乎全部為灰?guī)r,其中亮晶顆?;?guī)r最為發(fā)育。鷹山組一、二段幾乎全為灰?guī)r,大量發(fā)育亮晶顆?;?guī)r。鷹山組三段上部以灰?guī)r為主,下部以白云巖為主,或白云巖夾薄層灰?guī)r。鷹四段、蓬萊壩組以白云巖為主,夾灰?guī)r,局部出現(xiàn)硅質(zhì)交代或硅化作用。本地區(qū)巖性復(fù)雜,為測井巖性分類帶來了困難。

本次研究工作共取得9口井的常規(guī)測井資料,包括無鈾伽馬(CGR)、釷(TH)、鈾(U)、鉀(K)、自然電位(SP)、自然伽馬(GR)、補(bǔ)償中子(CNL)、密度(DEN)、深側(cè)向(LLD)、淺側(cè)向(LLS)以及光電吸收截面指數(shù)(PE)、聲波時差(DT)和MgCO3、CaCO3測井曲線,以及9個巖心薄片巖性鑒定結(jié)果。分別將9口井的巖性樣本數(shù)據(jù)整理好,對各個巖心樣本深度下對應(yīng)的測井曲線進(jìn)行整理,再按不同的巖性進(jìn)行歸類整理,分為三大類共10種巖性分類,整理結(jié)果見表1。

表1 目的層巖性分類

3 測井曲線敏感性分析

不同的測井曲線對不同的巖性響應(yīng)敏感性不同[17-22],因此在開始巖性分類之前,必須要進(jìn)行測井曲線敏感性分析。通過觀測分析不同巖性對不同測井曲線值的影響,選取碳酸鎂(MgCO3)/碳酸鈣(CaCO3)、無鈾伽馬(CGR)/釷(Th)、鈾(U)/鉀(K)、自然電位(SP)/自然伽馬(GR)、補(bǔ)償中子(CNL)/密度(DEN)、深側(cè)向(LLD)/淺側(cè)向(LLS)以及光電吸收截面指數(shù)(PE)/聲波時差(DT)這7組曲線制作交會圖(圖1~圖3)。由圖1~圖3的交會圖可知,CGR、Th、U、K、GR、PE、LLD、DEN、CNL、DT、MgCO3、CaCO3這12條測井曲線對巖性識別較為敏感,可利用其作為輸入曲線進(jìn)行巖性識別預(yù)測。

圖1 灰?guī)r類交會圖Fig.1 Crossplots of limestone

圖2 白云巖類交會圖Fig.2 Crossplots of dolomite

圖3 硅化巖類交會圖Fig.3 Crossplots of silicified rocks

4 隨機(jī)森林及巖性預(yù)測模型的建立

隨機(jī)森林是利用多棵樹對樣本進(jìn)行訓(xùn)練并預(yù)測的一種分類器。在機(jī)器學(xué)習(xí)中,隨機(jī)森林是一種包含了多個決策樹的分類器,并且其輸出的類別是由個別樹輸出的類別的眾數(shù)而定的。它是Bagging算法的進(jìn)化版。首先,隨機(jī)森林使用了CART決策樹作為弱學(xué)習(xí)器。其次,在使用決策樹時,隨機(jī)森林對決策樹的建立做了改進(jìn),對于普通的決策樹,會在節(jié)點(diǎn)上所有的n個樣本特征中選擇一個最優(yōu)的特征來作為決策樹的左右子樹劃分。但是隨機(jī)森林則會隨機(jī)選擇節(jié)點(diǎn)上的m個樣本特征(m

生成隨機(jī)森林的具體步驟如下[23]:

1)樣本集的選擇。每輪從原始訓(xùn)練數(shù)據(jù)集中通過Bootstrap的方式抽取K個樣本集,得到一個大小為K的訓(xùn)練集。在原始樣本集的抽取過程中,有被重復(fù)抽取的樣例,也可能有一次都沒有被抽到的樣例。共進(jìn)行n輪的抽取,則每輪抽取的訓(xùn)練集分別為T1,T2,…,Tk。

2)構(gòu)建決策樹。假設(shè)特征空間共有M個特征,則在每一輪生成決策樹的過程中,從M個特征中隨機(jī)選擇其中的m個特征(m

3)模型組合。因?yàn)樯傻膋個決策樹之間是相互獨(dú)立的,每個決策樹的重要性是相等的,因而在將它們進(jìn)行組合時,無需考慮他們的權(quán)值。在分類階段,分類結(jié)果是由所有分類樹的結(jié)果綜合而成,使用的是投票原則;

為了驗(yàn)證隨機(jī)森林法的效果,選取了貝葉斯分類和集成學(xué)習(xí)兩種方法進(jìn)行了對比,結(jié)果如表2所示。由表2可知,隨機(jī)森林法的回判率遠(yuǎn)遠(yuǎn)高于其他兩種方法,可以作為復(fù)雜碳酸鹽巖巖性識別的優(yōu)選方法。

表2 各類方法回判率對比

預(yù)測模型的建立過程如下:將通過敏感性分析后的12條測井曲線作為輸入,樣本巖性主要有灰?guī)r、白云巖和硅化巖三類,采用兩種方法進(jìn)行巖性分類建模。第一種方法是直接對所有巖性進(jìn)行建模,將GC8、GC10、GC13、GC15、GC16這五口曲線完整的井的CGR、Th、U、K、GR、PE、LLD、DEN、CNL、DT、MgCO3、CaCO3這12條測井曲線值作為巖心數(shù)據(jù)集建模A模型,導(dǎo)入到Matlab中,其余的4口井由于測井資料完整度不一致(GC7缺少PE測井曲線;GC9缺少LLD測井曲線;GC12缺少DT測井曲線;GC14缺少DEN測井曲線),所以分別對4口井(GC7、GC9、GC12、GC14)一一建模,總共5套模型,分別進(jìn)行回判。第二種方法改進(jìn)為間接建模,先建模3種大巖性,再建模10種小巖性。將總表按三種大巖性分開為灰?guī)r類、白云巖類和硅化巖類,然后將三種巖性對應(yīng)的測井曲線數(shù)據(jù)作為模型進(jìn)行訓(xùn)練,得到能區(qū)分三大巖性的巖性預(yù)測模型,再在劃分了巖性的總表中分別從GC8、GC10、GC13、GC15、GC16這五口曲線完整的井中提取小巖性數(shù)據(jù)到Matlab中,建立一套模型,然后將其余的四口井?dāng)?shù)據(jù)分開進(jìn)行建模,得到總共5套模型,最后分別進(jìn)行回判。

5 模型應(yīng)用效果分析

利用第一種方法直接建模,得到的回判率如表3所示。由表3可知,利用隨機(jī)森林算法劃分的巖性結(jié)果回判率非常好。但是由于巖性復(fù)雜,巖性小類太多,導(dǎo)致巖性判斷的結(jié)果波動很大,與地質(zhì)認(rèn)識不是十分相符。于是采用第二種方法進(jìn)行建模,得出的回判率如表4所示。

表3 回判率匯總

表4 建分大巖性后建分小巖性回判率

由表3和表4可見,兩種建模方法的回判率都很高,說明該算法穩(wěn)定性較強(qiáng)。最后將訓(xùn)練好的隨機(jī)森林算法模型對每口井的全井段進(jìn)行預(yù)測,并繪制各井的測井巖性剖面圖,達(dá)到10余種細(xì)巖性的劃分(分別為含灰白云巖、灰質(zhì)白云巖;白云質(zhì)泥晶灰?guī)r、粉-細(xì)晶白云巖、亮晶顆?;?guī)r、中-粗晶白云巖、泥-微晶白云巖、泥晶灰?guī)r、泥-亮晶灰?guī)r、含硅白云巖、硅質(zhì)白云巖;硅質(zhì)巖、含云硅質(zhì)巖等),如圖4所示。

圖4 GC8井巖性剖面Fig.4 Lithologic section of well GC8

由圖4可知,即使在巖性較為復(fù)雜多變,白云巖、灰?guī)r、硅質(zhì)巖交替出現(xiàn)的情況下,圖中仍能準(zhǔn)確清晰地顯示結(jié)果,因此證明了隨機(jī)森林方法在薄層識別中具有較大的優(yōu)勢,對巖性的識別較為準(zhǔn)確。第二種方法由于有了針對性,最終巖性分類結(jié)果與人工精細(xì)地質(zhì)分類的認(rèn)識吻合得更好,但是基于計算機(jī)分類,大大提高了效率,減少了人為因素的干擾。

5 結(jié) 論

儲層的巖性識別是儲層勘探和開發(fā)的基礎(chǔ),針對復(fù)雜碳酸鹽巖的強(qiáng)非均質(zhì)性,利用隨機(jī)森林算法,以三種大巖性對應(yīng)的測井曲線數(shù)據(jù)作為模型進(jìn)行訓(xùn)練,分別采用直接建模和間接建模的方法得到了能區(qū)分三大巖性的巖性預(yù)測模型,再提取小巖性數(shù)據(jù)建立5套模型分別進(jìn)行回判。得到如下結(jié)論:

1)利用隨機(jī)森林算法直接建模劃分的巖性結(jié)果回判率較高。但是由于巖性復(fù)雜,巖性小類太多,導(dǎo)致巖性判斷的結(jié)果波動較大,與地質(zhì)認(rèn)識并不相符。采用改進(jìn)的間接建模的方法。間接建模劃分的巖性結(jié)果回判率依然較高,巖性分類結(jié)果與地質(zhì)認(rèn)識吻合更好,可運(yùn)用于實(shí)際工作中。

2)即使在巖性較為復(fù)雜多變,白云巖、灰?guī)r、硅質(zhì)巖交替出現(xiàn)的情況下,巖性剖面圖中仍能準(zhǔn)確清晰地顯示結(jié)果,因此證明了隨機(jī)森林方法在薄層識別中具有較大的優(yōu)勢,對巖性的識別較為準(zhǔn)確。

3)隨機(jī)森林算法預(yù)測的結(jié)果穩(wěn)定性強(qiáng),樣本的預(yù)測精度及回判率較高,可以有效地提高復(fù)雜碳酸鹽巖儲層的巖性識別精度,在測井解釋問題中具有一定的優(yōu)勢和潛力,可以為復(fù)雜碳酸鹽巖儲層的勘探開發(fā)提供幫助。

猜你喜歡
白云巖決策樹灰?guī)r
灰?guī)r礦礦石分級利用的應(yīng)用實(shí)踐
山東冶金(2022年2期)2022-08-08 01:51:38
白云巖筑壩的難點(diǎn)和措施
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
銀額盆地哈日凹陷白云巖儲層研究
煤礦地面水害區(qū)域治理工程鉆進(jìn)層位控制
決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
渤中X油田沙一段生物碎屑白云巖井場識別方法
錄井工程(2017年4期)2017-03-16 06:10:28
基于決策樹的出租車乘客出行目的識別
金湖凹陷西斜坡阜寧組灰?guī)r段混積儲層特征
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
罗甸县| 楚雄市| 航空| 新源县| 秦安县| 金川县| 乐东| 周口市| 高淳县| 富顺县| 安新县| 广汉市| 镇康县| 阿克| 盐城市| 栖霞市| 泾阳县| 年辖:市辖区| 开鲁县| 静乐县| 苏尼特左旗| 定边县| 灵宝市| 新沂市| 富裕县| 阳城县| 宽城| 中江县| 临城县| 潜江市| 永和县| 宜兰县| 平阳县| 浏阳市| 乡城县| 怀来县| 武夷山市| 云龙县| 合江县| 许昌县| 临沂市|