国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于一維卷積神經(jīng)網(wǎng)絡(luò)的巖石物理相識(shí)別

2022-01-14 08:42李盼池李文杰
關(guān)鍵詞:測(cè)井儲(chǔ)層卷積

李盼池,李文杰

(東北石油大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,黑龍江 大慶163318)

0 引 言

近年來(lái),隨著油氣勘探工作的深入發(fā)展,致密砂巖儲(chǔ)層成為目前勘探工作的重中之重。但由于復(fù)雜的地質(zhì)成因作用使致密砂巖儲(chǔ)層表現(xiàn)出孔隙關(guān)系復(fù)雜、物性不好以及非均質(zhì)性等現(xiàn)象。這使常規(guī)儲(chǔ)層預(yù)測(cè)方法(如油氣測(cè)試法、含油產(chǎn)狀法和經(jīng)驗(yàn)統(tǒng)計(jì)法等)在識(shí)別致密砂巖儲(chǔ)層時(shí)的準(zhǔn)確率并不理想。雖然該類(lèi)方法相對(duì)簡(jiǎn)單,在油田實(shí)際工作中應(yīng)用較廣,但對(duì)儲(chǔ)層質(zhì)量的表征不夠全面,而且每種方法都有其適用性和局限性[1]。

儲(chǔ)層巖石物理相的概念由熊琦華等[2]提出,它是一個(gè)含有地質(zhì)相概念的成因單元,不是單因素控制的結(jié)果,而是多種地質(zhì)因素耦合的結(jié)果,這些地質(zhì)因素包括沉積、成巖和后期的構(gòu)造作用,可以通過(guò)巖石巖性、成分和結(jié)構(gòu)體現(xiàn)出所劃分的各巖石物理相之間的性質(zhì)差異預(yù)測(cè)出物性好的致密砂巖儲(chǔ)層。因此,巖石物理相是多種地質(zhì)作用形成的成因單元,它既能通過(guò)觀測(cè)反映當(dāng)前儲(chǔ)層宏觀或微觀的巖石物理特征,同時(shí)又能指示巖石物理特征形成時(shí)的地質(zhì)成因機(jī)理,因而具備地質(zhì)“相”的預(yù)測(cè)功能[3-6]。從巖石物理相入手可從儲(chǔ)層的形成機(jī)制上評(píng)價(jià)儲(chǔ)層,從而能進(jìn)一步對(duì)勘探區(qū)域優(yōu)質(zhì)儲(chǔ)層及含油氣進(jìn)行預(yù)測(cè)。不同巖石物理相對(duì)應(yīng)的沉積微相特征及成巖作用類(lèi)型均有所不同,且通過(guò)電阻率等測(cè)井技術(shù)所得到的地層信息內(nèi)容主要為物理性質(zhì)。而測(cè)井參數(shù)是對(duì)地層沉積、成巖、儲(chǔ)集空間及其所含儲(chǔ)層特征的綜合響應(yīng),不同的測(cè)井參數(shù)能反應(yīng)地層的巖性、儲(chǔ)集性、滲透性和含油氣特征等,盡管在敏感性上存在差異,但基于對(duì)同一地層探測(cè)的不同測(cè)井參數(shù)之間必然存在一定的聯(lián)系。不同測(cè)井參數(shù)是從不同機(jī)理、特征或角度對(duì)地層的響應(yīng),包含了豐富多樣的信息,這是利用測(cè)井參數(shù)進(jìn)行巖石物理相識(shí)別數(shù)據(jù)基礎(chǔ)[7-12]。

常規(guī)的點(diǎn)對(duì)點(diǎn)的機(jī)器學(xué)習(xí)方法無(wú)法有效表達(dá)測(cè)井參數(shù)的空間特征,對(duì)巖石物理相與其他測(cè)井參數(shù)之間的內(nèi)在關(guān)系的表征不夠充分。目前卷積神經(jīng)網(wǎng)絡(luò)(CNN:Convolutional Neural Networks)已經(jīng)是成熟技術(shù),該方法的準(zhǔn)確率相對(duì)較高,但其在處理文中問(wèn)題時(shí)接收的是測(cè)井曲線(xiàn)圖片,這既增加了工作成本,又降低了工作效率。因此,筆者選擇采用一種可解釋的一維卷積神經(jīng)網(wǎng)絡(luò)(1D-CNN:One-Dimensional Convolutional Neural Networks)實(shí)現(xiàn)巖石物理相識(shí)別,通過(guò)不同尺度卷積提取測(cè)井參數(shù)在測(cè)井深度空間上的結(jié)構(gòu)性特征,學(xué)習(xí)巖石物理相與測(cè)井參數(shù)深度特征之間的關(guān)系[13-15]。模型中引入的全局平均池化層(GAP:Global Average Pooling layer)代替了傳統(tǒng)的全連接層(FC:Fully Connected layer),它能將測(cè)井曲線(xiàn)波形的動(dòng)態(tài)變化部分可視化,并且通過(guò)分類(lèi)激活映射(CAM:Class Activation Map)解釋分類(lèi)結(jié)果[16-18],從而增強(qiáng)了模型的可解釋性。此外,由于GAP的引入減少了1D-CNN模型中參數(shù)的數(shù)量,這在一定程度上降低了模型的分類(lèi)能力。為此筆者加入了擴(kuò)張卷積(DC:Dilated Convolution)和批量歸一化(BN:Batch normalization),并且減少了最大池化層的個(gè)數(shù)彌補(bǔ)GAP引起的性能下降問(wèn)題。

1 可解釋一維卷積神經(jīng)網(wǎng)絡(luò)

1.1 卷積神經(jīng)網(wǎng)絡(luò)概述

卷積神經(jīng)網(wǎng)絡(luò)在上世紀(jì)九十年代初被引入,專(zhuān)門(mén)用于圖像識(shí)別。典型的CNN由一系列具有非線(xiàn)性激活的卷積層和池化層組成。卷積層通常由幾個(gè)并行通道組成,這些通道在信號(hào)處理中應(yīng)用標(biāo)準(zhǔn)卷積核的卷積操作,其中卷積核是可以訓(xùn)練的。此外,與標(biāo)準(zhǔn)的全連接網(wǎng)絡(luò)相比,CNN采用權(quán)重共享的方式處理由圖像或多變量序列數(shù)據(jù)提供的高維輸入空間。因此,從圖像處理、自然語(yǔ)言處理到序列數(shù)據(jù)分析,CNN被證明是各種機(jī)器學(xué)習(xí)任務(wù)中最先進(jìn)的架構(gòu)[19]。

其中hij是輸入圖像中(i,j)th個(gè)感受野的輸出,Xi+f,j+h是輸入圖像或序列的感受野中的元素,Ki+f,j+h是卷積核,b是卷積核的偏差,每個(gè)卷積核的大小是K∈Rnr×nr。

二維卷積假設(shè)關(guān)系在圖像的輸入域中可用,然而,在傳感器通道且沒(méi)有任何空間關(guān)系的序列數(shù)據(jù)中,情況并非如此,因?yàn)槎S卷積無(wú)法確保任意堆疊傳感器通道之間的空間關(guān)系。一維卷積可以應(yīng)用于多元序列分析。在一維卷積中,卷積核覆蓋整個(gè)傳感器通道,卷積核大小是nr×m。其定義為

其中hi是輸入序列中(i)th個(gè)感受野的輸出。本質(zhì)上,卷積核跨越整個(gè)列空間,其大小是K∈Rnr×m。顯然,如果傳感器通道的數(shù)量很多,卷積核的大小將急劇增加,這將嚴(yán)重削弱CNN的權(quán)重共享能力。此外,由于nr通常選擇很小,導(dǎo)致卷積核只能提取局部信息,即短時(shí)間范圍內(nèi)的特征。為解決這一難題,可通過(guò)增加CNN的深度增加卷積核的感受野,但這將導(dǎo)致參數(shù)過(guò)多。還有一種方式是通過(guò)增加固定膨脹率,即一維擴(kuò)張卷積解決上述問(wèn)題。

1.2 可解釋一維卷積神經(jīng)網(wǎng)絡(luò)模型

筆者研究屬于模式識(shí)別問(wèn)題,其研究對(duì)象為一維的測(cè)井采樣數(shù)據(jù),是一種多元序列數(shù)據(jù),因此可以采用一維卷積神經(jīng)網(wǎng)絡(luò)(1D-CNN),通過(guò)對(duì)目標(biāo)儲(chǔ)層各維輸入的序列數(shù)據(jù)做一維卷積運(yùn)算,提取該層的特征信息,進(jìn)而實(shí)現(xiàn)目標(biāo)儲(chǔ)層的巖石物理相類(lèi)型。提出的可解釋一維卷積神經(jīng)網(wǎng)絡(luò)模型,與傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的不同之處在于:首先,對(duì)卷積操作,采用了具有較大感受野的一維擴(kuò)張卷積;其次,為提升網(wǎng)絡(luò)性能在每個(gè)卷積層都配置了批量歸一化操作;最后,為增強(qiáng)網(wǎng)絡(luò)的可解釋性,用GAP代替了傳統(tǒng)的FC,在網(wǎng)絡(luò)的輸出端增加了CAM模塊。下面首先給出這3個(gè)子模塊的基本原理,然后給出模型的總體框架。

1.2.1 一維擴(kuò)張卷積

搭建的網(wǎng)絡(luò)需要具有多尺度聚合能力,而擴(kuò)張卷積(DC)可以實(shí)現(xiàn)在不丟失分辨率或重新縮放圖像的前提下,聚合多尺度上下文信息[20-22]。擴(kuò)張卷積的特點(diǎn)是在卷積核中添加了空洞,這些空洞可以使用不同的擴(kuò)張因子在不同的范圍內(nèi)應(yīng)用相同的卷積核,進(jìn)而增加了卷積核的感受野。

一維擴(kuò)張卷積定義為

其中l(wèi)是擴(kuò)張因子并定義*l為擴(kuò)張l倍的卷積,常見(jiàn)的卷積操作是擴(kuò)張1倍的卷積,即l=1;Xi+l*f是擴(kuò)張了l倍的輸入序列,nk是感受野的大小。不同擴(kuò)張率對(duì)卷積核感受野的影響如圖1所示。從圖1可以看出,隨擴(kuò)張因子的增加,卷積核尺寸的變化規(guī)律。

圖1 不同擴(kuò)張率對(duì)卷積核感受野的影響Fig.1 The influence of different dilation rates on the receptive field of convolution kernel

通過(guò)改變擴(kuò)張因子,擴(kuò)張卷積運(yùn)算可以在不同范圍內(nèi)應(yīng)用相同的卷積核(即具有相同數(shù)量的參數(shù)),從而實(shí)現(xiàn)更好的多尺度上下文信息聚合。該卷積可高效率實(shí)現(xiàn)對(duì)一維序列數(shù)據(jù)的特征抽取。

1.2.2 批量歸一化

對(duì)深層神經(jīng)網(wǎng)絡(luò),即使輸入數(shù)據(jù)已做標(biāo)準(zhǔn)化,訓(xùn)練中模型參數(shù)的更新依然很容易造成靠近輸出層的輸出存在劇烈變化,這種計(jì)算數(shù)值的不穩(wěn)定性將給訓(xùn)練有效的深度學(xué)習(xí)模型造成困難。批量歸一化(BN)利用小批量上的均值和標(biāo)準(zhǔn)差,不斷調(diào)整神經(jīng)網(wǎng)絡(luò)中間輸出,從而使整個(gè)神經(jīng)網(wǎng)絡(luò)在各層的中間輸出的數(shù)值更穩(wěn)定[23],原理如下:

設(shè)一個(gè)由m個(gè)樣本組成的小批量β={X1,X2,…,Xm},它們是BN層的輸入。對(duì)小批量β中任意樣本X(i)∈Rd,1≤i≤m,BN層的輸出y同樣是d維向量

并由以下幾步得到。首先,對(duì)小批量β求均值和方差

其中ε>0是一個(gè)很小的常數(shù),其作用是保證分母大于0。在上述標(biāo)準(zhǔn)化的基礎(chǔ)上,BN層引入了兩個(gè)可以學(xué)習(xí)的模型參數(shù),拉伸參數(shù)γ和偏移參數(shù)ω。這兩個(gè)參數(shù)和X(i)的形狀相同,皆為d維向量。它們與分別按元素乘法和加法計(jì)算

1.2.3 分類(lèi)激活映射

在訓(xùn)練學(xué)習(xí)階段,GAP作用于1D-CNN模型的最終輸出層,用于產(chǎn)生分類(lèi)激活映射。GAP計(jì)算最后一個(gè)卷積層每個(gè)內(nèi)核特征圖的空間平均值,因此可以通過(guò)將輸出層的權(quán)重應(yīng)用于卷積特征圖關(guān)注測(cè)井曲線(xiàn)波形的動(dòng)態(tài)變化部分。具體過(guò)程為對(duì)在深度d處的測(cè)井曲線(xiàn)信號(hào)fk(d)由最后一個(gè)卷積層在樣本層深度d處的卷積核k激活,然后將其作為GAP的輸入。對(duì)單位卷積核k,GAP將深度層的維度降為1,它是通過(guò)

1.2.4 模型總體框架

筆者設(shè)計(jì)的1D-CNN的網(wǎng)絡(luò)體系結(jié)構(gòu)如圖2所示。網(wǎng)絡(luò)中各層的含義解釋如下。

圖2 1D-CNN模型架構(gòu)Fig.2 The structure of 1D-CNN

1)輸入層。讓輸入層接收與巖石物理相類(lèi)別密切相關(guān)的測(cè)井曲線(xiàn)對(duì)應(yīng)的特征向量,從而進(jìn)行下一步的特征提取。

2)全局平均池化層(GAP)。用GAP代替?zhèn)鹘y(tǒng)FC,在處理測(cè)井曲線(xiàn)信息時(shí),GAP的優(yōu)點(diǎn)是:首先,GAP能為最后一個(gè)卷積層中分類(lèi)任務(wù)的每個(gè)對(duì)應(yīng)類(lèi)別生成一個(gè)特征圖;其次,GAP總結(jié)了空間信息,與傳統(tǒng)FC相比,它可以解釋模型的分類(lèi)結(jié)果;最后,GAP減少了模型訓(xùn)練參數(shù)的數(shù)量,可使該模型不易過(guò)擬合。

3)Block塊。由于GAP大大減小了參數(shù)的數(shù)量,這將導(dǎo)致模型的分類(lèi)能力可能會(huì)受到影響,所以在Block塊中引入了擴(kuò)張卷積(DC)、批量歸一化(BN)優(yōu)化模型,從而彌補(bǔ)GAP的短板。DC可增加卷積核的感受野,這使卷積層輸出包含更多范圍信息的特征圖,使網(wǎng)絡(luò)具有多尺度聚合能力。BN可利用小批量上的均值和標(biāo)準(zhǔn)差不斷調(diào)整神經(jīng)網(wǎng)絡(luò)中間輸出,從而隨著網(wǎng)絡(luò)的深入訓(xùn)練,它可以使非線(xiàn)性輸入的分布保持穩(wěn)定,進(jìn)而增強(qiáng)了網(wǎng)絡(luò)的表達(dá)能力。并在DC和BN后采用ReLU激活函數(shù)和丟棄策略(Dropout)。采用ReLU激活函數(shù)代替?zhèn)鹘y(tǒng)Sigmoid激活函數(shù)的優(yōu)點(diǎn)是:首先,它克服了Sigmoid激活函數(shù)存在的梯度消失問(wèn)題;其次,它可以加快訓(xùn)練速度。使用Dropout可以減少網(wǎng)絡(luò)隱藏層的節(jié)點(diǎn)數(shù),能有效抑制過(guò)擬合現(xiàn)象的發(fā)生。

4)最大池化層。這里僅在第1個(gè)和最后1個(gè)卷積層后添加了最大池化層,因?yàn)橐呀?jīng)有GAP減小特征圖的大小并減少訓(xùn)練參數(shù),它間接地代替了最大池化層的作用,所以加入過(guò)多的最大池化層只會(huì)使訓(xùn)練參數(shù)少之又少,進(jìn)而造成測(cè)井曲線(xiàn)特征圖的分辨率丟失。

5)輸出層。在輸出層中不同的神經(jīng)元對(duì)應(yīng)不同的巖石物理相類(lèi)型。

2 基于1D-CNN的巖石物理相識(shí)別方法

2.1 指標(biāo)敏感性分析方法

筆者提出通過(guò)深度學(xué)習(xí)模型連接權(quán)重運(yùn)算方法,表征測(cè)井識(shí)別深度學(xué)習(xí)模型對(duì)輸入測(cè)井曲線(xiàn)的敏感性。連接權(quán)重方法計(jì)算已建立深度神經(jīng)網(wǎng)絡(luò)模型的每個(gè)輸入變量與所有隱含層和輸出層的權(quán)重之和[24]。輸入變量在進(jìn)入模型前,所有輸入變量都?xì)w一化為[0,1]

其中sj是輸入變量xj的標(biāo)準(zhǔn)偏差,用于標(biāo)準(zhǔn)化輸入變量的尺度。I越大,神經(jīng)模型對(duì)相應(yīng)的輸入變量就越敏感。指標(biāo)敏感性分析方法同時(shí)還可以為模型變量選擇提供定量依據(jù)。

2.2 處理樣本不均衡的上采樣方法

通常,訓(xùn)練樣本的類(lèi)不平衡會(huì)導(dǎo)致分類(lèi)模型偏向于多數(shù)類(lèi),這會(huì)大大影響模型的識(shí)別準(zhǔn)確率[25]。筆者提出的處理樣本不均衡的上采樣方法,模擬了遺傳學(xué)中的繁殖過(guò)程,并通過(guò)遺傳和突變產(chǎn)生了新的少數(shù)樣本實(shí)例。對(duì)訓(xùn)練集中的每個(gè)少數(shù)類(lèi)別,都執(zhí)行以下步驟。

1)計(jì)算出少數(shù)類(lèi)別中每?jī)蓚€(gè)實(shí)例(xi,xj)之間的上采樣距離

其中S-1是協(xié)方差矩陣。之后根據(jù)距離以降序重新排列實(shí)例。

2)將重新排列的實(shí)例分為兩組,分別表示為b1和b2,它們將作為下一代的雙親。

3)依次選擇兩個(gè)實(shí)例xm∈b1,xn∈b2,之后將這兩個(gè)實(shí)例的平均值作為一個(gè)綜合實(shí)例xnew添加到少數(shù)類(lèi)中。重復(fù)此步驟,直到選擇b1和b2中的每個(gè)實(shí)例。

4)完成上述步驟后,如果少數(shù)類(lèi)的樣本數(shù)量仍然少于多數(shù)類(lèi),則綜合實(shí)例xnew將作為下一代的雙親,并再次執(zhí)行步驟3)。這種繼承將代代相傳,直到數(shù)據(jù)平衡為止。

5)最后,可以將新訓(xùn)練樣本描述為

2.3 樣本數(shù)據(jù)插值

為解決樣本層厚度不相等問(wèn)題,統(tǒng)計(jì)各樣本層數(shù)據(jù)點(diǎn)個(gè)數(shù),根據(jù)統(tǒng)計(jì)結(jié)果,統(tǒng)一數(shù)據(jù)點(diǎn)個(gè)數(shù)為L(zhǎng),對(duì)少于此長(zhǎng)度的測(cè)井曲線(xiàn)片段進(jìn)行數(shù)據(jù)插值,多于此長(zhǎng)度的測(cè)井曲線(xiàn)片段采用相同原理進(jìn)行數(shù)據(jù)抽稀。其中樣本數(shù)據(jù)插值的方法有很多,例如分段階梯插值、分段線(xiàn)性插值和分段樣條插值等。其中插值節(jié)點(diǎn)越多,插值多項(xiàng)式的次數(shù)也隨之增加,為避免高次插值在插值區(qū)間邊界產(chǎn)生劇烈動(dòng)蕩,筆者采用分段線(xiàn)性插值法進(jìn)行插值與抽稀,它的運(yùn)算量和插值誤差都較小,并且插值函數(shù)具有連續(xù)性,不會(huì)影響測(cè)井曲線(xiàn)形態(tài)[26-27]。原理如下。

設(shè)已知節(jié)點(diǎn)a=x0<x1<…<xn=b上的函數(shù)值為y0,y1,…,yn,插值函數(shù)為

滿(mǎn)足φ(xi)=yi(i=0,1,2,…,n)且在每個(gè)小區(qū)間[xi,xi+1]上φ(x)是線(xiàn)性函數(shù)。

2.4 數(shù)據(jù)標(biāo)準(zhǔn)化

如果直接使用原始數(shù)據(jù)的指標(biāo)值進(jìn)行分析,就會(huì)突出數(shù)值較高的指標(biāo)在綜合分析中的作用,相對(duì)削弱了數(shù)值水平較低指標(biāo)的作用。經(jīng)過(guò)標(biāo)準(zhǔn)化處理后,原始數(shù)據(jù)轉(zhuǎn)化為無(wú)量綱化指標(biāo)測(cè)評(píng)值,使各指標(biāo)值處于同一數(shù)量級(jí)別,可進(jìn)行綜合測(cè)評(píng)分析。此外,數(shù)據(jù)標(biāo)準(zhǔn)化還可以滿(mǎn)足筆者1D-CNN模型求解的需要,加快了梯度下降求最優(yōu)解的速度。筆者采取Z-score的數(shù)據(jù)標(biāo)準(zhǔn)化方法,處理后的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,原理如下

2.5 模型訓(xùn)練與評(píng)估

筆者將預(yù)處理后的數(shù)據(jù)分為3類(lèi):訓(xùn)練集、驗(yàn)證集和測(cè)試集。其中訓(xùn)練集用于訓(xùn)練模型,驗(yàn)證集用于調(diào)整模型的超參數(shù)并初步評(píng)估模型的能力,測(cè)試集用于評(píng)估最終模型的泛化能力。

筆者使用k折交叉驗(yàn)證的方法進(jìn)行評(píng)估,目的是確定模型是否已達(dá)到足夠的準(zhǔn)確性。具體做法是將訓(xùn)練數(shù)據(jù)集隨機(jī)劃分為k個(gè)不重合的子數(shù)據(jù)集,在每次訓(xùn)練中,使用1個(gè)子數(shù)據(jù)集用于驗(yàn)證,其余(k-1)個(gè)子數(shù)據(jù)集用于訓(xùn)練,重復(fù)k次,每次選擇不同的子數(shù)據(jù)集作為訓(xùn)練集和驗(yàn)證集。最后,對(duì)這k次模型訓(xùn)練的表現(xiàn)性能求平均。

評(píng)估指標(biāo)是一種基于人工神經(jīng)網(wǎng)絡(luò)的可視化、組織和選擇分類(lèi)器的技術(shù),一般幾個(gè)常見(jiàn)的指標(biāo)是:精度、召回率和F1分?jǐn)?shù),如下

其中TP,FN,TN和FP分別是真正例,假反例,真反例和假正例樣本的數(shù)量,這些值可以通過(guò)表1的分類(lèi)結(jié)果混淆矩陣得出。對(duì)多分類(lèi)問(wèn)題可以轉(zhuǎn)化為二分類(lèi)問(wèn)題,正例為對(duì)應(yīng)的某一類(lèi)別,其余的其他類(lèi)別均為負(fù)例。式(20)中的精度反映了模型預(yù)測(cè)負(fù)樣本的能力,精度越高,模型預(yù)測(cè)負(fù)樣本的能力越強(qiáng)。式(21)中的召回率反映了分類(lèi)模型預(yù)測(cè)正樣本的能力,召回率越高,模型預(yù)測(cè)正樣本的能力就越強(qiáng)。式(22)中的F1分?jǐn)?shù)是召回率和精度這兩者的調(diào)和,F1分?jǐn)?shù)越高,分類(lèi)模型綜合性能越好、越穩(wěn)健,所以F1分?jǐn)?shù)在模型評(píng)估中被廣泛使用[28]。

表1 分類(lèi)結(jié)果混淆矩陣Tab.1 Confusion matrix of the classification result

此外,筆者還進(jìn)行了消融實(shí)驗(yàn),以表明在GAP代替FC后模型F1分?jǐn)?shù)的變化。首先,以1D-CNN的基本架構(gòu)和標(biāo)準(zhǔn)的卷積核為基礎(chǔ),比較模型使用GAP和FC的性能差異。然后,在GAP的基礎(chǔ)上,通過(guò)添加BN層,并將標(biāo)準(zhǔn)卷積核替換為DC評(píng)估模型分類(lèi)性能的改進(jìn)。

3 實(shí)際應(yīng)用結(jié)果及分析

3.1 礦場(chǎng)資料數(shù)據(jù)

筆者研究的數(shù)據(jù)來(lái)自三肇地區(qū)的扶余油層儲(chǔ)層,三肇凹陷位于松遼盆地中心地帶,總面積大約是5 743 km2,西為大慶長(zhǎng)垣、東南接朝陽(yáng)溝階地、北為安達(dá)向斜。它是在古中央隆起解體后,由大慶長(zhǎng)垣和朝陽(yáng)溝階地抬升形成的,如圖3所示。據(jù)大慶油田第八采油廠2009年統(tǒng)計(jì)結(jié)果,該區(qū)域始于1989年,共含井796口,其平均井距在2 000 m以上。筆者最終在這里收集了三肇凹陷內(nèi)鉆遇扶余油層的54口鉆井資料,主要包括各口井內(nèi)對(duì)應(yīng)深度點(diǎn)的巖心圖片、鑄體薄片、掃描電鏡和測(cè)井參數(shù)。

圖3 數(shù)據(jù)來(lái)源地Fig.3 The source of data

3.2 指標(biāo)集構(gòu)造

結(jié)合專(zhuān)家經(jīng)驗(yàn)、巖石物理相描述等地質(zhì)專(zhuān)業(yè)相關(guān)知識(shí),儲(chǔ)層的品質(zhì)主要受控于粒度、鉀長(zhǎng)石含量和方解石含量的影響。通過(guò)2.1節(jié)的指標(biāo)敏感性分析方法選取對(duì)粒度、鉀長(zhǎng)石含量和方解石含量較為敏感的自然伽馬(GR:natural Gamma Ray)、自然電位(SP:Spontaneous Potential)、聲波時(shí)差(AC:Acoustic)、補(bǔ)償中子(CNL:Neutron)與密度(DEN:Density)5條測(cè)井曲線(xiàn),以巖心分析數(shù)據(jù)為標(biāo)定,確定了三肇凹陷扶余層的4種巖石物理相類(lèi)型(PF1相、PF2相、PF3相和PF4相)。其中PF1相主要為有利的沉積微相(水下分流河道及河口壩微相),經(jīng)歷建設(shè)性成巖相(主要為溶蝕相)改造后,儲(chǔ)集層物性特征較好,多為常規(guī)儲(chǔ)層,對(duì)應(yīng)常規(guī)油層及水層;PF2相主要為有利的沉積微相,經(jīng)歷一定成巖作用(溶蝕相及黏土礦物充填相)而形成,儲(chǔ)集層物性相對(duì)較好,多為產(chǎn)能較低油層;PF3相為有利的沉積微相背景下,經(jīng)歷破壞性成巖作用(壓實(shí)致密相及碳酸鹽膠結(jié)相)而形成,儲(chǔ)集物性特征較差,為產(chǎn)能較低油層及油水層;PF4相在不利的沉積微相(水下分流間灣)下,經(jīng)過(guò)破壞性成巖相疊加,儲(chǔ)集物性特征差,多為非儲(chǔ)層與干層。表2給出了某單井的部分樣本數(shù)據(jù),圖4為該井的測(cè)井解釋成果圖,包含測(cè)井?dāng)?shù)據(jù)和對(duì)應(yīng)的巖石物理相類(lèi)型。

表2 三肇凹陷扶余層某單井的部分樣本數(shù)據(jù)Tab.2 The partly sample data of a single well in Fuyu Formation,Sanzhao Sag

圖4 三肇凹陷扶余層某單井的測(cè)井解釋Fig.4 The logging interpretation of a single well

3.3 模型參數(shù)設(shè)置

筆者收集到的54口井的測(cè)井段大約在1 700~2 100 m范圍內(nèi),采樣間隔為0.05 m。通過(guò)分段線(xiàn)性插值,最終得到了11 547個(gè)長(zhǎng)為292,寬為5的樣本層張量。將訓(xùn)練集和測(cè)試集按照7∶1的比例劃分,得到10 167個(gè)訓(xùn)練集樣本(PF1相:722個(gè),PF2相:5 044個(gè),PF3相:4 310個(gè),PF4相:91個(gè))和1 380個(gè)測(cè)試集樣本,可以看出訓(xùn)練集樣本類(lèi)別不均衡,其中PF1相和PF4相屬于少數(shù)類(lèi),PF2相和PF3相屬于多數(shù)類(lèi)。筆者通過(guò)處理樣本不均衡的上采樣方法最終得到20 133個(gè)訓(xùn)練集樣本,并且最后通過(guò)10折交叉驗(yàn)證對(duì)這些訓(xùn)練集樣本進(jìn)行訓(xùn)練和驗(yàn)證。

實(shí)驗(yàn)對(duì)巖石物理相進(jìn)行分類(lèi)的1D-CNN模型使用Windows 10操作系統(tǒng),以Python3.7編程語(yǔ)言實(shí)現(xiàn),使用的學(xué)習(xí)框架為Keras,后端為T(mén)ensorflow,實(shí)驗(yàn)在GPU上運(yùn)行,GPU的具體規(guī)格是NVIDIA GeForce GTX 1050Ti,內(nèi)存4 GByte。

詳細(xì)的網(wǎng)絡(luò)配置參數(shù)如表3所示。

表3 1D-CNN模型中的網(wǎng)絡(luò)配置和參數(shù)Tab.3 The networks configuration and parameters in 1D-CNN model

筆者采用的小批量大小為30,表4給出了不同迭代次數(shù)對(duì)訓(xùn)練集準(zhǔn)確率的影響,可以看出當(dāng)訓(xùn)練迭代次數(shù)為200時(shí)實(shí)驗(yàn)效果最好。

表4 不同迭代次數(shù)對(duì)實(shí)驗(yàn)準(zhǔn)確率的影響Tab.4 The influence of different iteration times on experimental accuracy

筆者使用Adam優(yōu)化算法,初始學(xué)習(xí)率設(shè)為0.001,動(dòng)量為0.9,權(quán)重衰減為1×10-8,學(xué)習(xí)率衰減系數(shù)為0.000 5并且隨著迭代次數(shù)的增加逐漸減小。

3.4 實(shí)驗(yàn)結(jié)果對(duì)比

圖5是筆者模型訓(xùn)練過(guò)程中對(duì)應(yīng)的訓(xùn)練集和驗(yàn)證集的準(zhǔn)確率上升曲線(xiàn)和損失函數(shù)下降曲線(xiàn)(以10折交叉驗(yàn)證中的第8次訓(xùn)練驗(yàn)證為例)。其中對(duì)于準(zhǔn)確率,訓(xùn)練集最高為0.97,驗(yàn)證集最高為0.93;對(duì)于損失函數(shù),訓(xùn)練集最低為0.65,驗(yàn)證集最低為0.64。圖6是測(cè)試集的分類(lèi)結(jié)果對(duì)應(yīng)的混淆矩陣,可直觀地看出模型在不同巖石物理相類(lèi)別上的分類(lèi)效果。其中模型對(duì)PF4相的識(shí)別沒(méi)有誤差,而在PF1相和PF2相,PF2相和PF3相之間的識(shí)別存在誤判。圖7顯示了某測(cè)試井的測(cè)井解釋及1D-CNN模型在該井上的預(yù)測(cè)結(jié)果,觀察到真實(shí)巖石物理相與模型預(yù)測(cè)的巖石物理相幾乎一致,表明該模型準(zhǔn)確性較高,泛化能力比較強(qiáng),可以達(dá)到實(shí)際應(yīng)用效果。

圖5 訓(xùn)練過(guò)程中的準(zhǔn)確率上升和損失函數(shù)下降曲線(xiàn)圖Fig.5 The curve of increasing accuracy rate and decreasing loss function in the process of training

圖6 混淆矩陣Fig.6 The confusion matrix

圖7 某測(cè)試井的測(cè)井解釋和模型識(shí)別結(jié)果Fig.7 The logging interpretation and model identification results of a test well

表5給出了消融實(shí)驗(yàn)結(jié)果??梢钥闯霎?dāng)模型輸出端采用FC時(shí),模型表現(xiàn)一般,F1分?jǐn)?shù)僅為0.84。當(dāng)模型采用GAP代替FC(沒(méi)有加入DC和BN)時(shí)性能反而下降了,F1分?jǐn)?shù)為0.67。當(dāng)將DC,BN和GAP一起使用時(shí),分類(lèi)效果提高并且達(dá)到了最佳,F1分?jǐn)?shù)上升到0.97。

表5 1D-CNN在消融實(shí)驗(yàn)下的表現(xiàn)差異Tab.5 The difference of performance of 1D-CNN in ablation experiment

為驗(yàn)證筆者方法相比現(xiàn)有同類(lèi)方法的優(yōu)勢(shì),將BP神經(jīng)網(wǎng)絡(luò),雙向LSTM和筆者的1D-CNN進(jìn)行全面對(duì)比分析。其中,BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)層數(shù)為4,優(yōu)化器為Adam,學(xué)習(xí)率為0.001,隱藏層使用ReLU激活函數(shù),丟棄率為0.2,輸出層使用Softmax激活函數(shù)。雙向LSTM的網(wǎng)絡(luò)層數(shù)為5,優(yōu)化器為Adam,初始學(xué)習(xí)率為0.01且衰減系數(shù)為0.001,動(dòng)量為0.9,LSTM層的丟棄率為0.3并采用ReLU激活函數(shù),輸出層為Softmax激活函數(shù)。對(duì)比實(shí)驗(yàn)結(jié)果如表6所示,可以得出,1D-CNN的F1分?jǐn)?shù)比BP神經(jīng)網(wǎng)絡(luò)提升了0.24,比雙向LSTM提升了0.05,其參數(shù)量相對(duì)較少,訓(xùn)練時(shí)間也相對(duì)較短。

表6 同類(lèi)方法實(shí)驗(yàn)效果對(duì)比Tab.6 The comparison of experimental results of similar methods

3.5 實(shí)驗(yàn)結(jié)果分析

對(duì)3.4節(jié)中給出的實(shí)驗(yàn)結(jié)果,理論分析如下。由圖5b可知,訓(xùn)練集和驗(yàn)證集的損失函數(shù)在大約第25個(gè)迭代周期時(shí)就開(kāi)始逐漸趨于平緩,這是由于數(shù)據(jù)標(biāo)準(zhǔn)化加快了梯度下降求最優(yōu)解的速度,導(dǎo)致筆者模型收斂較快。且圖5a中驗(yàn)證集的準(zhǔn)確率與訓(xùn)練集的準(zhǔn)確率相差不多,說(shuō)明筆者模型不存在過(guò)擬合現(xiàn)象。圖6給出了測(cè)試集中4種巖石物理相的誤識(shí)別主要出現(xiàn)在PF1相和PF2相、PF2相和PF3相之間,而對(duì)PF4相沒(méi)有誤識(shí)別。原因在于PF1相和PF2相、PF2相和PF3相屬于儲(chǔ)層中的相鄰相,導(dǎo)致模型會(huì)產(chǎn)生一定的混淆。而PF4相為非儲(chǔ)層或干層,它與儲(chǔ)層差異明顯,所以具有較高的識(shí)別精度。由于GAP會(huì)減少模型中參數(shù)的數(shù)量,如果僅僅將FC替換為GAP會(huì)導(dǎo)致模型訓(xùn)練不足,從而造成模型的分類(lèi)性能下降。在GAP的基礎(chǔ)上,通過(guò)將普通卷積替換為DC,卷積核的參數(shù)保持不變,卷積核的感受野隨著擴(kuò)張率的增加呈指數(shù)增長(zhǎng),同時(shí)保證輸出的特征映射大小保持不變,再加上BN可以使非線(xiàn)性輸入的分布保持穩(wěn)定,既能彌補(bǔ)GAP的不足,又能保持GAP將測(cè)井曲線(xiàn)波形的動(dòng)態(tài)變化部分可視化的優(yōu)勢(shì),從而有效地提高網(wǎng)絡(luò)的學(xué)習(xí)與泛化能力。這與表3給出的結(jié)果是一致的。表4中BP神經(jīng)網(wǎng)絡(luò)的分類(lèi)效果最差,原因是它采用常規(guī)點(diǎn)對(duì)點(diǎn)的深度學(xué)習(xí)方法,導(dǎo)致對(duì)測(cè)井曲線(xiàn)的空間特征利用不充分。盡管雙向LSTM可以自動(dòng)提取序列化數(shù)據(jù)的空間動(dòng)態(tài)信息,模型的分類(lèi)性能也較高,但其固有的遞歸結(jié)構(gòu)和繁重的網(wǎng)絡(luò)參數(shù)會(huì)導(dǎo)致模型收斂緩慢,訓(xùn)練時(shí)間較長(zhǎng)。相對(duì)BP神經(jīng)網(wǎng)絡(luò)和雙向LSTM,筆者提出的1D-CNN模型既沒(méi)有過(guò)多的網(wǎng)絡(luò)訓(xùn)練參數(shù),訓(xùn)練時(shí)間相對(duì)較短,擁有較低的空間和時(shí)間復(fù)雜度,又能有效利用一維測(cè)井?dāng)?shù)據(jù)的空間特征,從而有效提升了網(wǎng)絡(luò)的分類(lèi)預(yù)測(cè)能力。

4 結(jié) 語(yǔ)

筆者在1D-CNN模型中引入了GAP,可以將測(cè)井曲線(xiàn)波形的動(dòng)態(tài)變化部分以一種可視化的方式展現(xiàn),并通過(guò)CAM解釋模型的分類(lèi)結(jié)果,用于確定深度學(xué)習(xí)模型的決策是否可信,進(jìn)而提高了模型分類(lèi)器的性能。由于GAP減少了模型中可訓(xùn)練參數(shù)的數(shù)量,在模型中加入了DC和BN,以及減少最大池化層的數(shù)量彌補(bǔ)GAP的不足。筆者提出的可解釋1D-CNN網(wǎng)絡(luò)模型既有效利用了測(cè)井曲線(xiàn)的空間特征、充分表征了巖石物理相與測(cè)井參數(shù)之間的內(nèi)在聯(lián)系,又對(duì)1D-CNN如何做出分類(lèi)決策加深了認(rèn)識(shí)。筆者模型具有可重復(fù)性和高度準(zhǔn)確性,相對(duì)人工預(yù)測(cè)巖石物理相節(jié)省了大量時(shí)間,其應(yīng)用可以大大緩減儲(chǔ)層勘探專(zhuān)家的許多繁瑣且費(fèi)力的工作,實(shí)現(xiàn)巖石物理相的有效分類(lèi)。

猜你喜歡
測(cè)井儲(chǔ)層卷積
基于全卷積神經(jīng)網(wǎng)絡(luò)的豬背膘厚快速準(zhǔn)確測(cè)定
一種基于組分補(bǔ)償?shù)亩S核磁共振測(cè)井?dāng)?shù)據(jù)高精度處理方法
冷凍斷裂帶儲(chǔ)層預(yù)測(cè)研究
基于圖像處理與卷積神經(jīng)網(wǎng)絡(luò)的零件識(shí)別
川中高石梯地區(qū)燈四段儲(chǔ)層地震響應(yīng)及差異性分析
一種基于卷積神經(jīng)網(wǎng)絡(luò)的地磁基準(zhǔn)圖構(gòu)建方法
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
資源勘查工程專(zhuān)業(yè)《地球物理測(cè)井與解釋》課程的教學(xué)改革
我國(guó)測(cè)井評(píng)價(jià)技術(shù)應(yīng)用中常見(jiàn)地質(zhì)問(wèn)題分析
儲(chǔ)層巖石顆粒大小對(duì)波阻抗反演的影響分析
上蔡县| 宜阳县| 高唐县| 江山市| 太湖县| 吐鲁番市| 红原县| 进贤县| 广南县| 两当县| 喀喇沁旗| 安化县| 沙洋县| 呈贡县| 建水县| 云阳县| 洱源县| 郴州市| 乐平市| 阿荣旗| 台南县| 凤冈县| 灌阳县| 开平市| 桐城市| 白银市| 镇安县| 南城县| 和硕县| 海口市| 长子县| 炉霍县| 石棉县| 酉阳| 淮南市| 马山县| 达州市| 宜良县| 秭归县| 通州市| 故城县|