何 旭 李忠偉 劉 昕 張 濤
(①中國石油大學(xué)(華東)計算機(jī)與通信工程學(xué)院,山東青島 266580; ②山東科技大學(xué)地質(zhì)學(xué)院,山東青島266590)
測井?dāng)?shù)據(jù)是銜接巖心與地震資料的中間尺度信息,也是認(rèn)識井點地質(zhì)信息的主要途徑。從20世紀(jì)50年代提出測井相[1]的概念以來,如何準(zhǔn)確而快速地識別測井相成為油藏地質(zhì)研究的一項重要內(nèi)容。早期測井相研究主要通過對比、分析測井曲線形態(tài)與錄井資料,確定沉積相或地層層序,是一種費時、費力的全人工分析模式[2]。隨著計算機(jī)技術(shù)尤其是人工智能的發(fā)展,使精準(zhǔn)、快速、自動識別測井相成為可能,判別分析法、數(shù)理統(tǒng)計法、聚類分析法、模糊識別、曲線擬合、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)等方法逐漸用于測井相識別與分析[3]。
Lim等[4]使用主成分分析和分層聚類分析方法定量分析測井曲線,取得了較好的效果; Sang等[5]應(yīng)用非參數(shù)回歸結(jié)合多變量統(tǒng)計分析(主成分分析和判別分析)方法識別測井相并預(yù)測滲透率; Lim等[6]針對數(shù)據(jù)模糊問題,提出模糊邏輯和神經(jīng)網(wǎng)絡(luò)結(jié)合方法,描述了測井相與儲層性質(zhì)之間的非線性關(guān)系,并能夠預(yù)測孔隙度或滲透率; Tang等[7]利用概率神經(jīng)網(wǎng)絡(luò)(PNN)方法分析測井相以精確地預(yù)測測井?dāng)?shù)據(jù),模型預(yù)測精度達(dá)70%; 汪忠德等[8]提取測井資料中的對應(yīng)特征建立標(biāo)準(zhǔn)模式樣本并使用反向傳播(BP)神經(jīng)網(wǎng)絡(luò)分析建模。但是,上述由機(jī)器學(xué)習(xí)算法定量識別測井相的模型也存在許多不足:首先,特征提取繁瑣,需要將數(shù)據(jù)歸一化等操作,不同的歸一化方法對模型訓(xùn)練結(jié)果也有影響,而且在識別測井相時還要調(diào)整數(shù)據(jù)維度;其次,泛化能力不足,由這種定量分析方法訓(xùn)練得到的模型只適用于某地區(qū)或具相同沉積環(huán)境的地區(qū)。
近年來,隨著人工智能的發(fā)展,在圖像識別方面,許多深度學(xué)習(xí)模型表現(xiàn)出優(yōu)異的性能,對某些數(shù)據(jù)集的處理水平已經(jīng)超越人類[9-15]。從圖像角度識別測井相正是模仿人類基于測井曲線形態(tài)分類識別的工作流程,使用深度神經(jīng)網(wǎng)絡(luò)模型可獲得較高的分類精度,這種使用曲線形態(tài)作為特征的模型泛化能力較強(qiáng),廣泛用于識別不同沉積環(huán)境。
本文選用東海F氣田的砂質(zhì)辮狀河三角洲的測井?dāng)?shù)據(jù),基于測井曲線形態(tài),選取自然伽馬(GR)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)構(gòu)建深度卷積神經(jīng)網(wǎng)絡(luò),并首次用于測井相識別,結(jié)合沉積微相與測井相對應(yīng)表識別沉積微相。結(jié)果表明,本文提出的卷積神經(jīng)網(wǎng)絡(luò)模型可有效識別測井相,在分類精度和模型泛化能力上優(yōu)于其他算法。
自20世紀(jì)80年代提出卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)并在手寫數(shù)字識別中取得了優(yōu)異成果[16-17]。CNN的結(jié)構(gòu)主要由輸入層、卷積層、池化層(也稱下采樣層)、全連接層和輸出層構(gòu)成,卷積層與池化層相鄰構(gòu)建,根據(jù)實際需要可以設(shè)置多個。
卷積層可視為由多個特征映射(Feature Map)組成,多個神經(jīng)元組成特征映射,每個神經(jīng)元通過卷積核(Kernel)與上層特征映射的一部分神經(jīng)元相連。其中卷積核為一個隨機(jī)初始化的權(quán)值矩陣,其作用是與上一層計算得到的特征映射進(jìn)行如下卷積操作
式中:n×n為卷積核大??;xi為區(qū)域內(nèi)第i個像素點的輸入值;wi為對應(yīng)的權(quán)值矩陣元素值;b為計算后加入的偏置;y為卷積運算結(jié)果。
卷積運算使用卷積核操作整個特征映射,可使權(quán)值共享,大大減少了網(wǎng)絡(luò)參數(shù),這也是CNN的一大優(yōu)勢。卷積結(jié)束使用激勵函數(shù)將y歸一化,作為下一層的輸入
x=f(y)
式中:f(·)是為激勵函數(shù),有多種形式,在實際實驗中可以根據(jù)情況自行選擇;x是為激勵函數(shù)的輸出,也是下一層網(wǎng)絡(luò)的輸入值。
池化層也由多個特征映射組成,其特征映射與上一層是一一對應(yīng)的[18]。以最大池化為例
yi=max{x1,x2,…,xn×n}
式中:x為池化區(qū)域的每個點的值;yi為從n×n個點中選取的最大值,也是池化操作的輸出。
池化操作降低了特征映射的分辨率,從而具有平移、旋轉(zhuǎn)不變形的特征[18],并且減少了神經(jīng)元個數(shù),從而降低了模型的復(fù)雜度,提高了泛化能力。
由于沉積旋回具有級次性,對測井相的探討必須建立在一個確定的尺度或地層單元上,本文采用多尺度小波變換劃分沉積單元,在此基礎(chǔ)上再識別多尺度測井相。小波變換是通過改進(jìn)傅里葉變換得到的變換方法,通過信號的伸縮、平移在局部分析時間或空間頻率,并且能以不同尺度細(xì)化。由于小波變換具有優(yōu)異的時頻局部化特點,被廣泛用于信號去噪。如,能夠抑制高頻噪聲,從而保護(hù)有用突變和尖峰信息。本文利用小波變換進(jìn)行濾波,以保持測井曲線的突變段,在去除噪聲的同時不會丟失曲線的有效信息。
采用小波變換去噪分為兩個過程,即:首先對原始信號進(jìn)行小波分解,然后再重構(gòu)分解的信號。小波變換使用的函數(shù)各有不同,常用的小波函數(shù)有Harr、Daubechies、Symlets、Morlet、Gauss等。在選定一個母小波作為小波基時,將母小波經(jīng)過尺度變化和位移得到一簇小波,該簇小波能夠表達(dá)一個信號,而得到一簇小波的過程就是多尺度小波變換過程。選用合適的小波函數(shù)和尺度處理測井曲線,可使測井曲線在整體趨勢上保持不變,但在細(xì)節(jié)上有所不同。
GR測井是對地層放射性的探測,其曲線變化可反映不同時間尺度的沉積環(huán)境變化,從而指示測井相和沉積相變化。經(jīng)過分解后,GR曲線的地質(zhì)意義發(fā)生變化,曲線本身已經(jīng)不再反映泥質(zhì)含量等與地層放射性密切相關(guān)的地質(zhì)特征,GR曲線的垂向變化趨勢以及變化界面有效地指示沉積級次,從而劃分不同級次地層單元。
識別測井相的前提是準(zhǔn)確劃分識別單元。陸相沉積類型復(fù)雜,在同一個地質(zhì)時間單元內(nèi)不同平面位置的地層可能存在較大的厚度差異,如何劃分、識別單元是一個難題;地下的沉積結(jié)構(gòu)復(fù)雜多變,導(dǎo)致同一種沉積微相的測井相存在差異,對經(jīng)驗豐富的解釋人員識別難度不大,但是對于計算機(jī)自動識別是嚴(yán)峻的挑戰(zhàn)。本文采用多尺度小波變換合理劃分識別單元,提出了深度CNN模型自動識別測井相的方法(圖1)。
圖1 深度CNN模型自動識別測井相基本框架
本文選用東海凹陷F氣田的砂質(zhì)辮狀河三角洲沉積環(huán)境的測井?dāng)?shù)據(jù)作為研究對象。因為不同沉積環(huán)境的物源和水動力等條件存在差異,使測井曲線形態(tài)、特征不同,所以在實際測井解釋時,基于區(qū)塊的沉積環(huán)境劃分測井曲線形態(tài)很重要。GR響應(yīng)能夠區(qū)分泥巖和砂巖,可反映垂向序列中砂巖和泥巖的相對含量,還可反映沉積環(huán)境、沉積韻律和沉積速率等地質(zhì)特征,具有良好的指示性[19-20],其測井曲線形態(tài)可反映沉積相類型。
不同沉積環(huán)境的水動力和物源條件差異造成沉積特征差異,導(dǎo)致GR曲線形態(tài)差異。GR曲線形態(tài)主要有箱形、鐘形、漏斗形、齒形及其復(fù)合形態(tài),復(fù)合形態(tài)是前幾種形態(tài)的組合。箱形反映了水動力條件穩(wěn)定的快速堆積或者環(huán)境穩(wěn)定的沉積;鐘形反映了水流能量逐漸減弱或物源供應(yīng)逐漸減少的沉積環(huán)境;漏斗形與鐘形正好相反,反映了水動力變強(qiáng)或物源供應(yīng)逐漸增多的沉積環(huán)境[19]。
本文選用四種GR曲線形態(tài)作為特征,將數(shù)值轉(zhuǎn)變?yōu)閳D像形式。由于形態(tài)標(biāo)定存在人為誤差,從不同井段的測井?dāng)?shù)據(jù)中選取無歧義的形態(tài)特征人工截取和標(biāo)定(圖2),首先對圖像做標(biāo)準(zhǔn)化、添加噪聲、旋轉(zhuǎn)和轉(zhuǎn)灰度等處理,再對數(shù)據(jù)增強(qiáng)與擴(kuò)充,最終建立訓(xùn)練和測試數(shù)據(jù)集,共計4000余張圖片。
圖2 訓(xùn)練數(shù)據(jù)集樣例
GR曲線是與深度有關(guān)的一串具有特定形態(tài)的數(shù)據(jù),針對其具有特定形態(tài)這一特性,本文基于基本CNN結(jié)構(gòu),提出了基于CNN的測井相分類模型,主體結(jié)構(gòu)如圖3所示。具體構(gòu)建策略及解釋如下。
(1)輸入圖像像素為227×227,在第1層使用64個11×11的卷積核對輸入圖像做卷積運算,隨后使用激活函數(shù)ReLU激活每個點。ReLU函數(shù)為
f(x)=max(0,x)
式中F(x)是經(jīng)過激活函數(shù)得到的新數(shù)值,其中x為該點數(shù)值。
激活函數(shù)有多種,一般使用飽和非線性函數(shù),如Sigmoid或Tanh函數(shù)等(圖4),ReLU是不飽和非線性函數(shù)(圖5)。與Sigmoid和Tanh相比,ReLU在梯度下降時更容易求得一階導(dǎo)數(shù),不易出現(xiàn)梯度消失或爆炸,還能加快收斂速度[21],所以本文選用ReLU作為激活函數(shù)。
(2)將經(jīng)過一層卷積之后得到的特征映射作為池化層的輸入,第2層使用192個5×5的池化核對其進(jìn)行池化操作。常用的池化方法有最大池化和平均池化,即分別取池化核部分中的最大值和所有值的平均值。本文針對所建數(shù)據(jù)集的特性,即整個圖片大部分為空白部分,真正有價值的特征區(qū)域占比很小,因此選用最大池化操作,充分利用其適用于分離稀疏特征的特點。
圖3 基于深度CNN的測井相分類模型主體結(jié)構(gòu)
圖4 激活函數(shù)Sigmoid和Tanh
圖5 激活函數(shù)ReLU
(3)第3層和第5層為卷積層,分別使用384個和256個3×3的卷積核,隨后再用ReLU做激活處理;第4層使用256個3×3的池化核對特征映射進(jìn)行最大池化處理;第6層將上述256個特征映射變換成長度為4096的特征向量;第7層對第6層的結(jié)果再進(jìn)行一次全連接操作,同樣得到長度為4096的特征向量。
(4)本文在網(wǎng)絡(luò)中加入了Dropout、局部響應(yīng)歸一化(Local Response Normalization,LRN)和L2正則化等策略。Dropout的原理是以一定概率隨機(jī)抑制神經(jīng)元,使一部分神經(jīng)元在訓(xùn)練階段處于休眠狀態(tài),不參加前向傳播和反向回饋過程,降低了網(wǎng)絡(luò)之間的連接性,從而提高了模型的魯棒性;LRN的作用是對局部神經(jīng)元建立競爭機(jī)制,增強(qiáng)響應(yīng)強(qiáng)烈的神經(jīng)元效果,從而抑制反饋較小的神經(jīng)元;L2范數(shù)是所有向量模的平方和的平方根,在CNN的目標(biāo)函數(shù)中加入L2范數(shù),在最小化過程中,會使L2范數(shù)也最小,而其中的參數(shù)為訓(xùn)練時得到的卷積核的權(quán)值矩陣,這樣在最小化過程中權(quán)值矩陣中所有元素都更加趨近于0,最終使模型參數(shù)接近0,致使模型的泛化能力更強(qiáng)且計算速度更快。
在識別實際測井?dāng)?shù)據(jù)時,需要分割一段深度序列數(shù)據(jù),并轉(zhuǎn)換為圖像形式由模型識別。由于GR的數(shù)據(jù)范圍為0~200(API),本文首先以120為閾值,找出大于120的極值點,將數(shù)據(jù)分割一次;接著以100為閾值,找出前述分割段之間大于100的極值,對數(shù)據(jù)進(jìn)行二次分割;再以85為閾值,找出前述分割段之間大于85的極值,對數(shù)據(jù)進(jìn)行三次分割;最后將這些數(shù)據(jù)段轉(zhuǎn)換成二維灰度圖像形式。
本文提出一種多尺度測井相單元劃分方法,經(jīng)過分析對比實驗,選用Daubechies小波基對測井?dāng)?shù)據(jù)進(jìn)行不同尺度的小波變換,使測井?dāng)?shù)據(jù)具有不同細(xì)節(jié)特征。本文選用Daubechies小波基作為小波基函數(shù)的原因為:本文的思想是將一維數(shù)據(jù)轉(zhuǎn)換為二維圖像進(jìn)行識別,選用合適階數(shù)和分解層數(shù)的Daubechies小波可以保持曲線的整體趨勢,并且不會在識別大尺度測井相時造成不良影響;Daubechies小波支持尺度變換,可根據(jù)實際數(shù)據(jù)特征和識別精度自由變換尺度;Daubechies小波具有良好的正則性,使信號重構(gòu)過程較為光滑。Daubechies小波基簡寫為dbN,N為小波的階數(shù),N越大表示小波濾波器越長。db小波還能進(jìn)行多層分解,分解層數(shù)越多表示信號分解次數(shù)越多。由不同階數(shù)和不同層數(shù)db小波的分解發(fā)現(xiàn),選用db6小波4層分解和db4小波4層分解能有效地對本文數(shù)據(jù)進(jìn)行降噪和濾波處理,同時不破壞GR曲線的主體形態(tài)與增減趨勢。圖6為原始數(shù)據(jù)與經(jīng)過小波變換去噪、平滑處理數(shù)據(jù)。由圖可見:db6小波4層分解進(jìn)一步擴(kuò)大了尺度; db4小波4層分解使測井曲線在大體形態(tài)不變的情況下,過濾了同一深度范圍內(nèi)GR曲線的細(xì)節(jié),只保留了主要趨勢,從而合理地劃分、識別單元。
圖6 原始數(shù)據(jù)與經(jīng)過小波變換去噪、平滑
為了驗證深度CNN測井相識別模型的有效性,對構(gòu)建的測井相數(shù)據(jù)集進(jìn)行實驗,并對比與傳統(tǒng)的分類算法(BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(Support Vector Machine,SVM)和傳統(tǒng)CNN(不添加Dropout、LRU和L2正則化))的實驗結(jié)果(表1),證明深度CNN模型在測井相分類中性能更好。在訓(xùn)練達(dá)到2000代時,傳統(tǒng)CNN模型已經(jīng)出現(xiàn)過擬合情況,深度CNN模型達(dá)到最高準(zhǔn)確率,表明模型具有良好的泛化能力。經(jīng)過數(shù)據(jù)分割操作,使用本文提出的測井相識別方法識別某一段GR數(shù)據(jù)(圖7),可以看出,db6小波4層分解(圖7a)識別的測井相類型多于db4小波4層分解(圖7b),這是因為前者僅僅使用了降噪處理,處理數(shù)據(jù)基本與原始數(shù)據(jù)無異,后者使用濾波處理使對應(yīng)同一深度段內(nèi)識別的測井相與前者有差異,但兩者在大范圍內(nèi)保持一致。
測井曲線形態(tài)從多個方面反映沉積特征,不同的測井曲線形態(tài)通常對應(yīng)不同的沉積相。根據(jù)“沃爾索相律”可知,只有在橫向上成因相似或者相鄰發(fā)育的沉積相,才能在垂向上依次疊覆相鄰。根據(jù)具體的沉積環(huán)境,可以由特定測井曲線形態(tài)判別沉積微相。本文選用砂質(zhì)辮狀河三角洲的GR數(shù)據(jù),利用測井相判別沉積相。砂質(zhì)辮狀河三角洲前緣的沉積微相主要為水下分流河道、分流間灣和河口壩(表2)。
表1 不同模型分類性能
圖7 模型識別結(jié)果(3212.7~3316.0m井段)
表2 沉積微相與測井曲線形態(tài)對應(yīng)表
利用測井曲線形態(tài)與沉積微相的對應(yīng)關(guān)系(表2),通過分析得到目標(biāo)井段的沉積微相。圖8為A井部分模型分析與實際結(jié)果對比。由圖可見: 基于深度CNN的測井相識別模型與BP神經(jīng)網(wǎng)絡(luò)、SVM算法識別結(jié)果差異較大; 對比沉積微相分析結(jié)果與取心分析結(jié)果表明,基于深度CNN的測井相識別模型具有較高的準(zhǔn)確率和泛化能力,但是還會出現(xiàn)誤判,尤其是對于齒形與漏斗形、鐘形之間的識別,這是由于有些曲線對應(yīng)的深度距離較小,存在歧義,使基于深度CNN的測井相識別模型不能準(zhǔn)確地識別。
圖8 A井部分模型分析與實際結(jié)果對比(3966.6~4120.0m井段)
本文基于人工智能技術(shù),提出了基于卷積神經(jīng)網(wǎng)絡(luò)的多尺度測井相識別方法,利用L2范數(shù)、Dropout和LRN有效地限制了模型的復(fù)雜程度,提高了模型泛化能力,獲得了優(yōu)于其他算法的97.87%的模型分類準(zhǔn)確率,利用Daubechies小波劃分不同尺度的測井相單元,可便捷、高效地自動識別測井曲線形態(tài)。由于文中方法選用二維測井相圖像數(shù)據(jù)進(jìn)行分類,無關(guān)具體數(shù)值,即結(jié)合研究區(qū)的沉積環(huán)境背景即可分析測井相,因此比經(jīng)典方法的泛化能力更強(qiáng)。對比沉積微相與取心分析結(jié)果表明,文中方法具有較高的準(zhǔn)確率和泛化能力。
尚需指出,卷積神經(jīng)網(wǎng)絡(luò)模型作為有監(jiān)督學(xué)習(xí),受訓(xùn)練數(shù)據(jù)影響很大,難以得到令人滿意的結(jié)果。因此,擴(kuò)充數(shù)據(jù)集、區(qū)分相似數(shù)據(jù)是未來的研究方向。