張玉璽 劉 洋*③ 張浩然 呂文杰 薛 浩
(①中國石油大學(xué)(北京)油氣資源與探測國家重點(diǎn)實(shí)驗(yàn)室,北京昌平 102249; ②中國石油大學(xué)(北京)CNPC物探重點(diǎn)實(shí)驗(yàn)室,北京昌平 102249; ③中國石油大學(xué)(北京)克拉瑪依校區(qū),新疆克拉瑪依 834000; ④中海油研究總院,北京 100028)
鹽丘是一種重要的底辟構(gòu)造[1],同時往往會伴隨一系列斷裂構(gòu)造。這種斷裂構(gòu)造會使某種可滲透地層單元變?yōu)椴豢蓾B透地層單元,使鹽丘具有良好的密閉性,為油氣聚集和儲存提供空間。因此鹽丘的準(zhǔn)確解釋對于鹽下儲層的勘探與開發(fā)具有重要意義。然而,基于三維地震數(shù)據(jù)的鹽丘解釋仍具有挑戰(zhàn)性。一方面,探測鹽丘時,首先要確定陡傾的鹽層沉積界面,即鹽丘側(cè)翼。但是由于鹽丘形態(tài)復(fù)雜、地層傾角大,甚至?xí)霈F(xiàn)鹽丘頂部直徑明顯大于下部,形如“蘑菇狀”的情況,而鹽丘速度又高于圍巖,造成地震波場復(fù)雜及時間域構(gòu)造畸變。另一方面,隨著對鹽丘的勘探程度逐漸提高,地震數(shù)據(jù)量不斷增大、接收到的地震反射信號更復(fù)雜,導(dǎo)致解釋工作難度大,多解性強(qiáng),傳統(tǒng)的多屬性分析等方法已很難滿足鹽丘解釋的需求。為了解決這些問題,人們相繼提出了多種計算機(jī)輔助解釋技術(shù)。Shi等[2]利用歸一化割圖像分割算法求取全局最優(yōu)化問題的方法檢測鹽丘,但是計算成本高,不適用于實(shí)時地震解釋[3]。Jing等[4]利用邊緣檢測技術(shù)識別鹽丘邊界,簡單、高效。Aqrawi等[5]通過優(yōu)化邊緣檢測技術(shù),對樣本設(shè)置不同權(quán)重組合樣本,可更好地檢測鹽丘。但是基于邊緣檢測的鹽丘識別技術(shù)僅在地震振幅變化劇烈時才能取得良好效果,而且單獨(dú)使用地震振幅信息也不能全面地體現(xiàn)鹽丘特征。
地震屬性能較為直觀地反映特殊的地質(zhì)構(gòu)造特征,因此屬性技術(shù)被廣泛用于鹽丘解釋。Berthelot等[6]提出基于紋理屬性的鹽丘檢測方法。Shafiq等[7]提出利用紋理梯度(GOT)分別測量兩個相鄰時窗之間的紋理差異檢測鹽丘邊界。此外,梯度結(jié)構(gòu)張量[8]、曲率[9]、相似性[10]等地震屬性陸續(xù)用于鹽構(gòu)造解釋并取得一定效果。但基于地震屬性的解釋方法通常需要提取多種屬性并且采用特殊的處理方式拾取地震信息,再進(jìn)行精細(xì)解釋得到最終結(jié)果,依賴于人工并且需要花費(fèi)大量的時間,難以滿足鹽丘勘探、開發(fā)需求。深度學(xué)習(xí)技術(shù)得到迅速發(fā)展,并逐漸用于地震資料解釋,自2018年始,深度學(xué)習(xí)技術(shù)在石油勘探領(lǐng)域掀起了研究熱潮。Pham等[11]利用深度卷積神經(jīng)網(wǎng)絡(luò)檢測河道;Di等[12]應(yīng)用反卷積神經(jīng)網(wǎng)絡(luò)分析地震相,初步實(shí)現(xiàn)了地震相自動分類;Wu等[13]利用端到端的卷積神經(jīng)網(wǎng)絡(luò)自動識別三維斷層。
為了提高鹽丘解釋精度并縮短工作周期,本文以深度學(xué)習(xí)技術(shù)為基礎(chǔ),以少量的二維地震數(shù)據(jù)為樣本訓(xùn)練和測試模型,基本能自動分割鹽丘,但仍存在一定誤差。為了充分考慮不同地震屬性特征,進(jìn)一步減少誤差,利用集成學(xué)習(xí)方法將不同地震屬性模型融合并測試整個三維地震數(shù)據(jù)體。結(jié)果表明,該方法能有效減少誤差,提高鹽丘分類準(zhǔn)確率。
深度學(xué)習(xí)通過構(gòu)建具有多個隱藏層的網(wǎng)絡(luò)模型和海量數(shù)據(jù)挖掘數(shù)據(jù)深層特征。學(xué)習(xí)過程為逐層特征變換,將樣本在原空間的特征表示變換到新特征空間,新空間能夠刻畫更豐富的數(shù)據(jù)內(nèi)在特征,從而使分類或預(yù)測更準(zhǔn)確。
圖像識別和圖像分割是深度學(xué)習(xí)極為重要的兩個部分。圖像識別通過給定一個滑動窗在圖像上滑動,每一個滑動窗所在的小圖像塊被當(dāng)作一個樣本輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,從而識別滑動窗中心像素點(diǎn),當(dāng)遍歷所有像素點(diǎn)就實(shí)現(xiàn)了對整個圖像每一個像素點(diǎn)的分類。這種方法的缺點(diǎn)在于每一個像素點(diǎn)都需要取一個以自身為中心的圖像塊,而相鄰兩個像素點(diǎn)圖像塊相似度非常高,并且需要重復(fù)計算相同部分,造成了大量信息冗余,使網(wǎng)絡(luò)訓(xùn)練速度變慢。另一方面,滑動窗尺寸的選取也需要兼顧計算效率與分類精度。當(dāng)尺寸較大時,計算量增大,尺寸較小時,圖像塊只包含少量局部信息,可能導(dǎo)致錯誤的分類。圖像分割是將整個圖像作為輸入進(jìn)行模型訓(xùn)練,利用得到的模型對圖像的每個像素點(diǎn)同時進(jìn)行分類和定位,實(shí)現(xiàn)目標(biāo)的精確分割。
文中將鹽丘識別視為目標(biāo)分割問題,在識別目標(biāo)的同時圈定目標(biāo)位置?;诰幋a—解碼器結(jié)構(gòu)[14]在計算機(jī)領(lǐng)域的出色表現(xiàn),本文擴(kuò)展了該結(jié)構(gòu)并輸入地震屬性數(shù)據(jù)訓(xùn)練模型。
圖1為編碼—解碼器網(wǎng)絡(luò)結(jié)構(gòu),圖2為特征圖隨網(wǎng)絡(luò)結(jié)構(gòu)的尺寸變化。由圖可見: ①該網(wǎng)絡(luò)為由20個卷積層(conv)組成的對稱結(jié)構(gòu)網(wǎng)絡(luò),編碼器部分(左側(cè))的每個卷積層包含不同數(shù)量的卷積核并使用批量標(biāo)準(zhǔn)化算子(BN)和線性整流函數(shù)(ReLU),每次卷積運(yùn)算之后產(chǎn)生多通道特征圖(藍(lán)色),通常在池化層(Max pooling)后,通道數(shù)成倍增加,特征圖尺寸減半(圖2),才能在減少網(wǎng)絡(luò)參數(shù)的同時確左側(cè)為用于提取輸入特征的編碼器部分,右側(cè)為恢復(fù)空間信息及準(zhǔn)確定位的解碼器部分,與左側(cè)對稱。藍(lán)色和紅色分別表示多通道特征圖和最大池化特征圖;綠色和黃色分別表示上采樣特征圖和Softmax激活函數(shù)。藍(lán)色下方的數(shù)字表示每一層的輸入通道數(shù)(由試驗(yàn)確定),箭頭表示左、右結(jié)構(gòu)對稱保提取的特征更具有代表性;②在每個上采樣(Up-sampling)過程中,通道數(shù)減半,特征圖尺寸加倍直至恢復(fù)至輸入尺寸(圖2),尺寸變化必須為整數(shù)。
圖1 編碼—解碼器網(wǎng)絡(luò)結(jié)構(gòu)
在網(wǎng)絡(luò)結(jié)構(gòu)中,卷積層數(shù)的設(shè)置應(yīng)在保證模型準(zhǔn)確率的前提下,降低訓(xùn)練成本,卷積層數(shù)過多可能導(dǎo)致模型訓(xùn)練過擬合現(xiàn)象。通道數(shù)決定了提取的特征,通道數(shù)越多,提取的特征越豐富,但通道數(shù)過多時,會增加網(wǎng)絡(luò)參數(shù),從而降低運(yùn)算效率,并且可能發(fā)生過擬合現(xiàn)象。圖3為卷積層數(shù)—模型訓(xùn)練時間—準(zhǔn)確率關(guān)系、第一層卷積層通道數(shù)—準(zhǔn)確率關(guān)系。由圖可見:①當(dāng)卷積層數(shù)為16和18時,模型訓(xùn)練的準(zhǔn)確率較低;當(dāng)卷積層數(shù)為20和22時,二者的準(zhǔn)確率相近(分別為97.75%和98.04%),但后者準(zhǔn)確率提高較小且需要更長的模型訓(xùn)練時間,因此將網(wǎng)絡(luò)的卷積層數(shù)設(shè)置為20(圖3a)。②完成4個Epoch后網(wǎng)絡(luò)的準(zhǔn)確率基本穩(wěn)定;當(dāng)通道數(shù)為32和64時,模型訓(xùn)練準(zhǔn)確率較高且相近,因此選擇第一層卷積層通道數(shù)為32。
圖2 特征圖隨網(wǎng)絡(luò)結(jié)構(gòu)的尺寸變化
圖3 卷積層數(shù)—模型訓(xùn)練時間—準(zhǔn)確率關(guān)系(a)、第一層卷積層通道數(shù)—準(zhǔn)確率關(guān)系(b)1個Epoch表示使用所有的訓(xùn)練數(shù)據(jù)完成一次訓(xùn)練,當(dāng)完成一個Epoch后,模型得到一次更新
鹽丘通常呈圓柱形、錐形和穹隆形等,特殊的形態(tài)產(chǎn)生特殊的地震響應(yīng)[15]。鹽丘兩側(cè)地層反射中斷,與圍巖的界面表現(xiàn)為強(qiáng)振幅、低連續(xù)反射結(jié)構(gòu),鹽丘內(nèi)部呈雜亂或空白反射結(jié)構(gòu)(圖4a)。
用于研究的數(shù)據(jù)為荷蘭北海F3區(qū)塊的三維地震數(shù)據(jù),該區(qū)域沉積盆地構(gòu)造演化經(jīng)歷了中生代的裂陷期和新生代裂后沉降期。古新世至上新世,盆地沉積了陸相、海陸過渡相以及海相地層,盡管該時期構(gòu)造運(yùn)動不活躍,但是依然發(fā)育鹽丘底辟和區(qū)域不整合面[16]?;邴}丘的地震反射特征,選取雜亂(Chaos)、均方根振幅(RMS)以及方差(Variance)等3種敏感屬性,每種屬性包含兩類樣本,即主測線數(shù)據(jù)及時間切片(圖4)。
數(shù)據(jù)包含563條主測線和768條聯(lián)絡(luò)測線數(shù)據(jù),采樣間隔為4ms,時間采樣點(diǎn)數(shù)為384,時間記錄范圍為188~1720ms。由于人工標(biāo)記標(biāo)簽耗時,為了提高工作效率,只選擇少量典型數(shù)據(jù)進(jìn)行標(biāo)注。
具體步驟為: ①分別選取典型的15條主測線剖面和15個時間切片,選取的樣本應(yīng)兼顧整個數(shù)據(jù)體; ②借助屬性分析等方法,人工解釋樣本并標(biāo)注為標(biāo)簽,由于標(biāo)簽的準(zhǔn)確性直接影響模型的預(yù)測性能,因此應(yīng)盡可能準(zhǔn)確地標(biāo)注標(biāo)簽(圖5)。
圖4 原始地震剖面及選取的3種屬性a)Inline285原始地震數(shù)據(jù); (b)、(c)和(d)分別為Inline285的Chaos、RMS及Variance剖面; (e)、(f)和(g)分別為t=1364ms時刻的Chaos、RMS及Variance切片
2.2.1 鏡像處理
由網(wǎng)絡(luò)結(jié)構(gòu)可知,在模型訓(xùn)練過程中樣本尺寸變化必須為整數(shù)。然而,原始數(shù)據(jù)輸入網(wǎng)絡(luò)時往往不滿足該條件,因此對訓(xùn)練數(shù)據(jù)使用鏡像操作(圖6)。首先計算滿足要求的最小輸入尺寸,以得到鏡像參數(shù)。通過設(shè)置鏡像參數(shù)拓展輸入數(shù)據(jù)的尺寸,從而使網(wǎng)絡(luò)能夠接受任意尺寸的輸入,意味著鏡像操作可以提高網(wǎng)絡(luò)的適用性。需注意的是,應(yīng)保證對訓(xùn)練樣本與標(biāo)簽進(jìn)行相同的處理。
2.2.2 數(shù)據(jù)增強(qiáng)
深度神經(jīng)網(wǎng)絡(luò)需要大量訓(xùn)練數(shù)據(jù)以保證模型的性能。由于不同區(qū)域的地質(zhì)環(huán)境和地下構(gòu)造差異較大,因此目前沒有通用的數(shù)據(jù)集。
人工解釋并制作標(biāo)簽很耗時,且在小數(shù)據(jù)集上使用深度神經(jīng)網(wǎng)絡(luò)容易過擬合。為了解決該問題并獲得高性能的預(yù)測模型,利用數(shù)據(jù)增強(qiáng)方法分別處理主測線剖面和時間切片的15個樣本并自動生成70000個訓(xùn)練數(shù)據(jù)。
兩組患者經(jīng)治療耳石癥的眩暈和位置性眼震癥狀均有所改善,且治療后四周時效果更明顯,研究組患者根據(jù)患者病情選用不同復(fù)位手法,治療療效顯著優(yōu)于對照組,差異具有統(tǒng)計學(xué)意義(P<0.05),見表1。
數(shù)據(jù)增強(qiáng)是指對已有的訓(xùn)練樣本進(jìn)行一定的變換生成大量數(shù)據(jù),其作用在于: ①增加訓(xùn)練的數(shù)據(jù)量,提高模型的泛化能力; ②利用多種變換以及添加噪聲保證訓(xùn)練樣本的多樣性,有利于提升模型的穩(wěn)定性并防止網(wǎng)絡(luò)過擬合。本文主要應(yīng)用角度旋轉(zhuǎn)、沿y軸的鏡像、模糊、光照等操作以及添加高斯和椒鹽噪聲,以不同的變換方式模擬不同地質(zhì)條件的地震反射特征(圖7)。
圖5 Inline285原始地震剖面(a)及對應(yīng)的標(biāo)簽(b)數(shù)字0表示非鹽丘,1表示鹽丘
圖6 鏡像處理示例(a)Inline 285的Variance剖面; (b)t=1364ms時刻的Variance切片鏡像處理結(jié)果黃色虛線為鏡像邊界
圖7 數(shù)據(jù)增強(qiáng)示例(a)、(b)和(c)僅使用旋轉(zhuǎn)操作; (d)、(e)和(f)使用旋轉(zhuǎn)、模糊、光照操作及添加高斯和椒鹽噪聲
提取3種地震屬性(每種屬性包含兩類樣本)進(jìn)行數(shù)據(jù)增強(qiáng),將增強(qiáng)后的數(shù)據(jù)輸入網(wǎng)絡(luò)訓(xùn)練模型,得到6個模型和6個結(jié)果。在NVIDIA Tesla K40m GPU上模型的訓(xùn)練時間為27.5h。
表1為基于不同屬性的模型預(yù)測準(zhǔn)確率。由表可見,基于RMS屬性的模型測試準(zhǔn)確率最高,基于Chaos屬性的模型測試準(zhǔn)確率最低。圖8為t=1692ms時刻不同切片的鹽丘預(yù)測結(jié)果。由圖可見,與標(biāo)簽(圖8a)相比,3種切片均能預(yù)測鹽丘的大致分布范圍,但RMS切片的預(yù)測結(jié)果(圖8b)誤差點(diǎn)較Chaos切片(圖8c)和Variance切片(圖8d)少(圖中紅框位置)。圖9為基于不同屬性的三維鹽丘預(yù)測結(jié)果。由圖可見: ①利用單種屬性進(jìn)行模型訓(xùn)練能自動識別鹽丘(圖中黃色區(qū)域),但存在預(yù)測誤差(圖中紅框位置); ②由主測線數(shù)據(jù)和切片得到的鹽丘預(yù)測結(jié)果存在一定差異(圖中藍(lán)框位置); ③RMS屬性三維鹽丘預(yù)測結(jié)果誤差點(diǎn)較少,Chaos屬性三維鹽丘預(yù)測結(jié)果有較多雜亂分布的預(yù)測誤差。
表1 基于不同屬性的模型預(yù)測準(zhǔn)確率
圖8 t=1692ms時刻不同切片的鹽丘預(yù)測結(jié)果(a)標(biāo)簽; (b)、(c)和(d)分別為RMS、Chaos和Variance切片預(yù)測結(jié)果黃色部分表示鹽丘
圖9 基于不同屬性的三維鹽丘預(yù)測結(jié)果(a)RMS剖面; (b)RMS切片; (c)Chaos剖面; (d)Chaos切片; (e)Variance剖面; (f)Variance切片
基于不同地震屬性得到的鹽丘分布范圍大致相同,但是邊界存在差異,并且均有預(yù)測誤差點(diǎn)。為了綜合考慮各屬性特征,減少預(yù)測誤差并得到更可靠、準(zhǔn)確的識別結(jié)果,利用集成學(xué)習(xí)方法融合各屬性模型。
集成學(xué)習(xí)思想[17]是利用一定的優(yōu)化策略將多個基學(xué)習(xí)器模型集成為強(qiáng)學(xué)習(xí)器模型組,其中基學(xué)習(xí)器模型可以單獨(dú)訓(xùn)練,并且它們的預(yù)測能以某種方式融合以得到更全面、準(zhǔn)確的結(jié)果。該方法的優(yōu)點(diǎn)在于: ①即使某個基學(xué)習(xí)器得到了錯誤的預(yù)測,集成的強(qiáng)學(xué)習(xí)器也可以將錯誤糾正; ②分類器間存在差異性并各自有一定的使用范圍和優(yōu)勢,通過集成策略將多個學(xué)習(xí)器合并就可以融合各學(xué)習(xí)器的優(yōu)勢,減小錯誤率,提高學(xué)習(xí)泛化能力,實(shí)現(xiàn)更好的預(yù)測。集成學(xué)習(xí)算法的關(guān)鍵主要在于: ①基學(xué)習(xí)器的訓(xùn)練數(shù)據(jù)多樣性; ②基學(xué)習(xí)器的訓(xùn)練方法多樣性; ③組合策略多樣性。提取的3種地震屬性保證了輸入樣本擾動,每種屬性又分為主測線數(shù)據(jù)及時間切片兩類訓(xùn)練數(shù)據(jù),保證了輸入屬性擾動,基于兩種擾動訓(xùn)練基學(xué)習(xí)器能產(chǎn)生差異性大的個體。在模型訓(xùn)練過程中根據(jù)輸入的不同調(diào)整訓(xùn)練參數(shù),以保證算法參數(shù)的多樣性,有助于得到差異較大的基學(xué)習(xí)器?;?類輸入數(shù)據(jù),得到了6個獨(dú)立模型,流程如圖10所示。
鹽丘的自動識別是一個二分類問題。針對分類問題,常用的組合策略包括絕對多數(shù)投票法、相對多數(shù)投票法以及加權(quán)投票法[18]。本文采用加權(quán)投票法。假設(shè)目標(biāo)有m類{c1,c2,…,cm},x為任意一個預(yù)測樣本,有T個學(xué)習(xí)器和T個預(yù)測結(jié)果hi(x)(i=1,…,T),第i個學(xué)習(xí)器的準(zhǔn)確率為Ri,wi為第i個基學(xué)習(xí)器的權(quán)重,由各基學(xué)習(xí)器的準(zhǔn)確率確定。再將各個類別的加權(quán)票數(shù)求和,則最大值對應(yīng)的類別為最終的預(yù)測結(jié)果H(x),即
(1)
本文利用加權(quán)投票法融合6類結(jié)果,集成結(jié)果的準(zhǔn)確率為97.43%(圖11b),高于基于RMS的預(yù)測結(jié)果(圖11c)。在3種屬性中,由于RMS預(yù)測結(jié)果與標(biāo)簽最相近,準(zhǔn)確率最高(圖8)。因此集成學(xué)習(xí)方法的預(yù)測結(jié)果準(zhǔn)確率高于基于3種基礎(chǔ)屬性的預(yù)測結(jié)果。綜上所述,集成學(xué)習(xí)方法能減少預(yù)測誤差,進(jìn)一步優(yōu)化分類。圖12為模型融合后三維鹽丘預(yù)測結(jié)果。由圖可見:由于集成學(xué)習(xí)過程中綜合考慮了多種屬性的剖面和切片特征,最終識別結(jié)果更可靠、準(zhǔn)確, 明顯消除了許多分類錯誤點(diǎn)(圖9紅框),鹽丘邊界較清晰。
圖10 集成學(xué)習(xí)流程
圖11 t=1692ms時刻不同方法切片的鹽丘預(yù)測結(jié)果(a)標(biāo)簽; (b)集成學(xué)習(xí); (c)RMS屬性
圖12 模型融合后三維鹽丘預(yù)測結(jié)果(a)三維鹽丘顯示; (b)局部鹽丘與原始數(shù)據(jù)疊加顯示
本文提出了基于深度學(xué)習(xí)的多屬性鹽丘自動識別方法。該方法基于鹽丘的地震反射特征提取了雜亂、均方根振幅以及方差等3種敏感屬性,每一種屬性分別選取少量主測線數(shù)據(jù)及時間切片作為訓(xùn)練樣本;然后搭建基于編碼—解碼器結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),分別輸入不同的樣本進(jìn)行訓(xùn)練和測試,模型訓(xùn)練時間約為27.5h。測試結(jié)果表明,單種屬性的預(yù)測模型能大致劃定鹽丘邊界,其中RMS屬性預(yù)測結(jié)果的準(zhǔn)確率高于Chaos和Variance屬性,但仍存在較多誤差點(diǎn),并且由各屬性得到的鹽丘邊界存在差異。為了綜合考慮各屬性特征,利用集成學(xué)習(xí)技術(shù)對基礎(chǔ)模型融合、優(yōu)化,并用于整個三維數(shù)據(jù)體。結(jié)果顯示,鹽丘邊界清晰,分類錯誤點(diǎn)明顯減少,進(jìn)一步提高了模型預(yù)測能力。
綜上所述,與傳統(tǒng)鹽丘解釋技術(shù)相比,深度學(xué)習(xí)技術(shù)能有效提高解釋效率,并能較準(zhǔn)確地實(shí)現(xiàn)三維鹽丘的自動分割,在輔助三維地震解釋的應(yīng)用中具有巨大潛力。