相 鵬 譚紹泉 陳學國 劉 佳
(①中國石化勝利油田分公司勘探開發(fā)研究院,山東東營 257000;②中國石化勝利油田分公司石油開發(fā)中心,山東東營 257000)
重力反演作為一種重要的定量解釋手段,可以得到地下的密度分布特征,為地質(zhì)解釋提供支持。然而,重力反演的垂向分辨率低、多解性強,制約了其在高精度勘探領(lǐng)域中的應用。上述問題的根本原因在于重力反問題的不適定性。首先,重力資料采集密度低,數(shù)據(jù)量小,而高分辨率反演需要對地下半空間進行精細的網(wǎng)格剖分,使網(wǎng)格數(shù)量(即反演的未知參數(shù)數(shù)量)遠大于數(shù)據(jù)數(shù)量,導致反演方程組嚴重欠定;其次,重力正演核函數(shù)隨深度加大而迅速衰減,淺層網(wǎng)格的核函數(shù)與深層網(wǎng)格的核函數(shù)之間相差多個數(shù)量級,反演方程組穩(wěn)定性差,當反演方程組欠定時,反演結(jié)果趨膚。因此,反演結(jié)果會被重力數(shù)據(jù)噪聲、網(wǎng)格剖分誤差和計算誤差等嚴重污染,分辨率和可靠性均低。
目前,基于廣義線性反演理論的重力反演方法已經(jīng)取得了大量的研究成果,這些方法可大致分為三類。
第一類方法通過增加重力數(shù)據(jù)數(shù)量,改善反演方程組的欠定性。有學者提出了等維反演方法[1-2],綜合利用不同高度上的位場數(shù)據(jù)聯(lián)合反演,在一定程度上能解決重磁位場反演的“上漂”問題,提高重磁位場異常反演的垂向分辨率。近年來,隨著航空重力梯度技術(shù)的發(fā)展,產(chǎn)生了利用重力梯度張量數(shù)據(jù)的反演方法[3-4]。另外,還有利用井中重力數(shù)據(jù)或者重力梯度數(shù)據(jù)聯(lián)合地面重力數(shù)據(jù)反演的方法[5-7]。
第二類方法主要是通過核函數(shù)處理以改善反演方程組的適定性。目前,大部分反演方法都可歸為該類方法。其中,用深度對核函數(shù)加權(quán)[8]是最具有代表性和影響力的方法,這種方法能夠有效解決反演趨膚的問題。同時,多種與之類似的不同加權(quán)方法也被提出[9-10]。此外,各種約束類反演方法,如聚焦約束、平滑約束和先驗模型約束等方法[2,6,11-13]也被歸為第二類。因為約束方程的加入,可被看作是一種對正演核函數(shù)矩陣進行行擴展的處理方式。
第三類方法主要是利用某種函數(shù)作為密度函數(shù)代替離散化的密度模型矢量,減少反演參數(shù)數(shù)量,從而改善反演方程組的適定性。該類方法通常要求根據(jù)密度函數(shù)具體形式推導不同的正演公式。近年來,在重磁正演領(lǐng)域已經(jīng)出現(xiàn)了大量研究成果,可以實現(xiàn)復雜形體的不同形式密度函數(shù)的變密度正演[14-16],但目前這些成果在反演領(lǐng)域的應用較少。劉潔等[17]利用高階多項式作為密度函數(shù)實現(xiàn)了重力反演,但是多項式函數(shù)是連續(xù)平滑的,模型表達能力有限,而表達能力強的密度函數(shù),其正演公式往往推導難度大,甚至無法推導解析公式。為了解決復雜函數(shù)形式正演公式推導難的問題,Tontini 等[18]仍采用核函數(shù)矩陣,利用高斯函數(shù)生成模型矢量,提出了一種高斯包絡磁力反演方法。該方法雖然沒有對正演公式進行改進,但是與現(xiàn)在機器學習領(lǐng)域的壓縮感知[19-20]和字典學習等技術(shù)[21-22]的核心思想有著異曲同工之處。
與廣義線性反演不同,基于神經(jīng)網(wǎng)絡的重力反演方法是一種非線性反演方法[23-24]。此類方法的特點在于采用分層結(jié)構(gòu),網(wǎng)絡結(jié)構(gòu)清晰,神經(jīng)元節(jié)點采用感知機模型,反向傳播訓練算法易于實現(xiàn),魯棒性強。神經(jīng)網(wǎng)絡反演方法分為訓練和預測兩個步驟,通過樣本數(shù)據(jù)集(重力場—密度模型對)訓練神經(jīng)網(wǎng)絡,建立重力場和對應模型的非線性映射關(guān)系;再在預測步驟里將實測重力場輸入,神經(jīng)網(wǎng)絡輸出預測密度模型,即反演結(jié)果?;谏窠?jīng)網(wǎng)絡的重力反演方法存在以下幾個方面的問題:第一,建立訓練數(shù)據(jù)集困難,訓練數(shù)據(jù)集中需要包含大量不同類型的模型和重力場,否則,實用效果大打折扣,而設計不同的模型并計算其重力場工作量巨大;第二,基于感知機模型的單隱層神經(jīng)網(wǎng)絡非線性映射能力弱,難以解決復雜非線性問題,使用深層網(wǎng)絡則存在過擬合、梯度消失、梯度爆炸等問題,訓練困難;第三,神經(jīng)網(wǎng)絡隱層可解釋性差,尤其是深層神經(jīng)網(wǎng)絡,每層對應的物理意義不明確。針對神經(jīng)網(wǎng)絡存在的問題,有學者提出了擬神經(jīng)網(wǎng)絡的反演方法[25-26]。模擬神經(jīng)網(wǎng)絡的分層結(jié)構(gòu),但不需要樣本數(shù)據(jù)集訓練,且網(wǎng)絡層具有較好的可解釋性。但是,前人提出的擬神經(jīng)網(wǎng)絡各層定義不清晰,層間耦合嚴重,神經(jīng)元多采用Sigmoid激活函數(shù),模型表達能力弱。
本文在梳理了大量已有的重力反演方法基礎(chǔ)上,提出了一種利用徑向基函數(shù)(Radial Basis Function,RBF)的擬神經(jīng)網(wǎng)絡重力反演方法。該方法利用高斯徑向基函數(shù)壓縮模型空間,在保證復雜模型表達能力的前提下,實現(xiàn)反演參數(shù)的降維;提出一種擬神經(jīng)網(wǎng)絡結(jié)構(gòu),不需要訓練樣本標簽,可以克服建立訓練數(shù)據(jù)集的困難。理論模型試算和實際資料應用表明,基于該網(wǎng)絡結(jié)構(gòu)實現(xiàn)的重力反演提高了垂向分辨率,同時增強了可靠性,并且具有較強的抗噪能力。
徑向基函數(shù)是沿徑向?qū)ΨQ的標量函數(shù),通常被定義為空間中任一點到某一中心點之間歐氏距離的單調(diào)函數(shù)。其作用往往是局部的,即當空間某點遠離中心點時,函數(shù)取值很小,調(diào)整局部函數(shù)值大小和作用范圍可以靈活地擬合復雜函數(shù)。本文采用最常用的高斯徑向基函數(shù),它在計算機視覺、人工智能、圖像壓縮和數(shù)據(jù)擬合等領(lǐng)域有著廣泛的應用。其三維公式為
(1)
式中:(x,y,z)是網(wǎng)格中心坐標;(μx,μy,μz)是徑向基函數(shù)中心坐標;δx、δy、δz是徑向基函數(shù)分布半徑。二維公式則為
(2)
根據(jù)高斯函數(shù)擬合原理[27],密度模型可以表示為多個不同振幅的高斯函數(shù)的疊加求和,即
(3)
式中:NG是高斯徑向基函數(shù)個數(shù);Wi是第i個高斯徑向基函數(shù)的振幅。高斯徑向基函數(shù)具有很強的模型表達能力,使用遠少于剖分網(wǎng)格個數(shù)的高斯徑向基函數(shù)就可以對復雜模型進行較高精度地擬合。對于圖1a復雜模型,分別使用不同數(shù)量的高斯徑向基函數(shù)擬合,效果如圖1b~圖1d所示。由圖可見,當僅用25個高斯徑向基函數(shù)擬合模型時,盡管分辨率較低,但已經(jīng)能較好地恢復模型的背景;隨著高斯徑向基函數(shù)數(shù)量的增加,越來越多的模型細節(jié)被恢復。為保證反演方程組不欠定,用于表示密度模型的高斯徑向基函數(shù)的數(shù)量理論上應該滿足ND/NG≥5(二維反演)和ND/NG≥7(三維反演),其中ND是重力數(shù)據(jù)的數(shù)量。但是,后文中模型試驗和實測資料反演結(jié)果表明,ND/NG低于上述比例時亦可獲得較好效果。
圖1 復雜模型(a)及25(b)、100(c)、400(d)個高斯徑向基函數(shù)的擬合結(jié)果
本文采用常密度立方體重力公式[28]作為正演公式,即
g=Kρ
(4)
式中K是核函數(shù)矩陣,即
(5)
(6)
由于高斯徑向基函數(shù)是徑向基函數(shù)中心和分布半徑的非線性函數(shù),因此重力正演公式由線性變成了非線性,反演參數(shù)由網(wǎng)格密度變成了徑向基函數(shù)的振幅W、中心(μx,μy,μz)和半徑(δx,δy,δz)。式(6)仍然保留正演核函數(shù)矩陣,與采用g=f(m)形式的正演公式相比,具有以下優(yōu)點。
正演核函數(shù)矩陣僅是觀測點和網(wǎng)格坐標的函數(shù),與密度解耦,在反演過程中只需計算一次,因而避免了計算量最大部分的重復計算。每次迭代只需計算高斯徑向基函數(shù)生成密度矢量,增加的計算量很小,而不能將密度解耦的非線性正演公式在每次迭代時,都需要進行計算量巨大的正演和靈敏度矩陣計算。
式(6)的形式與壓縮感知理論有著很好的對應關(guān)系。其中,核函數(shù)矩陣對應測量矩陣,高斯徑向基函數(shù)生成稀疏基矩陣,高斯徑向基函數(shù)的振幅對應稀疏系數(shù)。因此,可借鑒、應用壓縮感知的相關(guān)理論和技術(shù)。當固定徑向基函數(shù)的中心和半徑而只是反演振幅時,可利用壓縮感知的稀疏性原理實現(xiàn)稀疏約束反演,經(jīng)典算法有OMP[29]和LASSO算法[30];當同時反演徑向基函數(shù)的振幅、中心和半徑時,可以利用字典學習技術(shù)中經(jīng)典的MOD[31]和KSVD算法[21]快速實現(xiàn)。
在定義了基于高斯徑向基函數(shù)的重力正演公式之后,本文提出了一種如圖2所示的擬神經(jīng)網(wǎng)絡結(jié)構(gòu)。該網(wǎng)絡由輸入層、徑向基函數(shù)層、權(quán)重連接層和正演輸出層組成。其中,徑向基函數(shù)層的節(jié)點為高斯徑向基函數(shù),權(quán)重連接層的節(jié)點為高斯徑向基函數(shù)振幅,正演輸出層的節(jié)點為重力正演核函數(shù)。與傳統(tǒng)神經(jīng)網(wǎng)絡相比,本文提出的擬神經(jīng)網(wǎng)絡主要有以下幾點不同。
圖2 徑向基函數(shù)的擬神經(jīng)網(wǎng)絡結(jié)構(gòu)圖M為觀測點數(shù)量
(1)本文方法的輸入數(shù)據(jù)是模型網(wǎng)格中心的坐標,而傳統(tǒng)神經(jīng)網(wǎng)絡重力反演方法中輸入數(shù)據(jù)通常為重力樣本數(shù)據(jù)集。
(2)本文方法的輸出數(shù)據(jù)是正演重力值,而傳統(tǒng)神經(jīng)網(wǎng)絡重力反演方法中輸出數(shù)據(jù)通常為密度模型數(shù)據(jù)集。
(3)本文方法的損失函數(shù)是計算正演重力數(shù)據(jù)與實測重力數(shù)據(jù)之間的殘差,而傳統(tǒng)神經(jīng)網(wǎng)絡重力反演方法中損失函數(shù)是計算預測密度模型與密度模型樣本之間的殘差。損失函數(shù)的不同決定了神經(jīng)網(wǎng)絡各層的含義不同,本文擬神經(jīng)網(wǎng)絡各層可解釋性清晰、明確,而傳統(tǒng)神經(jīng)網(wǎng)絡中,若存在多個隱含層,則各層可解釋性不明確,只能將整個網(wǎng)絡解釋為重力正演函數(shù)的反函數(shù)。
(4)本文方法在訓練結(jié)束后,徑向基函數(shù)權(quán)重連接層的輸出即為最終反演結(jié)果,即密度模型。而傳統(tǒng)神經(jīng)網(wǎng)絡重力反演方法中,先使用樣本數(shù)據(jù)集訓練神經(jīng)網(wǎng)絡,再利用訓練后的神經(jīng)網(wǎng)絡執(zhí)行預測步驟,在網(wǎng)絡輸出層獲得最終反演結(jié)果。
為了驗證本文方法的有效性,在文獻[32]中的實驗模型基礎(chǔ)上設計了三維組合模型。如圖3a所示,模型大小為9240m×9240m×3040m,模型網(wǎng)格剖分為15×15×10個小長方體。三個地質(zhì)異常體(簡稱地質(zhì)體)中,地質(zhì)體1(黃色)的剩余密度為0.3g/cm3,尺寸為616m×6160m×608m,中心埋深為912m;地質(zhì)體2(桔色)的剩余密度為0.4g/cm3,尺寸為3696m×3696m×1216m,中心埋深為2128m;地質(zhì)體3(紅色)的剩余密度為0.5g/cm3,尺寸為2464m×1232m×1216m,中心埋深為1216m。地質(zhì)體1和地質(zhì)體2為垂向疊置。觀測系統(tǒng)范圍x方向為0~10000m,y方向為0~10000m,觀測點高度為0,每個方向均勻設置20個觀測點。正演重力場如圖3b所示。
圖3 理論模型(a)及正演重力場(b)
實驗一采用與正演網(wǎng)格相同的剖分方案,即初始模型剖分為15×15×10個小長方體,徑向基函數(shù)中心初始設置為在地下剖分空間均勻分布,x方向5個,y方向5個,z方向5個,徑向基函數(shù)層共有5×5×5=125個節(jié)點,權(quán)重連接層初始權(quán)重均設為0,數(shù)據(jù)和徑向基函數(shù)數(shù)量的比值為ND/NG=3.2,學習率為0.1,最大訓練次數(shù)為2000,訓練精度為1×10-6,訓練算法為自適應距估計算法,反演結(jié)果如圖4所示。由圖可見,無井約束反演可以恢復地質(zhì)體的形態(tài)(圖4左),其中,地質(zhì)體1的邊界較為尖銳,與地質(zhì)體2垂向疊加部分得到準確分離,但接近地質(zhì)體3的部分較為模糊;地質(zhì)體3的邊界非常清晰,但下界面偏淺;地質(zhì)體2的頂界面較準確,但因為埋深加大,邊界較為模糊。有井約束反演可以使地質(zhì)體1和2的邊界更加清晰(圖4右),地質(zhì)體3的下界面更接近真實深度。實驗結(jié)果證明:由于反演參數(shù)的減少,在不施加任何約束的情況下,重力反演亦能獲得較高的橫向和垂向分辨率,垂向疊加的地質(zhì)體能夠準確恢復;在施加先驗約束信息后,反演結(jié)果的橫向和垂向分辨率得以提高,地質(zhì)體的邊界反演精度更高。
圖4 實驗一無井(左)和有井(右)約束反演結(jié)果(a)重力反演結(jié)果;(b)過W1井的x方向反演剖面;(c)過W2井的x方向反演剖面;(d)過W3井的y方向反演剖面。三口井坐標分別為(6450m,2770m)、(6450m,6450m)和(3380m,3380m),圖5同
實驗二的初始模型剖分為31×31×21個小長方體,對重力異常添加3%的白噪聲,模擬在反演實測重力時存在網(wǎng)格剖分誤差和數(shù)據(jù)噪聲的情況,其他參數(shù)設置與實驗一相同。反演結(jié)果如圖5所示。由圖可見,無井約束反演結(jié)果橫向和垂向分辨率遠低于圖4(圖5左)。除網(wǎng)格剖分誤差和數(shù)據(jù)噪聲外,網(wǎng)格剖分數(shù)量是造成分辨率下降的主要原因。實驗二的網(wǎng)格數(shù)量是實驗一的8倍多,導致正演核函數(shù)矩陣的性狀(條件數(shù)、列相關(guān)性)變差。盡管反演參數(shù)數(shù)量沒有變化,但是在殘差反向傳播過程中,受到正演核函數(shù)矩陣性狀變差的影響,反演分辨率下降。有井約束反演結(jié)果橫向和垂向分辨率提高很大(圖5右),除了地質(zhì)體1與地質(zhì)體3相鄰處和地質(zhì)體3的下界面有些模糊外,整體反演效果甚至優(yōu)于圖4中的約束反演,尤其是地質(zhì)體2不僅與垂向疊加的地質(zhì)體1準確分離,而且邊界更接近真實模型。實驗結(jié)果說明:在無約束信息時,模型網(wǎng)格剖分數(shù)量不宜過多;但是加入少量先驗約束信息,即使在正演核函數(shù)矩陣性狀很差時(即網(wǎng)格數(shù)量遠大于重力數(shù)據(jù)數(shù)量時),仍可以得到較理想的反演結(jié)果。本文方法能夠充分利用先驗信息的約束作用,并具有良好的抗噪性能。
圖5 實驗二無井(左)和有井(右)約束反演結(jié)果(a)重力反演結(jié)果;(b)過W1井的x方向反演剖面;(c)過W2井的x方向反演剖面;(d)過W3井的y方向反演剖面
為檢驗方法的實用性,對車鎮(zhèn)凹陷的重力資料進行反演,開展古潛山和洼陷的識別。
渤海灣盆地是疊置在華北克拉通基底之上的中、新生代斷陷盆地,濟陽坳陷是渤海灣盆地的坳陷之一,依據(jù)地層與潛山的關(guān)系大致可以將地層劃分為兩個構(gòu)造層,即潛山內(nèi)幕層和蓋層。潛山內(nèi)幕層由魯西地塊的基底、太古界泰山群、古生界和中生界組成;蓋層由古近系孔店組、沙河街組、東營組和新近系館陶組、明化鎮(zhèn)組及第四系平原組組成。車鎮(zhèn)凹陷是濟陽坳陷最北部的一個凹陷,南北夾于義和莊凸起與埕子口凸起之間,西為慶云凸起,地表為第四系覆蓋。該區(qū)地層密度特征如表1所示。
表1 車鎮(zhèn)凹陷地層密度統(tǒng)計表
密度資料顯示,館陶組與東營組、沙一段與沙二段、上下古生界之間存在密度界面。由區(qū)域地質(zhì)背景可知,東營組沉積后,構(gòu)造運動導致的界面起伏不大,對重力異常形態(tài)的影響較小。下古生界起伏變化大,直接影響重力異常形態(tài)。下古生界與上覆地層構(gòu)成的密度界面為主要密度界面,依據(jù)地層與潛山的關(guān)系,大致可以將該密度界面作為車鎮(zhèn)凹陷的潛山頂界面。該區(qū)潛山表現(xiàn)為高密度、高阻抗的特征。相較于潛山,潛山之上地層呈現(xiàn)低密度特征。潛山與上覆地層的密度差最大可達0.18g/cm3,這為利用重力資料研究潛山構(gòu)造提供了物性基礎(chǔ)[17,33]。
對研究區(qū)布格重力異常采用延拓分離法進行場分離,得到剩余布格重力異常(圖6)。由圖可見,重力低值區(qū)對應斷陷或凹陷,重力高值區(qū)對應基底隆起,相互之間吻合關(guān)系較好。重力高值區(qū)與低值區(qū)之間有較明顯的梯度帶出現(xiàn),反映凹凸之間為斷裂或者地層產(chǎn)狀突變。
圖6 車鎮(zhèn)凹陷剩余布格重力異常
將重力覆蓋區(qū)域剖分成為500m×500m×250m的立方體網(wǎng)格,反演深度為8km,網(wǎng)格總數(shù)約為49.5萬個。在x、y、z方向分別設置15、25、8個徑向基函數(shù),共計有3000個,在地下空間均勻分布。初始權(quán)重均設為0,重力觀測點為20181個。數(shù)據(jù)量與徑向基函數(shù)數(shù)量的比值為ND/NG=6.727。根據(jù)研究區(qū)地層密度資料,結(jié)合剩余布格重力異常的值域范圍,通過多次實驗、分析后確定了剩余密度的下限為-0.75g/cm3。反演得到的三維剩余密度模型如圖7所示,模型的剩余密度范圍為-0.75~0.05g/cm3,與研究區(qū)地層密度最大值和最小值的差異范圍基本一致。
圖7 車鎮(zhèn)凹陷三維剩余密度模型
根據(jù)地層密度的統(tǒng)計結(jié)果,提取研究區(qū)下古生界的密度界面制作下古生界頂面構(gòu)造圖,如圖8所示。密度界面清晰地反映了車鎮(zhèn)地區(qū)下古生界的分布情況,最深處位于大王北洼陷,最淺處位于埕子口凸起西部。研究區(qū)兩凸一凹的格局非常清楚,埕子口凸起及義和莊凸起上的洼突分布比較明顯,較低洼處反映為古沖溝。凹陷內(nèi)不僅各級次洼清晰,凹陷深部的潛山也較清晰。另外,還清晰地顯示了埕南大斷層上的臺階狀斷塊及義和莊凸起北部緩坡帶上的近北東向斷裂。
圖8 車鎮(zhèn)凹陷下古生界頂面構(gòu)造圖黃線為圖9中剖面位置
從三維剩余密度模型中提取剖面與相鄰的地震剖面進行對比(圖9)。由圖可見,實測重力異常與擬合重力異常的誤差非常小,重力高、低值區(qū)與構(gòu)造凸凹之間對應關(guān)系很好(圖9a)。地震剖面上(圖9c)新生界成像清晰,且與剩余密度剖面(圖9b)形態(tài)對應關(guān)系較好。參考地震層位解釋方案,在密度剖面解釋了新生界層位。因為地震剖面為時間域剖面,所以剩余密度剖面的解釋方案與地震解釋方案形態(tài)相似但不完全相同。地震剖面上新生界以下的地層成像較差,根據(jù)鉆井資料在剖面左側(cè)可以解釋下古生界頂界面,而剖面右側(cè)則難以解釋。在剩余密度剖面上,可根據(jù)密度分布解釋下古生界和太古界頂界面,下古生界頂界面左側(cè)與地震解釋方案基本一致,由此推斷右側(cè)的解釋方案具有較高的可信度。太古界頂界面在地震剖面上無法識別,剩余密度剖面上所解釋的太古界頂界面雖無法證實,但可作為研究深層目標的參考。
圖9 剩余密度剖面與地震剖面對比(a)實測與擬合重力異常;(b)剩余密度剖面;(c)地震剖面
本文利用高斯徑向基函數(shù)作為激活函數(shù),定義了一種結(jié)構(gòu)清晰明確的擬神經(jīng)網(wǎng)絡,在保證復雜模型表征能力的前提下,降低了重力反演參數(shù)的數(shù)量,改善了重力反演的不適定性,能夠更充分的利用重力數(shù)據(jù)所包含的信息,反演結(jié)果更客觀。模型實驗表明在無約束或少量先驗信息約束的情況下,本文方法可以獲得較高橫向和垂向分辨率的反演結(jié)果。將本文方法應用于車鎮(zhèn)凹陷,得到的剩余密度模型與鉆井、地震資料解釋成果吻合度較高,較好地揭示了該地區(qū)下古生界的構(gòu)造格局與潛山發(fā)育規(guī)律,檢驗了本文方法反演實測資料的有效性。車鎮(zhèn)凹陷密度模型是在未施加層位和鉆井等強約束信息的情況下反演得到的,證明該方法在低勘探程度區(qū)具有較大的實用價值和應用潛力。