李少華,史敬華,,于金彪,王 軍,周傳友,喻思羽
(1.長(zhǎng)江大學(xué)地球科學(xué)學(xué)院,湖北 武漢 430100;2.中國(guó)石化勝利油田分公司勘探開(kāi)發(fā)研究院,山東 東營(yíng) 257015)
儲(chǔ)層建模包括多個(gè)步驟,不同學(xué)者有不同的劃分方法,如二步建模[1]、三步建模以及多步建模[2],沉積相建模是其中的一個(gè)重要環(huán)節(jié)。通常會(huì)先建立沉積相模型,然后在相模型基礎(chǔ)上建立儲(chǔ)層物性參數(shù)模型。為了評(píng)估建模參數(shù)不確定性的影響,通常還需要建立概率儲(chǔ)量[3-5]。一般來(lái)說(shuō),不同相帶物性參數(shù)的分布特征是不一樣的,在相模型基礎(chǔ)之上建立物性參數(shù)模型能夠更加合理地刻畫(huà)物性參數(shù)的空間分布,中國(guó)學(xué)者稱之為相控建模[6],已得到了廣泛的應(yīng)用[7-8],并且這個(gè)概念及應(yīng)用領(lǐng)域也被進(jìn)一步擴(kuò)大,如多級(jí)相控建模、碳酸鹽巖相控建模、地質(zhì)模式約束建模等[9-11]。有多種建立相模型的技術(shù),包括基于兩點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)的方法(序貫指示模擬、截?cái)喔咚鼓M),基于目標(biāo)的建模方法、多點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)方法(MPS,Multiple-points Statistics Methods)和基于沉積事件(過(guò)程)的建模方法[12]。自1993 年提出MPS 方法,在相建模方面展示出良好的應(yīng)用前景,該方法綜合了兩點(diǎn)地質(zhì)統(tǒng)計(jì)學(xué)建模方法和基于目標(biāo)建模方法的優(yōu)點(diǎn),既能較好地刻畫(huà)復(fù)雜地質(zhì)體的幾何形態(tài),又容易滿足已有的條件數(shù)據(jù)。MPS 方法逐漸成為研究的熱點(diǎn),中外學(xué)者對(duì)經(jīng)典的MPS 方法提出了很多改進(jìn)[13-17]。MPS方法基于訓(xùn)練圖像進(jìn)行模擬,例如經(jīng)典的基于概率的單一正規(guī)方程模擬(Snesim)方法,其核心技術(shù)包括:一是對(duì)訓(xùn)練圖像建立搜索樹(shù),二是從搜索樹(shù)中獲取條件概率[18];基于樣式的Simpat 方法,通過(guò)計(jì)算數(shù)據(jù)事件與訓(xùn)練圖像中樣式的差異進(jìn)行模擬[19],能夠更好地再現(xiàn)地質(zhì)模式。針對(duì)一個(gè)工區(qū)通?;谝粋€(gè)訓(xùn)練圖像進(jìn)行模擬,除非是對(duì)該工區(qū)地質(zhì)模式認(rèn)識(shí)上存在較大不確定性,可以采取幾張訓(xùn)練圖像代表不同的地質(zhì)模式[20]?;谟?xùn)練圖像MPS 方法的重點(diǎn)是提取訓(xùn)練圖像的模式,但是這些算法不能生成真實(shí)的非線性模式,也不能展現(xiàn)地質(zhì)推斷的可變性和不確定性,DUPONT認(rèn)為基于GAN模擬可以解決這些問(wèn)題[21]。
1968年,IVAKHNENKO 公開(kāi)了感知器(Perception)的概念,被認(rèn)為是深度學(xué)習(xí)的起源[22]。2014年,IAN 等提出了GAN 方法[23],主要包含生成器和判別器,兩者相互博弈,該方法受到廣大學(xué)者的關(guān)注,并在其基礎(chǔ)上做了大量的改進(jìn)研究。近年來(lái),人工智能方法在油氣領(lǐng)域的應(yīng)用越來(lái)越廣泛,例如以支持向量機(jī)回歸和XGBoost 回歸算法為基礎(chǔ)的儲(chǔ)層裂縫開(kāi)度預(yù)測(cè),結(jié)合卡爾曼濾波和人工神經(jīng)網(wǎng)絡(luò)進(jìn)行油藏井間連通性研究,基于測(cè)井的巖相自動(dòng)識(shí)別,應(yīng)用多次數(shù)據(jù)吸收集合平滑算法進(jìn)行自動(dòng)油藏歷史擬合[24-28]。ERIC 等提出基于訓(xùn)練圖像的空間生成對(duì)抗神經(jīng)網(wǎng)絡(luò)地質(zhì)統(tǒng)計(jì)學(xué)反演方法,該方法能夠快速生成二維和三維的非條件模擬結(jié)果[29]。COIFFIER 等使用生成對(duì)抗神經(jīng)網(wǎng)絡(luò)將二維樣本合成為三維地質(zhì)圖像,該方法實(shí)現(xiàn)簡(jiǎn)單,在標(biāo)準(zhǔn)GAN的生成器和判別器之間引入隨機(jī)截取采樣步驟[30]。ZHANG 等使用基于沉積結(jié)構(gòu)的生成對(duì)抗神經(jīng)網(wǎng)絡(luò)方法生成逼真的三維相模型,該方法可以再現(xiàn)各種概念地質(zhì)模型,同時(shí)具有滿足約束條件(如井資料)所必需的靈活性[31]。目前利用GAN 方法建模需要大量的訓(xùn)練圖像,基于15 000 張訓(xùn)練圖像學(xué)習(xí)開(kāi)展模擬預(yù)測(cè),盡管可以得到與訓(xùn)練圖像非常逼真的模擬結(jié)果,但是大量訓(xùn)練圖像的生成與學(xué)習(xí)訓(xùn)練增加了該方法應(yīng)用的難度。SinGAN 方法能夠從單個(gè)自然景觀圖像生成新的模型,克服了傳統(tǒng)的生成對(duì)抗神經(jīng)網(wǎng)絡(luò)需要大量的圖像進(jìn)行訓(xùn)練的限制[32]。為此,筆者嘗試將SinGAN 方法應(yīng)用到相建模中,以辮狀河儲(chǔ)層為例,并與經(jīng)典的基于樣式的Simpat 方法進(jìn)行對(duì)比,SinGAN方法展示出良好的應(yīng)用前景。
GAN 方法可以生成與期望地質(zhì)模式高度匹配并且滿足條件數(shù)據(jù)的模型,但是訓(xùn)練數(shù)據(jù)必須基于大量的特定訓(xùn)練集[24]。SinGAN 方法能夠從單個(gè)自然圖像中學(xué)習(xí)并生成模型[26]。
SinGAN 方法是一種金字塔式的全卷積輕量權(quán)重的GAN 方法,與常見(jiàn)的GAN 方法類似,其重要改進(jìn)之處是訓(xùn)練樣本采用的是單個(gè)訓(xùn)練圖像,核心在于通過(guò)不同尺度來(lái)捕獲復(fù)雜圖像結(jié)構(gòu)的統(tǒng)計(jì)特征。模型包含金字塔式的生成器和訓(xùn)練對(duì)應(yīng)的金字塔式圖像。降采樣是一種圖像處理技術(shù),降采樣的結(jié)果是原始圖像的縮略圖。訓(xùn)練過(guò)程是從最粗尺度開(kāi)始,多次迭代到最細(xì)尺度。所有的生成器和判別器具有相同的感受野,因此隨著尺度的逐步增加能夠捕獲到更小尺寸的圖像結(jié)構(gòu)。在最粗尺度上由生成器根據(jù)高斯分布的噪聲生成的圖像,其表達(dá)式為:
在最粗尺度下,有效感受野大約是訓(xùn)練圖像尺寸的一半,因此生成器生成的是圖像的布局和全局結(jié)構(gòu)。每一個(gè)更細(xì)尺度的生成器會(huì)增添上一個(gè)生成器沒(méi)有生成的細(xì)節(jié)部分。因此,除了空間噪聲,每一個(gè)生成器還要接受上一個(gè)尺度的上采樣圖像數(shù)據(jù),其表達(dá)式為:
所有的生成器結(jié)構(gòu)類似,特別之處在于在噪聲進(jìn)入卷積層之前,噪聲會(huì)被添加到上一個(gè)尺度生成的圖像數(shù)據(jù)中,這既保證GAN 方法未忽視噪聲,又避免完全隨機(jī)。卷積層目的是生成上一個(gè)尺度所缺乏的細(xì)節(jié),其表達(dá)式為:
卷積核大小為3×3,在最粗尺度上每個(gè)卷積塊使用32 個(gè)卷積核,每增加一個(gè)尺度,卷積核數(shù)量增加16個(gè)。因?yàn)樯善魇侨B接的卷積網(wǎng)絡(luò),通過(guò)修改噪聲的維度,可以生成任意大小和長(zhǎng)寬比例的圖像。
訓(xùn)練過(guò)程采用從最粗尺度到最細(xì)尺度的順序模型。一個(gè)GAN 方法訓(xùn)練完畢,就保持固定狀態(tài)。訓(xùn)練損失包括對(duì)抗損失和重建損失,其表達(dá)式為:
對(duì)抗損失用來(lái)減少訓(xùn)練圖像采樣后的圖像中塊的分布和生成樣本中塊的分布之間的差異,重建損失確保存在可以產(chǎn)生訓(xùn)練圖像降采樣后的圖像的特定噪聲圖集。每一個(gè)生成器與一個(gè)馬爾科夫判別器耦合,判別器將輸入的每個(gè)重疊塊分為真和假兩類。SinGAN 方法定義的損失是整個(gè)圖像的損失,這樣網(wǎng)絡(luò)可以學(xué)習(xí)邊界條件。馬爾科夫判別器的結(jié)構(gòu)和生成器中的由BatchNorm-LeakyReLU 的5個(gè)卷積塊組成的全連接卷積網(wǎng)絡(luò)相同,因此塊的大小也相同。要生成原始的圖像x,必須保證存在一組特定的輸入噪聲集。重建損失的表達(dá)式為:
當(dāng)尺度數(shù)量為N時(shí),重建的圖像在訓(xùn)練的過(guò)程中還有一個(gè)重要的作用,重建的圖像決定了每一個(gè)尺度上噪聲的標(biāo)準(zhǔn)差。
SinGAN方法的結(jié)構(gòu)尺度數(shù)量會(huì)影響模擬結(jié)果。當(dāng)尺度數(shù)量較少時(shí),粗尺度的有效感受野更小,只能捕獲細(xì)微的特征。隨著尺度數(shù)量增加,更高質(zhì)量的結(jié)構(gòu)和整體目標(biāo)布局會(huì)更好地保存下來(lái),圖像結(jié)構(gòu)隨著尺度數(shù)量增加而變化。
N 氣田位于中國(guó)東海陸架盆地某凹陷的中央反轉(zhuǎn)構(gòu)造帶中北部,為中國(guó)東海大型低滲透氣田,已經(jīng)勘探的3套氣藏儲(chǔ)層的厚度均大于100 m,總氣藏的厚度大于400 m。其主力層段花港組上段主要發(fā)育灰色泥巖、粉砂質(zhì)泥巖和泥質(zhì)粉砂巖等,且?jiàn)A有薄層細(xì)砂巖;花港組下段主要發(fā)育厚層細(xì)砂巖,局部發(fā)育中粗砂巖,并夾雜少量粉砂巖及泥巖。
為了檢驗(yàn)提出方法的合理性,選取了N 氣田2個(gè)有代表性的小層沉積微相圖作為訓(xùn)練圖像,包括河道、心灘和泥巖,訓(xùn)練圖像的大小為256×159個(gè)網(wǎng)格單元。其中圖1a 平穩(wěn)性較好,圖1b 較差,在訓(xùn)練圖像上部與下部具有較大差異,上部的河道間泥巖更為發(fā)育。為對(duì)比該方法的適用性,采用2 組不同的訓(xùn)練圖像。測(cè)試硬件環(huán)境包括:CPU 采用第八代英特爾酷睿i7 處理器,頻率為3.7 GHz,運(yùn)行內(nèi)存為16 G,顯卡采用英偉達(dá)GeForce GTX1 080 Ti。
圖1 2個(gè)小層的沉積微相圖Fig.1 Microfacies maps of two layers
Simpat方法由ARPAT 提出[19],與基于概率統(tǒng)計(jì)的Snesim 方法不同,該方法將圖像重建的思想引入到儲(chǔ)層建模,主要模擬步驟包括:①以數(shù)據(jù)樣板掃描訓(xùn)練圖像,構(gòu)建樣式庫(kù)。②在模擬過(guò)程中,計(jì)算數(shù)據(jù)事件與樣式庫(kù)中所有樣式的相似性,Simpat 方法采用Manhattan 距離計(jì)算數(shù)據(jù)事件與樣式的相似度。③將最相似的樣式整體粘貼到模擬網(wǎng)格中。④繼續(xù)模擬,直至所有網(wǎng)格都被模擬。
利用Simpat 方法分別采用3×3,5×5,7×7,9×9,11×11,13×13,15×15,17×17 共8 組數(shù)據(jù)樣板進(jìn)行測(cè)試。由基于相對(duì)平穩(wěn)訓(xùn)練圖像Simpat 方法模擬結(jié)果(圖2)和基于非平穩(wěn)訓(xùn)練圖像的模擬結(jié)果(圖3)可以直觀地看出,數(shù)據(jù)樣板大小對(duì)于模擬結(jié)果的影響很大,數(shù)據(jù)樣板過(guò)小模擬結(jié)果很離散,過(guò)大容易失真,且計(jì)算量增加。對(duì)于MPS 方法來(lái)說(shuō),合理確定數(shù)據(jù)樣板大小對(duì)于建模質(zhì)量的好壞具有重要的影響。另外,相對(duì)平穩(wěn)的訓(xùn)練圖像模擬效果比非平穩(wěn)的訓(xùn)練圖像好。
圖2 基于相對(duì)平穩(wěn)訓(xùn)練圖像的Simpat方法模擬結(jié)果Fig.2 Simulation results of Simpat based on stationary training image
圖3 基于非平穩(wěn)訓(xùn)練圖像的Simpat方法模擬結(jié)果Fig.3 Simulation results of Simpat based on non-stationary training image
基于SinGAN 方法的相關(guān)理論,搭建了相應(yīng)的PyTorch 環(huán)境。初始化參數(shù)設(shè)置包括噪聲、尺度因子、輸出路徑、種子數(shù)等,本次設(shè)置尺度因子為0.75,種子數(shù)使用程序隨機(jī)產(chǎn)生。訓(xùn)練的過(guò)程會(huì)根據(jù)尺度數(shù)量以金字塔式的順序依次從最粗尺度模擬至最細(xì)尺度,每個(gè)尺度迭代次數(shù)可以人為設(shè)置,本次設(shè)置為2 000 次,目標(biāo)函數(shù)重建損失前的系數(shù)設(shè)置為10。SinGAN 方法除了具有GAN 方法共有的核心生成器和判別器,還需要進(jìn)行尺度數(shù)量的選擇。尺度數(shù)量的選取一種是自適應(yīng)的方式,主要是根據(jù)圖像的像素大小計(jì)算選取,另一種方式是人工指定尺度數(shù)量。
首先利用SinGAN 方法對(duì)相對(duì)平穩(wěn)的訓(xùn)練圖像進(jìn)行模擬,選擇圖1a相對(duì)平穩(wěn)的辮狀河訓(xùn)練圖像進(jìn)行測(cè)試。分別采用尺度數(shù)量為3,5 和7 進(jìn)行模擬計(jì)算,設(shè)置成圖的數(shù)量為50 幅,部分模擬結(jié)果如圖4所示。
從圖4 中可以看出,N值對(duì)模擬結(jié)果的影響很大,N值較小的時(shí)候,會(huì)出現(xiàn)大量的過(guò)渡色,因?yàn)镾inGAN方法是針對(duì)自然景觀圖像,是連續(xù)變量。當(dāng)N為7 時(shí),效果良好,能夠刻畫(huà)不同沉積微相的結(jié)構(gòu)和空間展布規(guī)律,直觀對(duì)比發(fā)現(xiàn),優(yōu)于經(jīng)典Simpat方法模擬結(jié)果。
圖4 基于相對(duì)平穩(wěn)訓(xùn)練圖像的SinGAN方法模擬結(jié)果Fig.4 Simulation results of SinGAN based on stationary training image
為進(jìn)一步驗(yàn)證SinGAN 方法對(duì)非平穩(wěn)訓(xùn)練圖像的模擬效果,選擇圖1b非平穩(wěn)的辮狀河訓(xùn)練圖像進(jìn)行測(cè)試。同樣采取N為3,5和7進(jìn)行模擬計(jì)算,模擬結(jié)果如圖5所示。
由圖5 可以看出,N值對(duì)模擬結(jié)果的影響更加明顯,N為3時(shí),明顯失真,N為5變形也比較嚴(yán)重,N為7 效果較好。進(jìn)一步增加N值容易導(dǎo)致系統(tǒng)崩潰,一般不要超過(guò)7[26]。對(duì)比Simpat 方法模擬結(jié)果可以看出,SinGAN 方法優(yōu)于經(jīng)典的MPS 方法,與訓(xùn)練圖像刻畫(huà)的沉積微相空間結(jié)構(gòu)更相似。因?yàn)镾in?GAN 方法是基于自然景觀圖像,利用該方法建立沉積相模型會(huì)出現(xiàn)一些過(guò)渡色,即使當(dāng)采用N為7 時(shí)也會(huì)在個(gè)別地方出現(xiàn),且非平穩(wěn)的訓(xùn)練圖像這種現(xiàn)象更明顯一些。這個(gè)問(wèn)題可以采用聚類的方法進(jìn)行后處理,也就是對(duì)帶過(guò)渡色的圖像根據(jù)RGB 值進(jìn)行聚類,判斷每個(gè)像素的顏色與3 種顏色的差異,將最接近的那種顏色賦值給過(guò)渡色的像素,從而得到只有3種沉積相類型的模擬結(jié)果。非平穩(wěn)訓(xùn)練圖像基于N為6 時(shí)得到模擬結(jié)果3 的聚類后處理結(jié)果(圖6),在不同沉積相類型的接觸邊界,原始模擬結(jié)果(圖6a)呈現(xiàn)過(guò)渡色,通過(guò)聚類后處理的結(jié)果(圖6b)有效地消除這種過(guò)渡色,模型只保留了3種沉積相類型。
圖5 基于非平穩(wěn)訓(xùn)練圖像的SinGAN方法模擬結(jié)果Fig.5 Simulation results of SinGAN based on non-stationary training image
圖6 聚類前后結(jié)果對(duì)比Fig.6 Comparison of results before and after clustering
為了進(jìn)一步比較SinGAN 方法與經(jīng)典MPS 方法的樣式再現(xiàn)能力,選取了基于Simpat 方法模擬效果較好的2 個(gè)模擬結(jié)果(分別對(duì)應(yīng)數(shù)據(jù)樣板為13×13和15×15),N為7的SinGAN 方法模擬結(jié)果和原始訓(xùn)練圖像(相對(duì)平穩(wěn))進(jìn)行樣式相似性對(duì)比分析。將模擬結(jié)果中的樣式全部提取出來(lái),與訓(xùn)練圖像所包含的樣式進(jìn)行比對(duì),采用逐網(wǎng)格屬性比對(duì)的方式刻畫(huà)樣式的相似性。其表達(dá)式為:
通過(guò)計(jì)算模擬結(jié)果的每個(gè)樣式的相似性,即可統(tǒng)計(jì)比較模擬結(jié)果與訓(xùn)練圖像的樣式相似性差異。
由對(duì)比結(jié)果(圖7)可知,SinGAN 方法模擬結(jié)果與原始訓(xùn)練圖像的樣式相似性最好,其次是基于13×13 樣板模擬的結(jié)果。通過(guò)對(duì)比分析表明,Sin GAN 方法在再現(xiàn)訓(xùn)練圖像內(nèi)部結(jié)構(gòu)方面具有強(qiáng)大的能力,優(yōu)于經(jīng)典的MPS 方法,展示了良好的應(yīng)用前景。本次僅開(kāi)展了二維非條件的沉積相模擬,進(jìn)一步實(shí)現(xiàn)條件化的三維模擬將極大推進(jìn)該方法在儲(chǔ)層建模中的實(shí)際應(yīng)用。
圖7 數(shù)據(jù)樣式相似性對(duì)比Fig.7 Comparison of similarity of data patterns
基于單幅自然景觀圖像的SinGAN 方法應(yīng)用于沉積相建模,取得了良好的效果,通過(guò)直觀分析及數(shù)據(jù)樣式再現(xiàn)的定量化對(duì)比,SinGAN方法模擬的結(jié)果優(yōu)于Simpat 方法。SinGAN 方法模擬結(jié)果不論是相對(duì)平穩(wěn)的沉積微相圖還是非平穩(wěn)的沉積微相圖受模擬尺度數(shù)量的影響明顯。相對(duì)而言,對(duì)于非平穩(wěn)的沉積微相圖影響更大,需要選取更大的尺度數(shù)量才能夠達(dá)到較好的模擬效果。對(duì)于沉積相建模一般選取最粗尺度數(shù)量為7,過(guò)大可能會(huì)導(dǎo)致系統(tǒng)崩潰。當(dāng)SinGAN 方法用于建立離散的沉積相模型時(shí),即使采用最粗尺度數(shù)量為7 也會(huì)在個(gè)別地方出現(xiàn)一些過(guò)渡色,非平穩(wěn)情況下更為明顯。針對(duì)這種情況可以采取聚類的方式處理,消除過(guò)渡類型,達(dá)到模擬離散模型的目的。SinGAN 方法是針對(duì)連續(xù)變量的,可以直接應(yīng)用于連續(xù)變量的模擬。目前主要進(jìn)行了二維非條件的沉積相模擬測(cè)試,三維空間的模擬可以借鑒已有做法,需要考慮不同尺度相互匹配的問(wèn)題。如何將條件數(shù)據(jù)、地震屬性等更多的約束信息加入到SinGAN 方法仍是一個(gè)難點(diǎn),但該方法在儲(chǔ)層建模領(lǐng)域已經(jīng)展示出良好的應(yīng)用前景。
符號(hào)解釋
Dist——計(jì)算模擬結(jié)果的第i個(gè)樣式與PatDBT中的每個(gè)樣式的距離值,無(wú)量綱;
Dn——馬爾科夫判別器;
Gn——生成器;
GN——金字塔式的生成器;
i——編號(hào);
Ladv——對(duì)抗損失,無(wú)量綱;
Lrec——重建損失,無(wú)量綱;
n——當(dāng)前尺度數(shù)量;
N——最粗尺度數(shù)量;
Pat(i)——模擬結(jié)果的第i個(gè)樣式;
PatDBT——訓(xùn)練圖像里所有的樣式;
S(i)——訓(xùn)練圖像中與模擬結(jié)果的第i個(gè)樣式最相似樣式的相似度;
xn——當(dāng)前尺度數(shù)量為n時(shí)的圖像;
——對(duì)應(yīng)xn生成器生成的圖像;
x?rnec——當(dāng)前尺度數(shù)量為n時(shí)噪聲集生成的圖像;
x?N——最粗尺度數(shù)量為N時(shí)生成的圖像;
zn——當(dāng)前尺度數(shù)量為n時(shí)的空間噪聲圖像;
zN——最粗尺度數(shù)量為N時(shí)的空間噪聲圖像;
α——目標(biāo)函數(shù)重建損失前的系數(shù),無(wú)量綱;
↑r——重采樣;
ψn——BatchNorm-LeakyReLU 的5個(gè)卷積塊組成的全連接卷積網(wǎng)絡(luò)。