郭 超,趙謙平,劉 剛,郝世彥,高 潮,孫建博,劉 超,陳奕奕
[1.陜西延長石油(集團)有限責(zé)任公司 研究院,陜西 西安 710065; 2.陜西省陸相頁巖氣成藏與開發(fā)重點實驗室,陜西 西安 710065]
陸相頁巖儲層具有紋層發(fā)育、儲層相變快、巖性復(fù)雜以及非均質(zhì)性強的特征,在研究陸相頁巖氣儲集機理時需要大量的巖石薄片數(shù)據(jù)作為基礎(chǔ)。將顯微鏡下的薄片制作成圖像,靈活使用,方便保存,是當前主要的薄片處理手段。薄片圖像分析技術(shù)能夠幫助我們脫離笨重的顯微鏡限制來分析目標巖石的礦物組分、沉積以及成巖等相關(guān)特性,這對于油藏分析與研究都具有十分重要作用。然而圖像一旦被拍攝,分辨率就被固定了,這使得薄片圖像普遍存在大視域(field of view,FOV)與分辨率的矛盾問題。對大視域圖像進行局部放大細節(jié)研究時(圖1a),圖像分辨率常常較低,圖像中紋理以及組分邊緣等細節(jié)信息基本全部丟失(圖1b)。若僅拍攝局部高清圖像又會丟失圖中的大視域信息(圖1c)。因此怎樣得到更加高分辨率的大視域薄片圖像,成為目前亟需解決的問題。針對以上問題,本論文在頁巖儲層的薄片圖像分析中引入超分辨率(super-resolution,SR)技術(shù),嘗試解決薄片圖像研究中面臨的視域與分辨率的矛盾問題。
圖1 薄片圖像存在的視域與分辨率矛盾問題Fig.1 Thin section images showing an either FOV (field of view)or resolution dilemmaa.大視域圖像; b.圖像a中局部放大的圖像; c.小視域圖像
SR屬于數(shù)據(jù)增強技術(shù)范疇,其研究領(lǐng)域大多數(shù)都集中于圖像分割、分類與識別等領(lǐng)域[1-6],油藏方面的數(shù)據(jù)增強技術(shù)仍然屬于較為新穎的研究方向,Li Z[7]與 Wang Y D[8]通過超分辨率技術(shù)來提高CT掃描數(shù)字巖心數(shù)據(jù)的分辨率,Ye Liu[9]對鑄體薄片圖像的超分辨率技術(shù)進行深入研究與對比并提出基于感知的超分辨率損失函數(shù)。
超分辨率圖像數(shù)據(jù)增強技術(shù)作為一項新興的圖像增強技術(shù),在2016年由Chao Dong[10]引入深度學(xué)習(xí)領(lǐng)域,提出超分辨率生成對抗網(wǎng)絡(luò)(super-resolution convolutional neural network,SRCNN)的方法,隨后大量的新方法不斷涌現(xiàn)。諸如快速超分辨率卷積網(wǎng)絡(luò)[11](fast super-resolution CNN,FSRCNN)、超深超分辨率[12](very deep super-resolution,VDSR )、寬激活深度超分辨率[13](wide activation deep super-resolution,WDSR)等方法都取得了很好的超分辨率效果。尤其Christian Lediget 等人[14]提出的超分辨率生成對抗網(wǎng)絡(luò)(super-resolution generative adversarial network,SRGAN)技術(shù)將生成對抗網(wǎng)絡(luò)(generative adversarial networks,GAN)引入到超分辨率領(lǐng)域,并使用基于感知的損失函數(shù)使超分辨率后的圖像越來越逼真。
近年來,超分辨率研究開始向著無監(jiān)督、模型加速以及更大尺度的圖像分辨率增強領(lǐng)域發(fā)展[15-16]。而目前關(guān)于超分辨率技術(shù)在油藏與地質(zhì)領(lǐng)域的應(yīng)用成果較少,還處于起步階段。不過站在地質(zhì)油藏圖像分析與研究角度上,超分辨率技術(shù)具有廣闊的應(yīng)用前景。分辨率是所有圖像與數(shù)據(jù)分析、研究的基礎(chǔ),不僅僅是薄片領(lǐng)域,在掃描電鏡、數(shù)字巖心甚至電成像測井與聲成像測井等方面,都可以起到增強其數(shù)據(jù)質(zhì)量的效果。提高目標對象的分辨率,對于后續(xù)的圖像分割、組分智能識別以及孔隙分析等領(lǐng)域應(yīng)用,都能夠起到增強其數(shù)據(jù)基礎(chǔ),進而提高其所有處理與分析的質(zhì)量與效果。
雖然超分辨率技術(shù)已經(jīng)得到了廣泛應(yīng)用,但對于地質(zhì)與油藏等專業(yè)領(lǐng)域中具有特殊含義的圖像,仍然缺乏測試分析與深入探討。并且從超分辨率技術(shù)機理角度來說,提高分辨率的本質(zhì)是一種多解反演問題,因此其中蘊含的多解性問題仍然需要深入分析與評價,這也對超分辨率模型設(shè)計以及數(shù)據(jù)集組成提出更高的要求。此外,在常規(guī)圖像的超分辨率中,我們的注意力大多集中于像素級別的分辨率提升,并不關(guān)心一些諸如紋理等由多個像素所組合的高頻信息。而在油藏地質(zhì)類圖像中,這些高頻信息往往是我們所關(guān)心的重心,因為這些信息中包含了更具有地質(zhì)意義的紋理、組分邊界、小尺度礦物以及孔隙組分等數(shù)據(jù)。這個目標上的差異性使得常規(guī)超分辨率方法會將圖像增強的更加平滑,但同時丟失更多高頻信息以獲取更小的像素差異,因此它們并不適用于地質(zhì)油藏數(shù)據(jù),這也是本文需要解決的一個主要問題。
綜上所述,針對目前薄片圖像研究中所面臨的大視域和高分辨率的矛盾問題,以及高頻信息丟失問題。本文將基于感知損失的圖像SR技術(shù)引入到頁巖儲層表征之中,搭建基于GAN網(wǎng)絡(luò)與頁巖儲層損失函數(shù)的SR模型,以求對較低分辨率、較大視域的圖像增強其分辨率,獲得同時擁有較大視域與更高分辨率的圖像數(shù)據(jù),基于感知的損失函數(shù)改變了傳統(tǒng)基于像素的損失策略,從本質(zhì)上解決高頻信息丟失問題。
頁巖薄片圖像超分辨率工作流程可以分為兩個主要步驟。首先需要對超分辨率模型進行訓(xùn)練,采用的數(shù)據(jù)集會將高分辨率(HR,high-resolution)的原始圖像降采樣為低分辨率(LR,low-resolution)圖像,形成一個HR圖配一個對應(yīng)的LR圖的圖像對。其具體流程如圖2所示。
1) 數(shù)據(jù)對中的LR圖像會作為輸入?yún)?shù)發(fā)送到生成網(wǎng)絡(luò)模型中,生成網(wǎng)絡(luò)會生成一個合成的SR圖像。
2) SR圖像再和HR圖像共同被輸入到判別網(wǎng)絡(luò)中,由判別網(wǎng)絡(luò)來學(xué)習(xí)兩者的差別。
3) 判別網(wǎng)絡(luò)判別的結(jié)果傳遞到感知損失中,通過生成網(wǎng)絡(luò)的損失值決定如何進一步調(diào)整生成網(wǎng)絡(luò)以獲得更好的SR結(jié)果。同時還會通過判別網(wǎng)絡(luò)的損失值調(diào)整判別網(wǎng)絡(luò),實現(xiàn)兩個網(wǎng)絡(luò)的競爭學(xué)習(xí)。
不斷重復(fù)步驟1)—步驟3),實現(xiàn)訓(xùn)練的迭代進程,不斷對生成網(wǎng)絡(luò)以及判別網(wǎng)絡(luò)進行優(yōu)化學(xué)習(xí),使得生成網(wǎng)絡(luò)生成的SR圖像越來越像真實的HR圖像。當模型迭代訓(xùn)練結(jié)束后,第二步便可以根據(jù)任意給定的LR圖像,輸入生成網(wǎng)絡(luò)中,從而生成對應(yīng)的SR圖像,這步測試流程在測試集中實現(xiàn)。
超分辨率模型分為生成網(wǎng)絡(luò)、判別網(wǎng)絡(luò)以及損失函數(shù)3個部分。生成網(wǎng)絡(luò)模型(圖3)選擇一個B殘差塊作為主體,借用了SRCNN的整體結(jié)構(gòu),并加入了一個批歸一化(Batch normalization)層。
判別網(wǎng)絡(luò)采用Alexia Jolicoeur-Martineau[17]所提出的相對平均GAN(relativistic average GAN,RaGAN),判別網(wǎng)絡(luò)的作用是判斷輸入SR圖像與真實HR圖像之間差別,RaGAN使用了一個隨機的假圖像來幫助預(yù)測SR的相對概率,因此命名為RaGAN,其結(jié)構(gòu)如圖4所示。當生成網(wǎng)絡(luò)生成的SR與對應(yīng)的HR輸入到判別網(wǎng)絡(luò)中后,RaGAN模型便可通過公式(1)得到其判別網(wǎng)絡(luò)的輸出值:
圖2 基于感知的生成對抗網(wǎng)絡(luò)的超分辨率訓(xùn)練流程Fig.2 Overview of the perceptual GAN-based SR training process
DRa(xr,xf)=σ(C(xr)-Exf[C(xf)])
(1)
本文所使用的頁巖薄片圖像數(shù)據(jù)來自于鄂爾多斯盆地延長油田區(qū)塊,為中生界三疊系延長組7段,主要巖性有:含泥粉砂巖、含泥細粉砂巖、含泥長石細砂巖、含泥粉細長石巖屑砂巖、泥質(zhì)粉砂巖、砂質(zhì)泥巖以及泥巖等。圖像數(shù)據(jù)共768張,原始分辨率為2 048×2 048,并未進行任何前處理。其中692個樣本圖像組成訓(xùn)練數(shù)據(jù)集,另外76張組成測試集合,在整個訓(xùn)練過程中不進行計算,僅在訓(xùn)練結(jié)束后用于驗證模型在訓(xùn)練集外的泛化性。低分辨率LR圖像使用Bicubic算法將原始HR高清圖像降采樣為512×512,一方面可以取得LR與HR的圖像對用于訓(xùn)練,另一方面也方便定量評價SR圖像的真實性。訓(xùn)練所用硬件環(huán)境為一塊Nvidia P100 GPU顯卡,深度學(xué)習(xí)框架使用Pytorch,Tensorflow以及Keras。
為選取最佳的訓(xùn)練參數(shù),在小節(jié)中對批尺寸(Batch size)大小進行了定量分析。測試中用到了特征相似性檢索(feature similarity index,FSIM)[18]以及梯度幅度相似性偏差(gradient magnitude similarity deviation,GMSD)[19]兩個圖像質(zhì)量評價指標,兩個參數(shù)都為基于感知評價指標,與人的主觀評價更為接近。
隨著Batch size增加,訓(xùn)練時間有所減少,在Batch size為5時,F(xiàn)SIM參數(shù)的均值以及方差都最小,證明訓(xùn)練集中數(shù)據(jù)樣本的超分辨率效果相對均勻(表1)。同時,GMSD也取得次佳的GMSD評價指標。對比圖5中的實際數(shù)據(jù)測試結(jié)果,對真實圖(圖5a),Batch size為5時(圖5b)在礦物邊界、裂縫以及孔隙形態(tài)上取得了相對較佳的超分辨率效果。因此在本次實驗中,我們設(shè)計Batch size為5。
圖3 生成模型結(jié)構(gòu)Fig.3 Architecture of generative model
圖4 判別網(wǎng)絡(luò)模型結(jié)構(gòu)Fig.4 Architecture of discriminator network
表1 Batch size分析Table 1 Batch size analysis
對于迭代次數(shù)參數(shù)的選擇,如圖6所示,在對比了實際圖像的測試結(jié)果后,可以發(fā)現(xiàn)在迭代次數(shù)超過2 500后,圖像增強效果在主觀角度已經(jīng)基本穩(wěn)定,而圖像色調(diào)仍然存在一定變化,尤其圖6a與圖6b,具有明顯的色調(diào)差異。而從圖6c,6d以及6e 3幅圖中可以看出,迭代次數(shù)達到5萬次前,相關(guān)色調(diào)變化基本就已經(jīng)穩(wěn)定。因此為了取得更加穩(wěn)定的訓(xùn)練結(jié)果,在本次實驗測試中將訓(xùn)練迭代次數(shù)設(shè)置為5萬次。
經(jīng)過5萬次訓(xùn)練迭代,在訓(xùn)練集中取得如圖7的結(jié)果。從人眼主觀判斷角度對比圖7中的微觀部分,與HR圖像對比,僅在局部存在一定差異,整體上顯著提升了LR圖像的分辨率。對比局部細節(jié),SR圖像與HR圖像僅在微孔、喉道的狹窄處存在細微的差別。表明SR恢復(fù)的效果較為明顯。分析表明超分辨率技術(shù)在頁巖薄片圖像中效果較好,一方面原因在于圖像原始分辨率就較高,已經(jīng)超過了顯微鏡的放大倍數(shù),因此在降采樣時高頻信息損失并不多,這為超分辨模型恢復(fù)高頻信息帶來了更大優(yōu)勢。另一方面頁巖儲層大多巖石礦物紋理較為單一,減少了模型學(xué)習(xí)的難度。從圖像對比來看,站在主觀的觀察方面,本文提出的SR方法能夠穩(wěn)定增強頁巖薄片圖像的分辨率,顯著提高數(shù)據(jù)質(zhì)量。
圖5 5萬次訓(xùn)練迭代的Batch size 分析對比Fig.5 SR results with different batch size after 50 000 iteration training of SRGANa.原始圖像.;b. Batch size 5;c. Batch size 10;d. Batch size 20;e. Batch size 30
圖6 訓(xùn)練迭代次數(shù)對于測試集超分辨率效果影響Fig.6 Effect of iteration times on the quality of super-resolution images of test dataseta. 2 500次迭代;b. 5 000次迭代;c. 10 000次迭代;d. 20 000次迭代;e. 50 000次迭代
本文還選取了幾項常用的圖像質(zhì)量分析(image quality analysis,IQA)方法對SR圖像的質(zhì)量進行定量分析與對比(表2)。為了能夠在同一緯度進行對比,首先將LR圖像通過Bicubic方法采樣到與HR和SR同樣分辨率尺度。IQA方法選擇了峰值信噪比(peak signal to noise ratio,PSNR),結(jié)構(gòu)相似度指數(shù)(structural similarity index,SSIM),圖像均方誤差(image mean-squared error,IMMSE),FSIM,GMSD以及自然圖像質(zhì)量評估器(natural image quality evaluator,NIQE),從多個方面SR結(jié)果的準確性進行評估。
從PNSR角度來看,SR結(jié)果遠高出Bicubic,達到了31.9,證明從像素角度SR超分辨率方法基本可以將大多數(shù)細節(jié)恢復(fù)出來。SSIM和IMMSE也表現(xiàn)出近似的效果,其中SSIM達到0.98,證明SR圖像已經(jīng)趨于真實圖像。FSIM和GMSD從高頻信息和紋理角度評價圖像超分辨率質(zhì)量,F(xiàn)SIM達到0.991,高于Bicubic處理結(jié)果;而GMSD數(shù)值越小恢復(fù)效果越好,SR圖像數(shù)據(jù)僅為Bicubic數(shù)據(jù)的五分之一。從高頻信息以及紋理角度來說,SR也能夠提供遠超LR圖像的效果。NIQE是一項衡量圖像真實性的參數(shù),與GMSD類似,其數(shù)值越小圖像越具真實性,從數(shù)據(jù)上來看,SR圖像也較LR圖像更具真實性。
圖7 500 000次迭代后SR對比與分析Fig.7 SR results after 500 000 times of iteration traininga. #0879測試集樣本LR圖像;b. #0879測試集樣本SR圖像;c.#0879測試集樣本HR圖像;d. a圖的局部放大對比;e. b圖的局部放大對比;f. c圖的局部放大對比;g. #5155測試集樣本LR圖像;h. #5155測試集樣本SR圖像;i. #5155測試集樣本HR圖像;j. #2234測試集樣本LR圖像;k. #2234測試集樣本SR圖像;l. #2234測試集樣本HR圖像
表2 SR和Bicubic結(jié)果的IQA對比Table 2 IQA analysis of the SR and Bicubic results
從人眼主觀判斷以及IQA定量分析兩個角度來說,本文提出的SR模型方法都表現(xiàn)出較好的效果。具體表現(xiàn)在:無論是代表像素的PNSR等參數(shù),還是代表高頻信息的FSIM與GMSD,又或是表征圖像真實性的NIQE,SR都取得了較LR圖像好很多的結(jié)果。從方差來看,大多數(shù)參數(shù)的方差都在10%左右,證明在整個76張測試集數(shù)據(jù)中,SR取得的效果相對較為穩(wěn)定,也能夠進一步證明算法在訓(xùn)練集外的泛化性。只有GMSD方差略大,一方面是由于薄片圖像中紋理信息較多,對GMSD較易產(chǎn)生影響,另外GMSD數(shù)值較低,也會使得相對誤差較大一些。
對SR模型在訓(xùn)練過程中的表現(xiàn)進行定量測試,目的是為了展示SR在迭代過程中正確的收斂方向,用測試能夠表現(xiàn)出模型的泛化能力以及能夠避免過擬合狀態(tài)的能力。本文在定量測試的IQA參數(shù)中選擇了PSNR,FSIM,GMSD以及NIQE,分析的迭代次數(shù)為5 000次,圖8中4幅圖橫坐標均為迭代次數(shù),縱坐標為對應(yīng)的IQA數(shù)值,其具體分析結(jié)果如下。
PSNR代表了傳統(tǒng)的IQA參數(shù),用于從像素角度表征原始HR圖像與SR圖像之間的差異性。從圖8a中可以看出,PSNR參數(shù)在最初的50次迭代后已達到了20,在1 000次迭代時就已經(jīng)基本穩(wěn)定在30左右,證明了SR模型在訓(xùn)練過程中能夠穩(wěn)定提升所輸出圖像在像素角度的質(zhì)量。
FSIM與GMSD能夠從紋理角度展示出HR與SR圖像在微觀細節(jié)上的差異,這兩種IQA方法都脫離了像素級的評價,與人眼主觀觀測的效果更為相符。從圖8b與8c中可以看出,與PSNR不同,F(xiàn)SIM與GMSD基本在500次迭代左右就已經(jīng)達到相對較好的結(jié)果,這也與實際圖像的人眼觀測結(jié)果相符。該結(jié)果一方面證明FSIM與GMSD都是更適合于評價頁巖儲層薄片超分辨率效果的IQA方法;另一方面,也能夠表示SR模型在訓(xùn)練過程中在紋理與邊緣細節(jié)領(lǐng)域更快的收斂,整個參數(shù)分布也更為穩(wěn)定,波動較小。
最后一個NIQE則是一個無參考IQA方法,本文選取的NIQE模型為一個已經(jīng)通過公開的風(fēng)景照數(shù)據(jù)集預(yù)訓(xùn)練評價模型,因此圖8d中并未出現(xiàn)明顯的收斂特征,僅是隨著迭代次數(shù)增加,參數(shù)波動開始減小,證明常規(guī)的無參考IQA方法難以直接應(yīng)用于頁巖儲層薄片圖像評價中。
圖8 SR模型訓(xùn)練過程IQA定量分析Fig.8 IQA quantitative analysis through the SR model training processa.PSNR;b.FSIM;c.GMSD;d.NIQE
1) 本文針對頁巖儲層薄片圖像大視域和高分辨率不可兼得的難題,提出了一種超分辨率SR模型方法。
該模型采用生成對抗網(wǎng)絡(luò)作為基本架構(gòu),同時在生成模型中利用稠密塊(dense block),在判別模型中加入了RaGAN以及感知損失函數(shù),實現(xiàn)頁巖儲層薄片圖像提高超分辨率的效果。
2) 本次研究測試集選擇了768幅實際數(shù)據(jù),定量測試SR的具體效果,該模型訓(xùn)練完成后,可以用于具有近似巖石組分的頁巖儲層圖像,并不受數(shù)據(jù)集限制。
3) 從人眼主觀判斷以及IQA定量分析來看,SR圖像提供了更豐富的微觀細節(jié)信息,頁巖薄片圖像分辨率增強效果更好。各項IQA參數(shù)表明SR模型在整個訓(xùn)練中具有較好的穩(wěn)定收斂的特性,也能夠進一步表征SR模型的泛化性與抗過擬合性。