国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于遷移學(xué)習(xí)的全巖光片有機(jī)顯微組分識(shí)別與定量
——以皖涇地1井下三疊統(tǒng)殷坑組烴源巖為例

2022-02-06 04:47曾烴詳劉巖文志剛樊云鵬馮興強(qiáng)季長(zhǎng)軍史旭凱高變變武遠(yuǎn)哲
科學(xué)技術(shù)與工程 2022年35期
關(guān)鍵詞:煤巖定量組分

曾烴詳, 劉巖*, 文志剛, 樊云鵬, 馮興強(qiáng), 季長(zhǎng)軍, 史旭凱, 高變變, 武遠(yuǎn)哲

(1.油氣地球化學(xué)與環(huán)境湖北省重點(diǎn)實(shí)驗(yàn)室/長(zhǎng)江大學(xué)資源與環(huán)境學(xué)院, 武漢 430100;2.中國(guó)地質(zhì)科學(xué)院地質(zhì)力學(xué)研究所, 北京 100081)

有機(jī)巖石學(xué)是在孢粉學(xué)和煤巖學(xué)基礎(chǔ)上發(fā)展起來的一門邊緣學(xué)科,主要研究地質(zhì)體中沉積有機(jī)質(zhì)的成因、產(chǎn)狀、組成、結(jié)構(gòu)和演化等內(nèi)容[1-2]。為了客觀評(píng)價(jià)烴源巖,其常用手段是應(yīng)用光學(xué)顯微鏡交替使用反射光和熒光觀察研究全巖樣品,對(duì)觀察到的組分進(jìn)行識(shí)別、判斷及統(tǒng)計(jì)等分析,結(jié)果可用于評(píng)價(jià)烴源巖的有機(jī)質(zhì)類型、豐度和成熟度等,還能進(jìn)一步獲取生烴母質(zhì)、烴類生成和運(yùn)移等信息[3],而在煤巖學(xué)方面,顯微組分不僅關(guān)系到煤層氣的生成、賦存、儲(chǔ)集因素,還有利于煤巖的高效利用,因此,實(shí)現(xiàn)顯微組分的自動(dòng)識(shí)別與定量具有重要意義[4-6]。隨著深度學(xué)習(xí)在圖像識(shí)別領(lǐng)域發(fā)展,前人運(yùn)用機(jī)器學(xué)習(xí)技術(shù)研究煤巖顯微組分,取得了良好的成果[7-9]。目前,已有不少學(xué)者嘗試采用深度學(xué)習(xí)技術(shù)、卷積神經(jīng)網(wǎng)絡(luò)對(duì)煤巖顯微組分圖像進(jìn)行分析與識(shí)別,Wang等[10]對(duì)比經(jīng)典的深度學(xué)習(xí)分割模型,認(rèn)為DeepLab V3+網(wǎng)絡(luò)在中國(guó)煙煤顯微組分的識(shí)別具有更高的分割效率和精度。Lei等[11]通過改進(jìn)U-net網(wǎng)絡(luò),采用ResNet50主干網(wǎng)絡(luò),引入了注意力機(jī)制,實(shí)現(xiàn)對(duì)煤巖顯微組分的精確識(shí)別。雖然烴源巖的顯微組分識(shí)別方法與煤巖相似,但在客觀上,沉積巖中的顯微組分遠(yuǎn)比煤巖中復(fù)雜,煤巖的顯微組分和烴源巖中的組分有著明顯區(qū)別,主要體現(xiàn)在組分的類型、組成、形態(tài)及富集程度上,且不同豐度、類型及成熟度的烴源巖在顯微組分構(gòu)成上也存在差異。此外,根據(jù)中國(guó)石油天然氣行業(yè)標(biāo)準(zhǔn)《全巖光片顯微組分鑒定及統(tǒng)計(jì)方法》[12],對(duì)顯微組分定量計(jì)算是判斷烴源巖類型指數(shù)的重要指標(biāo)之一。謝小敏等[13-14]利用Leica QWin_V3圖像處理軟件,通過對(duì)圖片中的特殊區(qū)域進(jìn)行選取,實(shí)現(xiàn)對(duì)全巖有機(jī)顯微組分進(jìn)行客觀、快速的統(tǒng)計(jì)定量分析,并在近年來應(yīng)用了綜合礦物分析儀(TESCAN integrated mineral analyzer, TIMA)技術(shù)分析了Alum頁巖的有機(jī)質(zhì)和黃鐵礦粒度分布特征,為石油地質(zhì)研究者在快捷定量描述有機(jī)巖提供了新的思路。

現(xiàn)階段,全巖樣品或干酪根的有機(jī)顯微組分識(shí)別大多仍然采用人工觀測(cè)識(shí)別的方式,然后通過計(jì)數(shù)器或使用軟件對(duì)顯微組分進(jìn)行統(tǒng)計(jì)定量,這類方式存在自動(dòng)化程度低、結(jié)果易受主觀因素影響、人工工作量大等問題。針對(duì)這些問題,現(xiàn)以皖涇地1井下三疊統(tǒng)殷坑組烴源巖為研究樣品,設(shè)計(jì)了一個(gè)基于遷移學(xué)習(xí)的鏡下全巖光片顯微組分識(shí)別與定量實(shí)驗(yàn),實(shí)現(xiàn)對(duì)全巖顯微組分的自動(dòng)分類識(shí)別,再利用OpenCV圖像處理庫對(duì)組分分類結(jié)果進(jìn)行定量統(tǒng)計(jì),以期改進(jìn)全巖光片顯微組分的識(shí)別方式,提高顯微組分定量統(tǒng)計(jì)的效率。

1 分析框架

U-net網(wǎng)絡(luò)在醫(yī)學(xué)圖像語義分割應(yīng)用上有著出色的表現(xiàn),顯微組分的識(shí)別需求也同樣類似于醫(yī)學(xué)圖像語義分割,不僅需要識(shí)別物體類別,也需要精準(zhǔn)分割定位。由于烴源巖的多樣性和復(fù)雜性,很難使用一種全面且統(tǒng)一的顯微組分分類方案來描述烴源巖特征[15],因此,烴源巖顯微組分的語義分割模型應(yīng)當(dāng)針對(duì)研究區(qū)顯微組分的整體特點(diǎn)來構(gòu)建相應(yīng)的訓(xùn)練數(shù)據(jù)集,以使模型能夠?qū)ν愋蜔N源巖的組分識(shí)別有更好的泛化能力。在構(gòu)建數(shù)據(jù)集的初期,往往缺乏足夠的訓(xùn)練數(shù)據(jù),而遷移學(xué)習(xí)是一種有效的模型改進(jìn)方式,能夠在小樣本的情況下獲得比較好的訓(xùn)練結(jié)果,從而提升模型的訓(xùn)練精度和魯棒性能[16-17]。本次實(shí)驗(yàn)首先在細(xì)胞分割數(shù)據(jù)集下完成U-net預(yù)訓(xùn)練網(wǎng)絡(luò)的訓(xùn)練,然后將研究區(qū)不同深度的全巖光片顯微組分圖像作為訓(xùn)練數(shù)據(jù)遷移到預(yù)訓(xùn)練網(wǎng)絡(luò)模型中微調(diào)模型的權(quán)值,獲得新的分類模型,進(jìn)而實(shí)現(xiàn)對(duì)顯微組分圖像中不同組分的識(shí)別與分類,最后通過OpenCV圖像處理庫進(jìn)行定量處理,實(shí)驗(yàn)總體框架如圖1所示。

2 實(shí)驗(yàn)樣品

近年來,中國(guó)地質(zhì)科學(xué)院地質(zhì)力學(xué)研究所在皖南地區(qū)實(shí)施的皖涇地1井在下三疊統(tǒng)殷坑組鉆遇良好的油氣顯示,引起了研究人員的重視。皖涇地1井殷坑組主要有灰?guī)r和泥巖、泥灰?guī)r不等厚互層, 總有機(jī)碳(total organic carbon, TOC)含量介于0.031%~1.7%,研究區(qū)顯微組分特征如圖2所示,有機(jī)顯微組分主要以殼質(zhì)組為主,多發(fā)育富氫強(qiáng)熒光的殼屑體,殼屑體在紫外光激發(fā)下發(fā)黃色、橙色熒光,反射光下呈紅褐色。發(fā)育少量鏡質(zhì)體和惰屑體,熒光下均呈黑色。不同深度的樣品,黃鐵礦的數(shù)量差異較大,且形態(tài)復(fù)雜,有無規(guī)則、塊狀分布的黃鐵礦、成團(tuán)聚集的草莓狀黃鐵礦以及零散分布的近圓形的草莓狀黃鐵礦。

圖1 實(shí)驗(yàn)總體框架示意圖Fig.1 Schematic diagram of the overall framework of the experiment

3 實(shí)驗(yàn)預(yù)處理

3.1 圖像采集

本次研究采用的數(shù)據(jù)集分為研究區(qū)數(shù)據(jù)集與預(yù)訓(xùn)練數(shù)據(jù)集兩部分。在構(gòu)建研究區(qū)數(shù)據(jù)集的過程中,為了提高模型對(duì)皖涇地1井殷坑組樣品的適應(yīng)能力,挑選不同深度、TOC的樣品來進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)樣品信息如表1所示。將樣品沿垂直層理切割至合適大小,用環(huán)氧樹脂粘結(jié)固化,再經(jīng)粗磨、細(xì)磨、拋光處理形成塊光片,將光片置于光學(xué)顯微鏡下,配制50倍油浸物鏡拍攝,交替切換反射光與熒光光源采集圖像。在采集研究區(qū)數(shù)據(jù)集圖像的過程中,注意保持拍攝像機(jī)的曝光值、感光度、白平衡等攝影參數(shù)一致,收集高質(zhì)量的訓(xùn)練樣本圖片。將采集到的圖像各分為訓(xùn)練集、驗(yàn)證集、測(cè)試集。訓(xùn)練集用于匹配一系列參數(shù)來建立一個(gè)分類器,用于模型擬合數(shù)據(jù)樣本;驗(yàn)證集用于調(diào)整模型的超參數(shù)和用于對(duì)模型的能力進(jìn)行初步評(píng)估;測(cè)試集則用于檢驗(yàn)最終選擇最優(yōu)的模型的性能[18]。研究區(qū)數(shù)據(jù)集包含反射光及熒光圖像共490張,其中訓(xùn)練集樣本272張,驗(yàn)證集68張,5個(gè)測(cè)試集樣品各30張圖像作為測(cè)試集樣本,所有樣本圖像分辨率均為2 752像素×2 208像素。預(yù)訓(xùn)練數(shù)據(jù)集采用生物醫(yī)學(xué)成像國(guó)際研討會(huì)(International Symposium on Biomedical Imaging, ISBI)醫(yī)學(xué)細(xì)胞分割數(shù)據(jù)集[19],該數(shù)據(jù)集包含訓(xùn)練圖像及標(biāo)注圖像各30張,分辨率為512像素×512像素。

3.2 圖像的人工標(biāo)注

由經(jīng)驗(yàn)豐富的有機(jī)巖石學(xué)學(xué)者使用LabelMe圖像標(biāo)注工具[20]對(duì)圖像的各種顯微組分進(jìn)行組分的鑒定及標(biāo)注。根據(jù)研究區(qū)樣品的整體特點(diǎn),標(biāo)注分別為鏡質(zhì)體、惰屑體、殼屑體、草莓狀黃鐵礦,對(duì)部分特征難以分辨及實(shí)驗(yàn)中不關(guān)注的組分劃分為礦物背景,如圖3所示。值得注意的是,不同深度的樣品,黃鐵礦的數(shù)量和形態(tài)差異較大,故本次實(shí)驗(yàn)統(tǒng)一選取顆粒狀明顯的圓形草莓狀黃鐵礦進(jìn)行標(biāo)注。

表1 實(shí)驗(yàn)樣品信息Table 1 Experimental samples information

3.3 圖像數(shù)據(jù)增強(qiáng)

訓(xùn)練集和驗(yàn)證集圖像的質(zhì)量及數(shù)量都會(huì)對(duì)語義分割模型的性能和泛化能力產(chǎn)生巨大的影響[21-22]。為了防止模型過擬合,增強(qiáng)模型的訓(xùn)練精度和泛化能力,對(duì)研究區(qū)訓(xùn)練樣本圖像進(jìn)行了更改亮度、翻轉(zhuǎn)、旋轉(zhuǎn)、小范圍局部變形等圖像數(shù)據(jù)增強(qiáng)處理(圖4),對(duì)應(yīng)的標(biāo)注圖像也隨著形狀及位置的改變而改變,對(duì)部分過度增強(qiáng)或信息缺失的圖像進(jìn)行剔除。增強(qiáng)后,訓(xùn)練集擴(kuò)充至4 563幅,驗(yàn)證集擴(kuò)充至1 141幅。

圖3 人工標(biāo)注示意圖Fig.3 Schematic diagram of manual annotation

4 實(shí)驗(yàn)設(shè)計(jì)

4.1 模型構(gòu)建

圖4 數(shù)據(jù)增強(qiáng)處理示例Fig.4 Examples of data enhancement processing

U-net是一個(gè)優(yōu)秀的語義分割模型,其包含編解碼兩個(gè)模塊,整體呈“U”形,通過跳躍連接的方式將特征圖進(jìn)行維度拼接,能夠保留更多的位置和特征信息,在小樣本數(shù)據(jù)集上分割性能優(yōu)于其他網(wǎng)絡(luò)結(jié)構(gòu),且適合處理小尺寸物體的語義分割任務(wù)[23]。U-net左半部分為主干特提取網(wǎng)絡(luò),右半部分則是對(duì)提取的特征進(jìn)行上采樣。視覺幾何組(visual geometry group, VGG)網(wǎng)絡(luò)[24]結(jié)構(gòu)清晰,特征提取能力強(qiáng),在遷移學(xué)習(xí)中的泛化性能好。如王培珍[25]在ImageNet數(shù)據(jù)集基礎(chǔ)上,使用VGG16網(wǎng)絡(luò)完成預(yù)訓(xùn)練網(wǎng)絡(luò)訓(xùn)練,結(jié)合煤巖殼質(zhì)組樣本對(duì)模型進(jìn)行遷移學(xué)習(xí),實(shí)現(xiàn)對(duì)殼質(zhì)組組分高精度的識(shí)別。本次實(shí)驗(yàn)采用VGG16網(wǎng)絡(luò)的作為U-net模型的主干特征提取網(wǎng)絡(luò),該網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)如圖5所示。

實(shí)驗(yàn)采用的服務(wù)器硬件配置為: CPU 12th Gen Intel(R) Core(TM) i5-12600K 3.69 GHz; GPU Nvidia GeForce GTX 3060; Ram 32.0 GB; 軟件環(huán)境為Windows 10 1909,使用Python語言開發(fā),將Tensorflow作為本次深度學(xué)習(xí)框架,版本為2.4.1。在訓(xùn)練過程中,采用Adam優(yōu)化器進(jìn)行優(yōu)化,采用Dice_loss損失函數(shù)完成網(wǎng)絡(luò)參數(shù)優(yōu)化,模型訓(xùn)練參數(shù)如表2所示。

圖5 特征提取網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)Fig.5 Feature extraction network structure and parameters

表2 模型訓(xùn)練參數(shù)Table 2 Model training parameters

Dice系數(shù)是一種集合相似度度量函數(shù),一般用于計(jì)算兩個(gè)樣本的相似度[26]。Dice_loss損失函數(shù)計(jì)算公式為

(1)

式(1)中:X為預(yù)測(cè)值像素點(diǎn)集;Y為真實(shí)值像素點(diǎn)集。

將研究區(qū)數(shù)據(jù)集遷移到以細(xì)胞分割數(shù)據(jù)集完成的預(yù)訓(xùn)練網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,模型的損失值曲線如圖6所示。隨著訓(xùn)練次數(shù)的增加,模型的損失值在不斷減小,在經(jīng)過100個(gè)批處理后,loss值基本穩(wěn)定,模型訓(xùn)練結(jié)束。

4.2 評(píng)價(jià)指標(biāo)

如表3所示,混淆矩陣指在表中分別統(tǒng)計(jì)分類模型的分類情況,用于計(jì)算各種分類評(píng)價(jià)指標(biāo)。

像素準(zhǔn)確率(pixel accuracy, PA)、平均交并比(mean intersection over union, MIoU)、類別平均像素準(zhǔn)確率(mean pixel accuracy, MPA)是語義分割模型中中常用的評(píng)價(jià)指標(biāo),其中PA表示預(yù)測(cè)類別正確的像素?cái)?shù)占總像素?cái)?shù)的比例,表達(dá)式為

表3 混淆矩陣

圖6 模型損失值曲線Fig.6 Loss curves of the model

圖7 分類結(jié)果比較Fig.7 Comparison of classification results

(2)

MIoU表示每一類預(yù)測(cè)的結(jié)果和真實(shí)值的交集與并集的比值,求和再平均的結(jié)果,表達(dá)式為

(3)

MPA表示對(duì)每一個(gè)類被正確分類像素?cái)?shù)的比例累加求平均,表達(dá)式為

(4)

式中:C為總的分類數(shù);M為樣品總數(shù);pmii表示第m個(gè)樣本中屬于TP的像素?cái)?shù);pmij、pmji分別表示第m個(gè)樣本中屬于FN和FP的像素。

4.3 實(shí)驗(yàn)結(jié)果

將5個(gè)樣品,共150張測(cè)試集照片輸入實(shí)驗(yàn)?zāi)P椭羞M(jìn)行自動(dòng)識(shí)別與分類,模型各評(píng)價(jià)指標(biāo)如表4、表5所示,部分分類結(jié)果對(duì)比如圖7所示??梢钥吹?,測(cè)試集在本次模型中的PA、MIoU和MPA分別為99.74%、74.81%和84.65%,表明實(shí)驗(yàn)?zāi)P陀兄^好的分割性能。從混淆矩陣的分類識(shí)別概率表可以看出,整體分類識(shí)別率為84.32%,其中鏡質(zhì)體和惰屑體識(shí)別率較高,分別有89%和87.7%。因?yàn)樵诜瓷涔庵校@兩種組分邊緣界限清晰,與周圍的礦物背景有很好的區(qū)分,且整體光照明亮,成像效果好,因此識(shí)別率高。殼屑體識(shí)別率為79.2%,稍低于鏡質(zhì)體和惰屑體,一方面,殼屑體在較多透明礦物的環(huán)境下,熒光會(huì)產(chǎn)生不同程度的光暈;另一方面,熒光下,光源較暗,攝像機(jī)成像受一定影響,二者均會(huì)影響識(shí)別結(jié)果。草莓狀黃鐵礦識(shí)別率較低,僅有65.8%,主要因?yàn)樵谘芯繀^(qū)的樣品中,草莓狀黃鐵礦多聚集成團(tuán),容易出現(xiàn)粘連現(xiàn)象,且塊礦類似,會(huì)干擾草莓狀黃鐵礦的識(shí)別。此外,被錯(cuò)誤劃分或漏分的組分都大多劃分到礦物背景,說明模型對(duì)顯微組分具有良好的特征提取能力。

表4 模型的分類性能評(píng)價(jià)Table 4 Classification performance evaluation of the model

表5 各顯微組分分類識(shí)別混淆矩陣Table 5 Confusion matrix of maceral groups

4.4 定量統(tǒng)計(jì)

OpenCV作為功能強(qiáng)大的開源計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)軟件庫,實(shí)現(xiàn)了很多圖像處理和計(jì)算機(jī)視覺等方面的算法,能有效提升開發(fā)效率[27]。首先,對(duì)每一類組分的分類結(jié)果進(jìn)行二值化處理,調(diào)用OpenCV中的findContours( )函數(shù)建立目標(biāo)輪廓,然后調(diào)用contourArea( )函數(shù)對(duì)每一類組分遍歷統(tǒng)計(jì)輪廓的面積并調(diào)用putText()和rectangle()將每個(gè)組分所占像素直觀地顯示在圖片上,最后在后臺(tái)統(tǒng)計(jì)各組分像素與總視域圖像像素的比值作為顯微組分的百分比,定量統(tǒng)計(jì)流程如圖8所示。通過該方法統(tǒng)計(jì)5個(gè)測(cè)試樣品的分類結(jié)果,與人工數(shù)點(diǎn)統(tǒng)計(jì)定量的結(jié)果相比,結(jié)果如圖9所示,可以看出,本次通過OpenCV統(tǒng)計(jì)的有機(jī)顯微組分體積百分比與人工數(shù)點(diǎn)統(tǒng)計(jì)的結(jié)果相近。150張測(cè)試集圖像從模型分類識(shí)別到定量?jī)H需數(shù)分鐘,相較于傳統(tǒng)人工識(shí)別與定量,顯著地提高了工作效率。

5 結(jié)論

以皖涇地1井下三疊統(tǒng)殷坑組烴源巖的顯微組分圖像為訓(xùn)練數(shù)據(jù),構(gòu)建了一個(gè)基于遷移學(xué)習(xí)的U-net語義分割模型,開展了顯微組分自動(dòng)識(shí)別與定量的實(shí)驗(yàn),得出以下結(jié)論。

(1)以VGG16網(wǎng)絡(luò)為主干特征提取網(wǎng)絡(luò),構(gòu)建基于遷移學(xué)習(xí)的U-net語義分割模型,該模型對(duì)研究區(qū)數(shù)據(jù)集的整體分類識(shí)別準(zhǔn)確率可達(dá)84.32%,可以滿足對(duì)研究區(qū)烴源巖顯微組分進(jìn)行客觀、快速地識(shí)別與分類的需求。

(2)OpenCV圖像處理庫能對(duì)模型的分類結(jié)果的進(jìn)行定量統(tǒng)計(jì),統(tǒng)計(jì)結(jié)果與人工數(shù)點(diǎn)統(tǒng)計(jì)結(jié)果較為接近。

(3)本方法可以在短時(shí)間內(nèi)對(duì)大量與研究區(qū)類型相近的烴源巖顯微組分圖片進(jìn)行識(shí)別和定量,減輕了人工工作量,顯著提高了全巖光片的鑒定及統(tǒng)計(jì)效率。

圖8 定量統(tǒng)計(jì)流程示意圖Fig.8 Schematic diagram of quantitative statistical process

猜你喜歡
煤巖定量組分
組分分發(fā)管理系統(tǒng)在天然氣計(jì)量的應(yīng)用
玉華礦4-2煤裂隙煤巖三軸壓縮破壞機(jī)理研究
基于CT掃描的不同圍壓下煤巖裂隙損傷特性研究
顯微定量法鑒別林下山參和園參
當(dāng)歸和歐當(dāng)歸的定性與定量鑒別
黑順片不同組分對(duì)正常小鼠的急性毒性
金雀花中黃酮苷類組分鑒定及2種成分測(cè)定
10 種中藥制劑中柴胡的定量測(cè)定
基于測(cè)井響應(yīng)評(píng)價(jià)煤巖結(jié)構(gòu)特征
慢性HBV感染不同狀態(tài)下HBsAg定量的臨床意義
鲁山县| 寿阳县| 玉林市| 修文县| 张家界市| 即墨市| 宿州市| 独山县| 灵石县| 宁明县| 文昌市| 大洼县| 舞钢市| 北海市| 南阳市| 桂林市| 团风县| 嘉祥县| 苍山县| 寿阳县| 都安| 芦山县| 文昌市| 丰城市| 西安市| 太和县| 车险| 桂林市| 铁岭县| 昭觉县| 兴城市| 渭南市| 通河县| 从化市| 石嘴山市| 佳木斯市| 景宁| 留坝县| 红原县| 鹤壁市| 洛宁县|