国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學(xué)習(xí)與數(shù)據(jù)增強(qiáng)技術(shù)的小樣本巖石分類

2022-02-03 05:28:38張超群易云恒周文娟秦唯棟劉文武
科學(xué)技術(shù)與工程 2022年33期
關(guān)鍵詞:池化層巖石準(zhǔn)確率

張超群, 易云恒, 周文娟, 秦唯棟, 劉文武

(1.廣西民族大學(xué)人工智能學(xué)院, 南寧 530006; 2. 廣西混雜計(jì)算與集成電路設(shè)計(jì)分析重點(diǎn)實(shí)驗(yàn)室, 南寧 530006)

巖石分類是油氣勘探中一項(xiàng)十分重要的環(huán)節(jié),主要根據(jù)巖石的物理性質(zhì)對(duì)巖石進(jìn)行分類。例如,文獻(xiàn)[1]應(yīng)用取心井巖心樣品的孔隙度、滲透率和毛管壓力數(shù)據(jù),采用Winland R35方法劃分碳酸鹽巖油藏的巖石類型。

這類方法需要專業(yè)設(shè)備來(lái)獲取數(shù)據(jù),往往難以大規(guī)模普及。隨著人工智能技術(shù)的發(fā)展,越來(lái)越多的行業(yè)開(kāi)始采用該技術(shù)來(lái)提高工作效率,其中,機(jī)器學(xué)習(xí)作為人工智能的一個(gè)分支也被應(yīng)用于巖石分類,可分為兩種應(yīng)用方法:一種方法是利用機(jī)器學(xué)習(xí)中的白盒模型包括支持向量機(jī)(support vector machine,SVM)、鄰近算法(K-nearest neighbor,KNN)等方法構(gòu)建模型進(jìn)行分類,例如,文獻(xiàn)[2]將巖石的光譜數(shù)據(jù)收集起來(lái),用機(jī)器學(xué)習(xí)的白盒模型進(jìn)行分類,這類方法也需要獲取巖石數(shù)據(jù)進(jìn)行數(shù)理統(tǒng)計(jì),仍需專業(yè)設(shè)備,較難獲取所需的數(shù)據(jù);另一種方法是利用機(jī)器學(xué)習(xí)中的黑盒模型,即使用深度學(xué)習(xí)等算法構(gòu)建模型進(jìn)行分類。近些年,隨著深度學(xué)習(xí)技術(shù)的發(fā)展,利用深度學(xué)習(xí)技術(shù)分類的研究逐漸增多。

深度學(xué)習(xí)是指多層神經(jīng)網(wǎng)絡(luò)上運(yùn)用各種機(jī)器學(xué)習(xí)算法解決圖像分類等問(wèn)題的算法集合。利用最新的深度學(xué)習(xí)技術(shù),可以構(gòu)造一個(gè)卷積神經(jīng)網(wǎng)絡(luò)[3](convolutional neural network,CNN)進(jìn)行監(jiān)督學(xué)習(xí)來(lái)完成巖石分類。這類方法往往只需要一些巖石圖像與一臺(tái)計(jì)算機(jī)就能對(duì)巖石進(jìn)行分類,其效率和總體準(zhǔn)確率較高。例如,文獻(xiàn)[4]建立一個(gè)巖石圖像集分析的深度學(xué)習(xí)遷移模型,運(yùn)用遷移學(xué)習(xí)方法實(shí)現(xiàn)對(duì)少量巖石巖性進(jìn)行自動(dòng)識(shí)別與分類,該文獻(xiàn)中每類巖石的樣本數(shù)量都超過(guò)150張,但需分類的巖石種類僅有三種,而且不同類型巖石的特征明顯;文獻(xiàn)[5]從各大高校、博物館、實(shí)驗(yàn)室中獲得大量的訓(xùn)練數(shù)據(jù),該文獻(xiàn)將GhostNet的Ghost Bottlenecks模塊和InceptionV4的Inception-A模塊進(jìn)行整合和調(diào)優(yōu),提出一種新型的巖石分類模型,該模型雖然效果較好,但是所用數(shù)據(jù)集質(zhì)量極佳,該模型在訓(xùn)練數(shù)據(jù)稀少的情況下能否達(dá)到可觀的效果,猶未可知;文獻(xiàn)[6]為了提高巖石分類的速度,將巖石分類與目標(biāo)檢測(cè)結(jié)合,提出一種利用FastRCNN與YoLo進(jìn)行巖石分類識(shí)別的方法,利用目標(biāo)檢測(cè)方法進(jìn)行圖像識(shí)別的優(yōu)點(diǎn)是速度特別快,并且可以在同一張圖片中識(shí)別出不同類型的巖石,但是,其缺點(diǎn)是該類模型對(duì)于巖石識(shí)別的準(zhǔn)確度無(wú)法保證,這是因?yàn)槟繕?biāo)檢測(cè)先要檢測(cè)對(duì)象位置,再去進(jìn)行圖像分類,其任務(wù)要比單純的圖像分類多一個(gè)步驟,如果要速度快,則勢(shì)必會(huì)降低準(zhǔn)確度,并且目標(biāo)檢測(cè)模型的數(shù)據(jù)集難以標(biāo)注與處理;文獻(xiàn)[7]在微觀上對(duì)巖石樣本進(jìn)行特征提取,該文獻(xiàn)同樣使用深度學(xué)習(xí)技術(shù),并比較常用圖像分類模型在給定條件下對(duì)巖石分類的效果,所提出的方法效果很好且具有一定可行性,但是在大多數(shù)場(chǎng)景下,人們并沒(méi)有可以提取巖石微觀信息的設(shè)備,所以該方法應(yīng)用領(lǐng)域還是相對(duì)有限。由這些文獻(xiàn)可知,深度學(xué)習(xí)技術(shù)在巖石樣本識(shí)別中具有廣泛的應(yīng)用,但也存在一些不足。例如,在文獻(xiàn)中很少討論樣本數(shù)據(jù)不足,樣本數(shù)據(jù)質(zhì)量差的情況[4],也沒(méi)有考慮到樣本數(shù)據(jù)標(biāo)注與處理的困難[6]。

實(shí)際上,由于巖石的采樣及制成巖石樣本圖像費(fèi)時(shí)費(fèi)力,多數(shù)情況下能獲取到的巖石樣本圖像非常有限。對(duì)于樣本數(shù)據(jù)不足的圖像分類問(wèn)題,可以采用一些商業(yè)模型如EasyDL[8]等或者是采用GAN網(wǎng)絡(luò)[9]、遷移學(xué)習(xí)[10]來(lái)解決,這些方法都具有一定的可行性,但也存在不足。例如,EasyDL等作為一種閉源的商業(yè)模型,其安全性與可靠性難以保證。從現(xiàn)實(shí)邏輯來(lái)看,采取GAN網(wǎng)絡(luò)生成數(shù)據(jù)方法對(duì)于巖石樣本這類復(fù)雜數(shù)據(jù)而言充滿了不確定性,而單純使用遷移學(xué)習(xí),不一定能很好地解決樣本數(shù)據(jù)不足的圖像分類問(wèn)題[11]。因此,為了有效解決該問(wèn)題,可以考慮用數(shù)據(jù)增強(qiáng)技術(shù)來(lái)獲得更多的樣本,這樣可以最大化地利用已有的數(shù)據(jù)集提供的信息。

為了在訓(xùn)練樣本數(shù)據(jù)量不足的情況下取得一個(gè)擁有較好效果的模型,文獻(xiàn)[12]研究多種數(shù)據(jù)增強(qiáng)方式對(duì)于圖像識(shí)別效果的影響,該文獻(xiàn)指出,在小樣本情況下,數(shù)據(jù)增強(qiáng)具有一定的實(shí)踐價(jià)值。文獻(xiàn)[13]將數(shù)據(jù)增強(qiáng)技術(shù)運(yùn)用于蘋(píng)果花檢測(cè)任務(wù),通過(guò)實(shí)驗(yàn)證明在實(shí)際應(yīng)用中數(shù)據(jù)增強(qiáng)技術(shù)往往能帶來(lái)更好的效果;文獻(xiàn)[14]利用大樣本血清紅外光譜數(shù)據(jù)結(jié)合深度學(xué)習(xí)算法來(lái)診斷甲狀腺功能是否異常,該文獻(xiàn)同樣使用數(shù)據(jù)增強(qiáng)技術(shù)提高模型的效果。這些研究充分說(shuō)明在數(shù)據(jù)量不足的情況下,利用數(shù)據(jù)增強(qiáng)技術(shù)也能有不錯(cuò)的效果。

據(jù)悉,目前鮮有利用深度學(xué)習(xí)技術(shù)對(duì)巖石進(jìn)行分類的研究,現(xiàn)有的研究?jī)H采用遷移學(xué)習(xí)且?guī)r石種類較少,但樣本圖像相對(duì)較充裕[4]或是有專門(mén)的機(jī)構(gòu)提供大量數(shù)據(jù)[5]??紤]到大多數(shù)情況下很難獲得足夠的巖石樣本,而在小樣本分類中,數(shù)據(jù)增強(qiáng)的本質(zhì)就是將一份數(shù)據(jù)通過(guò)不同的變換生成多份數(shù)據(jù)[12],其實(shí)現(xiàn)簡(jiǎn)單高效。鑒于以上原因,現(xiàn)主要結(jié)合深度學(xué)習(xí)、數(shù)據(jù)增強(qiáng)技術(shù)來(lái)設(shè)計(jì)一個(gè)新的簡(jiǎn)單實(shí)用的MyNet模型,以實(shí)現(xiàn)對(duì)少量或有限的巖石樣本圖像進(jìn)行巖石分類。

1 人工神經(jīng)網(wǎng)絡(luò)

1.1 全連接神經(jīng)網(wǎng)絡(luò)

全連接神經(jīng)網(wǎng)絡(luò)[15]是一種基礎(chǔ)的神經(jīng)網(wǎng)絡(luò),主要分為輸入層、隱層和輸出層。其中,輸入層與輸出層均為單層,而隱層可有多層,隱層越多代表該全連接神經(jīng)網(wǎng)絡(luò)的深度越深。全連接神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示,其每一層由N個(gè)神經(jīng)元組成,每個(gè)神經(jīng)元與下一層所有神經(jīng)元相連接,全連接由此得名。

圖1 全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Fully connected neural network structure

將運(yùn)用全連接神經(jīng)網(wǎng)絡(luò)對(duì)圖像特征數(shù)據(jù)進(jìn)行分類。

1.2 卷積神經(jīng)網(wǎng)絡(luò)

CNN是區(qū)別于全連接神經(jīng)網(wǎng)絡(luò)的另一種神經(jīng)網(wǎng)絡(luò),常用于圖像識(shí)別與分類,在圖像分類中,CNN常被用于特征提取,特征提取主要是將卷積層與池化層結(jié)合,以將圖像的特征用較低的維度表示。

卷積層進(jìn)行卷積操作[16]。卷積操作是CNN的基礎(chǔ),如圖2所示,一個(gè)大矩陣與一個(gè)小矩陣進(jìn)行卷積操作,小矩陣依次覆蓋大矩陣,對(duì)于覆蓋的區(qū)域,將小矩陣與大矩陣被覆蓋的區(qū)域?qū)?yīng)元素相乘后再相加得到新元素,小矩陣依次移動(dòng),依次覆蓋,依次計(jì)算得到不同的元素組成新矩陣。

圖2 卷積操作示意圖Fig.2 Schematic diagram of convolution operation

池化層[17]是卷積神經(jīng)網(wǎng)絡(luò)的一個(gè)很重要的結(jié)構(gòu),其主要作用是除去圖像中的冗余信息,并對(duì)圖像進(jìn)行降維。它分為最大池化層與平均池化層。在圖像分類中,最大池化層應(yīng)用極其廣泛,其原理如圖3所示,將圖像分為若干個(gè)區(qū)域,輸出每個(gè)區(qū)域最大的塊,再將這些塊組成新圖像。最大池化層與圖像壓縮類似,即以犧牲背景信息為代價(jià)來(lái)保留圖像特征。對(duì)于不需要保留背景的圖像分類與識(shí)別常采用最大池化層。

圖3 最大池化層示意圖Fig.3 Schematic diagram of maximum pool level

若需要保留全部信息,則通常采用平均池化層。當(dāng)網(wǎng)絡(luò)深度較大時(shí),圖像數(shù)據(jù)的維度往往較小,而較少的維度應(yīng)包含較多的信息,因此,此時(shí)不適合使用最大池化層,應(yīng)使用平均池化層。平均池化層原理如圖4所示,將圖像分為若干個(gè)區(qū)域,然后取每個(gè)區(qū)域的平均值。

圖4 平均池化層示意圖Fig.4 Schematic diagram of average pool layer

1.3 殘差網(wǎng)絡(luò)

殘差網(wǎng)絡(luò)是不同于經(jīng)典網(wǎng)絡(luò)的另一種卷積神經(jīng)網(wǎng)絡(luò),其核心單元是殘差塊[18]。在經(jīng)典網(wǎng)絡(luò)中,隨著網(wǎng)絡(luò)深度的加深,該網(wǎng)絡(luò)訓(xùn)練效果會(huì)變好,但如果繼續(xù)加深網(wǎng)絡(luò),則訓(xùn)練效果會(huì)變差。因此,若需擬合一個(gè)x→x恒等映射,則可以設(shè)計(jì)一個(gè)淺層經(jīng)典網(wǎng)絡(luò)進(jìn)行擬合。若想擬合性能更好,則可以加大網(wǎng)絡(luò)深度,即設(shè)計(jì)多個(gè)淺層經(jīng)典網(wǎng)絡(luò)堆疊成一個(gè)深度經(jīng)典網(wǎng)絡(luò)。事實(shí)上,隨著網(wǎng)絡(luò)深度的加深,該網(wǎng)絡(luò)對(duì)x→x恒等映射的擬合效果反而變差[19]。但是,殘差網(wǎng)絡(luò)能完美地解決該問(wèn)題。殘差網(wǎng)絡(luò)由多個(gè)殘差塊組成,原始?xì)埐顗K結(jié)構(gòu)如圖5所示,對(duì)于每輸入一個(gè)x,經(jīng)過(guò)中間的卷積操作后輸出f(x),將x+f(x)作為下一個(gè)殘差塊的輸入。

圖5 原始?xì)埐顗K示意圖Fig.5 Schematic diagram of original residual block

2 實(shí)驗(yàn)設(shè)計(jì)與實(shí)現(xiàn)

2.1 實(shí)現(xiàn)環(huán)境

PaddlePaddle[20]是百度的一款深度學(xué)習(xí)框架,類似于Tensorflow。PaddlePaddle的支持與服務(wù)均在國(guó)內(nèi),可快捷訪問(wèn),且其官網(wǎng)有大量可用的視頻資料。因此,將學(xué)習(xí)框架確定為PaddelPaddle 2.0 +CUDA11??紤]到Python是PaddlePaddle唯一支持的語(yǔ)言,故選用Python 3.7作為實(shí)驗(yàn)編程語(yǔ)言。所有的實(shí)驗(yàn)均在英偉達(dá)RTX8000顯卡、Intel(R) Xeon(R) Silver 4114 CPU、128 G內(nèi)存、Ubuntu20.04操作系統(tǒng)的服務(wù)器上運(yùn)行。

2.2 總體流程

實(shí)驗(yàn)用的巖石樣本均來(lái)源于2021年第九屆“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽官網(wǎng)提供的B題(巖石圖像的智能分類)數(shù)據(jù)(https://www.tipdm.org:10010/#/competition/1354705811842195456/question)??傮w上,巖石樣本圖像的分辨率較高,雖然樣本數(shù)量較少,但每張圖像包含大量信息,可使用數(shù)據(jù)增強(qiáng)的方法對(duì)這些圖像進(jìn)行處理。在圖像分類中,常用的預(yù)訓(xùn)練模型有ResNet50[21]、Vgg16[22]。ResNet50是一個(gè)殘差網(wǎng)絡(luò)模型,包含49個(gè)卷積層和1個(gè)全連接層,它具有殘差網(wǎng)絡(luò)的性質(zhì)。Vgg16是一個(gè)大型經(jīng)典網(wǎng)絡(luò)模型,由13個(gè)卷積層和3個(gè)全連接層組成。主流的深度學(xué)習(xí)框架都提供ResNet50、Vgg16的預(yù)訓(xùn)練模型參數(shù)。ResNet50、Vgg16均可以通過(guò)加載其預(yù)訓(xùn)練模型參數(shù)來(lái)實(shí)現(xiàn)遷移學(xué)習(xí),也可以用隨機(jī)參數(shù)來(lái)進(jìn)行無(wú)遷移學(xué)習(xí)的訓(xùn)練和測(cè)試。因此,分別用加載、不加載預(yù)訓(xùn)練參數(shù)的ResNet50、Vgg16與所設(shè)計(jì)的模型MyNet進(jìn)行性能對(duì)比,以驗(yàn)證MyNet的可行性與實(shí)用性。實(shí)驗(yàn)總體流程如圖6所示。

圖6 實(shí)驗(yàn)總體流程Fig.6 Overall experimental process

2.3 數(shù)據(jù)預(yù)處理

數(shù)據(jù)預(yù)處理包括數(shù)據(jù)增強(qiáng)與數(shù)據(jù)標(biāo)準(zhǔn)化。當(dāng)訓(xùn)練集不足時(shí),進(jìn)行數(shù)據(jù)增強(qiáng)是很有必要的。實(shí)現(xiàn)數(shù)據(jù)增強(qiáng)的方法有旋轉(zhuǎn)與翻轉(zhuǎn)圖像,改變圖像對(duì)比度與亮度,改變圖像顏色,裁剪圖像,增加噪聲等操作。在使用數(shù)據(jù)增強(qiáng)方法時(shí),要考慮實(shí)際應(yīng)用情況選擇合適的操作。在巖石識(shí)別中,如果變換樣本圖像的顏色,則會(huì)對(duì)分類結(jié)果產(chǎn)生極大影響,可能得到錯(cuò)誤的結(jié)果,因此使用數(shù)據(jù)增強(qiáng)時(shí)不能變換圖像的顏色。

實(shí)驗(yàn)中用到的巖石樣本有兩種:一種是3 000×4 000高分辨率的圖像,整張圖像都是巖石,如圖7(a)所示,這種圖像有288張;另一種是2 000×2 000低分辨率的圖像,其背景有其他非巖石的信息,如圖7(b)所示,這種圖像有26張。用Python調(diào)用PaddlePaddle的API將288張高分辨率圖像沿水平垂直方向等分裁剪為16份,將26張低分辨率圖像沿著水平垂直方向等分切割為4份,這樣處理可得到內(nèi)容互不重復(fù)的4 712張圖像,增加樣本數(shù)據(jù),有利于MyNet、ResNet50、Vgg16模型更準(zhǔn)確地學(xué)習(xí)到圖像中的特征。

圖7 巖石樣本圖像Fig.7 Rock sample images

由于樣本數(shù)據(jù)量較少,為最大限度利用數(shù)據(jù)進(jìn)行訓(xùn)練,取4 564張圖像作為訓(xùn)練集數(shù)據(jù),剩余148張作為測(cè)試集數(shù)據(jù),主要考慮能充分利用現(xiàn)有的數(shù)據(jù)獲得更優(yōu)的模型,即涉及如何合理分配數(shù)據(jù)集。若測(cè)試集過(guò)多,則訓(xùn)練集就過(guò)少,理論上訓(xùn)練集的數(shù)量應(yīng)該遠(yuǎn)大于測(cè)試集的數(shù)量;但是測(cè)試集的數(shù)量也不能過(guò)少,測(cè)試集的數(shù)量過(guò)少會(huì)導(dǎo)致測(cè)試結(jié)果沒(méi)有說(shuō)服力。據(jù)此,根據(jù)經(jīng)驗(yàn)判斷和反復(fù)實(shí)驗(yàn),采取148張圖片作為測(cè)試集已足以測(cè)試模型的性能,而應(yīng)留更多的剩余的4 564張圖像作為訓(xùn)練集可更充分地訓(xùn)練模型,以此獲得更好的模型。接著,將單張圖像上下左右旋轉(zhuǎn)和水平垂直翻轉(zhuǎn),可使1張圖像變成6張。因此,訓(xùn)練集與測(cè)試集的圖像數(shù)量比原有的樣本數(shù)量均擴(kuò)充了6倍,這樣處理有助于模型對(duì)同一圖像的特征學(xué)習(xí)更全面,避免出現(xiàn)圖像倒轉(zhuǎn)后模型無(wú)法識(shí)別的情況。旋轉(zhuǎn)與翻轉(zhuǎn)的操作可直接由CPU實(shí)時(shí)運(yùn)算,即在內(nèi)存中對(duì)圖像進(jìn)行旋轉(zhuǎn)操作后直接用模型運(yùn)算該圖像,從而大大提高運(yùn)算速度。

最后,在將圖像導(dǎo)入模型前,需要統(tǒng)一圖像的大小為500×500。訓(xùn)練時(shí)將圖像進(jìn)行標(biāo)準(zhǔn)化,每個(gè)通道的均值與標(biāo)準(zhǔn)差值均設(shè)為127.5,該值是紅綠藍(lán)(red-green-blue,RGB)通道值的中間值。將圖像進(jìn)行標(biāo)準(zhǔn)化有利于模型的收斂[23]。

2.4 MyNet模型

新設(shè)計(jì)的模型MyNet采用經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),MyNet由8層卷積層、6層池化層、4層全連接層組成。MyNet的實(shí)現(xiàn)結(jié)構(gòu)如表1所示。由于MyNet默認(rèn)輸入的圖片大小為500×500,圖片有R、G、B 3個(gè)通道,模型輸入張量的形狀為[Batch_size, 3, 500, 500],其中,Batch_size是指圖片的批次數(shù)。表1顯示當(dāng)Batch_size為1時(shí),模型各層之間的輸入輸出情況。

表1 MyNet的實(shí)現(xiàn)結(jié)構(gòu)Table 1 Implementation structure of MyNet

巖石分類通常是抓住巖石的一個(gè)或多個(gè)特征進(jìn)行分類,而最大池化層能提取圖像的某一特征,因此在模型運(yùn)算的前期選擇最大池化層。模型運(yùn)算后期,由于此時(shí)單個(gè)點(diǎn)包含的信息較多,則選用平均池化層將圖像中的多個(gè)信息融合為一個(gè)信息。卷積與池化操作結(jié)束后,圖像被扁平化為一維數(shù)據(jù)。數(shù)據(jù)經(jīng)過(guò)全連接層與Dropout層的一系列處理,得出分類結(jié)果。

將MyNet、ResNet50、Vgg16三種模型的網(wǎng)絡(luò)結(jié)構(gòu)涉及的參數(shù)個(gè)數(shù)統(tǒng)計(jì)于表2,加粗?jǐn)?shù)據(jù)為最小值,其中,訓(xùn)練參數(shù)量是指模型中參與訓(xùn)練的參數(shù)總量,未訓(xùn)練參數(shù)量代表模型中不參與訓(xùn)練的參數(shù)總量,總參數(shù)量表示模型的參數(shù)總量。由表2可知,ResNet50與Vgg16涉及的參數(shù)眾多,結(jié)構(gòu)復(fù)雜,而MyNet的結(jié)構(gòu)相對(duì)更精簡(jiǎn)。

表2 三種模型的參數(shù)量統(tǒng)計(jì)Table 2 Statistics of parameters of three models

3 實(shí)驗(yàn)結(jié)果與分析

3.1 模型訓(xùn)練

為了測(cè)試MyNet的性能,分別訓(xùn)練MyNet、ResNet50、Vgg16并比較訓(xùn)練結(jié)果。ResNet50、Vgg16各自分兩種情況訓(xùn)練:一種是加載預(yù)訓(xùn)練參數(shù)模型,即先進(jìn)行遷移學(xué)習(xí),后進(jìn)行訓(xùn)練;另一種是不加載預(yù)訓(xùn)練參數(shù)模型,即無(wú)遷移學(xué)習(xí),直接進(jìn)行訓(xùn)練,以此驗(yàn)證ResNet50、Vgg16兩種模型有無(wú)遷移學(xué)習(xí)的效果。因MyNet是新建的模型,不存在加載預(yù)訓(xùn)練參數(shù)的情況。訓(xùn)練完成后將測(cè)試集分別導(dǎo)入各種模型中以獲取測(cè)試結(jié)果。

以No_ResNet50、Yes_ResNet50分別表示不加載、加載預(yù)訓(xùn)練參數(shù)的ResNet50,以No_Vgg16、Yes_Vgg16分別代表不加載、加載預(yù)訓(xùn)練參數(shù)的Vgg16。

根據(jù)電腦顯存與內(nèi)存資源的大小,設(shè)置所有模型訓(xùn)練的批次數(shù)(Batch_size)為50,迭代次數(shù)(epochs)為20。在測(cè)試中,各模型訓(xùn)練時(shí)的損失函數(shù)值(loss)、分類準(zhǔn)確率(acc)的變化曲線分別如圖8、圖9所示,其中,不同顏色的曲線代表用不同模型訓(xùn)練得到的結(jié)果。

由圖8、圖9可知,在同等訓(xùn)練條件下,所有模型在訓(xùn)練過(guò)程中l(wèi)oss逐漸減小,而acc逐漸上升。MyNet的loss收斂較慢,但與其他模型相差不大。MyNet訓(xùn)練時(shí)acc上升也較緩,當(dāng)更新次數(shù)近7 000次時(shí)獲得的acc約為70%,而最高的Yes_ResNet50最終得到的acc接近在90%。但總體來(lái)看,在訓(xùn)練過(guò)程中MyNet的準(zhǔn)確率與其他模型差別并不大。

圖8 5種模型訓(xùn)練損失函數(shù)值的變化曲線Fig.8 Variation curve of the training loss function value of five models

圖9 5種模型訓(xùn)練分類準(zhǔn)確率的變化曲線Fig.9 Variation curve of training classification accuracy of five models

3.2 模型測(cè)試

實(shí)驗(yàn)用的巖石樣本的數(shù)據(jù)集共有7類,分別用數(shù)字1~7表示其類別。采用數(shù)據(jù)增強(qiáng)技術(shù)得到的888張圖像作為模型的測(cè)試集。圖10~圖14是根據(jù)MyNet、ResNet50、Vgg16的測(cè)試結(jié)果繪制的混淆矩陣,其中1~7代表圖像類別,0代表其他類別,可以看出各模型對(duì)于哪類圖像在分類時(shí)容易混淆。例如,在圖12中,真實(shí)類為1類的圖像有60張被測(cè)試為1類,這代表測(cè)試結(jié)果正確,而有12張1類圖像被誤測(cè)為2類,這代表測(cè)試結(jié)果錯(cuò)誤。表3是5種模型測(cè)試888張1~7類巖石樣本圖像的分類準(zhǔn)確情況的統(tǒng)計(jì)結(jié)果,加粗?jǐn)?shù)據(jù)為最優(yōu)值,其數(shù)據(jù)是由圖10~圖14中5種模型分別測(cè)試7類圖像分類正確的數(shù)量分別除以各類圖像總數(shù)計(jì)算得到,準(zhǔn)確量為5種模型分別測(cè)試7類圖像分類正確的數(shù)量總和,而準(zhǔn)確率是各模型的準(zhǔn)確量除以總巖石樣本數(shù)888,它能體現(xiàn)模型總體分類的效果。

圖10 MyNet測(cè)試混淆矩陣Fig.10 Test confusion matrix of MyNet

圖11 No_ResNet50測(cè)試混淆矩陣Fig.11 Test confusion matrix of No_Resnet50

圖12 Yes_ResNet50測(cè)試混淆矩陣Fig.12 Test confusion matrix of Yes_Resnet50

圖13 No_Vgg16測(cè)試混淆矩陣Fig.13 Test confusion matrix of No_Vgg16

圖14 Yes_Vgg16測(cè)試混淆矩陣Fig.14 Test confusion matrix of Yes_Vgg16

由圖10和表3可知,MyNet對(duì)888張巖石樣本圖像能正確測(cè)試出671張樣本的類別,其總體測(cè)試準(zhǔn)確率為75.6%,均優(yōu)于比較模型,其中,對(duì)2、3、4類圖像的測(cè)試準(zhǔn)確率較高,都在88%以上,對(duì)5類圖像的測(cè)試準(zhǔn)確率為72%,對(duì)6、7類圖像的測(cè)試準(zhǔn)確率均接近70%,對(duì)于1類圖像的測(cè)試準(zhǔn)確率為50%。MyNet對(duì)1、5、6、7類圖像容易混淆,例如,1類圖像有30張被誤測(cè)為7類,12張被誤測(cè)為2類;5類圖像有25張被誤測(cè)為7類;6類圖像有25張被誤測(cè)為4類;7類圖像有41張被誤測(cè)為1類。后期應(yīng)加強(qiáng)1、5、6、7類圖像的訓(xùn)練。

表3 5種模型測(cè)試888張巖石樣本圖像的分類結(jié)果Table 3 Classification results of 888 rock sample images tested by five models

由圖11和表3可知,No_ResNet50對(duì)888張巖石樣本圖像能正確測(cè)試出645張樣本的類別,其總體測(cè)試準(zhǔn)確率為72.6%,其中,對(duì)2、3類圖像的測(cè)試準(zhǔn)確率很高,都在99%以上,對(duì)5、7類圖像的測(cè)試準(zhǔn)確率均在80%以上,對(duì)6、4類圖像的測(cè)試準(zhǔn)確率分別為76%、61%,但對(duì)1類圖像的測(cè)試準(zhǔn)確率僅為28%。No_ResNet50對(duì)1、4、5、6、7類圖像容易混淆,例如,1類圖像有78張被誤測(cè)為7類;4類圖像有37張被誤測(cè)為1類,28張被誤測(cè)為7類;5類圖像有18張被誤測(cè)為3類;6類圖像有23張被誤測(cè)為7類;7類圖像有22張被誤測(cè)為1類,14張被誤測(cè)為6類。后期應(yīng)加強(qiáng)1、4、5、6、7類圖像的訓(xùn)練。

由圖12和表3可知,Yes_ResNet50對(duì)888張巖石樣本圖像能正確測(cè)試出658張樣本的類別,其總體測(cè)試準(zhǔn)確率為74.1%,其中,對(duì)1、2、3類圖像的測(cè)試準(zhǔn)確率較高,都在90%以上,對(duì)4、6類圖像的測(cè)試準(zhǔn)確率均在82%以上,對(duì)7類圖像的測(cè)試準(zhǔn)確率為63%,但對(duì)于5類圖像的測(cè)試準(zhǔn)確率僅為23%。Yes_ResNet50對(duì)4、5、7類圖像容易混淆,例如,4類圖像有28張被誤測(cè)為1類;5類圖像有43張被誤測(cè)為4類,21張被誤測(cè)為1類,20張被誤測(cè)為3類;7類圖像有33張被誤測(cè)為1類,16張被誤測(cè)為6類,14張被誤測(cè)為4類。后期應(yīng)加強(qiáng)4、5、7類圖像的訓(xùn)練。

由圖13和表3可知,No_Vgg16對(duì)888張巖石樣本圖像能正確測(cè)試出626張樣本的類別,其總體測(cè)試準(zhǔn)確率為70.5%,其中,對(duì)1、2、3、4類圖像的測(cè)試準(zhǔn)確率都在80%以上,對(duì)于5類圖像的測(cè)試準(zhǔn)確率為70%,但對(duì)6、7類圖像的測(cè)試準(zhǔn)確率均為48%。No_Vgg16對(duì)5、6、7類圖像容易混淆,例如,5類圖像有16張被誤測(cè)為3類,12張被誤測(cè)為1類;6類圖像有41張被誤測(cè)為7類;7類圖像有49張被誤測(cè)為1類,36張被誤測(cè)為4類。后期應(yīng)加強(qiáng)5、6、7類圖像的訓(xùn)練。

由圖14和表3可知,Yes_Vgg16對(duì)888張巖石樣本圖像能正確測(cè)試出633張樣本的類別,其總體測(cè)試準(zhǔn)確率為71.3%,其中,對(duì)2、3類圖像的測(cè)試準(zhǔn)確率較高,都在90%以上,對(duì)5、4類圖像的測(cè)試準(zhǔn)確率分別為76%、72%,對(duì)于1、6、7類圖像的測(cè)試準(zhǔn)確率為60%左右。Yes_Vgg16對(duì)1、4、6、7類圖像容易混淆,例如,1類圖像有23張被誤測(cè)為7類,16張被誤測(cè)為5類;4類圖像有25張被誤測(cè)為1類,23張被誤測(cè)為7類;7類圖像有46張被誤測(cè)為1類,15張被誤測(cè)為4類。后期應(yīng)加強(qiáng)1、4、6、7類圖像的訓(xùn)練。

是否加載預(yù)訓(xùn)練參數(shù)對(duì)ResNet50、Vgg16最終得到的測(cè)試效果有一定影響:兩種模型加載比不加載預(yù)訓(xùn)練參數(shù)進(jìn)行訓(xùn)練得到的總體測(cè)試準(zhǔn)確率均略有提升;若使用遷移學(xué)習(xí),即加載預(yù)訓(xùn)練參數(shù)后再進(jìn)行訓(xùn)練,ResNet50對(duì)第3、5、7類圖像的測(cè)試效果反而變差,Vgg16對(duì)第1、4類圖像的測(cè)試效果也略有下降。這是因?yàn)檫w移學(xué)習(xí)會(huì)把原先學(xué)習(xí)到的特征應(yīng)用于新數(shù)據(jù)進(jìn)行再次學(xué)習(xí)與識(shí)別,從而產(chǎn)生不同的結(jié)果。換言之,加載、不加載預(yù)訓(xùn)練參數(shù)的ResNet50、Vgg16的巖石分類測(cè)試結(jié)果因受有無(wú)遷移學(xué)習(xí)影響會(huì)有所不同。但是,MyNet比有無(wú)遷移學(xué)習(xí)的ResNet50、Vgg16的總體分類效果都好,也相對(duì)更穩(wěn)定。

4 結(jié)論

巖石識(shí)別與分類是油氣勘探的一項(xiàng)關(guān)鍵步驟,而利用深度學(xué)習(xí)技術(shù)能極大提高其工作效率。在樣本數(shù)量不足時(shí),采用數(shù)據(jù)增強(qiáng)的方式能較好地完成分類任務(wù)。在經(jīng)過(guò)數(shù)據(jù)增強(qiáng)后,MyNet模型的測(cè)試平均準(zhǔn)確率達(dá)到75.6%,其效果略優(yōu)于Yes_ResNet50(74.1%)、Yes_Vgg16(71.3%)、No_ResNet50(72.6%)、No_Vgg16(70.5%)。由此可見(jiàn),MyNet模型利用數(shù)據(jù)增強(qiáng)技術(shù)能很好地完成巖石分類任務(wù),尤其是對(duì)第4類,MyNet(88%)比Yes_ResNet50(61%)、Yes_Vgg16(82%)、No_ResNet50(83%)、No_Vgg16(72%)的分類效果都要好;對(duì)于第3類的分類,MyNet(99%)與No_ResNet50(99%)并列第一,比Yes_ResNet50(94%)、Yes_Vgg16(90%)、No_Vgg16(88%)略高。對(duì)第5、6類的分類也處于中等水平,對(duì)于第5類的分類排名順序?yàn)镹o_ResNet50(83%)、Yes_Vgg16(76%)、MyNet(72%)、No_Vgg16(70%)、Yes_ResNet50(23%),對(duì)于第6類的分類排名順序?yàn)閅es_Vgg16(83%)、Yes_ResNet50(76%)、MyNet(67%)、No_ResNet50(48%)、No_Vgg16(58%);對(duì)于第7類的分類也處于中上等水平,其排名順序?yàn)镹o_ResNet50(80%)、MyNet(69%)、Yes_ResNet50(63%)、Yes_Vgg16(60%)、No_Vgg16(48%);對(duì)第2類的分類,各模型的分類準(zhǔn)確率均在90%以上。

雖然MyNet在小樣本的巖石分類中總體表現(xiàn)不錯(cuò),但是對(duì)某些類別的巖石的分類效果不是很好,例如,對(duì)第1類的識(shí)別準(zhǔn)確率僅有50%。如果能加大數(shù)據(jù)量和加強(qiáng)訓(xùn)練,那么整個(gè)模型的效果會(huì)更好。下一步的研究方向主要是改進(jìn)并拓展MyNet的實(shí)際應(yīng)用領(lǐng)域。

猜你喜歡
池化層巖石準(zhǔn)確率
卷積神經(jīng)網(wǎng)絡(luò)模型研究分析*
第五章 巖石小專家
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
3深源巖石
基于卷積神經(jīng)網(wǎng)絡(luò)的紙幣分類與點(diǎn)鈔
一種叫做煤炭的巖石
基于深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的人體行為識(shí)別研究
科技傳播(2020年6期)2020-05-25 11:07:46
海藻與巖石之間
淳化县| 嘉鱼县| 遂平县| 长宁区| 佛教| 城口县| 苏尼特左旗| 顺昌县| 门源| 黄梅县| 玉树县| 尉氏县| 温宿县| 荥阳市| 乐山市| 黑水县| 黄大仙区| 阿尔山市| 桐庐县| 珲春市| 浑源县| 南郑县| 乌鲁木齐市| 宣恩县| 浏阳市| 闻喜县| 潼南县| 南漳县| 金山区| 罗城| 汪清县| 济宁市| 金平| 库伦旗| 梨树县| 利津县| 丘北县| 新源县| 拉萨市| 蕉岭县| 白玉县|