楊彪,馬亦驥,倪瑞璞,蘇森濤,曾德明
(1.昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,云南 昆明 650500;2.昆明理工大學(xué) 云南省人工智能重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650500;3.昆明理工大學(xué) 非常規(guī)冶金教育部重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650093)
在礦物的勘探過程中,快速、準(zhǔn)確地對(duì)礦產(chǎn)資源進(jìn)行識(shí)別,判明其品質(zhì)和儲(chǔ)量,決定開采規(guī)模具有重大意義[1-2].礦物肉眼鑒定是地質(zhì)研究者所必須熟練掌握的基本技能,因?yàn)槿庋坭b別可以初步估計(jì)出礦物的種或族,由此決定選用什么方法進(jìn)行精確的鑒定和研究.但這種方法受限于鑒別者主觀經(jīng)驗(yàn),鑒別準(zhǔn)確性不高[3],如果選用方法不當(dāng),也會(huì)對(duì)后續(xù)研究會(huì)造成困難.
隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,采用模型判定礦物種屬的方法逐漸成為多數(shù)學(xué)者采用的方法.Baykan等[4]采用人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)對(duì)5 種顯微鏡下薄片圖像進(jìn)行分類,證明了RGB 這一顏色空間是礦物識(shí)別最佳色彩空間,但由于不同族的礦物其顏色特征可能相似,所以此方法還不能作為判別礦物種屬的依據(jù).與此同時(shí),Singh等[5]采用多層感知機(jī)(Multi-Layer Perceptron,MLP)進(jìn)行巖石紋理識(shí)別,通過從不同玄武巖提取的數(shù)值參數(shù)作為輸入,以巖體紋理類別作為輸出,相比單一顏色特征作為區(qū)分不同種礦物,此方法準(zhǔn)確率較高,但需要人工從眾多礦巖數(shù)值中進(jìn)行篩選,計(jì)算預(yù)處理過程較為繁瑣,不利于實(shí)際工程應(yīng)用.Chauhan等[6]等通過使用7 種機(jī)器學(xué)習(xí)方法對(duì)巖心斷層圖像進(jìn)行分割,比較了各個(gè)方法的優(yōu)劣性,找到了適用于礦物圖像分割的機(jī)器學(xué)習(xí)算法.受此啟發(fā),Baklanova等[7]使用K-means 聚類算法對(duì)顯微鏡下拍攝的礦物圖像定性評(píng)估其組成成分.賀金鑫等[8]使用樸素貝葉斯分類模型對(duì)高光譜礦物圖像進(jìn)行識(shí)別.但這些方法分析既耗時(shí)準(zhǔn)確率又不高.之后劉玨先等[9]針對(duì)巖石薄片成分分析耗時(shí)且準(zhǔn)確率不高問題,提出基于協(xié)同表示的多特征融合巖石分類法,識(shí)別速度得到了極大的提升,但仍未解決需要人工篩礦物特征這一問題.近十年來,圍繞著計(jì)算機(jī)視覺技術(shù)開展的研究工作取得了傲人的成績,尤其是卷積神經(jīng)網(wǎng)絡(luò)解決了傳統(tǒng)機(jī)器學(xué)習(xí)需要人工篩選特征問題,許多學(xué)者開始采用此技術(shù)解決礦物識(shí)別的問題.程國建等[10]通過搭建淺層卷積神經(jīng)網(wǎng)絡(luò),對(duì)3 類巖石薄片進(jìn)行自動(dòng)分類取得了98%的準(zhǔn)確率;白林等[11]基于VGG19 網(wǎng)絡(luò),對(duì)6 種常見巖石薄片進(jìn)行分類取得了82%的準(zhǔn)確率;郭艷軍等[12]以ResNet 作為框架,對(duì)5 種偏光顯微鏡下礦物進(jìn)行鑒別取得了89%的準(zhǔn)確率;徐述騰等[13]基于U-net 網(wǎng)絡(luò)對(duì)5 種硫化礦物的顯微鏡下圖像進(jìn)行識(shí)別,取得了90%的準(zhǔn)確率.采用卷積神經(jīng)網(wǎng)絡(luò)徹底解決了人工篩選礦物特征的問題,但是早期卷積神經(jīng)網(wǎng)絡(luò)所需訓(xùn)練數(shù)據(jù)較為龐大,同時(shí)對(duì)計(jì)算機(jī)運(yùn)算能力也有一定要求,而且目前針對(duì)實(shí)驗(yàn)環(huán)境下礦物識(shí)別研究較多,而針對(duì)野外環(huán)境下礦物識(shí)別過程研究較少.之后也有學(xué)者針對(duì)這些問題進(jìn)行了優(yōu)化和研究.張野等[14]運(yùn)用遷移學(xué)習(xí)的方法對(duì)3 類礦巖圖像進(jìn)行分類取,得了85%的準(zhǔn)確率,運(yùn)用遷移學(xué)習(xí)方法可以很好地彌補(bǔ)由于數(shù)據(jù)集不足造成卷積神經(jīng)網(wǎng)絡(luò)欠擬合問題,但在遷移學(xué)習(xí)之前網(wǎng)絡(luò)仍需在樣本充足的數(shù)據(jù)集上進(jìn)行充分訓(xùn)練,該數(shù)據(jù)集與礦物關(guān)聯(lián)性的強(qiáng)弱會(huì)影響最終的識(shí)別準(zhǔn)確率.彭偉航等[15]通過改進(jìn)InceptionV3 網(wǎng)絡(luò)和損失函數(shù),對(duì)16 種礦物直接圖像進(jìn)行識(shí)別取得了86%的準(zhǔn)確率.采用Inception 結(jié)構(gòu)對(duì)礦物圖像進(jìn)行多尺度采樣可以充分提取到礦物特征,但由于傳統(tǒng)Inception結(jié)構(gòu)每一層都是特別設(shè)計(jì)的并且伴隨著較大的參數(shù)量,造成部署較為困難,而且采集到多尺度特征信息并不能充分利用,使得網(wǎng)絡(luò)性能并不能充分發(fā)揮.李明超等[16]利用模型集成的方法,通過耦合顏色和紋理特征的方法,對(duì)19 類礦物圖像實(shí)現(xiàn)自動(dòng)辨別,但計(jì)算復(fù)雜度仍然較高.
針對(duì)上述問題,本文以直接獲取的礦物圖像作為研究對(duì)象,選用兼具低參數(shù)量和特征復(fù)用功能的DenseNet[17]為主干網(wǎng)絡(luò),同時(shí)結(jié)合前人所提聚合變換[18]思想,設(shè)計(jì)了一種多尺度密集連接網(wǎng)絡(luò)(Multi-Scale Densely connected convolutional Network,MS-DenseNet)作為礦物識(shí)別模型,并以分組卷積策略對(duì)多尺度結(jié)構(gòu)進(jìn)行參數(shù)優(yōu)化減少參數(shù)量.通過與典型網(wǎng)絡(luò)在測(cè)試集上進(jìn)行橫向?qū)Ρ?,?shí)驗(yàn)結(jié)果表明本文所提網(wǎng)絡(luò)在參數(shù)量和準(zhǔn)確率方面都有較大優(yōu)勢(shì).
1.1 密集連接結(jié)構(gòu)密集連接網(wǎng)絡(luò)(DenseNet)是Huang等[17]于2017 年提出一種網(wǎng)絡(luò)模型.相比之前從深度和寬度角度提升網(wǎng)絡(luò)性能,DenseNet 采用特征復(fù)用的方式對(duì)網(wǎng)絡(luò)性能進(jìn)行提升.通過將上層特征提取器與下層特征提取器進(jìn)行特征信息交互,將各自提取到的特征在通道維度進(jìn)行拼接,豐富下層網(wǎng)絡(luò)輸入特征的多樣性,同時(shí)減少信息損失.密集連接方式讓特征信息和梯度信息傳遞更加高效,對(duì)特征信息的挖掘更加充分,非常適用于樣本數(shù)較少的數(shù)據(jù)集.故本文選取DenseNet 中的密集連接結(jié)構(gòu)作為礦物識(shí)別的主干結(jié)構(gòu),密集連接結(jié)構(gòu)如圖1 所示.
圖1 密集連接結(jié)構(gòu)示意圖Fig.1 Schematic diagram of dense connection structure
1.2 多尺度特征提取結(jié)構(gòu)由于DenseNet 所有下層的網(wǎng)絡(luò)層與上層輸出的有一定關(guān)聯(lián),上層網(wǎng)絡(luò)提取到信息量多少對(duì)后續(xù)網(wǎng)絡(luò)層有著一定影響.而在卷積神經(jīng)網(wǎng)絡(luò)中,淺層網(wǎng)絡(luò)提取的特征和輸入比較接近,如果只使用小卷積將會(huì)忽視掉一些全局信息,造成后續(xù)可用于分類的信息較少,所以要讓靠前的網(wǎng)絡(luò)層具有不同尺度的特征獲取能力.此外,對(duì)于非公共數(shù)據(jù)集而言樣本數(shù)少是其顯著特點(diǎn),采用多尺度卷積結(jié)構(gòu)在一定程度可以彌補(bǔ)這一不足.因此,本文在DenseNet 基礎(chǔ)上引入了Inception[18-19]結(jié)構(gòu),如圖2 所示,并對(duì)傳統(tǒng)Inception 結(jié)構(gòu)進(jìn)行了參數(shù)優(yōu)化,解除傳統(tǒng)Inception 結(jié)構(gòu)存在針對(duì)性設(shè)計(jì)、參數(shù)量大等不足的問題.
圖2 傳統(tǒng)Inception 結(jié)構(gòu)Fig.2 The structure of classic Inception
首先,為了降低傳統(tǒng)結(jié)構(gòu)的計(jì)算復(fù)雜度同時(shí)又不損失其特征獲取能力,采用大小為1×1 的分組卷積對(duì)特征通道進(jìn)行減半壓縮,一方面可以起到線性修正的作用,方便后續(xù)特征融合;另一方面,防止參數(shù)量過大造成過擬合.
采用分組卷積,可以以較少的參數(shù)獲得與傳統(tǒng)卷積運(yùn)算得到一樣的特征圖.采用傳統(tǒng)卷積其參數(shù)量計(jì)算公式為:
式中,p為參數(shù)量,k為卷結(jié)核大小,c1為輸入特征圖維度,c2為輸出特征圖維度.
而采用分卷卷積其參數(shù)量計(jì)算公式為:
式中,g為分組數(shù).
由公式(1)和(2)可知,傳統(tǒng)卷積參數(shù)量是分組卷積的g倍.使用分組卷積消耗的計(jì)算內(nèi)存更少,計(jì)算復(fù)雜度也將降低,會(huì)使網(wǎng)絡(luò)的推理速度得到加強(qiáng).
然后,將分組卷積接入3 分支結(jié)構(gòu).分支1 是一組3×3 卷積;分支2 是兩組3×3 卷積,用兩組3×3 卷積替代一組5×5 大尺度卷積;分支3 是直連結(jié)構(gòu).同時(shí),引入一條最大池化分支,對(duì)上層特征圖進(jìn)行局部特征提取,并將該分支與3 卷積分支在通道維度進(jìn)行拼接,構(gòu)成一個(gè)多尺度特征提取模塊.
不同的卷積核所提取到的特征存在差異,其中大尺寸卷積核有助于捕獲全局信息,同一點(diǎn)所包含語義信息也較為豐富;小尺寸卷積核有助于獲取細(xì)節(jié)信息,最大池化層則更加關(guān)注特征圖的局部信息.將不同分支獲得的信息進(jìn)行融合,根據(jù)各自所得權(quán)重自適應(yīng)地處理特征信息.使網(wǎng)絡(luò)在無需構(gòu)建較深的情況下,也能得到豐富的特征信息,這些信息增強(qiáng)了網(wǎng)絡(luò)的魯棒性,提升了網(wǎng)絡(luò)性能,改進(jìn)后的多尺度特征提取結(jié)構(gòu)如圖3 所示.
圖3 優(yōu)化后的Inception 結(jié)構(gòu)Fig.3 The structure of improved Inception
融合后的特征計(jì)算公式為:
式中,finput為輸入特征,c為融合后的特征,wi(i=1,2,3,4)為 特征權(quán)重值,gConv1×1為1×1 分組卷積,Conv3×3為3×3 卷積,Conv1×1為1×1 普通卷積,max()為區(qū)域最大值函數(shù).
1.3 跳躍結(jié)構(gòu)輸入網(wǎng)絡(luò)經(jīng)過多次下采樣操作后,雖然壓縮了特征圖的尺寸,便于后續(xù)分類,但是在壓縮過程中造成一些信息的丟失.對(duì)于淺層網(wǎng)絡(luò)層因?yàn)榭拷斎雸D像層,這種影響非常小.而對(duì)于深層的網(wǎng)絡(luò)層這種影響較為嚴(yán)重,可能會(huì)影響最終分類效果.所以,為了減少這一損失,本文在密集連接模塊后的網(wǎng)絡(luò)層引入跳躍結(jié)構(gòu),以減小特征信息損失.
1.4 總體結(jié)構(gòu)本文網(wǎng)絡(luò)結(jié)構(gòu)如圖4 所示,表1給出了每個(gè)網(wǎng)絡(luò)層的具體信息.
表1 MS-DenseNet 參數(shù)信息Tab.1 The parameter information of MS-DenseNet
圖4 MS-DenseNet 結(jié)構(gòu)示意圖Fig.4 The structure diagram of MS-DenseNet
MS-DenseNet 運(yùn)算步驟如下:
步驟 1讀入圖像,使用7×7 卷積對(duì)原始圖像進(jìn)行特征預(yù)提取,并使用批標(biāo)準(zhǔn)化層進(jìn)行歸一化處理,使用ReLU 激活函數(shù)進(jìn)行激活,使用最大池化層將特征圖壓縮.
步驟 2將步驟1 得到的特征圖輸入進(jìn)分組卷積并在每層第一層使用批標(biāo)準(zhǔn)化層進(jìn)行歸一化處理,使用ReLU 激活函數(shù)進(jìn)行激活,送入三卷積分支和最大池化支路,并行進(jìn)行特征提取操作.將各支路獲取的信息進(jìn)行融合.在以平均池化操作整合全局空間信息,并進(jìn)一步縮減特征圖尺寸.
步驟 3對(duì)步驟2 得到的特征,進(jìn)行密集卷積運(yùn)算挖掘粗粒度信息,以平均池化壓縮特征圖尺寸.
步驟 4將步驟3 得到特征圖輸入帶有跳躍連接的卷積層,進(jìn)行卷積運(yùn)算.并將運(yùn)算后的特征送入全連接層,使用softmax 激活函數(shù)計(jì)算各類型礦物的概率.
2.1 實(shí)驗(yàn)數(shù)據(jù)及平臺(tái)礦物識(shí)別圖像數(shù)據(jù)集中所有數(shù)據(jù)來源于互聯(lián)網(wǎng)中最大的礦產(chǎn)資源數(shù)據(jù)庫平臺(tái)Mindat.org,使用爬蟲方法收集到的6 類礦物圖像,合計(jì)5 695張,各類礦物分布如表2 所示.選取數(shù)據(jù)集的80%作為訓(xùn)練集,10%作為驗(yàn)證集,10%作為測(cè)試集.并對(duì)訓(xùn)練集進(jìn)行隨機(jī)上下翻轉(zhuǎn)、隨機(jī)左右翻轉(zhuǎn)等數(shù)據(jù)增強(qiáng)操作擴(kuò)充訓(xùn)練集,實(shí)驗(yàn)電腦配置為:AMD Ryzen 7 4800H 2.90 GHz 處理器,NVIDIA GeForce RTX 1650 顯卡,使用Python 語言和Tensorflow2.3 深度學(xué)習(xí)平臺(tái)進(jìn)行網(wǎng)絡(luò)訓(xùn)練.
表2 各類礦物數(shù)據(jù)統(tǒng)計(jì)Tab.2 Statistics of various minerals
2.2 實(shí)驗(yàn)設(shè)置在圖像輸入網(wǎng)絡(luò)前,將圖像統(tǒng)一為224×224.損失函數(shù)為交叉熵?fù)p失函數(shù),使用Adam優(yōu)化器.學(xué)習(xí)率為自然指數(shù)衰減,初始學(xué)習(xí)率設(shè)為0.001,衰減率設(shè)為0.05,其數(shù)學(xué)表達(dá)式如下:
式中,l′表示初始學(xué)習(xí)率,r為衰減率,s為迭代次數(shù),s′為衰減次數(shù).
使用自然指數(shù)衰減學(xué)習(xí)率能夠加快網(wǎng)絡(luò)訓(xùn)練速度,而且變化的學(xué)習(xí)率能夠提升網(wǎng)絡(luò)抗干擾性,使其不易陷入局部最小值.每次迭代選取16 張圖像送入網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練次數(shù)(epochs)為1 000 次.
2.3 網(wǎng)絡(luò)評(píng)估本文以測(cè)試集的準(zhǔn)確率(A)評(píng)判各個(gè)網(wǎng)絡(luò)的分類性能,使用參數(shù)量評(píng)價(jià)網(wǎng)絡(luò)模型大小,使用混淆矩陣、精確度(P)、召回率(R) 和FS評(píng)價(jià)各網(wǎng)絡(luò)對(duì)礦物的識(shí)別能力.根據(jù)實(shí)驗(yàn)中真實(shí)情況和預(yù)測(cè)結(jié)果之間的關(guān)系,把實(shí)際結(jié)果和預(yù)測(cè)結(jié)果之間的差異分為4 種類別:實(shí)際為正樣本預(yù)測(cè)也為正樣本(TP)、實(shí)際為負(fù)樣本預(yù)測(cè)為正樣本(FP)、實(shí)際為正樣本預(yù)測(cè)為負(fù)樣本(FN)、實(shí)際為負(fù)樣本預(yù)測(cè)為負(fù)樣本(TN).
準(zhǔn)確率、精確度、召回率及FS的計(jì)算公式如下:
式中,β是調(diào)整精確度和召回率在FS中的權(quán)重.根據(jù)兩者的重要程度進(jìn)行選擇,若認(rèn)為召回率重要,則增大 β;若認(rèn)為精確度重要,則減小 β ;當(dāng) β=1時(shí)認(rèn)為二者一樣重要.對(duì)于礦物識(shí)別任務(wù),我們更關(guān)注識(shí)別準(zhǔn)確度,所以在FS中設(shè)置 β=0.5.
2.4 與典型經(jīng)典網(wǎng)絡(luò)對(duì)比實(shí)驗(yàn)為了驗(yàn)證本文提出方法的有效性,在使用相同數(shù)據(jù)集和同樣的預(yù)處理?xiàng)l件下,將本文方法與5 種典型圖像分類網(wǎng)絡(luò)在驗(yàn)證集和測(cè)試集上分別進(jìn)行橫向?qū)Ρ?經(jīng)過1 000次訓(xùn)練后,各個(gè)網(wǎng)絡(luò)在訓(xùn)練集均得到了充分訓(xùn)練,準(zhǔn)確率均達(dá)到了100%,如圖5 所示.
圖5 各模型訓(xùn)練集準(zhǔn)確率對(duì)比Fig.5 Accuracy comparison of training sets of each model
在驗(yàn)證集上,MS-DenseNet 準(zhǔn)確率達(dá)到90.54%,DenseNet121[17]準(zhǔn)確率達(dá)到87.76%;InceptionV3[20]準(zhǔn)確率為86.63%,ResNet50[21]準(zhǔn)確率為85.67%;MobileNetV2[22]準(zhǔn)確率為85.11%,VGG19[23]網(wǎng)絡(luò)準(zhǔn)確率為83.09%.驗(yàn)證集對(duì)比結(jié)果如圖6 所示.
圖6 各模型驗(yàn)證集準(zhǔn)確率對(duì)比Fig.6 Accuracy comparison of validation sets for each model
從各個(gè)模型準(zhǔn)確率對(duì)比結(jié)果可知,在礦物數(shù)據(jù)集上MS-DenseNet 的總體鑒別性能要好于VGG19、ResNet50 和InceptionV3 經(jīng)典網(wǎng)絡(luò),和同量級(jí)網(wǎng)絡(luò)MobileNetV2 和DenseNet121 相比,本文所提方法也取得了較優(yōu)的成績.
表3 為各個(gè)模型在測(cè)試集評(píng)價(jià)指標(biāo)對(duì)比表,從表3 中最后一列可以看出,本文所提方法的參數(shù)量要高于MobileNetV2,但本文方法在其他評(píng)價(jià)指標(biāo)上,比MobileNet 高3 到4 個(gè)百分點(diǎn),說明本文方法以犧牲較小的計(jì)算復(fù)雜性為代價(jià),換取比同量級(jí)網(wǎng)絡(luò)更高的識(shí)別性能.在與其他網(wǎng)絡(luò)評(píng)價(jià)指標(biāo)對(duì)比中發(fā)現(xiàn),無論是在精確度、召回率和FS還是測(cè)試集準(zhǔn)確率、參數(shù)量,本文所提方法都要好于其他網(wǎng)絡(luò),證明本文所提模型可以勝任在普通計(jì)算機(jī)上的礦物識(shí)別任務(wù).
表3 各模型在測(cè)試集評(píng)價(jià)指標(biāo)Tab.3 Comparison of evaluation indicators of each model
圖7 給出了在測(cè)試集整體識(shí)別準(zhǔn)確率較高的網(wǎng)絡(luò)的混淆矩陣對(duì)比圖.在測(cè)試集準(zhǔn)確率排名前3的網(wǎng)絡(luò)分別為MS-DenseNet、DenseNet 和Inception.從圖7 混淆矩陣對(duì)比可以看出,3 個(gè)網(wǎng)絡(luò)對(duì)赤鐵礦易發(fā)生誤判.MS-DenseNet 對(duì)赤鐵礦的識(shí)別準(zhǔn)確率僅為72%,相比InceptionV3 和DenseNet121 表現(xiàn)較差;而InceptionV3 對(duì)這類礦物識(shí)別效果較好,準(zhǔn)確率達(dá)到了77%左右.但在硅孔雀石和孔雀石的這兩類極為相似的礦物鑒別上,MS-DenseNet 鑒別效果要優(yōu)于其他兩個(gè)網(wǎng)絡(luò).對(duì)于斑銅礦的鑒定,DenseNet121 相比另外兩個(gè)網(wǎng)絡(luò)表現(xiàn)較好.雖然各網(wǎng)絡(luò)對(duì)各類礦物表現(xiàn)出不同的判定能力,但是各網(wǎng)絡(luò)對(duì)6 類礦物整體識(shí)別準(zhǔn)確率都在85%以上,而且本文所提方法整體精準(zhǔn)度要優(yōu)于其他兩類網(wǎng)絡(luò),尤其在硅孔雀石、孔雀石、黃鐵礦和石英判定上,誤判發(fā)生的概率較低.
圖7 混淆矩陣對(duì)比Fig.7 Confusion matrix comparison
2.5 消融實(shí)驗(yàn)與識(shí)別熱力圖為了驗(yàn)證MS-DenseNet在網(wǎng)絡(luò)結(jié)構(gòu)上的改進(jìn)更能有效地提取礦物特征,本節(jié)對(duì)原始的DenseNet、結(jié)合改進(jìn)多分支結(jié)構(gòu)的IDenseNet、結(jié)合跳躍連接結(jié)構(gòu)的S-DenseNet 以及本文方法進(jìn)行了對(duì)比.并以測(cè)試集準(zhǔn)確率作為評(píng)價(jià)指標(biāo),各個(gè)網(wǎng)絡(luò)訓(xùn)練設(shè)置相同對(duì)比結(jié)果如表4 所示.
表4 網(wǎng)絡(luò)結(jié)構(gòu)評(píng)價(jià)與指標(biāo)對(duì)比Tab.4 Network structure evaluation and index comparison
從表4 可知,最優(yōu)網(wǎng)絡(luò)的預(yù)測(cè)準(zhǔn)確率為88.06%,該網(wǎng)絡(luò)是在DenseNet 基礎(chǔ)上,融入跳躍連接結(jié)構(gòu)和多尺度卷積結(jié)構(gòu).在網(wǎng)絡(luò)前期,通過使用多尺度卷積可以耦合不同尺度的礦物特征信息,這些信息能有效幫助網(wǎng)絡(luò)進(jìn)行礦物判別;以密集連接方式將前面提取到的多尺度信息與下層網(wǎng)絡(luò)進(jìn)行交互,在豐富下層網(wǎng)絡(luò)輸入特征多樣性的同時(shí)加強(qiáng)信息流通;在網(wǎng)絡(luò)終端,以跳躍連接方式進(jìn)行信息增強(qiáng),減少特征圖壓縮過程中的信息丟失.從對(duì)比結(jié)果來看,本文所提改進(jìn)點(diǎn)是有效的.
除實(shí)驗(yàn)外,本文還將MS-DenseNet 在訓(xùn)練過程中學(xué)習(xí)到的礦物特征以及重要程度做了可視化展示,如圖8 所示,輸出前三的最大可能類別.從礦物特征圖對(duì)比中可發(fā)現(xiàn),每條分支所提取到特征是不同的,既有全局特征,也有局部特征,這印證了上文所述的多尺度卷積具有良好的尺度適應(yīng)性.同時(shí),本文所提多尺度結(jié)構(gòu)兼具低參數(shù)量優(yōu)勢(shì),相比傳統(tǒng)卷積結(jié)構(gòu),本文算法所需計(jì)算內(nèi)存低,便于日后在便攜式設(shè)備上進(jìn)行應(yīng)用.類激活熱力圖是將所提取特征對(duì)于網(wǎng)絡(luò)識(shí)別礦物種類的重要性作展示,如果提取到信息對(duì)網(wǎng)絡(luò)最后的判別越重要,那么該位置的激活強(qiáng)度就越大,即反映出的顏色也就越鮮艷.通過類激活熱力圖和top3 最大可能礦物概率,給出了網(wǎng)絡(luò)找到了不同種類礦物的不同之處,對(duì)于一些重要特征做了明顯標(biāo)記,提升了工作效率.
圖8 礦物特征圖與類激活熱力圖Fig.8 Mineral feature map and class activation heatmap
為了避免識(shí)別網(wǎng)絡(luò)結(jié)構(gòu)規(guī)模龐大、計(jì)算復(fù)雜度高問題,同時(shí)在有限數(shù)據(jù)集訓(xùn)練情況下,網(wǎng)絡(luò)模型具備礦物的識(shí)別性能,本文提出MS-DenseNet 礦物智能識(shí)別模型.首先通過在密集連接網(wǎng)絡(luò)中引入多尺度卷積結(jié)構(gòu)并使用分組卷積策略對(duì)網(wǎng)絡(luò)進(jìn)行優(yōu)化,使其具有不同尺度特征學(xué)習(xí)能力,減少特征信息損失同時(shí)保證較低網(wǎng)絡(luò)參數(shù)數(shù)量;其次在深層網(wǎng)絡(luò)的尾部采用跳躍連接結(jié)構(gòu),實(shí)現(xiàn)耦合上下層的信息并減少了深層網(wǎng)絡(luò)的信息丟失.為了驗(yàn)證本文方法有效性,在本文數(shù)據(jù)集上進(jìn)行了網(wǎng)絡(luò)結(jié)構(gòu)對(duì)比實(shí)驗(yàn)和與5 種典型網(wǎng)絡(luò)對(duì)比實(shí)驗(yàn),結(jié)果表明,本文所提方法在測(cè)試集預(yù)測(cè)準(zhǔn)確率均高于其他5 種網(wǎng)絡(luò),達(dá)到88.06%,所提改進(jìn)點(diǎn)有助于提升網(wǎng)絡(luò)性能.由于圖像質(zhì)量對(duì)網(wǎng)絡(luò)模型的特征提取能力有著重要影響,未來將采用目標(biāo)檢測(cè)網(wǎng)絡(luò)對(duì)圖像進(jìn)行預(yù)處理減少圖像中的干擾因素,從而進(jìn)一步提升網(wǎng)絡(luò)的性能.