田青林,郭幫杰,葉發(fā)旺,李 瑤,劉鵬飛,陳雪嬌
1.核工業(yè)北京地質(zhì)研究院遙感信息與圖像分析技術(shù)國家級重點(diǎn)實(shí)驗(yàn)室,北京 100029 2.Zachry Department of Civil and Environmental Engineering,Texas A&M University,Texas 77843,USA
近年來,深度學(xué)習(xí)技術(shù)不斷發(fā)展,被廣泛應(yīng)用于圖像分類[2]、語音識別[3]、醫(yī)學(xué)信號處理[4]等領(lǐng)域。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)[5-6]是深度學(xué)習(xí)中一個重要網(wǎng)絡(luò)結(jié)構(gòu),其強(qiáng)大的學(xué)習(xí)和分類能力遠(yuǎn)超傳統(tǒng)機(jī)器學(xué)習(xí)方法,具有廣泛適用性。何東遠(yuǎn)等[7]提出一種一維CNN模型對恒星光譜進(jìn)行分類,并給出了不同波段對不同恒星類型的貢獻(xiàn)率,具有較高的分類精度和魯棒性。趙勇等[8]提出一種一維CNN模型,對雌激素粉末拉曼光譜進(jìn)行分類,無需光譜預(yù)處理和特征提取步驟,展現(xiàn)出良好的分類性能和抗噪聲干擾能力。
本工作通過引入空洞卷積,將一維空洞卷積神經(jīng)網(wǎng)絡(luò)(one-dimensional dilated convolutional neural network,1D-DCNN)應(yīng)用于礦物光譜分類領(lǐng)域,研究礦物類別的端到端檢測,分析了卷積類型和迭代次數(shù)對模型分類結(jié)果的影響,并與反向傳播算法(back propagation,BP)和支持向量機(jī)(support vector machine,SVM)方法結(jié)果進(jìn)行對比。
測量礦物光譜的儀器為美國ASD公司的FieldSpec@3型便攜式光譜儀(350~2 500 nm),共2 151個波段,考慮到邊緣波段噪聲及數(shù)據(jù)量的原因,在380~2 420 nm波長范圍,按3 nm間隔進(jìn)行重采樣,得到511個波段。光譜儀視場角為25°,數(shù)據(jù)采集過程中將光纖探頭垂直于礦物樣本,距離約2 cm,盡量使采集到的光譜數(shù)據(jù)不受干擾。
按照上述方法采集白云母、白云石、方解石、高嶺石四種礦物光譜樣本,數(shù)量分別為478條、972條、540條、976條,如圖1所示。
圖1 部分礦物光譜數(shù)據(jù)(a):白云母;(b):白云石;(c):方解石;(d):高嶺石Fig.1 Part of the mineral spectra(a):Muscovite;(b):Dolomite;(c):Calcite;(d):Kaolinite
1.2.1 光譜數(shù)據(jù)增強(qiáng)
CNN的優(yōu)異性能需要大量數(shù)據(jù)樣本作為支撐。充足的訓(xùn)練樣本有助于網(wǎng)絡(luò)模型充分學(xué)習(xí)樣本類內(nèi)特征和類間區(qū)別。而受樣本數(shù)量、采集環(huán)境、測量設(shè)備等限制,一般較難獲取大量帶有標(biāo)簽的礦物光譜數(shù)據(jù),故采用數(shù)據(jù)增強(qiáng)的方式擴(kuò)充樣本。具體方法是向原始礦物光譜數(shù)據(jù)中添加強(qiáng)度不等的隨機(jī)高斯白噪聲,將白云母光譜擴(kuò)充至1 434條,白云石光譜擴(kuò)充至2 916條,方解石光譜擴(kuò)充至1 620條,高嶺石光譜擴(kuò)充至2 928條。經(jīng)過數(shù)據(jù)增強(qiáng),得到包含四類礦物光譜樣本的數(shù)據(jù)集共8 898條,并按照6∶1∶3比例劃分為訓(xùn)練集、驗(yàn)證集和測試集,用于模型訓(xùn)練、參數(shù)優(yōu)化及精度測試。
1.2.2 一維空洞卷積神經(jīng)網(wǎng)絡(luò)模型
CNN模型應(yīng)用于圖像語義分割領(lǐng)域時,重復(fù)的卷積、池化操作會降低特征圖分辨率,導(dǎo)致圖像細(xì)節(jié)結(jié)構(gòu)和邊緣信息丟失[10]。而在光譜分類中同樣面臨上述問題,為此通過引入空洞卷積來解決這一問題,在保持分辨率的同時擴(kuò)大濾波器感受野,盡可能地保留光譜細(xì)節(jié)特征。對一維光譜信號的情形,需要進(jìn)行一維空洞卷積操作,如圖2所示,當(dāng)空洞率rate=1時,空洞卷積相當(dāng)于標(biāo)準(zhǔn)卷積,濾波器以連續(xù)的方式對輸入信號進(jìn)行處理,當(dāng)rate=2時,在原始濾波器的每個元素間插入一個0,以跳躍的方式處理信號。
圖2 一維空洞卷積示意圖[9](a):標(biāo)準(zhǔn)卷積;(b):空洞卷積Fig.2 Schematic of one-dimensional dilated convolution(a):Standard convolution;(b):Dilated convolution
因此,針對礦物光譜數(shù)據(jù)的特點(diǎn),設(shè)計了1D-DCNN模型,其結(jié)構(gòu)如圖3所示,詳細(xì)參數(shù)見表1。模型包含1個輸入層,3個空洞卷積層,卷積核大小分別為5×1,3×1和3×1,卷積核數(shù)量均為64,步長為1,空洞率為2,選擇ReLU作為激活函數(shù)。2個池化層緊接在第1個和第2個空洞卷積層之后,池化核大小均為3×1,步長為2,池化類型為最大池化。第3個空洞卷積層之后緊接2個全連接層,最后通過softmax輸出層得到分類概率預(yù)測。
圖3 一維空洞卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 The structure of one-dimensional dilated convolutional neural network
表1 1D-DCNN網(wǎng)絡(luò)各項(xiàng)參數(shù)Table 1 The parameters of 1D-DCNN
1.2.3 模型訓(xùn)練
1D-DCNN網(wǎng)絡(luò)模型采用交叉熵作為損失函數(shù),使用SGD(stochastic gradient descent)優(yōu)化器進(jìn)行訓(xùn)練,具體參數(shù)設(shè)置為學(xué)習(xí)率lr=0.008,權(quán)值衰減系數(shù)decay=0.000 000 1,動量momentum=0.5,Epoch=200。為實(shí)現(xiàn)1D-DCNN模型快速收斂,訓(xùn)練集被分成多個批次(batch),批處理樣本數(shù)量(batch size)設(shè)置為40。
1.2.4 模型評價方法
采用訓(xùn)練集和測試集的判別準(zhǔn)確率作為模型評價指標(biāo)。判別準(zhǔn)確率P可表示為
(1)
式(1)中:Nc為判別正確的樣本數(shù)目,Na為樣本總數(shù)目。
為檢驗(yàn)卷積類型對模型性能的影響,將1D-DCNN中空洞卷積替換為標(biāo)準(zhǔn)卷積,記為1D-CNN,其他參數(shù)保持不變,比較二者分類精度和收斂速度差異,結(jié)果如圖4所示。
圖4 不同卷積核類型的模型性能比較Fig.4 Model performances with different convolution kernel types
從圖4可以看出,在網(wǎng)絡(luò)訓(xùn)練過程中,1D-CNN模型的最佳分類精度為98.78%,而引入空洞卷積的1D-DCNN模型精度更高,達(dá)到99.40%,提高了0.62%。在收斂速度方面,1D-DCNN模型在迭代23次后便達(dá)到94%的分類準(zhǔn)確率,而1D-CNN模型達(dá)到相近精度需要迭代60次。由此可見,引入空洞卷積同時能夠加快收斂速度,提高計算效率,使模型更快得到精確結(jié)果。
為選取最優(yōu)的網(wǎng)絡(luò)迭代參數(shù),對比了不同迭代次數(shù)對模型精度的影響,結(jié)果如表2所示。當(dāng)?shù)螖?shù)很少時,模型訓(xùn)練不夠充分,網(wǎng)絡(luò)參數(shù)未達(dá)到最優(yōu),分類準(zhǔn)確率較差;隨著迭代次數(shù)增加,準(zhǔn)確率隨之提高;當(dāng)?shù)螖?shù)達(dá)到足夠量時,模型分類效果變化不大,網(wǎng)絡(luò)達(dá)到收斂狀態(tài)。綜合考慮模型精度和效率,選擇迭代次數(shù)為200。
表2 不同迭代次數(shù)的1D-DCNN模型判別結(jié)果Table 2 1D-DCNN model discrimination results of different number of iteration
為驗(yàn)證1D-DCNN模型的礦物光譜分類性能,將BP算法、SVM與1D-DCNN進(jìn)行對比,各分類器均已經(jīng)過參數(shù)調(diào)試和優(yōu)化,分類結(jié)果如表3所示。
表3 不同算法分類準(zhǔn)確率Table 3 The classification accuracies of different algorithms
根據(jù)表3結(jié)果可以看出,1D-DCNN分類效果最好,準(zhǔn)確率達(dá)到99.32%;其次是BP算法,準(zhǔn)確率為98.65%;最后是SVM,準(zhǔn)確率為97.94%。相比于BP、SVM等傳統(tǒng)機(jī)器學(xué)習(xí)算法,本文提出的1D-DCNN方法是通過構(gòu)建具有多個隱含層的學(xué)習(xí)模型和大規(guī)模訓(xùn)練數(shù)據(jù),提取低層光譜特征并組合形成更抽象的高層語義類別信息,從而提高光譜分類的準(zhǔn)確率。
提出了基于一維空洞卷積神經(jīng)網(wǎng)絡(luò)的礦物光譜分類方法。設(shè)計了9層網(wǎng)絡(luò)結(jié)構(gòu),采用交叉熵為損失函數(shù),隨機(jī)梯度下降為優(yōu)化器,無需任何數(shù)據(jù)預(yù)處理操作,實(shí)現(xiàn)了白云母、白云石、方解石、高嶺石四種礦物類別的端到端檢測。
(1)1D-DCNN模型展現(xiàn)出強(qiáng)大的特征學(xué)習(xí)和表達(dá)能力,避免了復(fù)雜的光譜預(yù)處理及特征提取過程。通過引入空洞卷積,在保持特征分辨率的同時擴(kuò)大濾波器感受野,盡可能地保留光譜細(xì)節(jié)信息,提高分類精度。
(2)實(shí)驗(yàn)結(jié)果表明,與BP、SVM方法相比,1D-DCNN模型對礦物光譜分類準(zhǔn)確率更高,達(dá)到99.32%,展現(xiàn)出良好的分類性能。
在后續(xù)研究中,會嘗試增加礦物種類和樣本數(shù)量,設(shè)計更高效的深度學(xué)習(xí)模型,為礦物光譜規(guī)?;瘷z測提供可靠的技術(shù)支持。此外,還可將1D-DCNN模型推廣到煤炭、油氣、月壤等其他領(lǐng)域的光譜分類應(yīng)用中。