劉婷玥, 代晶晶, 田淑芳
1. 中國地質(zhì)大學(xué)(北京), 北京 100083 2. 自然資源部成礦作用與資源評價重點(diǎn)實(shí)驗(yàn)室, 中國地質(zhì)科學(xué)院礦產(chǎn)資源研究所, 北京 100037
石榴子石是一族具有島狀結(jié)構(gòu)的硅酸鹽礦物的總稱, 化學(xué)式為X3Y2[ZO4]3, 其中X代表二價陽離子鈣、 鐵、 鎂、 錳, Y代表三價陽離子鋁、 鐵、 鉻、 錳, Z一般代表四價陽離子硅。 依據(jù)X位置和Y位置陽離子的特征, 可將目前已知的石榴子石族礦物分為兩類: 鈣系列石榴子石和鋁系列石榴子石[1-2]。 鈣系列石榴子石包括鈣鉻榴石、 鈣鐵榴石、 鈣鋁榴石等亞類, 鋁系列石榴子石包括錳鋁榴石、 鐵鋁榴石、 鎂鋁榴石等亞類。 傳統(tǒng)的石榴子石亞類分類的判別主要是通過實(shí)驗(yàn)室測試分析, 存在耗時耗力、 破壞性、 昂貴等缺點(diǎn), 所以迫切需要一種新方法快速、 準(zhǔn)確地判別石榴子石類型。 高光譜可以捕獲大量信息, 反映研究對象復(fù)雜的內(nèi)在特征, 且具有無損探測、 省時省力的優(yōu)點(diǎn)[3], 近年來被應(yīng)用到礦物識別中。 高光譜研究表明金屬離子替代引起的礦物成分變化可以反映在光譜上[4], 石榴子石也不例外。 石榴子石亞類之間通過金屬離子替代相互轉(zhuǎn)化, 反映在高光譜上為熱紅外波段吸收谷及反射峰位置的不同。 其中, 鈣鉻榴石和錳鋁榴石反射峰位置特征明顯, 易于識別, 而鐵鋁榴石和鎂鋁榴石、 鈣鐵榴石和鈣鋁榴石的反射峰位置特征不明顯, 有較大重疊區(qū)域, 無法直接進(jìn)行判別, 因此需要找到一種能夠挖掘熱紅外波譜中的成分信息進(jìn)而識別石榴子石亞類的方法。 BP(back propagation)神經(jīng)網(wǎng)絡(luò)是一種非線性監(jiān)督分類方法, 無需事先確定映射關(guān)系, 僅通過自身的訓(xùn)練得到連接規(guī)則[5], 能夠解決許多傳統(tǒng)信息分析方法解決不了的問題。 目前, 還沒有利用熱紅外波譜特征和神經(jīng)網(wǎng)絡(luò)開展石榴子石亞類分類的相關(guān)報道。
嘗試將石榴子石在熱紅外波段的反射峰波長特征作為亞類判別標(biāo)志, 開展BP神經(jīng)網(wǎng)絡(luò)與聚類分析、 多元線性判別分析方法對比研究, 經(jīng)過精確率、 召回率和F1值三個評價指標(biāo)的評定, 找到一種判別石榴子石亞類類型的快速有效的方法, 并對其他礦物的快速識別提供新的技術(shù)啟示。
熱紅外譜段在結(jié)構(gòu)分析和組成分析中非常重要, 它能夠探測可見-短波紅外譜段探測不到的無水硅酸鹽類(架狀、 島狀、 鏈狀硅酸鹽)、 硫酸鹽、 磷酸鹽等礦物, 石榴子石是一種島狀硅酸鹽礦物, 因此熱紅外波段對于石榴子石的識別具有更大優(yōu)勢[6]。
受硅酸根離子影響, 石榴子石在9~13 μm的熱紅外譜段具有診斷性的三峰式吸收特征(如圖1所示), 3個反射峰分別為反射峰1、 反射峰2、 反射峰3(reflection peak 1, 2, 3), 主吸收谷位于反射峰1與反射峰2之間, 次吸收谷位于反射峰2與反射峰3之間[5]。 礦物的吸收譜帶主要由陰離子決定, 但是當(dāng)陽離子變化時, 吸收譜帶位置將會有微小的位移。 石榴子石亞類之間的不同主要是陽離子的不同, 因此可以通過反射峰波長判斷石榴子石中陽離子的類型, 進(jìn)而判別石榴子石類型, 本文將選擇反射峰的波長位置作為石榴子石亞類識別的標(biāo)志。
圖1 石榴子石熱紅外光譜圖
表1是在熱紅外光譜庫中提取的石榴子石光譜特征數(shù)據(jù), 包括18個鐵鋁榴石、 15個鈣鐵榴石、 25個鈣鋁榴石、 18個鎂鋁榴石、 6個錳鋁榴石、 3個鈣鉻榴石的3個反射峰波長信息(反射峰1波長、 反射峰2波長、 反射峰3波長)和1個反射峰波長差值信息(波峰3波長減去波峰2波長)。 將表1中的石榴子石光譜特征數(shù)據(jù)繪制成6種石榴子石反射峰波長分布圖(圖2), 由圖可知: ①鈣系和鋁系石榴子石可以通過反射峰波長進(jìn)行區(qū)別。 ②鈣鉻榴石和錳鋁榴石反射峰波長特點(diǎn)明顯, 易于與其他類型分別, 而鐵鋁榴石和鎂鋁榴石、 鈣鐵榴石和鈣鋁榴石的各反射峰均有較大重疊, 通過簡單的閾值劃分無法判別這幾類石榴子石。
表1 石榴子石光譜特征信息統(tǒng)計(jì)表
續(xù)表1
圖2 6種石榴子石反射峰波長位置分布圖
利用聚類分析、 多元線性判別分析和BP神經(jīng)網(wǎng)絡(luò)3種方法開展石榴子石亞類分類實(shí)驗(yàn), 使用表1中的3個反射峰波長信息和1個反射峰波長差值信息; 在SPSS和Python軟件中進(jìn)行, 分類效果將通過預(yù)測結(jié)果正確的概率——精確率、 樣本被正確預(yù)測的概率——召回率、 精確率和召回率結(jié)合得到的F1值進(jìn)行綜合評價。
聚類分析與多元線性判別分析采用的是k均值聚類和Bayes多元線性判別, 分析均通過SPSS軟件實(shí)現(xiàn), 結(jié)果如表2、 表3所示。
表2 聚類分析結(jié)果及評價
表3 判別分析結(jié)果及評價
由表4可知: 分類的精確率、 召回率和F1值均能達(dá)到100%, BP神經(jīng)網(wǎng)絡(luò)創(chuàng)建的模型有效, 所有石榴子石都能正確分類, 鐵鋁榴石和鎂鋁榴石、 鈣鐵榴石和鈣鋁榴石能夠很好地區(qū)分開。 由此可見, BP神經(jīng)網(wǎng)絡(luò)更適用于石榴子石亞類判別。
由表2、 表3可知: k均值聚類分析的精確率、 召回率和F1值分別為86.1%, 80%和79.2%, 除了鈣鉻榴石(類型4)完全正確地分類, 其他類型的石榴子石都有被誤分類的情況, k均值聚類分析是一種非監(jiān)督分類方法, 僅僅從距離的角度劃分類別, 判別效果不理想。 多元線性判別分析的精確率、 召回率和F1值分別為84.2%, 80%和79.5%, 鐵鋁榴石、 鎂鋁榴石、 鈣鐵榴石和鈣鋁榴石依然沒有得到很好的區(qū)分, 多元線性判別計(jì)算復(fù)雜度相對較低, 判別石榴子石亞類的效果同樣不理想。
BP神經(jīng)網(wǎng)絡(luò)是一種基于人腦所建立的模型, 通過模擬人腦結(jié)構(gòu)和功能來處理信息, 具有任意復(fù)雜的模式分類能力和優(yōu)良的多維函數(shù)映射能力。 BP神經(jīng)網(wǎng)絡(luò)方法與熱紅外光譜特征的結(jié)合, 可以充分利用二者優(yōu)勢, 構(gòu)建快速判別模型。 BP神經(jīng)網(wǎng)絡(luò)非線性判別分析借助Python軟件完成, 采用典型的三層神經(jīng)網(wǎng)絡(luò)模式。 表1中的反射峰波長信息及反射峰波長差值信息作為BP神經(jīng)網(wǎng)絡(luò)的輸入信息, 6個石榴子石亞類類型作為BP神經(jīng)網(wǎng)絡(luò)的輸出類型, 根據(jù)公式(1)和測試結(jié)果確定隱含層神經(jīng)元個數(shù)為10個。
(1)
式(1)中,m為隱藏層神經(jīng)元數(shù),n為輸入層神經(jīng)元數(shù),a為輸出層神經(jīng)元數(shù),b為0—10的任意常數(shù)。 分類模型的構(gòu)建過程如下[7]: ①實(shí)驗(yàn)數(shù)據(jù)劃分訓(xùn)練集和驗(yàn)證集。 ②信息輸入到BP神經(jīng)網(wǎng)絡(luò)中并進(jìn)行歸一化處理。 ③參數(shù)初始化, 設(shè)置神經(jīng)網(wǎng)絡(luò)的隱含層層數(shù)、 隱含層神經(jīng)元個數(shù)、 激活函數(shù)、 優(yōu)化方法、 輸出函數(shù)和終止條件。 ④正向傳播并計(jì)算各層的輸出值, ReLU函數(shù)增加網(wǎng)絡(luò)非線性[8]。 ⑤計(jì)算輸出層與期望值的誤差, 若是計(jì)算得到的輸出值與期望得到的輸出值存在不符合要求的誤差, 則轉(zhuǎn)為誤差反向反饋過程。 ⑥反向反饋并利用L-BFGS算法修正權(quán)值。 ⑦達(dá)到終止條件終止訓(xùn)練, softmax回歸函數(shù)對輸出值歸一化處理[9]。 ⑧得到石榴子石亞類分類預(yù)測模型。 ⑨使用精確率、 召回率和F1值進(jìn)行結(jié)果及精度評價, 評價報告如表4所示。
表4 BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果評價
(1) 通過BP神經(jīng)網(wǎng)絡(luò)和聚類、 多元線性判別分析應(yīng)用于石榴子石亞類分類的結(jié)果對比可知, 非線性的BP神經(jīng)網(wǎng)絡(luò)在光譜信息挖掘方面具有無可比擬的優(yōu)勢, 能夠?qū)㈣F鋁榴石和鎂鋁榴石、 鈣鐵榴石和鈣鋁榴石很好地區(qū)分, 判別石榴子石亞類分類的效果最好。
(2) 用來訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)的樣本數(shù)據(jù)會對判別結(jié)果產(chǎn)生決定性的影響。 一般來說, 樣本數(shù)量和涵蓋的產(chǎn)出環(huán)境類型越多, 訓(xùn)練結(jié)果越好, 因此實(shí)際應(yīng)用中還需要不斷擴(kuò)充樣本數(shù)據(jù)。 對已有樣本數(shù)據(jù)進(jìn)行微調(diào)是一種擴(kuò)充樣本數(shù)據(jù)、 提高模型訓(xùn)練精度的有效手段, 也可以給小樣本訓(xùn)練的神經(jīng)網(wǎng)絡(luò)增加自學(xué)習(xí)能力, 以滿足復(fù)雜的現(xiàn)實(shí)需要[10]。