鐘羽, 曹夢雪, 尹冬妹,路來君
1.成都理工大學(xué) 數(shù)理學(xué)院,四川 成都 610059;
2.成都理工大學(xué)數(shù)學(xué)地質(zhì)四川省重點實驗室,四川 成都 610059
在過去的幾十年中,地球化學(xué)勘查在礦產(chǎn)資源預(yù)測中發(fā)揮著關(guān)鍵作用,其中地球化學(xué)異常識別[1]對于礦床發(fā)現(xiàn)的價值已得到廣泛認可。地表中金屬富集異常可能涉及各種地質(zhì)和外力的復(fù)雜作用。這些過程可以在廣泛的時間和空間尺度上發(fā)生,并且因地而異,由此產(chǎn)生的地球化學(xué)模式錯綜復(fù)雜,為地球化學(xué)異常的識別帶來了很大的挑戰(zhàn)[2]。因此,開發(fā)能夠有效識別地球化學(xué)異常復(fù)雜關(guān)系的新方法成了近幾十年來的研究重點。
隨著機器學(xué)習(xí)算法引入到地球科學(xué)領(lǐng)域,學(xué)者們逐漸發(fā)現(xiàn)這些方法能夠較好地表達礦床與多源數(shù)據(jù)之間的非線性關(guān)系,并且不依賴于數(shù)據(jù)分布。相比于傳統(tǒng)處理方法而言,機器學(xué)習(xí)方法[3]對于處理復(fù)雜的非線性數(shù)據(jù)方面存在一定優(yōu)勢,可對多維特征進行建模,進而提高預(yù)測精度,以此彌補一般傳統(tǒng)方法無法有效識別隱藏空間模式的不足。正因如此,機器學(xué)習(xí)系列方法被廣泛用于地球化學(xué)異常識別,例如:支持向量機方法[4-5]可以通過搜索最佳超平面將采樣樣本分為化學(xué)異?;蚍钱惓?,從而建立成礦預(yù)測模型。隨機森林方法[6-7]可通過整合多個基分類器,生成更強的礦產(chǎn)潛力預(yù)測模型,而且對其優(yōu)化還能夠應(yīng)用于具有少量標(biāo)記樣本的研究領(lǐng)域。隨著深度學(xué)習(xí)[8,23]的興起,研究者們開始將卷積神經(jīng)網(wǎng)絡(luò)[9-10, 24]、生成對抗網(wǎng)絡(luò)[11]和深度自動編碼器[12-13]等方法引入到地球化學(xué)異常識別及礦產(chǎn)遠景預(yù)測領(lǐng)域。這些方法能夠自動從多源地球信息中提取高級特征,并實現(xiàn)大規(guī)模數(shù)據(jù)表征。尤其是卷積神經(jīng)網(wǎng)絡(luò),汪雪萍學(xué)者[14]運用卷積神經(jīng)網(wǎng)絡(luò)完成地球化學(xué)數(shù)據(jù)分類與巖性填圖;李童學(xué)者[15-16]通過全卷積神經(jīng)網(wǎng)絡(luò)對離子吸附型稀土礦進行預(yù)測;王??W(xué)者[17]將卷積神經(jīng)網(wǎng)絡(luò)和自編碼器結(jié)合運用在金銻礦集區(qū)的找礦預(yù)測。通過眾多學(xué)者的研究可以看出,通過卷積層提取特征,挖掘指示因子的空間分布與礦床位置的相關(guān)性。
本文以吉林省輝南—江源一帶鐵礦床為例,通過卷積神經(jīng)網(wǎng)絡(luò)模型挖掘Fe元素富集分布特征,并利用其訓(xùn)練模型對研究區(qū)進行地球化學(xué)異常識別,揭示地表元素與礦體位置之間的關(guān)系。
研究區(qū)[18-21]位于吉林省東南部,東經(jīng)126°00′~ 127°00′,北緯42°00′~ 42°40′(圖1)。行政區(qū)劃隸屬于吉林省白山市的靖宇縣,通化市輝南縣等。研究區(qū)中南部地勢較高,西北部較低。區(qū)內(nèi)主要受東西向構(gòu)造、北東向構(gòu)造影響,其中東西向構(gòu)造是最早形成。區(qū)內(nèi)礦產(chǎn)資源較為豐富,已知礦床、礦點及礦化點較多,主要以鐵礦為主,在研究區(qū)的鞍山群各組段中均見有沉積變質(zhì)鐵礦,這些鐵礦分布在龍崗背斜的南北兩翼,其展布方向受地層的控制,與龍崗背斜軸向方向一致,呈北東—南西方向帶狀分布。區(qū)內(nèi)出露地層主要為鞍山群四道砬子河組,巖性以黑云斜長片麻巖為主。區(qū)內(nèi)褶皺構(gòu)造和斷裂構(gòu)造較為發(fā)育。區(qū)內(nèi)由于東西兩部地層產(chǎn)狀差異而構(gòu)成為向斜構(gòu)造。礦體產(chǎn)狀則隨地層的彎曲或產(chǎn)狀變化而異,區(qū)內(nèi)發(fā)育北東向和北西向斷裂,造成了礦體的折斷或不完整。礦石為磁鐵石英巖型,呈條帶狀構(gòu)造,礦物成分有磁鐵礦、石英及石榴石。
圖1 吉林省輝南—江源一帶地質(zhì)簡圖
神經(jīng)網(wǎng)絡(luò)是一種模仿人類大腦行為特征的機器學(xué)習(xí)模型。神經(jīng)網(wǎng)絡(luò)依靠內(nèi)部大量節(jié)點之間相互連接的關(guān)系,進行分布式運算,從而達到處理數(shù)據(jù)的目的。每個節(jié)點接受數(shù)據(jù)的輸入后,先進行線性加權(quán),然后為每個節(jié)點加上非線性的激活函數(shù),最后完成非線性的數(shù)據(jù)輸出。每個節(jié)點之間的連接表示加權(quán)值,不同的加權(quán)值使神經(jīng)網(wǎng)絡(luò)產(chǎn)生不同的輸出結(jié)果。
卷積神經(jīng)網(wǎng)絡(luò)[22]是一類包含卷積計算的前饋神經(jīng)網(wǎng)絡(luò)。卷積相對全連接網(wǎng)絡(luò)不再是處理每個像素的輸入信息,而是處理像素區(qū)域。這種做法的優(yōu)點是使圖像可以作為數(shù)據(jù)直接輸入,加強了圖片信息的連續(xù)性。卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)通常包括輸入層、卷積層、池化層、全連接層和輸出層(圖2)。其中,卷積層、池化層和全連接層構(gòu)成多層感知器的隱藏層[23]。隱含層的卷積層和池化層是實現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)特征提取功能的核心模塊。
圖2 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
采用研究區(qū)化探報告中Fe元素含量,運用克里格法插值法繪制成Fe元素濃度分布圖(圖3)。對研究區(qū)進行網(wǎng)格化,由西向東由北向南分成320個4 100 m×4 625 m的小格,編號為1~320。研究區(qū)樣本被先標(biāo)記后分為1和0兩類。參考邏輯分類原則為:單位格子內(nèi)含有礦點,則標(biāo)記為1表示有礦。單位格子內(nèi)沒有礦點,則標(biāo)記為0表示無礦。由于77、78、270、271、287、306號緊鄰見礦孔,故均標(biāo)記為有礦。
圖3 吉林省白山市靖宇縣Fe元素濃度圖
本文所使用的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為:卷積層-池化層-卷積層-池化層-全連接層-全連接層。設(shè)定損失函數(shù)為交叉熵(CrossEntropy),學(xué)習(xí)率為0.001,訓(xùn)練次數(shù)為25次,將研究區(qū)內(nèi)30%樣本數(shù)據(jù)作為驗證集,以此得到訓(xùn)練集和測試集的準(zhǔn)確率(圖4a)和損失函數(shù)值(圖4b)。通過迭代運算發(fā)現(xiàn):在第15次迭代時,訓(xùn)練集準(zhǔn)確率可達到99.90%,損失函數(shù)值為0.000 1,模型訓(xùn)練到最佳效果。將驗證集輸入到訓(xùn)練好的模型中,驗證集的準(zhǔn)確率為96.88%,損失函數(shù)值為0.16,表明相對當(dāng)前數(shù)據(jù)而言,訓(xùn)練模型結(jié)果是有效的。
圖4 Fe元素卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練準(zhǔn)確率(a)和損失函數(shù)(b)
傳統(tǒng)地球化學(xué)異常識別是通過對研究區(qū)元素含量水平進行統(tǒng)計分析。利用統(tǒng)計學(xué)的方法把元素含量人為分為背景和異常兩部分,但背景和異常沒有一個“清晰”的界限,在不同條件下,背景和異??梢韵嗷マD(zhuǎn)換。本文轉(zhuǎn)變了以往思路,通過Fe元素地表分布圖像與礦體位置進行研究。建立起準(zhǔn)確率為0.968 8,損失函數(shù)值為0.16的卷積神經(jīng)網(wǎng)絡(luò)模型。對比模型結(jié)果與元素濃度分布特征發(fā)現(xiàn)在地表元素濃度并不是異常的地下位置卻有礦體分布。在此情形下,僅通過對異常值的識別是不能反映地表元素與地下礦體的關(guān)聯(lián)性,而運用卷積神經(jīng)網(wǎng)絡(luò)模型卻識別出異常區(qū)域。這表明,在沒有其他信息條件下,僅依靠數(shù)據(jù)分析的神經(jīng)網(wǎng)絡(luò)方法能夠發(fā)現(xiàn)地球化學(xué)異常有一定優(yōu)勢。
本文利用深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)模型挖掘輝南—江源一帶鐵礦床地表Fe元素分布特征,并進行地球化學(xué)異常識別。通過研究發(fā)現(xiàn):卷積神經(jīng)網(wǎng)絡(luò)可以深入探索地表元素分布與礦體地下位置關(guān)系,模型效果顯著,結(jié)果可靠。在后續(xù)深入的研究中,也可考慮將機器學(xué)習(xí)方法與地質(zhì)約束條件相結(jié)合或考慮地質(zhì)學(xué)理論替換模型的隱藏層,或許會增加所識別信息的可解釋性與可靠性,這可作為進一步研究的新思路。
致謝:感謝路來君導(dǎo)師、曹夢雪老師、尹冬妹碩士給予的指導(dǎo)和幫助,感謝成都理工大學(xué)數(shù)學(xué)地質(zhì)四川省重點實驗室的大力支持!