王建邦,薛林福*,于曉飛,李永勝,張運杰,冉祥金,丁 可
(1.吉林大學(xué)地球科學(xué)學(xué)院; 2.中國地質(zhì)調(diào)查局發(fā)展研究中心;3.自然資源部礦產(chǎn)勘查技術(shù)指導(dǎo)中心; 4.中國石油新疆油田分公司采油一廠)
人工智能是引領(lǐng)未來的戰(zhàn)略性技術(shù),以深度學(xué)習(xí)為代表的新一代人工智能在醫(yī)療、自動駕駛等領(lǐng)域得到了廣泛應(yīng)用,基于深度學(xué)習(xí)方法的找礦預(yù)測已成為當(dāng)前戰(zhàn)略性礦產(chǎn)資源勘查領(lǐng)域的研究熱點之一[1-2]。中國已積累了海量礦產(chǎn)地質(zhì)數(shù)據(jù)[3],深度學(xué)習(xí)方法處理這些高維、異構(gòu)、多屬性數(shù)據(jù)具有獨特優(yōu)勢,能夠更有效地從中挖掘礦床與數(shù)據(jù)之間的深層次相關(guān)性[4],研究如何利用深度學(xué)習(xí)方法來組織和處理這些數(shù)據(jù)并進(jìn)行找礦預(yù)測具有十分重要的意義。
首先,利用地質(zhì)數(shù)據(jù)進(jìn)行找礦預(yù)測主要集中在化探異常識別和利用物探、化探數(shù)據(jù)進(jìn)行找礦遠(yuǎn)景區(qū)圈定等方面。例如:CHEN等[5]提出了采用一種空間約束自動編碼器(SCMA)方法來處理多元地球化學(xué)異常識別問題。LI等[6]利用元素地球化學(xué)數(shù)據(jù)二維卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行金礦找礦預(yù)測。WU等[7]采用遷移學(xué)習(xí)和孿生神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法提高了提取多元地球化學(xué)異常的能力。其次,綜合利用多種地質(zhì)數(shù)據(jù)進(jìn)行找礦遠(yuǎn)景區(qū)預(yù)測越來越受到專家和學(xué)者的重視。例如,李忠潭等[8]提出一種將航磁和地球化學(xué)數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行銅礦找礦預(yù)測的方法。
相比傳統(tǒng)的機器學(xué)習(xí)方法,深度學(xué)習(xí)方法具有特征工程自動化的優(yōu)點,模型經(jīng)過大量原始數(shù)據(jù)的訓(xùn)練就可達(dá)到特征自動提取并實現(xiàn)分類、預(yù)測等目的[9]。深度學(xué)習(xí)方法一般分為無監(jiān)督方法和有監(jiān)督方法兩大類。其中,無監(jiān)督方法是主要利用自編碼網(wǎng)絡(luò)等模型進(jìn)行多元地球化學(xué)異常識別并圈定找礦遠(yuǎn)景區(qū)的方法[10-12];有監(jiān)督方法方面,一維卷積神經(jīng)網(wǎng)絡(luò)和二維卷積神經(jīng)網(wǎng)絡(luò)等方法已被應(yīng)用到部分區(qū)域礦產(chǎn)資源的智能化預(yù)測評價工作中[13-18]。例如:DING等[19]提出了利用地質(zhì)、物探和化探數(shù)據(jù),通過孿生神經(jīng)網(wǎng)絡(luò)對有礦樣本和無礦樣本進(jìn)行對比來實現(xiàn)找礦預(yù)測的方法。
盡管上述方法均取得了一定的效果,但目前仍存在一些尚未解決的問題:①地質(zhì)圖中包含的重要信息在找礦預(yù)測中尚未被有效利用;②使用模型的精度不夠,獲得預(yù)測靶區(qū)的面積較大。因此,本文提出了一種基于地質(zhì)圖ONE-HOT編碼方法及深度殘差網(wǎng)絡(luò)模型的找礦預(yù)測方法,該方法通過將地質(zhì)圖中的地層、巖體進(jìn)行ONE-HOT編碼,形成二維數(shù)組,實現(xiàn)地質(zhì)圖信息的量化表示,并根據(jù)斷裂與網(wǎng)格單元的距離關(guān)系將地質(zhì)圖中的斷裂轉(zhuǎn)化為成礦影響強度,在一定程度上解決了以往無法有效利用地質(zhì)圖信息的問題,采用此方法在陜西石泉地區(qū)進(jìn)行了找礦預(yù)測研究。
1—第四系 2—石泉組 3—大楓溝巖組上段 4—大楓溝巖組中段 5—大楓溝巖組下段 6—石家溝巖組上段 7—石家溝巖組下段 8—梅子埡巖組上段 9—梅子埡巖組中段 10—梅子埡巖組下段 11—斑鳩關(guān)巖組上段 12—斑鳩關(guān)巖組中段 13—斑鳩關(guān)巖組下段 14—洞河巖組中段 15—箭竹壩巖組 16—耀嶺河組 17—楊坪巖組 18—輝長巖脈 19—中酸性花崗巖脈 20—地質(zhì)界線 21—角度不整合界線 22—性質(zhì)不明斷裂 23—韌性剪切斷裂 24—正斷裂 25—逆斷裂 26—金礦及編號 27—包含已知金礦的找礦遠(yuǎn)景區(qū) 28—不包含已知金礦的找礦遠(yuǎn)景區(qū)及編號 29—一級構(gòu)造單元界線 30—二級構(gòu)造單元界線 31—三級構(gòu)造單元界線 32—研究區(qū) Ⅲ1—秦嶺—大別山新元古代—中生代造山帶南秦嶺邊緣海盆留壩—旬陽晚古生代陸緣海盆舟曲—安康早古生代裂谷揚子陸塊北緣鎮(zhèn)巴弧形逆沖帶圖1 石泉地區(qū)地質(zhì)與金礦預(yù)測圖(A)及大地構(gòu)造位置圖(B)
研究區(qū)共發(fā)現(xiàn)金礦共15處(見表1,其中金礦編號與圖1-B相同),除寧陜縣堰溝金礦外,其余均分布在研究區(qū)中部斑鳩關(guān)巖組和梅子埡巖組中,呈北西向—南東向展布,主要受一系列脆韌性剪切帶及次級脆性斷裂控制[26-27]。
表1 石泉地區(qū)典型金礦統(tǒng)計結(jié)果
ONE-HOT編碼方法是對研究區(qū)地質(zhì)圖中的各地質(zhì)體進(jìn)行數(shù)量化表示。研究區(qū)共有19類地質(zhì)體,包括17類地層和2類侵入巖。將研究區(qū)以50 m×50 m網(wǎng)格化為383×477個網(wǎng)格,對每個網(wǎng)格用長度為19 m的一維ONE-HOT編碼數(shù)組進(jìn)行地質(zhì)體表示,如[0,0,0,1,…,0,0,0]。當(dāng)確定了每個網(wǎng)格單元的編碼后,將各網(wǎng)格單元地質(zhì)體的ONE-HOT編碼數(shù)組進(jìn)行組合得到1個三維數(shù)組,其形狀為(383,477,19),以此來數(shù)量化表示整個圖幅內(nèi)各網(wǎng)格的地質(zhì)體。為方便與地球化學(xué)數(shù)據(jù)疊加后輸入卷積神經(jīng)網(wǎng)絡(luò),將形狀為(383,477,19)的三維ONE-HOT編碼數(shù)組采用自編碼神經(jīng)網(wǎng)絡(luò)(AE)降維方法壓縮為(383,477)形狀的二維數(shù)組(見圖2)。
圖2 石泉地區(qū)地質(zhì)體編碼方法
成礦作用通常在斷裂或斷裂附近比較發(fā)育,隨著與斷裂距離的增加,成礦作用強度總體呈衰減趨勢??梢杂弥笖?shù)函數(shù)將與斷裂的距離表示成斷裂對成礦作用的影響強度(I),計算函數(shù)見式(1):
I=ae-bx
(1)
式中:a為影響的幅度值,取1.0;b為衰減系數(shù),其值越大,衰減速率越快,取0.1;x為與地質(zhì)要素的距離(m)[28]。
研究區(qū)斷裂影響強度見圖3。由圖3可知:除少數(shù)金礦外,大部分金礦都位于高或較高影響強度區(qū)附近,這與研究區(qū)金礦(化)體主要受脆韌性剪切斷裂及次級脆性斷裂控制的情況相符。
圖3 石泉地區(qū)斷裂影響強度
將研究區(qū)內(nèi)16種元素的1∶5萬水系沉積物地球化學(xué)數(shù)據(jù)以50 m×50 m為網(wǎng)格單元進(jìn)行網(wǎng)格化,繪制出了8種與成礦密切相關(guān)的元素等值線圖,結(jié)果見圖4。
圖4 石泉地區(qū)元素地球化學(xué)等值線圖
研究區(qū)內(nèi)Au元素地球化學(xué)場分布自東北至西南方向具有一定的分帶性,主要表現(xiàn)為中間高、南北低的地球化學(xué)場格局。高值區(qū)呈北西向分布于斑鳩關(guān)巖組和梅子埡巖組內(nèi),這2組地層為研究區(qū)內(nèi)金礦主要的賦礦地層。低值區(qū)主要分布于南部的洞河巖組內(nèi),北部大楓溝巖組亦有小面積分布。
Ag、Cu、Zn、As、Sb、Cd、Mo高值區(qū)沿泥盆系與志留系接觸界面下方分布,總體呈北西向展布。除上述高值區(qū)地段之外的廣大地區(qū)都為低值區(qū)。Ag低值區(qū)在東北部泥盆系地層中多呈團(tuán)塊狀分布,與地層走向不一致。Cu、Zn、Cd、Mo低值區(qū)分布在東北角泥盆系地層。在西南角,Cu、Zn高值區(qū)沿斑鳩關(guān)巖組、洞河巖組和元古代地層綠片巖相的斷裂接觸界線呈串珠狀分布,串珠之間多以背景區(qū)相連。As、Sb在西南角分布一致,高值區(qū)呈孤峰狀分布在斷裂交會處。
深度殘差網(wǎng)絡(luò)找礦預(yù)測方法是通過平移、旋轉(zhuǎn)、縮放等數(shù)據(jù)增強方法從網(wǎng)格化數(shù)據(jù)中獲取訓(xùn)練樣本,再對深度殘差網(wǎng)絡(luò)進(jìn)行訓(xùn)練及優(yōu)化超參數(shù)后獲得預(yù)測模型,最終將預(yù)測模型應(yīng)用于研究區(qū)金礦找礦預(yù)測任務(wù)。其關(guān)鍵步驟為:數(shù)據(jù)樣本集生成、模型構(gòu)建、模型訓(xùn)練與超參數(shù)優(yōu)化。ResNet神經(jīng)網(wǎng)絡(luò)預(yù)測模型找礦預(yù)測流程見圖5。
圖5 ResNet神經(jīng)網(wǎng)絡(luò)預(yù)測模型找礦預(yù)測流程
根據(jù)金礦與其所在區(qū)域的地球化學(xué)及地質(zhì)特征的相關(guān)性,將圍繞金礦獲取一定格網(wǎng)窗口大小的數(shù)據(jù)樣本作為正樣本,在無金礦的位置隨機選取一定格網(wǎng)窗口大小的數(shù)據(jù)樣本作為負(fù)樣本。僅利用研究區(qū)15個金礦生成的數(shù)據(jù)樣本很難訓(xùn)練出在全區(qū)具有泛化能力的預(yù)測模型。為獲得更多的數(shù)據(jù)樣本,對于每個金礦,通過窗口平移、縮放、旋轉(zhuǎn)等方式從不同位置、不同距離、不同角度對周圍的地球化學(xué)及地質(zhì)特征進(jìn)行樣本獲取(見圖6)。采用此種數(shù)據(jù)增強方法在研究區(qū)共獲得了26 611個數(shù)據(jù)樣本。
圖6 通過格網(wǎng)窗口平移生成更多數(shù)據(jù)樣本的方法
相比于普通的卷積神經(jīng)網(wǎng)路(CNN),深度殘差網(wǎng)絡(luò)引入了跨層的恒等連接,使得網(wǎng)絡(luò)模型更容易被訓(xùn)練[20]。通過恒等連接,中間層被跳過,使深度網(wǎng)絡(luò)更容易被訓(xùn)練,恒等映射不貢獻(xiàn)任何額外的參數(shù)[29]。深度殘差網(wǎng)絡(luò)模型不是直接堆疊層以滿足特定的底層映射F(x),而是堆疊層以適應(yīng)殘差映射H(x),讓H(x)表示所需的底層映射,從而使得網(wǎng)絡(luò)映射[20]:
F(x)=H(x)-x
(2)
轉(zhuǎn)化為:
H(x)=F(x)+x
(3)
考慮到多維地質(zhì)數(shù)據(jù)不同于圖像數(shù)據(jù),本文采用的基本殘差單元去除了批規(guī)范(Batch Normalization,BN)層,避免BN層將網(wǎng)絡(luò)學(xué)習(xí)的地質(zhì)數(shù)據(jù)特征進(jìn)行強制歸一化,造成數(shù)據(jù)損失。本文構(gòu)建的深度殘差網(wǎng)絡(luò)找礦預(yù)測模型由6個殘差單元構(gòu)成(見圖7)。優(yōu)化器選擇Adam優(yōu)化器,學(xué)習(xí)率初始化為0.001,并在訓(xùn)練過程中逐步降低。
圖7 深度殘差網(wǎng)絡(luò)找礦預(yù)測模型架構(gòu)
利用從地球化學(xué)、斷裂及地質(zhì)體在網(wǎng)格化數(shù)據(jù)中獲取的數(shù)據(jù)樣本,對ResNet神經(jīng)網(wǎng)絡(luò)預(yù)測模型進(jìn)行100輪訓(xùn)練。其中,75 %的數(shù)據(jù)用于模型訓(xùn)練,25 %的數(shù)據(jù)用于模型驗證。為確定最優(yōu)超參數(shù),在訓(xùn)練過程中將各超參數(shù)設(shè)定一系列的預(yù)設(shè)值,通過對比試驗結(jié)果確定最優(yōu)值。
3.3.1 AE數(shù)據(jù)壓縮維度
由于經(jīng)網(wǎng)格化后的數(shù)據(jù)量較大,模型不易收斂。因此,采用自編碼神經(jīng)網(wǎng)絡(luò)(AE)數(shù)據(jù)壓縮方法在模型訓(xùn)練前對數(shù)據(jù)進(jìn)行壓縮。將格網(wǎng)窗口規(guī)定為16×16網(wǎng)格數(shù),進(jìn)行數(shù)據(jù)壓縮維度參數(shù)分別為3,5,7,9的對比試驗,結(jié)果見表2。由表2可知:當(dāng)AE數(shù)據(jù)壓縮維度為7時,在保證數(shù)據(jù)量少的同時,找礦遠(yuǎn)景區(qū)面積占比(7.12 %)也較小。因此,訓(xùn)練時將AE數(shù)據(jù)壓縮維度設(shè)置為7。
3.3.2 格網(wǎng)窗口大小
格網(wǎng)窗口大小對結(jié)果有一定的影響,窗口越小,通過數(shù)據(jù)增強所得到的訓(xùn)練數(shù)據(jù)就越少;窗口越大,找礦遠(yuǎn)景區(qū)面積也會越大。將數(shù)據(jù)壓縮維度設(shè)置為7,對不同窗口大小8×8、16×16、24×24和32×32(網(wǎng)格數(shù))的數(shù)據(jù)進(jìn)行對比,結(jié)果見表3。當(dāng)格網(wǎng)窗口大小為16×16(網(wǎng)格數(shù))時,模型驗證精度最高,為99.64 %,且找礦遠(yuǎn)景區(qū)面積占比較小,為6.54 %。因此,格網(wǎng)窗口大小最優(yōu)值為16×16。
表3 格網(wǎng)窗口大小對預(yù)測結(jié)果的影響
3.3.3 batch_size參數(shù)
合適的batch_size值能夠使模型訓(xùn)練收斂最快或者收斂效果最好。將數(shù)據(jù)壓縮維度設(shè)為7,窗口大小設(shè)為16×16(網(wǎng)格數(shù))后,分別進(jìn)行了batch_size為32,64,128和256 4種情況的對比試驗。當(dāng)batch_size為128時,驗證精度(99.64 %)達(dá)到最優(yōu),且找礦遠(yuǎn)景區(qū)面積占比最小,為6.54 %(見表4)。因此,batch_size最優(yōu)為128。
表4 batch_size對預(yù)測結(jié)果的影響
用試驗篩選出的最優(yōu)參數(shù),數(shù)據(jù)壓縮維度為7,窗口大小為16×16(網(wǎng)格數(shù)),batch_szie為128,對預(yù)測模型進(jìn)行訓(xùn)練,結(jié)果見圖8。由圖8可知:模型經(jīng)過50輪訓(xùn)練后,模型精度趨于穩(wěn)定,此時驗證集精度約為99.6 %。最后,將預(yù)測模型應(yīng)用于研究區(qū)進(jìn)行金礦找礦預(yù)測,經(jīng)過多次預(yù)測結(jié)果的綜合分析,共圈定19處找礦遠(yuǎn)景區(qū)(見圖1)。其中,11處找礦遠(yuǎn)景區(qū)包含已知金礦,8處找礦遠(yuǎn)景區(qū)為不包含已知金礦的新找礦遠(yuǎn)景區(qū),新找礦遠(yuǎn)景區(qū)特征如下。
圖8 模型訓(xùn)練精度曲線
P-1找礦遠(yuǎn)景區(qū):該找礦遠(yuǎn)景區(qū)位于溫家溝南部,北西向斷裂較為發(fā)育,地層主要為斑鳩關(guān)巖組;該區(qū)存在Zn、As、Cd元素異常高值區(qū),具有良好的找礦潛力。
P-2找礦遠(yuǎn)景區(qū):該找礦遠(yuǎn)景區(qū)位于溫家溝南部,地層主要為斑鳩關(guān)巖組和梅子埡巖組,該區(qū)為Ag、Cu、Zn、As、Cd元素異常高值區(qū)。
P-3找礦遠(yuǎn)景區(qū):該找礦遠(yuǎn)景區(qū)位于北西向珍珠河—酒店韌性剪切斷裂內(nèi),地層主要為斑鳩關(guān)巖組,巖性為泥砂質(zhì)結(jié)晶灰?guī)r夾石榴石二云石英片巖、鈣質(zhì)黑云卷云石英片巖;該區(qū)存在Au、Ag、As、Mo元素異常高值區(qū)。
P-4找礦遠(yuǎn)景區(qū):該找礦遠(yuǎn)景區(qū)位于北西向珍珠河—酒店韌性剪切斷裂內(nèi),地層主要為斑鳩關(guān)巖組,巖性為泥砂質(zhì)結(jié)晶灰?guī)r夾石榴石二云石英片巖、鈣質(zhì)黑云卷云石英片巖;該區(qū)存在Ag、As、Mo元素異常高值區(qū)。
P-5、P-6找礦遠(yuǎn)景區(qū):該找礦遠(yuǎn)景區(qū)位于平定寨北部,北西向斷裂較為發(fā)育,地層主要為斑鳩關(guān)巖組,巖性為炭質(zhì)絹云石英片巖、黑色石英巖和黑云母絹云石英片巖,存在Ag、As、Mo元素異常高值區(qū)。
P-7找礦遠(yuǎn)景區(qū):該找礦遠(yuǎn)景區(qū)位于干飯溝東北部,受北西向斷裂影響,主要地層為斑鳩關(guān)巖組和梅子埡巖組;該區(qū)存在Ag、Cu、Zn、As、Cd、Mo元素異常高值區(qū)。
P-8找礦遠(yuǎn)景區(qū):該找礦遠(yuǎn)景區(qū)主要位于北西向珍珠河—酒店韌性剪切斷裂內(nèi),地層主要為斑鳩關(guān)巖組、梅子埡巖組;該找礦遠(yuǎn)景區(qū)為石英脈韌性變形與脆性變形強硅化區(qū),Au、Ag、Sb元素異常明顯。
為對比地質(zhì)圖ONE-HOT編碼數(shù)據(jù)和斷裂影響強度數(shù)據(jù)的預(yù)測效果,構(gòu)建了3種數(shù)據(jù)集,分別為地球化學(xué)數(shù)據(jù)、斷裂影響強度+地質(zhì)圖ONE-HOT編碼數(shù)據(jù)、地球化學(xué)+斷裂影響強度+地質(zhì)圖ONE-HOT編碼數(shù)據(jù),來討論地質(zhì)圖數(shù)據(jù)對預(yù)測結(jié)果的影響,結(jié)果見圖9。
圖9 石泉地區(qū)3種數(shù)據(jù)集金礦預(yù)測結(jié)果對比圖
使用地球化學(xué)數(shù)據(jù)預(yù)測時,找礦遠(yuǎn)景區(qū)僅僅是依據(jù)區(qū)域地球化學(xué)異常得到的,表現(xiàn)出找礦遠(yuǎn)景區(qū)面積較大且分布散亂。使用斷裂影響強度+地質(zhì)圖ONE-HOT編碼數(shù)據(jù)時,找礦遠(yuǎn)景區(qū)呈條帶狀,與地層展布方向和斷裂走向一致,但未加入地球化學(xué)數(shù)據(jù)進(jìn)行控制,找礦遠(yuǎn)景區(qū)面積較大且多處找礦遠(yuǎn)景區(qū)未包含已知金礦。綜合利用地球化學(xué)+斷裂影響強度+地質(zhì)圖ONE-HOT編碼數(shù)據(jù)后,多數(shù)已知金礦包含在找礦遠(yuǎn)景區(qū)內(nèi),且找礦遠(yuǎn)景區(qū)主要分布在梅子埡巖組和斑鳩關(guān)巖組中,且在斷裂附近。此時找礦遠(yuǎn)景區(qū)面積(占比6.5 %)最小。
采用證據(jù)權(quán)重法、CNN及ResNet3種方法對陜西石泉迎豐街地區(qū)進(jìn)行找礦預(yù)測,結(jié)果見表5、圖10。3種方法的找礦遠(yuǎn)景區(qū)均呈北西向展布,且斷裂走向一致。ResNet方法相比其他方法具有更好的預(yù)測精度和最小的找礦遠(yuǎn)景區(qū)面積。
表5 3種方法的預(yù)測結(jié)果對比
圖10 石泉地區(qū)3種方法金礦預(yù)測結(jié)果對比圖
1)通過地質(zhì)圖ONE-HOT編碼網(wǎng)格化及斷裂影響強度網(wǎng)格化,實現(xiàn)了將巖性和斷裂信息加入基于深度學(xué)習(xí)方法的找礦預(yù)測過程,有效利用了已有地質(zhì)數(shù)據(jù)。
2)在融合地球化學(xué)和地質(zhì)數(shù)據(jù)后,采用基于深度殘差網(wǎng)絡(luò)找礦預(yù)測方法提高了找礦預(yù)測的精度和可靠性。與證據(jù)權(quán)重法和CNN預(yù)測方法比較,深度殘差網(wǎng)絡(luò)找礦預(yù)測模型可以獲得更高的預(yù)測精度和更小的找礦遠(yuǎn)景范圍。
3)基于深度殘差網(wǎng)絡(luò)模型在石泉地區(qū)圈定了8處新的找礦遠(yuǎn)景區(qū),為在該區(qū)進(jìn)一步開展金礦找礦提供了新的方向。