畢明麗
(長(zhǎng)春工程學(xué)院勘查與測(cè)繪工程學(xué)院,長(zhǎng)春 130021)
礦產(chǎn)資源勘探中,當(dāng)前易于尋找的地表礦已逐漸減少,找礦難度增大且成本提高,為滿足人類日益增長(zhǎng)的礦產(chǎn)資源需求,降低找礦成本,找礦工作重點(diǎn)已逐步由淺部礦、隱伏礦向難度更大的深部找礦發(fā)展,深部找礦成為現(xiàn)階段主要的礦產(chǎn)勘探趨勢(shì),這就要求加強(qiáng)對(duì)成礦規(guī)律的研究,形成較為完全的成礦理論,研究出新的成礦預(yù)測(cè)方法,提高礦產(chǎn)勘探效率。區(qū)域深部成礦預(yù)測(cè)已成為礦產(chǎn)勘探領(lǐng)域的熱點(diǎn),為眾多地質(zhì)學(xué)家所關(guān)注[1]。
王耀升等[2]以南泥湖鉬多金屬礦田為對(duì)象進(jìn)行找礦預(yù)測(cè)研究,確定了與成礦關(guān)系密切的隱伏巖體侵入模型,根據(jù)成礦空間位置分布的差異建立成礦模型和找礦模型,獲取了有利的成礦區(qū)域,完成了找礦預(yù)測(cè),但該方法的成礦預(yù)測(cè)準(zhǔn)確率不高;謝迎春等[3]為尋找隱伏礦等新資源,利用遙感影像與信息集成技術(shù),對(duì)研究區(qū)域的地質(zhì)特征進(jìn)行分析,建立地質(zhì)信息預(yù)測(cè)模型,但成礦預(yù)測(cè)精度較低;郝興中等[4]分析了長(zhǎng)江中下游成礦帶的地球物理學(xué)特征,指出巨礦形成的根本原因是地幔流通道因素,以此發(fā)現(xiàn)巨礦帶形成的根本原因,完成成礦預(yù)測(cè),但該方法計(jì)算中,參數(shù)選取不佳,導(dǎo)致預(yù)測(cè)精度不高;張曉華等[5]依據(jù)成礦特點(diǎn)分析了金屬異?;顒?dòng)態(tài)機(jī)制,構(gòu)建金屬異?;顒?dòng)模式,劃定出了遠(yuǎn)景成礦區(qū),但未能很好的優(yōu)化預(yù)測(cè)中的參數(shù),影響了預(yù)測(cè)結(jié)果。文獻(xiàn)[6]以遙感影像和遙感地質(zhì)解析方法為基礎(chǔ)研究金屬成礦問題,根據(jù)不同的遙感地質(zhì)解析規(guī)模和成礦地質(zhì)條件,劃分了不同級(jí)別的找礦預(yù)測(cè)區(qū),但存在預(yù)測(cè)效率不高的問題;文獻(xiàn)[7]提出了一種新的、綜合的斑巖-硅卡巖-低溫?zé)嵋旱V床模型,該模型解釋了地質(zhì)背景、礦石特征、成礦分帶以及北亞地區(qū)礦床成礦過程,但預(yù)測(cè)過程效率低;文獻(xiàn)[8]詳細(xì)分析了喀爾汗輝長(zhǎng)巖體的地質(zhì)構(gòu)造及金屬成礦前景,給出了硫化物成礦帶中金屬分布情況,幫助實(shí)現(xiàn)成礦預(yù)測(cè),但該方法的預(yù)測(cè)度較低。
為此,提出多金屬礦產(chǎn)綜合信息區(qū)域深部成礦預(yù)測(cè)方法,提取了區(qū)域深部成礦信息,通過GIS技術(shù)建立成礦數(shù)據(jù)庫(kù),通過證據(jù)權(quán)模型獲取控礦因素的最優(yōu)緩沖距離,基于參數(shù)優(yōu)化的支持向量機(jī)實(shí)現(xiàn)成礦預(yù)測(cè),并通過實(shí)驗(yàn)驗(yàn)證了所提方法的性能,表明方法能夠高精度的完成成礦預(yù)測(cè)。
對(duì)深部區(qū)域成礦預(yù)測(cè)中,應(yīng)首先建立多金屬礦綜合信息庫(kù),便于提供數(shù)據(jù)信息,幫助完成成礦預(yù)測(cè)。采用地理信息系統(tǒng)(geographic information system,GIS)建立多金屬礦綜合信息庫(kù),成礦預(yù)測(cè)過程中,依據(jù)GIS的計(jì)算機(jī)信息輔助功能對(duì)多金屬礦綜合信息統(tǒng)一管理[9-10]。
采集金屬、礦產(chǎn)、遙感以及地質(zhì)等信息,建立統(tǒng)一地理坐標(biāo)系下的GIS信息庫(kù),該數(shù)據(jù)庫(kù)的前期數(shù)據(jù)采集工作主要通過矢量化生成方式進(jìn)行,即通過GIS獲取遙感圖像,將圖像信息進(jìn)行數(shù)字化處理,生成三維數(shù)據(jù)模型。采集得到多金屬礦的綜合數(shù)據(jù)信息后,將GIS信息庫(kù)劃分為三層結(jié)構(gòu),對(duì)應(yīng)輸入數(shù)據(jù)信息。三層結(jié)構(gòu)分別為第一層遙感圖像數(shù)據(jù)文件,對(duì)GIS遙感圖像進(jìn)行存儲(chǔ);第二層子庫(kù)數(shù)據(jù),包括地理圖像數(shù)據(jù)庫(kù)、地址數(shù)據(jù)庫(kù)、物探數(shù)據(jù)庫(kù)等;第三層主要針對(duì)多項(xiàng)圖層數(shù)據(jù)進(jìn)行存儲(chǔ)。
區(qū)域深部的成礦信息是指能夠識(shí)別礦床賦存的綜合地質(zhì)信息和對(duì)成礦信息進(jìn)行提取,有利于準(zhǔn)確的完成成礦預(yù)測(cè)。GIS技術(shù)的出現(xiàn),促使成礦信息朝向數(shù)字化方向發(fā)展,依據(jù)上述建立的GIS多金屬礦綜合信息庫(kù)提取區(qū)域深部成礦信息。主要通過建立證據(jù)權(quán)模型,分析多金屬礦床與標(biāo)志圖層的關(guān)系,確定控礦因素的最優(yōu)緩沖距離來完成區(qū)域深部成礦信息提取[11-12]。
通常對(duì)于成礦過程而言,地質(zhì)要素本身以及其周邊范圍要素均會(huì)產(chǎn)生一定的作用,由此可建立證據(jù)權(quán)模型,獲取控礦因素的最優(yōu)緩沖距離,便于構(gòu)建最優(yōu)證據(jù)圖層,完成區(qū)域深部礦產(chǎn)預(yù)測(cè)。在GIS中,證據(jù)權(quán)模型具有多金屬礦產(chǎn)資源數(shù)字化分析功能,主要通過圖層統(tǒng)計(jì)實(shí)現(xiàn),為區(qū)域深部成礦提供了很好的依據(jù)。證據(jù)權(quán)模型能夠?qū)⒍嘟饘俚V床與標(biāo)志圖層相聯(lián)系,其中標(biāo)志圖層使用數(shù)字“0”和“1”表示,“0”表示地質(zhì)標(biāo)志不存在,“1”表示地質(zhì)標(biāo)志存在,用于展示多金屬礦床的存在與否[13]。
建立證據(jù)權(quán)模型的步驟如下。
將控礦地質(zhì)因素表示為Xm,其中m為控礦地質(zhì)因素?cái)?shù)量,假設(shè)Y為深部區(qū)域待預(yù)測(cè)單元,Wi為不同數(shù)量控礦地質(zhì)因素的權(quán)系數(shù),X1與X2之間相互獨(dú)立,則后驗(yàn)概率與權(quán)系數(shù)的關(guān)系可表示為
(1)
式(1)中:P(Y|Xm)表示Y的后驗(yàn)概率。其中權(quán)系數(shù)Wi可表示為
Wi=ln[P(Xi|Y1)/P(Xi|Y2)],i=0,1,…,m
(2)
(3)
(4)
則控礦地質(zhì)因素的對(duì)比度R可表示為
(5)
若R為正數(shù),表示控礦地質(zhì)因素與待預(yù)測(cè)單元呈現(xiàn)正相關(guān)關(guān)系;若R為負(fù)數(shù),表示控礦地質(zhì)因素與待預(yù)測(cè)單元呈現(xiàn)負(fù)相關(guān)關(guān)系;根據(jù)對(duì)比度R的正負(fù)取值可確定控礦地質(zhì)因素的最優(yōu)緩沖距離[14]。
對(duì)比度R的計(jì)算方式適用于礦點(diǎn)數(shù)量較多的情況,在礦點(diǎn)數(shù)量較少的情況下,僅通過計(jì)算對(duì)比度R獲取的結(jié)果不夠精確,由此需要計(jì)算R的顯著性統(tǒng)計(jì)量Stud(R):
(6)
根據(jù)上述步驟獲取控礦地質(zhì)因素的最優(yōu)緩沖距離,則表示完成了證據(jù)權(quán)模型的構(gòu)建。
根據(jù)2.1節(jié)建立的證據(jù)權(quán)模型獲取最大的緩沖距離,將其當(dāng)作最優(yōu)證據(jù)圖層,從而提取成礦信息?;谧C據(jù)權(quán)模型實(shí)現(xiàn)區(qū)域深部成礦信息提取的流程如下。
(1)對(duì)研究區(qū)域進(jìn)行網(wǎng)格化劃分,分為100 m×100 m的單元網(wǎng)格,保證每個(gè)單元網(wǎng)格的礦點(diǎn)不超過1個(gè)。將證據(jù)圖層劃分為地質(zhì)因素圖層、網(wǎng)格圖層和礦點(diǎn)分布圖層三部分。
(2)在不同緩沖距離下,對(duì)地質(zhì)因素圖層的含礦情況進(jìn)行分析。
(3)依次對(duì)網(wǎng)格圖層和礦點(diǎn)分布圖層的礦點(diǎn)數(shù)目進(jìn)行計(jì)算,并與地質(zhì)因素圖層進(jìn)行疊加分析,計(jì)算得出證據(jù)圖層含礦單元總數(shù)[15-16]。根據(jù)含礦單元數(shù)量計(jì)算統(tǒng)計(jì)量Stud(R),選取顯著性統(tǒng)計(jì)量Stud(R)最大時(shí)的緩沖距離作為最優(yōu)緩沖距離。
區(qū)域深部成礦信息提取的流程圖如圖1所示。
圖1 成礦信息提取流程圖Fig.1 Flowchart of metallogenic information extraction
基于提取得到的成礦信息,使用支持向量機(jī)完成區(qū)域深部礦產(chǎn)預(yù)測(cè)。支持向量機(jī)是基于統(tǒng)計(jì)學(xué)的一種分類方法,目前被廣泛認(rèn)為是一種有效的預(yù)測(cè)方法,在面對(duì)小樣本、高維數(shù)據(jù)條件下具有非常優(yōu)秀的性能[17]。
利用支持向量機(jī)進(jìn)行成礦預(yù)測(cè),主要是構(gòu)建一個(gè)能夠?qū)⒊傻V點(diǎn)和非成礦點(diǎn)區(qū)分開來的目標(biāo)函數(shù),獲取一個(gè)最優(yōu)分類平面。
支持向量機(jī)預(yù)測(cè)的關(guān)鍵是獲取最優(yōu)參數(shù),使用遺傳算法優(yōu)化支持向量機(jī)參數(shù),遺傳算法是一種隨機(jī)搜索優(yōu)化方法,過程中主要使用適應(yīng)度函數(shù)進(jìn)行計(jì)算,通過對(duì)生物群體迭代篩選獲取最優(yōu)參數(shù),遺傳算法具有簡(jiǎn)單便捷、尋優(yōu)范圍廣等優(yōu)勢(shì)。利用遺傳算法進(jìn)行支持向量機(jī)參數(shù)優(yōu)化,主要包括問題編碼、適應(yīng)度函數(shù)計(jì)算和遺傳運(yùn)算三部分,具體步驟如下。
(1)對(duì)懲罰因子C進(jìn)行初始化,并對(duì)其進(jìn)行二進(jìn)制編碼處理。
(2)使用支持向量機(jī)對(duì)二進(jìn)制編碼后的初始種群進(jìn)行訓(xùn)練,依據(jù)訓(xùn)練得到的數(shù)據(jù)計(jì)算種群個(gè)體的適應(yīng)度。
(3)隨機(jī)設(shè)置遺傳算法中的迭代次數(shù)、交叉概率等參數(shù),結(jié)合適應(yīng)度計(jì)算結(jié)果獲取新的種群,然后再重新計(jì)算新種群的適應(yīng)度。
(4)直至迭代完成,輸出適應(yīng)度最大的種群個(gè)體,即表示完成了參數(shù)優(yōu)化。
根據(jù)上述步驟完成支持向量機(jī)參數(shù)尋優(yōu),獲取最優(yōu)懲罰因子C,再利用徑向基核函數(shù)進(jìn)行數(shù)據(jù)集樣本計(jì)算,即可獲取預(yù)測(cè)結(jié)果,完成區(qū)域深部成礦預(yù)測(cè)。
利用GIS技術(shù)獲取吉林省臨江市東港地區(qū)的銅礦床數(shù)據(jù)集,將其作為研究對(duì)象,圖2為吉林省東港地區(qū)的找礦靶區(qū)預(yù)測(cè)圖。
1為船底山組;2為晚侏羅世-早白堊世石人組;3為晚三疊世長(zhǎng)白組;4為古元古代老嶺群珍珠門組;5為晚三疊世二長(zhǎng)花崗巖;6為古元古代片麻狀英云閃長(zhǎng)巖;7為花崗斑巖;8為閃長(zhǎng)巖脈;9為閃長(zhǎng)玢巖;10為同性剪切帶;11為實(shí)測(cè)及推測(cè)斷層;12為土壤地球化學(xué)測(cè)量異常及編號(hào);13為激電異常及編號(hào);14為綜合成礦預(yù)測(cè)靶區(qū)及編號(hào)圖2 東港地區(qū)找礦靶區(qū)預(yù)測(cè)圖Fig.2 Prediction of prospecting target area in Donggang area
將該地區(qū)的成礦預(yù)測(cè)靶區(qū)分為了3個(gè),其中ZHBQ-1位于該地區(qū)西北部,預(yù)測(cè)面積為1.32 km2。主體位于晚三疊二長(zhǎng)花崗巖、長(zhǎng)白組地層和古元古代片麻狀英云閃長(zhǎng)巖這三者接觸帶上以及其附近,另外,此處局部地區(qū)地段可見北東向韌性剪切帶,經(jīng)探測(cè)存在銅礦的可能性最大。
綜合該地區(qū)地質(zhì)背景,ZHBQ-1靶區(qū)具有更好的成礦地質(zhì)條件,是進(jìn)行預(yù)測(cè)成礦可能性較好的位置,因此選定次預(yù)測(cè)靶區(qū)為預(yù)測(cè)區(qū)域進(jìn)行預(yù)測(cè)。在該靶區(qū)構(gòu)建了多金屬銅礦綜合信息庫(kù),構(gòu)建的數(shù)據(jù)樣本包含100 個(gè)數(shù)據(jù)集,在構(gòu)建支持向量機(jī)模型時(shí),通常需要等量的正負(fù)樣本,因此設(shè)置100 個(gè)數(shù)據(jù)樣本中的50 個(gè)為礦點(diǎn)數(shù)據(jù)樣本,50 個(gè)為非礦點(diǎn)數(shù)據(jù)樣本。按照100 m×100 m的單元網(wǎng)格劃分研究區(qū)域,將每個(gè)網(wǎng)格看作一個(gè)礦點(diǎn)。為更好地利用樣本數(shù)據(jù)進(jìn)行算法性能測(cè)試,保障實(shí)驗(yàn)過程的穩(wěn)定進(jìn)行,對(duì)100 個(gè)數(shù)據(jù)樣本進(jìn)行無放回抽樣,按照 5:3:2 的比例構(gòu)建不同數(shù)量的樣本數(shù)據(jù)集,如表1所示。
實(shí)驗(yàn)在MATLAB環(huán)境中進(jìn)行,操作系統(tǒng)為Windows10,中央處理器為i7,頻率為3.2 GHz。
根據(jù)實(shí)驗(yàn)環(huán)境和數(shù)據(jù)的設(shè)置,對(duì)該區(qū)域深部礦產(chǎn)進(jìn)行實(shí)驗(yàn)測(cè)試,得到的成礦預(yù)測(cè)結(jié)果如圖3所示。
根據(jù)圖3可以看出,方法預(yù)測(cè)得到的成礦點(diǎn)較多,且大多分布在有礦區(qū),表明預(yù)測(cè)方法具有一定的可行性。
表1 樣本數(shù)據(jù)集Table 1 Sample dataset
圖3 成礦預(yù)測(cè)結(jié)果Fig.3 Metallogenic prediction results
為充分驗(yàn)證成礦預(yù)測(cè)方法的有效性,選取以下實(shí)驗(yàn)指標(biāo)進(jìn)行分析。
(1)最優(yōu)緩沖距離計(jì)算準(zhǔn)確率:成礦信息提取中,獲取最優(yōu)緩沖距離是主要需要實(shí)現(xiàn)的目標(biāo),對(duì)最優(yōu)緩沖距離計(jì)算準(zhǔn)確率進(jìn)行實(shí)驗(yàn)分析,驗(yàn)證成礦信息提取結(jié)果的優(yōu)劣。
(2)參數(shù)優(yōu)化耗時(shí):基于支持支持向量機(jī)進(jìn)行成礦預(yù)測(cè)的關(guān)鍵是獲取最優(yōu)參數(shù),對(duì)參數(shù)優(yōu)化耗時(shí)進(jìn)行對(duì)比分析,能夠很好的驗(yàn)證預(yù)測(cè)方法的性能。
(3)成礦預(yù)測(cè)精度:在線性可分和線性不可分條件下,分別對(duì)成礦預(yù)測(cè)結(jié)果的精度進(jìn)行分析,與文獻(xiàn)[3-5]方法進(jìn)行對(duì)比。
(4)預(yù)測(cè)度:預(yù)測(cè)度是指在固定區(qū)域面積中能夠預(yù)測(cè)得到的已知礦點(diǎn),能夠反映成礦預(yù)測(cè)的效率,預(yù)測(cè)度曲線的橫坐標(biāo)為研究區(qū)域面積百分比,縱坐標(biāo)為預(yù)測(cè)得到的已知礦點(diǎn)數(shù)量。
以最優(yōu)緩沖距離計(jì)算準(zhǔn)確率為指標(biāo),對(duì)本文方法與文獻(xiàn)[4- 6]方法進(jìn)行對(duì)比,結(jié)果如表2所示。
分析表2可以看出,利用本文方法計(jì)算最優(yōu)緩沖距離,在任意數(shù)據(jù)組別下,準(zhǔn)確率均在90%以上,文獻(xiàn)[4]方法的最高計(jì)算準(zhǔn)確率為70%,文獻(xiàn)[5]方法的最高計(jì)算準(zhǔn)確率為75%,文獻(xiàn)[6]為80%。由表2可以看出,本文方法具有一定的優(yōu)勢(shì),能夠很好地完成成礦信息提取,因?yàn)槭褂米C據(jù)權(quán)模型進(jìn)行分析,能夠數(shù)字化統(tǒng)計(jì)成礦相關(guān)信息,獲取最優(yōu)緩沖距離,構(gòu)建最優(yōu)證據(jù)圖層。
表2 最優(yōu)緩沖距離計(jì)算準(zhǔn)確率對(duì)比Table 2 Comparison of accuracy in calculating optimal buffer distance
采用支持向量機(jī)進(jìn)行成礦預(yù)測(cè),對(duì)懲罰因子C進(jìn)行優(yōu)化處理,提高預(yù)測(cè)結(jié)果的精度。對(duì)參數(shù)優(yōu)化耗時(shí)進(jìn)行對(duì)比分析,結(jié)果如圖4所示。
圖4 參數(shù)優(yōu)化耗時(shí)對(duì)比Fig.4 Comparison of parameter optimization time
根據(jù)圖4可知,文獻(xiàn)[5-7]方法的參數(shù)優(yōu)化耗時(shí)分布在6~12 s,而本文方法的參數(shù)優(yōu)化耗時(shí)最高不超過6 s,平均水平在4 s左右,由此可見,利用遺傳算法優(yōu)化支持向量機(jī)參數(shù),獲取了較好的結(jié)果,能夠快速完成參數(shù)優(yōu)化,從而盡快完成成礦預(yù)測(cè)。
數(shù)據(jù)線性可分和線性不可分條件下,方法與文獻(xiàn)[3-5]方法的成礦預(yù)測(cè)精度結(jié)果如表3所示。
表3 成礦預(yù)測(cè)精度對(duì)比Table 3 Comparison of metallogenic prediction accuracy
分析表3可以看出,在數(shù)據(jù)線性可分和線性不可分條件下,本文方法的預(yù)測(cè)精度基本不受影響,均在90%以上,而文獻(xiàn)[3-5]方法則會(huì)受到影響,尤其是文獻(xiàn)[5]方法,在數(shù)據(jù)線性可分條件下,文獻(xiàn)[5]方法的預(yù)測(cè)精度可達(dá)89%,但在數(shù)據(jù)線性不可分條件下,文獻(xiàn)[5]方法的預(yù)測(cè)精度不超過66%,具有明顯的差距。通過上述數(shù)據(jù)分析可以看出,利用支持向量機(jī)引入?yún)?shù)的方法,能夠很好的解決數(shù)據(jù)線性不可分問題,進(jìn)而實(shí)現(xiàn)高精度成礦預(yù)測(cè)。
以預(yù)測(cè)度為指標(biāo),將本文方法與文獻(xiàn)[6- 8]方法進(jìn)行對(duì)比,結(jié)果如圖5所示。
圖5 預(yù)測(cè)度對(duì)比Fig.5 Comparison of forecasting degrees
分析圖5可以看出,本文方法的預(yù)測(cè)度曲線最靠近左上方,即本文方法在固定區(qū)域面積內(nèi),能夠預(yù)測(cè)得到的已知礦點(diǎn)數(shù)量最多,預(yù)測(cè)效率最高。而文獻(xiàn)[6- 8]方法的預(yù)測(cè)度曲線雖然與本文方法的曲線走勢(shì)一致,但始終低于本文方法,表明本文方法的預(yù)測(cè)性能優(yōu)越。
區(qū)域深部成礦預(yù)測(cè)具有非常重要的現(xiàn)實(shí)意義,針對(duì)目前成礦預(yù)測(cè)要求的逐步提升,尋找一種精確的成礦預(yù)測(cè)方法迫在眉睫。提出多金屬礦產(chǎn)綜合信息區(qū)域深部成礦預(yù)測(cè)方法,采集金屬、礦產(chǎn)、遙感以及地質(zhì)等信息,建立統(tǒng)一地理坐標(biāo)系下的GIS信息庫(kù),通過圖層統(tǒng)計(jì)實(shí)現(xiàn)證據(jù)權(quán)模型金屬礦產(chǎn)資源數(shù)字化分析功能等,并利用支持向量機(jī)完成成礦預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,本文方法在最優(yōu)緩沖距離計(jì)算準(zhǔn)確率、支持向量機(jī)參數(shù)優(yōu)化耗時(shí)、成礦預(yù)測(cè)精度以及預(yù)測(cè)度等方法均優(yōu)于傳統(tǒng)方法,能夠高精度完成成礦預(yù)測(cè),為以后相關(guān)方面的研究提供了可參考依據(jù)。