韓 磊,何 超,黃 潔,楊顯華,田 立
?
基于GF-2衛(wèi)星數(shù)據(jù)的礦山開發(fā)信息自動(dòng)提取
韓 磊1,2,何 超1,2,黃 潔1,2,楊顯華1,2,田 立1,2
(1. 稀有稀土戰(zhàn)略資源評價(jià)與利用四川省重點(diǎn)實(shí)驗(yàn)室,成都 610081;2. 四川省地質(zhì)調(diào)查院,成都 610081)
我國高分系列衛(wèi)星數(shù)據(jù)因具有重訪周期短、價(jià)格低廉、精度較高的特點(diǎn),在礦山開發(fā)監(jiān)測工作中得到了廣泛的應(yīng)用。本文在深入了解高分二號衛(wèi)星數(shù)據(jù)特征的基礎(chǔ)上,以甘肅永登縣為例,利用機(jī)器學(xué)習(xí)模型中支持向量機(jī)算法(Support Vector Machine,SVM)自動(dòng)提取礦山開發(fā)信息,在處理的遙感影像上進(jìn)行樣本采集,借Matlab平臺(tái)對樣本及影像數(shù)據(jù)進(jìn)行歸一化、降維處理(PCA)。利用SVM模型進(jìn)行信息自動(dòng)提取過程中,選取徑向基核函數(shù)(RBF),運(yùn)用量子粒子群算法進(jìn)行參數(shù)尋優(yōu),最終對提取結(jié)果進(jìn)行野外調(diào)查。查證結(jié)果表明利用SVM模型進(jìn)行礦山開發(fā)信息自動(dòng)提取是可行的。該研究為國產(chǎn)數(shù)據(jù)在礦山監(jiān)測應(yīng)用中提供了新的思路。
遙感影像;礦山開發(fā)信息;自動(dòng)提?。恢С窒蛄繖C(jī)
進(jìn)入21世紀(jì),隨著我國航空衛(wèi)星的迅猛發(fā)展,國產(chǎn)衛(wèi)星數(shù)據(jù)逐漸覆蓋全國。高分二號衛(wèi)星的成功發(fā)射,標(biāo)志著我國民用衛(wèi)星進(jìn)入亞米級時(shí)代,為礦山監(jiān)測工作提供了可靠的數(shù)據(jù)源。目前,在礦山活動(dòng)監(jiān)測工作中,獲取礦山開發(fā)信息的主要方式為實(shí)地勘測及人機(jī)交互解譯。實(shí)地勘測雖能獲得較高的精度和置信度,但具有費(fèi)用高、工作量大、低效率的缺點(diǎn);同樣人機(jī)交互解譯也存在因解譯人員的水平不同,其質(zhì)量難以保證。因此,借助遙感技術(shù)以及近年來發(fā)展較快的人工智能技術(shù),自動(dòng)提取礦山開發(fā)信息,是一項(xiàng)重要的研究趨勢。
表1 高分二號衛(wèi)星有效載荷技術(shù)指標(biāo)
注:資料來源中國資源衛(wèi)星應(yīng)用中心網(wǎng)
研究以GF-2衛(wèi)星數(shù)據(jù)作為數(shù)據(jù)源,對其進(jìn)行系統(tǒng)的預(yù)處理。以甘肅省永登縣為研究區(qū),通過已有礦山開發(fā)資料,進(jìn)行樣本采集,并對影像數(shù)據(jù)及樣本進(jìn)行歸一化、降維處理(PCA)。在SVM模型中,至關(guān)重要一點(diǎn)就是選擇核函數(shù)和參數(shù),通過反復(fù)試驗(yàn),選擇徑向基核函數(shù)及量子粒子群算法進(jìn)行參數(shù)尋優(yōu)。通過該模型,最終自動(dòng)提取出礦山開發(fā)信息,為礦山開發(fā)信息自動(dòng)提取提出了一種新的技術(shù)方法。
永登縣地處甘肅中部,蘭州市西北部郊區(qū),西南接青海,北通寧夏、內(nèi)蒙古,是古絲綢之路的門戶,亞歐大陸之要沖。該縣地形特征可概括為"兩河夾三山"形成黃土丘陵區(qū)和秦王川盆地。地貌上表現(xiàn)為石質(zhì)山地與黃土丘陵交錯(cuò)分布。地勢位于青藏高原東北部與黃土高原西部過渡地帶,也是祁連山支脈東延與隴西沉降盆地間交錯(cuò)的過渡地區(qū)。境內(nèi)山巒重疊,丘陵起伏,河水縱貫[1]。
高分二號衛(wèi)星作為我國第一顆亞米級光學(xué)遙感衛(wèi)星,具有高定位精度和快速姿態(tài)機(jī)動(dòng)能力等特點(diǎn)[2]。其有效載荷技術(shù)指標(biāo)見下表1。
研究區(qū)礦山主要為露天開采,開采面所暴露的基巖具有獨(dú)特的光譜特征,與周圍土層及植被覆蓋產(chǎn)生強(qiáng)烈的反差。利用這一特點(diǎn),為礦山開發(fā)信息自動(dòng)提取提供了基礎(chǔ)。工作具體流程如下:
1)影像預(yù)處理:在自動(dòng)提取過程中使用的為高分二號Level 1A所獲得的各項(xiàng)原始數(shù)據(jù),因此要求開展配套的預(yù)處理工作,其中主要有大氣校正以及幾何精校正等多個(gè)方面的圖像處理,才能作為后續(xù)自動(dòng)提取的數(shù)據(jù)源。因?yàn)榈V山開發(fā)信息自動(dòng)提取中重點(diǎn)使用影像光譜信息,因此預(yù)處理重點(diǎn)為相關(guān)的輻射定標(biāo),同時(shí)包括波譜響應(yīng)函數(shù)、FLAASH大氣校正、幾何精矯正及影像融合[3]。
2)ROI采樣:查閱前人成果,利用礦山占地為樣本,對礦山開發(fā)信息的特征進(jìn)行歸納總結(jié)。其中選取SVM樣本5703件(包括1140個(gè)測試樣本),其中感興趣區(qū)樣本2114個(gè),非感興趣區(qū)樣本3598個(gè)。
3)歸一化處理:利用圖像歸一化、圖像的不變矩陣來尋找一組參數(shù),從而消除其他變換函數(shù)對圖像變換的影響。在MATLAB中,圖像數(shù)據(jù)本身是0~255單位數(shù)據(jù),因此需要?dú)w一化并轉(zhuǎn)換成0-1。同時(shí),為了加快機(jī)器學(xué)習(xí)的速度,對訓(xùn)練樣本進(jìn)行歸一化處理,使所有樣本的輸入信息的平均值接近或小于其平均方差,避免一些過大、過小的參數(shù)對預(yù)測結(jié)果產(chǎn)生較大影響[4]。
4)降維處理(PCA):主成分分析法是圖像處理中常用的降維方法,其目的是利用降維思想將多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)綜合指標(biāo)[5]。在研究中,降維處理時(shí),設(shè)參數(shù)間相關(guān)性為97%,根據(jù)運(yùn)算結(jié)果,模型中采用前兩個(gè)主成分(F1、F2)進(jìn)行分類。
5)支持向量機(jī)模型訓(xùn)練:支持向量機(jī)(Support Vector Machine,SVM)是Corinna Cortes和Vapnik等于1995年首先提出的,該算法在小樣本、非線性及高維模式識(shí)別具有其獨(dú)特的優(yōu)勢,與工作區(qū)中礦山開發(fā)樣本特征相符。
圖1 量子粒子群參數(shù)尋優(yōu)步驟圖
圖2 量子粒子群算法尋優(yōu)結(jié)果圖
在SVM模型中,至關(guān)重要的一點(diǎn)就是選擇核函數(shù)和參數(shù)。對于任意對稱函數(shù)K(x,y)可在特殊空間表示為內(nèi)積形式:K(x,y)=充要條件是K(x,y)是半正定的,即òò,為Mercer定理。滿足上述定理的函數(shù)是可行的SVM核函數(shù)。
表2 SVM模型分類結(jié)果展示(黑色區(qū)域?yàn)榈V產(chǎn)開發(fā)信息)
徑向基核函數(shù)因?yàn)樽约壕邆涞南鄳?yīng)特征,如區(qū)域性等,因此其一般出現(xiàn)在樣本數(shù)目多的分類問題中,參數(shù)要求較低,具有較寬的收斂域,是較為理想的分類函數(shù),故本次研究選取徑向基核函數(shù)(RBF)[6]。
RBF核函數(shù)包含兩個(gè)參數(shù):懲罰因子和核參數(shù)γ,其參數(shù)決定了高維映射的形態(tài),直接影響分類精度。懲罰因子能夠改變相關(guān)算法模型的復(fù)雜狀況,進(jìn)而實(shí)現(xiàn)樣本占比跟復(fù)雜狀況之間的匹配和調(diào)整。值得注意的是,SVM模型的學(xué)習(xí)訓(xùn)練過程耗時(shí)相對較長,提高參數(shù)區(qū)域內(nèi)的尋找概率是完成優(yōu)化的重點(diǎn)思路。對于相關(guān)函數(shù)參數(shù)選定的問題,通常能夠借助窮舉法、網(wǎng)格法等多樣化手段進(jìn)行,當(dāng)下廣泛運(yùn)用的一類智能式方法能夠?qū)θ繀?shù)完成查找,其滿足相應(yīng)的優(yōu)勢性特征,比如量子粒子群算法(PSO)等,因此本文在建立SVM分類模型時(shí),選用量子粒子群算法進(jìn)行為參數(shù)尋優(yōu)[7]。其具體流程圖如下(圖1):
將處理后的樣本數(shù)據(jù)進(jìn)入SVM分類器(在matlab實(shí)現(xiàn)),應(yīng)用量子粒子群算法尋找最大值(最佳適應(yīng)度)的結(jié)果如圖2所示,可以發(fā)現(xiàn):在迭代次數(shù)達(dá)到10左右即選出最佳適應(yīng)度,說明算法耗時(shí)較短,尋優(yōu)結(jié)果良好。
2.5.3模型應(yīng)用(分類)
將選取5703個(gè)樣本(包括1140個(gè)測試樣本),進(jìn)入SVM分類器(在matlab中實(shí)現(xiàn))。根據(jù)運(yùn)算結(jié)果可知,數(shù)據(jù)分類精度為95.43%,效果客觀。將分類結(jié)果輸出,對比處理后影像,實(shí)現(xiàn)礦山開采信息自動(dòng)提取可視化,結(jié)果如表2:
依據(jù)上述實(shí)驗(yàn)結(jié)果來看,基于機(jī)器學(xué)習(xí)模型中支持向量機(jī)算法(SVM)進(jìn)行礦山開發(fā)信息自動(dòng)提取的方法基本達(dá)到了預(yù)期效果,能夠完整地將礦山開發(fā)信息提取并展示出來。
為了更好地計(jì)算該方法提取的準(zhǔn)確性,本次研究對提取的數(shù)據(jù)進(jìn)行野外查證。在自動(dòng)提取結(jié)果的基礎(chǔ)上,剔除細(xì)小圖斑的干擾,依據(jù)處理后的提取結(jié)果采取點(diǎn)、線、面相結(jié)合的方法,利用GPS定位,對典型礦山的分布位置進(jìn)行野外查證。具體情況如下表3。
表3 自動(dòng)提取結(jié)果與野外查證后對比分析表
野外查證表面,基于支持向量機(jī)所提取的礦山開發(fā)信息邊界清晰,位置較為精確,可靠程度高,具有一定的應(yīng)用價(jià)值。根據(jù)野外查證分析,自動(dòng)提取結(jié)果中出現(xiàn)錯(cuò)誤提取、缺失提取及邊界不準(zhǔn)的問題主要原因?yàn)椋孩俨糠謪^(qū)域影像質(zhì)量一般,礦山開發(fā)信息與周圍地物反差不夠明顯;②部分礦山已經(jīng)廢棄,開采面出現(xiàn)風(fēng)化以及植被覆蓋現(xiàn)象,干擾了自動(dòng)提取的結(jié)果。
1)隨著我國航空衛(wèi)星的迅猛發(fā)展,國產(chǎn)衛(wèi)星數(shù)據(jù)應(yīng)用越來越廣泛。特別是國產(chǎn)高分系列數(shù)據(jù),具有較高的空間分辨率,能夠?qū)⒌匚锏墓庾V差異精確地展示出來。基于研究區(qū)內(nèi)高分二號衛(wèi)星數(shù)據(jù)中,礦山開發(fā)信息與周圍地物存在較大的光譜差異這一特點(diǎn),選取合適的信息提取模型,為自動(dòng)提取所需信息提供了可能,也是對國產(chǎn)衛(wèi)星數(shù)據(jù)在礦山監(jiān)測應(yīng)用中一次探索。
2)目前礦山遙感監(jiān)測主要依據(jù)人工目視解譯,該方法耗時(shí)耗力、效率較低,且依賴解譯人員的經(jīng)驗(yàn)。隨著人工智能的快速發(fā)展,機(jī)器學(xué)習(xí)模型在各個(gè)領(lǐng)域開始廣泛地應(yīng)用,將機(jī)器學(xué)習(xí)模型引入到礦山開發(fā)信息提取中,能夠?qū)崿F(xiàn)信息的快速自動(dòng)提取,可節(jié)約大部分的人力、物力,具有極高的應(yīng)用價(jià)值。
3)研究基于機(jī)器學(xué)習(xí)模型中支持向量機(jī)算法(SVM)進(jìn)行礦山開發(fā)信息自動(dòng)提取。選取研究區(qū)內(nèi)典型樣本,針對樣本及影像數(shù)據(jù)進(jìn)行歸一化、降維處理(PCA),模型選取量子粒子群算法進(jìn)行參數(shù)尋優(yōu),應(yīng)用SVM分類器進(jìn)行信息提取,最終得到礦山開發(fā)信息的自動(dòng)提取結(jié)果。對提取結(jié)果剔除細(xì)小的干擾圖斑,并進(jìn)行野外調(diào)查查明精度。查證結(jié)果表明利用SVM模型進(jìn)行礦山開發(fā)信息自動(dòng)提取是可行的,為國產(chǎn)數(shù)據(jù)在礦山監(jiān)測應(yīng)用中提供了新的思路。
[1] 魯?shù)梅? 董輝. 層次分析法在永登縣地質(zhì)災(zāi)害易發(fā)性評價(jià)中的應(yīng)用[J]. 甘肅科技縱橫, 2013, 42(12): 10-13.
[2] 潘騰, 關(guān)暉, 賀瑋.“高分二號”衛(wèi)星遙感技術(shù)[J]. 航天返回與遙感, 2015, 36(04): 16-24.
[3] 肖瑤. 高分系列衛(wèi)星在煤礦區(qū)地質(zhì)災(zāi)害監(jiān)測方面的應(yīng)用[D]. 合肥工業(yè)大學(xué), 2017.
[4] 湯榮志. 數(shù)據(jù)歸一化方法對提升SVM訓(xùn)練效率的研究[D]. 山東師范大學(xué), 2017.
[5] 李瑞光, 臧國輕. 基于主成分分析-支持向量機(jī)的土石壩滲流監(jiān)測數(shù)據(jù)預(yù)測模型[J]. 計(jì)算機(jī)時(shí)代, 2018(06): 5-8.
[6] 劉路民根. 支持向量機(jī)徑向基核參數(shù)優(yōu)化研究[J] .科學(xué)技術(shù)創(chuàng)新, 2018(26): 48-49.
[7] 周頔. 基于改進(jìn)量子粒子群算法的支持向量機(jī)參數(shù)優(yōu)化方法[J]. 計(jì)算機(jī)與現(xiàn)代化, 2018(09): 27-31.
Automatic Extraction of Mine Development Information Based on Gf-2 Satellite Data
HAN Lei1,2HE Chao1,2HUANG Jie1,2YANG Xian-hua1,2TIAN Li1,2
(1-Evaluation and Utilization of Strategic Rare Metals and Rare Earth Resource Key Laboratory of Sichuan Province,Chengdu,Sichuan 610081;2-Geological Survey of Sichuan Province, Chengdu 610081)
Gf series satellite data of China is characterized by short revisiting cycle, low cost and high accuracy, therefore widely applied to mine development monitoring. This study carries out automatic extraction of mine development information of Yongdeng County, Gansu Province with Matlab platform by means of Support Vector Machine based on GF-2 satellite data. The field investigation indicates that the extracted information is reliable.
remote sensing image; mine development information; automatic extraction; Support Vector Machine
2018-10-10
中國地質(zhì)調(diào)查局地質(zhì)調(diào)查項(xiàng)目“全國礦產(chǎn)資源開發(fā)環(huán)境遙感監(jiān)測”(121201203000160009);
“全國2017年新增的礦山恢復(fù)治理狀況監(jiān)測”(121201003000172718)
韓磊(1983-),男,四川成都人,工程師,主要從事資源環(huán)境遙感研究工作
何超(1993-),男,四川成都人,助理工程師,主要從事遙感地質(zhì)工作
P627
A
1006-0995(2018)04-0689-05
10.3969/j.issn.1006-0995.2018.04.034