常睿春,王 璐,王茂芝
(1.成都理工大學(xué)管理科學(xué)學(xué)院,成都 610059;2.成都東軟學(xué)院基礎(chǔ)教學(xué)部,成都 610059;3.數(shù)學(xué)地質(zhì)四川省重點(diǎn)實(shí)驗(yàn)室,成都 610059)
國內(nèi)外遙感地質(zhì)學(xué)者通過不斷研究遙感理論和技術(shù),形成了一整套基于多光譜遙感數(shù)據(jù)的遙感地質(zhì)找礦方法和技術(shù)流程[1-2]。但是高光譜遙感數(shù)據(jù)不同于多光譜遙感數(shù)據(jù),它具有的高光譜分辨率是以高數(shù)據(jù)維和大數(shù)據(jù)量為代價(jià)的,在這種情況下,基于多光譜遙感數(shù)據(jù)的礦物信息提取技術(shù)在高光譜領(lǐng)域的應(yīng)用效果不是很理想,需要研究針對(duì)高光譜遙感圖像的礦物信息提取方法。目前,通過國內(nèi)外眾多遙感地質(zhì)學(xué)者的努力,基于高光譜遙感技術(shù)的地物識(shí)別和信息提取已形成較為成熟的方法和流程[3-4];然而,面對(duì)高光譜遙感圖像的巨大數(shù)據(jù)量,傳統(tǒng)遙感分類方法一般難以取得良好的效果。若干研究者提出了基于獨(dú)立成分分析(independent component analysis,ICA)的高光譜遙感分類方法,李娜等[5]將其改進(jìn)的主成分分析法應(yīng)用于非監(jiān)督分類;林婷等[6]在水稻Zn污染檢測模型中使用了ICA方法分解多個(gè)波段反射率;臧卓等[7]在高光譜分類研究中將ICA與PCA做了對(duì)比。
在前人研究的基礎(chǔ)上,本文提出了基于快速獨(dú)立成分分析(fast independent component analysis,F(xiàn)astICA)的高光譜遙感礦物信息提取方法。首先利用虛擬維數(shù)(virtual dimensionality,VD)方法確定高光譜遙感圖像數(shù)據(jù)的最優(yōu)特征數(shù),然后利用FastICA方法進(jìn)行降維和混合像元分解;通過對(duì)模擬高光譜數(shù)據(jù)與HyMap機(jī)載高光譜遙感圖像的實(shí)驗(yàn),證明了本文方法在高光譜遙感數(shù)據(jù)處理中的可操作性和有效性。
ICA技術(shù)是近幾年發(fā)展起來的一種基于信號(hào)高階統(tǒng)計(jì)特性、能產(chǎn)生統(tǒng)計(jì)獨(dú)立分量的多元變量數(shù)據(jù)分析方法,在高光譜遙感領(lǐng)域受到了廣泛關(guān)注。其技術(shù)特點(diǎn)是利用原始數(shù)據(jù)間的高階統(tǒng)計(jì)性,能夠使得變換后的各個(gè)分量不僅互不相關(guān),而且還能保持各自的統(tǒng)計(jì)獨(dú)立性。根據(jù)ICA技術(shù)的這個(gè)特點(diǎn),在對(duì)高光譜數(shù)據(jù)降維的同時(shí),也能提取高光譜數(shù)據(jù)中的端元信息。FastICA亦稱“快速定點(diǎn)學(xué)習(xí)算法”,是ICA技術(shù)中的常用方法之一,具有收斂速度快、精度高等優(yōu)點(diǎn)。
假設(shè)原始數(shù)據(jù)向量為 X=(x1,x2,…,xn)T,用 S表示n個(gè)源信號(hào)(獨(dú)立成分)組成的列向量,S=(s1,s2,…,sn)T,用 A 表示混合矩陣,即
S和A均為未知。利用原始信號(hào)可以構(gòu)建分離矩陣W,由原始信號(hào)可得到源信號(hào)的估計(jì)S⌒,即
ICA方法的目的就是在一定條件下求解分離矩陣W。針對(duì)高光譜遙感圖像數(shù)據(jù)中相鄰波段間的相關(guān)性較高,采用基于負(fù)熵的固定點(diǎn)改進(jìn)FastICA算法(以負(fù)熵最大為優(yōu)化標(biāo)準(zhǔn)),F(xiàn)astICA算法分析見文獻(xiàn)[8-9]。
在高光譜遙感礦物信息提取中融入FastICA方法,以期達(dá)到降噪、降維及混合像元分解的目的。技術(shù)流程如圖1所示。
圖1 技術(shù)流程Fig.1 Flow chart of the method
由于設(shè)計(jì)的實(shí)驗(yàn)是針對(duì)高光譜遙感數(shù)據(jù)的礦物信息提取,所以實(shí)驗(yàn)數(shù)據(jù)選用美國地質(zhì)調(diào)查局地物光譜數(shù)據(jù)庫中的白云母、蛇紋石、方解石、綠簾石、綠泥石、明礬石、氯化銨和陽起石等8條礦物波譜曲線(圖2)作為端元信號(hào),構(gòu)造高光譜模擬圖像。
圖2 礦物波譜曲線Fig.2 Mineral spectral curves
為了簡化問題,將模擬圖像的像元數(shù)定為64,暫不考慮高斯噪聲影響。構(gòu)造模擬高光譜圖像的方法為:①確定像元數(shù)N=64,波段數(shù)L=420,端元數(shù)q=4,生成0~1之間由隨機(jī)數(shù)組成的豐度矩陣α4×64,使得混合矩陣A的每一列元素之和為1;②由R=Mα得到高光譜遙感的模擬圖像(其中R為L×N維的矩陣,表示N個(gè)維數(shù)為L的混合光譜矢量;M為L×q維的端元矩陣,表示q個(gè)維數(shù)為L的端元光譜矢量;α為q×N維的豐度矩陣)。該模擬圖像中白云母與方解石的混合像元波譜曲線如圖3所示。
圖3 混合像元波譜曲線Fig.3 Mixed pixel spectral curve
實(shí)際高光譜遙感數(shù)據(jù)會(huì)受到自然界各類因素的影響,所以構(gòu)造高光譜模擬數(shù)據(jù)時(shí)還需加入噪聲,本文加入數(shù)值在0~0.1內(nèi)白噪聲(高斯噪聲)序列,如圖4所示。
圖4 加噪后礦物波譜曲線Fig.4 Mineral spectral curve plus noise
采用VD法確定模擬高光譜圖像的最優(yōu)特征數(shù)[10],進(jìn)而界定已有數(shù)據(jù)的維數(shù)。對(duì)比前20個(gè)特征值差分對(duì)數(shù)與閾值(圖5)。
圖5 虛擬維數(shù)估計(jì)Fig.5 Virtual dimensionality
從圖5可以看出,共有7個(gè)特征值差分對(duì)數(shù)值位于閾值差分上方,故選擇特征提取后的數(shù)據(jù)維數(shù)為7。利用FastICA方法對(duì)模擬高光譜圖像數(shù)據(jù)進(jìn)行特征提取(降維),設(shè)定獨(dú)立成分?jǐn)?shù)為7,得到新的特征數(shù)據(jù),進(jìn)行光譜解混工作。圖6是當(dāng)端元個(gè)數(shù)為2時(shí),采用FastICA方法進(jìn)行線性解混后原始端元和分解端元的光譜曲線圖。
圖6 解混結(jié)果對(duì)比Fig.6 Unmixing results contrast
從圖6可以看出,解混后得到的端元與原始端元相比,雖然光譜曲線有了一定波動(dòng),但光譜變化范圍和光譜曲線的吸收特征(吸收谷位置、吸收寬度、斜率及吸收對(duì)稱度)基本一致。
為了檢驗(yàn)利用FastICA方法進(jìn)行特征提取的分類效果,采用光譜角填圖法(spectral angle mapping,SAM)分別對(duì)特征提取前后的高光譜模擬圖像進(jìn)行分類,并對(duì)比分類精度(表1)。
表1 SAM分類結(jié)果比較Tab.1 Comparison of SAM classification results
從表1可以看出,高光譜模擬圖像經(jīng)FastICA特征提取后,分類精度仍保持在90%以上??梢哉J(rèn)為,使用FastICA方法對(duì)高光譜遙感圖像數(shù)據(jù)中的礦物信息進(jìn)行降維、降噪及混合像元分解的效果在可接受范圍內(nèi)。
為了進(jìn)一步檢驗(yàn)本文方法的可靠性與有效性,采用HyMap機(jī)載高光譜遙感數(shù)據(jù)作為端元信息提取精度的檢驗(yàn)數(shù)據(jù),其地理坐標(biāo)為E 94°5′20" ~ 94°10′,N 42°10′~ 42°12′30",技術(shù)指標(biāo)如表2所示。
表2 技術(shù)指標(biāo)Tab.2 Technical specifications
應(yīng)用本文方法提取出的礦物端元信息為白云母、方解石、蛇紋石、綠泥石、綠簾石及陽起石等6種。用各端元的均方根誤差來衡量端元提取精度(表3),端元數(shù)由2遞增到6時(shí),誤差控制在10-3以內(nèi),礦物信息提取效果較好。
表3 不同端元提取精度Tab.3 Different endmember extraction accuracy
在前人研究的基礎(chǔ)上,闡述了基于FastICA方法的高光譜遙感數(shù)據(jù)的礦物信息提取方法,該方法首先使用虛擬維數(shù)方法確定高光譜遙感數(shù)據(jù)的最優(yōu)特征個(gè)數(shù),然后使用FastICA方法進(jìn)行降維和混合像元分解,在模擬數(shù)據(jù)與實(shí)際高光譜遙感數(shù)據(jù)中分別進(jìn)行實(shí)驗(yàn)。結(jié)果證明,該方法在高光譜遙感數(shù)據(jù)處理中是可操作和有效的。
目前,本文方法僅針對(duì)高光譜遙感數(shù)據(jù)所包含的海量信息中的礦物信息進(jìn)行提取,一些問題仍需進(jìn)一步解決。下一步研究是將本文提出的模型和算法更多地應(yīng)用于真實(shí)的高光譜遙感圖像數(shù)據(jù)中,并結(jié)合先驗(yàn)信息和實(shí)際地質(zhì)背景,進(jìn)一步探討FastICA技術(shù)的應(yīng)用效果和前景。
[1]王潤生,熊盛青,聶洪峰,等.遙感地質(zhì)勘查技術(shù)與應(yīng)用研究[J].地質(zhì)學(xué)報(bào),2011,85(11):1699-1743.Wang R S,Xiong S Q,Nie H F,et al.Remote sensing technology and its application in geological exploration[J].Acta Geologica Sinica,2011,85(11):1699-1743
[2]徐元進(jìn).面向找礦的高光譜遙感巖礦信息提取方法研究[D].北京:中國地質(zhì)大學(xué),2009.Xu Y J.Research of prospecting-oriented approaches to information extraction of rocks and minerals using hyperspectral remote sensing data[D].Beijing:China University of Geosciences,2009.
[3]甘甫平,王潤生,馬藹乃.基于特征譜帶的高光譜遙感礦物譜系識(shí)別[J].地學(xué)前緣,2003,10(2):445-454.Gan F P,Wang R S,Ma G N.Spectral identification tree(SIT)for mineral extration based on spectral characteristics of minerals[J].Earth Science Frontiers,2003,10(2):445-454.
[4]甘甫平,劉圣偉,周 強(qiáng).德興銅礦礦山污染高光譜遙感直接識(shí)別研究[J].地球科學(xué),2004,29(1):119-126.Gan F P,Liu S W,Zhou Q.Identification of mining pollution using hyperion data at dexing copper mine in Jiangxi Province,China[J].Earth Science,2004,29(1):119-126.
[5]李 娜,趙慧潔.高光譜數(shù)據(jù)非監(jiān)督分類的改進(jìn)獨(dú)立成分分析方法[J].國土資源遙感,2011,23(2):70-74.Li N,Zhao H J.An improved independent component analysis method for unsupervised classification of hyperspectral data[J].Remote Sensing for Land and Resources,2011,23(2):70-74.
[6]林 婷,劉湘南,譚正.基于ICA和高光譜指數(shù)的水稻Zn污染監(jiān)測模型[J].國土資源遙感,2011,23(2):59-64.Lin T,Liu X N,Tan Z.Zn Contamination monitoring model of rice based on ICA and hyperspectral index[J].Remote Sensing for Land and Resources,2011,23(2):59-64.
[7]臧 卓,林 輝,楊敏華.ICA與PCA在高光譜數(shù)據(jù)降維分類中的對(duì)比研究[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2011,31(11):18-22.Zang Z,Lin H,Yang M H.Comparative study on descending dimension classification of hyperspectral data between ICA algorithm and PCA algorithm[J].Journal of Central South University of Forestry and Technology,2011,31(11):18-22.
[8]Hyvrinen A.Fast and robust fixed-point algorithms for independent component analysis[J].IEEE Transactions on Neural Networks,1999,10(3):626-634.
[9]Hyvrinen A.The fixed-point algorithm and maximum likelihood estimation for independent component analysis[J].Neural Process Lett,1999,10(1):1-5.
[10]王祥濤,馮 燕,陳 武.基于改進(jìn)獨(dú)立分量分析的高光譜數(shù)據(jù)分類研究[J].計(jì)算機(jī)仿真,2009,26(11):177-181.Wang X T,F(xiàn)en Y,Chen W.Classification of hyperspectral data based on improved independent component analysis[J].Computer Simulation,2009,26(11):177-181.
[11]Chang J W C.Independent component analysis-based dimensionality reduction with applications in hyperspectral image analysis[J].IEEE Transactions on Geoscience and Remote Sensing,2006,44(6):1586-1594.
[12]王 璐.ICA在高光譜遙感礦物蝕變信息提取中的應(yīng)用[D].成都:成都理工大學(xué),2011.Wang L.Independent component analysis for mineralizing alteration information extraction of hyperspectral remote sensing data[D].Chengdu:Chengdu University of Technology,2011.