孫 肖, 徐林林, 王曉陽, 田 野, 王 偉, 張中躍
(1.中國地質(zhì)調(diào)查局廊坊自然資源綜合調(diào)查中心,廊坊 065000; 2.中國地質(zhì)大學(北京)土地科學技術(shù)學院,北京 100083)
高光譜遙感具有“圖譜合一”的特點,已廣泛應用于礦物識別、固體礦產(chǎn)和油氣勘探、環(huán)境保護及環(huán)境監(jiān)測、植被分類及檢測、月球和行星探測等方面[1-2]?,F(xiàn)有高光譜遙感礦物識別技術(shù)主要采用基于礦物波譜曲線的光譜匹配技術(shù),如混合像元分解技術(shù)、光譜角技術(shù)和混合調(diào)制匹配濾波技術(shù)等[3-5]?;旌舷裨纸饧夹g(shù)是一種常用的高光譜礦物識別技術(shù)。由于成像光譜儀的硬件問題,高光譜遙感圖像普遍光譜分辨率高而空間分辨率低,容易導致影像像元出現(xiàn)同譜異物現(xiàn)象,因此必須研究解混方法予以克服。
目前常用的解混方法包括像元純凈指數(shù)、N-Findr、頂點成分分析、最小二乘端元提取算法等[6-9]。在前人工作的基礎(chǔ)上,Roberts等[10]提出了經(jīng)典的迭代光譜解混方法(MESMA); Asner等[11]引入蒙特卡洛理論,將其與迭代解混理論有效結(jié)合起來,提出了AutoMUC方法; Song[12]介紹了一種基于貝葉斯決策的BSMA方法; 吳柯等[13]提出了基于神經(jīng)網(wǎng)絡的端元可變解混方法; 林紅磊等[14]提出基于單次散射反照率的礦物高光譜稀疏解混方法。上述高光譜解混方法雖然反演精度有了很大的提高,但是經(jīng)典的方法大都依賴于純凈像元,由于圖像的空間分辨率和地表目標的復雜程度,純凈的像元是很難直接從高光譜圖像中獲取的; 此外,這些方法在解釋混合像元的成像機理方面也還不完善。
Xu等[15]利用線性光譜混合模型來解釋混合像元的成像機理,利用凈化像元的概念提出K-P-Means算法來進行高光譜混合像元分解。該算法分2步迭代(豐度估計和端元優(yōu)化),通過基于高斯混合模型的期望最大(expectation maximization,EM)估計算法直到最終的端元估計收斂。由于K-P-Means算法估計端元和豐度的能力較強,因此,本文將該算法應用于礦物識別。該算法端元的優(yōu)化借助于計算出的地物類別標簽,由于地物類別標簽可能不正確,導致計算出的凈化像元存在多個類別,這種現(xiàn)象會導致端元優(yōu)化不理想。Fischler等[16]提出的隨機抽樣一致性算法(random sample consensus,RANSAC),可以有效剔除因分類標簽不正確導致的凈化像元中的異常值的影響。因此本文提出基于RANSAC的穩(wěn)健的K-P-Means算法(RANSAC based robust K-P-Means,RR-K-P-Means)。在K-P-Means算法的基礎(chǔ)上,利用RANSAC算法剔除異常影響,提高端元優(yōu)化的精度。最終將該算法用于美國內(nèi)華達州銅礦區(qū)的AVIRIS高光譜傳感器Cuprite數(shù)據(jù)的礦物識別,將估計出的光譜曲線與美國地質(zhì)調(diào)查局網(wǎng)站提供的礦物波譜曲線進行匹配,確定礦物種類。
1.1.1 線性光譜混合模型
線性光譜混合模型是一種常用的高光譜遙感圖像表達方式[17]。假設(shè)高光譜圖像像元集X由端元矩陣A和豐度矩陣S以及獨立同分布的高斯噪聲N組成,即
X=SAT+N,
(1)
(2)
(3)
式中:si(i=1,2,…,m)為E×1的豐度向量,用來表達第j個端元光譜向量aj(j=1,2,…,E)在P×1維高光譜像元xi中的貢獻;m為圖像像元個數(shù);E為端元個數(shù);P為波段數(shù);n為高斯噪聲向量。
1.1.2 K-P-Means模型
由于同一類的混合像元允許多種端元存在,為了更進一步移除豐度值較低的端元的影響,使用豐度值最大的端元(而不是用整個xi)來估計aj是很合理的。Xu等[15]把移除豐度值較低端元貢獻后的xi稱為凈化像元。
K-P-Means模型是傳統(tǒng)K-Means模型的衍生,考慮到實際中豐度非負,因此算法可以表述為:
(4)
式中k為地物類別數(shù)。
相比K-Means考慮物理過程的整體效果,K-P-Means探究影響觀測的物理過程的源頭,其目標函數(shù)可以表述為:
(5)
(6)
式中:l為類別;yi為第k類的凈化像元向量。
基于上面描述的模型,由于未知數(shù)遠遠多于觀測方程的個數(shù),這是一個嚴重奇異的問題。EM算法對于奇異問題的參數(shù)求解具有較好的效果,該算法通過迭代的方法尋找統(tǒng)計模型的最大似然估計[18]。K-P-Means模型依據(jù)EM算法分2步迭代進行豐度估計和端元優(yōu)化: 首先,通過非負最小二乘法進行豐度的估計; 然后,通過計算的豐度對端元進行優(yōu)化。
1.1.3 豐度估計
給定{aj},假設(shè)噪聲滿足高斯分布模型,則其噪聲的概率密度函數(shù)p(n)為:
(7)
(8)
估計豐度的目標函數(shù)可以表達為:
(9)
由于方差可以通過均勻區(qū)域法獲取,并作為權(quán)重計算豐度,地物類別li通過sik最大確定,即
(10)
因此,式(9)中豐度的估計本質(zhì)上就是一個加權(quán)非負最小二乘(weight nonnegative least square, WNNLS)問題[19]。
1.1.4 端元優(yōu)化
(11)
從上述K-P-Means算法的原理很容易發(fā)現(xiàn),端元的優(yōu)化完全依賴于由豐度確定的標簽。類別標簽錯誤或者存在異常值都會導致端元的優(yōu)化精度降低。實踐過程中,從凈化像元值的直方圖可以明顯發(fā)現(xiàn)存在多個類別(圖1)。
圖1 凈化像元直方圖Fig.1 Histogram of purified pixels
凈化像元值存在多個類別的現(xiàn)象降低了利用K-P-Means算法進行混合像元分解的精度。在計算機視覺以及其他很多研究領(lǐng)域,RANSAC算法對錯誤率超過50%的數(shù)據(jù)仍然能夠得到理想的處理結(jié)果,是最有效的穩(wěn)健估計算法之一[20]。因此,本文利用RANSAC算法對K-P-Means算法混合像元分解過程中產(chǎn)生的凈化像元進行優(yōu)化,剔除錯誤標簽的影響,實現(xiàn)對K-P-Means算法的優(yōu)化。
基于RANSAC算法的穩(wěn)健的K-P-Means算法基本過程可以描述為: ①利用式(1)—(10)原理獲取帶有錯誤標簽的凈化像元; ②尋找一個模型(一般為線性模型)適應于假設(shè)的正確的凈化像元(初始采用隨機點),利用尋找的凈化像元估算該模型的參數(shù)(圖2); ③用第二步得到的模型去測試所有的其他端元,若某個端元適用于估計的模型,則認為它也是該類別的端元,其他端元滿足的條件設(shè)置為大于最小端元差值(設(shè)定閾值),如果有足夠多的端元被歸類為假設(shè)的正確類別的端元,那么估計的模型就足夠合理,用所有假設(shè)的正確的端元去重新估計選取的模型,直到估計的正確的端元數(shù)量滿足給定條件(設(shè)置最低錯誤率)為止; ④重復第二步和第三步過程來估計更加穩(wěn)健的參數(shù),選擇更加合理的端元,將獲取的合理的端元帶入式(11),獲取優(yōu)化后的端元。
圖2 基于RANSAC算法的端元優(yōu)化原理示意圖Fig.2 Schematic diagram of the principle of end-memberoptimization based on RANSAC
從美國地質(zhì)調(diào)查局公布的地物光譜庫中,隨機選擇4條地物光譜曲線,按照如下程序混合成64×64大小的圖像。利用這4個端元,首先把整個圖像分成8×8的同質(zhì)塊; 然后通過7×7窗口大小的空間低通濾波對這些同質(zhì)塊降級; 再通過添加零均值高斯噪聲對圖像再降級,從而獲取和真實情況更為接近的仿真數(shù)據(jù)。
豐度和端元的估計實驗中,如果2個端元估計值的光譜角度距離(spectral angle distance,SAD)小于一個給定的數(shù)值τ或者預先規(guī)定迭代的次數(shù)iters,那么2步迭代就停止。本次實驗中τ=0.01,iters=50。每次迭代中采用頂點成分分析的結(jié)果作為端元的初值[8]。利用RR-K-P-Means算法對端元進行優(yōu)化時,模型采用線性模型,其他端元距離該直線的最小端元差值設(shè)置為5,最低錯誤率設(shè)置為15%。
分別利用K-P-Means算法和RR-K-P-Means算法進行豐度和端元的估計。用廣泛使用的SAD和光譜信息散度(spectral information divergence, SID)來評價估計端元和真實端元的一致性[21]。為了便于表示,將SID的數(shù)值統(tǒng)一擴大10 000倍。利用結(jié)構(gòu)相似性(structural similarity,SSIM)和峰值信噪比(peak signal-to-noise ratio,PSNR)來衡量利用估計的豐度和端元重新獲得的圖像與原圖像的相似性[22-23]。
SAD和SID值越小,估計的光譜曲線與真實光譜曲線越相似。SSIM和PSNR越大,表明利用估計的豐度和端元重新獲得的圖像與原始圖像越相似。從表1中數(shù)據(jù)可以看出,利用RR-K-P-Means算法估計的端元和豐度SAD達到0.73,SID達到3.1,估計值和真實值的一致性分別提高8.8%和13.89%。
表1 優(yōu)化前后圖像各指標對比Tab.1 Comparison of image parametersbefore and after optimization
利用估計的端元和豐度重新獲取的圖像和原始圖像相似性SSIM達到0.997,PSNR達到35.67,相似性分別提高10.17%和62.80%。RR-K-P-Means算法明顯優(yōu)于傳統(tǒng)的K-P-Means算法。從PSNR來看,RR-K-P-Means算法能更好地減弱噪聲對估計的影響。
RR-K-P-Means算法可以剔除個數(shù)較少的異常類別的影響,而且選擇的數(shù)據(jù)符合數(shù)據(jù)的分布形式(圖3)。盡管RR-K-P-Means算法不能在大范圍上改善分類結(jié)果,但是在細節(jié)上相比K-P-Means算法有了很大的改善。RR-K-P-Means算法估計的端元和豐度如圖4所示。圖4(a)—(d)為4種地物端元的估計值和真實值,兩者吻合程度比較高; 圖4(e)—(h)和(i)—(l)分別為4種地物的真實豐度和估計豐度,說明本文算法可以很好地計算豐度。較高精度的端元和豐度估計結(jié)果,為后續(xù)的礦物識別做好了準備。
圖3 真實標簽與優(yōu)化前后2種算法確定的地物標簽
圖4 優(yōu)化后估計的端元、豐度與真實值對比
將RR-K-P-Means算法用于真實高光譜遙感圖像數(shù)據(jù)的礦物提取。實驗中采用美國內(nèi)華達州銅礦區(qū)的AVIRIS高光譜傳感器的Cuprite數(shù)據(jù)集(圖5),數(shù)據(jù)獲取網(wǎng)站地址: http: //www.ehu.eus/ccwintco/index.php/Hyperspectral_Remote_Sensing_Scenes。Cuprite數(shù)據(jù)集除了少數(shù)植被覆蓋外大部分為含指示礦物的蝕變帶,是進行高光譜遙感地質(zhì)研究的典型樣區(qū)。該影像數(shù)據(jù)為1997年6月19日機載AVIRIS獲得,包括224個波段,地面瞬時視場約為20 m。剔除水汽影響嚴重的波段,共選取159個波段進行實驗。
圖5 內(nèi)華達州銅礦區(qū)的Cuprite數(shù)據(jù)集Fig.5 Cuprite data sets of Nevadacopper mining area
利用RR-K-P-Means算法對Cuprite數(shù)據(jù)集進行端元和豐度的估計,通過計算估計出的端元和美國地質(zhì)調(diào)查局礦物波譜庫的波譜曲線的相關(guān)性確定端元所屬的礦物類別。由于實際地物比較復雜,因此實驗中的端元數(shù)設(shè)置為30,多于本地礦物的種類。選擇相關(guān)系數(shù)大于0.75的端元進行研究。
通過相關(guān)系數(shù)的匹配得出8個類別的主要礦物,分別為: 黃鉀鐵礬、水銨長石、玉髓、葉蠟石、綠脫石、綠泥石、蒙脫石和白云母。研究區(qū)主要礦物綠脫石的端元估計結(jié)果如圖6所示,波長在400~600 nm的端元估計結(jié)果和真實值匹配度一致,其他部分基本相同。
圖6 綠脫石的端元估計值與真實值Fig.6 Estimated and true endmember values of nontronite
研究區(qū)主要礦物黃鉀鐵礬的端元估計結(jié)果如圖7所示,估計端元波譜曲線與真實值基本相同。在實際應用中,利用RR-K-P-Means算法估計的端元可以有效提取礦物的波譜曲線。
圖7 黃鉀鐵礬的端元估計值與真實值Fig.7 Estimated and true endmember values of jarosite
8種主要礦物的豐度圖見圖8。由圖8可見,礦物聚集性比較好,與已知樣本分布相比較,利用RR-K-P-Means算法獲取的8種主要礦物基本與實際情況一致。
圖8-2 識別出的8種礦物的豐度圖
針對K-P-Means算法中端元優(yōu)化受異常值影響的問題,提出基于RANSAC的穩(wěn)健的K-P-Means算法(RR-K-P-Means算法),并將該算法用于礦物識別,通過仿真和真實數(shù)據(jù)實驗,都取得了理想的效果。得出如下結(jié)論:
1)仿真實驗證明,利用RR-K-P-Means算法估計的端元和豐度與真實值的一致性提高明顯。利用估計的端元和豐度重新獲取的圖像和原始圖像相似性提高較多。從PSNR來看,RR-K-P-Means算法能更好地減弱噪聲對估計的影響。本文算法可以剔除個數(shù)較少的異常類別的影響,而且選擇的數(shù)據(jù)符合數(shù)據(jù)的分布形式。
2)通過真實數(shù)據(jù)驗證,利用RR-K-P-Means算法可以較好地識別研究區(qū)主要礦物,和美國地質(zhì)調(diào)查局地物波譜庫提供的標準地物波譜相比具有較高的一致性。在高光譜遙感圖像礦物識別中,RR-K-P-Means算法可以有效提取多種地物光譜,礦物識別效果較好。
本文端元優(yōu)化采用算數(shù)平均值,豐度較小的標簽未參與計算,未來可以將加權(quán)平均的方法應用到本研究中。除此之外,RR-K-P-Means不僅在高光譜遙感圖像礦物識別中可以得到很好的應用,同時可以推廣到分類、去噪、超分辨率重建等研究中。