李曉敏, 張 杰, 馬 毅, 任廣波
(國(guó)家海洋局 第一海洋研究所, 山東 青島 266061)
高光譜遙感技術(shù)是 20世紀(jì)80年代興起的新型對(duì)地觀測(cè)技術(shù), 在特定光譜域以高光譜分辨率同時(shí)獲得連續(xù)的地物光譜圖像, 可定量地分析識(shí)別地物類型和確定物質(zhì)性質(zhì)及組成成分。與傳統(tǒng)的遙感技術(shù)相比, 高光譜具有波段多、光譜范圍窄、波段連續(xù)、數(shù)據(jù)量大、信息冗余增加等特點(diǎn)[1]。
利用高光譜分辨率的特點(diǎn)可顯著提高地物類型識(shí)別的精度, 但同時(shí)大數(shù)據(jù)量也給數(shù)據(jù)處理和重要信息提取帶來(lái)了挑戰(zhàn)[2]。由于高光譜圖像的波段數(shù)量較多且波段間相關(guān)性較高, 圖像光譜信息所包含的高維特征集, 反而可能會(huì)導(dǎo)致解譯精度隨著特征維度的過(guò)分增長(zhǎng)而呈現(xiàn)下降趨勢(shì), 因此一般會(huì)通過(guò)降維或特征波段選擇的方式選取有限的波段來(lái)參與分類識(shí)別。主成分分析(Principal Components Analysis,PCA)是最基本的高光譜數(shù)據(jù)降維方法, 通過(guò)數(shù)學(xué)變換將多波段的圖像信息壓縮到比原波段更有效的少數(shù)幾個(gè)轉(zhuǎn)換波段, 降低特征的維數(shù), 減少波段之間的冗余, 提高圖像的數(shù)據(jù)質(zhì)量和處理效率, 已經(jīng)被廣泛應(yīng)用于高光譜圖像處理[3-5]、特征提取和維數(shù)降低[6-7]、地物分類和目標(biāo)檢測(cè)[8-12]中。
目前遙感影像的分類方法較多, 不同分類器因原理和適用性不同而得到不同的分類精度, 同一分類器不同地物的分類精度也不同, 各個(gè)分類器間存在一定的互補(bǔ)性。已有的研究結(jié)果[13-16]表明: 采用決策級(jí)數(shù)據(jù)融合方法, 充分利用現(xiàn)有分類器的優(yōu)勢(shì),可一定程度上提高地物的分類精度。
綜上, 主成分分析方法可提高圖像的數(shù)據(jù)質(zhì)量和圖像的處理效率, 決策級(jí)數(shù)據(jù)融合方法可一定程度上提高地物的分類精度。為此, 作者將主成分分析方法和決策級(jí)數(shù)據(jù)融合方法相結(jié)合, 來(lái)評(píng)價(jià)其對(duì)高光譜圖像地物分類效果的影響。
本研究的實(shí)驗(yàn)區(qū)域?yàn)辄S河入??谛吕虾拥澜唤缣?圖1), 根據(jù)2012年9月的現(xiàn)場(chǎng)踏勘結(jié)果, 該區(qū)域?yàn)榈湫偷臑I海濕地, 其地物類型包括蘆葦、黃河河道、水庫(kù)與坑塘等清澈水體、灘涂(包括海灘和河灘)、翅堿蓬和檉柳等, 地物類型的解譯圖見(jiàn)圖2。
作者所用的高光譜圖像為CHRIS/PROBA影像。PROBA[17]是歐空局于2001年10月22日發(fā)射的新一代微衛(wèi)星, 星上搭載了 3種傳感器, 其一即為緊湊式高分辨率成像光譜儀CHRIS(Compact High Re-solution Imaging Spectrometer), 具有 5種成像模式(表1), 可獲取0°、+36°、-36°、+55°和-55°等 5種角度的高光譜圖像。作者所用的實(shí)驗(yàn)數(shù)據(jù)是2012年6月獲取的CHRIS工作模式2的0°圖像(圖1), 其光譜范圍406~1036 nm, 波段的光譜分辨率從5.9 nm到44.1nm不等, 地面分辨率17 m。采用ESA提供的HDFclean軟件去除CHRIS影像的噪聲, 包括缺失像元填充、條帶噪聲去除; 采用BEAM軟件對(duì)CHRIS影像進(jìn)行大氣校正。
圖1 實(shí)驗(yàn)區(qū)CHRIS影像圖(B15B10B5)Fig.1 CHRIS image (B15B10B5)
圖2 實(shí)驗(yàn)區(qū)地物類型解譯圖Fig.2 The distribution map of the ground objects
PCA變換也稱霍特林變換或 K-L變換, 是一種基于信息量的正交線性變換, 該變換主要是采用線性投影的方法將數(shù)據(jù)投影到新的坐標(biāo)空間中, 從而使得新的成分按信息量分布, 第一主成分包含的信息量最大, 變換后各主成分分量彼此不相關(guān), 且隨著主成分編號(hào)的增加該分量包含的信息量減小。PCA變換后圖像的信息主要集中在前幾個(gè)主成分分量中, 在變換域中丟棄信息量小的主成分分量, 將原始的海量高光譜數(shù)據(jù)變換為少量的幾個(gè)成分, 在降低數(shù)據(jù)維數(shù)的同時(shí), 最大限度地保持了原始數(shù)據(jù)的信息[18]。
利用ENVI軟件對(duì)實(shí)驗(yàn)區(qū)的CHRIS/PROBA影像進(jìn)行PCA變換, 得到18個(gè)主成分分量, 各分量圖見(jiàn)圖3, 各分量的貢獻(xiàn)值見(jiàn)表2。
表1 CHRIS傳感器成像模式Tab.1 The imaging patterns of CHRIS
表2 PCA變換后各分量的貢獻(xiàn)率Tab.2 The contribution of different principal components after PCA transforms
圖3 PCA變換后的各分量Fig.3 The map of different principal components after PCA transforms
通過(guò)表2可以看出, 前3個(gè)分量包含了98.9%的信息量, 而前10個(gè)分量則包含了99.97%的信息量, 后8個(gè)分量?jī)H包含了0.03%的信息量; 同時(shí)從圖3的目視效果看, 第八分量所顯示的地物信息要比第七分量豐富。因此, 為了評(píng)價(jià)PCA變換對(duì)高光譜圖像地物分類精度的影響, 作者合成了 8種不同的分量組合圖, 分別是:(1)前10個(gè)分量組合, 以PC1~10表示; (2) 前9個(gè)分量組合, 以 PC1~9表示; (3)前 8個(gè)分量組合, 以 PC1~8表示; (4)前7個(gè)分量組合, 以PC1~7表示; (5)前6個(gè)和第8個(gè)分量組合, 以PC1~6, 8表示; (6) 前6個(gè)分量組合, 以PC1~6表示; (7)前4個(gè)分量組合, 以PC1~4表示;(8)僅前3個(gè)分量組合, 以PC1~3表示。
利用8種常用的監(jiān)督分類方法分別對(duì)CHRIS高光譜原始圖像和PCA變換后8種不同的分量組合圖進(jìn)行地物分類, 分類采用的ROI見(jiàn)圖4, ROI顏色所代表的地物類型同圖2。8種監(jiān)督分類方法選擇最大似然法(ML)、支持向量機(jī)(SVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)、最小距離(MD)、馬氏距離(Mad)、二進(jìn)制編碼(BE)、光譜角度法(SAM)和光譜信息散度法(SID)。
通過(guò)對(duì)各種方法的地物分類結(jié)果和地面真實(shí)地物類別進(jìn)行逐個(gè)像元統(tǒng)計(jì), 建立誤差矩陣, 使用總體精度、Kappa系數(shù)、生產(chǎn)者精度(PA)和用戶精度(UA)來(lái)評(píng)價(jià)地物分類的精度, 見(jiàn)表3~表6。
圖4 監(jiān)督分類采用的ROI分布Fig.4 Region of Interest map used in supervised classification
通過(guò)表3和表4可以看出: 最大似然法、支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò) 3種分類方法的總體精度和Kappa系數(shù)都較高, 總體精度多在 80%以上, Kappa系數(shù)多在 0.7以上, 分類結(jié)果見(jiàn)圖5。其中, 利用最大似然法對(duì)CHRIS高光譜原始圖像進(jìn)行分類的結(jié)果總體精度最高, 為85.096%; 利用最大似然法對(duì)PCA變換后前 9個(gè)分量組合圖進(jìn)行分類的結(jié)果總體精度次之, 為84.978%。
通過(guò)表5和表6可以看出, 對(duì)于實(shí)驗(yàn)區(qū)內(nèi)的6種地物類型, 利用不同的監(jiān)督分類方法和圖像類型所得到的分類結(jié)果精度有高有低, 且最高的生產(chǎn)者精度和用戶精度對(duì)應(yīng)的監(jiān)督分類方法和圖像類型不一。6種地物類型最高的生產(chǎn)者精度和用戶精度對(duì)應(yīng)的監(jiān)督分類方法、圖像類型及其精度見(jiàn)表7。
表3 分類結(jié)果的總體精度表(%)Tab.3 The overall accuracy of the classification result (%)
表4 分類結(jié)果的Kappa系數(shù)表Tab.4 Kappa coefficient of the classification result
充分利用各分類器的優(yōu)勢(shì), 從 3個(gè)方面考慮:(1)分類結(jié)果一致的, 采用共識(shí)的結(jié)果; (2)采用每類地物分類精度最高的結(jié)果; (3)采用總體分類精度最高的結(jié)果, 提出了兩組決策級(jí)融合策略, 每組融合策略又分兩種方式進(jìn)行。
融合策略一: 最優(yōu)和次優(yōu)的算法分類結(jié)果一致的, 采用共識(shí); 分類結(jié)果不一致, 采用每類地物分類精度最高(PA、UA、PA+UA)的, 空穴和縫隙采用總體分類精度最高的。分兩種方式: 一是按照從類型1(蘆葦)至類型6(檉柳)的順序; 二是按照分類精度從高到低的順序。
融合策略二: 直接采用每類地物分類精度最高(PA、UA、PA+UA)的, 空穴和縫隙采用總體分類精度最高的。同樣分兩種方式: 一是按照從類型1(蘆葦)至類型 6(檉柳)的順序; 二是按照分類精度從高到低的順序。
針對(duì)全部 8種監(jiān)督分類方法的分類結(jié)果和總體分類精度較高的3種分類方法(ML、SVM、ANN)的分類結(jié)果, 分別采用上述兩組融合策略進(jìn)行決策級(jí)分類, 分類結(jié)果圖見(jiàn)圖6, 分類結(jié)果精度表見(jiàn)表8。
總體來(lái)看, 兩組融合策略的分類結(jié)果均有如下特征: (1)PA+UA最高的分類表現(xiàn)最好, 即綜合考慮生產(chǎn)者精度和用戶精度的情形下地物分類精度最高;(2)僅使用總體分類精度較高的 3種分類方法(ML、SVM、ANN)的地物分類精度較使用全部8種分類方法的地物分類精度有提高; (3)按照分類精度從高到低順序進(jìn)行的融合分類要比按照類型順序進(jìn)行的融合分類效果好。
融合策略一兩種方式的地物分類總體精度和Kappa系數(shù)都較 8種監(jiān)督分類方法中效果最好的最大似然法有提高; 且在綜合考慮生產(chǎn)者精度和用戶精度的情形下, 僅使用ML、SVM和ANN 3種分類方法, 按照分類精度從高到低的順序進(jìn)行的融合分類效果最好, 總體分類精度為87.007%。融合策略二兩種方式的地物分類效果, 在僅考慮生產(chǎn)者精度的情形下不理想, 僅考慮用戶精度的情形下較最大似然法有提高, 在綜合考慮生產(chǎn)者精度和用戶精度的情形下最優(yōu); 同樣是在綜合考慮生產(chǎn)者精度和用戶精度的情形下, 僅使用ML、SVM和ANN 3種分類方法, 按照分類精度從高到低的順序進(jìn)行的融合分類效果最好, 總體分類精度為 87.82%, 較最大似然法的 85.10%提高了 2.7個(gè)百分點(diǎn); 同時(shí)較最大似然法明顯減少了誤分現(xiàn)象, 尤其是對(duì)于分布面積較小的翅堿蓬和檉柳, 灘涂被誤分為翅堿蓬、蘆葦被誤分為檉柳的現(xiàn)象大大降低。在高光譜圖像的其他應(yīng)用中, 如水果質(zhì)量檢查[19]、城市制圖[20]和林種制圖[21]等, 同樣也發(fā)現(xiàn)決策級(jí)融合方法可提高高光譜圖像地物分類結(jié)果的檢測(cè)與識(shí)別精度。
表5 分類結(jié)果的生產(chǎn)者精度表(%)Tab.5 The producer accuracy of the classification result (%)
表6 分類結(jié)果的用戶精度表(%)Tab.6 The user accuracy of the classification result (%)
圖5 ML(左)、SVM(中)、ANN(右)對(duì)原始圖像和8種分量組合圖的分類結(jié)果Fig.5 The classification map of original image and eight kind of principal components combination using Maximum Likelihood (left), Support Vector Machine (middle) and Artificial Neural Network (right)
表7 不同地物類型的優(yōu)勢(shì)分類方法及其精度表Tab.7 The best classifier and its accuracy of different ground objects
圖6 不同融合策略的分類結(jié)果圖(左: PA最高; 中: UA最高; 右: PA+UA最高)Fig.6 The classification map of different fusion strategies (left: the highest producer accuracy; middle: the highest user accuracy; right: the total of the producer and user accuracy is highest)
表8 不同融合策略的分類結(jié)果精度表(%)Tab.8 The classification accuracy of different fusion strategies(%)
高光譜數(shù)據(jù)具有波段多、數(shù)據(jù)量大、信息冗余增加的特點(diǎn), 利用主成分分析方法可降低高光譜數(shù)據(jù)的維數(shù), 提高圖像的質(zhì)量和處理效率; 而采用決策級(jí)數(shù)據(jù)融合方法, 則可充分利用各分類器的優(yōu)勢(shì),在一定程度上提高地物的分類精度。為此, 作者基于8種常用監(jiān)督分類器對(duì)高光譜原始圖像和PCA變換后不同分量組合圖的分類結(jié)果, 設(shè)計(jì)提出了兩組地物分類結(jié)果的決策級(jí)融合策略, 并將其應(yīng)用于覆蓋黃河入海口新老河道交界處的CHRIS/PROBA高光譜圖像中, 評(píng)價(jià)了主成分分析方法和決策級(jí)數(shù)據(jù)融合方法對(duì)高光譜圖像濱海濕地地物分類結(jié)果的影響。
需要注意的是, PCA變換將原始數(shù)據(jù)映射到一個(gè)新的空間, 在新的空間中, 原始數(shù)據(jù)的大部分信息被壓縮到較少的幾個(gè)波段(主成分)中, 改變了原始波段的物理意義[22], 使得PCA變換后的各主成分分量沒(méi)有明確的物理意義, 因此對(duì)于不同的高光譜圖像, 獲得的各主成分分量具有不確定性, 很難直接進(jìn)行比較。所以在作者所用高光譜影像中適用的方法, 在其他時(shí)相、其他地域、其他傳感器的高光譜影像中是否適用還需進(jìn)一步的實(shí)驗(yàn)進(jìn)行驗(yàn)證。此外, 高光譜圖像預(yù)處理過(guò)程[23]、監(jiān)督分類樣本的選擇[24]、不同監(jiān)督分類方法參數(shù)的設(shè)置[25]等也對(duì)地物分類結(jié)果的精度有影響。
[1]張良培、張立福.高光譜遙感[M].北京: 測(cè)繪出版社,2011.
[2]Anna M S, Annamaria C, Mariangela D, et al.Combined approach based on principal component analysis and canonical discriminant analysis for investigation hyperspectral plant response[J].Italian Journal of Agronomy, 2012, 7(3): 247-253.
[3]Chen G Y, Qian S E.Denoising of hyperspectral imagery using principal component analysis and wavelet shrinkage[J].IEEE Transactions on Geoscience& Remote Sensing, 2011, 49(3): 973-980.
[4]Koksal E S.Hyperspectral reflectance data processing through cluster and principal component analysis for estimating irrigation and yield related indicators[J].Agricultural Water Management, 2011, 98(8): 1317-1328.
[5]Qian D, Fowler J E.Low-complexity principal component analysis for hyperspectral image compression[J].International Journal of High Performance Computing Applications, 2008, 22(4): 438-448.
[6]Jaime Z, Ren J C, Ren J, et al.Structured covariance principal component analysis for real-time onsite feature extraction and dimensionality reduction in hyperspectral imaging[J].Applied Optics, 2014, 53(20): 4440-4449.
[7]Chen G Y, Qian S E.Denoising and dimensionality reduction of hyperspectral imagery using wavelet packets, neighbour shrinking and principal component analysis[J].International Journal of Remote Sensing, 2009, 30(18): 4889-4895.
[8]Rodarmel C, Shan J.Principal component analysis for hyperspectral images classification[J].Surveying and Land Information System, 2002, 62(2): 115-123.
[9]Bachmann C M, Donato T F, Lamela G M, et al.Automatic classification of land cover on Smith Island, VA, using HyMAP imagery[J].IEEE Transactions on Geoscience and Remote Sensing, 2002, 40(10): 2313-2330.
[10]Zhang L P, Liu Q H, Zhao C S, et al.The detailed vegetation classification for airborne hyperspectral remote sensing imagery by combining PCA and PP[C]//in 2ndWorkshop on Hyperspectral Image and Signal Processing: Evolution in Remote Sensing, WHISPERS 2010, Iceland: Reykjavik, 2010: 1-4.
[11]Pierre G, Jacquez G M, Andrew M.Geostatistical and local cluster analysis of high resolution hyperspectral imagery for detection of anomalies[J].Remote Sensing of Environment, 2005, 95(3): 351-367.
[12]Shahin M A, Symons S J.Detection of Fusarium damaged kernels in Canada Western Red Spring wheat using visible/near-infrared hyperspectral imaging and principal component analysis[J].Computers &Electronics in Agriculture, 2011, 75(1): 107-112.
[13]Licciardi G, Pacifici F, Tula D, et al.Decision fusion for the classification of hyperspectral data: outcome of the 2008 GRS-S data fusion contest[J].IEEE Transactions on Geoscience and Remote Sensing, 2009, 47(11): 3857-3865.
[14]He Y, Qian D, Ben M.Decision fusion on supervised and unsupervised classifiers for hyperspectral imagery[J].IEEE Transactions on Geoscience and Remote Sensing, 2010, 48(4): 875-879.
[15]Kalluri H R, Prasad S, Bruce L M.Decision-level fusion of spectral reflectance and derivative information for Robust hyperspectral land cover classification[J].IEEE Transactions on Geoscience and Remote Sensing, 2010,48(11): 4047-4058.
[16]Wei L, Prasad S, Fowler J E.Decision fusion inkernel-induced spaces for hyperspectral image classification[J].IEEE Transactions on Geoscience and Remote Sensing, 2014, 52(6): 3399-4012.
[17]曹斌, 譚炳香.多角度高光譜 CHRIS數(shù)據(jù)特點(diǎn)及預(yù)處理研究[J].安徽農(nóng)業(yè)科學(xué), 2010, 38(22): 12289-12294.
[18]張兵, 高連如.高光譜圖像分類與目標(biāo)探測(cè)[M].北京: 科學(xué)出版社, 2011.
[19]Nanyam Y, Choudhary R, Gupta L, et al.A decision-fusion strategy for fruit quality inspection using hyperspectral imaging[J].Biosystems Engineering, 2012, 111(1): 118-125.
[20]Huang X, Zhang L P.A multilevel decision fusion approach for urban mapping using very high-resolution multi/hyperspectral imagery[J].International Journal of Remote Sensing, 2012, 33(11): 3354-3372.
[21]Stavrakoudis D G, Dragozi E, Gitas I Z, et al.Decision fusion based on hyperspectral and multispectral satellite imagery for accurate forest species mapping[J].Remote Sensing, 2014, 6(8): 6897-6928.
[22]劉智深, 丁寧, 趙朝方, 等.主成分分析法在油熒光光譜選擇中的應(yīng)用[J].地理空間信息, 2009, 7(3): 12-14.
[23]蓋利亞, 劉正軍, 張繼賢.CHRIS/PROBA 高光譜數(shù)據(jù)的預(yù)處理[J].測(cè)繪工程, 2008, 17(1): 40-43.
[24]王曉玲, 杜培軍, 譚琨.高光譜遙感影像 SVM 分類中訓(xùn)練樣本選擇的研究[J].測(cè)繪科學(xué), 2011, 3: 127-129.
[25]楊希明.高光譜遙感圖像分類方法研究[D].哈爾濱:哈爾濱工程大學(xué), 2007.