宋相法 焦李成(西安電子科技大學(xué)智能感知與圖像理解教育部重點(diǎn)實(shí)驗(yàn)室 西安 710071)
②(河南大學(xué)計(jì)算機(jī)與信息工程學(xué)院 開封 475004)
高光譜遙感圖像是由幾十乃至數(shù)百個(gè)連續(xù)波段圖像組成的3維數(shù)據(jù)立方體,具有“圖譜合一”的特點(diǎn),提高了對(duì)地物的分類和監(jiān)測(cè)能力,已經(jīng)被廣泛應(yīng)用于資源勘探、環(huán)境監(jiān)測(cè)、精細(xì)農(nóng)業(yè)、災(zāi)害評(píng)估、目標(biāo)識(shí)別等領(lǐng)域[1-5]。像元分類是高光譜遙感圖像研究的最重要內(nèi)容之一。由于硬件等因素的制約,高光譜遙感圖像的光譜空間分辨率高而空間分辨率往往相對(duì)較低,如果僅利用光譜信息進(jìn)行分類,其分類精度必然受到一定的制約。為了提高像元分類精度,必須進(jìn)一步提取圖像的其他信息,例如形狀、紋理、空間關(guān)系和擴(kuò)展形態(tài)剖面(extended morphological profile)特征[1]。另外,由于高光譜數(shù)據(jù)維數(shù)高、數(shù)據(jù)量大、訓(xùn)練樣本數(shù)目有限,傳統(tǒng)的分類方法運(yùn)算速度慢,分類精度低,還會(huì)出現(xiàn)嚴(yán)重的huges現(xiàn)象[6]。在高光譜遙感分類中隨機(jī)森林分類器[7]具有明顯的優(yōu)越性,因此隨機(jī)森林分類器應(yīng)用被歸納為高光譜遙感分類最重要的進(jìn)展之一[4,5]。
由于光譜成像儀的空間分辨率限制以及自然界地物的復(fù)雜多樣性,通常情況下,高光譜圖像中每個(gè)像元往往包含幾種地物,可以認(rèn)為是圖像中幾個(gè)端元的線性組合。最近發(fā)展起來(lái)的稀疏表示[8]就是把圖像表示為字典中基原子的稀疏線性組合。當(dāng)把圖像投影到這些原子組成的特征子空間時(shí),只有少部分同時(shí)處于活躍狀態(tài),產(chǎn)生對(duì)該圖像的稀疏表示。該方法可以描述上述高光譜圖像像元的特性,并成功應(yīng)用于高光譜混合像元分解[9]。
為了提高像元分類精度,本文提出了基于稀疏表示[8]的高光譜遙感圖像特征提取算法,結(jié)合稀疏表示特征及光譜信息,使用隨機(jī)森林方法[7]作為分類器,提出了一種新的高光譜遙感圖像分類算法。實(shí)驗(yàn)結(jié)果表明:相對(duì)于光譜信息方法和稀疏表示特征方法,本文算法能夠提高高光譜遙感圖像分類的各項(xiàng)評(píng)價(jià)指標(biāo)。
由于稀疏表示模型符合生物視覺(jué)系統(tǒng)特性,且能夠提取圖像的高級(jí)特征[8],成為了圖像處理和模式識(shí)別等領(lǐng)域的研究熱點(diǎn)[8-18]。本文利用稀疏表示提取高光譜圖像稀疏表示特征,基于稀疏表示特征及光譜信息利用隨機(jī)森林作為分類器提出了一種新的高光譜遙感圖像分類算法。
如何獲得高光譜圖像中的端元構(gòu)造字典是利用稀疏表示方法提取稀疏表示特征的關(guān)鍵問(wèn)題。常用的端元提取方法主要有純像元指數(shù),N-FINDR,定點(diǎn)成分分析和主分量分析,這些方法假設(shè)高光譜數(shù)據(jù)位于一個(gè)凸面體內(nèi)[19]。而稀疏表示模型不需要假設(shè)數(shù)據(jù)位于凸面體內(nèi),利用學(xué)習(xí)的方法構(gòu)造的字典原子更能有效地捕獲高光譜圖像像元的譜特征,該字典可以有效地表示像元。
令高光譜遙感圖像數(shù)據(jù)集X={xi|xi∈?m,1 ≤i≤n},字典D∈?m×p(每一列Dj∈?m為一個(gè)原子),該字典D能夠捕獲像元的譜特征,且每個(gè)像元xi可以被字典D中的原子稀疏線性表示。根據(jù)文獻(xiàn)[18],可以把字典學(xué)習(xí)的問(wèn)題轉(zhuǎn)化為求解如下形式的優(yōu)化問(wèn)題:
其中A∈?p×n為系數(shù)矩陣(每一列Ai∈?p為一個(gè)系數(shù)向量),λ>0。式(1)中第1項(xiàng)為重構(gòu)誤差,第2項(xiàng)為稀疏懲罰函數(shù),參數(shù)λ表示數(shù)據(jù)重構(gòu)和稀疏性之間的折中關(guān)系。字典D中的元素Dj和系數(shù)矩陣A中的元素Ai是被優(yōu)化的變量。
在字典學(xué)習(xí)階段,當(dāng)字典D和系數(shù)矩陣A不固定時(shí),上述問(wèn)題不是凸優(yōu)化問(wèn)題。通常情況下,采用迭代的方法可以求解式(1)。首先固定字典D,則式(1)轉(zhuǎn)化為一個(gè)關(guān)于A的基于?1-范數(shù)的最小平方凸優(yōu)化問(wèn)題;然后固定系數(shù)矩陣A,則式(1)轉(zhuǎn)化為一個(gè)關(guān)于D的帶二次約束的最小平方凸優(yōu)化問(wèn)題。通過(guò)多次迭代求解可以得到字典D。
利用2.1節(jié)學(xué)習(xí)得到的字典D,根據(jù)稀疏表示理論,可以把像元x∈X表示為字典D中原子的稀疏線性組合,即求解下列優(yōu)化問(wèn)題:
式(2)是一個(gè)凸?1-正則化最小平方問(wèn)題,得到的解是一個(gè)稀疏向量,即只有少數(shù)元素不為零。
由于同類像元的光譜曲線結(jié)構(gòu)非常相似,因此根據(jù)字典D求得的系數(shù)也比較相似。根據(jù)文獻(xiàn)[14],可以把作為像元x的一種新的表示形式,即像元x在字典D上的稀疏表示特征。
利用高光譜圖像稀疏表示特征及光譜信息表示像元x∈X時(shí),由于它們處于兩個(gè)不同的表示空間,為了提高分類精度,本文提出利用分類器集成方法。隨機(jī)森林是近年來(lái)比較流行的一種基于決策樹(decision tree)的分類器集成算法。該算法是一種對(duì)參數(shù)選擇不敏感,不存在過(guò)適應(yīng),分類結(jié)果穩(wěn)定,學(xué)習(xí)訓(xùn)練速度較快的分類器集成算法,在解決多類問(wèn)題上具有許多獨(dú)特的優(yōu)勢(shì)。隨機(jī)森林方法定義如下[7]:
隨機(jī)森林分類器由多個(gè)決策樹(h(x,θk),k=1,2,…,l)組成,其中θk是相互獨(dú)立且同分布的隨機(jī)向量,每個(gè)決策樹對(duì)于輸入給出獨(dú)立的分類結(jié)果,最終根據(jù)所有決策樹的分類結(jié)果通過(guò)多數(shù)投票決定輸出結(jié)果。
隨機(jī)森林算法包括兩部分,即構(gòu)建l棵決策樹和投票決定分類結(jié)果。在構(gòu)造決策樹時(shí),采用bagging方法[20],即從全體訓(xùn)練樣本集中隨機(jī)地有放回地選取一個(gè)子集,作為單棵決策樹的訓(xùn)練樣本集,上述過(guò)程重復(fù)l次就分別得到l棵決策樹的訓(xùn)練樣本集。同樣,在每棵決策樹的生成過(guò)程中也引入了隨機(jī)性,若訓(xùn)練數(shù)據(jù)為q維特征向量,在決策樹的每個(gè)節(jié)點(diǎn)處,并不對(duì)所有特征進(jìn)行比較,而是隨機(jī)選擇t(t?q)個(gè)特征進(jìn)行比較,選擇其中分類結(jié)果較好的特征來(lái)切分樹節(jié)點(diǎn)。引入隨機(jī)性使得每?jī)煽脴渲g的差異度增加,從而使得森林的泛化誤差提高。構(gòu)造的決策樹不進(jìn)行剪枝。利用隨機(jī)森林方法進(jìn)行分類的最終分類結(jié)果由所有決策樹通過(guò)多數(shù)投票決定。
由于隨機(jī)森林采用隨機(jī)子空間特征選擇方法減少了輸入空間的維數(shù)且能夠快速構(gòu)造決策樹,同時(shí)根據(jù)多個(gè)決策樹的結(jié)果采用投票策略決定分類結(jié)果,因此能夠克服傳統(tǒng)高光譜數(shù)據(jù)分類方法中所面臨的數(shù)據(jù)維數(shù)高,訓(xùn)練樣本數(shù)目少,運(yùn)算速度慢等問(wèn)題,有效地對(duì)高光譜數(shù)據(jù)進(jìn)行分類。
本文提出結(jié)合稀疏表示特征及光譜信息,充分利用不同表示空間的特征信息,使用隨機(jī)森林方法對(duì)高光譜遙感圖像進(jìn)行分類。算法步驟如下:
(1)字典學(xué)習(xí)。利用SPAMS工具箱[18]求解式(1),得到學(xué)習(xí)字典D。
(2)特征提取。利用SPAMS工具箱[18]求解式(2),得到像元x∈X的稀疏表示特征。
(3)構(gòu)造隨機(jī)森林。利用像元x的稀疏表示特征和光譜信息分別構(gòu)造隨機(jī)森林,即決策樹集合的構(gòu)造。
為了對(duì)本文算法的分類效果進(jìn)行評(píng)估,對(duì)兩組高光譜遙感圖像數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn),為了對(duì)本文算法的分類效果進(jìn)行評(píng)估,對(duì)兩組高光譜遙感圖像數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn);同時(shí)對(duì)于單一的光譜信息特征和單一的稀疏表示特征也采用隨進(jìn)森林分類器進(jìn)行分類,并將他們的分類結(jié)果與本文算法的分類結(jié)果進(jìn)行了比較。實(shí)驗(yàn)中采用常用的分類比較評(píng)價(jià)指標(biāo),即總精度(Overall Accuracy, OA)和Kappa系數(shù)。為了使得算法具有可比性,實(shí)驗(yàn)中將各類樣本按數(shù)量隨機(jī)等分成兩部分作為訓(xùn)練、測(cè)試樣本集,所有算法和實(shí)驗(yàn)都按照這種方式運(yùn)行 10次對(duì)結(jié)果求平均值,最優(yōu)結(jié)果用粗體表示。
實(shí)驗(yàn)1使用1992年6月AVIRIS 傳感器采集的美國(guó)印第安納州 Indian Pine實(shí)驗(yàn)區(qū)高光譜遙感圖像,該圖像來(lái)自Purdue 大學(xué)遙感圖像處理實(shí)驗(yàn)室。去除水汽吸收和低信噪比波段后,從原始的220 個(gè)波段中選取了200個(gè)波段作為研究對(duì)象。實(shí)驗(yàn)數(shù)據(jù)集使用常用的9 類典型地物作為測(cè)試樣本,共包含9345 個(gè)樣本點(diǎn),如表1 所示。
3種不同方法的分類結(jié)果如表 2所示,原始Indian Pine實(shí)驗(yàn)區(qū)高光譜遙感圖像及其分類結(jié)果對(duì)比如圖1所示。從表2中可以看出:(1)總精度分別由基于光譜信息方法的 87.3%,基于稀疏表示特征方法的84.8%提高到了本文方法的89.0%;(2)Kappa系數(shù)分別由基于光譜信息方法的0.851,基于稀疏表示特征方法的0.811提高到了本文方法的0.870。
表1 Indian Pine實(shí)驗(yàn)區(qū)典型地物樣本信息統(tǒng)計(jì)表
表2 3種分類方法的實(shí)驗(yàn)結(jié)果對(duì)比
實(shí)驗(yàn) 2使用美國(guó)國(guó)家航空航天局(NASA)的機(jī)載可見(jiàn)/紅外成像光譜儀(AVIRIS)于1996年3月23日獲取的美國(guó)佛羅里達(dá)州 Kennedy Space Center(KSC)實(shí)驗(yàn)區(qū)高光譜遙感圖像[5]。光譜范圍為 400~2500 nm,波段個(gè)數(shù)為224,去掉大氣水份吸收和低信噪比波段后,剩余176個(gè)波段作為研究對(duì)象。根據(jù)肯尼迪空間中心地面覆蓋圖和Landsat專題制圖儀(TM)影像,共得到13類典型地物樣本點(diǎn)5211個(gè),如表3所示。
3種不同方法的分類結(jié)果如表4所示,原始KSC實(shí)驗(yàn)區(qū)高光譜遙感圖像及其分類結(jié)果對(duì)比如圖2所示。從表4中可以看出:(1)總精度分別由基于光譜信息方法的92.0%,基于稀疏表示特征方法的91.1%提高到了本文方法的93.3%; (2)Kappa系數(shù)分別由基于光譜信息方法的0.865,基于稀疏表示特征方法的0.852提高到了本文方法的0.880。
表3 KSC實(shí)驗(yàn)區(qū)典型地物樣本信息統(tǒng)計(jì)表
圖1 Indian Pine實(shí)驗(yàn)區(qū)高光譜遙感圖像分類結(jié)果對(duì)比
圖2 KSC實(shí)驗(yàn)區(qū)高光譜遙感圖像分類結(jié)果對(duì)比
表4 3種分類方法的實(shí)驗(yàn)結(jié)果對(duì)比
由于本文算法分別利用稀疏表示特征和光譜信息構(gòu)造隨機(jī)森林,根據(jù)不同特征空間的分類結(jié)果進(jìn)行集成得到最終結(jié)果,從上述兩個(gè)高光譜遙感圖像數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果對(duì)比可以看出,本文算法在分類精度上和視覺(jué)效果上都要優(yōu)于光譜信息方法和稀疏表示特征方法。另外,實(shí)驗(yàn)1中光譜信息的分類結(jié)果精度高于稀疏表示特征的方法,即這兩種方法的差異性大;而實(shí)驗(yàn)2中光譜信息的分類結(jié)果精度略高于稀疏表示特征的方法,即這兩種方法的差異性小,因此本文算法在實(shí)驗(yàn)1上的改善程度略高于實(shí)驗(yàn) 2,這與集成學(xué)習(xí)中差異性對(duì)集成結(jié)果的影響是一致的。
為了直觀比較各種分類方法花費(fèi)的代價(jià),使用運(yùn)算時(shí)間作為計(jì)算復(fù)雜度的度量。實(shí)驗(yàn)中使用的機(jī)器配置為雙核2.93 GHz Intel Core i3 處理器,8GB內(nèi)存,在Matlab7.10環(huán)境下進(jìn)行實(shí)驗(yàn)。表5給出了3種方法的運(yùn)行時(shí)間。由表中可以看出,本文方法的運(yùn)算時(shí)間高于光譜信息方法,且略高于稀疏表示特征方法。由于本文方法的分類效果優(yōu)于上述兩種方法,所以增加的計(jì)算開銷是可以接受的。
表5 3種分類方法的運(yùn)行時(shí)間(s)
針對(duì)僅利用光譜信息導(dǎo)致高光譜遙感圖像分類精度較低的問(wèn)題,本文提出基于稀疏表示理論提取高光譜圖像的稀疏表示特征,根據(jù)稀疏表示特征和光譜信息這兩種不同的表示形式,提出利用隨機(jī)森林方法實(shí)現(xiàn)圖像分類。對(duì)兩個(gè)高光譜圖像數(shù)據(jù)集分類的實(shí)驗(yàn)結(jié)果表明,本文所提出的基于稀疏表示及光譜信息的高光譜圖像遙感分類算法的性能總體優(yōu)于光譜信息方法和稀疏表示特征方法,在總精度和Kappa系數(shù)上相對(duì)于光譜信息方法和稀疏表示特征方法都有大幅度的提高。本文的研究工作還有許多有待改進(jìn)的地方,例如,如何更加有效地融合稀疏表示特征和光譜信息,采用其它組合分類器算法獲得更佳的分類效果,進(jìn)一步研究快速算法從而降低計(jì)算開銷等問(wèn)題。
[1]Plaza A, Benediktsson J A, Boardman J,et al.. Recent advances in techniques for hyperspectral image processing [J].Remote Sensing of Environment, 2009, 113(9): 110-122.
[2]邸韡, 潘泉, 趙永強(qiáng), 等. 高光譜圖像波段子集模糊積分融合異常檢測(cè)[J]. 電子與信息學(xué)報(bào), 2008, 30(2): 267-271.Di Wei, Pan Quan, Zhao Yong-qiang,et al.. Anomaly target detection in hyperspectral imagery based on band subset fusion by fuzzy integral[J].Journal of Electronics&Information Technology, 2008, 30(2): 267-271.
[3]宋娟, 吳成柯, 張靜, 等. 基于分類和陪集碼的高光譜圖像無(wú)損壓縮[J]. 電子與信息學(xué)報(bào), 2011, 33(1): 231-234.Song Juan, Wu Cheng-ke, Zhang Jing,et al.. Lossless compression of hyperspectral images based on classification and coset coding [J].Journal of Electronics&Information Technology, 2011, 33(1): 231-234.
[4]Chan J C W and Paelinckx D. Evaluation of random forest and adaboost tree-based ensemble classification and spectral band selection for ecotope mapping using airborne hyperspectral imagery[J].Remote Sensing of Environment,2008, 112(6): 2999-3011.
[5]Ham J, Chen Y, Crawford M,et al.. Investigation of the random forest framework for classification of hyperspectral data [J].IEEE Transactions on Geoscience and Remote Sensing, 2005, 43(3): 492-501.
[6]Shahshahani B M and Landgrebe D A. The effect of unlabeled samples in reducing the small sample size problem and mitigating the hughes phenomenon[J].IEEE Transactions on Geoscience and Remote Sensing, 1994, 32(5):1087-1095.
[7]Breiman L. Random forests [J].Machine Learning, 2001,45(1): 5-32.
[8]Olshausen B A and Field D J. Emergence of simple-cell receptive field properties by learning a sparse code for natural images [J].Nature, 1996, 381(6583): 607-609.
[9]Iordache M D, Dias J M B, and Plaza A. Sparse unmixing of hyperspectral data. [J].IEEE Transactions on Geoscience and Remote Sensing, 2011, 49(6): 2014-2039.
[10]Wright J, Ma Y, Mairal J,et al.. Sparse representations for computer vision and pattern recognition [J].Proceedings of the IEEE, 2010, 98(6): 1031-1044.
[11]余慧敏, 方廣有. 壓縮感知理論在探地雷達(dá)三維成像中的應(yīng)用[J]. 電子與信息學(xué)報(bào), 2010, 32(1): 12-16.Yu Hui-min and Fang Guang-you. Research on compressive sensing based 3D imaging method applied to ground penetrating radar [J].Journal of Electronics&Information Technology, 2010, 32(1): 12-16.
[12]屈樂(lè)樂(lè), 方廣有, 楊天虹. 壓縮感知理論在頻率步進(jìn)探地雷達(dá)偏移成像中的應(yīng)用[J]. 電子與信息學(xué)報(bào), 2011, 33(1): 21-26.Qu Le-le, Fang Guang-you, and Yang Tian-hong. The application of compressed sensing to stepped-frequency ground penetrating radar migration imaging [J].Journal of Electronics&Information Technology, 2011, 33(1): 21-26.
[13]孫玉寶, 韋志輝, 吳敏, 等. 稀疏性正則化的圖像泊松去噪算法[J]. 電子學(xué)報(bào), 2011, 39(2): 285-290.Sun Yu-bao, Wei Zhi-hui, Wu Min,et al.. Image poisson denoising using sparse representations [J].Acta Elcetronica Sinica, 2011, 39(2): 285-290.
[14]Raina R, Battle A, Lee H,et al.. Self-taught learning: transfer learning from unlabeled data[C]. International Conference on Machine Learning, Corvallis, 2007: 759-766.
[15]Qiao Li-shan, Chen Song-can, and Tan Xiao-yang. Sparsity preserving projection with applications to face recognition [J].Pattern Recognition, 2010, 43(1): 331-341.
[16]Han Ya-hong, Wu Fei, Zhuang Yue-ting,et al.. Multi-label transfer learning with sparse representation[J].IEEE Transactions on Circuits and Systems for Video Technology,2010, 20(8): 1110-1121.
[17]Aharon M, Elad M, and Bruckstein A. K-SVD: an algorithm for designing over-complete dictionaries for sparse representation [J].IEEE Transactions on Signal Processing,2006, 54(11): 4311-4322.
[18]Mairal J, Bach F, Ponce J,et al.. Online learning for matrix factorization and sparse coding [J].Journal of Machine Learning Research, 2010, 11(1): 19-60.
[19]童慶禧, 張兵, 鄭蘭芬. 高光譜遙感: 原理、技術(shù)與應(yīng)用[M].北京: 高等教育出版社, 2006: 262-272.Tong Qing-xi, Zhang Bing, and Zheng Lan-fen. Hyperspectral Remote Sensing —— Theory, Technology and Applications[M]. Beijing: Higer Education Press, 2006: 262-272.
[20]Breiman L. Bagging predictors [J].Machine Learning, 1996,24(2): 123-140.