彭忻怡,羅 斌,付志濤
(1.武漢大學(xué) 測繪遙感信息工程國家重點實驗室,湖北 武漢 430079; 2.昆明理工大學(xué) 國土資源工程學(xué)院,云南 昆明 650093)
高光譜圖像由于其非常窄的波段寬度與眾多的光譜數(shù)目,存在維度較高、波段間相關(guān)性高、信息冗余量大的問題,一方面給圖像的存儲、傳輸與運算帶來了更大負擔,大大增加了處理的時間與空間復(fù)雜度;另一方面,隨著數(shù)據(jù)維度的過度增長,有限的樣本訓(xùn)練出的數(shù)據(jù)分布模型精度反而會降低,即出現(xiàn)“維度災(zāi)難”[1],對地物分類與圖像分析產(chǎn)生影響[2].高光譜圖像波段選擇是遙感領(lǐng)域的常見數(shù)據(jù)預(yù)處理方法,其目的是從高光譜圖像中選擇有限的波段以減輕計算負擔,同時避免對分類精度造成較大損失,并保留波段的物理特性.
大部分波段選擇方法可以根據(jù)選擇策略劃分為基于排序、基于聚類、基于貪婪算法及基于演化算法的的波段選擇方法.基于排序的方法通常利用拉普拉斯值[3]、樣本成分分析值[4-5]、信息離散度[6]、流形排序[7]等作為波段評價指標.其中基于主成分方差最大的波段選擇[8]已成為波段選擇的基準方法之一,若排序指標未充分考慮波段之間存在重疊,則還需要對排序后波段進行去冗余操作.聚類方法則是直接從波段相似性出發(fā),選出冗余度最小的波段組合.常見的有基于響應(yīng)平滑性約束的優(yōu)化聚類方法[9]、快速密度峰值聚類方法[10]、低秩子空間聚類[11]、基于圖的聚類方法[14]等,然而這樣可能會漏選信息量更大或?qū)Ψ诸惥哂懈鼜娬孀饔玫牟ǘ螆D像.因此也有將排序與聚類組合的波段選擇方法,先通過聚類篩掉冗余度大的波段,接著將剩余波段進行排序后選擇[15].基于貪婪的方法[16-17]采用前向或后向搜索策略進行多次迭代,每次選取一個波段進入候選子集或者從候選子集中移除一個波段,這種方法由于每次增加一個波段需要重新遍歷所有剩余波段,算法復(fù)雜度隨著波段數(shù)目的增加而平方增加.基于演化計算的方法[18-19]是隨機生成一組波段候選子集,接著通過不斷迭代更新波段子集的方法,同樣存在計算量過大的問題.
人類視覺系統(tǒng)能夠迅速在復(fù)雜背景下進行信息篩選,準確識別出特殊區(qū)域,這些區(qū)域往往在圖像整體中體現(xiàn)出了與眾不同的視覺表觀,并且與相鄰區(qū)域具有較大的視覺差異,因此才能吸引人類視線.視覺顯著性正是利用算法模擬人類視覺注意機制,篩選出顯著目標的方法.由于顯著性區(qū)域中涵蓋大量高級語義信息,該方法被廣泛運用于目標檢測與識別等多個領(lǐng)域.有一些研究提到了顯著性波段的概念,然而顯著性只是作為差異性的同義詞被使用,與本文提到的視覺顯著性方法存在差異.
傳統(tǒng)波段選擇方法傾向于選擇包含更多信息的波段子集,通常以各波段代表性與波段間相關(guān)性為評價標準,其選出的豐富信息量波段圖像不一定能得到最好的地物分類效果,因此本文引入視覺顯著性方法,定義基于顯著圖的波段評價指標,以充分利用各波段圖像的空間信息,結(jié)合固有的光譜信息進行波段選擇,并通過結(jié)構(gòu)相似度(structural similarity index, SSIM)作為相似波段的篩除標準.
基于視覺顯著性的波段選擇方法流程如上圖1所示.首先,引入視覺顯著性作為波段評價指標,以對所有波段排序;然后,基于結(jié)構(gòu)相似性對冗余波段進行篩除,使所選頻段包含較少的重疊信息;最終得到優(yōu)選的波段子集以用于后續(xù)的地物分類.
圖1 基于顯著性的波段選擇方法
考慮單獨以信息量最大為依據(jù)選出的波段子集,并不一定是針對特定分類任務(wù)的最優(yōu)解,為使那些于區(qū)分不同地物更有利的信息得到突出,本文引入了視覺顯著性量度,而后續(xù)的實驗證明這種思路具有可取之處.視覺顯著性是根據(jù)數(shù)學(xué)模型模擬人類視覺機制,判斷并評價目標與背景差異程度的一種衡量標準.視覺顯著性方法將影像處理為顯著圖,每個像素值代表了該點在原圖的顯著程度,即與周圍背景點的差異程度.正是因為這樣的特性,我們才將其作為基于高光譜分類任務(wù)的波段選擇中的重要量度,這樣能夠根據(jù)不同的分類任務(wù),更有針對性地選出對分類更有幫助的波段子集.
不同側(cè)重的視覺顯著性方法會輸出不同的顯著圖.基于空間加權(quán)差異(spatially weighted dissimilarity, SWD[20])方法根據(jù)圖像塊間的空間距離定義顯著性.基于主成分分析(principal component analysis, PCA[21])的方法則是將圖像塊通過主成分分析體現(xiàn)的不同分布進行對比.快速有效顯著性(fast and efficient saliency, FES[22])方法認為視覺顯著性分布符合于某種密度函數(shù),并通過對滑動圓進行采樣來推導(dǎo)該函數(shù).基于分割(segment, SEG[23])的方法同樣利用了概率函數(shù),它將滑動圓改為滑動窗口.基于情境感知(context-aware, CA[27])的方法利用了全局與局部對比,不僅考慮顯著性物體,還考慮了一些背景中與顯著性物體相關(guān)的情境部分.基于圖規(guī)整(graph-regularized, GR[24])的方法引入了基于凸包的中心圖以抑制背景,并以圖結(jié)構(gòu)對空間差異進行加權(quán).光譜殘差法(spectral residuals,SR[25]) 定義了光譜殘差概念,并在頻率域計算顯著性,.基于魯棒性背景檢測(robust background detection,RBD[26])方法引入了魯棒性量度, 定義了直觀的代價函數(shù)最小障礙距離(minimal barrier saliency, MBS[28])方法則定義了新的空間距離,對以某點為起點,邊緣點為終點的每一條路徑,都計算其最大像素值與最小像素值之差,最終將所有路徑的輸出值下限定義為最小障礙距離.
圖2展示了上述不同算法對高光譜圖像某一波段的顯著圖輸出結(jié)果與groundtruth對比.盡管存在輸出區(qū)別,上述方法都可以探測到如噴漆金屬板屋頂?shù)娘@著目標,目標都聚集成簇,成為全圖中的顯著區(qū)域.如果某一波段的目標區(qū)域與背景區(qū)域(通過少量訓(xùn)練樣本得到)的顯著性的差異更大,則可以認為該波段能為分類提供更好的幫助.
基于視覺顯著性的波段排序算法偽碼如下表1.高光譜圖像Im×n×l可以被視作一系列二維圖像的集合{i1,i2,…,il},其中ik是圖像I的第k波段.對每個波段圖像ik分別輸出顯著圖Salik.少量的訓(xùn)練樣本Tc={(xi,yi)|yi=c}能夠指明需要被分類的興趣區(qū)域,其中xi是地物c的二維坐標,而yi是地物標簽.那么對于特定c類地物在k波段上的顯著性就可以根據(jù)公式1加權(quán)計算得到,其中Nc是訓(xùn)練子集Tc的基數(shù).
(1)
圖2 不同視覺顯著性方法效果區(qū)別
表1 基于顯著性的排序方法
那么,對于需要分類各項地物的總體分類任務(wù)C,我們定義了波段ik的顯著性O(shè)Sal(ik)如公式2所示,它刻畫了兩兩不同地物之間的對比度.根據(jù)波段顯著度性,我們可以將波段集合降序排列.實驗發(fā)現(xiàn),少量(10%)訓(xùn)練樣本就能夠在數(shù)據(jù)集上取得不錯的效果.排序后選取前m個波段,待分類地物在這些波段上會比背景更明顯.
(2)
表2是對pavia數(shù)據(jù)集進行排序后選出的波段序號及其顯著性.而圖 3分別對比了最顯著與最不顯著的波段圖像.可以看到,顯著波段在右半部分具有更清晰明顯的細節(jié)部分.由此可見,這樣的排序方法有其合理之處.然而,波段之間是存在重疊與冗余的,正如表2中顯示的那樣,選擇出的前10波段會存在序號過近的現(xiàn)象,增加了重復(fù)信息.所以需要對冗余波段進行篩除操作.
表2 前10波段顯著性
(3)
C1=(K1L)2,C2=(K2L)2.
SSIM的范圍在-1到1之間,其絕對值越接近于1,則兩個波段圖像越相似;越接近0,則2個波段圖像更不相關(guān).下圖 4證明了SSIM能夠作為濾除相似波段圖像的量度.濾除操作的偽碼如下表3,首先計算兩兩波段間的SSIM,若其高于設(shè)定閾值,則篩除更不顯著的波段,即是排序后序號更大的波段.
圖3 顯著與不顯著波段的對比
圖4 相似圖像對與不相似圖像對的SSIM對比
表3 SSIM 過濾器
為了驗證提出的基于視覺顯著性的波段選擇方法,我們在3個數(shù)據(jù)集上進行了實驗.肯尼迪航天中心 (Kennedy space center,KSC)數(shù)據(jù)集是由 NASA AVIRIS 傳感器獲取,去除低質(zhì)量波段后共有176個波段,包含13種不同地物.而Pavia中心和Pavia大學(xué)(PaviaU)數(shù)據(jù)集則由ROSIS 傳感器獲取,都包含9種不同地物,分別有103和102個波段.
為了找到更適合于高光譜分類的視覺顯著性算法,我們將大部分經(jīng)典視覺顯著性算法帶入上節(jié)提到的算法框架中進行實驗對比.我們測試了9種不同的顯著性算法,最終都選出10個波段,隨機選擇了10%的樣本進行監(jiān)督訓(xùn)練.根據(jù)經(jīng)驗,SSIM閾值設(shè)置為0.90.實驗結(jié)果如下表4所示.采取了Kappa系數(shù)和總體精度(overall accuracy, OA)作為評價指標.
表4 不同顯著性方法的分類結(jié)果對比
可以看出,MBS是最適合高光譜分類的顯著性算法,在各數(shù)據(jù)集中都有穩(wěn)健優(yōu)異的表現(xiàn).這可以解釋為,因為大多數(shù)顯著性算法都是基于人眼的預(yù)測或加上了中心偏移的先決條件.中心偏移的前提條件是,感興趣的對象始終位于圖像的中間,這在自然圖像中效果很好,但在高光譜圖像中表現(xiàn)不佳. MBS算法基于距離變換來描繪目標與背景之間的潛在對比,而無需后處理部分就可以很好地工作.因此,建議使用基于MBS視覺顯著方法進行波段選擇.
為了驗證視覺顯著性波段選擇方法的可行性與有效性,將其與其他幾類選擇算法進行了比較. 線性映射方法(linear projection,LP[29])選擇最不相似的頻段作為組合,交叉信息方法(mutual information,MI[30])通過排序選擇信息熵更多的頻段. 增強快速密度峰值聚類方法(enhanced fast density peaked clustering,EFDPC[31])通過使用聚類的密度估計來解決頻帶選擇. 顯著波段選擇方法(saliency-based band saliency,SBSS[32])還利用尺度選擇來利用頻譜信息,并希望找到差異波段.這幾種算法涵蓋了大部分波段選擇方法類型.
用這5種方法分別選出了10波段組成的波段子集,并進行了20次獨立的重復(fù)實驗,最終得到的kappa系數(shù)和OA結(jié)果分別列于表5和表6.結(jié)果表明,基于MBS的視覺顯著性波段選擇方法在高光譜分類中具有不錯的效果. SBSS和MBS在不同的數(shù)據(jù)集中都可以很好地工作,這證明了顯著性可以作為頻段選擇的重要指標.而MBS具有更好的表現(xiàn),是因為進一步探討了顯著性概念,它不僅是波段系列中的奇異波段,而且還刻畫了波段圖像中不同地物的突出程度.
表5 不同波段選擇方法的Kappa系數(shù)
表6 不同波段選擇方法的OA對比
本文基于信息量最大波段子集并不一定是最適合分類的波段子集這一思路,引入了視覺顯著性作為適合高光譜分類任務(wù)的波段選擇尺度,認為顯著性描述的目標與背景差異能夠更好體現(xiàn)波段質(zhì)量.為了去除冗余頻段,使用SSIM篩選類似的頻段,并在實驗上取得了不錯的效果.然而,基于結(jié)構(gòu)相似度的冗余波段篩選方法也存在計算量大,速度較慢的問題.在后續(xù)研究中,若能將排序方法與聚類策略進行結(jié)合,或許能夠更高效地為高光譜分類服務(wù).