謝福鼎, 楊秋艷, 嵇 敏
(1.遼寧師范大學(xué) 地理科學(xué)學(xué)院,遼寧 大連 116029;2.遼寧師范大學(xué) 計算機與信息技術(shù)學(xué)院,遼寧 大連 116081)
與多光譜圖像相比,具有數(shù)百個波段的高光譜圖像不僅包含了豐富的光譜信息,還擁有較高的空間分辨率,這顯然有利于我們對地物進行準確的識別.目前,高光譜圖像已被廣泛應(yīng)用于環(huán)境監(jiān)測、土地管理、城市區(qū)域規(guī)劃等多個領(lǐng)域[1-3].然而,高光譜圖像的高維特征不但增加了計算負擔,還會導(dǎo)致Hughes現(xiàn)象的發(fā)生(即分類精度隨著維數(shù)的增加呈現(xiàn)出先增后減的趨勢)[4].所以,為了獲得較好的分類結(jié)果,在對高光譜圖像分類時,有必要對其進行降維計算.
高光譜圖像的降維方法一般可分為兩類:特征選擇和特征提取[5].特征選擇是根據(jù)所設(shè)計的準則函數(shù)直接從原始的波段中選取一定數(shù)量最具代表性的波段;特征提取是通過變換的方法將原始的高維波段空間映射到低維的特征空間.一些流行的特征提取方法有線性判別分析、譜方法、主成分分析(PCA)、核主成分分析(KPCA)等[6-7].由于無監(jiān)督的PCA和KPCA具有計算效率高,降維效果好,易于理解的優(yōu)點,因此被廣泛應(yīng)用于高光譜圖像的研究中[8].
近年來,基于譜-空信息的高光譜圖像降維方法越來越受到了人們的關(guān)注.這是因為在降維過程中考慮了包含在圖像中的空間信息,所以得到了比僅僅使用譜信息降維更好的效果.例如,利用遞歸濾波、加權(quán)均值濾波、鄰域保持投影、局部保持投影等方法[9-12],提出了一系列基于譜-空信息有效的降維算法.
超像素是由空間相鄰且顏色相近的像素組成的均質(zhì)區(qū)域,具有形狀和大小自適應(yīng)特性的超像素在計算機視覺領(lǐng)域獲得了成功的應(yīng)用.另外,超像素的這一特征也為我們提供了豐富的空間結(jié)構(gòu)信息,因此也被廣泛地使用在高光譜圖像的研究中.在眾多的分割算法中,基于圖的熵率超像素分割(ERS)算法由于在分割效率和有效性方面都具有優(yōu)異的性能,且對類邊緣有較好的依附性,因此被廣泛應(yīng)用于對高光譜圖像的分割[13].Jiang等人[14]通過在每一個超像素上局部實現(xiàn)PCA并降維到同樣的維數(shù),從而實現(xiàn)了整體降維,提出了S-PCA譜-空降維方法.Zhang 等人[15]則認為對于非線性可分的樣本數(shù)據(jù),KPCA有更好的降維效果,進而提出了S-KPCA譜-空降維算法.
已有的基于超像素的降維算法都存在一個公共的問題:降維結(jié)果嚴重依賴于超像素的分割尺度.一般來說,最優(yōu)分割尺度的獲得是一個實驗結(jié)果,難以事先指定.為了減緩降維效果對分割尺度的依賴性,在超像素均質(zhì)性假設(shè)的基礎(chǔ)上,本文提出了一種基于超像素合并的空譜降維方法.在兩個基準數(shù)據(jù)集上的實驗結(jié)果表明,在合并后的超像素圖上開展降維計算,可以有效削弱降維結(jié)果對分割尺度的依賴性.
對于一副給定的具有B個波段和n個像素的高光譜圖像HSI,采取下列步驟進行降維.
步驟1:超像素分割
首先使用PCA算法降維,并取第一主成分生成基礎(chǔ)圖像.然后利用ERS算法對基礎(chǔ)圖像進行超像素分割,得到如下分割結(jié)果:
HSI=S1∪S2∪…SM,Si∩Sj=?,i,j=1,2,…M.
(1)
其中,Si(i=1,2,…,M)是包含ni個像素的超像素.
步驟2:稀疏加權(quán)網(wǎng)絡(luò)的構(gòu)造
以每個超像素Si為節(jié)點vi,用式(2)對節(jié)點進行加權(quán)連接.
(2)
其中,ki是超像素Si的空間鄰居數(shù),d(Si,Sj)通過下面的能量距離[16-17]計算:
(3)
步驟3:超像素合并
假設(shè)所構(gòu)造的稀疏加權(quán)網(wǎng)絡(luò)的權(quán)重矩陣為W=(wi,j)M×M.定義子網(wǎng)絡(luò)Vi的局部模塊度[18]如下:
(4)
在合并后的網(wǎng)絡(luò)中,每一個子網(wǎng)絡(luò)代表了一個新的超像素.
步驟4:降維
利用每一個新的超像素提供的空間信息,以及原始圖像中包含的譜信息,在每個新的超像素上執(zhí)行PCA 或KPCA算法,并降至同樣的維數(shù).
在所提出的基于超像素合并的降維方法中,通過新定義的局部模塊度函數(shù),對超像素快進行局部合并.合并后的超像素在保持超像素同質(zhì)性的同時,依然滿足超像素的其他性質(zhì).為了驗證降維效果,通過SVM分類器對降維后的高光譜數(shù)據(jù)進行分類.
綜上所述,本文提出了SMPCA、SMKPCA兩種基于超像素合并的降維方法.
為了驗證方法的有效性,在Indian Pine,Salinas兩個典型的高光譜數(shù)據(jù)集上進行試驗.程序運行平臺是Matlab 2015b.為避免隨機采樣帶來的分類結(jié)果的影響,本文進行了10組獨立實驗,以10次結(jié)果的平均值來報告最終的分類結(jié)果.為了證明所提出方法的優(yōu)越性,將結(jié)果與PCA[5]、KPCA[6]、IFRF[9]、SPCA[14]以及SKPA[15]5種特征提取方法得到的結(jié)果進行了對比.與大多數(shù)已經(jīng)存在的工作一樣[19],采用總體精度(OA)、平均精度(AA)和kappa系數(shù)3個指標評價算法的性能.
圖1記錄了在每類隨機標記30個樣本,統(tǒng)一降到30維的情況下,分類結(jié)果隨超像素數(shù)目的變化情況.由于PCA、KPCA、IFRF未涉及超像素,故實驗只選取了SPCA、SKPCA兩種降維方法作為對比實驗.可以看出,隨著超像素數(shù)目增多,4種方法的分類精度整體都呈下降趨勢.這是因為隨著超像素數(shù)目的增加,超像素的體積逐漸變小,從而空間信息的作用逐漸被削弱.對于Indian Pines數(shù)據(jù)集,當超像素數(shù)目從100增加到1 000時,SMPCA和SMKPCA方法的分類精度下降幅度分別為8.55%和11.50%.而SPCA、SKPCA分類精度的下降幅度分別為29.35%,29.37%.對于Salinas數(shù)據(jù)集,與Indian Pines類似,SMPCA、SMKPCA的分類精度下降幅度遠小于SPCA、SKPCA的下降幅度.這證明了所提出的基于超像素合并的降維方法可有效減緩分類結(jié)果對分割尺度的依賴性.
圖1 4種降維算法的分類精度隨超像素數(shù)目的變化
在每類隨機標記30個樣本時,圖2顯示了7種降維算法的分類結(jié)果隨降維維數(shù)的變化.從圖2可以看出,所提出的兩種降維方法SMPCA和SMKPCA的降維性能均優(yōu)于其他5種方法,這意味著經(jīng)過超像素合并后,對降維提供了更有效的空間信息,從而增強了降維效果.基于超像素的4種降維方法的降維性能都好于基于譜的PCA和KPCA,且隨著維數(shù)的增加呈現(xiàn)出了比較穩(wěn)定的趨勢,這說明這4種方法可以有效提取到原始數(shù)據(jù)的光譜信息,同時也證明了空間信息在降維過程中的重要作用.但隨著維度的不斷增加,所提出降維方法的結(jié)果沒有呈現(xiàn)出明顯增加的趨勢,說明譜信息出現(xiàn)了冗余現(xiàn)象.
圖2 降維算法的分類精度隨降維維數(shù)的變化
表1報告了7種方法在兩個標準高光譜數(shù)據(jù)集上的分類結(jié)果.5種對比方法中的實驗參數(shù)與原文一致.從表1可以看出,僅僅利用光譜信息而未利用空間信息降維的PCA和KPCA方法沒有獲得理想的分類結(jié)果.由于利用了空間信息和光譜信息,IFRF、SPCA、SKPCA分類精度相對較高,基于超像素技術(shù)的SPCA和SKPCA的分類結(jié)果優(yōu)于基于固定大小窗口的IFRF的結(jié)果,這是由于超像素自適應(yīng)大小和形狀的特征比固定大小窗口能夠提供更有效的空間信息.本文提出的基于超像素合并的兩種算法的結(jié)果在兩個數(shù)據(jù)集上均好于其余5個方法,說明提出的算法通過對超像素的合并,增大了超像素的體積,提供了更多的空間信息,有助于降維性能的提高.
表1 7種方法在兩個高光譜數(shù)據(jù)集上的降維結(jié)果對比
在本文中,針對超像素的降維算法對于分割尺度具有嚴重依賴性的問題,提出了一種基于超像素合并的高光譜圖像譜-空降維方法.該方法通過對超像素進行合并,增大了同質(zhì)區(qū)體積,有效地整合空間信息.使其在降維過程中起到更有效的作用,從而提高了降維的效果.在兩個常用的標準高光譜數(shù)據(jù)集上的實驗結(jié)果表明,該方法有效削弱超像素分割尺度對基于超像素降維方法降維結(jié)果的影響.比較實驗結(jié)果表明所提出的方法均好于其他5種降維方法.然而如何把高光譜圖像降到恰當?shù)木S數(shù),即保持有效譜信息的同時,盡可能出現(xiàn)少的信息冗余,目前仍是一個值得研究的問題.