張國云, 歐陽慧婷, 涂 兵, 楊先暢
(湖南理工學院 信息科學與工程學院, 湖南 岳陽 414006)
異常檢測是高光譜圖像處理和高光譜遙感應(yīng)用領(lǐng)域的重要課題之一, 在軍事安全、環(huán)境污染監(jiān)測、地質(zhì)勘探以及農(nóng)林監(jiān)控等實際應(yīng)用中發(fā)揮了重要的作用[1].異常目標通常具有兩個明顯特征, 即概率低、數(shù)量少[2].利用這兩個特征, 許多經(jīng)典異常檢測算法被提出, 如RX算法[3]、低秩與稀疏分解算法[4]、協(xié)同表示算法[5]和基于機器學習的異常檢測方法等.RX算法通過求解待測像元與背景像元光譜均值之間的馬氏距離得到檢測結(jié)果, 但該算法需假設(shè)背景模型符合高斯分布, 而大部分情況下該條件無法滿足[6].基于背景數(shù)據(jù)具有低秩性而異常數(shù)據(jù)具有稀疏性的假設(shè), 低秩與稀疏分解算法將數(shù)據(jù)矩陣分解為一個低秩矩陣和一個稀疏矩陣.基于低秩與稀疏分解的算法最重要的是建立一個完善的過完備字典, 但是由于異常和背景先驗信息的缺失和孤立噪聲的污染, 當異常覆蓋面積較大時, 異??赡軙患{入到背景字典中.基于機器學習的高光譜異常檢測方法, 不需要評估背景統(tǒng)計量, 避免了背景建模的不準確.Li[7]等首先訓練深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)并用于高光譜異常檢測.基于機器學習的方法通常需要復雜的計算過程和參數(shù)分析, 其中核參數(shù)和懲罰參數(shù)的優(yōu)化直接影響分類結(jié)果的準確性.協(xié)同表示通過背景像元的線性組合來表示中心像元, 將得到的結(jié)果與實際結(jié)果的差作為異常目標的判斷依據(jù), 取得了不錯的探測效果, 在異常檢測中得到廣泛應(yīng)用.
由于高光譜遙感圖像具有復雜的非線性光譜和空間信息, 大部分數(shù)據(jù)都不是線性可分的, 因此許多基于核函數(shù)方法改進的異常檢測算法被提出.核RX算法[8]將原始數(shù)據(jù)通過非線性函數(shù)映射到高維特征空間, 使得原來線性不可分的數(shù)據(jù)變得線性可分, 從而能更好地區(qū)分背景和目標信息.核方法使異常與背景的可分性增強, 同時得到更純凈的背景像素集.例如, 基于核背景純化的異常目標檢測方法[9]能更準確地估計背景信息, 提取純凈背景像素集進行背景協(xié)方差矩陣估計.基于核方法的孤立森林高光譜異常檢測方法[10]將高光譜圖像通過徑向基核函數(shù)映射到高維特征空間后, 利用異常比背景更容易受到內(nèi)核空間中的隔離影響對異常目標進行檢測.純凈的背景像素集對協(xié)同表示檢測器的性能有很大的提高, 故一些其他的純化背景像素集的策略也被提出來改善算法性能.最近鄰正則化子空間局部求和異常值去除異常檢測器[11]在最近鄰正則化子空間中運用異常值去除的策略純化協(xié)同表示方法的背景像素集, 降低背景像素集中含有異常像素對檢測結(jié)果造成的誤差.
本文將高光譜遙感圖像非線性光譜信息用于協(xié)同表示檢測器.首先, 將高光譜遙感數(shù)據(jù)通過核函數(shù)映射到高維特征空間, 增加目標像素與背景像素的可分性.然后, 為改善協(xié)同表示檢測器的背景像素集含有雜質(zhì)的問題, 采用異常值去除策略純化背景像素集, 得到最近鄰正則化子空間內(nèi)鄰域像素集的空間一致的核協(xié)同表示, 核協(xié)同表示近似值可以線性加權(quán)表示被測像素, 返回被測像素與其鄰域之間的相似性度量.在通過上述方法得到異常目標初始檢測圖后, 利用高光譜圖像的空間—光譜信息優(yōu)化初始檢測圖,從而得到更精確的檢測結(jié)果.最后通過在四個真實高光譜數(shù)據(jù)集上的實驗證明所提算法在精度和性能方面有較大提升.
協(xié)同表示的目標是找到背景像素集的線性組合的權(quán)向量, 使協(xié)同表示結(jié)果與中心像元y的距離盡可能小.協(xié)同表示的目標函數(shù)為
權(quán)向量的解為
最后得到協(xié)同表示的近似值與中心像元的歐氏距離的殘差, 作為被測像素的異常得分1r, 并設(shè)置合適的閾值, 將大于該閾值的被測像素認定為異常目標, 低于該閾值的則認定為背景像素.異常得分的數(shù)學表達式為
高光譜遙感圖像具有復雜的光譜空間結(jié)構(gòu), 大部分情況下原始數(shù)據(jù)難以簡單地線性分類識別.核方法的引入可以充分挖掘高光譜圖像波段間的非線性統(tǒng)計特性, 增強不同類數(shù)據(jù)的可分性, 從而獲得高維空間中的線性可分能力[12].將核方法應(yīng)用到協(xié)同表示算法中, 采用高斯核函數(shù)作為投影函數(shù):
將原始數(shù)據(jù)映射到核函數(shù)誘導的特征空間后, 中心像元投影為:y→Φ (y), 背景像素集投影為:Xs→Φ(Xs), Φ是一種非線性或線性核映射.被測像素的核協(xié)同表示目標函數(shù)優(yōu)化為
其中α*為背景像素集在新的特征空間中的權(quán)向量,s為背景像素個數(shù),λ為正則化參數(shù), 背景像素集的權(quán)重對角矩陣Γy的表現(xiàn)形式變?yōu)?/p>
高維特征空間中權(quán)向量α*的求解公式為
核協(xié)同表示的殘差rk求解公式更新為
本文提出空間一致核協(xié)同優(yōu)化的高光譜異常檢測算法(SCKCRD).首先, 利用非線性核函數(shù)將高光譜像元映射到高維特征空間, 增強異常目標與背景像素的可分性.由于異常目標的光譜值通常游離于中心地帶, 可通過設(shè)置合適的閾值去除背景像素集中潛在的異常像素.然后, 用異常值去除方法加強最近鄰正則化子空間內(nèi)背景像素集的空間一致性, 從而優(yōu)化核協(xié)同檢測器的性能.被測像素的估計值將由其鄰域像素的核協(xié)同表示通過線性加權(quán)求和得到.最后利用空間光譜信息優(yōu)化初始檢測結(jié)果得到被測像素最終的異常得分.算法流程如圖1所示.
圖1 異常值去除核協(xié)同表示算法流程
背景像素集中存在異常值會對測試像素的協(xié)同表示近似值造成較大的誤差, 從而對檢測性能帶來負面影響.因此, 提高背景像素集的純凈度是提升協(xié)同表示檢測性能的有效途徑[13].針對協(xié)同表示算法中高光譜異常檢測算法的背景純化問題, 采用離群值去除策略提升算法檢測精度.去除離群像素需要設(shè)置合理的閾值區(qū)間, 將檢測窗口內(nèi)像素強度值不在閾值區(qū)間內(nèi)的像素作為異常值去除, 從而得到更純凈的表征中心像素的背景像素集.假定原始數(shù)據(jù)通過核函數(shù)投影到高維特征空間后服從正態(tài)分布, 閾值區(qū)間可根據(jù)雙窗口內(nèi)像素強度值的均值和標準差來構(gòu)造[14].已有研究表明, 該方法得到的閾值區(qū)間能夠較合理地隔離異常像素.該閾值區(qū)間上限τmax和下限τmin的計算公式為
其中μ和σ是原背景像素集Xs的均值和標準差.強度值高于τmax和低于τmin的像素將被移除出原背景像素集, 從而得到新的純凈的背景像素集Xp.中心像元y在高維特征空間中的離群值去除核協(xié)同表示目標函數(shù)更新為
地物通常表現(xiàn)為光譜和空間分布上的聚類特性, 即空間一致性高的地物屬于同種類型的概率也會更高.像元的空間信息與其光譜值的重構(gòu)有較大關(guān)系, 鄰域像元對中心像元的作用與距離成反比.對于被測像素y, 假設(shè)其最近鄰正則化子空間像素集為A= {a1,a2, …,am},m為子空間內(nèi)像素個數(shù), 像素ai通過離群值去除核協(xié)同表示算法得到的異常得分為ri, 則被測像素y的異常得分為
其中ρi為最近鄰正則化子空間像素ai的權(quán)重, 數(shù)學表達式為
根據(jù)高光譜遙感圖像的特點[15,16], 高光譜遙感影像中的像元與其周圍像元通常反映相同或相似的地物特征.為進一步利用高光譜圖像的空間信息, 采用一種同時利用光譜和空間信息的檢測圖優(yōu)化方法來提高檢測精度.同時考慮鄰域像素xi與中心像素y之間的空間歐氏距離和離群點去除核協(xié)同表示預測值的距離, 定義距離和歐氏距離為
初始檢測圖包含HIS顏色模型的光譜信息, 利用被測像素及其相鄰像素的空間位置關(guān)系, 對初始異常得分重新分配適當?shù)臋?quán)重.在該檢測圖優(yōu)化過程中, 將待測像元的初始異常得分作為其殘差的加權(quán)值和相鄰像元殘差的加權(quán)平均值.對于被測像素y, 該優(yōu)化策略表示為
其中rfinal為被測像元最終異常得分,β為權(quán)重系數(shù),φ為鄰域像素集,ry和ri分別為像素y和像素ai的初始異常得分.
本算法在四個真實數(shù)據(jù)集上進行評估, 分別是San Diego、Airport、Beach和Urban數(shù)據(jù)集.它們是通過機載可見/紅外成像光譜儀(AVIRIS)和反射光學系統(tǒng)成像光譜儀(ROSIS-03)獲得的真實高光譜數(shù)據(jù)集,數(shù)據(jù)集的詳細信息見表1.四個真實數(shù)據(jù)集的偽彩色圖像和異常實際參考圖如圖2所示.
圖2 數(shù)據(jù)集的偽彩色圖及其異常實際參考圖
表1 數(shù)據(jù)集的詳細描述
將本文算法SCKCRD與RX、局部RX(LRX)、協(xié)同表示算法(CRD)、屬性邊緣濾波器算法(AED)[17]、核孤立森林算法(KIFD)、核協(xié)同表示算法(KCRD)和異常值去除的最近鄰正則化子空間局部求和算法(LSUNRSEDORAD)等七種異常目標檢測算法進行實驗比較.在對比實驗中, 所有算法設(shè)置最佳參數(shù)值以盡可能地獲取更高的檢測精度.針對四個實驗數(shù)據(jù)集, 各算法獲得的視覺檢測結(jié)果分別如圖3~6所示, 白色表示異常像素, 黑色表示背景像素.從實驗結(jié)果來看, CRD、AED、KCRD和LSUNRSEDORAD方法能大致識別飛機的位置, 但飛機形狀較模糊, 且存在偽異常像素.在所有方法中, 一些與周圍像素在光譜上有很大差異的背景像素也可能被檢測為異常.AED、KIFD和SCKCRD的檢測效果較好, 但AED算法的異常目標突出能力不如KIFD和SCKCRD算法, 原因可能是通過核函數(shù)的映射有效提高了目標與背景的可分離性, 而SCKCRD比KIFD算法的背景抑制效果更好, 得到較少虛警的檢測結(jié)果.相對來說,SCKCRD算法具有更好的魯棒性.
圖3 不同算法在San_Diego數(shù)據(jù)集上的視覺檢測結(jié)果
圖4 不同算法在Airport數(shù)據(jù)集上的視覺檢測結(jié)果
圖5 不同算法在Beach數(shù)據(jù)集上的視覺檢測結(jié)果
圖6 不同算法在Urban 數(shù)據(jù)集上的視覺檢測結(jié)果
圖7為不同方法在各數(shù)據(jù)集上得到的ROC曲線.曲線下面積(AUC)值越大, 表明檢測方法的優(yōu)越性越強.可以看出, 本文SCKCRD算法在ROC曲線上的表現(xiàn)更好, 比其他方法有更大的曲線下面積, 且ROC曲線上升速度更快, 其檢測精度優(yōu)于其他異常檢測方法.少數(shù)比較算法與SCKCRD算法的ROC曲線有相似的走勢, 但在虛警率較低時, SCKCRD算法有更高的檢測精度.
圖7 不同算法在各數(shù)據(jù)集上的ROC曲線
表2給出了各算法在不同實驗數(shù)據(jù)集上的具體AUC值, 不難看出, 本文方法在異常檢測精度方面比其他方法有更高的AUC值.
表2 不同算法在各數(shù)據(jù)集上的AUC值
為比較各方法對背景和異常的可分離性, 我們用方框圖將SCKCRD方法與其他方法的可分離性結(jié)果進行了對比.如圖8所示, 將每種方法的檢測值歸一化, 紅色框代表異常目標的檢測值分布, 綠色框代表背景像素的檢測值分布, 每個盒子內(nèi)部的橫線是中值位置, 盒子的上下邊緣分別表示極大值和極小值, 反映了像素分布的傾向性和緊湊性, 異常目標與背景的中線位置之間的距離差代表了異常與背景的可分離性.從圖8的結(jié)果來看, AED方法、KIFD方法和SCKCRD方法在四個實驗數(shù)據(jù)集上的背景與異??煞蛛x性都較好, KCRD算法在目標與背景的分離性方面也優(yōu)于傳統(tǒng)CRD算法, 這表明核方法在分離異常目標與背景方面發(fā)揮了重要作用.SCKCRD方法對異常和背景具有較高的識別能力.
圖8 不同算法在各數(shù)據(jù)集上的異常與背景可分離性
本文基于核方法有效提取高光譜圖像非線性光譜和空間特征, 降低傳統(tǒng)協(xié)同表示異常檢測器對純凈背景的高度依賴性, 提出一種空間一致核協(xié)同優(yōu)化的高光譜異常檢測算法.該方法利用核函數(shù)投影方法增大異常與背景像素的可分離性.通過增強最近鄰正則化子空間內(nèi)背景像素的空間一致性, 對被測像素的鄰域像素進行核協(xié)同表示, 然后將優(yōu)化后的核協(xié)同表示近似值通過線性加權(quán)表示中心像素, 并充分利用圖像的空間和光譜信息對檢測器的初始檢測圖進行優(yōu)化后再處理.在實際高光譜數(shù)據(jù)集上的實驗分析表明, 本文所提算法在檢測精度和算法性能方面都具有優(yōu)越性.