韓賓賓,韓 萍,程 爭
(中國民航大學a.電子信息與自動化學院;b.工程技術訓練中心,天津 300300)
極化合成孔徑雷達(PolSAR,polarimetric synthetic aperture radar)是一種搭載在衛(wèi)星、飛機等空間平臺上的對地觀測系統(tǒng),其通過發(fā)射和接收特定頻率(微波波段)和極化方式的電磁波進行成像,具有全天時、全天候、高分辨、穿透強、信息豐富等特點,已經(jīng)在農(nóng)作物長勢監(jiān)測、地質(zhì)勘探、海洋監(jiān)測、軍事偵察等領域獲得了廣泛應用[1]。
地物分類是PolSAR 圖像解譯的重要內(nèi)容之一。文獻[2]利用多分量散射模型(MCSM,multiple-component scattering model)和灰度共生矩陣(GLCM,graylevel co-occurrence matrix)提取特征,用支持向量機(SVM,support vector machine)實現(xiàn)分類。文獻[3]研究了利用不同極化分解進行特征組合實現(xiàn)SVM 分類的問題。以上兩種算法雖然取得了一定的分類效果,但其分類準確率仍不能滿足現(xiàn)實需求。究其原因在于:其都以單個像素為基本分類單元,像素特征受相干斑噪聲影響嚴重,且隨著眾多遙感衛(wèi)星升空和系統(tǒng)分辨率不斷提升,遙感數(shù)據(jù)呈海量增長趨勢,以單個像素為基本單元的圖像解譯方式在計算效率上也面臨巨大挑戰(zhàn)。
在此背景下,以圖像塊為基本單元的面向?qū)ο蠓诸愃惴ㄒ鹣嚓P學者的關注。超像素,即空間鄰近、特征相似的圖像塊,是最為常用的面向?qū)ο蠓诸惖幕締卧?。文獻[4]在PauliRGB 偽彩色圖上進行超像素分割得到待分割對象,然后將Wishart 分類器應用于超像素實現(xiàn)圖像分類,該算法在分類對象生成中只用了部分極化信息,是一種次優(yōu)算法。文獻[5]首先提取了27 維極化特征,然后用拉普拉斯特征映射(LLE,Laplacian Eigenmaps)進行特征降維,再用SVM 分類器進行分類,最后利用超像素在局部區(qū)域內(nèi)進行眾數(shù)投票確定分類結果。文獻[6]與文獻[5]采用相似結構,由主成分分析(PCA,principal component analysis)替換LLE 進行特征降維,在眾數(shù)投票中設定優(yōu)勢閾值,最優(yōu)類別占比小于閾值則以像素為單位進行Wishart 分類,否則將超像素整體標注為優(yōu)勢類別。以上兩種算法的主要分類過程仍以像素為基本單位完成,超像素僅起到局部平滑作用,沒有充分發(fā)揮面向?qū)ο蠓诸愃惴ǖ挠嬎阈蕛?yōu)勢。
針對以上問題,提出一種面向?qū)ο蟮腟VM 分類算法。在分類對象生成階段,算法從計算效率和分割效果出發(fā),采用前期研究成果(文獻[7])生成基本對象單元;在特征提取階段,算法利用轉(zhuǎn)換矩陣將PolSAR 圖像極化協(xié)方差矩陣轉(zhuǎn)化為多個單極化雷達系統(tǒng)的散射截面積參數(shù),這些參數(shù)物理意義明確且均可以用對數(shù)正態(tài)分布加以描述,有利于后續(xù)分類,同時簡單矩陣相乘的特征提取方式保證了特征提取步驟的高效性;在分類階段,考慮到面向?qū)ο蠓诸愒跍p少分類處理單元的同時,也必然減少訓練樣本數(shù)量,算法選擇在小樣本條件下依然具有較好學習性能和泛化性能的SVM 分類器實現(xiàn)分類。
滿足互易性的單站全極化雷達數(shù)據(jù)可以用極化協(xié)方差矩陣C 表示
式中:S 表示雷達散射系數(shù);下標h 表示水平發(fā)射或接收;下標v 表示垂直發(fā)射或接收;上標*表示復數(shù)共軛;〈·〉表示時間或空間的集合平均。
從式(1)可以看出,極化協(xié)方差矩陣C 為共軛對稱矩陣,其全部信息可以由以下9 個“實數(shù)”參數(shù)表示
式中:Re[·]表示復數(shù)實部;Im[·]表示復數(shù)虛部。式(2)中參數(shù)雖然為實數(shù),但其物理意義難以明確。文獻[8]根據(jù)不同坐標系下散射系數(shù)轉(zhuǎn)換關系將式(2)表示為9 個雷達散射截面積參數(shù)(RCS,radar cross section),且這些參數(shù)均服從對數(shù)正態(tài)分布,使其能夠非常方便地服務于后續(xù)分類任務,即
式中
SVM 分類器是機器學習領域一種非常經(jīng)典的分類方法,在小樣本情況下依然具有較好的學習能力和泛化能力。假設數(shù)據(jù)樣本集為{(x1,y1),(x2,y2),…,(xn,yn)},其中xi∈Rd為d 維特征向量,yi∈{1,-1}為樣本類別標號,n 為樣本數(shù)目。SVM 分類器的學習目標是尋找一個最優(yōu)分類超平面的f(w,b)= wTx + b = 0,使其到兩個類別的距離最大化。超平面到兩個類別距離定義為
式中:Ⅰ為類別標號為“1”的樣本集合;Ⅱ為類別標號為“-1”的樣本集合。從式(4)可以看出,SVM 將類別到超平面的距離定義為“所有樣本到超平面的最短距離”。上述分類器設計原理可以等價描述為優(yōu)化以下目標函數(shù)
式中Lhinge(u)=max{0,u},?u∈R。求解式(5)可以得到如下分類表達式
式中αi≥0 為目標優(yōu)化過程中的拉格朗日乘子。
從分類器設計原理可以看出,以上SVM 分類器只能處理線性可分二分類問題,對于非線性可分問題,需要先用映射函數(shù)?(x)將樣本特征映射到高維線性可分空間,再利用特征內(nèi)積實現(xiàn)分類。根據(jù)Mercer 定理[9],可以通過某些核函數(shù)在不顯著增加計算量的情況下實現(xiàn)高維特征空間內(nèi)積運算,從而在一定程度上解決線性不可分問題。常用的核函數(shù)有線性核函數(shù)、多項式核函數(shù)、徑向基核函數(shù),即
式中q,σ2為對應核函數(shù)的參數(shù)。
對于多分類(N≥3)問題,一般采用兩種方式解決:①將SVM 分類器進行擴展使其適用于多分類問題;②將多分類問題拆解為多個二分類問題。針對具體拆分方式又可以分為“一對多”、“一對一”兩種:“一對多”依次將某一類視為單獨一類,其余類視作另一類,如此對于N 類分類問題需要N 個分類器;“一對一”則在兩兩類別之間建立一個分類器,如此需要N(N-1)個分類器。
所提算法流程圖如圖1 所示,首先對圖像進行超像素分割產(chǎn)生待分類對象,然后利用轉(zhuǎn)換矩陣提取待分割對象的雷達散射截面積參數(shù),最后構造訓練集和測試集,利用SVM 分類器完成圖像分類。具體分類步驟細節(jié)描述如下。
圖1 算法流程圖Fig.1 Flowchart of proposed algorithm
1)超像素分割生成待分類對象
對象生成為圖像分類的預處理步驟,應該具有較高的運算效率,同時生成的對象應該具有較好的內(nèi)容一致性,為此采用前期研究成果[7]產(chǎn)生超像素對象,并將超像素內(nèi)的協(xié)方差矩陣平均值作為對象內(nèi)容,以此實現(xiàn)濾波降噪,同時大大降低后續(xù)分類基本單元數(shù)目,提升圖像分類效率。
2)對象特征提取
理想的特征提取應該具有特征意義明確、提取步驟簡單和特征信息完備等特點。上文提取的特征為各坐標系下的雷達散射截面積參數(shù),物理意義非常明確;特征提取可以通過簡單的矩陣乘法完成,具有計算簡單的特點;轉(zhuǎn)換矩陣為可逆矩陣,可以在協(xié)方差矩陣元素和特征集之間相互轉(zhuǎn)換,具有信息完備性。因此,選擇前述矩陣轉(zhuǎn)換方式提取雷達散射截面積特征。同時,考慮到這些特征服從對數(shù)正態(tài)分布,將這些特征進行”對數(shù)”處理。
3)分類器訓練和分類
面向?qū)ο蠓诸惙椒ㄔ跍p少待分類對象的同時也必然減少了可用的訓練樣本數(shù)目,為此選擇SVM 分類器作為主干分類算法進行分類。關于核函數(shù)選擇問題,考慮到雷達散射截面積參數(shù)服從對數(shù)正態(tài)分布,選擇徑向基核函數(shù)。PolSAR 圖像通常包含多種地物,綜合考慮分類效果和計算效率,選擇“一對多”方式進行多分類。
為了驗證所提算法的有效性,用PolSAR 圖像處理領域的公開實測San Francisco 場景數(shù)據(jù)進行實驗。實驗所用數(shù)據(jù)的PauliRGB 圖和對應場景真值圖[10]如圖2 所示,數(shù)據(jù)由機載AIRSAR 系統(tǒng)于1989年采集,成像采用L 波段,圖像大小為900×1 024,場景中主要包括山區(qū)、海洋、植被、平坦城區(qū)和傾斜城區(qū)5 種地物。為保持分辨率,不預先對數(shù)據(jù)進行濾波降噪處理。
為了驗證雷達散射截面積參數(shù)的統(tǒng)計特性,對海洋區(qū)域數(shù)據(jù)(圖2 的紅框區(qū)域)進行采樣,分析其統(tǒng)計特性。數(shù)據(jù)統(tǒng)計結果如圖3 所示,分別為9 個雷達散射截面積參數(shù)的對數(shù)直方圖和對應均值、方差的正態(tài)分布曲線。從圖3 中可以看出,正態(tài)分布曲線很好地擬合了直方圖。
圖2 San Francisco 場景數(shù)據(jù)Fig.2 Data image of San Francisco field
圖3 雷達散射截面積參數(shù)統(tǒng)計分布Fig.3 Statistical distribution of radar cross section
為了便于分析所提算法的分類效果,編程實現(xiàn)了文獻[2]和文獻[3]算法作為對比算法。同時,為了說明所提特征提取和面向?qū)ο蠓诸惒呗缘暮侠硇裕幊虒崿F(xiàn)了僅基于極化分解特征的SVM 分類,包括MCSM 分解特征(記為MCSM)、Cloude 分解和Freeman 分解組合特征(記為C-F,文獻[3]的特征組合之一)和雷達散射截面積參數(shù)特征(記為RCS);基于極化分解特征和GLCM 紋理特征的SVM 分類,分別記為MCSM-GLCM(文獻[2]算法)、C-F-GLCM 和RCS-GLCM,同時包括上述算法的面向?qū)ο蠓诸惒呗?,記為MCSM-Object、C-F-Object、RCS-Object(所提算法)、MCSM-GLCMObject、C-F-GLCM-Object、RCS-GLCM-Object。
上述算法的MCSM、Cloude、Freeman 分解特征由PolSARpro 軟件計算得到。GLCM 紋理特征包括能量、相關性、對比度及和平均[2],特征計算的局部窗口為7 × 7,灰度等級為16,像素對方向為{0°,45°,90°,135°},距離為1。通過交叉驗證方式確定SVM 分類器最優(yōu)分類參數(shù):懲罰項c = 1 000,徑向基核函數(shù)σ=0.01。訓練樣本按固定比例隨機采樣確定,考慮到圖像的像素數(shù)目水平在百萬級,面向像素分類的訓練樣本采樣比例設為0.1%;面向?qū)ο蠓诸惖挠柧殬颖静蓸颖壤O為10%。以上述參數(shù)重復實驗10 次,各算法的最優(yōu)結果如圖4 所示。
圖4 所提算法和對比算法的分類結果Fig.4 Classification results of the proposed and contrast algorithms
從圖4 中可以看出,相對于面向像素分類,面向?qū)ο蠓诸惒呗燥@著提升了分類效果;對于面向像素分類來說,加入紋理特征后的分類效果提升非常明顯,這是由于GLCM 特征為局部區(qū)域特征,受相干斑噪聲影響較小;相對地,紋理特征沒有顯著提升面向?qū)ο蠓诸惖姆诸愋Ч踔翆τ赗CS-Object 來說,紋理特征的加入反而降低了分類效果,如圖4(k)中黃框標識區(qū)域;比較僅基于極化分解特征的MCSM、C-F 和RCS分類效果,RCS 的分類視覺效果更加接近真值圖。
以分類精度作為評價指標對以上算法進行定量評價,評價結果如表1 所示。定量評價結果與視覺評價結果整體一致。相對于面向像素分類,面向?qū)ο蟮姆诸悳蚀_率提升在10%左右,最高達到30.37%;加入紋理特征使面向像素分類的準確率最低提升了7.30%,而使面向?qū)ο蠓诸惖臏蚀_率最高僅提升了3.42%,由此可以看出,紋理特征對于面向?qū)ο蟮姆诸惒呗蕴嵘Ч邢?;對于所提算法,加入紋理特征使分類準確率降低了0.26%;對于僅依賴極化分解特征的MCSM、C-F和RCS 3 種算法,其分類準確率分別約為56.18%、69.65%和75.90%,RCS 特征表現(xiàn)出更加優(yōu)秀的地物區(qū)分能力。相對于文獻[2]和文獻[3],所提算法的分類準確率提升了約10%。
表1 所提算法和對比算法的定量分析結果Tab.1 Quantitative analysis of the proposed and contrast algorithms
從不同地物的分類效果來看,所提算法對山區(qū)、植被達到了最優(yōu)分類性能,對海洋和平坦城區(qū)接近最優(yōu)分類性能;對傾斜城區(qū)分類效果較差,原因是算法對植被和傾斜城區(qū)進行了一定程度的混淆,對比Paui RGB 圖發(fā)現(xiàn),植被和傾斜城區(qū)確實表現(xiàn)出非常相似的極化特征。加入紋理調(diào)整后,對傾斜城區(qū)的分類效果有所改善,相比較RCS 特征提取而言,GLCM 紋理特征提取計算復雜度較高,因此,從分類處理效果提升和計算復雜度出發(fā),在特征提取步驟中沒有加入紋理特征。
針對PolSAR 圖像強噪聲、大場景特點,利用超像素分割、快速特征提取和SVM 分類技術提出一種具有強抗噪聲干擾能力的高效分類算法。實測數(shù)據(jù)的實驗結果表明,所提算法顯著地改善了PolSAR 圖像分類效果。同時,實驗發(fā)現(xiàn)算法對于極化特征相近地物(如植被和傾斜城區(qū))的分類效果還不是非常理想,下一步將針對該問題進行重點研究。