趙春暉, 李思聰
(哈爾濱工程大學(xué) 信息與通信工程學(xué)院, 黑龍江 哈爾濱 150001)
基于多特征融合的SVM高分辨率遙感影像建筑物提取方法
趙春暉, 李思聰
(哈爾濱工程大學(xué) 信息與通信工程學(xué)院, 黑龍江 哈爾濱 150001)
通過有效地利用多源遙感數(shù)據(jù),基于灰度共生矩陣和雙邊濾波等方法提取建筑物的低層特征,并通過SVM初分類得到建筑物的高層語義特征,將低層特征與高層特征進(jìn)行有效地融合成為新的特征用于建筑物提取.實驗結(jié)果表明,進(jìn)行多特征融合后的建筑物提取的完整率和正確率都得到了提高.
高分辨率遙感影像; 建筑物提取; SVM; DSM; 語義特征
隨著航天技術(shù)及遙感技術(shù)的迅速發(fā)展,遙感影像的分辨率與準(zhǔn)確度得到了極大的提高,且遙感信息日趨多源化、豐富化.建筑物是城市或城郊地面的重要特征,精確有效地提取建筑物區(qū)域在城市規(guī)劃、災(zāi)害預(yù)報、資源勘探、地理信息系統(tǒng)庫更新、數(shù)字化城市以及軍事偵察等領(lǐng)域有著重大的意義[1].
高分辨率遙感影像細(xì)節(jié)豐富,地物信息復(fù)雜,相對而言,提取有效信息的難度更大.
目前的建筑物提取根據(jù)使用的數(shù)據(jù)源不同主要可分為以下三類:①通過高分辨率遙感影像提取建筑物,主要利用建筑物的各種形狀,邊緣及陰影等特征并結(jié)合不同的分割算法,進(jìn)行建筑物區(qū)域的提取.若達(dá)到建筑物的精確提取,算法大多較為復(fù)雜[2].②通過機載激光雷達(dá)(LiDAR)數(shù)據(jù)等高程數(shù)據(jù)來提取建筑物,目前大多是使用數(shù)字表面模型(DSM)等灰度影像數(shù)據(jù)結(jié)合邊緣檢測和閾值判斷等來提取建筑物,這種方法對于高度較高的建筑物提取較精確,對于低矮的建筑物以及與樹木混雜的建筑物提取效果不理想[3].③通過高分辨率遙感影像及LiDAR等高程數(shù)據(jù)結(jié)合的建筑物提取方法,由于結(jié)合了高分辨率遙感影像豐富的光譜和空間信息以及高程數(shù)據(jù)對于建筑物提取的優(yōu)勢,提取精度較高,是目前建筑物提取的主要研究方向[4].
本文在第③類方法的基礎(chǔ)上,針對高分辨率遙感影像建筑物的特點,結(jié)合DSM數(shù)據(jù),使用支持向量機(SVM)進(jìn)行分類,并融入了影像的紋理特征,空間鄰域特征,光譜特征以及高層語義特征,在算法上進(jìn)行了改進(jìn).
支持向量機(SVM)是Vapnik[5]等人提出的一種基于結(jié)構(gòu)化風(fēng)險最小化的統(tǒng)計學(xué)習(xí)方法.其主要思想是通過對訓(xùn)練樣本的計算,尋找一個可以使兩類樣本被分開且間隔最大的最優(yōu)的分類超平面,同時所得的期望風(fēng)險最小.SVM通過引入核函數(shù),將低維線性不可分問題轉(zhuǎn)化到高維特征空間使其變得線性可分.常用的核函數(shù)有線性核函數(shù)、多項式函數(shù)、高斯徑向基函數(shù)和Sigmoid函數(shù)等[6].
SVM的二元分類可看作求解如下優(yōu)化問題:
式中:w為權(quán)值向量;b為偏置;xi為訓(xùn)練樣本;C為給定的參量;ξi為樣本xi對應(yīng)的松弛變量.解上述目標(biāo)函數(shù)可得最優(yōu)分類超平面(圖1).
圖1 SVM最優(yōu)分類超平面
Fig.1 The optimal margin hyper-plane of SVM
引入核函數(shù)的SVM判決函數(shù)為:
式中:k(xi,x)為選擇的核函數(shù);α為拉格朗日乘子.
高分辨率遙感影像中,由于空間分辨率的提高,同類地物內(nèi)部的光譜差異有時會變得很大,紋理信息,邊緣信息也都會更加復(fù)雜.本論文結(jié)合DSM高程數(shù)據(jù),將“高度”這一建筑物明顯的特征加入到復(fù)雜的光譜特征中,并對融合后的影像進(jìn)行空域濾波和紋理特征提取,加入鄰域空間信息和紋理特征.然后利用支持向量機(SVM)進(jìn)行影像分類,得到初始的SVM分類結(jié)果,并將其進(jìn)行空域濾波后的結(jié)果作為一維新的語義特征加入之前提取的特征向量中,進(jìn)行第二次SVM分類,得到最終的建筑物提取結(jié)果.
2.1特征提取
建筑物的特征包括其顏色特征、紋理特征、空間關(guān)系特征等.單一的顏色(光譜)特征不能表達(dá)其空間分布的信息.而圖像的紋理特征描述了圖像區(qū)域所對應(yīng)景物的表面性質(zhì),反映了圖像像素灰度值的空間分布信息.空域濾波將孤立的像元與其周邊像元相結(jié)合,使得單一像元具有了鄰域像元的信息,將其作為遙感影像的光譜----空間結(jié)合特征.
首先需要對DSM數(shù)據(jù)進(jìn)行預(yù)處理,去除地形因素(DTM)的影響,得到歸一化的nDSM數(shù)據(jù).之后通過對高分遙感影像與DSM數(shù)據(jù)進(jìn)行像素級的數(shù)據(jù)融合,便于后續(xù)進(jìn)行特征提取[7].
接下來分別對融合后的遙感影像數(shù)據(jù)提取顏色(光譜)特征,紋理特征及鄰域空間特征,并將其組合作為訓(xùn)練樣本的特征屬性.
其中融合后的數(shù)據(jù)可看作具有4個波段的高分辨率遙感影像,可分別記作(IR, R, G, h),并將歸一化處理后的該四個波段的值看作數(shù)據(jù)的光譜特征FC.
(1) 基于灰度共生矩陣的紋理特征提取.紋理是遙感影像的一種重要的空間特征,反映了物體的深度和表面信息,表達(dá)了物體表面顏色和灰度的某種變化,由該像元與其周圍像元的分布情況決定,是光譜特征的一個重要補充[8].基于統(tǒng)計方法的灰度共生矩陣(gray level co-occurrence matrix, GLCM)紋理提取方法,通過研究像元與像元之間的空間分布特性來描述紋理,簡單、易于實現(xiàn)且具有較好的適應(yīng)性.本文采用GLCM方法提取遙感影像的紋理特征.
灰度共生矩陣定義為在θ方向上,間隔距離為d的一對像素,其灰度值分別為i和j的概率記為P(i,j;d,θ).設(shè)一幅M×N大小的二維圖像f(x,y)的灰度量化為Ng級.則灰度共生矩陣P(i,j;d,θ)可表示為:
式中:#(z)為集合z中元素的個數(shù);θ為方向參數(shù),通常選取0°,45°,90°和135°這4個方向.在可通過灰度共生矩陣計算得到的共14個特征中,只有角二階矩、熵、對比度、和相關(guān)性這4個特征之間不相關(guān),且對紋理有具有較好的表達(dá).于是選取這4個特征作為提取的紋理特征:
① 角二階矩(Angular Second Moment, ASM).
角二階矩反映了影像灰度分布的均勻和紋理的粗細(xì)程度,影像紋理較細(xì)致、灰度分布較均勻時ASM值較大.
② 熵(Entropy)
熵表征影像紋理的隨機性,紋理越復(fù)雜則熵越大.
③ 對比度(Contrast)
對比度反映圖像的清晰度和紋理溝紋的深淺,對比度越大說明影像中紋理溝紋越明顯.
④ 相關(guān)性(Correlation)
相關(guān)性反映某灰度值在特定方向上的延伸,表征的是紋理的走向.
本文選擇距離參數(shù)d=1,方向參數(shù)θ為0°、45°、90°和135°四個方向所得到的灰度共生矩陣,并將分別計算得到的4個特征的均值作為紋理特征FT,即:
(2) 基于雙邊濾波的空間鄰域特征提取.由于像元特征的單一性,無法有效地提取建筑物等,空域濾波主要是應(yīng)用濾波模板對每個像元的鄰域進(jìn)行卷積處理來實現(xiàn)的.但一般的空域濾波例如均值濾波和高斯濾波,在引入鄰域空間信息的同時也會導(dǎo)致影像不同程度的模糊,影響邊緣特征的表達(dá).本文根據(jù)建筑物邊線特征明顯的特點采用具有良好邊緣保持特性的雙邊濾波來進(jìn)行空間鄰域特征的提取.
雙邊濾波器是以高斯濾波器為基礎(chǔ)的保邊去噪濾波器,經(jīng)過雙邊濾波器濾波輸出的像素值g(i,j)可以表示為
式中:f(k,l)為濾波前濾波窗口內(nèi)鄰域點的像素值;w(i,j,k,l)為加權(quán)系數(shù),可以看作由兩個高斯核函數(shù)(空間高斯核d(i,j,k,l)與亮度高斯核r(i,j,k,l))相乘來得到[9]:
w(i,j,k,l)=d(i,j,k,l)·r(i,j,k,l).
其中空間核表示為
亮度核表示為
可以發(fā)現(xiàn),由于亮度核r(i,j,k,l)的影響,在像素亮度值差異大的地方(邊緣),其權(quán)重值會變小,濾波效果相應(yīng)降低,達(dá)到邊緣保持的高斯濾波效果.
本文對數(shù)據(jù)的每個波段分別進(jìn)行雙邊濾波處理,參數(shù)選擇σd=20,σr=1.5,將濾波后的結(jié)果作為影像的空間鄰域特征FS.
2.2融入高層語義特征的SVM建筑物提取
對于識別圖像中的建筑物,人類是通過對圖像中的信息進(jìn)行抽象概括,得到高層的語義特征來進(jìn)行判斷的[10].高層的語義特征可以看作低層特征的組合,從低層到高層越來越抽象,也就越來越能表達(dá)語義的描述,對于建筑物提取來說,最高層的語義就可以認(rèn)為是能進(jìn)行“是建筑物”或“不是建筑物”這樣最后判斷的特征.從這個層面來看,經(jīng)過低層特征(光譜特征,紋理特征,空間鄰域特征)組合,并由SVM分類判別出的結(jié)果(是否是建筑物),便可看作對于建筑物判別最抽象的一維高層語義特征[11].從整個圖像的宏觀角度來看,由于SVM[5]直接的判決結(jié)果中,每個像素的判決相對孤立,整體散亂并存在誤判,所以將其進(jìn)行濾波后的結(jié)果作為能比較有效識別建筑物的高層語義特征.將該特征加入之前的特征集合中,與其他的低層特征融合作為新的建筑物特征再次進(jìn)行SVM建筑物分類.實驗結(jié)果表明,融合高層語義特征后能有效提高建筑物提取的正確率.
整個提取算法流程如圖2所示.
圖2 算法流程圖Fig.2 Flow chart of the algorithm
具體步驟如下:
Step 1 將提取的光譜特征FC、紋理特征FT以及空間鄰域特征FS進(jìn)行特征融合得到特征向量集合F1:
Step 2 根據(jù)目視解譯隨機選取訓(xùn)練樣本點.
Step 3 通過SVM對所選的訓(xùn)練樣本進(jìn)行訓(xùn)練.
Step 4 通過訓(xùn)練得到的分類器對測試樣本進(jìn)行判別,得到初次SVM判決結(jié)果.
Step 5 對初次SVM的判決結(jié)果進(jìn)行均值濾波,將濾波后的結(jié)果作為高層語義特征FN,加入到原有的特征向量集合中得到新的特征向量集合:
Step 6 再次進(jìn)行SVM分類判決,得到最終建物判決的結(jié)果.
本文實驗數(shù)據(jù)選取來自國際攝影測量與遙感學(xué)會(ISPRS)的“城市分類與3D重建測試項目”中德國的Vaihingen地區(qū)數(shù)據(jù)集.其中高分辨率遙感影像包含“近紅外、紅、綠”三個波段,空間分辨率為8 cm.相匹配的DSM數(shù)據(jù)的空間分辨率為9 cm.
分別從德國的Vaihingen地區(qū)數(shù)據(jù)集中的區(qū)域1和區(qū)域3中選取了1 000×1 000大小的高分辨率遙感影像以及與之匹配的DSM數(shù)據(jù)進(jìn)行實驗.其中區(qū)域1是Vaihingen地區(qū)的城市中心區(qū)域,建筑物密集且形狀較為復(fù)雜;區(qū)域3主要是居民區(qū),建筑物分布較均勻,間隔較小.圖3展示了區(qū)域1和區(qū)域3的偽真彩圖和DSM深度影像.
圖3 德國Vaihingen地區(qū)高分辨率遙感影像Fig.3 High-resolution remote sensing image of Vaihingen, German(a)—區(qū)域1偽真彩圖; (b)—區(qū)域3偽真彩圖; (c)—區(qū)域1DSM數(shù)據(jù); (d)—區(qū)域3DSM數(shù)據(jù).
實驗中隨機選取建筑物和非建筑物訓(xùn)練樣本各500個,其余點作為測試樣本,SVM訓(xùn)練核函數(shù)為徑向基函數(shù),通過10折交叉驗證選取的懲罰因子C和核函數(shù)參數(shù)σ分別為
所有實驗的仿真環(huán)境為MATLAB2014a,實驗平臺是處理器為Intel(R) Core(TM) i5-2450M CPU @ 2.50 GHz,主頻為2.50 GHz,RAM為8 GB,系統(tǒng)類型為64位操作系統(tǒng).
圖4和圖5分別列出了區(qū)域1和區(qū)域3的建筑物實驗結(jié)果圖.其中圖4a和圖5a分別是兩幅實驗圖像在未融入DSM數(shù)據(jù)時,僅通過高分遙感影像進(jìn)行特征提取后用SVM判別得到的建筑物提取結(jié)果;圖4b和圖5b是融入DSM數(shù)據(jù)后的SVM判別結(jié)果;圖4c和圖5c是在融入DSM數(shù)據(jù)的基礎(chǔ)上,結(jié)合了高層語義特征的SVM判別結(jié)果.圖4d和圖5d是用于評價分類正確率的標(biāo)準(zhǔn)建筑物提取圖.
圖4 區(qū)域1建筑物提取實驗結(jié)果Fig.4 Extracted results of buildings in area 1(a)—未融入DSM數(shù)據(jù); (b)—融入DSM數(shù)據(jù); (c)—加入高層語義特征; (d)—標(biāo)準(zhǔn)圖.
從圖4和圖5中可以看出,在未融入DSM數(shù)據(jù)時,建筑物提取效果較差,很多建筑物都存在提取不完整的情況,孤立誤判的雜亂點也較多;在融入DSM數(shù)據(jù)后,明顯地提升了建筑物的提取結(jié)果,可以看出比較完整的建筑物整體,但仍有一些孤立散亂的誤判點使得整個提取效果顯得不夠清晰;而在加入高層語義特征之后,可以看出整體的建筑物提取正確率進(jìn)一步提高,建筑物的整體輪廓也更加清晰.
圖5 區(qū)域3建筑物提取實驗結(jié)果Fig.5 Extracted results of buildings in area 3(a)—未融入DSM數(shù)據(jù); (b)—融入DSM數(shù)據(jù); (c)—加入高層語義特征; (d)—標(biāo)準(zhǔn)圖.
為了定量評價本文所提出的算法,采用建筑物提取完整率以及建筑物提取正確率[12]兩個指標(biāo)來綜合評價建筑物提取效果.對于每一個像素點是否是建筑物的判決結(jié)果有4種情況,分別對像素點進(jìn)行統(tǒng)計,記:
TP(True Positive):建筑物被判斷為建筑物的像素點個數(shù);
FP(False Positive):非建筑物被判斷為建筑物的像素點個數(shù);
TN(True Negative):非建筑物被判斷為非建筑物的像素點個數(shù);
FN(False Negative):非建筑物被判斷為建筑物的像素點個數(shù).
建筑物的提取完整率定義為
建筑物提取正確率定義為
表1和表2分別展示了區(qū)域1和區(qū)域3的建筑物提取完整率和正確率.
表1 區(qū)域1建筑物提取完整率和正確率
從表1和表2可以看出,融入DSM數(shù)據(jù)后明顯提升了區(qū)域1的建筑物提取完整率從82.79%到91.28%,加入高層語義特征后,雖然沒有明顯提高建筑物提取的完整率,但建筑物提取的正確率得到提升,建筑物提取的整體效果得到改善,這也與圖5所示的實驗結(jié)果相符,表明加入高層語義特征可以有效提高建筑物的提取效果.對于區(qū)域3,由于該區(qū)域建筑物分布更為規(guī)則和均勻,種類也比較單一,在融合DSM后已經(jīng)達(dá)到了較好的建筑物提取效果,加入高層語義特征使其提取效果得到了進(jìn)一步提高.
表2 區(qū)域3建筑物提取完整率和正確率
本文提出的基于多特征融合的SVM高分遙感影像建筑物提取算法,有效地融合了像元的光譜、紋理、空間鄰域等低層特征和SVM判決得到的高層語義特征,實現(xiàn)了對高分辨率遙感影像建筑物的有效提取.通過實驗驗證,本文提出的方法從視覺效果和結(jié)果的數(shù)據(jù)評價上都取得了明顯的提升,但仍存在一些問題與不足,后續(xù)考慮通過形態(tài)學(xué)濾波等操作進(jìn)一步改善提取結(jié)果.
[ 1 ] BOLTER R,LEBERL F. Detection and reconstruction of buildings from multiple view interferometric SAR data[C]∥IEEE 2000 International Geoscience and Remote Sensing Symposium, 2000(2):749-751.
[ 2 ] EKHTARI N,ZOEJ M J V,SAHEBI M R,et al. Automatic building extraction from LiDAR digital elevation models and Worldview imagery[J]. Journal of Applied Remote Sensing, 2009,3(1):2701-2712.
[ 3 ] SOHN G,DOWMAN I. Data fusion of high-resolution satellite imagery and LiDAR data for automatic building extraction[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2007,62(1):43-63.
[ 4 ] KABOLIZADE M,EBADI H,AHMADI S. An improved snake model for automatic extraction of buildings from urban aerial images and LiDAR data[J]. Computers Environment & Urban Systems, 2010,34(5):435-441.
[ 5 ] VAPNIK V,LEVIN E,CUN Y L. Measuring the VC-dimension of a learning machine[M]. Cambridge, MA: The MIT Press, 1994:851-876.
[ 6 ] 張學(xué)工. 關(guān)于統(tǒng)計學(xué)習(xí)理論與支持向量機[J]. 自動化學(xué)報, 2000,26(1):32-42. (ZHANG X G. Introduction to statistical learning theory and support vector machines[J]. Acta Automatica Sinica, 2000,26(1):32-42.)
[ 7 ] LAFARGE F,DESCOMBES X,ZERUBIA J,et al. Automatic building extraction from DEMs using an object approach and application to the 3D-city modeling[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2008,63(3):365-381.
[ 8 ] 劉麗,匡綱要. 圖像紋理特征提取方法綜述[J]. 中國圖象圖形學(xué)報, 2009,14(4):622-635. (LIU L,KUANG G Y. Overview of image textural feature extraction methods[J]. Journal of Image and Graphics, 2009,14(4):622-635.)
[ 9 ] TOMASI C,MANDUCHI R. Bilateral filtering for gray and color images[C]∥International Conference on Computer Vision. IEEE, 1998:839.
[10] 羅世操. 基于深度學(xué)習(xí)的圖像語義提取與圖像檢索技術(shù)研究[D]. 上海:東華大學(xué), 2016. (LUO S C. Image semantics extraction and retrieval based on deep learning[D]. Shanghai: Donghua University, 2016.)
[11] 徐侃,楊文,陳麗君,等.利用主題模型的遙感圖像場景分類[J]. 武漢大學(xué)學(xué)報:信息科學(xué)版, 2011,5:540-543. (XU K,YANG W,CHEN L J,et al. Satellite image scene categorization based on topic models[J]. Geomatics and Information Science of Wuhan University, 2011,5:540-543.)
[12] TURKER M,KOC-SAN D. Building extraction from high-resolution optical spaceborne images using the integration of support vector machine(SVM) classification, hough transformation and perceptual grouping[J]. International Journal of Applied Earth Observation & Geoinformation, 2015,34(5):58-69.
BuildingExtractionofHighResolutionRemoteSensingImageBasedonMultipleFeaturesFusionSVM
ZhaoChunhui,LiSicong
(College of Information and Communication Engineering, Harbin Engineering University, Harbin 150001, China)
Gray level co-occurrence matrix and bilateral filtering method was used to extract the low-level features and then SVM classifier was applied to get the high level semantic feature. The low-level features and high level semantic feature were merged together, and fed to SVM classifier to further extract buildings. Experimental results show that the completeness and correctness of building extraction of the proposed algorithm are improved obviously.
high resolution remote sensing image; building extraction; SVM; DSM; semantic feature
TP 751.1
: A
【責(zé)任編輯:李艷】
2017-04-24
國家自然科學(xué)基金資助項目(61405041,61571145); 黑龍江省自然科學(xué)基金重點項目(ZD201216); 哈爾濱市優(yōu)秀學(xué)科帶頭人基金資助項目(RC2013XK009003).
趙春暉(1965-),男,黑龍江湯原人,哈爾濱工程大學(xué)教授,博士生導(dǎo)師.
2095-5456(2017)04-0311-06