薛夢姣,陳 剛,張 笑,于 靖,段淼然,陳瑞芳
(1.江蘇省地理信息技術(shù)重點實驗室,江蘇 南京 210023; 2.南京大學(xué)地理信息科學(xué)系,江蘇 南京 210023)
?
面向?qū)ο蟮馁Y源三號衛(wèi)星影像分類研究
薛夢姣1,2,陳 剛1,2,張 笑1,2,于 靖1,2,段淼然1,2,陳瑞芳1,2
(1.江蘇省地理信息技術(shù)重點實驗室,江蘇 南京 210023; 2.南京大學(xué)地理信息科學(xué)系,江蘇 南京 210023)
資源三號衛(wèi)星影像數(shù)據(jù)目前廣泛用于地形測繪、資源監(jiān)測、地理國情監(jiān)測等領(lǐng)域。本文主要針對資源三號衛(wèi)星影像數(shù)據(jù),以南京市玄武區(qū)為例,研究了適合國產(chǎn)高分辨率衛(wèi)星影像的分類技術(shù)方法。分別采用面向?qū)ο蟮腒NN分類方法和SVM分類方法對影像進行分類,并對分類結(jié)果的精度進行了分析和評價。研究結(jié)果表明,在對遙感影像采用合適的分割尺度進行分割后,采用基于面向?qū)ο蟮腟VM分類方法得到的結(jié)果,其總體分類精度為90.72%,Kappa系數(shù)為86.64%,遠(yuǎn)高于采用基于面向?qū)ο蟮腒NN分類方法得到的結(jié)果。因此,面向?qū)ο蟮腟VM分類方法更適合于資源三號衛(wèi)星影像的分類。
資源三號; 面向?qū)ο? 分類; SVM; KNN
資源三號衛(wèi)星作為國內(nèi)首顆民用高分辨率光學(xué)傳輸型測繪衛(wèi)星,主要面向測繪1∶50 000地形圖及開展1∶25 000等更大比例尺地形圖的修測與更新工作。影像數(shù)據(jù)采用了立體觀測與資源調(diào)查兩種觀測模式成像,具有定位精度佳、空間分辨率高與影像信息豐富等特點,為我國目前開展的地理國情監(jiān)測工程提供了堅實的數(shù)據(jù)保障,也為探索利用國產(chǎn)高分辨率遙感衛(wèi)星資料開展遙感應(yīng)用研究提供了良好的工作基礎(chǔ)[1-2]。
通過對遙感影像分類而快速獲取地表信息,是遙感影像應(yīng)用的關(guān)鍵步驟。資源三號衛(wèi)星影像作為高分辨率遙感影像,利用傳統(tǒng)的面向像素的遙感影像分類方法,易造成分類精度降低、空間數(shù)據(jù)冗余及資源浪費等問題[3]。M Baatz等根據(jù)高分辨率遙感影像的特點,于2000年提出了一種面向?qū)ο蟮姆诸惙椒?,該方法根?jù)影像的大小、形狀、紋理及地物光譜特質(zhì)等信息,將影像分割為同質(zhì)的對象,并以此為基礎(chǔ)進行影像分類[4]。隨后,眾多國內(nèi)外學(xué)者對面向?qū)ο蟮姆椒ㄟM行了研究。S W Myint等采用面向?qū)ο蠓椒ǎ瑢γ绹鴣喞D侵蔌P凰城中心城區(qū)的QuickBird影像進行了分類,其城市地物分類的總體精度達到90.40%,遠(yuǎn)高于僅依靠光譜信息的傳統(tǒng)方法[5]。蘇偉等結(jié)合QuickBird遙感影像和激光掃描LiDAR數(shù)據(jù),采用多尺度、多變量的影像分割的面向?qū)ο蠓诸惣夹g(shù),對馬來西亞吉隆坡城市中心區(qū)的土地覆蓋進行了分類研究,分類總精度達88.52%[6]。林先成等針對成都地區(qū)的QuickBird影像,采用不同的分割尺度對試驗區(qū)的影像進行分割,比較了分割結(jié)果的優(yōu)劣,確定了最佳分割尺度[7]。
本文以南京市玄武區(qū)的資源三號衛(wèi)星影像數(shù)據(jù)為例,對影像分類過程中的技術(shù)方法展開研究,并對分類結(jié)果進行評價,從而找到一種適合于資源三號衛(wèi)星影像分類的方法。
本文研究區(qū)域位于南京市玄武區(qū)。玄武區(qū)是南京市的中心城區(qū)之一,區(qū)域面積80.97 km2,范圍為北緯32°0′0.89″—32°0′31.16″,東經(jīng)118°4′18.15″—118°6′39.38″。該區(qū)內(nèi)有著名的鐘山風(fēng)景區(qū)和玄武湖風(fēng)景區(qū),植被覆蓋率較高,植被、水體、建筑物等都有明顯分布。
根據(jù)對玄武區(qū)遙感影像的分析及實地考察,本文將玄武區(qū)的土地利用類別劃分為5大類,分別是植被、水體、道路、建筑用地和裸地。
本文采用的試驗數(shù)據(jù)為資源三號測繪衛(wèi)星的正視全色影像和多光譜影像,數(shù)據(jù)采集于2013年11月29日。正視全色影像光譜范圍為0.50~0.80 μm,地面分辨率為2.1 m。多光譜影像有4個波段,分別為藍(lán)(0.45~0.52 μm)、綠(0.52~0.59 μm)、紅(0.63~0.69 μm)和近紅外(0.77~0.89 μm)波段,地面分辨率為5.8 m。影像數(shù)據(jù)為傳感器校正產(chǎn)品,即影像已經(jīng)過輻射校正和傳感器校正處理。
1.影像預(yù)處理
(1) 幾何精糾正
基于南京市的正射影像數(shù)據(jù)對全色和多光譜影像分別進行幾何糾正。一共選取了15個控制點,控制點主要位于道路的交叉點和水系的轉(zhuǎn)折點,且均勻分布于待糾正影像上??刂泣c的均方根誤差為1.20。本文采取二次多項式對影像進行幾何糾正,利用雙線性內(nèi)插法進行影像的重采樣。對于糾正后的影像,本文選取了10個檢查點進行精度評價。檢查點的均方根誤差為1.12,基本滿足試驗要求。
(2) 影像融合
對糾正后的全色和多光譜影像進行融合。目前有多種融合方法,如Gram-Schmidt、主成分變換、小波變換、Brovey變換等,本文選擇Gram-Schmidt方法進行影像融合。該方法具有較高的圖像保真效果,且計算簡單,運算速度較快。重采樣方式為雙線性內(nèi)插。
(3) 影像裁剪
利用南京市玄武區(qū)的行政區(qū)劃矢量邊界數(shù)據(jù)對影像進行裁剪。裁剪后的玄武區(qū)影像如圖1所示。
圖1 南京市玄武區(qū)真彩色合成影像圖
2.影像分割
本文采用ENVIFX模塊進行影像分割。該模塊根據(jù)鄰近的像素的紋理、顏色、亮度等對影像進行分割。不同的分割尺度會產(chǎn)生不同的效果。當(dāng)選擇的分割尺度較大時,生成的同質(zhì)對象面積較大,且數(shù)量較少,但是易導(dǎo)致不同的地物類型錯分為同一個同質(zhì)對象;當(dāng)選擇的分割尺度較小時,生成的同質(zhì)對象面積較小,且與實際地物更接近,但數(shù)量較多。因此,分割尺度的選擇十分關(guān)鍵,將影響影像分類的精度。此外,在完成分割后,可以結(jié)合光譜和空間信息,合并鄰近的同質(zhì)對象,從而控制分割后的同質(zhì)對象的數(shù)量,提高分割的精度。
從玄武區(qū)的遙感影像可以看出,玄武湖及研究區(qū)內(nèi)的其他湖泊,選擇較大的分割尺度就能得到較好的同質(zhì)對象;植被主要集中于紫金山風(fēng)景區(qū)、主城區(qū)的道路兩旁以及小區(qū)的綠地,前者分布較為集中較容易分割,而后者分布分散,且大多和建筑用地混雜在一起,較難分割;建筑用地主要為主城區(qū)的居民地和商業(yè)區(qū),這些獨立的建筑都比較破碎,當(dāng)選擇較大的分割尺度時,容易導(dǎo)致其邊界輪廓模糊,從而和道路混淆;道路分割尺度的設(shè)定主要和道路的等級有關(guān),對于主干道,選擇較大的分割尺度即可,但對于支路,設(shè)置較小的分割尺度可避免與建筑用地的混淆;研究區(qū)內(nèi)的裸地主要為待建設(shè)的工地以及少量植被邊緣的荒地,多成塊出現(xiàn),易于分割。
經(jīng)過多次試驗,對比了多種分割閾值得到的同質(zhì)對象與實際地物的輪廓邊界后,本文將分割尺度設(shè)置為10、合并閾值設(shè)置為90%。在此基礎(chǔ)上,可以得到分割效果較好的同質(zhì)對象。
3.影像分類
面向?qū)ο蟮姆诸惒煌趥鹘y(tǒng)的基于像素的分類方法,它是以原始影像分割后生成的同質(zhì)對象為基礎(chǔ)來進行分類的。本文主要使用兩種分類方法,即面向?qū)ο蟮腒NN分類方法和面向?qū)ο蟮腟VM分類方法來進行影像分類。
(1) 面向?qū)ο蟮腒NN分類
KNN(k-nearest neighbor algorithm)算法最早由T Cover等提出[8],算法的基本思路是:計算待分類樣本x與每一個訓(xùn)練樣本的距離,對距離進行排序,從中選擇距離最近的K個訓(xùn)練樣本作為x的K個最近鄰,并根據(jù)這K個最近鄰判斷樣本x的所屬類別。常用的距離有歐氏距離和馬氏距離等[9]。
KNN算法在計算時只與相鄰的K個訓(xùn)練樣本有關(guān),當(dāng)訓(xùn)練樣本數(shù)量分布不均勻時,易導(dǎo)致訓(xùn)練樣本數(shù)量較少的類別的分類精度降低,從而影響整體的分類精度。此外,KNN算法在分類過程中需要計算待分類樣本與每一個訓(xùn)練樣本的距離,因此運算量較大,且最近鄰的K值不易確定,一般通過比較不同K值時的分類精度以確定合適的K值。
在進行面向?qū)ο蟮腒NN分類時,在訓(xùn)練樣本的特征空間中加入影像的自定義特征函數(shù)NDVI、影像自身的空間特征和紋理特征,并將K值設(shè)置為5。圖2為基于面向?qū)ο蟮腒NN分類得到的結(jié)果。
(2) 面向?qū)ο蟮腟VM分類
支持向量機(support vector machine,SVM)是一種監(jiān)督式學(xué)習(xí)方法,由V Vapnik于1995年首先提出[10],目前主要應(yīng)用于手寫字體識別、文本分類、遙感影像分析等領(lǐng)域。
圖2 基于面向?qū)ο蟮腒NN分類結(jié)果
SVM算法基于結(jié)構(gòu)風(fēng)險最小化理論,在特征空間中建構(gòu)最優(yōu)分割超平面,使得學(xué)習(xí)器得到全局最優(yōu)化。SVM算法是針對線性可分情況進行分析,對于線性不可分的情況,可以使用非線性映射算法,將樣本空間映射到高維的特征空間中,從而將線性不可分問題轉(zhuǎn)化為線性可分的問題[11-12]。
在進行SVM分類時,向訓(xùn)練樣本的特征空間中加入影像的自定義特征函數(shù)NDVI、影像自身的空間特征和紋理特征,并將核函數(shù)設(shè)置為二次多項式。圖3為基于面向?qū)ο蟮腟VM分類得到的結(jié)果。
圖3 基于面向?qū)ο蟮腟VM分類結(jié)果
首先利用ArcGIS軟件,統(tǒng)計了兩種分類方法得到的各類地物的面積。結(jié)果如圖4所示。
從圖中可以看出,基于面向?qū)ο蟮腒NN分類方法得到的道路、裸地、水體和植被的面積均大于基于面向?qū)ο蟮腟VM分類方法得到的面積,而得到的建筑用地的面積明顯小于后者。
本文采用混淆矩陣法對南京市玄武區(qū)的影像分類精度進行評價?;煜仃囉糜诒硎痉譃槟骋活悇e的像元個數(shù)與地面檢驗為該類別的比較,通常行代表參考數(shù)據(jù),列代表由遙感數(shù)據(jù)分類得到的類別數(shù)據(jù)。通過ArcGIS軟件在試驗區(qū)隨機產(chǎn)生了97個樣本點,結(jié)合野外調(diào)查數(shù)據(jù)及南京市的矢量數(shù)據(jù),建立了混淆矩陣。結(jié)果見表1—表2。
圖4 面積統(tǒng)計
表1 基于面向?qū)ο蟮腒NN分類的混淆矩陣
表2 基于面向?qū)ο蟮腟VM分類的混淆矩陣
在混淆矩陣的基礎(chǔ)上,本文采用兩類指標(biāo)來進行精度評價,分別為總體分類精度t和Kappa系數(shù)。設(shè)混合矩陣A為一個n×n的矩陣??傮w分類精度為
(1)
式中,P1為分類后影像中與實際地物相符的像元的個數(shù);P2為總的樣本個數(shù),即
(2)
(3)
Kappa系數(shù)是另外一種計算分類精度的方法。它的計算公式為
(4)
式中,mi+和m+i分別表示矩陣A的第i行和第i列的總和。
表3為對兩種分類方法進行總體分類精度和Kappa系數(shù)計算得到的結(jié)果。
表3 精度評價 (%)
從表中可以看出,基于SVM的分類方法的總體分類精度達到90.72%,Kappa系數(shù)達到86.64%。而基于KNN的分類精度為76.29%,Kappa系數(shù)為65.75%。相比于基于面向?qū)ο蟮腒NN分類方法,基于面向?qū)ο蟮腟VM分類方法得到的結(jié)果的精度更高。
此外,從分類的結(jié)果圖及面積統(tǒng)計圖可以發(fā)現(xiàn):①由于試驗區(qū)的水體較為集中,在高分辨率遙感影像上表現(xiàn)出大片均勻的色調(diào),因此,兩種分類方法對水體提取的準(zhǔn)確率都較高。但是仔細(xì)對比會發(fā)現(xiàn),基于KNN的影像分類得到的水體的面積偏大,對玄武湖進行分類時,有部分水體被誤分為建筑用地。②在對植被進行分類時,植被較為集中的紫金山地區(qū)的分類效果較好;但是主城區(qū)道路兩旁的植被由于本身較為破碎,且受到了陰影的干擾,影響了分類精度。③兩種方法對裸地的分類結(jié)果都較好,玄武區(qū)的裸地主要集中于西北和東南角,多為待建設(shè)的工地。④由于主城區(qū)的建筑都較高,建筑的陰影影響到建筑用地和道路的區(qū)分。對于等級較高的道路,如30~40 m的主干道、20~24 m的次干道,分類精度較高;但是對于寬度較窄的支路、小道,分類精度較低。⑤基于KNN得到的建筑用地的面積明顯低于基于SVM得到的結(jié)果,經(jīng)過對比分析,發(fā)現(xiàn)主城區(qū)有大量的建筑用地被錯分為其他土地利用類型。
本文主要探討了對資源三號衛(wèi)星遙感影像進行分類過程中的技術(shù)方法,并得出以下結(jié)論:
1) 影像分割尺度的選擇決定了影像的分類精度,且分割尺度與影像的實際情況有關(guān)。因此,在對影像進行分割時需要根據(jù)實際情況進行多次試驗,選擇合適的閾值。分割結(jié)束后,還可以針對分割結(jié)果的具體情況,進行一定的對象合并。
2) 本文選擇了兩種不同的方法進行分類,從最終的結(jié)果可以看出,兩種方法對于同類地物大面積分布的區(qū)域得到的結(jié)果都較好,但是對于地物分布較為破碎的區(qū)域,分類結(jié)果的錯誤較多。通過對分類精度進行分析,表明了基于面向?qū)ο蟮腟VM分類方法得到的分類結(jié)果較好,更適合用于資源三號衛(wèi)星影像的分類。
[1] 蔣永華,張過,唐新明,等.資源三號測繪衛(wèi)星三線陣影像高精度幾何檢校[J].測繪學(xué)報, 2014, 42(4): 523-529.
[2] 曹海翊,劉希剛,李少輝,等.“資源三號”衛(wèi)星遙感技術(shù)[J].航天返回與遙感, 2012, 33(3): 7-16.
[3] 丁曉英.eCognition在土地利用項目中的應(yīng)用[J].測繪與空間地理信息,2006,28(6): 116-117.
[4] BAATZ M, SCHAPE A.Multiresolution Segmentation: An Optimization Approach for High Quality Multi-scale Image Segmentation[C]∥Angewandte Geographische Informationsverarbeitung Ⅻ.Heidelberg:[s.n.],2000.
[5] MYINT S W, GOBER P, BRAZEL A, et al.Per-pixel vs.Object-based Classification of Urban Land Cover Extraction Using High Spatial Resolution Imagery[J].Remote Sensing of Environment, 2011, 115(5): 1145-1161.
[6] 蘇偉,李京,陳云浩,等.基于多尺度影像分割的面向?qū)ο蟪鞘型恋馗脖环诸愌芯俊择R來西亞吉隆坡市城市中心區(qū)為例[J].遙感學(xué)報, 2007, 11(4): 521-530.
[7] 林先成,李永樹.成都平原高分辨率遙感影像分割尺度研究[J].國土資源遙感,2010(2):7-11.
[8] COVER T, HART P.Nearest Neighbor Pattern Classification[J].IEEE Transactions on Information Theory, 1967, 13(1): 21-27.
[9] 李蓉,葉世偉,史忠植.SVM-KNN 分類器——一種提高 SVM 分類精度的新方法[J].電子學(xué)報, 2002, 30(5): 745-748.
[10] VAPNIK V.The Nature of Statistical Learning Theory[M].[S.l.]:Springer,1999.
[11] 黃立賢,沈志學(xué).高光譜遙感圖像的監(jiān)督分類[J].地理空間信息, 2011, 9(5): 81-83.
[12] 張學(xué)工.關(guān)于統(tǒng)計學(xué)習(xí)理論與支持向量機[J].自動化學(xué)報, 2000, 26(1): 32-42.
Research on Object-oriented Classification with ZY-3 Satellite Image
XUE Mengjiao,CHEN Gang,ZHANG Xiao,YU Jing,DUAN Miaoran,CHEN Ruifang
薛夢姣,陳剛,張笑,等.面向?qū)ο蟮馁Y源三號衛(wèi)星影像分類研究[J].測繪通報,2015(7):42-45.
10.13474/j.cnki.11-2246.2015.0207
2014-05-21
國家科技支撐計劃(2012BAH28B04-05)
薛夢姣(1990—),女,碩士生,主要研究方向為遙感影像解譯。E-mail:xuemengjiao1101@163.com
P237
:B
:0494-0911(2015)07-0042-04