謝 瑞,程效軍,管海燕
(1.同濟大學 測繪與地理信息學院,上海 200092;2.河南工程學院 土木工程系,河南 鄭州 451191;3.滑鐵盧大學 地理與環(huán)境管理學院,加拿大 滑鐵盧 N2L3G1)
近年來,機載激光掃描(LiDAR)得到了迅速的發(fā)展,作為一種新的空間信息獲取模式,LiDAR在快速數(shù)據(jù)采集、三維建模等方面得到了廣泛的應用,但它難以直接獲得物體表面的語義信息,在數(shù)據(jù)后處理上還有許多問題亟待研究[1],如激光掃描數(shù)據(jù)的分類、地物識別和提取等.與LiDAR數(shù)據(jù)相比,航空遙感影像提供了大量豐富的空間、紋理等語義信息,但獲取的主要是建筑物的頂面信息.各種數(shù)據(jù)源都有其自身的優(yōu)勢和局限性,單純利用一種數(shù)據(jù)源進行分類和地物的識別提取其精度都有所限制,將多源數(shù)據(jù)融合以彌補單一數(shù)據(jù)源的局限性是一個非常重要的研究方向[2],許多學者對其進行了研究[3-6].實踐證明數(shù)據(jù)融合是一種有效可行的地物分類方法[7].
目前的遙感影像分類主要采用面向?qū)ο蠡蚧趩蜗裨姆诸?,基于面向?qū)ο蟮姆椒ㄓ捎谑苡跋穹指畛叨鹊挠绊?,會產(chǎn)生類似“混合像元”的對象出現(xiàn),降低了分類精度;基于單像元的方法從整幅影像入手,逐像元進行數(shù)據(jù)統(tǒng)計,工作量較大.針對這種情況,本文提出了基于面向?qū)ο蠛蛦蜗裨娜诤虾娇者b感影像與LiDAR數(shù)據(jù)的復雜城區(qū)多級自動化分類.
實驗位置.曼海姆,德國西南部,位于萊茵河與和內(nèi)卡河的交匯處,中心區(qū)域街道呈格網(wǎng)狀分布,是曼海姆獨有的城市景觀.測區(qū)為典型城市地區(qū)地貌,地物復雜、豐富,包含大量各式建筑物,比較密集,地形略有起伏,高程大約89.83~159.71m,樹木和草地主要分布在建筑物間的空隙處和道路兩側(cè).
數(shù)據(jù)源.①LiDAR數(shù)據(jù),由TopoSys公司采用基于光纖掃描方式的FalconⅡ傳感器于2004年采集,航高約1 200m,平均點密度和點間距分別為4點·m-2和0.5m,共192 700個點.LiDAR數(shù)據(jù)記錄首末次回波信息和激光脈沖的強度信息(圖1),圖中像素灰度值與高差呈正比,越亮的區(qū)域表示高程值越大.② 真彩色正射影像數(shù)據(jù)的地面分辨率為0.5m·像素-1(圖2).③ 假彩色近紅外正射影像數(shù)據(jù)由近紅外、紅色和綠色3個波段組成,植被表現(xiàn)為紅色調(diào)(圖3圖例所示色調(diào)均為植被),地面分辨率為0.5m·像素-1.
圖1 激光掃描數(shù)據(jù)Fig.1 Laser scanning data
在現(xiàn)實世界里,地物主要分為人工地物與自然地物,人工地物包括建筑物、橋梁、鐵路、道路等;自然地物指樹木、草地、河流等.本文將嘗試利用上述多源數(shù)據(jù)融合,實現(xiàn)建筑物、樹木、草地和道路的自動分類.
本文的地物分類主要是基于以下5種信息進行,如圖4所示.
信息1:濾波.對激光點云的末次回波進行濾波處理,初步判斷為地面點與非地面點.
信息2:差分數(shù)字地面表面模型(DTM).計算LiDAR首末回波高差信息,判斷是否為樹木.
信息3:假彩色近紅外影像紅色分量.分析影像中的植被信息,提取紅色分量.
信息4:直線特征.對真彩色航空影像提取建筑物的直線信息.
信息5:同質(zhì)區(qū)域影像分割.將融合影像分割成同質(zhì)區(qū)域塊,每個區(qū)域塊作為單個對象,進行面向?qū)ο蟮牡匚锓诸?
面向?qū)ο蟮姆诸惙椒軌蜉^好地解決基于像素的高分辨率遙感影像分類結(jié)果中存在的“椒鹽效應”,該方法是基于基元或單元的遙感影像信息提取技術,基于一定的同質(zhì)性標準通過影像分割來獲得基元[8],形成影像對象層,然后采用模型成員函數(shù)分類器來分類.為了提高航空影像分割精度,首先將點云距離影像(圖1a)與真彩色航空影像(圖2)采用比值變換融合(Brovey),該方法能充分保留每個像素的相關光譜特征,然后對融合后的影像進行分割.融合后的影像(圖5a)包含LiDAR數(shù)據(jù)的高程信息,與圖2相比,樹木、建筑物、草地與道路等地表信息輪廓能清晰地區(qū)別出來,其光譜特征、形狀特征表現(xiàn)明顯,由此可以簡化影像分割的難度,提高影像分割的正確性.
圖4 分類信息Fig.4 Flow diagram of species classification procedure
分割尺度決定了分割對象所允許的最大異質(zhì)程度,分割尺度越大,同質(zhì)區(qū)域面積越大,異質(zhì)區(qū)域數(shù)量越少,最適宜的分割尺度是分割后的多邊形能將地物類型的邊界表示清楚,即能用一個或幾個同質(zhì)對象表示出這種地物.一般情況下,在影像分割時光譜是最重要的特征,但是過分依賴光譜信息會產(chǎn)生大量破碎區(qū)域,一定權重的形狀特征可以提高對象提取的精度,它表達的是對象在空間上的一致性,使分割對象達到邊界光滑或者形狀緊湊的目的,在很大程度上能避免過度分割.大多分割算法未能整合光譜信息和空間信息,本文分割尺度參數(shù)選擇光譜異質(zhì)性和形狀異質(zhì)性(式(1)),將融合后影像具有的明顯的空間特征考慮在內(nèi).分割尺度等級定義為0~250,經(jīng)過實驗,本文選擇35,光譜權重0.6,光譜異質(zhì)性由合并前后對象的各波段的灰度標準差決定,形狀權重0.4,形狀異質(zhì)性由合并前后對象的周長和外接矩形邊長決定,圖5b為分割結(jié)果.
式中:wc表示光譜權重;hc表示光譜異質(zhì)性;ws表示形狀權重;hs表示形狀異質(zhì)性.
圖5 融合及分割結(jié)果Fig.5 Merge-image and segmentation result
比較圖5,基本上達到了最適宜分割尺度,樹木被獨立分割,建筑物和道路這兩類地物被分割成少數(shù)幾個對象,分割邊緣明確;只有中心區(qū)域的圓形地物被分割破碎(從圖2和圖3可以明顯看出這一地物類型),主要是因為融合后其光譜信息與道路光譜信息相近;道路上的車輛與道路大部分被劃分到同一圖斑,只有少數(shù)單獨存在,其原因在于分割尺度的設置,如果設置小的尺度則會分離開,但勢必造成其他地物類型過多的瑣碎圖斑,給后續(xù)分類處理帶來不便.圖6是采用同樣的參數(shù)對圖2的分割結(jié)果,融合LiDAR數(shù)據(jù)的航空影像在分割時,確實能改善分割效果.
圖6 航空影像分割結(jié)果Fig.6 Segmentation of true-color ortho-image
從激光腳點數(shù)據(jù)點云中提取數(shù)字高程模型,需要將其中的地物數(shù)據(jù)點去掉,就是所謂的激光掃描數(shù)據(jù)的濾波[9].就濾波的實質(zhì)意義來講,濾波也是一種分類,濾波后能區(qū)分地面點和非地面點.
本文實驗區(qū)域為建筑物密度較大的城區(qū),采用基于高程差閾值的自適應TIN(不規(guī)則三角網(wǎng))模型濾波算法,首先去除噪音點,然后用少量種子點建立稀疏的TIN,最后根據(jù)高差閾值參數(shù)通過迭代對TIN不斷加密.具體步驟如下:
(1)去除極低局外點.在濾波前需要對LiDAR預處理,去除極低局外點,避免構建錯誤的DEM.在復雜城區(qū),地鐵站的入口、窨井以及口徑較小的深坑等,其高程值明顯低于其他地面點,這類極低局外點對初始地面種子點的選取會產(chǎn)生很大的影響,極低局外點附近的地形會發(fā)生沉降,如圖7虛線所示區(qū)域.
極低局外點的去除采用近鄰域的方法,近鄰域的搜索采用將激光點云數(shù)據(jù)分塊的方法并構建3維KD樹(K維搜索樹,其構建過程采用文獻[10]的方法,對空間點云按坐標軸方向進行3次分割),計算塊內(nèi)點高程的平均值,對平均值以下的點,給定搜索半徑R(大于地面分辨率的2倍以上),統(tǒng)計該點在半徑R內(nèi)的點個數(shù),如果點個數(shù)小于給定閾值,則認為該點是極低局外點.極低局外點一般只有少數(shù)幾個.
(2)根據(jù)給定格網(wǎng)大小分別在x,y方向劃分規(guī)則格網(wǎng),從每個格網(wǎng)中選取高程最低的激光點(圖7中地表上的虛點)作為初始地面種子點加入到不規(guī)則三角網(wǎng)(TIN)中,構成初始DEM.
初始DEM的質(zhì)量與格網(wǎng)有關,格網(wǎng)過大或過小,地物點的尺寸都不能被正確估計.在城區(qū)較大尺寸的獨立地物點一般是建筑物,如果格網(wǎng)小于激光點云中建筑物的大小,則會將建筑物的地物點作為地面點加入到初始TIN中,因此格網(wǎng)應該大于激光點云數(shù)據(jù)中最大建筑尺寸,然而最大建筑物的尺寸往往無法正確估計.針對這種情況,為了降低最大建筑物尺寸對種子點選取的影響,對所選出來的種子點及其鄰域3×3的窗口擬合參數(shù)平面(城區(qū)地形是連續(xù)且平緩的,并在較小范圍內(nèi)可以近似地認為地面為平面),根據(jù)區(qū)域的地形坡度閾值(本文選擇小于5°)作為約束條件將殘差大的點從種子點中去除.
(3)遍歷TIN,計算投影到三角形中每個激光點至三角形的距離d,如果小于給定的高差閾值(本文選擇0.8~1.2m)則認為該點是地面點,直至將TIN中所有的三角形遍歷后,將獲得的地面點重新加入TIN.重復迭代,直至滿足給定的迭代最大次數(shù)或者迭代搜索獲取的地面點小于給定的最少地面點.圖8為激光點云末次回波的濾波結(jié)果,白色表示地物點,黑色表示地面點.
LiDAR數(shù)據(jù)包含首末兩次回波信息,根據(jù)信息2得到激光點云首末回波高程差(圖9),像素灰度值與高差值呈正比,越亮的點表示高程差越大.利用綠色植被對近紅外的強烈反射使得在影像上呈紅色這一特性(圖3圖例所示色調(diào)),根據(jù)信息3提取假彩色影像中的植被信息(圖10).
目前具有3個信息源:2.3節(jié)濾波后產(chǎn)生的地面點與地物點信息SF、首末次回波的高差信息SD、假彩色影像中提取的紅色信息SR.考察影像分割后每個對象內(nèi)所含的SF,SD和SR,如果該對象滿足劃分為某一類的準則,則將對象區(qū)域內(nèi)所有像素劃分為此類中.將SF,SD和SR量化,分別為F1,F(xiàn)2與F3.
F1=T/P,表示區(qū)域內(nèi)地面點所占百分比;F2=D/P,表示高差大于設定閾值點所占百分比;F3=R/P,表示內(nèi)含有植被的紅色信息所占百分比.其中P為區(qū)域內(nèi)的像素總個數(shù),T為區(qū)域內(nèi)地面點個數(shù),D為高差大于設定閾值的個數(shù),R為區(qū)域內(nèi)含有植被的紅色信息像素個數(shù).
通過訓練樣本獲取具體分類規(guī)則(表1),比如就樹木而言,激光點能夠產(chǎn)生多次回波,局部高程信息變化較大;在假彩色影像上呈現(xiàn)紅色,在分割對象內(nèi)所含的該色調(diào)信息量也應該相當多.
表1 多源特征分類規(guī)則Tab.1 Classification on multi-sources feature of rules
根據(jù)表1的分類規(guī)則,可以得出一個初始分類結(jié)果,但分割對象內(nèi)存在一個同質(zhì)圖斑包含多種地物類型的情況存在(與分割尺度有關),類似于混合像元的現(xiàn)象,如中心區(qū)域圓環(huán)內(nèi)的植被,按上述規(guī)則會造成誤分類.針對這種情況,將植被信息、高差信息與分類結(jié)果進行疊加(假設提取的植被信息、高程差信息均正確),再對植被信息逐像元判斷,將分類錯誤的植被像元重新定義,且利用高差信息區(qū)分草地和樹木(草地高差定義小于1m,樹木高差大于等于1m).
與道路分割在同一圖斑的車輛,在滿足表1提出的分類規(guī)則時被定義為道路,不滿足條件的由于車輛是非地面點,會被定義為建筑物.另外,分割過程中還存在單獨的車輛圖斑,而道路上的車輛和建筑物高差信息不會發(fā)生變化,此類對象在這一步也被誤分為建筑物,需要進一步處理.
圖11為分類結(jié)果,其中白色為粗糙分類的建筑物,即包含錯誤分類在內(nèi).
通常情況下,建筑物具有規(guī)則形狀,包含很多直線信息,可以通過提取直線,統(tǒng)計分割對象內(nèi)含有直線段的數(shù)量進一步分類建筑物.當線段數(shù)量大于等于2時,如果分類結(jié)果不是建筑物,則將其定義為建筑物.直線段提取采用Canny算子對真彩色航空影像處理,Canny算子采用高、低兩個閾值,并對提取結(jié)果進行“非極大抑制”和形態(tài)學連接操作,它提取的建筑物直線信息外圍輪廓線比較完整,見圖12.在這個過程中設置簡單的長度閾值(本文定義小于2 m),去除小的斷裂線.最終分類結(jié)果如圖13所示.
為了準確地評價分類精度(或誤差),本文將融合分類結(jié)果、單個影像分類結(jié)果與人工分類結(jié)果進行比較,圖14是單影像數(shù)據(jù)分類結(jié)果(本文采用假彩色影像監(jiān)督分類),圖15是人工分類結(jié)果并將此作為參考信息,建立3種分類結(jié)果的統(tǒng)計信息(表2)和融合分類與人工分類的混淆矩陣(表3).
從表2可以看出,單影像分類中建筑物與道路分類存在較大的誤差,道路上的車輛、中心環(huán)形區(qū)域的邊界都被歸類為建筑物,使得其數(shù)量大量增加,而道路數(shù)量減少,另外道路兩側(cè)行樹的遮擋也是造成道路數(shù)量減少的原因之一.從圖13可以明顯看出,單影像分類存在過多的分類錯誤,而在融合分類中這一錯誤分類現(xiàn)象得到明顯改善(圖13),比如建筑物分類數(shù)量得到控制.但樹木與道路數(shù)量存在一定誤差.
從表3可知,樹木的制圖精度較低,為75.75%,這主要是由于有較多的像元被漏分為道路.草地的用戶精度最低,為71.20%,有較多的道路像元被錯誤地歸為這一類;道路的精度為82.58%,有較多的樹木像元被錯誤地歸為這一類.樹木、草地和道路三者之間易發(fā)生混淆;樹木與草地均屬于植被,而植被信息主要來源于假彩色近紅外影像中植被的光譜特性和LiDAR點云首末次回波的高程差,由于植被光譜的差異使得有些植被在假彩色近紅外影像上不能用全局閾值提取出來而造成植被的漏分,而本文在定義這兩個類別時是以該結(jié)果完全正確為前提的.建筑物的分類結(jié)果即使利用直線段數(shù)量進行糾正,但是由于城區(qū)的復雜,仍然會存在錯誤,如道路上靜止不動的大型巴士,它的高差信息不會改變,在頂部面積、高度、直線段數(shù)量等方面與建筑物有些類似,又由于融合影像后,光譜信息有所改變,所以單從幾何表現(xiàn)上是不能將其與建筑物分開的,如果能引入語義特征,則分類精度將會進一步提高.另外,由于實驗區(qū)域為城區(qū),地面狀況較為復雜,人工分類的精度也會影響對分類結(jié)果的分析.
制圖精度為分類正確的像素個數(shù)與實際像素個數(shù)的比值;用戶精度為分類正確的像素個數(shù)與分類像素個數(shù)的比值;分類精度為全部分類正確的像素個數(shù)與實際全部像素個數(shù)的比值.整體上看,建筑物的制圖精度和用戶精度分別為92.53%和95.79%,對用戶而言是比較可靠的,說明LiDAR數(shù)據(jù)提供的高程信息在參與建筑物信息提取時是非常有效的.整個區(qū)域的分類精度為89.62%.
表2 3種方法分類結(jié)果統(tǒng)計表Tab.2 statistics of different classification results像素
表3 分類混淆矩陣表Tab.3 Confusion matrix of classification像素
本文綜合利用LiDAR數(shù)據(jù)提供的高程信息、真彩色正射影像與假彩色近紅外正射影像提供的豐富的光譜及紋理信息,將點云數(shù)據(jù)與航空影像融合,利用影像的光譜特征和空間特征對其進行分割,采用基于面向?qū)ο笈c單像元分類相結(jié)合的方法,進行了建筑物、樹木、草地和道路4類地物的提取.首先在給定的分類決策條件下,確認每個同質(zhì)分割對象的類別歸屬,并將分類結(jié)果與植被紅色分量、高程差疊加,實現(xiàn)基于像元的樹木和草地在上述分類中錯誤類別的更改,實現(xiàn)多源數(shù)據(jù)的二級分類;然后利用建筑物具有規(guī)則形狀的特點,在分類結(jié)果中加入直線信息,進一步改善分類結(jié)果,實現(xiàn)了多源數(shù)據(jù)的第三級精化分類.該方法能夠有效區(qū)分建筑物、樹木、草地和道路4類地物.
實驗僅實現(xiàn)了4種地物的提取,在具有復雜景觀的城市區(qū)域可能需要更詳細的地物類別.本文地物分類的基礎是單尺度的影像分割,如果在分割過程中針對不同的地物類型,采用不同尺度的分割參數(shù),即多尺度分割,盡量避免混合圖斑對象的出現(xiàn),分類結(jié)果將會有所改善.另外,建筑物直線段特征是基于航空影像提取的,而基于LiDAR數(shù)據(jù)的建筑物直線段提取對分類結(jié)果的影響程度有多大有待進一步研究.
LiDAR技術是近年來迅速發(fā)展起來的新技術,遙感影像的空間分辨率也越來越高,它們的應用也越來越多,現(xiàn)在利用這些數(shù)據(jù)進行單一地物提取的方法越來越多,越來越成熟,如何在地物分類時集成這些方法,集成多源數(shù)據(jù),提取更多的分類信息,自動分離出更多類別的地物,且使分類結(jié)果具有更高的精度等問題將在此基礎上進行下一步研究.
[1] 吳杭彬.融合航空影像的機載激光掃描數(shù)據(jù)分類與特征提?。跠].上海:同濟大學測繪與地理信息學院,2010.
WU Hangbin.Classification and feature extraction of airborne LiDAR data fused with aerial image[D].Shanghai:College of Surveying and Geo-Informatics of Tongji University,2010.
[2] Dowman I.Integration of LiDAR and IFSAR for mapping[J].International Archives of Photogrammetry,Remote Sensing and Spatial Information Sciences,2004,35(Part B2):90.
[3] Sohn G,Dowman I.Data fusion of high-resolution satellite imagery and LiDAR data for automatic building extraction[J].ISPRS Journal of Photogrammetry &Remote Sensing,2007,62:43.
[4] CHEN Yunhao,SU Wei,LI Jing,et al.Hierarchical object oriented classification using very high resolution imagery and LiDAR data over urban areas[J].Advances in Space Research,2009,43:1101.
[5] CHEN Lei,ZHAO Shuhe,HAN Wenquan,et al.Building detection in an urban area using LiDAR data and QuickBird imagery[J].International Journal of Remote Sensing,2012,33(16):5135.
[6] Guo L,Chehata N,Mallet C,et al.Relevance of airborne lidar and multispectral image data for urban scene classification using Random Forests[J].ISPRS Journal of Photogrammetry and Remote Sensing,2011,66:56.
[7] Puttonen E,Suomalainen J,Hakala T,et al.Tree species classification from fused active hyperspectral reflectance and LIDAR measurements[J].Forest Ecology and Management,2010,260:1843.
[8] 蘇偉,李京,陳云浩,等.基于多尺度影像分割的面向?qū)ο蟪鞘型恋馗脖环诸愌芯浚跩].遙感學報,2007,11(4):521.
SU Wei,LI jing,CHEN Yunhao,et al.Object-oriented urban land-cover classification of multi-scale image segmentation method[J].Journal of Remote Sensing,2007,11(4):521.[9] 張小紅.機載激光雷達測量技術理論與方法[M].武漢:武漢大學出版社,2007.
ZHANG Xiaohong.Theory and methods of airborne LiDAR measurement technology[M].Wuhan:Wuhan University Press,2007.
[10] 施貴剛.地面三維激光掃描數(shù)據(jù)處理技術及作業(yè)方法的研究[D].上海:同濟大學測繪與地理信息學院,2009.
SHI Guigang.Research on terrestrial 3D laser scanning data processing technology and operation method[D].Shanghai:College of Surveying and Geo-Informatics of Tongji University,2009.