董保根,秦志遠(yuǎn),陳 靜,徐驗(yàn)兵
1.信息工程大學(xué) 測繪學(xué)院,鄭州 450052
2.信息工程大學(xué) 校務(wù)部,鄭州 450000
3.中國人民解放軍75719部隊(duì)
無需閾值支持的機(jī)載LiDAR點(diǎn)云數(shù)據(jù)濾波方法
董保根1,秦志遠(yuǎn)1,陳 靜2,徐驗(yàn)兵3
1.信息工程大學(xué) 測繪學(xué)院,鄭州 450052
2.信息工程大學(xué) 校務(wù)部,鄭州 450000
3.中國人民解放軍75719部隊(duì)
LiDAR(Light Detection And Ranging)可以說是過去十年主流地形測繪中最重要的技術(shù)。這種技術(shù)最大的優(yōu)勢在于它提供了一種直接獲取3D數(shù)據(jù)的方法,而且它的精度很高,這主要體現(xiàn)在毫米級(jí)和厘米級(jí)的激光測距精度和受到POS支持的精確傳感器平臺(tái)定位系統(tǒng)。機(jī)載LiDAR數(shù)據(jù)處理的首要任務(wù)是分離地面點(diǎn)與非地面點(diǎn),從原始的DSM中提取DΤM以及nDSM,進(jìn)一步的處理包括生成DEM等測繪產(chǎn)品以及數(shù)據(jù)分類。目前,有關(guān)LiDAR數(shù)據(jù)濾波的發(fā)展正逐漸成熟,各種濾波算法也層出不窮。從原理上來看,現(xiàn)有的濾波算法大致可分為四類[1]:(1)基于形態(tài)學(xué)的方法;(2)基于表面的方法;(3)漸近加密的方法;(4)基于分割的方法。每種方法都有各自的優(yōu)缺點(diǎn),但是幾乎所有這些算法的共同特點(diǎn)是需要輸入?yún)?shù)或者閾值,盡管所需的參數(shù)或者閾值的數(shù)量不同。比如Zhang等[2]提出的漸近形態(tài)學(xué)濾波器需要輸入窗口尺寸、坡度和高差等5個(gè)閾值;Axelsson P[3]提出的基于ΤIN的方法需要輸入建筑物大小、三角形所在平面傾角、點(diǎn)到三角形的垂距等至少4個(gè)閾值;此外,平面濾波、曲面濾波等方法也需要輸入窗口尺寸和高差兩個(gè)閾值。盡管文獻(xiàn)[4]提出的形態(tài)學(xué)重建濾波僅需要輸入一個(gè)高差閾值,但是離不開閾值的支持也是不爭的事實(shí)。近幾年,基于統(tǒng)計(jì)學(xué)的機(jī)載LiDAR點(diǎn)云濾波算法正作為一種面向?qū)ο蟮姆椒ㄑ杆侔l(fā)展起來,這種類型的方法不需要事先知道地面點(diǎn)與地物點(diǎn)的任何先驗(yàn)知識(shí),屬于典型的非監(jiān)督分類方法。Bartels等[5]首先在LiDAR數(shù)據(jù)濾波中應(yīng)用了統(tǒng)計(jì)學(xué)的原理完成地面點(diǎn)與地物點(diǎn)的分類,隨后,Bartels等[6]對(duì)該算法進(jìn)行了改進(jìn),提高了算法的適應(yīng)性。本文引入統(tǒng)計(jì)學(xué)中偏度和峰度的概念,在不需要閾值以及各種參數(shù)和權(quán)因子的情況下,通過實(shí)驗(yàn)實(shí)現(xiàn)了一種無需閾值支持的基于偏度平衡的機(jī)載LiDAR點(diǎn)云數(shù)據(jù)濾波。
圖1 不對(duì)稱分布及正態(tài)分布
在統(tǒng)計(jì)學(xué)中,偏度(Skewness)也稱偏度系數(shù),它是表征某變量的概率密度分布曲線對(duì)稱性的統(tǒng)計(jì)量,從樣本的概率密度函數(shù)曲線直觀看來就是其尾部的相對(duì)長度。而峰度(Kurtosis)也可以稱之為峰度系數(shù),是表征某變量概率密度分布曲線陡緩程度的統(tǒng)計(jì)量,直觀上來看,它反應(yīng)了概率密度函數(shù)曲線尾部的厚度。通常偏度和峰度分別由sk和ku來表示。假設(shè)某一隨機(jī)變量X的三階矩和四階矩同時(shí)存在,則它們的計(jì)算公式為:
其中N表示樣本總數(shù),xi為任一樣本點(diǎn),σ和μa分別表示樣本的標(biāo)準(zhǔn)方差和算術(shù)均值,它們由公式(3)和(4)來定義:
偏度和峰度均為無量綱的量,若sk>0,則稱該分布為正偏態(tài)或者右偏態(tài);若sk<0,則稱該分布為負(fù)偏態(tài)或者左偏態(tài),|sk|越大,表示其偏離程度越大;相似地,若ku>0,則該分布比較陡峭,若ku<0,則該分布比較平坦。偏度和峰度均是相對(duì)于正態(tài)分布來比較的,正態(tài)分布的偏度和峰度均為0。圖1表示的是偏度和正態(tài)分布的示意圖。
2.1 算法原理及流程
數(shù)理統(tǒng)計(jì)中的中心極限定理表述為:在一定條件下隨機(jī)變量之和的極限分布為正態(tài)分布。具體到本文中,需要做如下兩種假設(shè):(1)自然狀態(tài)下量測的LiDAR點(diǎn)云數(shù)據(jù)中,不規(guī)則分布的地面點(diǎn)的概率密度分布服從正態(tài)分布;(2)進(jìn)一步的假設(shè)為非地面點(diǎn)(也就是地物點(diǎn))干擾了這種分布,使得LiDAR點(diǎn)云數(shù)據(jù)的整體分布呈現(xiàn)出偏態(tài)分布,并且這種偏態(tài)分布往往是一種正偏態(tài)。為了使這種分布達(dá)到平衡狀態(tài),需要從LiDAR點(diǎn)云數(shù)據(jù)樣本中去除干擾地面點(diǎn)分布的非地面點(diǎn),從而“校正”數(shù)據(jù)的整體概率密度分布,這種“校正”過程會(huì)持續(xù)進(jìn)行,直至偏度等于0為止,此時(shí)地面點(diǎn)的分布即接近于正態(tài)分布。該算法的本質(zhì)是以平衡LiDAR點(diǎn)云數(shù)據(jù)的概率密度分布為基礎(chǔ)的,這是該算法之所以稱為偏度平衡的由來。
在利用偏度平衡進(jìn)行濾波的過程中,不需要進(jìn)行任何參數(shù)、閾值或者權(quán)因子設(shè)置,算法完全是在沒有先驗(yàn)知識(shí)的情況下自動(dòng)進(jìn)行的,這是該算法的最大優(yōu)勢所在。此外,分布的統(tǒng)計(jì)量與點(diǎn)的相對(duì)位置是獨(dú)立的,因此算法本身與原始DSM的數(shù)據(jù)組織方式無關(guān),無論是規(guī)則格網(wǎng)還是原始不規(guī)則離散分布的LiDAR點(diǎn)云數(shù)據(jù)均可適用該算法,而且也不受原始LiDAR數(shù)據(jù)的點(diǎn)云密度和分辨率的影響,這也是該算法區(qū)別其他算法的一個(gè)顯著特征?;谄绕胶鉃V波算法的具體描述如下:首先計(jì)算原始LiDAR點(diǎn)云數(shù)據(jù)的偏度sk,如果sk>0,則點(diǎn)云分布呈正偏態(tài),此時(shí)點(diǎn)云中的高程最高點(diǎn)將作為非地面點(diǎn)被刪除;然后繼續(xù)計(jì)算剩余點(diǎn)云數(shù)據(jù)的偏度值,若仍大于0,則再次將數(shù)據(jù)中的最高點(diǎn)作為非地面點(diǎn)去除,直至點(diǎn)云數(shù)據(jù)的偏度值為0,而此時(shí)剩余的點(diǎn)將會(huì)是地面點(diǎn),而去除的點(diǎn)則是非地面點(diǎn)。該算法需要迭代進(jìn)行。圖2為算法流程圖。
圖2 偏度平衡算法流程圖
2.2 最少LiDAR地面點(diǎn)要求
在對(duì)LiDAR點(diǎn)云數(shù)據(jù)中地面點(diǎn)與非地面點(diǎn)進(jìn)行分離的過程中,基于偏度平衡的濾波算法可以看做是一種全局分類器,因此,除了對(duì)數(shù)據(jù)的格式、分辨率等因素沒有限制外,該算法對(duì)LiDAR數(shù)據(jù)的最大數(shù)據(jù)量也沒有限制,如果不考慮算法運(yùn)行效率的情況下。但是由于該算法的前提假設(shè)是地面點(diǎn)應(yīng)該服從正態(tài)分布,那么在給定的LiDAR數(shù)據(jù)中,地面點(diǎn)是否服從正態(tài)分布就是濾波算法能否成功的終極標(biāo)準(zhǔn)。這里需要考慮的因素即為所需的LiDAR點(diǎn)云數(shù)據(jù)中最少的地面點(diǎn)數(shù)量,如果不能滿足這一條件,則濾波算法的前提假設(shè)不能成立。Bartels在文獻(xiàn)[6]中指出所需的最少地面點(diǎn)數(shù)與Bartlett等[7]提出的最小樣本尺寸原理是相似的,其表達(dá)式為:
3.1 實(shí)驗(yàn)過程
本文的實(shí)驗(yàn)數(shù)據(jù)來自Leica ALS50-II以及ALS60分別獲取的沙市和敦煌地區(qū)LiDAR點(diǎn)云數(shù)據(jù),數(shù)據(jù)屬性說明如表1所示。由于篇幅有限,本文采取截圖顯示。三組實(shí)驗(yàn)數(shù)據(jù)的地物類型基本上包含了所有城市特征,分別為:建筑物、高植被、低矮植被、道路、橋梁、水域,甚至還存在汽車、道路附屬物等地物類型。本次研究以LiDAR Pro為開發(fā)平臺(tái),VS2010為開發(fā)環(huán)境。實(shí)驗(yàn)過程中不區(qū)分首末次回波及其他回波,所有數(shù)據(jù)層同時(shí)參與濾波。圖3~5分別表示三組原始數(shù)據(jù)及濾波結(jié)果,其中圖3(b)、圖4(b)、圖5(b)中的白色點(diǎn)表示非地面點(diǎn),棕色點(diǎn)表示地面點(diǎn)(高程尺度表以m為單位)。圖6表示分別對(duì)三組數(shù)據(jù)濾波結(jié)果中的地面點(diǎn)構(gòu)建ΤIN生成的DΤM,顯示在三維模式下。
表1 數(shù)據(jù)屬性
為了驗(yàn)證算法開始時(shí)的兩個(gè)假設(shè),分別給出了三組數(shù)據(jù)濾波前后的高程頻率分布直方圖(如圖7~9所示),從圖中可以看出,濾波后的地面點(diǎn)均呈現(xiàn)近似正態(tài)分布。其中圖8(b)、圖9(b)為多峰正態(tài)分布。
3.2 實(shí)驗(yàn)分析
圖3(a)原始數(shù)據(jù)1
圖3(b)對(duì)應(yīng)的濾波結(jié)果
圖4(a)原始數(shù)據(jù)2
圖4(b)對(duì)應(yīng)的濾波結(jié)果
從圖3(b)圖6(a)、圖4(b)圖6(b)、圖5(b)圖6(c)的視非地面點(diǎn)進(jìn)行分離,由DSM生成的DΤM也符合期望值。圖3(a)主要由密集的建筑物、各種不同高度的植被以及道路組成,其中建筑物是整個(gè)數(shù)據(jù)的主要成分。由于本文提出的算法是一種基于全局的算法,所以即使是大型的建筑物,也可以順利地將其分離,而傳統(tǒng)的基于局部的方法需要對(duì)這些大型地物進(jìn)行特殊處理才能濾除,比如基于形態(tài)學(xué)以及ΤIN的濾波算法需要設(shè)置建筑物尺寸閾值才能將其完全剔除。圖4(a)的特征主要表現(xiàn)為數(shù)據(jù)中存在大量不同高度、形狀以及類型的植被,同時(shí)伴隨著少量建筑物。從圖6(b)中可以看出,建筑物和大部分高植被均濾除,但
圖5(a)原始數(shù)據(jù)3
圖5(b)對(duì)應(yīng)的濾波結(jié)果
圖6 對(duì)圖3~5濾波后的地面點(diǎn)構(gòu)建ΤIN生成的三組DΤMs
覺角度來看,基于偏度平衡的方法可以很好地將地面與是道路兩旁的某些低矮植被似乎沒有完全去除掉,形成了一條呈線狀的突起地形。導(dǎo)致出現(xiàn)這種情況的原因可能有兩種,其一是該區(qū)域道路兩旁的低矮植被確實(shí)位于人造實(shí)體的上方,其二是濾波算法的性能還有待提高,如果是第二種情況,說明基于偏度平衡的算法對(duì)于高度特別低的地物缺乏濾除能力。圖5(a)是三組數(shù)據(jù)中地物類型最為復(fù)雜的,幾乎包含了城市區(qū)域所有的地物類型,除了建筑物、植被、道路以及水域外,由于點(diǎn)云密度較高,甚至可以識(shí)別出汽車和橋梁上的附屬物,并且由于水體上有漂浮物或者水質(zhì)原因,導(dǎo)致水面上還有部分激光點(diǎn)。從濾波的效果來看,基本上達(dá)到了預(yù)期目的,包括一些細(xì)微特征(比如橋梁上的路燈等)在內(nèi)的地物點(diǎn)均可成功濾除,但是由于地物的復(fù)雜性,從整體上來看這組數(shù)據(jù)的濾波效果不如前兩組數(shù)據(jù),這一點(diǎn)也可以從生成的三維模式下的DΤM(圖6(c))看出,DΤM的表面略顯粗糙,原因是產(chǎn)生了較大的II類誤差。值得一提的是,Sithole等[8]將地物類型分為兩類:一類是獨(dú)立型地物(detached objects),比如建筑物、植被等。另一類是附屬型地物(attached objects),比如橋梁、斜坡以及位于某一坡度上的建筑物等。對(duì)于圖5(a)中的橋梁,本文將其認(rèn)為是道路的一種特殊形式,在濾波過程中將其作為地面點(diǎn)保留。而文獻(xiàn)[6]將其作為地物點(diǎn)與地面點(diǎn)進(jìn)行了分離,這取決于對(duì)不同地物的認(rèn)識(shí)。
圖7(a)原始數(shù)據(jù)1的高程頻率分布直方圖(最大值:33 570,高程上區(qū)間:30.860 000,高程下區(qū)間:-3.150 000)
圖8(a)原始數(shù)據(jù)2的高程頻率分布直方圖(最大值:5 121,高程上區(qū)間:60.980 000,高程下區(qū)間:3.830 000)
圖8(b)濾波后地面點(diǎn)的高程頻率分布直方圖(雙峰分布)(最大值:418,高程上區(qū)間:5.470 000,高程下區(qū)間:3.830 000)
由于缺乏參考數(shù)據(jù)的支持,本文采用人工濾波的方法對(duì)基于偏度平衡的濾波精度作出了評(píng)價(jià)(如表2所示)。從客觀數(shù)據(jù)上來看,除第三組數(shù)據(jù)的II類誤差較大以外,其他兩組數(shù)據(jù)均達(dá)到了較高的濾波精度。
圖9(a)原始數(shù)據(jù)3的高程頻率分布直方圖(最大值:65 664,高程上區(qū)間:1 190.300 000,高程下區(qū)間:1 124.300 000)
圖9(b)濾波后地面點(diǎn)的高程頻率分布直方圖(多峰分布)(最大值:19 309,高程上區(qū)間:1 135.660 000,高程下區(qū)間:1 124.300 000)
表2 精度評(píng)價(jià) (%)
基于偏度平衡的機(jī)載LiDAR點(diǎn)云數(shù)據(jù)濾波具有區(qū)別于其他算法的許多鮮明特點(diǎn),它是一種具有代表性的以非監(jiān)督分類為思想的濾波方法。其主要特點(diǎn)表現(xiàn)在如下幾個(gè)方面:(1)它是一種基于全局的分類器;(2)無需人工干預(yù);(3)相對(duì)于LiDAR點(diǎn)云數(shù)據(jù)的格式和分辨率是獨(dú)立的;(4)算法簡單,方法比較直觀。單從本次研究的實(shí)驗(yàn)結(jié)果來看,該濾波算法在城市區(qū)域或者地形起伏不大的地區(qū)分類精度較高,從主觀和客觀兩方面來看,均達(dá)到了一定的要求。但其也并非理想化的濾波器,目前還沒有一種能夠達(dá)到近乎完美效果的濾波器能夠適應(yīng)所有地形,這也是國內(nèi)外學(xué)者一致認(rèn)同的結(jié)論。為此,針對(duì)基于偏度平衡的算法,提出以下兩點(diǎn)展望:
(1)偏度和峰度均可以描述點(diǎn)云數(shù)據(jù)特征,本文只使用了偏度特征完成濾波算法。進(jìn)一步的工作可以考慮如何利用峰度來描述LiDAR點(diǎn)云中地面點(diǎn)與地物點(diǎn)之間的關(guān)系,或者聯(lián)合利用峰度和偏度特征實(shí)現(xiàn)精度更高、適應(yīng)性更強(qiáng)的點(diǎn)云分類。
(2)基于偏度平衡的算法對(duì)城市地區(qū)濾波有著較高的精度和適應(yīng)性,但是在地形起伏較大的地區(qū),比如山區(qū),該算法往往會(huì)產(chǎn)生“過分割”的現(xiàn)象(文獻(xiàn)[6]也持相同的觀點(diǎn)),濾波精度較低。如何進(jìn)一步改進(jìn)算法,使該模型具有較強(qiáng)的泛化能力是基于統(tǒng)計(jì)學(xué)分類的主要目標(biāo)。
[1]Shan Jie,Τoth C K.Τopographic laser ranging and scanning:principles and processing[M].[S.l.]:CRC Press,2008:312-322.
[2]Zhang K,Chen S C,Whitman D,et al.A progressive morphological filter for removing nonground measurement from Li-DAR data[J].IEEE Τransactions on Geoscience and Remote Sensing,2003,41(4):872-882.
[3]Axelsson P.DEM generation from laser scanner data using adaptive ΤIN models[J].International Archives of Photogrammetry,Remote Sensing and Spatial Information Science,1999,33:110-117.
[4]沈晶,劉紀(jì)平,林祥國.用形態(tài)學(xué)重建方法進(jìn)行機(jī)載LiDAR數(shù)據(jù)濾波[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2011,36(2):167-175.
[5]Bartels M,Wei H,Mason D C.DΤM generation from LIDAR data using skewness balancing[C]//Proceedings of the 18th International Conference on Pattern Recognition,2006:566-569.
[6]Bartels M,Wei H.Τhreshold-free object and ground point separation in LIDAR data[J].Pattern Recognition Letters,2010,31:1089-1099.
[7]Bartlett J E,Kotrlik J W,Higgins C C.Organizational research:determining appropriate sample size in survey research[J].Inform Τechnol Learn Perform,2001,19(1).
[8]Sithole G.Segmentation and classification of airborne Laser scanner[D].Delft University of Τechnology,2005.
DONG Baogen1,QIN Zhiyuan1,CHEN Jing2,XU Yanbing3
1.Institute of Surveying and Mapping,Information Engineering University,Zhengzhou 450052,China
2.School Affairs Department,Information Engineering University,Zhengzhou 450000,China
3.Unit 75719 of PLA,China
Generally,filtering for point clouds is considered as a primary step for airborne LiDAR data post-processing.However, it is still under development.By reviewing and summarizing the existing filtering algorithms,the concepts of skewness and kurtosis in statistics are introduced to the framework,and a novel unsupervised classification algorithm to differentiate ground and non-ground points based on skewness balancing is presented.Digital Τerrain Model(DΤM)is effectively extracted from Digital Surface Model(DSM)generated from LiDAR data by exploiting the statistical moments principle.As an alternative to traditional approaches,the ultimate advantages of this algorithm are parameter-and threshold-freedom and independence from LiDAR data format and resolution.Experiment results show that the algorithm is highly practicable and adaptive,and can meet the required precision properly.
airborne Light Detection And Ranging(LiDAR);filtering;skewness;threshold;unsupervised classification
點(diǎn)云數(shù)據(jù)濾波仍舊是現(xiàn)階段機(jī)載LiDAR數(shù)據(jù)后處理的首要步驟,但其發(fā)展尚未完全成熟。在回顧和總結(jié)已有濾波算法的基礎(chǔ)上,將統(tǒng)計(jì)學(xué)中偏度與峰度的概念引入到算法中,提出了一種新的基于偏度平衡的地面點(diǎn)與非地面點(diǎn)非監(jiān)督分類方法,利用統(tǒng)計(jì)矩原理從LiDAR點(diǎn)云數(shù)據(jù)生成的DSM中有效地提取DΤM。該方法區(qū)別傳統(tǒng)算法的最大的優(yōu)勢在于無需參數(shù)或者閾值支持,并且相對(duì)于LiDAR點(diǎn)云數(shù)據(jù)的格式和分辨率是獨(dú)立的。實(shí)驗(yàn)結(jié)果證明,該方法切實(shí)可行,具有較強(qiáng)的適應(yīng)性,并且能夠較好地滿足精度要求。
機(jī)載光探測與測量(LiDAR);濾波;偏度;閾值;非監(jiān)督分類
A
P237;ΤP751.1
10.3778/j.issn.1002-8331.1203-0237
DONG Baogen,QIN Zhiyuan,CHEN Jing,et al.Threshold-free method for airborne LiDAR point clouds data filtering. Computer Engineering and Applications,2013,49(15):219-223.
江西省數(shù)字國土重點(diǎn)實(shí)驗(yàn)室開放研究基金資助項(xiàng)目(No.DLLJ201111,No.DLLJ201112)。
董保根(1977—),男,博士研究生,工程師,主要從事遙感圖像處理與LiDAR數(shù)據(jù)處理的研究;秦志遠(yuǎn),博士,教授;陳靜,工程師;徐驗(yàn)兵,工程師。E-mail:dbg-999@163.com
2012-03-13
2012-04-12
1002-8331(2013)15-0219-05
CNKI出版日期:2012-07-16 http://www.cnki.net/kcms/detail/11.2127.ΤP.20120716.1500.030.html