江恒彪
(1.茂名市特聘人才管理中心,廣東 茂名 525000; 2.茂名市國土資源勘探測繪院,廣東 茂名 525000)
基于實(shí)體化的地面點(diǎn)云建模技術(shù)
江恒彪1,2
(1.茂名市特聘人才管理中心,廣東 茂名 525000; 2.茂名市國土資源勘探測繪院,廣東 茂名 525000)
地面三維激光掃描點(diǎn)云密集,實(shí)體信息隱含,特征提取困難。根據(jù)原始點(diǎn)云數(shù)據(jù)的特點(diǎn),提出對點(diǎn)云進(jìn)行實(shí)體化處理,種子點(diǎn)生成技術(shù)可用于實(shí)體提取。完成點(diǎn)云實(shí)體化后,通過隨機(jī)采樣一致算法結(jié)合穩(wěn)健估計(jì)方法,可更好地進(jìn)行地物特征提取。由于現(xiàn)實(shí)客觀世界的復(fù)雜性,采用一些先驗(yàn)性知識(shí),可以減少人工處理過程,加快點(diǎn)云分類和實(shí)體建模速度。
點(diǎn)云;實(shí)體化;模型擬合;RANSAC;特征提取
LiDAR技術(shù)采集的原始數(shù)據(jù)以密集離散點(diǎn)云的方式存在,大量冗余的坐標(biāo)點(diǎn)影響人們從中提取有用的信息,例如確定一個(gè)平面數(shù)學(xué)上只需要3個(gè)點(diǎn)或幾個(gè)點(diǎn)就可以,但點(diǎn)云數(shù)據(jù)每隔2~5 cm就會(huì)產(chǎn)生一個(gè)數(shù)據(jù)點(diǎn),遠(yuǎn)比用戶需要的多,如何對數(shù)據(jù)點(diǎn)進(jìn)行簡化處理及建模成為數(shù)據(jù)后處理的重點(diǎn)任務(wù)。對于地理信息系統(tǒng)而言,所有的要素集都是基于矢量的或有明確意義的,一個(gè)點(diǎn)要素可能會(huì)代表一個(gè)學(xué)校、商店或其它,一條線要素可能表示道路、河流、管線等[1]。原始的點(diǎn)云數(shù)據(jù)實(shí)體與實(shí)體相連,表達(dá)自然地理空間布局,因此,有必要對點(diǎn)云數(shù)據(jù)進(jìn)行分割,對點(diǎn)云進(jìn)行建模,理解各部分點(diǎn)云所代表地面或其它地物(樹或路燈等),提高其對地理狀況的表達(dá)程度。
目前的研究還不能用全自動(dòng)的方法將點(diǎn)云數(shù)據(jù)地理實(shí)體一一識(shí)別提取出來,采用軟件人工交互刪除無用數(shù)據(jù)等預(yù)處理步驟仍然很有必要。本文的實(shí)體化是指把無序復(fù)雜的離散點(diǎn)云重新排序、分類,每一類再分割成具有實(shí)體意義的子點(diǎn)云塊,每個(gè)實(shí)體塊都具有唯一的ID號,例如可以把每棵有意義的樹、路燈等點(diǎn)云塊作為一個(gè)實(shí)體。
1.1 實(shí)體化的重要性
實(shí)體化的主要作用是對點(diǎn)云進(jìn)行分類,便于在后期數(shù)據(jù)處理中逐個(gè)實(shí)體一一識(shí)別,使復(fù)雜的點(diǎn)云數(shù)據(jù)處理簡單明了。點(diǎn)云實(shí)體化對于地物的建模與可視化具有非常重要的意義:分類后的點(diǎn)云由無序復(fù)雜變成有序化、編址(有ID號)化,甚至結(jié)構(gòu)化,便于實(shí)行分層管理(選層)、檢索、渲染等;不同類別的點(diǎn)云可根據(jù)模型特點(diǎn)采用不同的矢量化方法;可以采用分類分層分色顯示技術(shù),隱藏層數(shù)據(jù)僅顯示所需要的數(shù)據(jù),方便軟件處理(見圖1)。
圖1 點(diǎn)云實(shí)體化(每棵樹作為一個(gè)實(shí)體,分類分層分色渲染)
1.2 點(diǎn)云實(shí)體化策略
分類是點(diǎn)云數(shù)據(jù)處理的一個(gè)技術(shù)難點(diǎn)和關(guān)鍵點(diǎn)。試驗(yàn)中主要采用種子點(diǎn)生長技術(shù)來進(jìn)行分類[2-3],種子點(diǎn)基本上都選在實(shí)體與地面的交界處,根據(jù)實(shí)體類型確定種子點(diǎn)擴(kuò)散方向,如樹、路燈等地物種子點(diǎn)向上生長,首先要設(shè)置好距離閾值,只有小于這個(gè)距離的點(diǎn)才會(huì)被考慮歸為同一類,也可以考慮將顏色相同或相近的點(diǎn)歸為一類,或考慮將反射強(qiáng)度相近的歸為一類[4];同時(shí)利用先驗(yàn)性知識(shí),如樹的高度在10 m以內(nèi)、電桿的高度在15 m內(nèi)等加以限制,提高點(diǎn)云檢索分類的速度。圖2展示了通過基于種子點(diǎn)生長技術(shù)實(shí)體化后,樹、路燈等實(shí)體點(diǎn)云被分離出來,并用不同的顏色渲染。
根據(jù)三維空間實(shí)體的分類和可視化方法,實(shí)體化后點(diǎn)云可分成點(diǎn)、線、面、體4大類,另外,無用數(shù)據(jù)也作為一大類編碼。點(diǎn)云大類編碼如下:
圖2 種子點(diǎn)生長技術(shù)提取實(shí)體樹、路燈
a)零層碼:0001——0999;
b)點(diǎn)層碼:1001——1999;
c)線層碼:2001——2999;
d)面層碼:3001——3999;
e)體層碼:4001——4999。
具體的地物分類編碼及策略見表1。
表1點(diǎn)云實(shí)體分類策略簡表
點(diǎn)云實(shí)體化分類后的主要目標(biāo)是對地物進(jìn)行矢量化、建模、特征提取。
2.1 點(diǎn)云實(shí)體形狀特征
點(diǎn)云實(shí)體建模是把離散點(diǎn)云數(shù)據(jù)集轉(zhuǎn)換成一個(gè)分段連續(xù)、光滑的模型。對人類視覺而言,很容易識(shí)別模型對象是否是平面,或是可用函數(shù)表達(dá)的曲面;對計(jì)算機(jī)分析而言,獲取關(guān)于模型對象盡可能多的先驗(yàn)性知識(shí)對目前的技術(shù)非常重要,這將決定要構(gòu)造的最終模型(平面、圓柱面等)并影響計(jì)算效率。假設(shè)已經(jīng)知道表面的類型(平面、圓柱面等),以及一些參數(shù)估計(jì),則可以利用最小二乘法擬合出模型表面,同時(shí)剔除不屬于該表面的點(diǎn)云。對于大多數(shù)實(shí)體而言,都可以通過擬合平面而達(dá)到實(shí)體重建的目的,如盒子型的房屋,先擬合四周的垂直面,與頂面和地面相交確定房屋輪廓線。通過平面相交的方法可以提取到窗戶、陽臺(tái)、道路等各種地物的邊緣線[3]。
2.2 點(diǎn)云粗差剔除技術(shù)
點(diǎn)云實(shí)體化后的點(diǎn)集仍然有可能存在不屬于模型的點(diǎn)(噪聲點(diǎn)數(shù)據(jù)),模型擬合必須把一些粗差點(diǎn)或噪聲點(diǎn)剔除出來,否則對擬合的模型有嚴(yán)重影響。點(diǎn)云數(shù)據(jù)含有3種誤差:隨機(jī)誤差、系統(tǒng)誤差和粗差(噪聲點(diǎn))。在生產(chǎn)實(shí)踐和實(shí)驗(yàn)所采集的數(shù)據(jù)中,粗差出現(xiàn)的概率為1%~10%[5]。通常有兩種方法解決粗差,即數(shù)據(jù)探測法和穩(wěn)健參數(shù)估計(jì),第一種方法使用最小二乘然后統(tǒng)計(jì)結(jié)果誤差,排除最大誤差的數(shù)據(jù),處理過程不斷循環(huán)直到殘差滿足正態(tài)分布,該方法的缺點(diǎn)是一次只能找出一個(gè)粗差;第二種方法是在計(jì)算殘差最小化的過程中,能一次性地排除所有粗差(兩個(gè)以上)。
2.3 穩(wěn)健的模型擬合方法
模型擬合是一個(gè)最優(yōu)化問題,需要尋找指定模型的最合適參數(shù)使得點(diǎn)云數(shù)據(jù)與最終模型相匹配[6-8]。匹配的準(zhǔn)則可以用點(diǎn)到表面模型的距離來衡量,對于點(diǎn)云集合而言,就是計(jì)算所有點(diǎn)到模型的距離之和。距離和越小表明模型擬合得越好。模型擬合可以用數(shù)字公式定義為
(1)
式中:給定n個(gè)點(diǎn)云數(shù)據(jù)p1,p2, …,pn;Γ(γ1,γ2,…,γm)是擬合模型的方程,模型含有m個(gè)未知參數(shù)γ1,γ2,…,γm。Ψ是一個(gè)距離函數(shù)(代數(shù),正交的或其它距離測度),F(xiàn)是關(guān)于這個(gè)距離Ψ的函數(shù)(最小二乘估計(jì)采用(.)2)。
對于平面擬合來說,Ψ在這里采用歐氏距離函數(shù)。F將采用距離的平方,因此擬合方程變?yōu)?/p>
(2)
2.4 基于RANSAC的點(diǎn)云平面模型擬合與特征提取
根據(jù)隨機(jī)采樣一致算法(random sample consensus,RANSAC)[9-10]:產(chǎn)生正確模型的辦法是選擇數(shù)據(jù)點(diǎn)集中模型上的點(diǎn),排除不屬于模型的點(diǎn),這通過迭代過程比較容易做到,首先,選擇一個(gè)只有幾個(gè)點(diǎn)的數(shù)據(jù)點(diǎn)子集,然后進(jìn)行模型擬合,查看
其他點(diǎn)是否大部分可以匹配到擬合的模型上。不斷隨機(jī)選點(diǎn)迭代擬合,當(dāng)大部分點(diǎn)都可匹配時(shí)即可求得模型參數(shù)。
假設(shè)抽取n個(gè)數(shù)據(jù)點(diǎn),p是RANSAC迭代算法中抽取k次得到好點(diǎn)的概率,w是這些點(diǎn)中好點(diǎn)的比例(只要合理估計(jì)這個(gè)數(shù)),因?yàn)槌槿∈仟?dú)立的,n個(gè)點(diǎn)都是好點(diǎn)的概率是wn,那么至少有一個(gè)點(diǎn)是壞點(diǎn)的概率就是1-wn,含有壞點(diǎn)將不能擬合出正確的模型。那么算法迭代k次都沒有取到好點(diǎn)集的概率為1-p,即
1-p=(1-wn)k,
(3)
兩邊取對數(shù),得
k=log(1-p)/log(1-wn).
(4)
假設(shè)本次選點(diǎn)99%的可能是好點(diǎn),則對一個(gè)包含10%粗差點(diǎn)的數(shù)據(jù)集擬合平面,由式(4)計(jì)算得k=15。如果這3個(gè)點(diǎn)恰好是平面上的點(diǎn),那么其余點(diǎn)都會(huì)非??拷蛇@3點(diǎn)構(gòu)造的平面。用RANSAC算法擬合平面的過程如下:
1)在分類好的點(diǎn)云實(shí)體中隨機(jī)選擇3個(gè)點(diǎn),直接計(jì)算其對應(yīng)的平面方程ax+by+z=d,然后計(jì)算點(diǎn)云至該平面的距離di=|axi+byi+zi-d|;
2)選取閾值t,若di 3)k次重復(fù)以上步驟,比較選取好點(diǎn)最多平面; 4)根據(jù)最小二乘算法以最多的好點(diǎn)重新進(jìn)行平面擬合,得到最終擬合的平面方程。 對于某個(gè)隨機(jī)采樣擬合平面,檢驗(yàn)?zāi)P褪欠裾_,可以計(jì)算有多少點(diǎn)在平面外的某個(gè)距離內(nèi)。RANSAC的優(yōu)點(diǎn)是能夠剔除大部分的壞點(diǎn),計(jì)算模型的參數(shù),最小二乘估計(jì)能產(chǎn)生更好的結(jié)果。因此,應(yīng)將RANSAC與最小二乘估計(jì)結(jié)合起來計(jì)算模型參數(shù)。圖3顯示使用兩種算法擬合提取的路面和墻面。 LiDAR技術(shù)在三維數(shù)據(jù)采集方面表現(xiàn)出巨大優(yōu)勢,測繪技術(shù)人員從海量數(shù)據(jù)提取有用信息成為研究熱點(diǎn)。本文提出采用實(shí)體化的辦法預(yù)先對點(diǎn)云數(shù)據(jù)進(jìn)行分類分層,后期數(shù)據(jù)處理就可以對各個(gè)點(diǎn)云實(shí)體逐一擊破,分實(shí)體建模。如果已經(jīng)知道表面的類型(如平面),以及它的一些參數(shù)估計(jì),可以使用最小二乘法擬合出表面,從而實(shí)現(xiàn)實(shí)體建模及特征提取。 圖3 路面、墻面擬合與特征提取 [1]鄔倫,張晶,劉瑜.地理信息系統(tǒng)原理、方法和應(yīng)用[M].北京:科學(xué)出版社,2001:63-67. [2]G SOHN, I DOWMAN. Terrain surface reconstruction by the use of tetrahedron model with the MDL criterion [C]. Austria, Graz: IAPRS XXXIV 3A, 2002:336-344. [3]S PU, G VOSSELMAN. Extracting windows from terrestrial laser scanning, International Archives of Photogrammetry [J]. Remote Sensing and Spatial Information Sciences, 2007, 36 (Part 3/W52):320-325. [4]龔亮,李正國,包全福.融合航空影像的LiDAR地物點(diǎn)云分類[J].測繪工程,2012,21(1):34-38. [5]邱衛(wèi)寧. 測量數(shù)據(jù)處理理論與方法[M]. 武漢:武漢大學(xué)出版社,2008:111-120. [6]P J HUBER. Robust statistics [M]. Chichester, NY: John Wiley & Sons, 1981:10-20. [7]T KRARUP, J JUHL, K KUBIK. G?tterd?mmerung over least squares adjustment [J]. International Archives for Photogrammetry and Remote Sensing, 1980, 23(B3):369-377. [8]P C J?RGENSEN. Frederiksen. Robust Estimation[J]. International Archives for Photogrammetry and Remote Sensing, 1984, 25(A3a):269-277. [9]Martin A. Fischler and Robert C. Bolles. Random Sample Consensus: A Paradigm for Model Fitting with Applications to Image Analysis and Automated Cartography [J]. New York: Communications of the ACM, 1981, 24:381-395. [10]周春霖,朱合華,李曉軍.隨機(jī)抽樣一致性平面擬合及其應(yīng)用研究[J].計(jì)算機(jī)工程與應(yīng)用,2011(7):177-179. [責(zé)任編輯:張德福] A modeling technique of point cloud based on entity-classification JIANG Heng-biao1,2 (1.Maoming City Distinguished Talent Management Center,Maoming 525000, China; 2.Maoming Mapping Institute of Land and Resources, Maoming 525000, China) It’s difficult to extract the feature from 3D terrestrial laser scanning point cloud because the data is mass and geographic entity information is implied. Based on the characteristics classifying the point cloud into entity is proposed with seed-grown method first. After classification and layering, RANSAC algorithm and robust modeling method can be used to extract the object feature. As for the complexity of the objective world, the use of some prior knowledge can reduce the manual processing time when classification and modeling are done. point cloud; entity-classified; modeling; RANSAC;feature extraction 2013-11-07 江恒彪(1977-),男,工程師,博士. P208 :A :1006-7949(2014)07-0030-043 結(jié)束語