孫興華 鄒娟茹
摘 要:該文以機(jī)載LIDAR點(diǎn)云數(shù)據(jù)處理為研究對(duì)象,首先分析了LIDAR數(shù)據(jù)的特點(diǎn)和數(shù)據(jù)處理思路,進(jìn)而分析了LIDAR點(diǎn)云數(shù)據(jù)存儲(chǔ)和檢索策略,在此基礎(chǔ)上,作者探討了基于規(guī)則格網(wǎng)重采樣生成DSM的方法和思路,全文是作者長(zhǎng)期工作實(shí)踐基礎(chǔ)上的理論升華,相信對(duì)從事相關(guān)工作的同行能有所裨益。
關(guān)鍵詞:機(jī)載 LIDAR 點(diǎn)云 數(shù)據(jù) DSM
中圖分類號(hào):P228 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2015)05(b)-0001-02
1 LIDAR數(shù)據(jù)處理概述
1.1 LIDAR數(shù)據(jù)的特點(diǎn)
從嚴(yán)格意義上講,航空激光雷達(dá)系統(tǒng)獲取的數(shù)據(jù)包括位置、方位/角度、距離、時(shí)間、強(qiáng)度等飛行過程中得到的各種信息。而實(shí)際應(yīng)用中,人們接觸和使用的是與具體時(shí)間及發(fā)射信號(hào)波長(zhǎng)一一對(duì)應(yīng)的點(diǎn)坐標(biāo)及對(duì)應(yīng)的強(qiáng)度等。作為一種非成像技術(shù),航空激光雷達(dá)數(shù)據(jù)在內(nèi)容、形式等方面具有很多自身的特點(diǎn)。
(1)從內(nèi)容上講,航空激光雷達(dá)數(shù)據(jù)是分布于對(duì)象表面的一系列三維點(diǎn)坐標(biāo)。值得注意的是,多次回波數(shù)據(jù)得到的點(diǎn)坐標(biāo)可能對(duì)應(yīng)著不同的表面,首、末次信號(hào)分別對(duì)應(yīng)樹冠和地面,這種特性在某些場(chǎng)合可以發(fā)揮重要作用。例如,在相鄰掃描帶上植被或其它具有不規(guī)則形狀的物體可能會(huì)具有不同的高度,若用它們進(jìn)行匹配可能會(huì)產(chǎn)生粗差,使用末次回波信號(hào)就可以避免匹配過程中不可預(yù)測(cè)的粗差問題。與記錄反射/發(fā)射能量的強(qiáng)度數(shù)據(jù)相比,航空激光雷達(dá)數(shù)據(jù)在提取空間信息上更加便捷。 (2)激光雷達(dá)數(shù)據(jù)在形式上呈離散分布。這里“離散”是指數(shù)據(jù)點(diǎn)的位置、間隔等在三維空間中的不規(guī)則分布,即數(shù)據(jù)分布無規(guī)律性。(3)數(shù)據(jù)形式的另一個(gè)特點(diǎn)是掃描帶中數(shù)據(jù)分布不均勻——不同位置的點(diǎn)云密度不同,造成這種情況的主要原因是激光掃描儀所采用的掃描方式。激光掃描儀所采用的掃描方式有圓錐掃描,線掃描和光纖掃描。不考慮地形起伏的影響,在圓錐掃描方式中,掃描帶兩側(cè)數(shù)據(jù)密度大,中間部分稀;線掃描方式的情況類似;在光纖掃描方式中,掃描線方向上的數(shù)據(jù)密度大于垂直掃描線方向上的。其他原因還包括飛行速度、掃描儀與地形/地物的相對(duì)位置/方向及航高等。例如,對(duì)建筑物的傾斜屋頂而言,朝向掃描儀方向的屋頂會(huì)比背向掃描儀方向的屋頂反射更多的信號(hào),在數(shù)據(jù)密度較大時(shí)兩個(gè)屋頂平面上數(shù)據(jù)密度就會(huì)表現(xiàn)出差異。(4)盡管目標(biāo)點(diǎn)的三維坐標(biāo)是航空激光雷達(dá)的主要數(shù)據(jù)形式,但其數(shù)據(jù)類型并不局限于此。強(qiáng)度信號(hào)是另一個(gè)有用的信息源,它反映了地表物體對(duì)激光信號(hào)的響應(yīng)。由于一些技術(shù)上的原因,還沒有得到多少實(shí)際應(yīng)用。目前有用強(qiáng)度信號(hào)作為樹種分類的依據(jù)事例。
1.2 LIDAR數(shù)據(jù)處理
LIDAR數(shù)據(jù)處理包括原始數(shù)據(jù)預(yù)處理和點(diǎn)云數(shù)據(jù)后處理兩個(gè)階段。原始數(shù)據(jù)預(yù)處理階段主要包括濾除雷達(dá)噪聲,對(duì)記錄的原始信號(hào)、時(shí)間參數(shù)、距離參數(shù)、GPS和INS數(shù)據(jù)進(jìn)行歸化處理、坐標(biāo)變換,以得到地面目標(biāo)的三維(x,y,z)點(diǎn)云坐標(biāo)數(shù)據(jù)。坐標(biāo)的格式可以根據(jù)用戶的要求定義,即可以得到不同的數(shù)據(jù)格式文件。點(diǎn)云數(shù)據(jù)后處理就是對(duì)得到的地面目標(biāo)的三維點(diǎn)云坐標(biāo)數(shù)據(jù)進(jìn)行分離處理。具體地說,由于激光雷達(dá)點(diǎn)云數(shù)據(jù)分布在不同的目標(biāo)上(如圖1所示),后處理就是將落在地形表面上的點(diǎn)(即所謂的地面點(diǎn))與那些非地形表面上的點(diǎn)(譬如圖1中落在汽車上、樹木或植被上以及落在房屋上的點(diǎn))進(jìn)行有效而準(zhǔn)確的分離。只有高精度及準(zhǔn)確而可靠地分離不同信息后,才可能有效地將這些數(shù)據(jù)用于不同的目的,例如:得到DEM數(shù)據(jù)、測(cè)量樹的高度、獲取城市的三維模型等。對(duì)三維點(diǎn)云坐標(biāo)數(shù)據(jù)進(jìn)行有效的后處理是激光遙感系統(tǒng)最主要的組成部分。
盡管LIDAR技術(shù)在獲取地面點(diǎn)三維坐標(biāo)方面具有效率高、全覆蓋、三維測(cè)量等優(yōu)良的技術(shù)特性,但是其數(shù)據(jù)量的龐大、復(fù)雜、無規(guī)律等特點(diǎn)始終困擾著后期的數(shù)據(jù)處理。離散LIDAR點(diǎn)云數(shù)據(jù)后處理中碰到的第一個(gè)問題就是如何存儲(chǔ)和快速檢索這些龐大的離散數(shù)據(jù)。如果沒有一個(gè)合適的存儲(chǔ)結(jié)構(gòu)和一個(gè)恰當(dāng)?shù)臋z索方法,就會(huì)影響后續(xù)數(shù)據(jù)處理的速度和效率。一個(gè)好的存儲(chǔ)檢索方案可以大大化簡(jiǎn)算法難度,極大的方便后續(xù)數(shù)據(jù)處理的實(shí)現(xiàn),從而使整體算法都得到改觀,所以這一問題的解決具有十分重要的意義。在針對(duì)LIDAR數(shù)據(jù)的壓縮簡(jiǎn)化技術(shù)還不成熟的情況下,一個(gè)好的存儲(chǔ)檢索方案對(duì)于整個(gè)數(shù)據(jù)后處理都至關(guān)重要。為了滿足數(shù)據(jù)后處理的要求,存儲(chǔ)檢索方案應(yīng)該同時(shí)具備以下特征:(1)高空間利用率,使數(shù)據(jù)處理的空間代價(jià)最小并保持?jǐn)?shù)據(jù)無損。(2)檢索快速方便,算法易于實(shí)現(xiàn)。(3)模塊化強(qiáng),自身發(fā)生變化時(shí),對(duì)其它算法的影響最小化。
因此,LIDAR數(shù)據(jù)的存儲(chǔ)檢索研究就是要得到符合以上特征的算法方案,從而為后續(xù)的數(shù)據(jù)處理打下扎實(shí)的基礎(chǔ)。在分析研究其它方法的基礎(chǔ)上,該文提出了一種相對(duì)簡(jiǎn)單的規(guī)則地址格網(wǎng)檢索(GAS-Grid Address Select)算法對(duì)離散LIDAR點(diǎn)云數(shù)據(jù)進(jìn)行存儲(chǔ)與檢索。
2 LIDAR點(diǎn)云數(shù)據(jù)存儲(chǔ)與檢索
2.1 規(guī)則地址格網(wǎng)檢索(GAS-Grid Address Select)算法思想
規(guī)則地址格網(wǎng)檢索(GAS)算法的基本思想是:離散LIDAR點(diǎn)云數(shù)據(jù)按劃分的規(guī)則格網(wǎng)進(jìn)行有序的存儲(chǔ),數(shù)據(jù)檢索的邏輯結(jié)構(gòu)是規(guī)則地址格網(wǎng),二者由地址映射函數(shù)對(duì)應(yīng)起來。
按照GAS算法的思想,預(yù)處理所要執(zhí)行的操作有:從原始數(shù)據(jù)文件中提取本文需要的數(shù)據(jù),即(X,Y,Z)三維坐標(biāo),并順序規(guī)則化離散點(diǎn)。此外,為了后續(xù)的操作方便還要確定文件的格式和向其中加入必要的元數(shù)據(jù)信息,即(X,Y,Z)三維坐標(biāo)的最值。
之后就可以用它來定義數(shù)組為離散數(shù)據(jù)分配內(nèi)存。
接下來,定義幾個(gè)數(shù)據(jù)處理函數(shù)來完成預(yù)處理任務(wù),主要包括以下幾點(diǎn)。
(1)原始數(shù)據(jù)的讀入函數(shù)。
將原始數(shù)據(jù)文件(ASCII碼文本格式)中的數(shù)據(jù)讀入計(jì)算機(jī)內(nèi)存,存儲(chǔ)在由RPoint結(jié)構(gòu)體定義的數(shù)組中,并獲得總點(diǎn)數(shù)(n)。
(2)數(shù)據(jù)處理函數(shù)。
數(shù)據(jù)處理函數(shù)由X坐標(biāo)的排序函數(shù)、Y坐標(biāo)的排序函數(shù)、在X坐標(biāo)1m范圍內(nèi)對(duì)Y排序的處理函數(shù)和求Z坐標(biāo)最值的函數(shù)組成,完成對(duì)離散數(shù)據(jù)進(jìn)行“之”字形排序處理,并獲取X、Y、Z坐標(biāo)的最大和最小值,是離散數(shù)據(jù)預(yù)處理的關(guān)鍵部分。其中對(duì)X、Y坐標(biāo)排序時(shí)用的是快速排序算法,求最值用的是比較法。
(3)處理后數(shù)據(jù)的輸出函數(shù)。
該函數(shù)生成的文件內(nèi)容包括離散點(diǎn)總個(gè)數(shù)(n)、離散點(diǎn)中X、Y、Z坐標(biāo)的最大、最小值和離散點(diǎn)的X、Y、Z坐標(biāo)數(shù)據(jù),同時(shí)該函數(shù)還去除了原始數(shù)據(jù)中的冗余數(shù)據(jù)即X、Y、Z坐標(biāo)完全相同的點(diǎn)和沒有用到的反射強(qiáng)度值,以及可能的錯(cuò)誤點(diǎn)等。通過以上預(yù)處理程序?qū)υ紨?shù)據(jù)進(jìn)行處理后就生成一個(gè)ASCII碼文本文件,文件的第一行為離散點(diǎn)總個(gè)數(shù)(n),第二行為X、Y、Z坐標(biāo)的最大值,第三行為X、Y、Z坐標(biāo)的最小值,接下來是順序存儲(chǔ)的離散點(diǎn)的X、Y、Z坐標(biāo)數(shù)據(jù),這些數(shù)據(jù)是按X坐標(biāo)差小于1m間距“之”字形排列的。
2.2 規(guī)則地址格網(wǎng)(GIT-grid index table)的建立
規(guī)則地址格網(wǎng)建立的基本方法是:根據(jù)格網(wǎng)劃分尺度將坐標(biāo)區(qū)域劃分成規(guī)則格網(wǎng),對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行地址映射得到其存放地址,記錄落入每一個(gè)格網(wǎng)中的離散點(diǎn)個(gè)數(shù)和第一個(gè)離散點(diǎn)的存放地址。先定義一個(gè)存儲(chǔ)三維坐標(biāo)數(shù)據(jù)的結(jié)構(gòu)體Point,將處理后的數(shù)據(jù)存儲(chǔ)在此結(jié)構(gòu)體中。然后用這個(gè)結(jié)構(gòu)體定義一個(gè)二維數(shù)組來表示格網(wǎng),形成格網(wǎng)的存儲(chǔ)結(jié)構(gòu)。之后確定格網(wǎng)的原點(diǎn)坐標(biāo),再通過數(shù)據(jù)的坐標(biāo)值對(duì)格網(wǎng)進(jìn)行處理(即將數(shù)據(jù)的地址裝入對(duì)應(yīng)的網(wǎng)格)這樣規(guī)則地址格網(wǎng)就建立起來了。
2.3 基于規(guī)則地址格網(wǎng)的數(shù)據(jù)檢索
規(guī)則地址格網(wǎng)建立起來之后,每個(gè)離散數(shù)據(jù)點(diǎn)就會(huì)落入對(duì)應(yīng)的格網(wǎng)單元,就可以安全、準(zhǔn)確、高效的實(shí)現(xiàn)離散LIDAR點(diǎn)云數(shù)據(jù)的快速檢索。當(dāng)進(jìn)行內(nèi)插或數(shù)據(jù)檢索時(shí),首先判斷內(nèi)插所在的格網(wǎng)單元,根據(jù)需要取出當(dāng)前格網(wǎng)單元或鄰域(如周圍3×3格網(wǎng))的全部數(shù)據(jù),避免了內(nèi)插過程中逐個(gè)數(shù)據(jù)的搜索,使得查找速度大大提高,特別是海量數(shù)據(jù)的處理。根據(jù)檢索區(qū)域的形狀不同,檢索函數(shù)也千差萬別,但其中最基本的是單個(gè)網(wǎng)格檢索函數(shù)。就像點(diǎn)組成面一樣,單個(gè)網(wǎng)格可組成任意形狀的檢索區(qū)域,所以其它形狀的檢索函數(shù)只需要對(duì)單個(gè)網(wǎng)格檢索函數(shù)稍做修改或者多次調(diào)用單個(gè)網(wǎng)格檢索函數(shù)就可獲得。例如:將單個(gè)網(wǎng)格檢索函數(shù)的主體部分加上確定矩形區(qū)域的循環(huán)就可轉(zhuǎn)化為矩形檢索函數(shù),從而使得檢索函數(shù)的設(shè)計(jì)變得十分容易。這些都充分體現(xiàn)了GAS算法在離散數(shù)據(jù)檢索方面的特點(diǎn)。
3 規(guī)則格網(wǎng)重采樣生成數(shù)字表面模型(DSM)
3.1 DSM逐點(diǎn)內(nèi)插理論基礎(chǔ)
基于不規(guī)則分布采樣點(diǎn)的DSM建立實(shí)質(zhì)上就是離散數(shù)據(jù)規(guī)則格網(wǎng)化的處理過程。通過不規(guī)則分布數(shù)據(jù)直接建立DSM通常采用逐點(diǎn)內(nèi)插法。所謂逐點(diǎn)內(nèi)插,是以內(nèi)插點(diǎn)為中心,確定一個(gè)鄰域范圍,用落在鄰域范圍內(nèi)的采樣點(diǎn)來計(jì)算內(nèi)插點(diǎn)的高程值。其基本步驟如下。
(1)定義內(nèi)插點(diǎn)的鄰域范圍;(2)確定落在鄰域內(nèi)的采樣點(diǎn);(3)選定內(nèi)插數(shù)學(xué)模型;(4)通過鄰域內(nèi)的采樣點(diǎn)和內(nèi)插數(shù)學(xué)模型計(jì)算內(nèi)插點(diǎn)的高程。
為實(shí)現(xiàn)上述步驟,逐點(diǎn)內(nèi)插法需要解決以下幾個(gè)問題。
(1)內(nèi)插函數(shù),逐點(diǎn)內(nèi)插法的內(nèi)插函數(shù)決定著DSM的精度、連續(xù)性、內(nèi)插點(diǎn)鄰域的最小采樣點(diǎn)個(gè)數(shù)和內(nèi)插計(jì)算效率。內(nèi)插函數(shù)常常與采樣點(diǎn)的分布有關(guān),目前常用的適合于離散分布采樣點(diǎn)的內(nèi)插函數(shù)有曲面擬合、加權(quán)平均內(nèi)插法等。(2)鄰域大小和形狀,在逐點(diǎn)內(nèi)插中,鄰域的作用是選擇參加內(nèi)插的采樣點(diǎn)。逐點(diǎn)內(nèi)插法的鄰域大小、形狀和位置隨內(nèi)插點(diǎn)的位置而變動(dòng)。鄰域確定一般用在離散分布采樣點(diǎn)的DSM建立中,常用的鄰域有圓形、方形等。(3)鄰域內(nèi)數(shù)據(jù)點(diǎn)的個(gè)數(shù),鄰域內(nèi)數(shù)據(jù)點(diǎn)全部參加內(nèi)插計(jì)算,用來進(jìn)行內(nèi)插計(jì)算的采樣點(diǎn)不能太多也不能太少,太多影響計(jì)算精度(對(duì)內(nèi)插計(jì)算的貢獻(xiàn)程度太小)和處理效率,太少則不能滿足內(nèi)插函數(shù)的要求,鄰域點(diǎn)的確定一般與具體的內(nèi)插函數(shù)有關(guān),通常認(rèn)為4~10個(gè)點(diǎn)是比較合適的。鄰域數(shù)據(jù)點(diǎn)的個(gè)數(shù)常常決定著鄰域范圍的大小。鄰域內(nèi)的點(diǎn)數(shù)也與采樣點(diǎn)的分布密度有關(guān)。(4)采樣點(diǎn)的權(quán)重,采樣點(diǎn)的權(quán)重是指采樣點(diǎn)對(duì)內(nèi)插點(diǎn)的貢獻(xiàn)程度,現(xiàn)今最常用的定權(quán)方法是按距離定權(quán),即反距離權(quán)。逐點(diǎn)內(nèi)插方法由于計(jì)算簡(jiǎn)單,應(yīng)用比較靈活,內(nèi)插效率較高,而成為目前生產(chǎn)中常采用的方法。
3.2 距離加權(quán)平均內(nèi)插生成數(shù)字表面模型
在建立了規(guī)則地址格網(wǎng)檢索算法的基礎(chǔ)上,該文利用逐點(diǎn)內(nèi)插法中的距離加權(quán)平均法來生成數(shù)字表面模型(DSM),具體步驟如下。
(1)確定內(nèi)插點(diǎn)所在的格網(wǎng)單元。
由測(cè)區(qū)內(nèi)所有激光采樣點(diǎn)X、Y坐標(biāo)的最大、最小值可以得到測(cè)區(qū)的范圍,再依據(jù)采樣間隔就可以計(jì)算出DSM格網(wǎng)的大小。
(2)規(guī)則地址格網(wǎng)檢索鄰域內(nèi)的點(diǎn)。
利用距離加權(quán)平均法進(jìn)行內(nèi)插計(jì)算,需要選取與插值點(diǎn)距離最近的若干個(gè)點(diǎn)來參加計(jì)算。最簡(jiǎn)單的方法就是計(jì)算內(nèi)插點(diǎn)與周圍采樣點(diǎn)的距離,然后從中選出與內(nèi)插點(diǎn)距離最近的若干點(diǎn)。這種方法計(jì)算量大,影響到插值速度。為解決這一問題,可選用一定的鄰域搜索區(qū)域,根據(jù)距離加權(quán)平均法內(nèi)插數(shù)學(xué)模型對(duì)采樣點(diǎn)數(shù)量的要求,不斷調(diào)整搜索范圍,直到滿足要求為止。
(3)權(quán)值的計(jì)算。
由于地形的自相關(guān)性,較近的采樣點(diǎn)對(duì)內(nèi)插點(diǎn)的影響要大一些,因此常常用內(nèi)插點(diǎn)和采樣點(diǎn)之間的距離來刻畫采樣點(diǎn)對(duì)內(nèi)插點(diǎn)的貢獻(xiàn)程度,即距離越近,權(quán)值越大,反之越小。
(4)計(jì)算內(nèi)插點(diǎn)的高程值。
定義了采樣點(diǎn)的權(quán),并獲得了內(nèi)插點(diǎn)鄰域范圍內(nèi)的采樣點(diǎn),就可以利用距離加權(quán)平均法進(jìn)行DSM內(nèi)插。
4 灰度量化生成DSM深度影像
為了直觀地表示出LIDAR數(shù)據(jù)的內(nèi)容信息,將由離散LIDAR點(diǎn)云數(shù)據(jù)規(guī)則格網(wǎng)重采樣生成的數(shù)字表面模型(DSM)按照高程進(jìn)行灰度量化,得到同灰度圖像一樣的DSM深度影像。這就為后續(xù)的基于數(shù)字圖像處理技術(shù)的DSM深度影像處理做好了準(zhǔn)備。具體做法是:搜索DSM中所有的LIDAR數(shù)據(jù)點(diǎn),得到高程最大值和最小值,對(duì)高程進(jìn)行量化,得到每一點(diǎn)的像素灰度值;同時(shí)將DSM三維點(diǎn)坐標(biāo)中的X、Y坐標(biāo)轉(zhuǎn)化為DSM深度影像的二維橫、縱坐標(biāo)、,一個(gè)坐標(biāo)點(diǎn)對(duì)應(yīng)一個(gè)像素點(diǎn),就生成了同DSM格網(wǎng)大小相同的DSM深度影像。
(1)影像的灰度值和DSM中LIDAR數(shù)據(jù)的高程值成線性關(guān)系,高程值越高對(duì)應(yīng)的像素灰度值就越高,反之,則越低。(2)在平坦城區(qū),影像上地面部分的灰度值變化不大,且像素的灰度值低于建筑物部分。在影像的灰度直方圖上,往往最高的波峰由地面部分LIDAR點(diǎn)的像素形成。(3)由于LIDAR光束在較高建筑物邊緣常和墻面相切,導(dǎo)致建筑物邊緣數(shù)據(jù)不準(zhǔn)確,因此在灰度影像上建筑物邊緣常呈鋸齒狀。DSM深度影像其獨(dú)特的特點(diǎn)為引入數(shù)字圖像處理的方法提取建筑物奠定了基礎(chǔ)。
參考文獻(xiàn)
[1] 馮仲科,楊伯鋼,羅旭,等.應(yīng)用LIDAR技術(shù)預(yù)測(cè)林分蓄積量[J].北京林業(yè)大學(xué)學(xué)報(bào),2007(S2):45-51.
[2] 劉永霞,胡涌,馮仲科.基于LIDAR數(shù)據(jù)的林冠層三維信息模型的提取與應(yīng)用[J].北京林業(yè)大學(xué)學(xué)報(bào),2007(S2):66-69.
[3] 王永平.機(jī)載LIDAR數(shù)據(jù)處理及林業(yè)三維信息提取研究[D].北京:中國(guó)測(cè)繪科學(xué)研究院,2006.
[4] 賈廣帥.機(jī)載激光雷達(dá)數(shù)據(jù)特點(diǎn)和濾波方法研究[D].北京:北京大學(xué),2007.