馬澤亮,楊風(fēng)暴
(中北大學(xué)信息與通信工程學(xué)院,山西 太原 030051)
機(jī)載激光掃描與測(cè)距系統(tǒng)(Light Detection And Ranging,LiDAR)作為一種新興主動(dòng)式遙感技術(shù),具有空間分辨率高、獲取三維信息迅速等獨(dú)特優(yōu)勢(shì),廣泛應(yīng)用于森林樹(shù)種分類(lèi)[1],地物類(lèi)別檢測(cè)[2-3],三維城市建模[4-5]和自然災(zāi)害救援[6],而上述應(yīng)用得以實(shí)現(xiàn)的必要保證是構(gòu)造一種滿(mǎn)足高精度要求,具有實(shí)時(shí)性的LiDAR數(shù)據(jù)地物分類(lèi)算法。
現(xiàn)有的LiDAR數(shù)據(jù)地物分類(lèi)方法主要是機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和以證據(jù)推理為代表的多特征智能組合方法。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法能夠在大規(guī)模數(shù)據(jù)集訓(xùn)練的基礎(chǔ)上,半自動(dòng)或者全自動(dòng)的識(shí)別地物。Hoang M N[7]等人運(yùn)用支持向量機(jī)方法(SVM)實(shí)現(xiàn)了森林植被區(qū)域單株樹(shù)木的提??;何曼蕓[8]等人運(yùn)用隨機(jī)森林算法(RF)實(shí)現(xiàn)了城市地區(qū)建筑物點(diǎn)的提?。悔w中陽(yáng)[9]等人提出了一種基于多尺度特征和Point Net的深度神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)了復(fù)雜場(chǎng)景下LiDAR點(diǎn)云的自動(dòng)分類(lèi)。DS證據(jù)理論[10]作為處理不確定性問(wèn)題的基本方法,通過(guò)構(gòu)建信任分配函數(shù)描述不同分類(lèi)特征與地物類(lèi)別間的不確定關(guān)系,利用決策規(guī)則進(jìn)行證據(jù)的合成,可以很好地處理不同特征數(shù)據(jù)間的復(fù)雜關(guān)系并且該過(guò)程不需要大量訓(xùn)練樣本,能夠大大提高算法運(yùn)行效率,可以廣泛應(yīng)用于多種地物分類(lèi)場(chǎng)景。馮裴裴[11]等結(jié)合模糊分布中的正態(tài)分布提出一種基于正態(tài)DS證據(jù)理論的LiDAR數(shù)據(jù)地物分類(lèi)方法,將不同特征數(shù)據(jù)下的地物類(lèi)別分布設(shè)為正態(tài)信任分配函數(shù); Yang F B[12]等人基于DS證據(jù)理論,構(gòu)造了一種線性信任分配函數(shù),并利用分層組合框架對(duì)城市地物進(jìn)行分類(lèi);上述方法解決了模糊點(diǎn)的分類(lèi)問(wèn)題,但其信任分配函數(shù)難以準(zhǔn)確描述分類(lèi)特征數(shù)據(jù)與地物類(lèi)別間的不確定關(guān)系,算法分類(lèi)精度不太高。
綜上所述,本文基于基本DS證據(jù)理論,改進(jìn)上述方法中的信任分配函數(shù),構(gòu)造了一種基于尖τ型信任分配函數(shù)的快速地物分類(lèi)方法,在有效提高算法運(yùn)行效率的同時(shí)提升了算法分類(lèi)精度,可廣泛應(yīng)用于多種地物分類(lèi)場(chǎng)景。
本文用到的源數(shù)據(jù)包括機(jī)載LiDAR首次回波(FE),末次回波(LE),強(qiáng)度特征(IN),可見(jiàn)光圖像(RGB),近紅外圖像(NIR)。根據(jù)源數(shù)據(jù)特征和地物特性得到兩組衍生數(shù)據(jù)特征:首末次回波高程差(HD)、歸一化差異植被指數(shù)(NDVI)。
首末次回波高程差(Height Difference,HD)可由公式(1)得到,激光雷達(dá)對(duì)樹(shù)木有穿透特性,能夠在樹(shù)冠、樹(shù)干與地面形成多次回波,而對(duì)于不可穿透地物,比如建筑物、道路、草地,HD沒(méi)有能力將其區(qū)分,該衍生特征可以用來(lái)表征樹(shù)木點(diǎn)的高度信息。
HD=FE-LE
(1)
歸一化植被差異指數(shù)(Normalized Difference Vegetation Index,NDVI)通過(guò)測(cè)量近紅外(植被強(qiáng)烈反射)和紅光(植被吸收)之間的差異來(lái)量化植被。該衍生特征利用植物葉綠素對(duì)紅光的吸收特性來(lái)進(jìn)行植物的識(shí)別,獲取公式如式(2)所示:
(2)
NDVI值總是在-1~+1之間,與植被分布密度成線性關(guān)系,如果接近+1,則是密集的綠葉。NDVI值的大小與地物覆蓋種類(lèi)關(guān)系如(3)所示:
(3)
本文采用首次回波(FE)、強(qiáng)度(IN)、首末次回波高程差(HD)、歸一化植被差異指數(shù)(NDVI)四種特征來(lái)對(duì)包含建筑物、草地、樹(shù)木、道路四類(lèi)復(fù)雜地物場(chǎng)景進(jìn)行分類(lèi)。
DS證據(jù)理論作為一種不確定性的推理方法,在解決地物分類(lèi)問(wèn)題時(shí),其作用在于利用不同特征的輸入數(shù)據(jù),將待識(shí)別地物區(qū)分為符合實(shí)際地物的不同地物類(lèi)別,其集合Θ稱(chēng)為識(shí)別框架。識(shí)別框架Θ的所有子集組成的一個(gè)集合稱(chēng)為Θ的冪集,記作2Θ,來(lái)自不同數(shù)據(jù)源的特征數(shù)據(jù)可以為一個(gè)或者多個(gè)命題提供支持度,這種支持度可以通過(guò)基本信任分配函數(shù)獲得。
基本信任分配函數(shù)m(A)是一個(gè)從集合2Θ到[0,1]的映射,A表示識(shí)別框架Θ的任意子集(命題),記作A∈2Θ,基本信任分配函數(shù)m(A)滿(mǎn)足0≤m(A)≤1,m(φ)=0,∑A∈2Θm(A)=1,其中φ為空集,且識(shí)別框架中的集合A只要滿(mǎn)足m(A)>0,則稱(chēng)A為焦元。m(A)可利用函數(shù)根據(jù)傳感器得到的數(shù)據(jù)計(jì)算獲得,比如BPA函數(shù)。BPA函數(shù)可以根據(jù)傳感器檢測(cè)得到的數(shù)據(jù)構(gòu)造而來(lái)。
基本信任分配函數(shù)是對(duì)一個(gè)命題的不確定性度量的基礎(chǔ),在地物分類(lèi)應(yīng)用中,由于不同特征數(shù)據(jù)來(lái)源不同,會(huì)得到兩個(gè)或者多個(gè)不同的基本信任分配函數(shù),此時(shí)為描述命題的不確定性,必須將兩個(gè)或多個(gè)基本信任分配函數(shù)進(jìn)行正交和運(yùn)算來(lái)合成,上述方法即為D-S合成規(guī)則。若已知P個(gè)數(shù)據(jù)源,每個(gè)數(shù)據(jù)源i有基本信任分配函數(shù)mi(Bj),且有0≤i≤P,Bj∈2Θ。對(duì)于命題A可以由D-S合成規(guī)則對(duì)多個(gè)數(shù)據(jù)源的基本信任分配函數(shù)進(jìn)行合成:
(4)
(5)
其中,焦元A,Bj∈2Θ,|Bj|是集合Bj的元素個(gè)數(shù)。
信任分配函數(shù)的定義是DS證據(jù)理論的基礎(chǔ)。本文基于基本DS證據(jù)理論的基礎(chǔ),引入模糊集理論,提出了一種新的信任分配函數(shù)——尖τ型信任分配函數(shù),表示分類(lèi)特征和地物類(lèi)別間的不確定關(guān)系。該函數(shù)基于不同特征下地物點(diǎn)灰度值與所屬地物類(lèi)別可能性程度呈尖τ型分布的假設(shè)。利用直方圖統(tǒng)計(jì)不同特征數(shù)據(jù)下不同地物類(lèi)別的灰度值范圍,由此確定不同特征對(duì)應(yīng)信任分配函數(shù)的閾值。函數(shù)定義為:
(6)
(7)
(8)
式中,PAi(x)表示當(dāng)數(shù)據(jù)源i輸入為x時(shí),圖像某個(gè)像素點(diǎn)屬于A類(lèi)的可能性;PBi(x)表示當(dāng)數(shù)據(jù)源i輸入為x時(shí),圖像某個(gè)像素點(diǎn)屬于B類(lèi)的可能性;引入模糊類(lèi)別A∪B用來(lái)表示A類(lèi)與B類(lèi)之間的模糊類(lèi),集合A∪B中的元素不能完全確定屬于A類(lèi)還是B類(lèi)。當(dāng)輸入x小于閾值h12時(shí),PAi(x)和PA∪Bi(x)可以由式(6)和式(8)求出,此時(shí)屬于B類(lèi)的可能性PBi(x)為0。同理,當(dāng)輸入x大于閾值h12時(shí),PBi(x)和PA∪Bi(x)可以由式(7)和式(8)求出,此時(shí)屬于A類(lèi)的可能性PAi(x)為0。
尖τ型信任分配函數(shù)的曲線由圖1給出。地物類(lèi)別間的辨識(shí)度描述的是分類(lèi)特征不同取值時(shí)屬于某類(lèi)地物的可能性程度[13]。考慮到不同數(shù)據(jù)源獲取信息的不確定性,本文中選取P1=0.02,P2=0.98來(lái)表示實(shí)際情況中不確定程度的下限和上限。與基本DS信任分配函數(shù)相比,尖τ型信任分配函數(shù)的優(yōu)勢(shì)在于:
(1)對(duì)地物特性進(jìn)行直方圖統(tǒng)計(jì)可得,尖τ型分布更符合實(shí)際地物類(lèi)別的分布。
(2)模糊類(lèi)別A∪B,將無(wú)法準(zhǔn)確分類(lèi)的地物點(diǎn)歸為模糊類(lèi)別更符合實(shí)際情況,能有效提高分類(lèi)精度。
(3)軟閾值使得DS理論在處理不確定性問(wèn)題時(shí)發(fā)揮更好的優(yōu)勢(shì)。
圖1 尖τ型信任分配函數(shù)曲線
均值濾波是一種線性空間濾波,可以均等地對(duì)鄰域中的每個(gè)像素點(diǎn)進(jìn)行處理。本文在使用尖τ型信任分配函數(shù)對(duì)地物場(chǎng)景進(jìn)行分類(lèi)時(shí)引入模板半徑為3的圓形區(qū)域均值濾波,用于消除部分存在于某一類(lèi)地物場(chǎng)景中表示其他類(lèi)地物的孤立像素點(diǎn),比如草地中存在的裸地點(diǎn)會(huì)被錯(cuò)分為道路類(lèi)地物,應(yīng)用圓形區(qū)域均值濾波可以有效減少錯(cuò)分率,提高分類(lèi)精度。
本文實(shí)驗(yàn)采用兩組LiDAR數(shù)據(jù)集,由TopoSys Falcon II系統(tǒng)拍攝,均經(jīng)過(guò)預(yù)處理,空間分辨率為0.5 m。數(shù)據(jù)集1和數(shù)據(jù)集2尺寸分別為300×300像素和220×300像素。
為說(shuō)明本文方法應(yīng)用于LiDAR數(shù)據(jù)地物分類(lèi)時(shí)的有效性,使用基本DS證據(jù)理論方法和正態(tài)分布DS證據(jù)理論方法處理實(shí)驗(yàn)數(shù)據(jù)集,并將其實(shí)驗(yàn)結(jié)果與本文方法應(yīng)用于同一數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果作對(duì)比。圖2為實(shí)驗(yàn)所使用的數(shù)據(jù)集1,圖3為實(shí)驗(yàn)數(shù)據(jù)集2。
圖2 LiDAR數(shù)據(jù)集1
圖3 LiDAR數(shù)據(jù)集2
本文提出的尖τ型DS方法與基本DS方法相比,實(shí)驗(yàn)結(jié)果更接近人工解譯真實(shí)值。在使用信任分配函數(shù)對(duì)像素點(diǎn)進(jìn)行分類(lèi)時(shí),某個(gè)區(qū)域內(nèi)可能會(huì)存在代表其他地物類(lèi)別的孤立像素點(diǎn)。實(shí)際地物分類(lèi)中,樹(shù)木區(qū)域出現(xiàn)的混淆主要是激光無(wú)法穿透茂密樹(shù)冠區(qū)域?qū)е屡c建筑物區(qū)域產(chǎn)生的混淆;草地區(qū)域的混淆主要是由于草地區(qū)域有部分裸地點(diǎn)的存在,本文在采用尖τ型模糊DS證據(jù)理論分類(lèi)過(guò)程中,引入模糊類(lèi)別能夠?qū)ι鲜龌煜c(diǎn)進(jìn)行所屬地物類(lèi)別的可能性分配,同時(shí)采用均值濾波算法對(duì)數(shù)據(jù)中的噪聲點(diǎn)進(jìn)行處理,可以有效提高分類(lèi)精度。
數(shù)據(jù)集1實(shí)驗(yàn)結(jié)果如圖4所示。圖4(d)為人工解譯真實(shí)值圖像,由人工對(duì)比可見(jiàn)光圖像逐個(gè)像素分類(lèi)得到,作為標(biāo)準(zhǔn)用來(lái)評(píng)判分類(lèi)結(jié)果的準(zhǔn)確性和有效性。
圖4 實(shí)驗(yàn)結(jié)果圖
表1為本文方法應(yīng)用于數(shù)據(jù)集1時(shí)的混淆矩陣,根據(jù)相關(guān)計(jì)算公式可得,Kappa系數(shù)為85.93 %,表明本文分類(lèi)算法結(jié)果與實(shí)際地物具有比較高的一致性,因此該分類(lèi)模型能夠滿(mǎn)足實(shí)際要求。
表1 數(shù)據(jù)集1混淆矩陣
表2為數(shù)據(jù)集1利用基本DS證據(jù)理論和本文方法的分類(lèi)精度對(duì)比,表中S-DS為基本DS證據(jù)理論方法,F-DS+F為正態(tài)分布DS證據(jù)理論采用均值濾波方法。分析數(shù)據(jù)可得本文方法能夠在有效提高建筑物、草地類(lèi)分類(lèi)精度的同時(shí),顯著提高了樹(shù)木類(lèi)的分類(lèi)精度,平均分類(lèi)精度由85.41 %提升到89.50 %,提高4.09 %。
表2 數(shù)據(jù)集1分類(lèi)結(jié)果精度(%)
表3為本文方法與參考文獻(xiàn)[14]中不同方法應(yīng)用在同一數(shù)據(jù)集的算法復(fù)雜度對(duì)比,通過(guò)算法運(yùn)行時(shí)間相比,參考文獻(xiàn)[14]中算法運(yùn)行時(shí)間最快的為ICM-MRF方法,運(yùn)行時(shí)間為21.65 s,而本文方法僅為0.28 s,時(shí)間縮短了98.70 %,有效提高了算法效率,因此本文方法能夠有效應(yīng)用于實(shí)時(shí)性要求較高的場(chǎng)景中。
表3 幾種算法運(yùn)行時(shí)間對(duì)比
圖5為本文方法應(yīng)用于數(shù)據(jù)集的2實(shí)驗(yàn)結(jié)果圖。圖5(d)為人工解譯真實(shí)值圖像,對(duì)比結(jié)果圖發(fā)現(xiàn)本文方法分類(lèi)結(jié)果最接近實(shí)際地物類(lèi)型場(chǎng)景。
圖5 實(shí)驗(yàn)結(jié)果圖
表4、表5、表6分別為本文方法應(yīng)用于數(shù)據(jù)集2的混淆矩陣、實(shí)驗(yàn)結(jié)果精度表和算法運(yùn)行時(shí)間對(duì)比。數(shù)據(jù)集2平均分類(lèi)精度由82.38 %提高到88.64 %,提高了6.26 %;算法運(yùn)行時(shí)間僅為0.26s,與參考文獻(xiàn)[14]中運(yùn)行速度最快算法相比運(yùn)行時(shí)間縮短了98.02 %,Kappa系數(shù)為84.80 %,表明本文分類(lèi)算法結(jié)果與實(shí)際地物具有較高的一致性,并且算法有比較好的魯棒性。
表4 數(shù)據(jù)集2混淆矩陣
表5 數(shù)據(jù)集2分類(lèi)結(jié)果精度(%)
表6 幾種算法運(yùn)行時(shí)間對(duì)比
本文提出一種基于尖τ型信任分配函數(shù)的快速地物分類(lèi)方法,并且在兩組數(shù)據(jù)集上驗(yàn)證本文方法的有效性。結(jié)論如下:(1)構(gòu)造了一種新的信任分配函數(shù),有效協(xié)調(diào)四種分類(lèi)特征的分布合成方法;(2)解決了現(xiàn)有算法在復(fù)雜地物分類(lèi)場(chǎng)景中實(shí)時(shí)性較低的問(wèn)題?;诂F(xiàn)有工作基礎(chǔ),下一步研究需構(gòu)造各分類(lèi)特征的可能性分布及其合成規(guī)則,構(gòu)建基于可能性分布合成推理的LiDAR數(shù)據(jù)地物分類(lèi)模型。