楊致賢 樊仲謀 楊森 葉芊 吳翠溝
(福建農(nóng)林大學(xué),福州,350002)
城市森林資源對(duì)維持城市生態(tài)環(huán)境平衡具有不可替代的作用,對(duì)城市森林進(jìn)行監(jiān)測管理是推行可持續(xù)發(fā)展觀的重要工作環(huán)節(jié)[1-2]。樹種分類識(shí)別,是森林資源經(jīng)營管理、生物多樣性監(jiān)測評(píng)價(jià)的重要工作基礎(chǔ)。傳統(tǒng)意義上的人工調(diào)查樹種分類識(shí)別,工作效率低、調(diào)查周期長[3],難以滿足森林資源管理的技術(shù)要求。而激光點(diǎn)云數(shù)據(jù),能夠在較大尺度提供綜合性強(qiáng)的樹木信息參數(shù),如樹木相對(duì)聚類特征、結(jié)構(gòu)特征、紋理特征等,因此應(yīng)用激光雷達(dá)(LiDAR)點(diǎn)云數(shù)據(jù)的樹種分類是當(dāng)前樹種分類研究的熱門[4]。
近年來,支持向量機(jī)(SVM)[5]、隨機(jī)森林(RF)[6]、條件推斷森林(CF)模型[7]、卷積神經(jīng)網(wǎng)絡(luò)(CNN)[8]等機(jī)器學(xué)習(xí)算法,被廣泛應(yīng)用于激光雷達(dá)數(shù)據(jù)樹種分類研究。用于分類的特征參數(shù),涵蓋了紋理特征、點(diǎn)云結(jié)構(gòu)信息[9]、冠形結(jié)構(gòu)參數(shù)、單木特征、顏色特征等。從已有研究結(jié)果看,冠形結(jié)構(gòu)特征和點(diǎn)云結(jié)構(gòu)特征,多依賴于地基三維激光掃描儀,其工作效率較低。在最優(yōu)特征參數(shù)的研究方面,已有研究認(rèn)為,選擇高質(zhì)量的分類指標(biāo)比增加分類指標(biāo)數(shù)量更為重要[10]。在機(jī)載激光雷達(dá)樹種識(shí)別的研究方面,機(jī)器學(xué)習(xí)的分類準(zhǔn)確度,優(yōu)于傳統(tǒng)的監(jiān)督分類和無監(jiān)督分類[11];但由于研究對(duì)象和分類系統(tǒng)等原因,且單一算法會(huì)對(duì)部分指標(biāo)產(chǎn)生偏好,導(dǎo)致同一種算法對(duì)于不同樹種的分類效果,在精確度方面的表現(xiàn)存在明顯的差異性[12],目前尚不能提出一個(gè)能適應(yīng)各種環(huán)境及樹種的最優(yōu)分類器。隨著各種分類器在樹種識(shí)別中應(yīng)用的普及,針對(duì)結(jié)構(gòu)復(fù)雜、郁閉度高的復(fù)雜森林環(huán)境,開始嘗試將兩種或多種分類模型進(jìn)行組合,使用組合分類器進(jìn)行樹種分類研究,如將K最近鄰模型(K-NN)、支持向量機(jī)、分析回歸樹(CART)、隨機(jī)森林等模型融合,建立面向?qū)ο蟮慕M合分類器,對(duì)樹種識(shí)別結(jié)果進(jìn)行驗(yàn)證,總體精度和卡帕(Kappa)系數(shù)均優(yōu)于單一模型算法[13]。
為此,本研究選擇堆疊(Stacking)融合模型作為分類器,對(duì)福州市三江口生態(tài)公園激光雷達(dá)點(diǎn)云數(shù)據(jù)進(jìn)行重采樣、去噪、漸進(jìn)三角網(wǎng)濾波等預(yù)處理;應(yīng)用分水嶺算法進(jìn)行單木分割,對(duì)單木分割操作后的樹木點(diǎn)云提取地徑、樹高、枝下高、冠幅面積、冠高、胸徑和95%百分位高度7種樹木特征參數(shù);使用堆疊融合模型應(yīng)用激光雷達(dá)數(shù)據(jù)參數(shù)因子進(jìn)行樹種分類,分類結(jié)果與常用的支持向量機(jī)、隨機(jī)森林、K最近鄰模型3種模型分類結(jié)果進(jìn)行對(duì)比,分析堆疊融合模型應(yīng)用點(diǎn)云數(shù)據(jù)進(jìn)行樹種分類的準(zhǔn)確度、卡帕系數(shù)、精確率、召回率等;旨在為優(yōu)化單一分類器的樹種分類精度提供參考。
研究區(qū)域?yàn)楦V菔腥谏鷳B(tài)公園,位于福州市閩江北巷西南岸沿岸(地理中心坐標(biāo)26°1′N、119°38′E),綠地面積達(dá)126.2 hm2。園區(qū)內(nèi)樹木種類繁多,有豐富的優(yōu)勢樹種,包括水杉(Metasequoiaglyptostroboides)、小葉榕(Ficusconcinna)、大葉榕(Ficusstipulosa)、樸樹(Celtissinensis)、南洋杉(Araucariacunninghamii)以及其他名貴樹種,具有較高的研究價(jià)值。
試驗(yàn)數(shù)據(jù)獲取由科衛(wèi)泰的六旋翼無人機(jī)KWT-X6L-15搭載RIEGL VUX-1UAV三維激光掃描儀,于2021年6月份采集完成。為驗(yàn)證點(diǎn)云數(shù)據(jù)提取參數(shù)滿足試驗(yàn)要求,本研究隨機(jī)選取10%試驗(yàn)樹木,獲取地徑地面數(shù)據(jù),用于點(diǎn)云數(shù)據(jù)樹木參數(shù)提取的驗(yàn)證。地徑真實(shí)值獲取,選擇樹干距地面0.1 m處,使用圍尺測量。
無人機(jī)主要參數(shù):空心質(zhì)量(10.0±0.2)kg、標(biāo)準(zhǔn)起飛質(zhì)量(21.0±0.2)kg、極限懸停載荷18 kg、最大抗風(fēng)能力18 m/s、最大爬升速度5 m/s、最大下降速度2 m/s、相對(duì)飛行高度3 000 m、工作環(huán)境溫度-30~55 ℃、圖傳距離20 km、地面站控制距離、20 km。
三維激光掃描儀主要參數(shù):掃描視場角0~330°、角度分辨率0.001°、發(fā)射頻率550 kHz、工作溫度范圍0~40°、輸入電壓11~32 V、功率50 W。
根據(jù)三江口生態(tài)公園野外樹木調(diào)查,選取園區(qū)內(nèi)8種樹木作為研究對(duì)象,激光雷達(dá)數(shù)據(jù)的試驗(yàn)樹種:水杉(Metasequoiaglyptostroboides)57株、小葉榕(Ficusconcinna)58株、大葉榕(Ficusstipulosa)58株、樸樹(Celtissinensis)56株、洋紫荊(Bauhiniablakeana)58株、南洋杉(Araucariacunninghamii)53株、桂花樹(Oleafragrans)59株、大腹木棉(Ceibaspeciosa)45株,總共樣本數(shù)444株。
由于機(jī)載激光雷達(dá)飛行環(huán)境的不確定性、實(shí)驗(yàn)儀器的精度等因素,獲取的點(diǎn)云數(shù)據(jù)量大且復(fù)雜,需要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,提高后續(xù)點(diǎn)云數(shù)據(jù)處理效率;數(shù)據(jù)預(yù)處理操作使用LiDAR360激光雷達(dá)點(diǎn)云數(shù)據(jù)處理分析軟件完成。
①重采樣。點(diǎn)云數(shù)據(jù)冗余會(huì)增加樹木參數(shù)提取的難度,為了提高數(shù)據(jù)處理效率,使用LiDAR360激光雷達(dá)點(diǎn)云數(shù)據(jù)處理分析軟件對(duì)原始數(shù)據(jù)進(jìn)行重采樣處理,減少冗余點(diǎn)云。與四叉樹法相比,八叉樹[14]遍歷點(diǎn)云數(shù)據(jù)效率更高、速度更快,且便于點(diǎn)云數(shù)據(jù)管理,因此本研究選用八叉樹法進(jìn)行重采樣。
②去噪。由于試驗(yàn)數(shù)據(jù)獲取儀器的精度以及森林公園的環(huán)境復(fù)雜性,獲取的點(diǎn)云數(shù)據(jù)會(huì)產(chǎn)生不可避免的噪聲,影響樹木信息提取。因此,先需要對(duì)點(diǎn)云數(shù)據(jù)進(jìn)行降噪。本研究使用依據(jù)空間分布算法去噪,每個(gè)點(diǎn)與K相鄰點(diǎn)的平均距離在設(shè)定閾值以外,則當(dāng)作噪點(diǎn)去除。為了提高數(shù)據(jù)準(zhǔn)確性,需要通過目視手動(dòng)去除部分噪聲。
③漸進(jìn)加密三角網(wǎng)濾波。數(shù)字表面模型、數(shù)字高程模型、冠層高度模型的生成,要求地面點(diǎn)與非地面點(diǎn)的分離盡可能準(zhǔn)確。通常原始數(shù)據(jù)中地面點(diǎn)占比約60%,如果不能準(zhǔn)確分離地面點(diǎn)與非地面點(diǎn),會(huì)導(dǎo)致樹簇分割錯(cuò)誤。為提高分割效率和準(zhǔn)確性,本研究使用漸進(jìn)加密三角網(wǎng)濾波方法去除地面點(diǎn)。
④生成冠層高度模型。原始數(shù)據(jù)需要分離地面點(diǎn)、提取樹木點(diǎn)。以數(shù)字表面模型(DSM)減去數(shù)字高程模型(DEM),可得冠層高度模型(CHM,見圖1)。完成地面點(diǎn)分離,使用反距離加權(quán)插值方法[15]分別對(duì)地面點(diǎn)和非地面點(diǎn)插值后,生成數(shù)字高程模型、數(shù)字表面模型。選擇合適的插值網(wǎng)格分辨率,降低后續(xù)利用目標(biāo)檢測算法檢測樹頂點(diǎn)的漏檢率,減少樹冠邊緣信息缺失。本研究設(shè)置,圖像網(wǎng)格分辨率為1.5 m、插值半徑為2.5 m、權(quán)重為1.5、最少插值點(diǎn)數(shù)為25個(gè)。
圖1 冠層高度模型示意圖
⑤單木分割。點(diǎn)云數(shù)據(jù)單木分割是樹木參數(shù)提取的必要工作。機(jī)載激光雷達(dá)獲取的樹木點(diǎn)云數(shù)據(jù)進(jìn)行單木分割,通常有兩種方法,一種是直接依據(jù)點(diǎn)云通過聚類等方法進(jìn)行分割,另一種是依據(jù)冠層高度模型進(jìn)行分割,如局部極值法、多尺度分割法、分水嶺算法[16]。本研究對(duì)比了兩類分割方法,其中依據(jù)點(diǎn)云聚類分割法正確分割率為77.5%,而依據(jù)分水嶺算法分割準(zhǔn)確度為79.1%,略優(yōu)于前者。因此,本研究選擇依據(jù)分水嶺算法對(duì)點(diǎn)云數(shù)據(jù)進(jìn)行單木分割。該方法將監(jiān)測的局部最小值設(shè)為固定值進(jìn)行分水嶺轉(zhuǎn)換,剔除非樹冠點(diǎn)。點(diǎn)云冠層高度模型中的樹冠邊緣梯度值相對(duì)較大,樹冠頂部梯度值相對(duì)較小。使用形態(tài)學(xué)梯度公式改善樹木邊緣,實(shí)現(xiàn)閉合邊緣圖形。
g(f)=(f⊕b)-(f?b);式中的f為輸入的冠層高度模型圖像、⊕為形態(tài)學(xué)“膨脹”運(yùn)算、?為形態(tài)學(xué)“腐蝕”運(yùn)算、b為結(jié)構(gòu)元素。
邊緣檢測生成的樹冠邊緣閉合圖形可以構(gòu)建分割樹冠的范圍,使用形態(tài)學(xué)開閉運(yùn)算重構(gòu)冠層高度模型形態(tài)學(xué)梯度[17],去除噪聲點(diǎn),對(duì)區(qū)域內(nèi)的極大值與極小值進(jìn)行校正。為避免過分分割,需要對(duì)冠層高度模型的形態(tài)學(xué)進(jìn)行開閉運(yùn)算,重構(gòu)冠層高度模型形態(tài)學(xué)梯度。公式:f*b=?rec(f*b,f)、f·b=Ψrec(f·b,f);式中的*為形態(tài)學(xué)中的開運(yùn)算、·為形態(tài)學(xué)中的閉運(yùn)算、f為輸入的柵格圖像、b為結(jié)構(gòu)元素、?rec為膨脹后重構(gòu)圖像、Ψrec為腐蝕后重構(gòu)圖像。
提取冠層高度模型標(biāo)記。從研究區(qū)域的局部極小值點(diǎn)開始,對(duì)所有極小值小于或等于d的集水盆都被分配唯一標(biāo)識(shí)記錄,設(shè)當(dāng)前值為d+1,若d+1的鄰域已經(jīng)有標(biāo)記的像元點(diǎn),則將d+1與此標(biāo)記點(diǎn)劃分為一類標(biāo)記;若其鄰域內(nèi)沒有一個(gè)像元被標(biāo)記,則將記為一個(gè)新標(biāo)記點(diǎn),重定一個(gè)新的集水盆。重復(fù)該步驟,直至研究區(qū)的每一個(gè)像元都被標(biāo)注,完成分水嶺變換。通過分水嶺變換,得到圍繞樹頂點(diǎn)周圍的封閉的、連貫的樹冠輪廓。單木分割得到的典型樹種點(diǎn)云對(duì)比見圖2。
圖2 典型樹種點(diǎn)云對(duì)比圖
(1)樹高提取。本研究用狄洛尼(地形擬合方法[18])生成不規(guī)則三角網(wǎng)(TIN),將數(shù)字表面模型獲取的樹頂點(diǎn)坐標(biāo)對(duì)應(yīng)至不規(guī)則三角網(wǎng)中提取的地面點(diǎn)高程,樹頂點(diǎn)與地面點(diǎn)高程值之差為樹高。
ZG=z1-[(xi-x1)(y21z31-y31z21)+(yi-y1)(z21x31-
z31x21)]/(x21y31-x31y21);
H=zi-ZG。
式中:(xi,yi,zi)為樹頂點(diǎn)坐標(biāo);ZG為樹頂點(diǎn)對(duì)應(yīng)的地面點(diǎn)高程;xj1、yj1、zj1,分別為xj-x1、yj-y1、zj-z1,j=2、3;H為樹木高度。
(2)冠幅提取。Edelsbrunne et al.[19-20]提出散點(diǎn)輪廓(Alpha Shape)算法用作點(diǎn)云的邊界劃分,即有一點(diǎn)云集P,存在一個(gè)半徑為α的圓點(diǎn)云集P內(nèi)的任意兩點(diǎn),且點(diǎn)云集P內(nèi)其他點(diǎn)不在該圓域內(nèi),則圓上兩點(diǎn)的連線即為點(diǎn)云輪廓的一條邊(見圖3);以參數(shù)α為半徑的圓,遍歷點(diǎn)云邊界后,該圓運(yùn)動(dòng)的軌跡即為點(diǎn)云集的輪廓。①將樹木點(diǎn)云投影到X-Y平面,在平面上的點(diǎn)云表示樹冠形狀,首先將點(diǎn)云的Z坐標(biāo)值設(shè)置為0;②調(diào)整α參數(shù),使得樹木邊界形成閉合圖形,且能夠表現(xiàn)樹冠結(jié)構(gòu)特征;③計(jì)算樹木邊界點(diǎn)云集M至樹干的距離,求其平均值即為樹木的冠幅。
di=[(xi-x0)2+(yi-y0)2]1/2;
式中:xi、yi為點(diǎn)云集M的任意一點(diǎn),x0、y0為樹木基點(diǎn)坐標(biāo),Dc為樹木冠幅,n為點(diǎn)云集M的數(shù)量。
圖3 散點(diǎn)輪廓提取示意圖
(3)冠幅面積和冠長提取。冠幅面積是指樹木樹冠垂直投影到地面上的平面面積。本研究中,樹木冠幅面積的提取,采用易康(eCongition)軟件與目視解譯相結(jié)合的方法進(jìn)行。提取冠幅面積主要包括2個(gè)步驟:①使用易康軟件,依據(jù)多尺度算法進(jìn)行樹冠的初始自動(dòng)分割;②將切割結(jié)果圖導(dǎo)入地理信息系統(tǒng)軟件(ArcGIS)中,使用目視解譯法將未處理好的部分進(jìn)行手工去除,獲得最佳的提取效果。
(4)枝下高與地徑面積提取。枝下高獲取方法——①從樹干底部開始,將樹木的點(diǎn)云分為n層,層高設(shè)定為h(本研究選擇5 cm),逐層以該層內(nèi)點(diǎn)云為對(duì)象進(jìn)行地徑(Dg)擬合,依次存儲(chǔ)為Dg,1、Dg,2、…、Dg,n。②依次計(jì)算第n層與第n-1層之間的直徑比,根據(jù)以下條件選擇合適閾值(K),最終判斷樹干高度,即:若(Dg,n/Dg,n-1) 根據(jù)地徑面積的計(jì)算,參照地徑數(shù)據(jù),采用圓面積公式計(jì)算并記錄。 (5)地徑提取。從點(diǎn)云塊中采集的樹木點(diǎn)云,依次獲取樹木的地徑提取值?;驹?①1.5 m以下的樹木點(diǎn)云屬于樹干,但由于實(shí)際情況,樹木生長很少與地面垂直,如果直接將樹干點(diǎn)云投影到地面并擬合,提取地徑,則會(huì)導(dǎo)致獲取的地徑值大于真實(shí)值;森林資源調(diào)查,地徑通常選測樹木0.1~0.2 m高度處測量[21];本研究依次選取每棵樹木高程在0.1~0.2 m的點(diǎn)云,并對(duì)其進(jìn)行二維平面投影。②樹干點(diǎn)云高差值較小時(shí),點(diǎn)云投影可近似為圓,因此,按照投影結(jié)果依次對(duì)每棵樹的樹干點(diǎn)云采用最小二乘擬合,并將擬合的結(jié)果提取每棵樹木的地徑大小,記為Dg,i(i=1、2、3、…、n),n為樹木的棵數(shù)。 圖4 枝下高提取示意圖 (6)95%百分位高度提取。對(duì)點(diǎn)云數(shù)據(jù)進(jìn)行高程歸一化,單木點(diǎn)云按高度值從最低到最高進(jìn)行排序,然后提取總高度95%處的高度值。 (7)胸徑提取。胸徑通常指的是樹干距離地面1.3 m處的直徑值。本研究采用分片裁剪的方法,在矩陣實(shí)驗(yàn)室(MATLAB)中提取胸徑。首先對(duì)提取的單木樹干點(diǎn)云進(jìn)行切片分層,并投影到水平面,使用隨機(jī)抽樣一致性(RANSAC)[22]算法擬合成圓;然后將圓心逐一連接,對(duì)連接線進(jìn)行平滑處理,用平滑后的圓心重新擬合一個(gè)圓,計(jì)算出其直徑即得胸徑值。 本研究以地徑參數(shù)值誤差分析為例,隨機(jī)選取10%試驗(yàn)樹木進(jìn)行地面數(shù)據(jù)獲取,測得地徑真實(shí)值,檢驗(yàn)點(diǎn)云數(shù)據(jù)提取的參數(shù)是否符合試驗(yàn)要求。通過地面樣本數(shù)據(jù)對(duì)比,試驗(yàn)樹木地徑參數(shù)提取平均誤差為5.27%(見表1),滿足試驗(yàn)要求。 表1 提取激光雷達(dá)數(shù)據(jù)樹木地徑的參數(shù)值誤差 本研究使用堆疊融合模型對(duì)提取的樹木幾何參數(shù)進(jìn)行分類。集成學(xué)習(xí)是將多種機(jī)器學(xué)習(xí)模型融合在一起,融合模型的算法包括引導(dǎo)聚集算法(Bagging)、提升算法(Boosting)、混合算法(Blending)、堆疊算法(Stacking)[23]等。堆疊算法是異質(zhì)融合,將兩個(gè)或多個(gè)不同的弱分類器結(jié)合起來,生成一個(gè)性能優(yōu)于其組成的分類器的模型。堆疊融合模型過程見圖5。 圖5 堆疊融合模型示意圖 本研究選用5折交叉法[24]驗(yàn)證得到的分類結(jié)果,其中4折用于訓(xùn)練,1折用于驗(yàn)證。同時(shí)在矩陣實(shí)驗(yàn)室中分別使用支持向量機(jī)、K最近鄰模型、隨機(jī)森林進(jìn)行分類,與堆疊融合模型分類效果進(jìn)行對(duì)比分析。取80%的試驗(yàn)樹木作為樣本進(jìn)行分類器訓(xùn)練、20%的樹木數(shù)據(jù)作為驗(yàn)證樣本,得到樹種分類結(jié)果后,選擇檢驗(yàn)樣本對(duì)結(jié)果進(jìn)行精度評(píng)價(jià),與堆疊融合模型分類結(jié)果對(duì)比。 以激光雷達(dá)點(diǎn)云數(shù)據(jù)多參數(shù)因子,選取樹高、地徑、枝下高、冠幅面積、冠高、胸徑、95%百分位高度7個(gè)單木特征參數(shù)組成影響因素因子集,以研究區(qū)樹種作為評(píng)價(jià)指標(biāo),用測試集測試訓(xùn)練好的分類模型實(shí)現(xiàn)精度驗(yàn)證分析分類結(jié)果,獲得混淆矩陣、準(zhǔn)確度、卡帕系數(shù)、精確率、召回率評(píng)價(jià)指標(biāo),評(píng)價(jià)堆疊融合模型、支持向量機(jī)模型、K最近鄰模型、隨機(jī)森林模型樹種分類的準(zhǔn)確度和可靠性(見圖6、表2)。 由表2可見:堆疊融合模型分類結(jié)果中,水杉與南洋杉容易發(fā)生誤分,樸樹和洋紫荊容易發(fā)生誤分。其中,水杉對(duì)南洋杉的誤分率8.7%,即8.7%水杉誤分為南洋杉,南洋杉對(duì)水杉的誤分率為9.6%;樸樹對(duì)洋紫荊誤分率為12.5%,洋紫荊對(duì)樸樹誤分率為5.2%。 表2 不同模型對(duì)激光雷達(dá)點(diǎn)云多參數(shù)因子樹種分類結(jié)果 橫坐標(biāo)軸為測試集的真實(shí)類,縱坐標(biāo)軸為測試樣品的預(yù)測類。主對(duì)角線數(shù)據(jù)為真實(shí)類與預(yù)測類一致,其數(shù)值為分類準(zhǔn)確的樹木數(shù)量。主對(duì)角線外則為分類錯(cuò)誤,其數(shù)值為分類錯(cuò)誤數(shù)量。 本研究使用無人機(jī)載激光雷達(dá)獲取樹木點(diǎn)云數(shù)據(jù)作為數(shù)據(jù)源,提取樹高、枝下高、冠高、冠幅、地徑、胸徑、95%百分位高度,使用Stacking融合模型對(duì)樹種進(jìn)行分類得到分類精度,并使用K最近鄰模型、隨機(jī)森林模型、支持向量機(jī)模型3種常用模型進(jìn)行樹種分類,與Stacking融合模型分類結(jié)果進(jìn)行對(duì)比,結(jié)果表明:①堆疊融合模型樹種分類的效果,整體優(yōu)于K最近鄰模型、隨機(jī)森林模型、支持向量機(jī)模型3種常用模型,其分類精度可達(dá)79.72%,K最近鄰模型分類效果最差(分類準(zhǔn)確度只有60.14%)。②堆疊融合模型對(duì)水杉、小葉榕、樸樹、南洋杉的識(shí)別效果更好,對(duì)水杉分類精確率達(dá)到90.91%,對(duì)小葉榕、樸樹、南洋杉的分類精確率也能達(dá)到80%。③不同樹種分類模型對(duì)同一種類樹木的分類精度,存在明顯差異;在本研究所選試驗(yàn)樹種中,堆疊融合模型適用性更高。 由于研究區(qū)內(nèi)各樹種數(shù)量較少,導(dǎo)致本研究所選樣本量偏少。堆疊融合模型分層訓(xùn)練過程需要大量訓(xùn)練樣本支持,若進(jìn)一步提高分類效果,滿足更復(fù)雜的森林樹種識(shí)別需求,需要增加訓(xùn)練樣本量。1.4 樹木特征參數(shù)提取值誤差檢驗(yàn)
2 結(jié)果與分析
3 結(jié)論