程曉菲,武 剛
(北京林業(yè)大學信息學院,北京 100089)
單木是組成陸地生態(tài)系統(tǒng)的最小喬木實體。隨著新一代信息技術(shù)特別是遙感影像處理技術(shù)的發(fā)展與普及,高效采集海量單木信息建立單木數(shù)據(jù)庫,是實現(xiàn)精準林業(yè)特別是城市林業(yè)精準集約化管理的基礎(chǔ),也是新一代智慧林業(yè)發(fā)展的目標[1-4]。事實上,國內(nèi)一些個別的林業(yè)領(lǐng)域已實現(xiàn)單木集約管理,如古樹名木、北京市楊柳雌株精準管理、果樹管理等[5-6],但這些主要通過傳統(tǒng)的地面調(diào)查實現(xiàn),效率低且工作量巨大。基于遙感影像的單木提取是實現(xiàn)單木數(shù)據(jù)庫高效建設(shè)的關(guān)鍵技術(shù),其中基于遙感影像的單木定位(探測)是基礎(chǔ)。
近年來遙感平臺和相應(yīng)的處理技術(shù)發(fā)展很快[7],雖然主動遙感技術(shù)(如激光雷達LiDAR等)已用于單木檢測(包括單木位置、樹高等)和反演模型建立等方面研究[8],但其成本較高且不適用于大規(guī)模獲取。而基于高分辨率光學遙感影像的單木提取方法,因為其具有技術(shù)基礎(chǔ)深厚、影像尺度大且易得性高、便于推廣應(yīng)用等特點,依然是研究熱點[9-10]。大量關(guān)于被動遙感的研究表明:遙感數(shù)據(jù)源[11]、季節(jié)及樹木生長狀況[12]、定位方法選擇[13]等均為影響單木定位效果的重要因素。針對單木定位問題,學者們提出了以局部最大值法[9]為代表的探測單木樹尖的直接定位方法,以及單木樹冠探測與繪制(ITCD,Individual Tree Crown Detection and Delineation)等間接定位方法[14-15],如各種改進的分水嶺法[16-17]、谷底跟蹤法[18]、區(qū)域生長法[19]和標記點過程[3]。近年來學者們也嘗試各種定位新方法,如爬峰法[20]、Snake模型[21-22]、機器學習方法[23]等。但目前單木定位方法精度難以達到實用要求,還沒有一種方法能夠適應(yīng)各種林分[24-25]。對于ITCD而言,其主要問題是單木排列緊密及冠層交錯均會導致單個樹冠內(nèi)、重疊樹冠間出現(xiàn)過分割或欠分割問題,導致單木定位產(chǎn)生誤判和漏判問題[26-27],因此需要探究更高效且穩(wěn)定的單木定位新方法。
Chan等[28]提出了一種基于區(qū)域活動輪廓模型的圖像分割方法,即Chan-Vese模型(簡稱CV模型)。CV模型利用像元灰度區(qū)域的統(tǒng)計信息,能夠較好處理模糊邊界或者離散狀邊界的目標[29],已廣泛應(yīng)用于醫(yī)學、農(nóng)業(yè)等領(lǐng)域[30-33]。但是,CV模型應(yīng)用時,初始輪廓的大小、位置及形狀,均影響其分割的效率和結(jié)果[34]。實際應(yīng)用中,通常采用人工介入的方法將包裹目標物體的圓或矩形作為初始輪廓,其效率低且在一定程度上忽略了圖片的視覺特征[35]。
因此,本研究基于樹木的形態(tài)學及其影像光譜特征,在自動提取初始輪廓的基礎(chǔ)上,通過對多個實驗區(qū)高分辨率衛(wèi)星影像進行多方法比較實驗分析,探討基于CV模型的單木定位方法應(yīng)用效果。
首先選擇了北京林業(yè)大學及其附近的2個實驗區(qū),通過目視和實地測量,進行了初步試驗,并與河北文安界圍農(nóng)場、深圳寶安荔枝園、山東棲霞市蘋果園、浙江臨安青山湖綠道的4個實驗區(qū)實驗影像進行比較,具體的實驗影像數(shù)據(jù)及其參數(shù)如表1所示。試驗區(qū)1為北京市海淀區(qū)的東升八家郊野公園,主要樹種為針葉圓柏(Sabinachinensis),該地區(qū)樹木密度較高,樹冠重疊現(xiàn)象較為嚴重。裁剪的實驗影像1如圖1A中藍框區(qū)域所示,其中目視定位且實地驗證共有397棵參考單木。試驗區(qū)2為北京林業(yè)大學校園,裁剪的實驗影像6(如圖1F中藍框區(qū)域),該影像含有籃球場及其周邊,目視定位且實地驗證了24棵參考單木,其樹冠茂盛,重疊嚴重,樹種主要為闊葉的國槐(Sophorajaponica)和饅頭柳(Salixmatsudanavar.matsudanaf.umbraculifera)。它們分別代表現(xiàn)實單木存在的林分和非林分(四旁樹)兩種形式。
后續(xù)為了對比考察CV模型單木定位法對不同類型影像源的適用性及其定位效果,選擇了試驗區(qū)2的”北京二號”影像7(圖1G),以及目視定位可靠且代表不同類型(針葉林、闊葉林、經(jīng)濟林)的4幅林分影像2~5(圖1B—1E)[19,36-39]。
圖1 研究區(qū)實驗影像Fig.1 Experimental image of study area
一般單木定位(探測)的圖像預處理包括校正、配準、增強、樹木區(qū)域提取等環(huán)節(jié),它們是準確提取單木位置信息的基礎(chǔ)。本研究遙感影像已進行過校正和配準,實驗只涉及圖像增強和樹木區(qū)域提取2個環(huán)節(jié)。
為提高圖像的層次感,增強樹冠和非樹冠之間的差異,減少同一樹冠內(nèi)由于小樹枝及陰影引起的噪聲,采用高斯濾波方法增強圖像[14]。
樹木區(qū)域提取的目的是盡可能地剔除遙感影像中非樹木區(qū),如土壤、街道、房屋、操場、草地等,以保證定位處理方法僅作用于樹木區(qū)域。通常在高分辨率遙感影像中,采用歸一化植被指數(shù)(NDVI)用于掩膜運算。
采用綠度分割方法[24,40]:
dgreen=(R-G)/(R+G)。
(1)
其中:dgreen為綠度,R和G分別代表紅色波段和綠色波段光譜反射值。基于綠度統(tǒng)計直方圖,使用最大類間方差法(OTSU)確認閾值[41],去除小于閾值的像元點,以此將圖像中的道路、草地等無關(guān)信息剔除,獲取樹木區(qū)域圖像I。
1.3.1 初始輪廓提取
CV模型常用于獲取目標物體的精確輪廓,首先沿著物體邊緣大致設(shè)置一條閉合曲線,使其在約束條件下,朝著內(nèi)法線的方向移動,最終在目標邊界停止。在傳統(tǒng)方法中,通常采用基于人工交互的方式將其設(shè)置在目標邊緣。單木定位中,因樹冠數(shù)量諸多,手工設(shè)置初始輪廓工作繁重且不實用,宜采用自動化方法實現(xiàn)初始輪廓提取。根據(jù)樹冠頂點受太陽光照強度較大,在影像中通常具有較高的光譜反射值,而樹冠邊緣反射值較低[42],本研究通過計算影像中多個局部最大值區(qū)域并進行連通域標記,作為初始輪廓。其中,局部最大值區(qū)域是指連通且值相同的像元區(qū),其周圍像元值均小于區(qū)域的像元值。具體提取過程如下:
1)設(shè)樹木區(qū)域圖像I的像元(x,y)灰度值為G(x,y),其8鄰域內(nèi)像元灰度值為Gneigh(x,y),遍歷每個像元,則由公式(2)可得到一個二值圖A。
(2)
2)對二值圖A中的局部最大值區(qū)域采用4鄰域方法進行形態(tài)學連通域查找并標記[43],獲取初始輪廓標記圖C=C1∪C2∪…∪CL。其中,Ci為第i個連通域,Ci(x,y)=i,若記Ci在樹木區(qū)域圖像I中對應(yīng)的區(qū)域為Ωi,i=1,2,…,L,則Ω=Ω1∪Ω2∪…∪ΩL,即為CV模型演化的初始輪廓。
1.3.2 樹冠輪廓分割
基于CV模型對初始輪廓進行演化迭代,主要是通過輪廓曲線的能量函數(shù)值的不斷優(yōu)化完成。樹冠輪廓曲線由水平集函數(shù)φ(x,y,t)表達,曲線把圖像劃分為內(nèi)外兩個部分,c1和c2分別記為曲線內(nèi)部和外部的圖像像元平均值,將圖像的能量函數(shù)定義為:
(3)
其中:μ≥0、v≥0、λ1≥0、λ2≥0是各個能量項的權(quán)重系數(shù);x、y分別為圖像橫縱軸坐標;當曲線逼近樹冠邊緣時取值接近0,且c1=c2,此時曲線ci位于目標樹冠邊界。H(φ)和δ(φ)分別為Heaviside函數(shù)和Dirac函數(shù)的正則化表示,用于劃分演化區(qū)域,限定輪廓在演變過程中在零水平集函數(shù)附近取值,其表達式為:
(4)
(5)
式中,ε為數(shù)字運算選取的一個小正數(shù)(閾值)。
依據(jù)變分原理和梯度下降原理,對水平集函數(shù)φ求式(3)能量泛函極小化,得到其偏微分方程:
(6)
式中:v為能量項的權(quán)重系數(shù),φ0(x,y)為初始水平集函數(shù)。
式(6)可通過有限差分法求解,即設(shè)空間步長為h,時間步長為Δt,則得到迭代方程為[28]:
(7)
樹冠輪廓具體迭代計算步驟為:
①n=0,根據(jù)待分割圖Ω,建立初始水平集函數(shù)φ0(x,y),并根據(jù)式(3)構(gòu)造能量函數(shù);
②根據(jù)當前樹冠輪廓迭代結(jié)果φn,按照式(7)計算φn+1;
③若|φn+1-φn|≤ε(閾值),則N=n,轉(zhuǎn)步驟④,否則n=n+1,轉(zhuǎn)向步驟②;
④輸出最終輪廓(樹冠曲線)φN(x,y)。
1.3.3 單木位置計算
對上述分割樹冠輪廓二值圖φN(x,y)進行連通域查找,基于圖像幾何矩原理,用公式(8)計算其重心作為單木位置坐標(x,y)[44],連通域個數(shù)即為提取的單木數(shù)量。
(8)
其中:φN(x,y)為二值圖的像元值;C10和C01為圖像一階矩,分別表示樹冠輪廓x坐標值與像元灰度值乘積的累加和以及樹冠輪廓y坐標值與灰度值乘積的累加和;C00為圖像零階矩,表示樹冠輪廓像元灰度值的累加和。
影像1的局部影像機器定位與目視定位的對比結(jié)果見圖2,其中圖2B為CV模型定位結(jié)果與目視定位的對比,圖2C為標記分水嶺定位結(jié)果與目視定位的對比。
圖2 影像機器定位與目視定位對比Fig.2 Comparison between image machine positioning and visual positioning
以配有Intel Core(TM)i5、2.60GHz、12GB內(nèi)存、64位Windows 10操作系統(tǒng),利用PyCharm Community Edition 2018.3.5、Python編程語言及其OpenCV、MATLAB. Engine等組件開發(fā)的算法實驗平臺,對7幅影像以目視解譯數(shù)據(jù)作為參考,采用CV模型和3種傳統(tǒng)的主流單木定位方法(梯度分水嶺法、標記分水嶺法和局部最大值法)進行了實驗比較分析。
影像2的各算法實驗影像見圖3。其中圖3A—3D分別為圖像原圖、初始輪廓圖、CV模型樹冠輪廓圖以及基于CV模型的單木位置圖像。圖3E—3G為局部最大值法、梯度分水嶺法以及標記分水嶺的單木定位圖像??梢钥闯?,基于樹冠的光譜反射原理,初始輪廓大概標記了單木位置,并在此基礎(chǔ)上,進行水平集函數(shù)的構(gòu)建及迭代,使樹冠輪廓逐步收斂到目標邊緣,能夠較好地識別單木。相較于局部最大值的漏判,梯度分水嶺多棵單木誤識別為1棵,CV模型能夠較好地進行單木定位。7組實驗的單木位置精度評價見表2,CV模型均取得了最高匹配率。
在影像1排列緊密、大小均勻且排列較為規(guī)則的針葉林中,因其樹冠輻射值較高且分布較均勻,局部最大值在3種傳統(tǒng)方法中匹配率(M)最高,梯度分水嶺及標記分水嶺等傳統(tǒng)方法將多個小樹冠誤合并識別為1個樹冠,因此漏判率(Rom)較高;影像2~3中,樹冠大小不一且排列凌亂,局部最大值方法無法準確獲取單木位置,導致了一定程度的漏判和誤判,樹冠間無明顯區(qū)分,梯度分水嶺及標記分水嶺法易將樹冠誤分割為多部分, CV模型的準確率(Rmat)較高,并且誤判率(Rcom)較低,能夠較好地識別較小單木,處理漏判現(xiàn)象,具有一定的泛化效果。在影像4~7中,闊葉樹樹冠較大且樹冠重疊嚴重,傳統(tǒng)方法將樹冠誤分割為多個樹冠,出現(xiàn)了一定的過分割現(xiàn)象,也因此導致了較高的誤判率,CV模型較好地緩解了這一狀況,但存在一部分相鄰樹冠難以分割的情況,而總體匹配率效果較好。
圖3 影像2各算法實驗影像圖Fig.3 Image 2 experimental results of each algorithms
表2 單木位置精度評價
所有實驗影像的整體定位效果見表3,局部最大值方法因其受移動窗口因素影響較大,同一樹冠(特別是闊葉樹)中易產(chǎn)生多個局部最大值點,因此導致較高的誤判率(Rcom),平均為0.434。梯度分水嶺和標記分水嶺通過在原始圖像上分別計算圖像梯度函數(shù)及標記樹冠大概位置,在其基礎(chǔ)上進行分水嶺分割,容易產(chǎn)生過分割現(xiàn)象,誤判率較高。相較于其他3種定位方法,CV模型在7組影像實驗中均取得了最高的匹配率(M),平均高出其他方法約23%,綜合定位效果最好。在同一地區(qū)不同影像中(影像6~7),不同類型樹木中均具有較好的定位效果。但CV模型在樹木排列緊密區(qū)域,目視不清時,也容易存在一定的欠分割問題,導致漏判率較高(影像3~7)。影像6的局部區(qū)域?qū)嶒瀳D像見圖4。該區(qū)域樹冠緊密,CV模型將排列緊密樹冠誤認為同一個(圖4B),僅識別出1棵單木(圖4C)。
表3 整體單木定位精度
圖4 CV模型局部實驗圖像Fig.4 Local experimental image of CV model
本研究提出的CV模型單木定位法,首先利用樹木的形態(tài)學特征及其在影像中的光譜特征,自動設(shè)置初始輪廓;其次,進行基于水平集函數(shù)構(gòu)建及迭代,對樹冠輪廓進行演變;最終獲取單木位置。該方法基于圖像全局信息,利用曲線內(nèi)外的灰度均值而不是梯度信息進行分割,能夠在邊界模糊或梯度無意義的圖像中取得較好的分割效果,能夠快速準確地收斂到目標位置。實驗表明:該方法比其他3種方法(梯度分水嶺法、標記分水嶺法、局部最大值法)具有更高的匹配率,平均高出23%,且與影像源無關(guān),顯示了良好的泛化應(yīng)用潛力。
更全面地評價單木信息還需要進行更多方法(如區(qū)域增長、模板匹配、機器學習等)和更多影像的對比實驗。同時,實驗也表明,雖然CV模型的單木定位法一定程度上解決了單木樹冠識別的過分割及欠分割問題,綜合定位效果有所提高,但在郁閉度較高、目視都難以識別單木的情況下,仍存在一定的欠分割問題;后續(xù)可針對郁閉度差異進行單木定位實驗研究,探討其適用性。隨著機器學習方法在目標檢測方面的突破,新的單木定位方法值得期待。另外,結(jié)合多時像(春、夏、秋、冬)高分辨率影像的融合應(yīng)用技術(shù)的研究,或許對解決郁閉度高、單木難定位識別問題有所幫助。