徐隆鑫 ,孫永華 ,何仕俊 ,趙元銘 ,葉 淼
(1.首都師范大學(xué)資源環(huán)境與旅游學(xué)院,北京 100048;2.水資源安全北京試驗(yàn)室,北京 100048;3.教育部三維信息獲取與應(yīng)用重點(diǎn)試驗(yàn)室,北京 100048;4.核工業(yè)北京地質(zhì)研究院遙感信息與圖像分析技術(shù)國家級(jí)重點(diǎn)實(shí)驗(yàn)室,北京 100029)
我國正處于經(jīng)濟(jì)建設(shè)的高速發(fā)展時(shí)期,城市更新速度加快,不可避免地產(chǎn)生了大量的建筑垃圾,而我國當(dāng)前對(duì)建筑垃圾的處理仍處于初級(jí)階段,大量建筑垃圾被露天堆置或填埋,侵占了大量土地,同時(shí)也造成了資源的極大浪費(fèi)[1-2].對(duì)建筑垃圾進(jìn)行合理的分類,既可以提高建筑垃圾的綜合回收利用率,又可以進(jìn)一步改善生態(tài)環(huán)境質(zhì)量.
近些年來,針對(duì)建筑垃圾的分類研究有所增加.鄭龍海等[3]提出了一種基于機(jī)器視覺與稱重技術(shù)相結(jié)合的建筑垃圾自動(dòng)分類方法,實(shí)現(xiàn)了建筑垃圾中常見的木頭和磚石的自動(dòng)分類;Xiao等[4]基于木材、塑料和磚塊等6種常見類型建筑垃圾的光譜反射率特征,利用極限學(xué)習(xí)機(jī)和隨機(jī)森林算法完成了6種建筑垃圾的分類,并取得了較好的分類精度;Davis等[5]基于自動(dòng)識(shí)別不同材料的技術(shù),設(shè)計(jì)了一種深度卷積神經(jīng)網(wǎng)絡(luò),成功識(shí)別了7種典型建筑垃圾,識(shí)別準(zhǔn)確度高達(dá)94.0%.針對(duì)特定研究區(qū),上述分類方法往往需要大量的數(shù)據(jù)樣本,使得建筑垃圾分類工作的時(shí)效性受到限制.無人機(jī)遙感憑借其低成本、靈活機(jī)動(dòng)性強(qiáng)、操作簡單和起飛限制條件少等優(yōu)勢,已被廣泛地應(yīng)用于環(huán)境保護(hù)監(jiān)測[6-7]、工程測量[8-9]、地表植被分類識(shí)別[10-12]、生物量估算及生物多樣性監(jiān)測[13-14]、農(nóng)作物病蟲害監(jiān)測及產(chǎn)量估產(chǎn)[15-17]等多種領(lǐng)域.隨著無人機(jī)遙感技術(shù)的逐漸成熟,建筑垃圾的分類研究也迎來了新的機(jī)遇.
當(dāng)前遙感領(lǐng)域中,基于整波形特征的光譜匹配技術(shù)已經(jīng)成為了高光譜成像光譜地物分類識(shí)別的關(guān)鍵技術(shù)手段,該技術(shù)是通過判定標(biāo)準(zhǔn)參考光譜和未知像元光譜之間的相似性,來達(dá)到識(shí)別地物類型的目的.從概念上來講,光譜匹配技術(shù)模式主要是有查找、匹配和聚類3個(gè)過程[18-19],常用的光譜匹配模型有最小距離、光譜角度匹配、光譜間距離匹配、二值編碼匹配、多值編碼匹配和光譜信息散度等[20].段瑞魯?shù)龋?1]基于實(shí)測的沙丘植被光譜數(shù)據(jù),對(duì)比最小距離、光譜角度匹配、光譜相關(guān)系數(shù)和光譜信息散度4種光譜匹配模型,成功實(shí)現(xiàn)了沙丘典型植被的分類;趙冬娥等[22]提取了多種常見生活垃圾的特征波段,在此基礎(chǔ)上,利用光譜角匹配算法成功實(shí)現(xiàn)了生活垃圾的識(shí)別分類,分類準(zhǔn)確度均達(dá)99.0%以上;明群杰[23]采用HJ-1A高光譜數(shù)據(jù)結(jié)合植被光譜庫數(shù)據(jù),分析了交叉相關(guān)光譜匹配、光譜角匹配和小波變換等多種匹配算法的適用性,對(duì)研究區(qū)內(nèi)的小蒿草(Kobresia pygmaea)植被和針茅(Stipa)植被得到了較好的分類結(jié)果.
本研究利用無人機(jī)搭載高光譜成像儀獲取研究區(qū)高光譜遙感圖像,并進(jìn)行幾何校正和輻射校正等圖像預(yù)處理,基于研究區(qū)內(nèi)背景地物的光譜特征差異,利用決策樹法將研究區(qū)內(nèi)的背景地物分離,針對(duì)研究區(qū)內(nèi)4種不同類型的建筑垃圾,選取樣本點(diǎn),提取光譜信息,建立波譜庫,在此基礎(chǔ)上分別利用二進(jìn)制編碼、光譜角填圖和光譜信息散度3種光譜匹配算法對(duì)建筑垃圾進(jìn)行分類,并對(duì)分類的結(jié)果進(jìn)行驗(yàn)證與分析,以此為建筑垃圾分類識(shí)別提供技術(shù)支持.
本文選取的研究區(qū)為中國遼寧省盤錦市大洼區(qū)榮興水庫西側(cè)1.2 km處,研究區(qū)內(nèi)地物類型較為豐富,主要包含水體、植被、裸土、柏油路以及多類型建筑垃圾.其中:水體主要為養(yǎng)殖池塘,池塘中包含常見的水生植物和微生物;植被類型主要有蘆葦(Phragmites austrous)和蒿子(Artemisia carvifolia),蘆葦所占比例達(dá)95.0%,集中分布在池塘兩側(cè),蒿子作為一年生草本植被,但其莖的木質(zhì)化程度較高,還屬于灌木,主要分布在池塘邊緣兩側(cè),較為貼近地面;研究區(qū)內(nèi)建筑垃圾主要包括防塵布、地基渣土、瓦礫砂石及白色塑料,主要是由周邊建筑工地在施工過程中產(chǎn)生的,由于研究區(qū)位置較為偏僻,故建筑垃圾大多被隨意露天堆放.
本研究采用的無人機(jī)高光譜系統(tǒng)中,無人機(jī)平臺(tái)采用大疆經(jīng)緯M600Pro無人機(jī).高光譜圖像獲取設(shè)備為GaiaSky-mini2推掃式機(jī)載高光譜成像系統(tǒng),系統(tǒng)內(nèi)置掃描系統(tǒng)和增穩(wěn)系統(tǒng),可以同時(shí)實(shí)現(xiàn)自動(dòng)曝光和自動(dòng)匹配掃描的速度,具體技術(shù)參數(shù)見表1.
表1 高光譜相機(jī)技術(shù)參數(shù)
數(shù)據(jù)采集試驗(yàn)于2019年9月27日14:00進(jìn)行,試驗(yàn)時(shí)天氣晴朗、無風(fēng),無人機(jī)航高設(shè)定為200 m,航速設(shè)定為12.8 m/s.采集數(shù)據(jù)時(shí)設(shè)定相機(jī)采用推掃模式進(jìn)行作業(yè),獲取的無人機(jī)高光譜圖像的空間分辨率為79 mm.
野外數(shù)據(jù)采集時(shí),根據(jù)像控點(diǎn)布設(shè)原則,選擇道路中間路沿石、池塘拐角以及人工布設(shè)的標(biāo)志物,共5個(gè)像控點(diǎn),其中人工布設(shè)的標(biāo)志物處用紅色噴漆噴成十字交叉型,像控點(diǎn)坐標(biāo)使用千尋星矩SR1智能網(wǎng)絡(luò)RTK接收機(jī)測量,利用像控點(diǎn)數(shù)據(jù)對(duì)無人機(jī)高光譜圖像的幾何畸變進(jìn)行數(shù)學(xué)模擬完成幾何校正.由于無人機(jī)飛行過程中,航線兩端機(jī)身自身抖動(dòng),云臺(tái)未能及時(shí)補(bǔ)償運(yùn)動(dòng)誤差會(huì)造成圖像兩端的扭曲變形[24],因此對(duì)無人機(jī)高光譜圖像進(jìn)行裁剪,剔除邊緣無效圖像.
利用SpecView軟件平臺(tái)針對(duì)高光譜圖像進(jìn)行輻射校正,用來消除數(shù)據(jù)獲取和傳輸過程中產(chǎn)生的系統(tǒng)、隨機(jī)輻射失真或者畸變,計(jì)算公式為
式中Rr為輻射校正過的圖像反射率值,Dr為無人機(jī)原始圖像的像元亮度值,Dw為參考板(白板)的像元亮度值,Nd為成像光譜儀內(nèi)部系統(tǒng)噪聲.
由于高光譜成像儀是在無人機(jī)飛到一定高度后獲取圖像數(shù)據(jù),圖像本身會(huì)受到大氣和水汽等因素的影響,為了消除影響,在無人機(jī)起飛之前,在拍攝區(qū)域放置一塊經(jīng)過國家計(jì)量院標(biāo)定過的反射率為20%、面積為1 m×1 m的灰布,在高光譜成像儀獲取圖像時(shí),只需要保證其中一景影像中覆蓋到灰布即可.大氣校正的公式為
式中Rf是消除大氣、水汽等因素后的圖像光譜反射率,Rr是經(jīng)過黑白校正后的圖像反射率,Rs是經(jīng)過國家計(jì)量院標(biāo)定的灰布的光譜反射率,Rg是經(jīng)過黑白校正后圖像中的灰布反射率.
本次試驗(yàn)將研究區(qū)分為背景地物和建筑垃圾2類,其中背景地物包含植被、水體、陰影、柏油路和裸土,建筑垃圾包含白色塑料、防塵布、地基渣土和瓦礫砂石,具體信息見表2.
表2 研究區(qū)內(nèi)地物類型
為了消除背景地物對(duì)后續(xù)建筑垃圾分類識(shí)別產(chǎn)生的影響,本次試驗(yàn)首先利用決策樹分類法將背景地物分離.針對(duì)不同類型背景地物分別選取30個(gè)樣本點(diǎn),統(tǒng)計(jì)并提取樣本點(diǎn)光譜信息,制作各類背景地物的光譜曲線,如圖1所示.基于各類背景地物的光譜曲線,分析各地物之間的光譜特征差異,選擇特征波段.背景地物分離過程為:通過選取近紅外波段 b117(780.8 nm)和紅光波段 b88(679.3 nm)來構(gòu)造歸一化植被指數(shù)(normalized vegetation index,NDVI),當(dāng) NDVI≥0.2 時(shí),首先將植被分離出去;由于水體和陰影的光譜反射率在b163(947 nm)處的光譜反射率值明顯低于其他類型地物,因此利用單波段閾值法將水體和陰影從圖像中分離出來;通過選取 b120(791.4 nm)和 b58(577.2 nm)來構(gòu)造歸一化水體指數(shù)(normalized difference water index,NDWI),當(dāng) NDWI>0.5 時(shí),分離水體;由于裸土和柏油路的光譜曲線從b86(672 nm)處開始快速下降,并且在 b46(537 nm)~b79(648 nm)之間同時(shí)存在反射峰和反射谷,這是其他類型背景地物不具備的光譜特征,首先利用單波段閾值法和波段比值法將二者分離出來;又因?yàn)槁阃梁桶赜吐吩赽45(534 nm)~b58(577 nm)之間的光譜曲線斜率存在差異,因此通過波段比值法進(jìn)行細(xì)分.
圖1 各類背景地物光譜曲線
由于本次分類試驗(yàn)是利用決策樹將背景地物進(jìn)行了分離,而決策樹算法在執(zhí)行每一個(gè)判斷條件時(shí),都會(huì)對(duì)當(dāng)前圖像信息進(jìn)行遍歷,因此這里還要考慮部分背景地物驗(yàn)證點(diǎn)被錯(cuò)分為建筑垃圾的情況,并對(duì)錯(cuò)分情況進(jìn)行評(píng)估.通過統(tǒng)計(jì):針對(duì)陰影選取的20個(gè)驗(yàn)證樣本點(diǎn)中,有1個(gè)點(diǎn)被錯(cuò)分為地基渣土;針對(duì)裸土選取的20個(gè)驗(yàn)證樣本點(diǎn)中,有1個(gè)點(diǎn)被錯(cuò)分為瓦礫砂石.由于針對(duì)6種背景地物選取的120個(gè)驗(yàn)證點(diǎn)中,僅有2個(gè)點(diǎn)被錯(cuò)分為建筑垃圾,錯(cuò)分率為1.7%,因此可以表明,利用決策樹分離背景地物時(shí),不會(huì)對(duì)后續(xù)建筑垃圾的識(shí)別造成影響.
本試驗(yàn)利用二值編碼、光譜信息散度和光譜角匹配3種匹配算法對(duì)研究區(qū)內(nèi)的建筑垃圾分類識(shí)別.
(1)二值編碼匹配算法是以編碼的方式將圖像中每個(gè)像元的光譜信息特征進(jìn)行表述,極大地提高了光譜匹配計(jì)算的效率[25].具體的編碼公式為
式中x(n)為像元第n波段的光譜值;h(n)為像元第n波段的編碼值;N為總波段數(shù);T為選定的門限值,一般選為光譜的平均光譜值.
無人機(jī)高光譜圖像經(jīng)過二值編碼處理之后,圖像中每個(gè)像元光譜變?yōu)橐粋€(gè)與波段數(shù)長度相同的編碼序列,每個(gè)序列中的值由0或者1組成.雖然二進(jìn)制編碼算法在一定程度上有助于提高圖像光譜數(shù)據(jù)的分析處理效率,但有時(shí)不能提供合理的光譜可分性,并且會(huì)失去很多細(xì)節(jié)光譜信息[26].
(2)光譜信息散度算法基于信息論的理論,利用散度度量像元波譜與波譜庫中端元波譜的匹配程度,散度越小,匹配程度越高.在信息論中,Kullback-Leibler(K-L)散度是對(duì)信號(hào)相似度的一般度量,將其應(yīng)用于高光譜遙感圖像中,不僅可以得到不同波段圖像之間的信息量差異,而且可以描述標(biāo)準(zhǔn)參考光譜和待匹配像元光譜曲線的相似性[27-28].假設(shè)在波段數(shù)為n的高光譜數(shù)據(jù)中,存在2 條光譜曲線分別為X=(X1,X2,X3,…,Xn)T和Y=(Y1,Y2,Y3,…,Yn)T,則可得 2條光譜曲線的概率向量分別為:
根據(jù)K-L信息函數(shù),定義Y關(guān)于X的相對(duì)熵和X相對(duì)于Y的相對(duì)熵為:
綜上,X和Y光譜曲線的光譜信息散度為
實(shí)際應(yīng)用中,光譜信息散度是以圖像中選取的各類地物參考樣本的平均光譜作為參照,計(jì)算圖像上每個(gè)像素與各類別地物參照光譜的光譜信息散度,然后將該像素歸為光譜信息散度得分最高的類別中.
(3)光譜角匹配算法是將具有n個(gè)波段的高光譜數(shù)據(jù)中每個(gè)像元的光譜曲線作為N維空間矢量,計(jì)算其與已知標(biāo)準(zhǔn)參考光譜之間的廣義夾角,進(jìn)而判斷匹配的好壞程度[29],屬于監(jiān)督分類方法的一種.假設(shè)矢量分別為X=[x1,x2,x3,…,xn]和Y=[y1,y2,y3,…,yn],則其之間的廣義夾角(θ)可表示為
式中n為高光譜圖像波段數(shù).θ值越小,X和Y的相似性越大,即夾角越小,說明越相似.在實(shí)際的分類應(yīng)用中,根據(jù)真實(shí)地物圖像,選取各類地物的參考樣本,并計(jì)算平均光譜作為樣本中心,利用式(10)分別求出圖像中每一個(gè)像素與不同類別樣本中心的夾角,得到相似度排名,然后將該像素歸入與其夾角最小的類別中.
針對(duì)研究區(qū)內(nèi)不同類型的建筑垃圾分別選取30個(gè)樣本點(diǎn),統(tǒng)計(jì)并提取樣本點(diǎn)全部波段光譜信息,并通過圖像文件格式保存為二進(jìn)制的數(shù)據(jù)文件(.sli),制作4類建筑垃圾的光譜曲線,建立波譜庫(圖2),便于存儲(chǔ)和管理光譜信息.
圖2 各類建筑垃圾光譜曲線
將背景地物分離之后的研究區(qū)圖像轉(zhuǎn)換為感興趣區(qū)文件,并利用感興趣區(qū)文件對(duì)研究區(qū)圖像進(jìn)行裁剪,從而提取出研究區(qū)內(nèi)的建筑垃圾.針對(duì)提取出的建筑垃圾區(qū)域,基于建立的建筑垃圾波譜庫,利用二值編碼、光譜信息散度和光譜角匹配3種光譜匹配算法,對(duì)建筑垃圾進(jìn)行分類識(shí)別,分類結(jié)果如圖3所示,不同類型建筑垃圾的分類結(jié)果以不同的顏色區(qū)別顯示.對(duì)比3種不同光譜匹配算法的分類結(jié)果:二值編碼匹配算法的分類結(jié)果較為粗糙,主要表現(xiàn)為瓦礫砂石、白色塑料之間相互錯(cuò)分,白色塑料漏分,以及細(xì)小圖斑較多導(dǎo)致的分類區(qū)域斑塊較為破碎等現(xiàn)象;光譜信息散度和光譜角匹配2種算法分類效果相近,相對(duì)于二值編碼,很大程度上減少了錯(cuò)分、漏分現(xiàn)象,并且分類區(qū)域斑塊較為完整,針對(duì)4種建筑垃圾的分類識(shí)別更加準(zhǔn)確精細(xì).
圖3 建筑垃圾分類結(jié)果
針對(duì)高空間分辨率的無人機(jī)高光譜圖像,基于圖像像元對(duì)4種建筑垃圾,分別選取15個(gè)驗(yàn)證樣本點(diǎn),共選取60個(gè)驗(yàn)證點(diǎn).此次驗(yàn)證點(diǎn)取樣規(guī)則為:驗(yàn)證點(diǎn)之間要保持一定間隔,且均勻分布.通過建立混淆矩陣得到的總體分類精度和Kappa系數(shù)(κ),對(duì)3種光譜匹配算法的分類結(jié)果進(jìn)行精度評(píng)價(jià).總體分類精度表示的是被正確分類的驗(yàn)證點(diǎn)數(shù)與全部驗(yàn)證點(diǎn)數(shù)之間的比值.κ是一個(gè)用于一致性檢驗(yàn)的客觀指標(biāo),通過一種離散的多源技術(shù)與總體分類精度形成互補(bǔ),當(dāng)κ為0.61~0.80時(shí),表示二者之間具有高度一致性.光譜匹配不同建筑垃圾3種算法精度評(píng)價(jià)結(jié)果列于表3.試驗(yàn)研究所用的3種光譜匹配算法中,二值編碼匹配算法的總體分類精度和κ值最低(κ=0.70),結(jié)合分類結(jié)果中出現(xiàn)的錯(cuò)分漏分以及區(qū)域斑塊破碎等現(xiàn)象,體現(xiàn)了該算法容易丟失細(xì)節(jié)光譜信息、分類結(jié)果粗糙的劣勢;光譜角匹配算法的總體分類精度和κ值最高(κ=0.85),分類效果優(yōu)于其他2種算法,針對(duì)4種建筑垃圾的分類識(shí)別,制圖精度均>80.0%,防塵布、地基渣土和白色塑料3種建筑垃圾的用戶精度均>85.0%,而瓦礫砂石的用戶精度僅為77.8%,是由于選取的15個(gè)地基渣土驗(yàn)證樣本點(diǎn)當(dāng)中,有3個(gè)點(diǎn)被錯(cuò)分為瓦礫砂石所導(dǎo)致,結(jié)合野外實(shí)際情況,分析是由于部分地基渣土表面散落的細(xì)碎瓦塊,導(dǎo)致分類器將地基渣土的局部區(qū)域錯(cuò)分為瓦礫砂石.對(duì)于選取的15個(gè)白色塑料驗(yàn)證點(diǎn),有2個(gè)被錯(cuò)分為其他,可能是由于地面鋪設(shè)的定標(biāo)白布與白色塑料的光譜反射特性較為接近導(dǎo)致的.
表3 3種光譜匹配算法的精度評(píng)價(jià)結(jié)果 單位:%
本研究創(chuàng)新性地將無人機(jī)高光譜遙感應(yīng)用于建筑垃圾的分類識(shí)別,以獲取研究區(qū)無人機(jī)高光譜圖像為基礎(chǔ),利用決策樹法對(duì)研究區(qū)內(nèi)的背景地物進(jìn)行了分離,在此基礎(chǔ)上,提取了4類建筑垃圾的光譜信息,并建立了標(biāo)準(zhǔn)波譜庫;利用二值編碼、光譜信息散度和光譜角匹配3種光譜匹配算法,實(shí)現(xiàn)了建筑垃圾的精細(xì)分類,并對(duì)分類結(jié)果進(jìn)行精度評(píng)價(jià).
通過比較分析3種光譜匹配算法的分類結(jié)果,得出以下結(jié)論:(1)二值編碼由于其編碼特性,導(dǎo)致分類過程中某些細(xì)節(jié)光譜信息丟失,分類結(jié)果中錯(cuò)分、漏分現(xiàn)象較多,分類區(qū)域斑塊破碎,整體分類效果不理想;光譜信息散度算法的總體分類精度為85.3%,κ=0.82,總體分類效果較好;光譜角匹配算法的總體分類精度為88.0%,κ=0.85,整體分類效果最好.(2)對(duì)建筑垃圾的分類識(shí)別過程中,光譜信息散度和光譜角匹配2種算法的總體分類精度都>85.0%,κ值均>0.80,驗(yàn)證了利用光譜匹配算法對(duì)建筑垃圾進(jìn)行分類識(shí)別的可行性和科學(xué)性.
本文所采用的分類方法屬于監(jiān)督分類,對(duì)樣本的依賴性較大,訓(xùn)練樣本和驗(yàn)證樣本的選取不同以及光譜匹配算法中閾值的設(shè)定,可能會(huì)使得最終的分類效果存在差異.因此,在后續(xù)研究中,將會(huì)結(jié)合相關(guān)分類方法進(jìn)一步研究建筑垃圾的分類識(shí)別,提高其精度,同時(shí)為了減少光譜匹配分類過程中由于光譜信息差異帶來的誤差,在無人機(jī)高光譜數(shù)據(jù)采集時(shí),留意太陽入射角及儀器觀測角度等眾多因素,避免同物異譜、異物同譜等現(xiàn)象發(fā)生.