邢 瑾
(上??睖y設(shè)計研究院有限公司,上海 200434)
建筑物作為城市的主要組成部分,城市規(guī)劃、智慧城市等方面的不斷發(fā)展對建筑物信息的提取研究提出了更高要求[1]。隨著遙感技術(shù)的不斷進(jìn)步,基于高空間分辨率遙感影像的建筑物信息提取成為目前遙感和攝影測量領(lǐng)域的研究熱點(diǎn)[2]。建筑物信息提取方法主要分為以像元和對象為研究對象的兩大類,相對于存在嚴(yán)重“椒鹽”現(xiàn)象的基于像元分類方法[3],面向?qū)ο蠓诸惙椒ň哂腥诤舷噜復(fù)|(zhì)像元光譜、紋理、幾何形狀和上下文等特征信息,以實(shí)現(xiàn)目標(biāo)對象的高質(zhì)量提取[4]。
近年來,國內(nèi)外大量學(xué)者針對地物信息提取多采用面向?qū)ο蟮臋C(jī)器學(xué)習(xí)分類算法,隨機(jī)森林作為較為熱門的機(jī)器學(xué)習(xí)算法之一,在建筑物提取方面發(fā)揮著重要作用。郜燕芳等[5]通過對比不同訓(xùn)練樣本比例下隨機(jī)森林和支持向量機(jī)方法對城市不透水面的提取研究,表明隨機(jī)森林方法優(yōu)于支持向量機(jī)方法;宋茜[6]應(yīng)用RF、SVM 分類器訓(xùn)練并獲取黑龍江省北安市農(nóng)作物空間分布,結(jié)果表明對于具有高維特征空間和多分類等問題上,RF 的泛化和抗噪能力要優(yōu)于SVM;Novack 等[7]通過對巴西圣保羅城區(qū)的地表覆蓋分類,對比分析了支持向量機(jī)、C4.5 決策樹、分類回歸樹、隨機(jī)森林等4 種方法,試驗(yàn)結(jié)果表明隨機(jī)森林的分類精度最高;M.Pal[8]對隨機(jī)森林分類器和支持向量機(jī)在分類精度、訓(xùn)練時間和用戶自定義參數(shù)方面進(jìn)行比較,兩者分類效果相當(dāng),隨機(jī)森林所需的用戶自定義參數(shù)數(shù)量少于支持向量機(jī)所需的數(shù)量,易于定義。針對以上已有研究,本文以德國恩茨河畔法伊欣根某部分城區(qū)為例,探討基于隨機(jī)森林(RF)在面向?qū)ο笥跋穹治龇椒ㄖ羞M(jìn)行建筑物信息提取的技術(shù)。
研究區(qū)位于德國恩茨河畔法伊欣根某部分城區(qū),所使用數(shù)據(jù)為Open Topography 網(wǎng)站下載的官方測試數(shù)據(jù),該數(shù)據(jù)已經(jīng)過幾何校正等預(yù)處理,其空間分辨率為0.9m,由近紅外、紅光和綠光3 個波段組成,影像尺寸為1024 像素×1024 像素,區(qū)域范圍約為0.85km2(圖1)。該研究區(qū)主要有建筑物、草地、樹木、道路、裸地五種地物類型。本文研究的主要對象是建筑物,此研究區(qū)內(nèi)的建筑物顏色不一、形狀多樣。
圖1 研究區(qū)影像
面向?qū)ο蟮挠跋穹治龇椒ㄖ饕ㄓ跋穹指?、特征選擇和對象分類三個板塊。首先,選擇合適的影像分割方法將影像根據(jù)像元的同質(zhì)性和異質(zhì)性分割成多個影像對象;其次,選取有利于對象分類的影像對象的光譜、紋理、幾何形狀和上下文等特征參與影像對象分類;最后,選取合適分類方法及分類參數(shù)實(shí)現(xiàn)影像對象分類。
影像分割是將影像分成若干個具有相似特征的多邊形對象的過程。文獻(xiàn)[9]中Baatz 和Schape 提出的分型網(wǎng)絡(luò)演化算法作為目前最為常用且最具特色的分割技術(shù)。該算法主要通過尺度因子(Scale)、形狀因子(Shape)和緊湊度(Compactness)三個參數(shù)變量組合決定地物在影像中的分割結(jié)果[10]。采用試錯法進(jìn)行分割參數(shù)組合,具有一定的主觀性和盲目性,而Liu 等[11]設(shè)計的不一致性評價法,通過綜合參考多邊形與分割對象之間的幾何關(guān)系差異和代數(shù)關(guān)系差異,提出了PSE、NSR 和ED2 三個分割質(zhì)量評價指數(shù),可定量化評價分割質(zhì)量。
在面向?qū)ο蟮挠跋穹诸惙椒ㄖ?,?gòu)建合適的特征空間對分類結(jié)果具有重要作用。特征空間中特征種類組合及維度的選擇對分類結(jié)果均有一定的影響及作用。根據(jù)研究區(qū)以及特征優(yōu)選方法現(xiàn)狀,本文預(yù)采用Relief F 和PSO 混合特征選擇算法進(jìn)行特征優(yōu)選。Relief F 算法是一種過濾式多分類特征選擇算法,通過計算各特征和類別的相關(guān)性賦予不同權(quán)重,并根據(jù)權(quán)值大小判斷特征重要性[12]。POS 是一種基于群體協(xié)作的隨機(jī)搜索算法,通過群體匯總個體之間的協(xié)作和信息共享使整個群體的運(yùn)動在問題求解空間中產(chǎn)生無序到有序的演化過程,從而獲得最優(yōu)解[13]。
隨機(jī)森林是由Breiman 等提出的一種機(jī)器學(xué)習(xí)算法[14],它是通過集成學(xué)習(xí)的思想將多棵樹集成的一種算法,基本單元是決策樹,而其本質(zhì)屬于機(jī)器學(xué)習(xí)的一大分支——集成學(xué)習(xí)(Ensemble Learning)方法。實(shí)際上是一種特殊的bagging 方法,將決策樹用作bagging 中的模型。隨機(jī)森林中的每顆決策樹估計一個分類,這個過程稱為“投票”,理想情況下,根據(jù)每顆決策樹的投票結(jié)果,選擇最多投票數(shù)作為分類結(jié)果。隨機(jī)森林的參數(shù)設(shè)置比較簡單,只需要定義構(gòu)成隨機(jī)森林的決策樹的深度即可。
本文采用eCognition 商業(yè)軟件中的分型網(wǎng)絡(luò)演化算法(Fractal Net Evolution Approach,F(xiàn)NEA)完成研究區(qū)影像的多尺度分割,基于Liu 等[11]提出的不一致評價法分割參數(shù)優(yōu)選模型。根據(jù)研究區(qū)建筑物實(shí)際特點(diǎn),將影像分割的尺度因子范圍設(shè)為10-160,步長10;形狀因子和緊湊度因子均設(shè)為0.1-0.9,步長0.1。通過ED2 與尺度因子的相對關(guān)系,確定影像的最優(yōu)分割參數(shù)組合,尺度因子:90、形狀因子:0.4、緊湊度因子:0.6。從而得到最優(yōu)分割結(jié)果圖(圖2)。
圖2 影像最優(yōu)分割結(jié)果圖
為了構(gòu)建全面且最優(yōu)的特征空間,本文分別選取了9 個光譜特征、28 個紋理特征、15 個幾何特征以及4 個自定義特征,共計56 個特征組成基本分類特征空間。以此為基礎(chǔ),基于WEKA 平臺,按照Relief F 和PSO 混合特征選擇算法實(shí)現(xiàn)特征優(yōu)選,優(yōu)選出建筑物分類的18 維最優(yōu)特征空間組合(見表1)。
表1 最優(yōu)特征空間組合
隨機(jī)森林算法的分類精度主要取決于決策樹的最大深度。為了盡可能地提高分類準(zhǔn)確性,本文對決策樹最大深度參數(shù)設(shè)置不同數(shù)值進(jìn)行了測試和評估,通過比較不同最大深度下的隨機(jī)森林OOB 誤分率,來選擇最佳的深度值(圖3)。從分類結(jié)果中可以發(fā)現(xiàn),當(dāng)隨機(jī)森林的最大深度為5 時,OOB 的誤分率最低,這也符合Breiman 關(guān)于特征自己維度的最優(yōu)值約等于所有特征個數(shù)的算術(shù)平方根的結(jié)論。而當(dāng)決策樹的最大深度為11 時,OOB 的誤分率趨向平穩(wěn),其模型效果也最好,所有本研究選擇隨機(jī)森林的模型最大深度為5 作為分類參數(shù)。
圖3 隨機(jī)森林OOB 誤分率和參數(shù)的關(guān)系
3.4.1 植被掩膜
研究區(qū)中含有大量的樹木和草地等植被,植被具有獨(dú)特的光譜特征,NDVI 是一種被廣泛運(yùn)用的檢測植被狀況的特征指數(shù),可以很好地利用植被的光譜信息進(jìn)行植被提取。對研究區(qū)進(jìn)行大量實(shí)驗(yàn),當(dāng)NDVI≥0.1245 時,可以將植被很好掩膜。
3.4.2 陰影掩膜
研究區(qū)中地物高度不一,由于太陽高度原因產(chǎn)生大量的陰影,會對建筑物提取造成一定的影響,為了去除陰影,本文使用影像三波段的均值,不斷嘗試,最終確定當(dāng)影像三波段的均值≤45.5 時,可以將陰影很好掩膜。
3.4.3 語義特征優(yōu)化
經(jīng)過植被掩膜和陰影掩膜后,會發(fā)現(xiàn)仍有許多建筑物對象被歸為其他類別,按照建筑物對象與其他對象直接的語義關(guān)系進(jìn)行填洞、邊界補(bǔ)充等操作,使建筑物提取效果得到優(yōu)化。
為評價本文所提方法的分類效果,通過目視解譯,查看建筑物的提取情況,定性評價建筑物的提取效果;再選擇驗(yàn)證樣本進(jìn)行定量精度評價,得出基于隨機(jī)森林的面向?qū)ο蠼ㄖ锾崛】偩葹?6.3%,卡帕系數(shù)為0.843(表2)。
表2 分類精度統(tǒng)計表
圖4 為本實(shí)驗(yàn)建筑物信息提取的結(jié)果圖,圖中共有15 個建筑物對象,提取結(jié)果中也都包含了這15 個對象,且建筑物提取總精度達(dá)到96.3%,較以往建筑物提取實(shí)驗(yàn),精度有所提高,說明使用本文所采用面向?qū)ο蟮淖顑?yōu)深度隨機(jī)森林方法較為可信。但從提取的單個建筑物看,存在建筑物的輪廓不夠完整的現(xiàn)象,尤其是建筑物的邊緣部分被歸為其他類別,這可能是由于建筑物邊緣部分具有獨(dú)特的結(jié)構(gòu)所引起的。另外,由于建筑物與裸地相鄰,它們的光譜信息極為相近,導(dǎo)致建筑物提取結(jié)果中含有部分裸地對象。
圖4 建筑物提取結(jié)果圖
本文針對德國恩茨河畔法伊欣根某部分城區(qū)的0.9m 高空間分辨率遙感影像,基于隨機(jī)森林面向?qū)ο笥跋穹治龅姆椒ㄌ崛?fù)雜建筑物。結(jié)果表明:隨機(jī)森林算法能夠有效地利用自身適合于高維數(shù)據(jù)分類的優(yōu)勢,充分挖掘建筑物的光譜、紋理和幾何等信息,并對各種特征的重要性全面評估,從而為其他面向?qū)ο蠓诸惙椒ㄌ峁┨卣骺臻g構(gòu)建的依據(jù)。建筑物信息提取的總體精度和卡帕系數(shù)分別達(dá)到96.3%和0.843,實(shí)現(xiàn)了建筑物的高精度提取,對復(fù)雜情況下的高分辨率遙感影像地物提取具有參考價值,但關(guān)于建筑物輪廓細(xì)節(jié)還有待思考其他方法進(jìn)行完善。