許 飛,曹 鑫,2,陳學(xué)泓,2,崔喜紅,2
(1. 北京師范大學(xué) 地表過程與資源生態(tài)國家重點(diǎn)實(shí)驗(yàn)室,北京 100875;2. 北京師范大學(xué)地理科學(xué)學(xué)部遙感科學(xué)與工程研究院,北京 100875)
高空間分辨率遙感影像提高了遙感技術(shù)監(jiān)測(cè)地面信息的精細(xì)程度,被廣泛應(yīng)用于城市規(guī)劃、土地資源調(diào)查等領(lǐng)域。然而,受光照條件、地形起伏等因素影響,高空間分辨率使遙感影像在監(jiān)測(cè)同一地表覆蓋類型時(shí)出現(xiàn)嚴(yán)重的光譜變異性,即“椒鹽效應(yīng)”(salt-andpepper effect)[1]。當(dāng)使用基于像元的分類方法處理高空間分辨率遙感影像時(shí),這種“椒鹽效應(yīng)”會(huì)使高分影像中同一種地表覆蓋類型的分類結(jié)果出現(xiàn)誤分,降低了分類方法提取地面目標(biāo)的精度。影像分割算法是一種解決“椒鹽效應(yīng)”的圖像處理算法,該方法對(duì)遙感影像的像元分割為若干個(gè)分割體,每個(gè)分割體內(nèi)的像元均為同質(zhì)性像元[2]。通過后續(xù)的分類、目標(biāo)識(shí)別等影像處理過程,分割體可以被轉(zhuǎn)換為具有特殊語義的對(duì)象[3]。在分割算法中,分割尺度決定了分割體容納同質(zhì)像元的能力,當(dāng)分割尺度越大時(shí),分割體內(nèi)部像元的同質(zhì)性越低,分割體的面積越大;當(dāng)分割尺度越小時(shí),分割體內(nèi)部像元的同質(zhì)性越高,分割體的面積越小。過小的分割尺度會(huì)使分割體無法容納地面物體類內(nèi)的光譜變異性,即無法克服“椒鹽效應(yīng)”的影響;過大的分割尺度會(huì)使分割體不但能容忍地面物體類內(nèi)的光譜變異性,也能夠容忍地物類間的變異性,導(dǎo)致分割體內(nèi)部包含不同類別的像元,遺漏具有較小分割尺度的地面物體。因此,當(dāng)影像分割算法被用于處理高空間分辨率遙感影像時(shí),選擇分割尺度是一個(gè)非常重要的問題。
目前,遙感影像的分割算法包括單一尺度的分割方法[4-6]和多尺度分割算法[1-2,7]。其中,單一尺度的分割方法不適用于地表覆蓋條件復(fù)雜的遙感影像。在遙感影像中,不同類型的地面物體具有不同的物理空間尺度,因此,在遙感影像分割時(shí),單一分割尺度無法同時(shí)刻畫所有類型的地面物體。相反,多尺度分割允許同一幅遙感影像被不同大小的分割尺度分割,相比之下多尺度分割更具有實(shí)用性。此外,在處理高空間分辨率遙感影像的工作中,eCognition?[8]是一種被廣泛使用的影像處理平臺(tái),該軟件可以實(shí)現(xiàn)以多種尺度分割遙感影像的功能。
針對(duì)從多尺度影像分割中尋找影像中各種地物目標(biāo)的最優(yōu)尺度問題,本文提出了一種基于后驗(yàn)概率信息熵的多尺度分割組合算法MOCA(Multi-scalesegmentation Optimal Composition Algorithm)。該算法使用eCognition?對(duì)高空間分辨率遙感影像在多個(gè)尺度下進(jìn)行分割,以分割體為單位計(jì)算不同分割尺度下高空間分辨率遙感影像內(nèi)每個(gè)分割體的平均光譜?;诓煌指畛叨认路指铙w的平均光譜,通過選取目標(biāo)類型訓(xùn)練樣本,使用分類器(本文中為支持向量機(jī)SVM[9])生成不同分割尺度下的目標(biāo)類型的后驗(yàn)概率,并計(jì)算不同分割尺度下的后驗(yàn)概率信息熵。最后,利用相鄰分割尺度下信息熵指標(biāo)的最大差分值尋找每個(gè)地面物體的最優(yōu)分割尺度。本文使用F指標(biāo)(Fmeasure)和BCI(Bidirectional Consistency Index)兩種指標(biāo)評(píng)估地面目標(biāo)物提取精度,并將MOCA與同類多尺度分割方法進(jìn)行比較。本文提出的MOCA算法試圖實(shí)現(xiàn)多個(gè)分割尺度的最優(yōu)組合,以期獲得較高的地面目標(biāo)物提取精度。
本文提出了一種多尺度分割優(yōu)化組合方法MOCA,其基本過程包括計(jì)算像元級(jí)后驗(yàn)概率矢量、遙感影像的多尺度分割、計(jì)算不同分割尺度分割體的后驗(yàn)概率信息熵、建立后驗(yàn)概率信息熵最大差分指標(biāo)、逐對(duì)象選擇最優(yōu)分割尺度。
1)計(jì)算像元級(jí)后驗(yàn)概率矢量以及對(duì)高分影像進(jìn)行多尺度分割
本文提出的方法需要計(jì)算多尺度分割結(jié)果中每個(gè)分割體的后驗(yàn)概率矢量。首先,本文使用支持向量機(jī)(SVM)計(jì)算單個(gè)像元的后驗(yàn)概率矢量。計(jì)算時(shí),本文分別對(duì)樹木、草地、屋頂、道路和水體每種地表覆蓋類型選擇3000~5000個(gè)像元作為訓(xùn)練樣本,將訓(xùn)練樣本輸入至SVM分類器中得到像元級(jí)后驗(yàn)概率矢量。與此同時(shí),本文使用eCognition 8.9軟件對(duì)遙感影像進(jìn)行多級(jí)尺度分割。分割時(shí),形狀因子設(shè)置為0.2,緊致度因子設(shè)置為0.5。此外,影像的DN值的數(shù)量級(jí)決定了eCognition分割尺度的范圍。以HYDICE數(shù)據(jù)為例,本文以10為步長,從50遞增至1000,最終被選擇的多級(jí)分割尺度為50,60,70,80,…,970,980,990,1000。基于以上參數(shù),本文在eCognition 8.9軟件中利用MRS (multiresolution segmentation)算法創(chuàng)建規(guī)則集,生成高空間分辨率遙感影像在不同分割尺度下的分割結(jié)果。
然后,將eCognition生成的多尺度分割結(jié)果生成編號(hào)文件,以分割尺度為順序依次導(dǎo)出為柵格數(shù)據(jù),其中柵格數(shù)據(jù)中每個(gè)像素對(duì)應(yīng)的值就是該像元所在分割體的編號(hào)?;谏鲜霾襟E獲得的eCognition多尺度分割結(jié)果,以及像元級(jí)后驗(yàn)概率矢量,可計(jì)算每一個(gè)分割尺度下各分割體的平均后驗(yàn)概率矢量,最終得到每個(gè)地面物體在所有分割尺度的平均后驗(yàn)概率。其中,對(duì)于某一分割尺度上的一個(gè)分割體而言,其后驗(yàn)概率矢量可以表示如下:
2)建立后驗(yàn)概率信息熵最大差分值指標(biāo)
在不同分割尺度的分割結(jié)果中,總有一個(gè)面積最大的分割體Simax覆蓋地面物體i。隨著分割尺度的增加,不同類別的像元融入Simax,導(dǎo)致Simax的平均后驗(yàn)概率矢量隨著分割尺度的增加發(fā)生變化。后驗(yàn)概率信息熵[10]能夠?qū)⒎指铙w的后驗(yàn)概率矢量轉(zhuǎn)換為分割體的類別純凈度指標(biāo);Simax的后驗(yàn)概率信息熵隨著分割尺度的變化信息也能夠代表Simax內(nèi)部像元純凈度的變化。
本文對(duì)所有地面物體的Smax按照分割尺度的遞增順序分別計(jì)算其后驗(yàn)概率信息熵。后驗(yàn)概率信息熵的計(jì)算方法如下:
式中,Pi表示分割體屬于第i類的后驗(yàn)概率,n代表總類別個(gè)數(shù)。當(dāng)分割體處于過分割時(shí)(即分割尺度較小時(shí)),分割體內(nèi)所包含的類別單一,后驗(yàn)概率信息熵值較??;當(dāng)分割體處于低分割(即分割尺度較大時(shí)),分割體內(nèi)包含的類別豐富,后驗(yàn)概率信息熵值較大。隨著分割體在不同尺度下形狀大小的變化,分割體的后驗(yàn)概率信息熵也發(fā)生變化。分割尺度的增減直接影響分割體內(nèi)部像元類別多樣性的變化,因此,地面物體分割尺度的變化等價(jià)于地面物體所在分割體的后驗(yàn)概率的變化。為了進(jìn)一步探究后驗(yàn)概率對(duì)信息熵指標(biāo)的影響,本文假設(shè)兩種地表覆蓋類別的情況(兩種地表覆蓋的后驗(yàn)概率分別為P1和P2),其中P1為目標(biāo)地物真實(shí)類別的后驗(yàn)概率,P0為目標(biāo)地物周圍其他類別的后驗(yàn)概率,信息熵的變化可以表達(dá)如下:
式中,Ei代表在第i分割尺度下分割體的后驗(yàn)概率信息熵,1代表第i分割尺度和第i+1分割尺度的分割體的后驗(yàn)概率差分值。
本文通過eCognition生成高空間分辨率遙感影像在50,60,70,…,980,990,1000分割尺度下的分割結(jié)果,通過前文所述的計(jì)算過程得到這些分割尺度下的后驗(yàn)概率信息熵序列 。本文基于公式(4)計(jì)算出每一個(gè)地面物體在不同的相鄰分割尺度下的后驗(yàn)概率信息熵序列,并找到|△E|i,i+1最大的分割尺度作為當(dāng)前地面物體的最佳分割尺度,保存該物體在最佳分割尺度的分割體,最后合并遙感影像中所有地面物體的最佳分割體,形成多尺度分割結(jié)果。MOCA算法流程如圖1所示。
圖1 MOCA算法流程Fig.1 Flow chart of MOCA method
遙感影像分割結(jié)果的評(píng)判方法包括目視解譯法和定量判別法。在使用定量判別方法時(shí),本文首先對(duì)研究區(qū)域的遙感影像進(jìn)行手工數(shù)字化,生成地面物體的理想分割體,用于評(píng)價(jià)多尺度分割算法生成分割體的準(zhǔn)確性。本文使用 BCI(Bidirectional Consistency Index)指標(biāo)[11]和F指標(biāo)(Fmeasure)[12]評(píng)價(jià)多尺度分割結(jié)果。F指標(biāo)和BCI的計(jì)算公式如下:
式中,Si表示高空間分辨率遙感影像分割結(jié)果的第i個(gè)分割體,Simax表示Ri覆蓋區(qū)域的面積最大的分割體;Ri表示對(duì)應(yīng)于Si的參考分割體,Rimax表示Si覆蓋區(qū)域的面積最大的參考分割體。F指標(biāo)和BCI的值越高,代表實(shí)驗(yàn)生成的分割結(jié)果越符合地面物體的最優(yōu)分割結(jié)果。
本文使用了兩幅高空間分辨率遙感影像,其中一幅高分影像為華盛頓特區(qū)的HYDICE高空間分辨率高光譜影像,另一幅為北京地區(qū)的Quickbird高空間分辨率影像。如圖2所示,HYDICE和Quickbird高分影像中包括水體、道路、草坪、屋頂?shù)鹊孛嫖矬w。此外,HYDICE和Quickbird高空間分辨率遙感影像的過分割結(jié)果與低分割結(jié)果都無法恰當(dāng)?shù)乜坍嬔芯繀^(qū)域的地面物體。度分割算法[13]以及MOCA算法對(duì)HYDICE影像和Quickbird影像進(jìn)行分割,并使用F指標(biāo)和BCI對(duì)每種方法生成的分割結(jié)果進(jìn)行評(píng)估和對(duì)比。MOCA算法得到的分割尺度最優(yōu)組合結(jié)果如圖3所示,圖3中HYDICE數(shù)據(jù)與Quickbird數(shù)據(jù)的“參考分割結(jié)果”是手工數(shù)字化參考分割體;圖3的“MOCA分割結(jié)果”為本文算法得到的多尺度分割結(jié)果。為了體現(xiàn)MOCA能夠得到對(duì)象級(jí)的最優(yōu)分割尺度,圖3給出了HYDICE和Quickbird的分割尺度分布圖,其中每個(gè)分割體都具有不同的分割尺度。需要補(bǔ)充說明的是,由于道路和一些線狀分布的行道樹實(shí)際的物理尺度可能遠(yuǎn)遠(yuǎn)大于本文設(shè)定的分割尺度,為了更準(zhǔn)確地對(duì)比不同方法的分割精度,本文在手工數(shù)字化參考分割體中剔除了道路和線狀分布的行道樹,只保留了雕像、屋頂、停車場(chǎng)、草坪、湖泊等地面物體。
圖2 HYDICE高光譜高空間分辨率遙感影像與Quickbird多光譜高空間分辨率遙感影像及其過分割與低分割結(jié)果Fig.2 High spatial resolution images of HYDICE and Quickbird, and the over-segmented and under-segmented results of HYDICE and Quickbird
圖3 MOCA算法最優(yōu)分割尺度組合結(jié)果Fig.3 Optimal multi-scale-segmentation composition results by MOCA
本文首先利用MOCA算法對(duì)HYDICE影像和Quickbird影像分別進(jìn)行多尺度分割優(yōu)化組合,得到影像中每一個(gè)地面對(duì)象的分割體,利用F指標(biāo)和BCI對(duì)算法生成分割體的準(zhǔn)確性進(jìn)行定量評(píng)價(jià),并對(duì)比了單一尺度分割算法和穩(wěn)定區(qū)間多尺度分割算法[13]。然后,本文討論了eCognition多級(jí)分割尺度的步長與SVM分類器的訓(xùn)練樣本量對(duì)MOCA算法分割精度的影響。
3.2.1 分割結(jié)果及精度評(píng)價(jià)
本文分別使用單一尺度分割方法、穩(wěn)定區(qū)間多尺
根據(jù)圖3顯示的多尺度分割結(jié)果,可認(rèn)為MOCA算法得到的分割結(jié)果與地面物體的理想分割體具有較高的吻合度。此外,本文使用F指標(biāo)和BCI兩種指標(biāo)定量評(píng)價(jià)了三種方法在同一區(qū)域的分割結(jié)果,定量評(píng)估結(jié)果見表1。通過定量對(duì)比實(shí)驗(yàn),本文得出MOCA算法比單一分割尺度、基于穩(wěn)定區(qū)間的多尺度分割算法具有更高的分割精度。
表1 定量評(píng)定結(jié)果Tab.1 Assessment of segmentation accuracy
3.2.2 參數(shù)敏感性分析
MOCA算法涉及兩個(gè)關(guān)鍵參數(shù),eCognition生成多級(jí)分割尺度分割結(jié)果的尺度步長、SVM分類器的訓(xùn)練樣本量。這兩種參數(shù)可能會(huì)對(duì)多尺度分割算法最終的分割精度產(chǎn)生影響,因此本文使用控制變量法,分別使用不同梯度的分割尺度步長和不同梯度的SVM分類器的訓(xùn)練樣本量對(duì)HYDICE數(shù)據(jù)進(jìn)行分割,并統(tǒng)計(jì)不同輸入?yún)?shù)下的分割精度。參數(shù)變化對(duì)分割結(jié)果的影響見表2。
表2 參數(shù)變化對(duì)分割精度的影響Tab.2 The impact of parameters on accuracy of segmentation
本文根據(jù)表2得出以下結(jié)論:MOCA算法對(duì)eCognition分割尺度步長的變化敏感性較低,eCognition分割尺度步長越小,該算法得出的分割精度越高;SVM分類器的訓(xùn)練樣本量對(duì)本文算法分割精度具有較強(qiáng)的敏感性,當(dāng)每種地表覆蓋類型的訓(xùn)練樣本量為5 000個(gè)像元時(shí),本文算法的分割精度最高。
本文針對(duì)高空間分辨率遙感影像設(shè)計(jì)了一種基于后驗(yàn)概率信息熵的多尺度分割優(yōu)化組合算法MOCA。通過華盛頓地區(qū)的HYDICE高光譜高空間分辨率遙感影像和北京地區(qū)QuickBird多光譜影像進(jìn)行實(shí)驗(yàn),對(duì)分割結(jié)果的目視判別和定量評(píng)估,表明MOCA能夠同時(shí)適用于高光譜和多光譜高空間分辨率遙感影像的分割工作,并且能得到相對(duì)較好的分割精度。此外,本文對(duì)該算法涉及到的兩種參數(shù)進(jìn)行了精度敏感性實(shí)驗(yàn),證明了該算法對(duì)eCognition多尺度分割步長不敏感,當(dāng)SVM分類器訓(xùn)練樣本量為5000時(shí)該算法能得到最高的分類精度。