張光裕 李華朋
(東北林業(yè)大學(xué),哈爾濱,150040) (中國科學(xué)院東北地理與農(nóng)業(yè)生態(tài)研究所)
證據(jù)推理遙感分類背景下遙感影像證據(jù)支持度生成方法的對比
張光裕 李華朋
(東北林業(yè)大學(xué),哈爾濱,150040) (中國科學(xué)院東北地理與農(nóng)業(yè)生態(tài)研究所)
選擇黑龍江省洪河自然保護區(qū)的ETM+遙感影像,對比分析了基于最小距離法(MD)和頻率分布法(FD)兩種不同證據(jù)支持度生成方法的證據(jù)推理遙感分類精度。結(jié)果表明,在使用前3個或更少的波段情況下,MD方法證據(jù)支持度質(zhì)量比MD方法好,而在前4個或更多的波段情況下,MD方法生成的證據(jù)支持質(zhì)量更高。證據(jù)支持度的合理與否直接影響證據(jù)推理的分類精度和效果,而MD方法在多波段情況下在證據(jù)支持度生成方面更具優(yōu)勢。
遙感分類;證據(jù)推理;證據(jù)支持度;最小距離法;頻率分布法
遙感分類一直是遙感領(lǐng)域研究的重要內(nèi)容之一,是遙感影像轉(zhuǎn)換為可用的地理數(shù)據(jù)的核心[1]。已有研究表明,多源數(shù)據(jù)具有提高遙感分類精度的潛力[2],基于多源數(shù)據(jù)遙感分類已經(jīng)成為遙感分類研究的主要方向。這給傳統(tǒng)的基于統(tǒng)計學(xué)的遙感分類方法提出了挑戰(zhàn),因為這些方法不能處理多維數(shù)據(jù)[3],并且對數(shù)據(jù)的分布有一定要求(滿足正態(tài)分布)[4]。因此,亟待提出新的方法解決這些問題。證據(jù)推理是兩種能有效地處理多源數(shù)據(jù)的方法之一,已經(jīng)有很多研究利用證據(jù)推理結(jié)合多源數(shù)據(jù)完成了一系列的分類任務(wù)[5-9]。
證據(jù)理論(Theory of Evidence)是基于Dempster-Shafer理論而建立起來的。它首先由Dempster提出,并由Shafer進一步發(fā)展完善起來。證據(jù)推理方法在結(jié)合多重信息方面具有優(yōu)勢,它能以詳細記錄的方式完成正式的概率推理[10]。該方法基于決策知識和信息的不確定、不完整性提出的,例如遙感影像分類。在遙感分類背景下,證據(jù)推理方法比傳統(tǒng)分類方法更具優(yōu)勢,例如它是無參分類器,能處理不符合高斯分布的數(shù)據(jù),并且能處理以任何尺度、數(shù)量及以任何測量方式記錄的數(shù)據(jù)。
眾所周知,證據(jù)支持度是應(yīng)用 DS理論的關(guān)鍵一步[11-12]。然而,由于DS理論創(chuàng)立時考慮到其通用性,沒有規(guī)定如何計算證據(jù)支持度,即基本概率分配(BPA)[13-14],這就給證據(jù)推理方法的應(yīng)用帶來了很多困擾。目前,有關(guān)從遙感影像生成證據(jù)支持度的研究不多,僅有的一些研究中,證據(jù)支持度生成方法較為主觀,沒有形成規(guī)范的、客觀的模式。Peddle等人最早集中研究了不同數(shù)據(jù)類型的證據(jù)生成方法,針對遙感影像提出了頻率分布(FD)方法計算證據(jù)支持度,很多研究都是基于該方法而完成的[15]。然而,該軟件目前并未商業(yè)化,且其提供的方法繁瑣。李華朋等提出了計算遙感影像證據(jù)支持度的最小距離法(MD),取得了較好的效果。筆者將通過證據(jù)推理遙感分類精度來對比MD與FD方法在計算遙感影像證據(jù)支持度方面的能力。
選擇洪河濕地自然保護區(qū)極其周圍地區(qū)為研究區(qū),這一地區(qū)為重要的濕地保護區(qū),高精度的遙感分類信息對于濕地管理和保護很有意義。該區(qū)屬于溫帶濕潤大陸性氣候,其特點是冬長嚴(yán)寒,夏短炎熱。年平均氣溫2.2℃,多年平均降水量為603.8mm,全年平均蒸發(fā)量為1 257.1mm。結(jié)合以往研究和筆者選擇的影像的分類能力,將本區(qū)域分為6種類型:沼澤、草甸、旱田、水田、林地、建筑用地。
選擇覆蓋研究區(qū)1景Landsat 7 ETM+遙感影像,影像成像時間為2007年9月22日,行列號為118/26。影像成像時間天氣情況良好,影像的含云量均小于5%。該影像從美國地質(zhì)調(diào)查局地球資源觀測系統(tǒng)數(shù)據(jù)中心(http://glovis.usgs.gov/)下載得到,數(shù)據(jù)在分發(fā)前經(jīng)過了輻射校正和幾何校正,達到了1 G質(zhì)量水平?;贓RDAS軟件對該影像進行裁切,裁切的影像包括了全部洪河保護區(qū)以及周圍地區(qū),面積約為4.94×103hm2。
精確訓(xùn)練樣本的采集對于證據(jù)推理方法的成功應(yīng)用至關(guān)重要。一般的訓(xùn)練樣本采集方法是基于野外實地采樣或直接從高分辨率遙感影像(Quick bird,IKONOS)上采樣。本研究采取了野外采樣點結(jié)合地形圖及ETM+影像的方法采集各類別訓(xùn)練樣本。有研究表明,TMETM+影像能識別的最小濕地斑塊為大約11個像元組成的斑塊[16]。因此,在訓(xùn)練點和驗證點的采樣過程中,確保選擇的典型樣點必須位于至少由11個像元組成的斑塊內(nèi)部,保證濕地斑塊的可識別性和降低幾何糾正誤差對于采樣的影響。利用分層隨機采樣方法采集了訓(xùn)練點7674個,其中蘆葦2010個,建筑用地947個,水田1 094個,旱地1 295個,林地1 328個,濕草甸1 000個。
對于驗證點采用與訓(xùn)練點相同的采樣方法,即選擇的典型樣點必須滿足最小距離其它類別邊緣2個像元以上的條件。各類別驗證點絕對不與訓(xùn)練點重復(fù),保證精度驗證的獨立性。一般認為在遙感精度驗證時每一類別至少保證30~50個驗證點。本研究采用分層采樣方法共采集了驗證點904個,其中蘆葦2010個,建筑用地947個,水田1 094個,旱地1 295個,林地1 328個,濕草甸1 000個。建立誤差矩陣,計算Kappa系數(shù)來表示分類結(jié)果分類精度。
證據(jù)推理方法的識別框架、基本概率分配函數(shù)、證據(jù)累積規(guī)則、分類決策等問題已經(jīng)有很多文獻進行了陳述和討論。識別框架是證據(jù)推理的基礎(chǔ),基于對本研究區(qū)的調(diào)查及本研究目標(biāo),制訂了本研究識別框架:{沼澤,城鎮(zhèn),水田,旱地,林地,草甸}。因為在遙感背景下,本研究只對單子集感興趣,因此識別框架可以簡化為{沼澤},{城鎮(zhèn)},{水田},{旱地},{林地},{草甸}。
FD(Frequency Distribution)方法主要以統(tǒng)計的樣本點生成的證據(jù)支持度為基礎(chǔ),其突破點即其加入了一個滑動窗口,這樣就保證了證據(jù)能傳播到未出現(xiàn)在樣本中的數(shù)值。并且滑動窗口具有證據(jù)權(quán)重分配功能,即越接近出現(xiàn)樣本點的數(shù)值,其證據(jù)支持度越高。這符合地理學(xué)第一定律,即相鄰的事物相似,遠離的事物相異。其計算過程如下:設(shè)定f為類別n樣本點i的出現(xiàn)頻數(shù)(數(shù)量),則該樣本點i的證據(jù)支持度為:
其中T為類別n所有樣本點數(shù)量。為了滿足地理學(xué)第一定律,通過滑動窗口生成的證據(jù)支持度需要滿足條件:
滑動窗口的計算公式為:
式中:a為f(i)出現(xiàn)的頻數(shù);b為滑動窗口的大小;設(shè)定遞減度為2,滿足了地理學(xué)第一定律的要求,使得越靠近樣本點的非樣本點數(shù)值計算分配到的證據(jù)支持度越大。
該方法的突出優(yōu)點是計算證據(jù)支持度數(shù)據(jù)源不需要滿足正態(tài)分布規(guī)律,但其存在的最大問題是計算得到的證據(jù)支持度過小。以本研究區(qū)為例,第二波段對于水田和沼澤的最高證據(jù)支持度僅為0.138 4和 0.049 1(圖1(a),(b)),這顯然過小,不利用遙感分類研究中正確類別的有利識別。
圖1 FD和MD方法生成的水田證據(jù)支持度
基于FD方法的不足,李華朋等提出了MD(Minum Distance)方法計算遙感影像證據(jù)支持度。它的原理同樣是地理學(xué)第一定律。不同的是,它通過引入平均值,對比不同樣本點與平均值的最小距離來分配證據(jù)支持度。最小距離平均值點越近的其分配到的概率越大,反之亦然。最小距離法最大的優(yōu)勢是可以實現(xiàn)多波段聯(lián)合計算,從而生成合理的證據(jù)支持度。針對ETM+影像而言,本研究提出的針對比率數(shù)據(jù)的證據(jù)支持度生成方法共分為3步。
①計算所用ETM+影像6個波段每種類別的反射率平均值,構(gòu)成6×1大小的平均值矩陣。平均值的計算來自于選擇的訓(xùn)練樣本,因為研究區(qū)共有6個類別,這樣構(gòu)成平均值矩陣 Mi,p的維度為6×6,i、p 分別表示類別、波段號。
②計算ETM+影像每一個像元到每種類別平均值矩陣的最小距離之和:
式中:Px,y,p表示 p波段像元在二維影像系統(tǒng)中坐標(biāo)為(x,y)的像元值,Mi,p表示p波段類別i的平均值矩陣。通過上式的計算,可以將ETM+影像的6個波段信息納入不同類別支持度生成中,充分利用了ETM+多波段光譜信息。
③將計算得到的像元Xi與平均值矩陣的最小距離歸一化為基本概率分配:
di為式(4)得到的最小距離值,n為確定的識別框架的單子集類別數(shù)量。
分別建立6個證據(jù)推理的分類模型來表示使用遙感影像不同波段組合下證據(jù)推理分類精度變化特征。模型1代表利用ETM+影像的第1波段,模型2代表1+2波段,模型3代表1+2+3波段,以此類推。對于MD方法來說,直接利用波段組合生成各類別的證據(jù)支持度,以支持度最大為劃分像元歸屬類別原則得到分類圖;對于FD方法,則單獨生成每一個波段對各類別的證據(jù)支持度,通過證據(jù)累積后,同樣以支持度最大為劃分像元歸屬類別原則得到分類圖。分別對兩種分類圖建立誤差矩陣,提取Kappa系數(shù)來表達分類精度變化情況(表1)??梢钥闯?,隨著累積波段數(shù)量的增加,基于FD方法分類模型的分類精度穩(wěn)步升高,隨著第2到第6波段的加入,其分類的Kappa系數(shù)從0.4753提高到0.661,多證據(jù)的累積不斷地提高分類精度。而基于MD方法的分類模型,其分類精度隨著波段數(shù)量的增加并不呈現(xiàn)出線性上升趨勢。第2波
段的加入大幅度提高了分類精度,而第3波段加入后反而降低了分類精度,第4波段的加入又一次較大幅度提高了分類精度,但加入第5、第6波段后分類精度變化不大,反而有一定降低。
表1 基于兩種證據(jù)支持度生成方法不同分類模型的分類精度變化特征
顯然,在3個波段及以下的模型中,基于FD方法的證據(jù)推理分類精度比基于MD方法的分類精度高;而在3個波段以上的模型中,基于MD方法的分類精度顯然高于基于FD方法的證據(jù)推理分類精度。這說明在使用多波段數(shù)據(jù)的(大于3)情況下,MD方法比FD方法在生成證據(jù)支持度方面更具優(yōu)勢;而在使用較少波段下,F(xiàn)D方法更具優(yōu)勢。事實上,大部分研究都是基于多個波段,這樣可以充分利用影像的信息。因此,MD方法的提出為合理使用證據(jù)支持度生成方法提供了有益的借鑒。
圖2表示了在使用ETM+影像6個波段情況下基于FD方法及MD方法的研究區(qū)證據(jù)推理遙感分類結(jié)果,顯然,基于MD方法的分類結(jié)果更好。對于沼澤、林地、水田等研究區(qū)主要類別的識別準(zhǔn)確率更高,而基于FD方法的分類結(jié)果中,只有城鎮(zhèn)類別識別較好。這與圖2中的結(jié)果相一致。
圖2 使用ETM+影像6個波段情況下研究區(qū)證據(jù)推理遙感分類精度
在使用較少波段的情況下(3個波段及以下),基于FD方法生成的證據(jù)支持度證據(jù)推理遙感分類精度更高;而在使用多個波段的情況下(3個波段以上),基于MD方法生成的證據(jù)支持度證據(jù)推理遙感分類精度更高。并且,基于FD方法的證據(jù)推理分類精度隨著波段的數(shù)量的累積,其分類精度穩(wěn)步提高;而基于MD方法的證據(jù)推理分類精度則不呈現(xiàn)規(guī)律變化。盡管如此,研究發(fā)現(xiàn)使用MD方法可能達到的最高分類精度是FD方法所不能達到的。因此,總體上來看,MD方法比FD方法具有優(yōu)勢。本研究選擇的區(qū)域和驗證數(shù)據(jù)較為單一,未來研究應(yīng)將這種對比研究應(yīng)用于更多區(qū)域和更廣泛的數(shù)據(jù)類型,進一步驗證這兩種方法在生成遙感影像證據(jù)支持度方面的能力。
[1] Cohen Y,Shoshany M.Analysis of convergent evidence in an evidential reasoning knowledge-based classification[J].Remote Sensing of Environment,2005,96(3/4):518-528.
[2] 李華朋,張樹清,孫妍.合成孔徑雷達在濕地資源研究中的應(yīng)用[J].自然資源學(xué)報,2010,25(1):148-154.
[3] Franklin S E,Peddle D R,Dechka J A,et al.Evidential reasoning with landsat TM,DEM and GIS data for landcover classification in support of grizzly bear habitat mapping[J].International Journal of Remote Sensing,2002,23(21):4633-4652.
[4] Mertikas P,Zervakis M E.Exemplifying the theory of evidence in remote sensing image classification[J].International Journal of Remote Sensing,2001,22(6):1081-1095.
[5] Congalton R G.A review of assessing the accuracy of classifications of remotely sensed data[J].Remote Sensing of Environment,1991,37(1):35-46.
[6] Foody G M.Status of land cover classification accuracy assessment[J].Remote Sensing of Environment,2002,80(1):185-201.
[7] Lein J K.Applying evidential reasoning methods to agricultural land cover classification[J].International Journal of Remote Sensing,2003,24(21):4161-4180.
[8] 鄧文勝,邵曉莉,劉海,等.基于證據(jù)理論的遙感圖像分類方法探討[J].遙感學(xué)報,2007,11(4):568-573.
[9] 方勇.證據(jù)推理應(yīng)用于多源信息融合分析[J].遙感學(xué)報,2000,4(2):106-111.
[10] Peddle D R,F(xiàn)erguson D T.Optimisation of multisource data analysis:an example using evidential reasoning for GIS data classification[J].Computers & Geosciences,2002,28(1):45-52.
[11] Peddle D R,F(xiàn)ranklin S E.Multisource evidential classification of surface cover and frozen ground[J].International Journal of Remote Sensing,1992,13(17):3375-3380.
[12] Peddle D R.Knowledge formulation for supervised evidential classification[J].Photogrammetric Engineering and Remote Sensing,1995,61(4):409-417.
[13] Sun W X,Liang S L,Xu G,et al.Mapping plant functional types from MODIS data using multisource evidential reasoning[J].Remote Sensing of Environment,2008,112(3):1010-1024.
[14] Na X D,Zhang S Q,Zhang H Q,et al.Integrating TM and ancillary geographical data with classification trees for land cover classification of marsh area[J].Chinese Geographical Science,2009,19(2):177-185.
[15] Wilkinson G G,Megier J.Evidential reasoning in a pixel classification hierarchy-a potential method for integrating image classifiers and expert system rules based on geographic context[J].International Journal of Remote Sensing,1990,11(10):1963-1968.
[16] Wright C,Gallant A.Improved wetland remote sensing in Yellowstone National Park using classification trees to combine TM imagery and ancillary environmental data[J].Remote Sensing of Environment,2007,107(4):582-605.
Comparison Between Evidence Measures Generated from Satellite Images Under the Background of Supervised Evidential Classification
/Zhang Guangyu(School of Forestry,Northeast Forestry University,Harbin 150040,P.R.China);Li Huapeng(Northeast Institute of Geography and Agroecology,Chinese Academy of Forestry)//Journal of Northeast Forestry University.-2011,39(6).-80~82,113
Land cover classification;Evidential reasoning;Evidence measures;Minimum distance algorithm;Frequency distribution method
P237
張光裕,男,1984年6月生,東北林業(yè)大學(xué)林學(xué)院,碩士研究生。
2011年3月15日。
責(zé)任編輯:戴芳天。
A scene of ETM+imagery covered Honghe National Nature Reserve was chosen to compare the ability of two algorithms,the minimum distance(MD)algorithm and the frequency distribution(FD)algorithm,in generation EM for supervised evidential classification.Results show that the FD algorithm is superior to the MD algorithm when using the first three or fewer bands of ETM+imagery,while the MD algorithm is better when using the first four or more bands for classification.It indicates that the EM generation algorithm directly affects the accuracy of the supervised evidential classification,and the MD algorithm has advantages when using multi-bands of ETM+imagery for EM generation.