肖 昶,張 莉
(1. 湖北省基礎地理信息中心,湖北 武漢 430074; 2. 湖北省測繪成果檔案館,湖北 武漢 430074)
地理國情監(jiān)測已經進入到了常態(tài)的動態(tài)監(jiān)測階段,其主要工作方式為在統(tǒng)一底圖上,使用最新的遙感數據對既有成果進行變化檢測和數據更新[1]。而隨著遙感事業(yè)的飛速發(fā)展,越來越多的新型設備和新的處理方法不斷涌現(xiàn),使遙感數據來源多樣,質量不斷提升,推動遙感數據在地理國情監(jiān)測中廣泛應用[2]。但遙感數據源的復雜性和龐大數據量,使選擇地理國情監(jiān)測數據源成為難題,有必要對各種遙感數據源進行對比評價,以選擇成本更低、精度更高的數據源,更好地為地理國情監(jiān)測服務[3]。
許多專家學者對相關問題進行了研究。文獻[4]基于空間分辨率和成圖比例尺提出了選擇航天遙感數據源的依據,選擇出了適用于第二次全國土地調查的航天遙感數據源,但其適用范圍具有一定的局限。文獻[5]討論了可見光、多光譜及高光譜數據的波譜特征、云量,以及光照、價格等因素,為公路區(qū)域生態(tài)環(huán)境監(jiān)測中數據的選取提供了依據,但其僅針對公路進行了研究。文獻[6]依據地質災害調查中的區(qū)域類型、精度要求及解譯效果、最佳成圖比例尺等提出數據選取原則,對滑坡災害不同時期的數據實現(xiàn)選取和處理,但其方法適用于災害研究及其數據的處理,所得的方法也并不適用于常態(tài)的地理國情監(jiān)測研究。
本文對地理國情監(jiān)測數據源的種類、光譜特性、時相、分辨率、影像質量及價格等影響其質量和實用性的主要因子進行分析,針對不同需求提出對應的指標體系。在此基礎上提出一種結合主觀專家評價和客觀熵值計算的比選方法。首先綜合人工賦權和熵值法自動賦權兩種方法,對各因子給予相應的權重;然后加權求和,得到比選指標結果;最后比較分析,選擇評分最優(yōu)的數據源作為待選數據源。
數據源對地理國情監(jiān)測的生產效率和產品精度都具有決定性作用。近年來,遙感數據源種類不斷增加,由于其特征參數存在諸多差異,如何從大量復雜的遙感數據中選取最佳地理國情監(jiān)測的數據源成為亟需解決的問題。
地理國情監(jiān)測的數據源主要有以下幾類:中、低分辨率遙感影像數據,包括衛(wèi)星影像如Landsat 7和Landsat 8衛(wèi)星的影像數據等;高分辨率影像數據,如航空像片、Spot 5、高分一號、高分二號、資源三號數據等;無固定分辨率的數據,如Google影像等[7]。各類遙感數據源見表1。
表1 地理國情監(jiān)測的主要遙感數據源
評價遙感數據源主要有兩類指標,一類為遙感研究對象的地理特性,即地物的空間分布、波譜特性、數據的時相等,對應了空間分辨率、光譜分辨率、輻射分辨率和時間分辨率[8]4個分辨率指標;另一類為具體應用特性,包括精度要求、類型、成本等。若需要提取幾何結構參數,通常使用航空像片、激光雷達或多角度觀測數據;若需要提取非表面信息,通常使用微波遙感;若需要獲取生化參數,通常選擇高光譜數據。實踐中可基于這兩類指標,建立評價體系對數據源進行綜合評價選取[9]。
地理國情監(jiān)測數據源選擇時,不僅需要考慮數據自身屬性,還需要考慮數據處理分析及相關產品的要求,如比例尺、覆蓋面積、地形特征、地物類別及分布等[10]。若同一年不同季節(jié)的影像,應選擇適宜時相的影像以更好地反映地物特征;若影像數據源的時相適宜但分辨率較低,可用分辨率較高的舊影像作為輔助;為保證數據覆蓋,需要選擇同一地區(qū)不同時相的影像進行對比研究[11]。地理國情監(jiān)測中常用的數據源選擇指標包括分辨率、時相、價格、覆蓋范圍、地形、經濟、人文等要素。
本文研究從反映影像質量、解譯和應用效果等方面出發(fā),選取空間分辨率、時相、波段特征、含云量和價格指標,通過賦權,建立指標體系,評價數據源,實現(xiàn)地理國情數據源的選取。由于不同的研究對象對指標有不同的需求,本文分別針對水體、植被、建筑3種地理國情監(jiān)測對象,對遙感數據源進行分析和評價[12]。
水體會隨季節(jié)變化,對其進行研究時需要得到較為完整的信息,故時相選擇尤為重要[13]。同時,無論在哪一波段,水體的圖像特征均呈現(xiàn)深色調,與周圍地物相比反差較大,且這種特性不會隨區(qū)域與時相變化,反差大時分辨率適當降低也能由于其差別過大而被識別,因此對于分辨率的要求可適當降低[14]。而含云量與價格可以看作固有屬性,云量會影響后續(xù)研究,而價格較為固定,但選擇可以多樣,研究者可以根據經濟狀況作出選擇,其重要程度相對較低。
植被分析上與水體大致相似,時相要求高。選擇植被茂盛、信息量豐富的影像較為重要[15]。分辨率方面在信息豐富的程度上能準確判別其與其他地物的差別即可。含云量與價格考慮相同。
由于環(huán)境較為復雜,建筑物比選有別于前兩者,包含各種主次干道、房屋、地物,且在城市中排布緊密,故空間分辨率要求較高。建筑物體隨時間變化不大,時相考慮上主要受周邊水體、植被影響,因此權重值不與水體和植被一樣大??紤]到城市建筑較為集中,較大云量會遮蔽大量信息,因此含云量給予較大權重。價格同樣是作為輔助參考[16]。
本文綜合專家評價法和熵值法對各數據源的評價指標進行賦權并計算得綜合分值,通過比較分值得到最佳數據源。操作流程如圖1所示。
2.3.1 專家評價法
不同的研究對象對指標有不同的需求,本文針對水體、植被、建筑3種研究對象,根據參考文獻和專家評價調研結果,依據研究對象的不同,對相應數據的指標賦予不同權重。
水體的范圍會發(fā)生季節(jié)性變化,因此數據的時相信息尤為重要,賦予40%的權重。由于水體反射作用較強,在大多數波段的圖像都呈現(xiàn)深色調,與周圍地物反差較大,且不產生區(qū)域性與時間性的變化,因此對于數據源分辨率的要求可適當降低,將其權重定為20%。波段數過少或過多對于信息的提取都有影響,將其權值定為10%。含云量與價格可以看作固有屬性,云量會影響研究效果,設權重為20%,以保證數據完整性與可用性。影像數據價格相對便宜,重要程度相對較低,權值定為10%,以提供參考。
植被的評價指標賦權與水體大致相似,在本文中需選擇植被茂盛、信息量豐富的影像。植被的研究對時相要求較高,設定比重為40%。分辨率上在信息豐富的程度上能準確判別其與其他地物的差別即可,權重設為20%。波段數的權重設為20%,含云量為10%、價格為10%。
建筑物所處環(huán)境復雜,且排布緊密。準確識別建筑物對象需要較高的分辨率,將其權值賦為40%。由于建筑物隨時間變化較小,其時相因素主要受周邊水體、植被影響,所賦權重略小,為20%。由于城市建筑較為集中,較大云量會遮蔽大量信息,影響較大,其權重設為25%。波段數和價格同樣是作為輔助參考,波段數權重為10%,價格權重為5%。
將各評價指標值轉換成相應的分值,再依據權重進行加權求和。計算過程如下:
針對不同的研究對象,空間分辨率的閾值設定差別較大,水體閾值為30 m;植被為5 m;建筑物為2.5 m。空間分辨率等于閾值時,其轉換評分值V1為1,分辨率為其他值時,評分等于閾值R與當前空間分辨率R1的比值,本文方法中,分辨率值越接近閾值,評分越高。
V1=1-0.01·|R1-R|
(1)
時相評分值M1以月份為單位,不同地物對應的最佳研究值M為:水體:5、8月;植被5、6月;建筑1、2月。時相為最佳值時,轉換評分值V2為0.7;時相為其他值時,轉換評分值V2均以每間隔最優(yōu)值一個月遞減0.2計算。
V2=1-|M1-M|·0.1
(2)
含云量低于10%時,評分值V3為1,高于10%時,評分值V3的計算以含云量C越高,評分值越低為原則。
V3=1.1-C
(3)
設定波段數為B1,其最佳值B在3~15之間,在此范圍內,波段數評價值為1,若不在此范圍內,則距離兩邊界值越遠,得分值越低。計算公式為
V4=1-0.1·|B1-B|
(4)
經調研,設定價格閾值為500元,其他值評分V5為最能接受的代價值P除以當前代價值P1所得。
V5=P/P1
(5)
最終得分值V為4種評價值進行加權運算得到。
V=V1·a+V2·b+V3·c+V4·d+V5·e
(6)
式中,a、b、c、d、e為各評價指標對應的權重。
一般而言,專家評價法具有較高的可靠性,但是專家的權威性、專家小組組成的合理性、專家們評價的主觀傾向性等是選擇專家組合設計評價模型時需要解決的問題[17]。
2.3.2 熵值法賦權計算
熵值法是指利用評價指標自身的信息來確定其價值的一種方法。熵是一種信息無序度的度量,熵值越大,信息的無序度越高,反之,熵值越小,信息的無序度越小,信息的有效度越大,可以用信息熵值來判斷評價指標的有效性。其原理為:
將數據存儲為矩陣Xij(m×n),進行最大標準化處理,得到矩陣Yij(m×n),即Yij=Xij/max(Xij)。通過下列公式[12]計算第j項指標的熵值ej(0≤ej≤1)和信息效用值dj。
(7)
式中,k=1/lnm;dj=1-ej。
則各指標的權重為
qj=dj/∑dj
(8)
所有數據源的評價值為
(9)
2.3.3 綜合主觀評價法和客觀評價法的數據源比較評價
根據相關文獻統(tǒng)計,武漢市武昌區(qū)的各種地形類物中,水體占約43.43%,植被占約15.02%,將剩余占41.55%部分均按照建筑物的評分方法進行評價。根據多次試驗和與實際情況對比結果,將主觀評價法所得結果M1賦予55%的權重,將客觀評價法所得結果M2賦予45%的權重,則各數據源的最終得分M的計算結果為
M=M1×55%+M2×45%
(10)
其中,通過對水體、植被、建筑物3種地物的評價結果分別按照地物分布比例賦權重,再加權計算,得到主觀評價法的總得分計算結果,相應公式為
M1=Mwater×43.43%+Mvegetation×15.02%+Mbuilding×41.55%
(11)
式中,Mwater、Mvegetation和Mbuilding分別表示針對水體、植被和建筑物的數據評價結果。
本文采用的數據范圍為武漢市武昌區(qū),包括Landsat 8影像、Planet影像、資源3號影像、高分1號影像、高分2號影像、航攝影像及Google影像數據,詳細參數見表2。
表2 遙感數據源參數
本文分別采用綜合專家評價法和熵值法的方法,對各數據源的空間分辨率、時相、波段數、含云量、價格5個參數進行權重和評分計算,并基于Windows10系統(tǒng)和VS2017平臺開發(fā)了系統(tǒng),實現(xiàn)了通過依次輸入多個數據源的參數,計算相應的評價結果并將結果錄入文檔中。評價對比結果如圖2所示。
可見,針對不同地物目標,各數據像的評價結果不盡相同,采用不同的評價方法得到的結果也不相同。其中,數據1為進行水體和植被研究的最優(yōu)數據,數據6為進行建筑物研究的最優(yōu)數據。若提取3種地物,基于專家評價法可得數據1為最優(yōu)數據源;根據熵值法數據2為最佳數據源;綜合主觀評價法和客觀評價法可得,數據6為最佳數據源。
分析數據參數可知,數據1的時相和分辨率均滿足水體研究的閾值,在水體研究中具有明顯優(yōu)勢;數據1的時相也是植被研究的最佳時相,而時相對于植被的研究權重較大,同時數據1的分辨率也與植被研究分辨率閾值接近,因此數據1提取植被也有優(yōu)勢。雖然數據3分辨率最接近建筑物提取的分辨率閾值,但其時相與閾值相差較大,而數據6的時相與建筑物提取時相閾值最接近,其他參數相差不大,因此數據6為更適合建筑物研究的最優(yōu)數據。在實際生產中,由于航空影像分辨率較高,且其獲取時分辨率、時相等參數可控性更高,其應用也最為廣泛。因此本文研究所得結果與實際研究相符,評價結果較為合理。
本文綜合選取遙感數據的分辨率、時相、波段數、含云量和價格5項指標,設計和實現(xiàn)了一種結合主觀專家評價和客觀熵值計算的地理國情監(jiān)測數據源比選方法。得到如下結論:
(1) 利用熵值法賦權,不受主觀因素的干擾,可基于數據的物理特性,對數據源進行總體評價。
(2) 利用專家評價法賦權,可充分利用先驗知識,明確各因素的應用價值,對數據源的應用價值進行總體評價。
(3) 數據源對不同種類地物的提取的影響程度不同。需要針對不同研究對象制定不同的評分標準。綜合主觀評價法和客觀評價法對數據源進行評價比選,可充分發(fā)揮兩種方法的優(yōu)勢,彌補各自的不足,使評價體系和方法更加科學有效,獲得的評價結果更加合理可靠。
后續(xù)工作將對數據源的評價比選標準和方法展開進一步優(yōu)化,以使參數挑選更加合理,賦權更加科學,計算更加自動化,更大程度地實現(xiàn)地理國情監(jiān)測數據源比選的自動化和智能化。