王 玉, 張萬昌, 李旺平, 陳 豪,3, 高會(huì)然,3, 黨星海
(1.蘭州理工大學(xué),蘭州 730050; 2.中國科學(xué)院空天信息創(chuàng)新研究院,北京 100094;3.中國科學(xué)院大學(xué),北京 100049)
水資源是人類社會(huì)生產(chǎn)發(fā)展的物質(zhì)基礎(chǔ),明確水資源分布是維持社會(huì)可持續(xù)發(fā)展、合理調(diào)控水資源和生態(tài)系統(tǒng)平衡等領(lǐng)域的重要研究內(nèi)容[1-2]. 傳統(tǒng)人工監(jiān)測水體方法耗時(shí)耗力,難以大范圍監(jiān)測[3]. 遙感技術(shù)的發(fā)展,使得低成本和大范圍的水體監(jiān)測成為可能. 目前為止,遙感技術(shù)已經(jīng)成功應(yīng)用于水體面積、水位、蓄水量和徑流量等水體監(jiān)測與研究之中[4-5]. 其中,Landsat衛(wèi)星影像由于具有長達(dá)40多年的免費(fèi)中高空間分辨率影像,被廣泛應(yīng)用于水體監(jiān)測之中[6].
目前針對遙感影像的水體提取方法主要包括水體指數(shù)法、監(jiān)督分類法、水體特征法等[7-8]. 水體指數(shù)法是以1996年McFeeters提出的歸一化差異水體指數(shù)法(Normalized Difference Water Index,NDWI)和2005年徐涵秋提出的改進(jìn)歸一化差異水體指數(shù)法(Modified Normalized Difference Water Index,MNDWI)為代表的一類水體提取方法[9-10]. 因其簡單易行,精度較高,已被廣泛應(yīng)用于各類水體提取研究中[11]. 但隨著更精細(xì)的多光譜影像波段劃分,水體指數(shù)法已經(jīng)不能完全滿足研究者的需求[12]. 因此許多研究者致力于研究高精度的水體提取方法,如Muller等使用180 000個(gè)分為26類的樣本點(diǎn),運(yùn)用基于機(jī)器學(xué)習(xí)的監(jiān)督分類法提取Landsat影像水體,取得了良好的精度[13]. Tulbure等利用水體指數(shù)法耦合監(jiān)督分類,提取半干旱地區(qū)30年次大陸尺度的水體. 此方法在水體提取時(shí)考慮了凸顯水體特征的水體指數(shù),減少了樣本需求,也獲得了高精度的水體提取結(jié)果[14].
凸顯水體特征可以提高水體提取精度,水體特征法被發(fā)展以期獲得高精度的水體提取結(jié)果. 如Jia等針對Landsat 8_OLI(Operational Land Imager,OLI)影像,利用基于光譜匹配的離散粒子群優(yōu)化方法(Spectral Matching Based Discrete Particle Swarm Optimization,SMDPSO)對全球典型區(qū)域水體進(jìn)行提取. 該方法深度挖掘了OLI影像7個(gè)波段的水體特征信息,獲得可以描述水體特征的水體概率分布. 在此基礎(chǔ)上利用離散粒子群優(yōu)化方法(Discrete Particle Swarm Optimization,DPSO)進(jìn)行水體提取和優(yōu)化,取得了較高的水體提取精度[15]. SMDPSO方法能提取小水坑和細(xì)小支流等水體,但也會(huì)將雪冰、機(jī)場、云及云陰影等地物錯(cuò)判為水體. 該方法提取水體主要依賴于水體概率,而水體概率的計(jì)算依據(jù)與水體光譜曲線的相似程度較高,因此會(huì)將與水體具有相似光譜曲線的地物如雪冰、機(jī)場、云及云陰影等誤判為水體.
為了降低SMDPSO 方法對與水體光譜特征相似的非水體的誤判率,本文利用最大熵模型(Maximum Entropy Model,MaxEnt)耦合DPSO 方法,構(gòu)建耦合最大熵模型的離散粒子群方法(Maximum Entropy Model Based Discrete Particle Swarm Optimization,MEDPSO),提取了全球6個(gè)不同氣候和水體類型的Landsat 8_OLI影像水體. 探討MEDPSO方法的科學(xué)性和合理性,以期提高DPSO方法的水體提取精度以及該方法在遙感提取水體上的應(yīng)用水平.
MEDPSO 方法利用MaxEnt 模型替換SMDPSO 中的光譜匹配方法(Spectral Matching,SM)計(jì)算水體概率,提取OLI影像水體. 該方法主要分為兩步:①M(fèi)axEnt模型計(jì)算水體概率,參考AUC 指標(biāo)選擇熵最大水體概率分布圖. ②通過DPSO方法進(jìn)行水體優(yōu)化和提取,得到最優(yōu)的水體分布. 其方法流程設(shè)計(jì)如圖1.
SM方法通過計(jì)算參考光譜o 和地物光譜w 之間的相似度,定量衡量地物與參考地物的相似程度[16]. 最小距離法和光譜角匹配法是光譜匹配中常用的方法,Jia等計(jì)算水體概率式(1)結(jié)合考慮了距離相似度(dist)和光譜角相似度(cos)[15].
圖1 MEDPSO方法水體提取流程圖Fig.1 MEDPSO method water extraction flow chart
最大熵可根據(jù)少量已知信息對未知信息的分布進(jìn)行無偏推斷,認(rèn)為熵最大的事物最可能接近它的真實(shí)狀態(tài)[17]. 2004年P(guān)hillips等依據(jù)最大熵原理開發(fā)了MaxEnt模型,只需少量水體樣本點(diǎn)和環(huán)境變量,就能準(zhǔn)確評估環(huán)境變量中水體概率的高低[18].
本文采用3.4.1版Maxent模型,需要輸入以ASCII為格式的環(huán)境變量和以CSV為格式的樣本點(diǎn)經(jīng)緯度坐標(biāo). 環(huán)境變量包括:輻射定標(biāo)的1~7波段影像,NDWI、MNDWI、NDVI(Normalized Difference Vegetation Index,NDVI)、AWEI(Automated Water Extraction Index,AWEI)等水體指數(shù)計(jì)算的影像[19]. 通過目視解譯OLI水體影像,在該區(qū)域中隨機(jī)選取樣本點(diǎn). MaxEnt模型參數(shù)設(shè)置,選擇受試者工作特征ROC曲線(Create Response Curves,ROC)評價(jià)MaxEnt 模型挖掘水體特征建立預(yù)測模型的準(zhǔn)確性[20-21]. 綜合參考建模與測試的AUC 評價(jià)指標(biāo),選取最優(yōu)的水體概率分布輸入DPSO方法.
DPSO方法已被廣泛地應(yīng)用于圖像匹配、圖像增強(qiáng)、數(shù)據(jù)挖掘、多目標(biāo)優(yōu)化等研究領(lǐng)域[22]. DPSO中的每一個(gè)D維粒子都代表適應(yīng)度評價(jià)函數(shù)T的一個(gè)可行解,可行解具有位置向量Xi=[Xi1,Xi2,…,XiD]和改變速率向量Vi=[Vi1,Vi2,…,ViD]兩個(gè)特征[23]. DPSO方法構(gòu)建由0,1組成的離散粒子群XID,其中每一個(gè)Xi都表示一個(gè)4×4柵格的水體分布. 適應(yīng)度評價(jià)函數(shù)結(jié)合了離散粒子群與最大熵概率分布,賦予粒子水體概率信息. 通過T值對攜帶水體概率信息的粒子群進(jìn)行評價(jià),尋找歷史最優(yōu)Pid和全局最優(yōu)Pgd. DPSO方法具體優(yōu)化步驟如:①初始化粒子群XID和VID;②計(jì)算適應(yīng)度評價(jià)函數(shù)T,尋找Pid和Pgd;③通過Vid學(xué)習(xí)Pid和Pgd,更新Xid;④比較Xid與Pid和Pgd,更新Pid和Pgd;⑤判斷是否滿足終止條件,是則結(jié)束,否則繼續(xù)③~④直至滿足條件為止.
本文通過目視解譯驗(yàn)證區(qū)域制作水體驗(yàn)證數(shù)據(jù)集,統(tǒng)計(jì)SMDPSO方法和MEDPSO方法水體提取中與水體驗(yàn)證數(shù)據(jù)集分類一致(正確像元)、分類不一致(錯(cuò)誤像元)及影像總像元(總像元)個(gè)數(shù)組成混淆矩陣[24]. 計(jì)算總體精度、Kappa系數(shù)、錯(cuò)分誤差、漏分誤差,定量評估SMDPSO方法和MEDPSO方法提取水體的精確度.
為了驗(yàn)證MEDPSO 水體提取方法的通用性,選取全球6個(gè)不同氣候條件和水體類型的研究區(qū)(表1)進(jìn)行水體提取. 參照J(rèn)ia等(2018)SMDPSO方法的研究,選取A~D區(qū)域,其中SMDPSO方法在A~B區(qū)域具有較好的水體提取精度. 在此區(qū)域進(jìn)行方法對比,可以驗(yàn)證Maxent 模型耦合DPSO 方法水體提取的可行性.SMDPSO 方法在提取C~D 區(qū)域水體時(shí),某些地物處具有較高的錯(cuò)分誤差,因此可以檢驗(yàn)MEDPSO 對水體提取精度提高的有效性. SMDPSO 方法將雪冰、云及云陰影等完全誤判為水體,因此選取E、F 區(qū)域驗(yàn)證MEDPSO方法在相同條件下水體提取的適用性.
表1 MEDPSO與SMDPSO方法水體提取研究區(qū)Tab.1 MEDPSO and SMDPSO method water extraction research areas
在A~D 研究區(qū)中,選取與SMDPSO 方法相同的驗(yàn)證區(qū)域a~d作為MEDPSO 方法的驗(yàn)證區(qū)域. E~F 區(qū)域分別選擇具有云覆蓋、冰雪等e~f區(qū)域,作為研究雪冰、云與云陰影對MEDPSO方法提取水體精度的影響.
本文使用的OLI影像共有9個(gè)波段,除波段8是空間分辨率為15 m的全色波段外,其余波段的分辨率均為30 m. 該影像來源于從美國地質(zhì)調(diào)查局(https://earthexplor er.usgs.gov/),L1TP 影像通過地面控制點(diǎn)校正具有較高的精度.
利用IDL(Interactive Data Language,IDL)對OLI 影像1~7波段批量進(jìn)行輻射定標(biāo)處理,裁剪歸一化處理后,研究區(qū)A~F 和驗(yàn)證區(qū)a~f 區(qū)域,按波段6(red)、波段5(green)及波段3(blue)假彩色顯示(如圖2). 基于PyCharm 平臺(tái)編寫代碼調(diào)用ArcPy 模塊,將影像轉(zhuǎn)化成最大熵模型可讀的ASCII格式. 使用ArcGIS 10.2,隨機(jī)采取A~F水體區(qū)域樣本點(diǎn),以m為單位提取CSV格式的樣本點(diǎn)經(jīng)緯度坐標(biāo)數(shù)據(jù).
圖2 研究區(qū)A~F與驗(yàn)證區(qū)域a~f假彩色顯示Fig.2 Study area A-F and verification area a-f false color display
圖3展示了SMDPSO方法與MEDPSO方法在A~F區(qū)域提取水體的結(jié)果. 總體來說,在A~D區(qū)域SMDPSO方法將水陸混合、水植混合等地物判別為水體,過高地估計(jì)了水體范圍. 而MEDPSO 方法在該區(qū)域能精確地剔除混合像元,獲得高精度的水體提取結(jié)果. E區(qū)域SMDPSO方法過多地將概率高的云及云陰影誤判為水體,而MEDPSO方法抑制云及云陰影像元的水體概率,水體提取顯示出相對更好的結(jié)果. F區(qū)域SMDPSO方法計(jì)算雪冰像元時(shí),具有更高的概率值,導(dǎo)致很高的誤判. 而MEDPSO方法由于概率區(qū)分明顯,展示出較好的結(jié)果. 由此可見,水體概率對DPSO方法提取水體影響較大,而SM方法計(jì)算水體概率過度依賴地物光譜,導(dǎo)致SMDPSO方法存在較高的誤判率. MEDPSO方法綜合水體光譜以及水體紋理和結(jié)構(gòu)等信息,充分挖掘水體特征,相對于SMDPSO方法提取水體有明顯的改進(jìn).
圖3 SMDPSO方法與MEDPSO方法水體提取分布對比Fig.3 Comparison of water extraction distributions between SMDPSO method and MEDPSO method
在圖4中,a~b區(qū)域SMDPSO方法比MEDPSO方法總體精度低9%左右,錯(cuò)分誤差高20%左右,漏分誤差低4%左右,Kappa系數(shù)低0.19. c~d區(qū)域SMDPSO方法與MEDPSO方法總體精度之間差值不高于3%,c區(qū)域SMDPSO 方法比MEDPSO 方法錯(cuò)分誤差高38%左右,漏分誤差低4%左右,kappa 系數(shù)低0.18 左右. d 區(qū)域SMDPSO 方法比MEDPSO 方法錯(cuò)分誤差高13%左右,漏分誤差低3%左右,kappa 系數(shù)低0.07 左右. e、f 區(qū)域SMDPSO 方法相比于MEDPSO 方法結(jié)果差別過大,SMDPSO 方法總體精度和Kappa 系數(shù)太低. 而MEDPSO方法相較于a~d區(qū)域沒有太大的差別,證明MEDPSO方法提取水體具有更高的穩(wěn)定性.
SMDPSO 方法過度地將水陸、水植混合像元誤判為水體(如圖5),導(dǎo)致較高的錯(cuò)分誤差,而漏分誤差趨近于0. 該方法在細(xì)小支流處能夠完全提取水體支流,但也將其鄰近的其他地物誤判為水體. MEDPSO 方法不能夠完全提取細(xì)支流,但也能在一定程度上提取水體支流且有較低的錯(cuò)分誤差. 因此Maxent模型耦合DPSO方法能在水陸混合、水植混合區(qū)域,高精度提取水陸、水植處的水體.
圖4 驗(yàn)證區(qū)a-f 水體提取結(jié)果精度對比 Fig 4 Comparison of precision of a-f water extraction results in verification area
圖5 驗(yàn)證區(qū)a~b水體提取結(jié)果Fig.5 Water extraction results in verification area a-b
c區(qū)域是干旱季平谷地區(qū)影像(如圖6),干涸河床在遙感影像上顯示為黑色,與水體具有相似的光譜曲線. 導(dǎo)致SM方法計(jì)算得到高的概率值,經(jīng)DPSO方法提取水體后錯(cuò)分誤差較高. MaxEnt方法在計(jì)算干涸河床時(shí)得到趨于0的概率值,經(jīng)DPSO方法提取水體后錯(cuò)分誤差和漏分誤差較低. 由此可知,DPSO方法將概率值高的地物判別為水體. d區(qū)域人工建筑較多,SMDPSO方法將建筑物尤其是黑色公路誤判為水體,具有較高的錯(cuò)分誤差. MEDPSO方法提取含有人工建筑的水體區(qū)域時(shí),完全不受建筑物的影響. 對比發(fā)現(xiàn),MEDPSO方法能夠更精準(zhǔn)有效地提取水體.
e區(qū)域含云量高(如圖7),SMDPSO方法極易將云及其陰影誤判為水體,導(dǎo)致高達(dá)61.6%的錯(cuò)分誤差. 同樣在冰川、積雪覆蓋的F區(qū)域,SMDPSO方法在提取水體時(shí),幾乎將全部地物錯(cuò)分為水體,導(dǎo)致非常高的錯(cuò)分誤差. MEDPSO方法明顯剔除雪、冰、云及其陰影對水體提取的干擾,僅有7%左右的漏分誤差,總體精度最低高達(dá)95.89%,Kappa系數(shù)最低高達(dá)0.9.
圖6 驗(yàn)證區(qū)c~d水體提取結(jié)果Fig.6 Water extraction results in verification area c-d
圖7 驗(yàn)證區(qū)e~f水體提取結(jié)果Fig.7 Water extraction results in verification area e-f
本文針對SMDPSO方法易將與水體具有相似光譜曲線的其他地物誤判為水體的缺點(diǎn),提出了耦合最大熵模型和離散粒子群優(yōu)化方法(MEDPSO),并通過在全球選取6個(gè)研究區(qū)域進(jìn)行水體提取,對SMDPSO方法和MEDPSO方法在典型區(qū)域進(jìn)行了定量和定性的比較.
研究表明SMDPSO方法過高估計(jì)水體分布范圍,通常擁有很高錯(cuò)分誤差和一定的漏分誤差. MEDPSO方法錯(cuò)分誤差與漏分誤差一致較低,因此MESPDO提取水體穩(wěn)定性較高. 一般情況下,MEDPSO方法相比于SMDPSO方法,總體精度提高7%,Kappa系數(shù)提高7%~20%左右. 在雪冰、云及其陰影區(qū)域SMDPSO方法將此類地物完全誤判為水體,MEDPSO方法能剔除雪冰、云及其陰影,高精度提取水體. 綜上所述,MEDPSO方法通過綜合考慮水體特征,降低了SMDPSO方法提取水體時(shí)對光譜曲線的依賴,顯著提高了DPSO方法在水體提取精度.