許芬,孟慶巖,張琳琳
1.福州大學(xué)地理空間信息技術(shù)國(guó)家地方聯(lián)合工程研究中心,空間數(shù)據(jù)挖掘與信息共享教育部重點(diǎn)實(shí)驗(yàn)室,福州 350002
2.海南省地球觀測(cè)重點(diǎn)實(shí)驗(yàn)室,海南三亞 572029
3.中國(guó)科學(xué)院遙感與數(shù)字地球研究所,北京 100101
數(shù)據(jù)庫(kù)(集)基本信息簡(jiǎn)介
數(shù)據(jù)庫(kù)(集)名稱 2013-2017年海南島陸域水體遙感提取數(shù)據(jù)集數(shù)據(jù)作者 許芬、孟慶巖、張琳琳數(shù)據(jù)通信作者 孟慶巖(mengqy@radi.ac.cn)數(shù)據(jù)時(shí)間范圍 2013-2017年地理區(qū)域 海南島:北緯18°10′-20°10′,東經(jīng)108°37′-111°03′空間分辨率 15 m、16 m數(shù)據(jù)量 11.6 MB數(shù)據(jù)格式 *.shp數(shù)據(jù)服務(wù)系統(tǒng)網(wǎng)址 http://www.sciencedb.cn/dataSet/handle/673基金項(xiàng)目 海南省重大科技計(jì)劃項(xiàng)目(ZDKJ2016021);四川省科技計(jì)劃(2018JZ0054)。數(shù)據(jù)庫(kù)(集)組成數(shù)據(jù)集由6部分?jǐn)?shù)據(jù)組成,分別為5個(gè)不同年份(2013-2017年)水體分布結(jié)果數(shù)據(jù)與1個(gè)驗(yàn)證樣本點(diǎn)數(shù)據(jù),每部分?jǐn)?shù)據(jù)包含*.dbf,*.prj,*.shp,*.shx ,*.jpeg,*.sbx,*.sbn,*.xml 8個(gè)文件,示例如下:1.2015.dbf為2015年矢量數(shù)據(jù)dBASE表文件;2.2015.prj為2015矢量數(shù)據(jù)坐標(biāo)投影文件;3.2015.shp為2015矢量數(shù)據(jù)主文件;
數(shù)據(jù)庫(kù)(集)組成4.2015.shx為2015矢量數(shù)據(jù)索引文件,存儲(chǔ)地理數(shù)據(jù)幾何特征的索引;5.2015.jpeg為2015年水體產(chǎn)品分布結(jié)果圖;6.2015*.sbx為2015年矢量數(shù)據(jù)索引文件,存儲(chǔ)地物特征的索引;7.2015*.sbn為2015年矢量數(shù)據(jù)索引文件,存儲(chǔ)地物特征的索引;8.2015*.xml為對(duì)2015年數(shù)據(jù)的描述,方便實(shí)現(xiàn)數(shù)據(jù)交換。
水是人類賴以生存和社會(huì)發(fā)展不可替代的戰(zhàn)略資源,是全球水資源安全和管理、氣候變化研究、生態(tài)環(huán)境動(dòng)態(tài)監(jiān)測(cè)[1-3]等不可或缺的重要基礎(chǔ)信息。海南島河流眾多,水資源豐富,人均水資源占有量達(dá)3 700m3,是全國(guó)平均水平的1.76倍[4]。隨著自然環(huán)境的變化與社會(huì)經(jīng)濟(jì)的發(fā)展,由地表水帶來(lái)的洪水泛濫和水體污染等問(wèn)題已成為當(dāng)前人類社會(huì)關(guān)注的熱點(diǎn)問(wèn)題[5-6]。因此,及時(shí)快速監(jiān)測(cè)地表水體動(dòng)態(tài)變化,掌握地表水體空間變化規(guī)律,減少其帶來(lái)的災(zāi)害威脅,需開(kāi)展地表水體產(chǎn)品研制。
國(guó)內(nèi)外大中尺度地表水體產(chǎn)品生成和制圖研究成果,主要依賴低空間分辨率衛(wèi)星數(shù)據(jù)[7],如由聯(lián)合國(guó)環(huán)境規(guī)劃署世界保護(hù)監(jiān)測(cè)中心(WCMC)提供的Global Lakes and Wetlands Database(GLWD)主要采集包括湖泊、水庫(kù)和濕地在內(nèi)的水體,利用多邊形矢量的面積、體積來(lái)判斷水體,其空間分辨率為30弧秒(大約1 km),覆蓋范圍在60°S至90°N。然而,大多數(shù)的內(nèi)陸水體面積相對(duì)較小,低空間分辨率衛(wèi)星數(shù)據(jù)難以有效提取出小范圍水體信息[8],因此,中高空間分辨率遙感影像對(duì)于中尺度區(qū)域的水體提取具有重要意義。本文利用高分1號(hào)數(shù)據(jù)與Landsat 8 OLI多光譜與全色波段融合后的15 m空間分辨率數(shù)據(jù),采用面向?qū)ο蟮闹R(shí)規(guī)則集對(duì)海南島雨季水體進(jìn)行自動(dòng)化提取,最后加以人工修正,得到2013-2017年間陸域地表水體信息,一方面為揭示水體分布和動(dòng)態(tài)變化規(guī)律提供有效信息,另一方面為水體水質(zhì)監(jiān)測(cè)、水環(huán)境評(píng)估提供準(zhǔn)確的水體邊界信息,本文基于中高空間分辨率遙感影像提取的覆蓋海南島陸域范圍的地表水信息能為水資源和環(huán)境變化研究提供數(shù)據(jù)支撐。
1.1.1 區(qū)域范圍
海南島位于北緯 18°10′-20°10′,東經(jīng) 108°37′-111°03′,屬熱帶季風(fēng)氣候,存在明顯的干濕季。每年5-10月份是多雨季,總降水量達(dá)1 500mm左右,占全年總降水量的70%~90%;每年11月至翌年4月為少雨季節(jié),降水量?jī)H占全年的10%~30%。地勢(shì)中部高四周低,河流大都發(fā)源于中部山區(qū),組成輻射狀水系,河流眾多,自然形成的湖泊較少,人工水庫(kù)居多。
1.1.2 影像數(shù)據(jù)源
高空間分辨率遙感影像為準(zhǔn)確提取陸域水體信息提供了重要的數(shù)據(jù)源,但隨著空間分辨率的提高,影像覆蓋范圍變小,覆蓋全島所需數(shù)據(jù)量增大,同時(shí)海南島云雨天氣較多,無(wú)云或少云的數(shù)據(jù)難以滿足覆蓋整體的要求。而中高空間分辨率數(shù)據(jù)一方面能滿足水體信息準(zhǔn)確提取的要求,另一方面能滿足覆蓋整體范圍的需求。本文以2013-2017年雨季(5-10月)覆蓋整個(gè)海南島陸域范圍的高分1號(hào)WFV傳感器產(chǎn)品及Landsat 8 OLI多光譜與全色波段融合后的數(shù)據(jù)為數(shù)據(jù)源,空間分辨率分別為 16 m、15 m,云量均低于 9%,其中高分 1號(hào) WFV影像數(shù)據(jù)來(lái)源于中國(guó)資源衛(wèi)星應(yīng)用中心(http://www.cresda.com/CN/),Landsat 8 OLI傳感器影像來(lái)源于地理空間數(shù)據(jù)云網(wǎng)站(http://www.gscloud.cn/),遙感影像覆蓋范圍如圖1。
圖1 研究區(qū)遙感影像(假彩色合成)圖
本數(shù)據(jù)集以經(jīng)過(guò)正射校正、大氣校正等預(yù)處理后的高分1號(hào)及Landsat 8 OLI數(shù)據(jù)為數(shù)據(jù)源,再通過(guò)影像分割,生成能合理表現(xiàn)地物類型,特別是水體信息的影像對(duì)象層;選取對(duì)象樣本進(jìn)行特征提取,根據(jù)最優(yōu)特征信息構(gòu)建知識(shí)規(guī)則集提取水體信息;最后對(duì)分類結(jié)果進(jìn)行濾除碎斑、人工修正等后處理,對(duì)分類進(jìn)行精度評(píng)價(jià),得到海南島陸域范圍的水體分布產(chǎn)品,具體處理流程如圖2。
圖2 數(shù)據(jù)處理流程圖
1.2.1 數(shù)據(jù)預(yù)處理
首先結(jié)合DEM數(shù)據(jù)對(duì)高分1號(hào)數(shù)據(jù)與Landsat 8數(shù)據(jù)進(jìn)行正射校正,消除原本由地勢(shì)起伏等原因所導(dǎo)致的影像幾何畸變[9];再根據(jù)數(shù)據(jù)的定標(biāo)系數(shù),通過(guò)輻射定標(biāo)消除各種輻射失真[10];同時(shí)采用改進(jìn)的6S大氣校正模型進(jìn)行大氣校正,基于查找表逐像元計(jì)算的方式,對(duì)太陽(yáng)天頂角、水蒸氣、臭氧濃度、氣溶膠光學(xué)厚度等參數(shù)進(jìn)行敏感性分析,得到每個(gè)點(diǎn)的大氣校正系數(shù)用以修正地表反射率影像,從而消除大氣的影響[11]。最終得到研究區(qū)域的地表反射率產(chǎn)品。
1.2.2 水體信息的提取
首先基于異質(zhì)性最小原則的區(qū)域合并算法FNEA(Fractal Net Evolution Approach),考慮光譜異質(zhì)性、形狀異質(zhì)性對(duì)影像進(jìn)行多尺度分割,形成影像對(duì)象層,統(tǒng)計(jì)影像對(duì)象層中對(duì)象的特征信息,其次基于最小冗余最大相關(guān)特征選擇算法mRMR(minimum-redundancy maximum-relevancy)選擇眾多特征中的最優(yōu)特征子集,具體包括水體指數(shù)、灰度共生矩陣GLCM(Grey Level Concurrence Matrix)信息熵、形狀特征中長(zhǎng)寬比,構(gòu)建知識(shí)規(guī)則集,提取水體。所選的水體指數(shù)中包括由 Mcfeeters在1996年提出的歸一化水體指數(shù)NDWI、徐涵秋[12]提出的改進(jìn)的歸一化水體指數(shù)MNDWI及混合水體指數(shù)[13](CIWI),其中NDWI是利用綠光波段與近紅外波段水體與非水體的波譜差異提取水體信息,MNDWI是針對(duì)土壤、建筑物在綠光波段和近紅外波段波譜特征與水體幾乎一致,易與水體造成混淆的問(wèn)題提出的基于近中紅外(MIR)波段與綠光波段組合提取水體的方法,使水體識(shí)別精度得到進(jìn)一步改善,但是仍有部分城鎮(zhèn)信息混合在水體中,同時(shí)對(duì)于高分1號(hào)影像,缺乏參與計(jì)算的近中紅外波段,存在一定的局限性;而混合水體指數(shù)則是在分析NDWI與MNDWI優(yōu)缺點(diǎn)和各波段光譜特征的基礎(chǔ)上,用近紅外波段與近紅外波段均值的比值構(gòu)造一個(gè)無(wú)量綱參數(shù) NIR,再將其與歸一化植被指數(shù)NDVI求和,增強(qiáng)水體與其他地物的差異,同時(shí)也能運(yùn)用于高分一號(hào)影像中,計(jì)算公式如下:
式中CIWI為混合水體指數(shù),NIR為遙感影像中的近紅外波段,NIRmean為遙感影像中的近紅外波段像素均值,R為遙感影像中的紅光波段。在進(jìn)行特征優(yōu)選過(guò)程中發(fā)現(xiàn)這3種特征具有較強(qiáng)相關(guān)性,為提高計(jì)算效率,選取其中對(duì)水體信息提取貢獻(xiàn)最大的CIWI指數(shù)進(jìn)行分類,具體步驟包括:首先利用CIWI提取出大致水體范圍。此范圍中除了水體信息,還包含部分云層、山體陰影信息。再通過(guò)調(diào)節(jié)長(zhǎng)寬比特征閾值,選取長(zhǎng)寬比閾值剔除山體陰影信息。通過(guò)調(diào)節(jié)信息熵閾值,提取出云層信息,結(jié)合前后時(shí)期的影像信息人工判讀云層覆蓋范圍的地表土地利用類型。最后對(duì)提取出的水體信息進(jìn)行碎斑去除等后處理,整理出水體分布產(chǎn)品,結(jié)合驗(yàn)證點(diǎn)對(duì)最后分類結(jié)果進(jìn)行精度評(píng)價(jià)。
數(shù)據(jù)以年份命名,包括5個(gè)年份的海南島水體分布矢量圖。在ArcGIS軟件中打開(kāi)由面向?qū)ο笠?guī)則集分類提取出的結(jié)果文件,對(duì)圖斑進(jìn)行顯示和顏色填充,得到2013-2017年的水體分布圖(圖3)。
圖3 2013-2017年海南島水體分布圖
為保證數(shù)據(jù)質(zhì)量,在進(jìn)行水體提取都是云量較低的數(shù)據(jù),同時(shí)對(duì)于其中存在的部分云覆蓋的地區(qū)則是通過(guò)臨近日期無(wú)云影像中所表現(xiàn)的地物類型采用人工判讀的方式進(jìn)行信息填補(bǔ),減少云覆蓋對(duì)水體分布的影響;而在季節(jié)對(duì)水體影響方面,則是考慮到海南島分為明顯的旱雨兩季,為避免季節(jié)降水變化對(duì)水體分布產(chǎn)生影響,選用的數(shù)據(jù)均為每年5-10月的雨季影像,提取的是雨季的水體分布,一定程度上減少了季節(jié)降水差異對(duì)水體分布的影響。
數(shù)據(jù)提取結(jié)果在空間分布上,水體信息呈輻射狀分布,東多西少,與海南島中東部丘陵山地迎風(fēng)坡多雨,西部地區(qū)濱海山地背風(fēng)少雨這一特征相符;同時(shí)數(shù)據(jù)集在數(shù)據(jù)的形態(tài)上,兼顧了整體信息與細(xì)節(jié)信息,不僅覆蓋了大范圍河流湖泊等信息,還包括如坑塘等分布零散的水體信息;由于影像空間分辨率較高,地物細(xì)節(jié)表現(xiàn)較明顯,如一些橋梁、河道周邊植被等信息與水體的區(qū)分造成了水體分布的分段分布(圖4),但總體水體特征表現(xiàn)較好。
圖4 數(shù)據(jù)集局部細(xì)節(jié)示意圖
在數(shù)據(jù)屬性上,2013-2017年間雨季水體面積信息表現(xiàn)出與降水量信息的相關(guān)性,這符合海南島水資源變化受降水量變化影響大這一特點(diǎn)。具體表現(xiàn)在5年中2013年水體面積最大,其降雨量均高于其他年份,達(dá)到2393.7 mm,比多年平均降水量高36.9%,屬于豐水年;2015年水體面積最小,其降水量為1403.5 mm,低于其他年份,同時(shí)比平均年份低19.8%,屬于枯水年;其他3個(gè)年份水體面積也體現(xiàn)出與降水量的正相關(guān)關(guān)系,總體體現(xiàn)出數(shù)據(jù)集的合理性。
利用ArcGIS軟件中Create Random Point工具,在研究區(qū)域范圍隨機(jī)生成300個(gè)驗(yàn)證點(diǎn)(圖5),結(jié)合不同時(shí)期的Google earth影像數(shù)據(jù)與部分高分1號(hào)PMS傳感器2 m空間分辨率影像數(shù)據(jù)確定驗(yàn)證點(diǎn)的屬性值,與分類結(jié)果構(gòu)建誤差矩陣進(jìn)行精度評(píng)價(jià),如表1-5。混淆矩陣中用戶精度是指從分類結(jié)果中任取一個(gè)隨機(jī)樣本,其所具有的類型與地面實(shí)際類型相同的條件概率。生產(chǎn)精度指分類中某一類別正確分類的像元數(shù)占這一類別所有像元數(shù)的比例。總體精度為所有樣本中被正確分類的樣本比例。Kappa系數(shù)則用于反映整體的分類精度,系數(shù)越接近1,分類質(zhì)量越好。
圖5 驗(yàn)證樣本點(diǎn)分布圖
表1 2013年海南島水體分類精度驗(yàn)證混淆矩陣
表2 2014年海南島水體分類精度驗(yàn)證混淆矩陣
表3 2015年海南島水體分類精度驗(yàn)證混淆矩陣
表4 2016年海南島水體分類精度驗(yàn)證混淆矩陣
表5 2017年海南島水體分類精度驗(yàn)證混淆矩陣
2013-2017年總體分類結(jié)果精度都較高,Kappa系數(shù)均大于0.8,其中2017年分類精度最高,Kaapa系數(shù)為90.66%;2013年和2014年精度略低于2016年和2017年,與驗(yàn)證樣本點(diǎn)的屬性部分以近年土地利用屬性為依據(jù),與2013年和2014年真實(shí)地物屬性存在差異,造成的驗(yàn)證誤差有關(guān);2015年精度最低,非水體誤分為水體的情況較多,主要是由于2015年部分影像中云量較高,云與云層陰影易誤分為水體,導(dǎo)致水體提取的生產(chǎn)者精度偏低,但就總體而言,分類效果都較好,漏提率、誤提率較低,均能達(dá)到水體分布產(chǎn)品制圖要求。
本數(shù)據(jù)集是基于中高空間分辨率遙感數(shù)據(jù)提取得出的5個(gè)年份的水體分布數(shù)據(jù)產(chǎn)品,可比較好地識(shí)別小面積湖泊、河流等水域,且分類精度較高,可為水資源時(shí)空分布研究提供數(shù)據(jù)支持,為區(qū)域水質(zhì)水安全等方面的研究提供基礎(chǔ)底圖,同時(shí)可以服務(wù)于水資源變化和環(huán)境變化研究。
中國(guó)科學(xué)數(shù)據(jù)(中英文網(wǎng)絡(luò)版)2019年2期