衡藝婷
摘 要:本文以河南省北部洪澇災(zāi)害為例,結(jié)合洪災(zāi)前后多期光學(xué)和雷達(dá)衛(wèi)星,分析閾值法和機(jī)器模型遷移法對不同傳感器影像的水體識別能力,并分析研究區(qū)的洪澇災(zāi)害情況。重點(diǎn)分析機(jī)器學(xué)習(xí)模型在時間序列影像上的水體遷移識別的技術(shù),討論不同特征對水體的識別能力,并對分類結(jié)果進(jìn)行精度檢驗(yàn)和評價。研究結(jié)果表明,基于閾值法的光學(xué)影像水體提取受到云陰影的影響,而雷達(dá)影像水體提取受到部分道路的干擾?;跈C(jī)器學(xué)習(xí)模型遷移的水體識別提取方法能夠快速、準(zhǔn)確提取系列光學(xué)和雷達(dá)的洪災(zāi)影像。本次洪災(zāi)持續(xù)時間近兩個月,淹沒面積最大值達(dá)到320km2?;跈C(jī)器學(xué)習(xí)模型遷移開展多源光學(xué)雷達(dá)衛(wèi)星影像水體快速識別,對于洪澇災(zāi)害范圍監(jiān)測具有重要的意義。
關(guān)鍵詞:洪澇災(zāi)害,水體識別,機(jī)器學(xué)習(xí),模型遷移,多源遙感
Automatic Extraction and Analysis of Flood Area in Henan Province Based on Multi-Source Remote Sensing Satellite
HENG Yiting
(Liaoning Normal University, Dalian, Liaoning Province, 116000 China)
Abstract: In this paper, it takes the flood disaster in the north of Henan Province as an example, combined with the multi-scene optical and radar satellites before and after the flood, the water extraction ability of the threshold method and the machine model transfer method for different sensor images as well as the flood disaster situation is analyzed. This paper focuses on the technology of water transfer classification based on machine learning model in time series image, discusses the recognition ability of different features to water, and verifies and evaluates the accuracy of classification results. The results show that the water extraction from optical image based on threshold method is affected by cloud shadow, while from radar image is interfered by some roads. The water extraction method based on machine learning model transfer can extract a series of optical and radar flood images quickly and accurately. The flood lasted nearly two months and submerged an area of 320 km2 at its maximum. Rapid water extraction based on multi-source radar satellite image based on machine learning model transfer is of great significance to flood disaster area monitoring.
Key Words: Flood disaster; Water extraction; Machine learning; Model transfer; Multi-source remote sensing
洪澇災(zāi)害是世界上主要自然災(zāi)害之一,遙感是監(jiān)測洪災(zāi)的重要手段,洪澇災(zāi)害的遙感監(jiān)測技術(shù)關(guān)鍵在于水體信息提取和識別。
已有水體提取方法主要基于閾值法和分類法。閾值法構(gòu)建特征直方圖,或直接使用類間最大方差法,找到區(qū)分水體和背景的最佳閾值分割水體范圍。王帆等[1]提出了基于紅綠和近紅外波段組合的改進(jìn)水體指數(shù)NNDWI,該指數(shù)能較好地區(qū)分水體、云及云的陰影,得到去云的水體范圍。而光學(xué)影像常受到云雨影響難以提取完整水體,雷達(dá)影像則具有穿云透雨的能力。已有研究基于表面近似平滑的水體在SAR影像中后向散射值較低的特點(diǎn),構(gòu)建雙峰直方圖找到分割水體的閾值[2-4]。受到雷達(dá)成像特點(diǎn)的影響,山體陰影會干擾水體提取,通常結(jié)合地形信息剔除山體陰影的影響[5]。除單波段閾值法外,賈詩超等[6]提出的雷達(dá)水體指數(shù)SDWI結(jié)合閾值提取的方法也被廣泛運(yùn)用。分類法多采用監(jiān)督分類結(jié)合訓(xùn)練樣本進(jìn)行水體提取,隨機(jī)森林是經(jīng)典的監(jiān)督分類方法。童瑩萍等[7]、王一帆等[8]采用隨機(jī)森林分類器成功提取了不同地區(qū)的水體。
2021年7月,受到臺風(fēng)煙花水汽輸送的影響,河南發(fā)生特大暴雨,短時間內(nèi)鄭州發(fā)生嚴(yán)重的內(nèi)澇,造成重大人員傷亡和經(jīng)濟(jì)損失。之后雨團(tuán)持續(xù)北上,衛(wèi)河成為了本次洪災(zāi)的主要蓄滯洪區(qū)。本文基于光學(xué)和雷達(dá)遙感衛(wèi)星數(shù)據(jù),結(jié)合閾值法和分類法進(jìn)行災(zāi)前、災(zāi)中和災(zāi)后洪水淹沒范圍識別和提取,并對比閾值法和分類法水體提取效果,分析淹沒和受災(zāi)情況。
研究區(qū)和數(shù)據(jù)
研究區(qū)概況
研究區(qū)位于河南省北部衛(wèi)河經(jīng)過的新鄉(xiāng)衛(wèi)輝、鶴壁淇縣、??h和安陽滑縣。研究區(qū)內(nèi)主要的自然和人工水系有衛(wèi)河、淇河、孟姜女河和共產(chǎn)主義渠等,其余水系在非雨期幾乎處于半枯水狀態(tài)。除西部山地丘陵區(qū)外,大部分地勢較低,高程分布在50~100m的范圍內(nèi)。作為本次洪災(zāi)的主要蓄滯洪區(qū),衛(wèi)河兩岸積水時間長達(dá)近2個月,洪澇災(zāi)害造成重大的經(jīng)濟(jì)和財(cái)產(chǎn)損失。
衛(wèi)星數(shù)據(jù)與預(yù)處理
選取歐空局哨兵二號(Sentinel-1)作為本次研究的光學(xué)數(shù)據(jù),Sentinel-2從可見光和近紅外到短波紅外覆蓋13個光譜波段,具有不同的空間分辨率,雙星重訪周期5d,從中選取藍(lán)B2、綠B3、紅B4、近紅外B8和短波紅外B11波段。雷達(dá)數(shù)據(jù)選擇歐空局哨兵一號(Sentinel-1)地距影像(GRD,Ground Range Detected),極化方式為VV、VH,對Sentinel-1數(shù)據(jù)進(jìn)行軌道校正、熱噪聲去除、輻射定標(biāo)、多視處理、噪聲濾波和地形校正,采樣后的空間分辨率為10m,最終轉(zhuǎn)為后向散射系數(shù)dB。
下載SRTM 30m分辨率的DEM高程數(shù)據(jù),計(jì)算坡度,并重采樣為10m分辨率。
樣本數(shù)據(jù)
選取水庫、河流及洪災(zāi)淹沒區(qū)域作為研究的水體樣本;選取未被淹沒的耕地、林地和人造地表作為非水體樣本,對于光學(xué)影像,還選取了云覆蓋區(qū)域及云陰影作為非水體樣本,結(jié)合波段特征分別提取得到光學(xué)、雷達(dá)的水體/非水體樣本數(shù)據(jù)集。
洪水監(jiān)測方法
技術(shù)路線
首先對光學(xué)和雷達(dá)數(shù)據(jù)進(jìn)行預(yù)處理和特征提取,目視解譯得到水體和非水體樣本,構(gòu)建特征—樣本水體識別數(shù)據(jù)集?;陂撝捣ê蜋C(jī)器學(xué)習(xí)分類法分別提取光學(xué)和雷達(dá)影像中的水體分布,進(jìn)行精度評價并對比閾值法和分類法的水體識別效果。使用訓(xùn)練好的機(jī)器學(xué)習(xí)模型遷移到其他時期的影像,實(shí)現(xiàn)序列影像水體范圍快速自動化識別提取。最后分析研究區(qū)淹沒面積變化和洪災(zāi)影響的范圍和嚴(yán)重性。技術(shù)路線如圖1所示。
特征提取
基于光譜和極化特征波段組合運(yùn)算,分別構(gòu)建光學(xué)和雷達(dá)水體指數(shù),以增強(qiáng)水體識別提取的能力。
歸一化差異水體指數(shù)NDWI:
NDWI= (G-NIR)/(G+NIR)
改進(jìn)的歸一化差異水體指數(shù)MNDWI:
MNDWI= (G-MIR)/(G+MIR)
新型改進(jìn)歸一化差異水體指數(shù)NNDWI:
NNDWI= (NIR+R)/(G*C)
雷達(dá)水體指數(shù)SDWI:
SDWI= ln?(10*VV*VH)-8
其中G、R和NIR分別為光學(xué)影像的綠、紅和近紅外波段,MIR為中紅外波段,在哨兵二號中對應(yīng)短波紅外1(SWIR1)波段。C為NNDWI水體指數(shù)的常數(shù),本文將C設(shè)置為1。VV和VH分別為雷達(dá)影像的垂直發(fā)射、垂直接收和垂直發(fā)射、水平接收的兩個極化波段。
閾值法水體提取
OTSU閾值法又稱最大類間方差法,是常用的二分類閾值分割方法。閾值法基于水體與其他地物的反射差異,尋找區(qū)分水體和其他地物的最佳閾值從而提取得到水體范圍。
本文光學(xué)數(shù)據(jù)基于水體指數(shù)(NDWI、MNDWI和NNDWI)提取水體,雷達(dá)數(shù)據(jù)則基于單波段(VV、VH)極化數(shù)據(jù)和雷達(dá)水體指數(shù)(SDWI)提取水體。水體指數(shù)結(jié)合閾值提取水體的基本原理,是特征進(jìn)行對進(jìn)行波段運(yùn)算,以此擴(kuò)大水體與其他地物間的差異,而使用雷達(dá)單波段極化特征結(jié)合閾值提取水體的原理,則是雷達(dá)影像中接近鏡面的水體具有區(qū)別于其他地物的較低后向散射值的特點(diǎn)。
分類法水體提取
采用監(jiān)督分類的策略,選取一定數(shù)量的樣本數(shù)據(jù)訓(xùn)練模型,預(yù)測得到水體分布。隨機(jī)森林RF是經(jīng)典的機(jī)器學(xué)習(xí)監(jiān)督分類方法,被廣泛運(yùn)用于遙感地物信息提取。RF屬于集成學(xué)習(xí),由多個決策樹組成,是一種非參數(shù)估計(jì)的方法。
本文采用RF分類器,分別對構(gòu)建好的光學(xué)和雷達(dá)樣本/特征數(shù)據(jù)庫進(jìn)行訓(xùn)練。訓(xùn)練得到水體識別提取模型后,從而將模型遷移到其他時期的影像,實(shí)現(xiàn)序列洪災(zāi)影像的快速水體識別提取。
采用精確率(PA)、召回率(UA)和F1值(F1 score)指標(biāo)對分類結(jié)果進(jìn)行精度評價。
PA=TP/(TP+FP)
UA=TP/(TP+FN)
F1= (2*PA*UA)/(PA+UA)
其中TP、FP、FN、TN分別為“被分為水體,實(shí)際也是水體”“被分為水體,但實(shí)際是非水體”“被分為非水體,但實(shí)際是水體”“被分為非水體,實(shí)際也是非水體”的樣本個數(shù)。
結(jié)果與分析
水體提取結(jié)果分析
以7月26日的光學(xué)影像為例,利用OTSU閾值分割方法分別對NDWI、MNDWI和NNDWI這3種水體指數(shù)進(jìn)行閾值分割。由于光學(xué)影像容易受到云和陰影的干擾,陰影具有較低的反射率,與同樣具有較低反射率的暗黑水體可能造成混分,而云具有較高的反射率,云的遮擋作用直接導(dǎo)致了云下水體信息的缺失。由圖2可以看出,3種水體指數(shù)的閾值分割結(jié)果均將陰影歸為水體(黃框),未能正確區(qū)分陰影和水體;對于云而言,MNDWI水體分割結(jié)果能夠?qū)⒃铺蕹ňG框),而其他兩個水體指數(shù)則將云也劃入了水體,未能正確區(qū)分云和水體。因此,對比三種水體指數(shù),MNDWI閾值分割結(jié)果最優(yōu)。
以7月27日的雷達(dá)影像為例,利用OTSU閾值分割方法分別對VV、VH和SDWI進(jìn)行閾值分割。由于雷達(dá)側(cè)視成像,背向雷達(dá)發(fā)射的極化波的山坡會產(chǎn)生雷達(dá)陰影,即具有較低的后向散射值,同時因?yàn)樗w也具有低的后向散射值,因而容易造成山體陰影和水體的混分,常用DEM高程數(shù)據(jù)輔助提取水體。本文基于DEM得到坡度數(shù)據(jù),基于水面近似平面而坡度較小的特點(diǎn),去除山地陰影的干擾,進(jìn)一步得到更為精確的水體范圍。如圖3所示,部分道路也被提取成水體(黑框),結(jié)合光學(xué)影像得知被誤分為水體的道路是瀝青路。由于瀝青路具有平滑的表面,在雷達(dá)影像中同水體一樣產(chǎn)生了較低的后向散射值,因而在閾值分割的方法下被誤分為水體。同時,對比VV、VH和SDWI的提取結(jié)果,SDWI提取結(jié)果從視覺效果上看更優(yōu),具有更少的噪聲信息和更完整連續(xù)的水體分布。
對比閾值法和RF分類法得到的水體提取結(jié)果,如圖3所示。對于光學(xué)影像,將閾值分割結(jié)果最優(yōu)的MNDWI特征與RF分割結(jié)果進(jìn)行對比分析,結(jié)果表明RF能夠正確區(qū)分陰影和水體信息(綠框),同時對于細(xì)小的水體和小塊的云也能夠正確區(qū)分。對于雷達(dá)影像,將閾值分割結(jié)果最優(yōu)的SDWI特征與RF分割結(jié)果進(jìn)行對比分析,結(jié)果表明SDWI分割結(jié)果與RF分割結(jié)果接近,沒有明顯的差異,同時二者均不能正確區(qū)分水體和瀝青路。
綜合對比閾值法和分類法的水體提取結(jié)果,RF提取光學(xué)影像水體更優(yōu)于閾值法,表現(xiàn)在RF水體提取結(jié)果能區(qū)分陰影。而兩種方法對雷達(dá)影像水體提取結(jié)果則沒有明顯差異,均受到了部分道路的干擾。
精度檢驗(yàn)與評價
RF的水體識別精度總體上大于閾值法的精度,基于閾值法的水體提取精度都在85%以上,而RF精度都在90%以上。而RF對光學(xué)影像的識別精度高于雷達(dá)的識別精度,這是由于在雷達(dá)影像中不能將部分道路和水體正確區(qū)分,而在光學(xué)影像中正確區(qū)分水體和云及陰影。因此,需結(jié)合數(shù)據(jù)質(zhì)量選取對應(yīng)的識別方法,如對無云影像而言,選取光學(xué)進(jìn)行水體識別會比雷達(dá)的識別效果更好,這是因?yàn)槔走_(dá)的提取結(jié)果帶有部分道路和一些細(xì)小的后向散射值低的斑塊噪聲;對于有云影像,雷達(dá)的識別效果則更好,但需要進(jìn)一步結(jié)合經(jīng)驗(yàn)知識去除道路的干擾。
洪水災(zāi)害評估
根據(jù)RF對Sentinel-1和Sentinel-2序列影像的水體遷移分類結(jié)果,統(tǒng)計(jì)主要蓄滯洪區(qū)(圖6)的水體面積變化信息,主要蓄滯洪區(qū)指衛(wèi)河和共產(chǎn)主義渠兩岸的區(qū)域,是本次洪災(zāi)的主要淹沒區(qū),得到以下結(jié)果,如圖4所示。
根據(jù)主要蓄滯洪區(qū)水體面積變化情況,可以得出,研究區(qū)至少于7月26日開始積水,且在7月31日淹沒面積達(dá)到最大值,約為320km2,之后洪水開始快速消退,8月20日后洪水消退速度趨于平穩(wěn),直至9月15日,研究區(qū)仍有50km2水體滯留。
使用洪水范圍達(dá)到最大值時即7月31日的影像進(jìn)行水體分布制圖,該日影像由Sentinel-2獲取,影像無云,成像質(zhì)量好,使用RF遷移分類得到的水體提取結(jié)果,制圖得出本次洪災(zāi)的全部影響范圍。由下圖可以看出,本次河南洪災(zāi)主要蓄滯洪區(qū)發(fā)生的洪澇災(zāi)害較為嚴(yán)重,其中衛(wèi)輝城區(qū)發(fā)生城市內(nèi)澇,部分道路被洪水淹沒,而??h則有大面積耕地被洪水淹沒。
結(jié)論
本文對比分析了閾值法和機(jī)器學(xué)習(xí)模型遷移分類法在多源光學(xué)和雷達(dá)影像中的水體識別提取應(yīng)用,并分析了洪災(zāi)水體面積變化和洪災(zāi)的影響程度。對比分析以上結(jié)果,得出以下結(jié)論。
(1)閾值法人工選取樣本且速度快,但其提取水體的精度易受到水體與背景面積比例的影響,誤差較大,僅適用于水體占比較大影像。
(2)機(jī)器學(xué)習(xí)模型依賴訓(xùn)練樣本,而基于單期影像訓(xùn)練得到的水體識別模型,不需要重新選擇樣本,能夠直接用于其他時期的影像水體提取,快速提取得到時間序列水體分布提取結(jié)果,并且分類精度較高,具有自動化快速識別水體的應(yīng)用潛力。
(3)MNDWI水體指數(shù)結(jié)合閾值法能夠區(qū)分云和水體,但仍受到陰影干擾,而RF分類法則能夠較好地區(qū)分水體和云陰影;雷達(dá)影像水體調(diào)則由于后向散射特性受到山體陰影的干擾,使用坡度數(shù)據(jù)能夠剔除山體陰影的影響;基于SDWI結(jié)合閾值法和RF分類法的雷達(dá)影像水體提取效果相近,但均受到了部分道路的干擾。
(4)本次河南北部蓄滯洪區(qū)洪澇災(zāi)害影響持續(xù)時間長達(dá)近兩個月,最大淹沒面積達(dá)到320km2,衛(wèi)輝城區(qū)發(fā)生內(nèi)澇,??h大片農(nóng)作物受災(zāi),洪澇災(zāi)害影響嚴(yán)重。
參考文獻(xiàn)
[1]. 王帆,李崇貴,馬婷,等.一種改進(jìn)的遙感影像水體信息快速提取方法[J].人民長江,2021,52(6):223-228.
[2]. 任正情.高分三號影像在洪澇災(zāi)害應(yīng)急監(jiān)測中的應(yīng)用[J].西部資源,2021(4): 112-114.
[3]. 楊明軍,康冰鋒,張珣,等,苗世源.高分三號衛(wèi)星SAR影像在水體信息提取中的應(yīng)用[J].科技創(chuàng)新導(dǎo)報(bào),2018,15(32):66-70.
[4]. 谷鑫志,曾慶偉,諶華,陳爾學(xué),趙磊,于飛,涂寬.高分三號影像水體信息提取[J].遙感學(xué)報(bào),2019,23(3):555-565.
[5]. 楊澤楠,黃亮,王梟軒.結(jié)合DEM的面向?qū)ο蟾叻秩朣AR影像高原山區(qū)水系提取[J].昆明理工大學(xué)學(xué)報(bào):自然科學(xué)版, 2019.44(1):39-46.
[6]. 賈詩超,薛東劍,李成繞,等.基于Sentinel-1數(shù)據(jù)的水體信息提取方法研究[J].人民長江,2019,50(2):213-217.
[7]. 童瑩萍,馮偉,全英匯,等.基于GF-3與Sentinel-2A圖像融合的高精度水體提取算法[J].無線電工程,2021,51(8):750-753.
[8]. 王一帆,徐涵秋.基于客觀閾值與隨機(jī)森林Gini指標(biāo)的水體遙感指數(shù)對比[J].遙感技術(shù)與應(yīng)用,2020,35(5):1089-1098.