摘要:使用基于SwinTransformer的深度學(xué)習(xí)模型,成功應(yīng)用于Sentinel-1合成孔徑雷達(dá)(SyntheticApertureRadar,SAR)遙感圖像(讀不通??)水體提取任務(wù)。通過MSTAR數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練和遷移學(xué)習(xí),模型在遵義地區(qū)的實(shí)驗(yàn)中表現(xiàn)出顯著的準(zhǔn)確性和效率。采用圖像預(yù)處理和SwinTransformer的窗口注意力機(jī)制,成功提高了水體提取性能。實(shí)驗(yàn)結(jié)果顯示,該模型在提取水體矢量信息方面取得了顯著成果,為遙感圖像處理和水體提取領(lǐng)域的進(jìn)一步研究提供了有力支持。
關(guān)鍵詞:遙感水體提取SwinTransformer合成孔徑雷達(dá)
ResearchonWaterBodyExtractionBasedonSARRemote-SensingImages
SHENRunhanHUANGGuangrui*
ZunyiSurveyandDesignInstituteofWaterConservancyandHydropowerCo.,Ltd.,Zunyi,GuizhouProvince,563000China
Abstract:ThisstudysuccessfullyappliesadeeplearningmodelbasedonSwinTransformertothewaterbodyextractiontaskofremote-sensingSentinel-1SyntheticApertureRadar(SAR)images.TheMSTARdatasetisusedforpre-trainingandtransferlearning,andthemodeldemonstratesnotableaccuracyandefficiencyinexperimentsintheZunyiregion.The&nbsTwTdtLPwbT6MIlsdB5tJMQ==p;imagepreprocessingandthewindowedattentionmechanismofSwinTransformerareusedtosuccessfullyimprovetheperformanceofwaterbodyextraction.Experimentalresultsindicatethatthemodelachievesremarkableresultsinextractingthevectorinformationofthewaterbody,whichprovidesstrongsupportforfurtherresearchinthefieldofremote-sensingimageprocessingandwaterbodyextraction.
KeyWords:Remotesensing;Waterbodyextraction;SwinTransformer;Syntheticapertureradar
合成孔徑雷達(dá)遙感技術(shù)在近幾十年的發(fā)展中成為遙感領(lǐng)域中的一項(xiàng)重要工具,其在地表覆蓋監(jiān)測、環(huán)境變化分析以及資源管理等方面展現(xiàn)出卓越的能力。其中,SAR遙感影像在水體提取方面的研究日益引起廣泛關(guān)注,成為解決水資源管理、環(huán)境監(jiān)測和災(zāi)害應(yīng)對等重要問題的關(guān)鍵手段。SAR技術(shù)相較于光學(xué)遙感具有獨(dú)特的優(yōu)勢,其能夠突破天候和光照的限制,在不同的氣象條件下均能提供高質(zhì)量的影像。由于雷達(dá)波在水體表面與地面發(fā)生反射時具有不同的特性,SAR影像在水體提取中能夠捕捉水體與周圍地物的微妙差異,使其成為識別和監(jiān)測水體的重要工具。本文提出了一種利用SwinTransformer作為Backbone來提取SAR圖像的水體特征的深度學(xué)習(xí)模型,該模型能夠提取區(qū)域內(nèi)的水體數(shù)據(jù)。
1.國內(nèi)外研究現(xiàn)狀
SAR圖像在水體提取方面的研究涉及遙感圖像處理、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等多個領(lǐng)域。傳統(tǒng)方法中,滑動窗口方法[1]是一種基于像素統(tǒng)計(jì)特征的傳統(tǒng)圖像處理方法。該方法使用一個固定大小的窗口,在圖像上進(jìn)行滑動,通過對每個窗口內(nèi)的像素進(jìn)行統(tǒng)計(jì)分析,提取紋理特征,并基于這些特征進(jìn)行水體和非水體的分類。該方法簡單易行,不需要復(fù)雜的模型和大量標(biāo)注數(shù)據(jù),但對復(fù)雜的地物覆蓋和光照變化敏感,難以處理非線性關(guān)系。多頻率極化特性方法[2]利用SAR圖像的多頻率和極化信息,通過分析不同頻率和極化通道的特性,采用閾值或數(shù)學(xué)形態(tài)學(xué)等傳統(tǒng)方法來提取水體信息。該方法利用頻率和極化信息,對水體和非水體進(jìn)行更為精細(xì)的區(qū)分,但對復(fù)雜地物和不同天氣條件下的影響較為敏感,可能需要針對不同場景進(jìn)行參數(shù)調(diào)整。
接著學(xué)者開始將機(jī)器學(xué)習(xí)的方法引入SAR影像的水體提取研究中,在SAR影像水體提取[3]中,研究者利用SVM[4]通過學(xué)習(xí)訓(xùn)練數(shù)據(jù)的特征和標(biāo)簽,建立一個決策邊界,從而對水體和非水體進(jìn)行分類。他們也利用CNN通過卷積和池化操作,學(xué)習(xí)局部和全局特征,從而實(shí)現(xiàn)對水體的準(zhǔn)確分類。這些機(jī)器學(xué)習(xí)方法在SAR影像水體提取中都有其獨(dú)特的優(yōu)勢,選擇合適的方法通常依賴于具體的任務(wù)需求、數(shù)據(jù)情況以及計(jì)算資源。最近,深度學(xué)習(xí)方法在該領(lǐng)域的發(fā)展日益受到關(guān)注,尤其是一些先進(jìn)的架構(gòu),如Transformer[5]等,為提高水體提取的準(zhǔn)確性和效率提供了新的可能性。之后,SwinTransformer[6]的提出旨在應(yīng)對傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)在大圖像處理任務(wù)中的挑戰(zhàn),為處理高分辨率圖像或大尺寸圖像提供了一種新穎的架構(gòu),具備更好的性能和計(jì)算效率。
2.SAR圖像水體提取方法
2.1圖像預(yù)處理
在進(jìn)行水體提取之前,對合成孔徑雷達(dá)影像進(jìn)行預(yù)處理是必要的,以提高圖像質(zhì)量、降低噪聲。首先,執(zhí)行輻射校正反映地物的真實(shí)輻射特性,減少影像之間的差異,增強(qiáng)可比性。隨后,進(jìn)行幾何校正以糾正幾何畸變,如地形和大氣效應(yīng)。由于SAR影像受到斑點(diǎn)噪聲的影響,進(jìn)行去斑點(diǎn)處理有助于減少噪聲,提高影像可讀性。其次,對SAR影像進(jìn)行濾波和平滑處理,減少高頻噪聲,使影像更適合進(jìn)行進(jìn)一步的圖像分析。這些預(yù)處理步驟的目標(biāo)是提供更清晰、準(zhǔn)確的輸入數(shù)據(jù),為水體提取任務(wù)提供更有利的條件,支持后續(xù)的分析和模型訓(xùn)練。
2.2SwinTransformer
SwinTransformer旨在在大規(guī)模圖像分類和目標(biāo)分割任務(wù)中取得出色性能。它引入了窗口注意力機(jī)制,將圖像分割成窗口執(zhí)行自注意力操作,降低了計(jì)算復(fù)雜度,提高了處理大規(guī)模圖像的效率。網(wǎng)絡(luò)結(jié)構(gòu)采用階段性設(shè)計(jì),分組圖像,通過階段連接傳遞信息,提高感受野,捕獲更廣泛的上下文信息。逐漸減小圖像分辨率的策略通過階段性結(jié)構(gòu)實(shí)現(xiàn),有助于減少計(jì)算復(fù)雜度,同時有效建模圖像的全局信息。使用窗口化的自注意力機(jī)制,每個SwinTransformerBlock經(jīng)過W-MSA和SW-MSA處理,通過獨(dú)立處理每個窗口內(nèi)的特征向量,優(yōu)化了注意力機(jī)制的復(fù)雜度。SW-MSA通過錯位窗口減少了自注意力機(jī)制的計(jì)算復(fù)雜度,使得模型在處理大規(guī)模圖像時表現(xiàn)卓越。
2.3遷移學(xué)習(xí)
本文選擇了MSTAR數(shù)據(jù)集作為SwinTransformer模型的預(yù)訓(xùn)練數(shù)據(jù),隨后將預(yù)訓(xùn)練的SwinTransformer模型應(yīng)用于水體提取任務(wù),作為初始模型。微調(diào)階段則使用了水體提取任務(wù)的小規(guī)模數(shù)據(jù)集,其中包括水體和非水體區(qū)域的標(biāo)記數(shù)據(jù)。為了提高訓(xùn)練數(shù)據(jù)的多樣性,本文采用了數(shù)據(jù)增強(qiáng)技術(shù),如隨機(jī)裁剪、旋轉(zhuǎn)、翻轉(zhuǎn)等,將數(shù)據(jù)增強(qiáng)的倍數(shù)設(shè)置為原始數(shù)據(jù)的10倍。
3.水體提取
3.1實(shí)驗(yàn)數(shù)據(jù)集
MSTAR是由美國國防部高級研究計(jì)劃局(DARPA)贊助的合成孔徑雷達(dá)數(shù)據(jù)集,為雷達(dá)目標(biāo)檢測、識別和跟蹤等任務(wù)提供大規(guī)模多樣化的圖像。包含各種視角和條件下的合成孔徑雷達(dá)圖像,涵蓋移動和靜止目標(biāo),如車輛、建筑物、樹木,以及不同地形和環(huán)境條件。數(shù)據(jù)集還包括不同季節(jié)和天氣條件下的圖像,對合成孔徑雷達(dá)領(lǐng)域的研究和算法開發(fā)至關(guān)重要,為評估和比較各種算法性能提供了真實(shí)世界條件下的大規(guī)模圖像。MSTAR數(shù)據(jù)集可用于模型的訓(xùn)練、驗(yàn)證和測試,推動合成孔徑雷達(dá)技術(shù)的進(jìn)展。Sentinel-1是歐洲空間局的地球觀測衛(wèi)星,搭載C波段合成孔徑雷達(dá)傳感器,提供全球高分辨率SAR圖像,廣泛應(yīng)用于環(huán)境監(jiān)測、地質(zhì)勘探、農(nóng)業(yè)管理和災(zāi)害監(jiān)測等領(lǐng)域。該SAR傳感器支持水平和垂直方向上的雙極化模式,為遙感提供更多信息,有助于解釋目標(biāo)表面性質(zhì)。
3.2訓(xùn)練
本文在訓(xùn)練模型時,使用AdamW優(yōu)化算法來優(yōu)化模型,weight_decay設(shè)置為0.0004。學(xué)習(xí)率設(shè)置為0.000001,BatchSize為2,迭代次數(shù)為300,該模型基于Pytorch框架。模型的SwinTransformerBlock的WindowSize設(shè)置為7,構(gòu)架為SwinTransformerTiny。
3.3結(jié)果
本文的模型在Sentinel-1SAR遙感圖像水體提取任務(wù)中取得了顯著的成果,其效果如圖1與圖2所示。
通過所提出的方法,成功地從遵義地區(qū)的遙感影像中提取了大部分水體的矢量信息。這一技術(shù)不僅高效,還能顯著減輕工作負(fù)擔(dān)。進(jìn)一步結(jié)合高分辨率影像進(jìn)行目視解譯,以對提取結(jié)果進(jìn)行補(bǔ)充和驗(yàn)證。這種雙重策略不僅提升了水體提取的準(zhǔn)確性,同時提供了更全面、更可信的水體信息。研究不僅在遙感圖像處理領(lǐng)域取得了顯著的成果,也為實(shí)際應(yīng)用提供了可靠的水體矢量數(shù)據(jù),有助于地理信息系統(tǒng)(GIS)應(yīng)用、城市規(guī)劃等領(lǐng)域的進(jìn)一步研究和決策。
4結(jié)語
本研究基于SwinTransformer深度學(xué)習(xí)模型,通過對Sentinel-1SAR遙感圖像進(jìn)行水體提取任務(wù)的實(shí)驗(yàn),取得了顯著的成果。本文采用了MSTAR數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,并通過遷移學(xué)習(xí)將模型成功應(yīng)用于實(shí)際水體提取任務(wù)。通過圖像預(yù)處理和SwinTransformer的窗口注意力機(jī)制,有效地提高了水體提取的準(zhǔn)確性和效率。實(shí)驗(yàn)證明,在遵義地區(qū)的SAR影像中,模型成功提取了大部分水體的矢量信息,展現(xiàn)了較高的性能。通過與高分辨率影像結(jié)合的雙重策略,該方法不僅提高了提取結(jié)果的可靠性,還為地理信息系統(tǒng)等領(lǐng)域提供了可信的水體矢量數(shù)據(jù)。這項(xiàng)研究為遙感圖像處理和水體提取領(lǐng)域的進(jìn)一步研究和實(shí)際應(yīng)用提供了有力的支持。
參考文獻(xiàn)
[1]李璐,張風(fēng)麗,邵蕓,等.基于滑動窗口的高分辨率SAR圖像點(diǎn)目標(biāo)積分響應(yīng)能量計(jì)算方法研究[J].遙感技術(shù)與應(yīng)用,2023,38(1):182-189.
[2]鄧云凱,張衡,范懷濤,等.面向綜合環(huán)境監(jiān)測的星載SAR技術(shù)發(fā)展[J].中國空間科學(xué)技術(shù),2023,43(2):32-46.
[3]張文璇,王卷樂.基于SAR影像后向散射特性的中俄黑龍江流域洪水監(jiān)測[J].地球信息科學(xué)學(xué)報(bào),2022,24(4):802-813.
[4]左堅(jiān),鐘凱文,許劍輝,等.多時相SAR數(shù)據(jù)下的嶺南早稻提取與時空變化分析[J].測繪科學(xué),2023,48(1):91-99.
[5]喻九陽,胡天豪,戴耀南,等.面向遙感目標(biāo)檢測的無錨框Transformer算法[J].電子學(xué)報(bào),2024,51(11):3238-3247.
[6]董章華,趙士杰,賴?yán)?一種基于SwinTransformer神經(jīng)網(wǎng)絡(luò)的低截獲概率雷達(dá)信號調(diào)制類型的識別方法[J].四川大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,60(2):36-42.