吳瑞姣
(福建省地質(zhì)測(cè)繪院,福建 福州 350011)
準(zhǔn)確的耕地面積和空間分布信息是權(quán)衡農(nóng)業(yè)生產(chǎn)效益與生態(tài)環(huán)境保護(hù)的重要依據(jù)[1],也是解決產(chǎn)量估算[2]、土地利用規(guī)劃和農(nóng)業(yè)生產(chǎn)管理等問(wèn)題的關(guān)鍵[3]。衛(wèi)星和高分辨率影像的迅速發(fā)展和快速獲取,為大范圍、精確有效的耕地信息監(jiān)測(cè)提供了可能[4]。高分辨率遙感影像解譯是遙感信息處理領(lǐng)域的研究熱點(diǎn)之一[5]。隨著多源高分遙感影像數(shù)據(jù)的爆炸式增長(zhǎng),基于深度學(xué)習(xí)的智能圖像處理技術(shù)成為推動(dòng)大數(shù)據(jù)時(shí)代遙感信息服務(wù)水平提升的重要力量[6]?;谙袼胤诸惖纳疃葘W(xué)習(xí)語(yǔ)義分割能快速解析圖像深層次語(yǔ)義信息,成為當(dāng)前圖像分割領(lǐng)域最先進(jìn)的應(yīng)用技術(shù)[7],如全卷積神經(jīng)網(wǎng)絡(luò)[8]、 U-Net[9]、 U-Net++[10]、殘差網(wǎng)絡(luò)ResNet[11]等,在自然場(chǎng)景圖像和醫(yī)學(xué)影像分割領(lǐng)域取得了顯著成效[6]。文獻(xiàn)[3-4,12-13]基于深度學(xué)習(xí)技術(shù)提取中高分辨率衛(wèi)星遙感影像耕地開展了相關(guān)研究。然而以上研究,多數(shù)是基于高分、資源系列(0.65~2.5 m)或更低分辨率的衛(wèi)星遙感影像,對(duì)于耕地地塊小、形狀不規(guī)則、農(nóng)業(yè)景觀破碎的區(qū)域,混合像元影響大大增加了耕地遙感提取的難度,難以獲取準(zhǔn)確的耕地提取結(jié)果[14]。而基于更高分辨率衛(wèi)星遙感影像的耕地識(shí)別研究鮮有報(bào)道。越高分辨率衛(wèi)星遙感影像,其光譜和空間紋理信息越復(fù)雜,地表細(xì)節(jié)特征越豐富,自動(dòng)提取的難度也越大[6]。
因此,針對(duì)南方丘陵地區(qū)耕地零散、破碎、不規(guī)則導(dǎo)致的山垅田識(shí)別難度大、準(zhǔn)確率低等問(wèn)題,本文擬在 U-Net語(yǔ)義分割網(wǎng)絡(luò)基礎(chǔ)上,引入高效通道注意力(efficient channel attention,ECA)和注意力門(attention gate,AG)雙注意力模塊,構(gòu)建一種混合U-Net模型,以福建省南安市2021年WorldView-2衛(wèi)星影像為數(shù)據(jù)源,并對(duì)比不同網(wǎng)絡(luò)模型下耕地預(yù)測(cè)分類結(jié)果的精度,驗(yàn)證本文方法的有效性,為糧食產(chǎn)量估算、耕地種植用途監(jiān)測(cè)、耕地非糧化等提供準(zhǔn)確可靠的技術(shù)支持。
研究區(qū)為福建省南安市,位于福建省東南沿海,地處晉江中游、戴云山脈東南麓,境內(nèi)以山地丘陵為主。南安市作為全國(guó)百?gòu)?qiáng)縣,經(jīng)濟(jì)發(fā)展迅速,建設(shè)用地緊張、耕地保護(hù)壓力大,快速獲取該區(qū)域的耕地空間分布信息具有較強(qiáng)的實(shí)際需求。如圖1所示。
圖1 南安市研究區(qū)
本文所使用的影像數(shù)據(jù)源為WorldView-2衛(wèi)星影像18景,空間分辨率為0.5 m,成像時(shí)間是2021年1月15日-2月15日,含藍(lán)、綠、紅和近紅4個(gè)波段。利用PIE Orth軟件,根據(jù)影像自帶的RPC信息,基于基礎(chǔ)底圖和高精度DEM分別對(duì)全色和多光譜數(shù)據(jù)進(jìn)行正射校正、配準(zhǔn)、融合、重采樣和裁切等預(yù)處理。
模型訓(xùn)練和驗(yàn)證數(shù)據(jù)使用WorldView-2影像標(biāo)注耕地標(biāo)簽,數(shù)據(jù)標(biāo)簽的標(biāo)記通過(guò)ArcGIS矢量化工具對(duì)采樣區(qū)域耕地矢量輪廓的勾畫,并轉(zhuǎn)化為柵格數(shù)據(jù),生成二值化的掩膜標(biāo)簽圖(即耕地與非耕地)。
首先通過(guò)目視檢查,剔除含耕地信息小于40%及明顯標(biāo)注錯(cuò)誤的圖片,再以4∶1的比例,將樣本劃分為訓(xùn)練集和驗(yàn)證集。然后通過(guò)縮放、翻轉(zhuǎn)(水平、垂直、對(duì)角線)、旋轉(zhuǎn)、隨機(jī)擴(kuò)增策略進(jìn)行數(shù)據(jù)增強(qiáng),提升模型泛化能力。最后,分別得到512×512的訓(xùn)練和驗(yàn)證影像171 34張和4285張。
耕地精度驗(yàn)證數(shù)據(jù)是2021年4月在南安外業(yè)實(shí)地調(diào)查時(shí)獲取的,共有1384個(gè)(如圖1所示)。其中,耕地981個(gè),非耕地403個(gè)。
本文采用 U-Net深度學(xué)習(xí)網(wǎng)絡(luò)框架[9],即編碼器-解碼器結(jié)構(gòu)。編碼器用于提取原始影像的特征,解碼器則將編碼器所提取的特征進(jìn)行解碼重建,從而獲取像素級(jí)的分類結(jié)果。針對(duì)高分辨率遙感影像上山垅田識(shí)別難度大、準(zhǔn)確率低等問(wèn)題,在 U-Net模型基礎(chǔ)上引入ECA模塊[15]和AG模塊[16],構(gòu)建一種基于 U-Net改進(jìn)的雙注意力模塊混合U-Net模型進(jìn)行高分辨率衛(wèi)星遙感影像耕地信息提取。如圖2所示。
圖2 基于雙注意力模塊的混合U-Net模型
2.1.1 ECA模塊
通道注意力機(jī)制可以有效提高 U-Net的語(yǔ)義分割性能,但不可避免增加了模型的復(fù)雜度。ECA通過(guò)恰當(dāng)?shù)目缤ǖ澜换タ梢栽诮档湍P蛷?fù)雜度的情況下提升語(yǔ)義分割性能。因此,本文在 U-Net中加入ECA模塊。該模塊使用一維卷積快速實(shí)現(xiàn)一種無(wú)降維的局部跨通道交互策略,在付出少量的參數(shù)代價(jià)的情況下,提高模型對(duì)不同波段的影像學(xué)習(xí)能力,增強(qiáng)對(duì)多尺度上下文信息的提取和利用,并抑制高分辨率遙感影像中冗余、無(wú)關(guān)信息的影響,提高耕地有效特征的提取精度。
ECA模塊如圖3所示。首先使用全局均值池化在空間維度對(duì)特征進(jìn)行壓縮,獲取通道維度的全局特征;然后使用具有自適應(yīng)卷積核的一維卷積構(gòu)建局部特征通道間的相關(guān)性;最后使用一個(gè)Sigmoid函數(shù)獲得0~1之間歸一化的權(quán)重,并將其加權(quán)到每個(gè)通道的特征中。
圖3 嵌入bottleneck block中的ECA模塊
2.1.2 AG模塊
AG模塊中的注意力權(quán)重是由編解碼中兩部分的信息共同確定的,編碼部分淺層的神經(jīng)網(wǎng)絡(luò)更善于提取局部的細(xì)節(jié)特征,而解碼部分深層的神經(jīng)網(wǎng)絡(luò)更善于提取全局的語(yǔ)義特征。因此,AG模塊則是添加在 U-Net模型的編解碼器之間,同編解碼器之間的跳連接和上一層神經(jīng)網(wǎng)絡(luò)相連,由編解碼信息共同構(gòu)建的AG模塊可在把握耕地目標(biāo)全局特征的情況下,將更多注意力集中于耕地目標(biāo)的細(xì)節(jié)特征,從而使模型更多地關(guān)注耕地目標(biāo)在形狀和大小上的變化,提升小塊耕地提取精度。如圖4所示。
圖4 AG模塊
g和xl分別為注意力模塊的輸入,其中g(shù)來(lái)自模型的編碼部分,具有低層次的語(yǔ)義信息,xl來(lái)自解碼部分,具有高層次的語(yǔ)義信息。AG模塊的具體實(shí)現(xiàn)過(guò)程為:首先將g和xl通過(guò)1×1的卷積后相加,突出編解碼均有的特征;然后經(jīng)過(guò)ReLU激活函數(shù),增加非線性操作;最后經(jīng)過(guò)1×1卷積和Sigmoid函數(shù),得到歸一化后的注意力權(quán)重α,并將其與xl相乘得到具有不同特征權(quán)重的新xl。
為了更好地驗(yàn)證所構(gòu)建的模型,設(shè)置了兩個(gè)不同模型的對(duì)比試驗(yàn)。第1個(gè)是基于編碼-解碼架構(gòu)的 U-Net模型;第2個(gè)是在 U-Net模型基礎(chǔ)上添加了單一注意力機(jī)制,即在 U-Net編碼模塊中引入了殘差結(jié)構(gòu)和ECA注意力機(jī)制,形成了ECA U-Net模型。通過(guò)對(duì)比分析3個(gè)模型的耕地預(yù)測(cè)提取結(jié)果,探究所提出的混合U-Net模型對(duì)于南方丘陵地區(qū)山垅田及零散獨(dú)立小地塊的空間特征提取效果。
考慮Adam優(yōu)化器在模型訓(xùn)練過(guò)程相較其他優(yōu)化器收斂得更快[17],在TensorFlow框架下選擇Adam優(yōu)化器,使用3塊GPU NVIDIA GeForce RTX 2080 Ti(11 GB)顯卡進(jìn)行模型參數(shù)訓(xùn)練,其中batch_size設(shè)置為4,初始學(xué)習(xí)率設(shè)置為1×10-4,在訓(xùn)練中,學(xué)習(xí)率產(chǎn)生4次遞減,每次遞減為原學(xué)習(xí)率的0.2倍,模型在第150個(gè)epoch時(shí)結(jié)束。
當(dāng)神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練完成后,可以通過(guò)前向傳播過(guò)程得到影像的預(yù)測(cè)結(jié)果。使用處理后的遙感影像和訓(xùn)練后的模型進(jìn)行耕地信息結(jié)果預(yù)測(cè),獲得耕地的空間分布圖。
為了驗(yàn)證混合U-Net模型在0.5 m高分辨率衛(wèi)星遙感影像上提取耕地的精度和有效性,采用基于實(shí)際外業(yè)點(diǎn),通過(guò)構(gòu)建混淆矩陣計(jì)算用戶精度和生產(chǎn)者精度來(lái)定量化描述模型對(duì)南安市耕地提取的總體精度。
此外,另外選取了3個(gè)測(cè)試區(qū)域,選取的辦法是將南安市按照3072 m×3072 m劃分網(wǎng)格,共有278幅,扣除處于縣級(jí)行政界限邊緣未滿圖幅87幅,在剩余圖幅中按照10%的比例隨機(jī)挑選20幅作為候選測(cè)試區(qū)域。在此基礎(chǔ)上,按照耕地破碎程度、形狀規(guī)則程度,以及所處的坡度等級(jí),人工選擇了3個(gè)代表性圖幅(山區(qū)、半山區(qū)半丘陵、平原)作為測(cè)試區(qū)域。采用深度學(xué)習(xí)語(yǔ)義分割常用的F1分?jǐn)?shù)和交并比(IoU)作為評(píng)價(jià)指標(biāo),計(jì)算公式分別為
(1)
(2)
式中,TP為預(yù)測(cè)正確的正樣本;FP為預(yù)測(cè)錯(cuò)誤的正樣本;TN為預(yù)測(cè)正確的負(fù)樣本;FN為預(yù)測(cè)錯(cuò)誤的負(fù)樣本。
基于調(diào)查的實(shí)地外業(yè)點(diǎn),通過(guò)構(gòu)建混淆矩陣計(jì)算用戶精度和生產(chǎn)者精度來(lái)定量化描述模型對(duì)南安市耕地提取的總體精度(見表1)。試驗(yàn)結(jié)果表明,添加雙注意力機(jī)制的結(jié)果均優(yōu)于添加單一注意力機(jī)制和不添加注意力機(jī)制的結(jié)果?;诨旌蟄-Net分類結(jié)果總體精度達(dá)到了93.42%,較ECA U-Net模型和 U-Net模型分別提升了9.75%和19%,總體精度較好。從3種網(wǎng)絡(luò)模型得出的生產(chǎn)者和用戶精度中發(fā)現(xiàn):耕地的生產(chǎn)者和用戶精度均比非耕地的生產(chǎn)者和用戶精度高;ECA U-Net模型和 U-Net模型耕地的用戶精度大于生產(chǎn)者精度,漏分現(xiàn)象大于錯(cuò)分現(xiàn)象;混合U-Net模型生產(chǎn)者精度大于用戶精度,錯(cuò)分現(xiàn)象大于漏分現(xiàn)象。
表1 耕地提取精度 (%)
在3個(gè)測(cè)試區(qū)域內(nèi),將不同模型測(cè)試結(jié)果與通過(guò)三調(diào)耕地結(jié)合人工目視解譯獲得的耕地真實(shí)值進(jìn)行比對(duì)(見表2)。結(jié)果表明,混合U-Net模型、ECA U-Net模型和 U-Net模型的3個(gè)區(qū)域耕地F1分?jǐn)?shù)平均值分別為0.918 6、0.810 1和0.631 5,IoU平均值分別為59.37%、72.53%和76.97%?;旌蟄-Net模型優(yōu)于ECA U-Net模型和 U-Net模型的結(jié)果,尤其是在測(cè)試區(qū)域1(山區(qū))和測(cè)試區(qū)域2(半山區(qū)、半丘陵)結(jié)果提升明顯。3個(gè)測(cè)試區(qū)域內(nèi),不同模型測(cè)試結(jié)果對(duì)比如圖5所示。
表2 測(cè)試區(qū)域耕地提取精度
圖5 3個(gè)測(cè)試區(qū)域不同方法提取耕地的驗(yàn)證結(jié)果
測(cè)試區(qū)域1,位于南安市北部的向陽(yáng)鄉(xiāng),地處群山環(huán)抱的內(nèi)陸山區(qū),梯田和坡地類型耕地占區(qū)域1耕地總面積的94.54%。 U-Net模型提取的耕地與真實(shí)耕地一致性低的主要原因是漏提比較嚴(yán)重,如西側(cè)大片耕地的光譜特征因與林、園地相似而被錯(cuò)分為非耕地,東側(cè)被四周林地包圍的獨(dú)立耕地遺漏,從而大大降低了提取耕地的精度。ECA U-Net模型在西側(cè)耕地與林園地光譜特征相似的情況下漏錯(cuò)分現(xiàn)象得到改善,但并不能提升村莊周邊的小塊耕地及被林地包圍的獨(dú)立耕地提取精度。而混合U-Net模型,從圖5中可以明顯看到,東側(cè)數(shù)個(gè)被林地包圍的獨(dú)立耕地部分得到了提取,同時(shí),在梯狀耕地地塊末端邊界精度也得到了部分改善。
測(cè)試區(qū)域2,位于南安市西部的碼頭鎮(zhèn)及詩(shī)山鎮(zhèn),屬半山區(qū)、半丘陵地貌。村莊內(nèi)部及周邊耕地為平地,占區(qū)域2耕地總面積的37.35%;梯田和坡地類型耕地則分布在村莊較遠(yuǎn)的地區(qū),占62.65%。 U-Net模型在村莊內(nèi)部及周邊的平地耕地提取精度較好,但在村莊較遠(yuǎn)的梯田和坡地上耕地提取精度偏低,特別是在西側(cè)村莊邊緣的山區(qū)耕地?zé)o法準(zhǔn)確識(shí)別,出現(xiàn)了較大面積的漏分,也存在少量耕地光譜特征與林園相似錯(cuò)分。ECA U-Net模型與真實(shí)耕地相比較,明顯改善了村莊邊緣的山區(qū) U-Net模型無(wú)法識(shí)別的耕地,但對(duì)小塊耕地及被林地包圍的獨(dú)立耕地提取效果不佳?;旌蟄-Net模型相較ECA U-Net模型,對(duì)于村莊周邊小塊耕地及被林地包圍的小塊獨(dú)立耕地的識(shí)別得到了進(jìn)一步提升,但仍有少部分圖斑會(huì)與村莊周邊的陰影、剛栽種的果園及水庫(kù)周邊的灘涂存在錯(cuò)分現(xiàn)象。
測(cè)試區(qū)域3,主要為南安市南部的水頭鎮(zhèn),屬平原地區(qū),建設(shè)用地密集,地物之間異質(zhì)性大。區(qū)域內(nèi)耕地以平原耕地為主,占90.27%。本文設(shè)計(jì)的3種深度學(xué)習(xí)網(wǎng)絡(luò)模型預(yù)測(cè)的耕地結(jié)果在測(cè)試區(qū)域3的F1分?jǐn)?shù)均在0.8以上,較測(cè)試區(qū)域1和測(cè)試區(qū)域2以梯田和坡地為主的識(shí)別能力更高。但由于地物之間異質(zhì)性大,特別是 U-Net模型在被城鎮(zhèn)內(nèi)部房屋包圍的小塊耕地、與平整地特征相類似的休耕地及房屋陰影遮蓋處的耕地容易出現(xiàn)漏分,而部分林園、荒草地、操場(chǎng)內(nèi)部、養(yǎng)殖場(chǎng)等光譜特征與耕地相類似出現(xiàn)了錯(cuò)分,提取的耕地邊界較真實(shí)耕地邊界,因耕地邊上荒草地錯(cuò)納入耕地邊界,耕地內(nèi)部非常小的林地、設(shè)施農(nóng)用地未剔除。ECA U-Net模型相較U-Net模型,平整地特征相類似的休耕地漏分現(xiàn)象得到緩解,荒草地、操場(chǎng)內(nèi)部、養(yǎng)殖場(chǎng)等光譜特征與耕地相類似錯(cuò)分比例有所下降,但受房屋陰影遮蓋下的耕地及被城鎮(zhèn)內(nèi)部房屋包圍的小塊耕地漏分仍然存在。混合U-Net模型針對(duì)被城鎮(zhèn)內(nèi)部房屋包圍的小塊耕地部分得到了提取,進(jìn)一步提高了耕地提取精度。
南安市預(yù)測(cè)的耕地(如圖6所示),面積為26 219.32 hm2。從耕地立地條件看,位于坡度≤2°的耕地為10 240.84 hm2,占全市耕地的39.06%;坡度位于(2°,6°]的耕地為6 248.41 hm2,占23.83%;位于(6°,15°]的耕地為5927.57 hm2,占22.61%;位于(15°,25°]的耕地為3 113.35 hm2,占11.87%;坡度>25°的耕地為689.25 hm2,占2.63%。從地理空間分布來(lái)看,平原、平原邊緣以上的坡麓、臺(tái)地及山地丘陵均有分布。耕地集中連片分布較少,零散農(nóng)田較多,地塊較小,較多呈階梯狀和魚鱗狀分布。只有南部溪谷、河谷沖積平原和濱海平原處耕地比較集中、地塊較規(guī)則。
圖6 南安市耕地空間分布及坡度分級(jí)
本文提出了混合U-Net模型,在福建省南安市2021年WorldView-2衛(wèi)星影像數(shù)據(jù)的耕地提取中取得了較好精度,優(yōu)于單一注意力機(jī)制模型ECA U-Net和 U-Net模型,特別是在山區(qū)和半丘陵區(qū),F1分?jǐn)?shù)達(dá)到了0.921 2和0.902 5。 U-Net在平原地區(qū)耕地提取精度較好,但對(duì)山垅田的識(shí)別容易與耕地光譜特征相近的林地、荒草地、園地、平整地等混淆及受陰影影響導(dǎo)致分類精度降低,尤其是小塊耕地及被其他復(fù)雜地物包圍的獨(dú)立耕地的識(shí)別程度不高。ECA U-Net通過(guò)引入ECA注意力機(jī)制優(yōu)化 U-Net的編碼器增強(qiáng)特征提取以提升性能,對(duì)于與耕地光譜特征相近的地物錯(cuò)漏分現(xiàn)象明顯下降,整體分類效果提升明顯。但由于耕地的形狀和大小在南方丘陵山區(qū)差異較大,ECA U-Net只是單純地把同層的下采樣層的特征直接concate到上采樣層中,分類效果不如混合U-Net?;旌蟄-Net在編解碼器之間使用了AG注意力模塊,用于學(xué)習(xí)不同形狀和大小耕地目標(biāo),而使得一些較小的耕地及被其他復(fù)雜地物包圍的獨(dú)立耕地得到關(guān)注,具有較好的普適性。
盡管構(gòu)建的混合U-Net模型在耕地提取上取得了較好的精度,本文仍然存在以下問(wèn)題可以改進(jìn):①本文所需的精確樣本依靠人工制作,費(fèi)時(shí)費(fèi)力,樣本制作方面可利用聚類方法或active learning方法快速提取,因此如何快速制作精確樣本是需要進(jìn)一步解決的問(wèn)題;②高分辨率遙感影像耕地地塊的自動(dòng)化提取算法依然是國(guó)內(nèi)外遙感領(lǐng)域共同面臨的科學(xué)問(wèn)題,傳統(tǒng)耕地地塊提取技術(shù)的效率已無(wú)法滿足當(dāng)前精細(xì)化農(nóng)業(yè)應(yīng)用快速響應(yīng)的需求,因此在本文基礎(chǔ)上,可以進(jìn)一步研究耕地地塊的提取算法。