金 晶,毛 星,張 欣,劉 楊,陸學(xué)文,任 妮
(江蘇省農(nóng)業(yè)科學(xué)院信息中心,江蘇 南京 210014)
淡水養(yǎng)殖為全球糧食安全和人類生計(jì)做出了重大貢獻(xiàn)。我國淡水養(yǎng)殖水產(chǎn)品占世界總產(chǎn)量的60% 以上[1]。2020 年,江蘇省淡水養(yǎng)殖產(chǎn)值達(dá)1 065.81 億元,約占全國總產(chǎn)值的16.69%。作為拉動經(jīng)濟(jì)增長、促進(jìn)農(nóng)民增收的重要突破口,淡水養(yǎng)殖對加快實(shí)現(xiàn)鄉(xiāng)村振興具有重要意義[2]。及時(shí)、動態(tài)、精準(zhǔn)地掌握淡水養(yǎng)殖的空間分布,對于水產(chǎn)養(yǎng)殖管理的標(biāo)準(zhǔn)化和智能化至關(guān)重要。傳統(tǒng)的淡水養(yǎng)殖數(shù)據(jù)主要來源于統(tǒng)計(jì)上報(bào),數(shù)據(jù)收集耗時(shí)費(fèi)力、更新速度慢,且準(zhǔn)確性較低。衛(wèi)星遙感影像能夠?qū)崿F(xiàn)對區(qū)域養(yǎng)殖空間分布信息的宏觀感知,是水產(chǎn)養(yǎng)殖動態(tài)監(jiān)測的重要數(shù)據(jù)源[3]。
在水產(chǎn)養(yǎng)殖區(qū)域的遙感識別領(lǐng)域,現(xiàn)有研究已基于圖像的光譜、紋理等特征提出了多種分類方法。光譜閾值法是早期養(yǎng)殖水體識別的常用方法,通過分析不同地物在單波段[4‐5]或多波段組合[6‐7]上的特征差異,提出區(qū)分養(yǎng)殖區(qū)域的閾值。由于閾值法只考慮各波段的光譜信息,但實(shí)際上養(yǎng)殖區(qū)域與河流湖泊等其他水體光譜差異較小,很容易出現(xiàn)“椒鹽”噪聲,使得分類效果較差?;诳臻g結(jié)構(gòu)的方法能夠有效利用圖像的紋理特征、鄰域特征[8‐9],相較于分布零散的內(nèi)陸淡水養(yǎng)殖區(qū)域,更加適用于近海養(yǎng)殖等集中養(yǎng)殖區(qū)域的識別。基于機(jī)器學(xué)習(xí)的支持向量機(jī)(Support vector machine,SVM)[10]、決策樹[11]和隨機(jī)森林[12]等分類方法不但消除了閾值設(shè)定帶來的主觀性誤差,而且充分利用了圖像的光譜紋理融合特征,使得該方法在適用性和精度方面都有了一定的提升。隨著深度學(xué)習(xí)技術(shù)的出現(xiàn),卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)在遙感影像場景分類、目標(biāo)識別和影像分割中的應(yīng)用越來越廣泛[13‐16]。CUI 等[17]改進(jìn)了U-Net 模型,提出了一種端到端的筏式養(yǎng)殖區(qū)提取模型,可以自適應(yīng)地融合邊界減少粘連現(xiàn)象,并以連云港近海筏式養(yǎng)殖區(qū)為例,驗(yàn)證了模型的實(shí)用性與可靠性。ZENG等[18]提出了一種用于提取水產(chǎn)養(yǎng)殖池塘的全卷積神經(jīng)網(wǎng)絡(luò)(Fully convolutional network,F(xiàn)CN),在2 m 多光譜融合影像中的試驗(yàn)精度達(dá)85%。FU 等[19]基于VGG-16提出了適合近海養(yǎng)殖提取的層級級聯(lián)模型HCNet,可以有效識別和區(qū)分不同種類的海水養(yǎng)殖區(qū)??傮w而言,卷積神經(jīng)網(wǎng)絡(luò)模型對遙感影像光譜和紋理特征非常敏銳[20],能夠有效降低養(yǎng)殖區(qū)域錯(cuò)分、漏分的情況,對水陸邊界的識別也更加精準(zhǔn)。
雖然近年來遙感影像解譯水產(chǎn)養(yǎng)殖區(qū)域的研究取得了較多的成果,但上述研究大多針對圖像特征較為明顯的近海養(yǎng)殖[21]和圍湖養(yǎng)殖[22]區(qū)域,少有涉及空間分布較為零散的內(nèi)陸?zhàn)B殖區(qū)域。內(nèi)陸?zhàn)B殖池塘周圍經(jīng)?;煊锌臻g特征相似的農(nóng)用坑塘水體,且養(yǎng)殖池塘的遙感影像光譜易與河流、湖泊、水庫等水域混淆[23],因此難以直接通過傳統(tǒng)分類方式進(jìn)行區(qū)分。此外,不同類型水產(chǎn)品種養(yǎng)殖池塘的波譜曲線變化趨勢相近,而通用的卷積神經(jīng)網(wǎng)絡(luò)模型忽略了像素之間的關(guān)系,且采樣卷積過程易丟失細(xì)節(jié)信息[24]。為了更加精準(zhǔn)、高效地識別內(nèi)陸淡水養(yǎng)殖池塘,基于多光譜Sentinel-2 衛(wèi)星影像數(shù)據(jù),提出一種結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林算法的淡水養(yǎng)殖池塘識別方法。該方法在卷積神經(jīng)網(wǎng)絡(luò)中引入注意力機(jī)制,以提高邊界和零碎圖斑的識別能力,同時(shí)利用植被、水體指數(shù)紋理特征優(yōu)化隨機(jī)森林算法,提高不同水產(chǎn)品種養(yǎng)殖池塘的空間特性的利用效率,并以宜興市為例實(shí)現(xiàn)了淡水養(yǎng)殖池塘的自動提取,以期為精準(zhǔn)水產(chǎn)養(yǎng)殖服務(wù)提供有效信息支撐和決策支持。
宜興市隸屬江蘇省無錫市,位于北緯31°07′~31°37′,東經(jīng)119°31′~120°03′,面積1 996.6 km2,境內(nèi)水域面積占比達(dá)16.75%,水文氣候條件適合溫水魚類和蝦蟹等水產(chǎn)養(yǎng)殖[25],是太湖地區(qū)水產(chǎn)養(yǎng)殖面積最大的縣市(圖1)。2016 年,宜興水產(chǎn)品總量達(dá)8.18萬t,漁業(yè)總產(chǎn)值17.86億元,占全市農(nóng)業(yè)總產(chǎn)值的20.63%[26]。
圖1 研究區(qū)位置Fig.1 Location of the study area
1.2.1 遙感數(shù)據(jù)及預(yù)處理 本研究選用Sentinel-2 L1C 級影像產(chǎn)品作為遙感數(shù)據(jù)的主要數(shù)據(jù)源(下載于美國USGS 網(wǎng)站:https://earthexplorer.usgs.gov/)。該影像包含13個(gè)波段,研究中選取了其中能夠反映養(yǎng)殖池塘復(fù)雜水生環(huán)境的可見光、植被紅邊、近紅外和短波紅外等9個(gè)波段進(jìn)行分析。該數(shù)據(jù)最高空間分辨率可達(dá)10 m,因此可以清晰識別池塘邊界。通過利用SNAP 軟件對影像進(jìn)行大氣校正得到L2A級產(chǎn)品,再將影像空間分辨率重采樣至10 m。另外,由于植被指數(shù)和水體指數(shù)能夠有效反映養(yǎng)殖池塘的地物特征,因此與衛(wèi)星原始波段融合后進(jìn)行歸一化處理,從而得到歸一化植被指數(shù)(Normalized difference vegetation index,NDVI)和歸一化水體指數(shù)(Normalized difference water index,NDWI)。數(shù)據(jù)波段信息如表1所示。
表1 使用的Sentinel-2數(shù)據(jù)波段描述Tab.1 Description of the Sentinel-2 data bands used in this study
1.2.2 實(shí)地調(diào)研數(shù)據(jù) 根據(jù)2017 年度漁情統(tǒng)計(jì)數(shù)據(jù),宜興市以螃蟹和常規(guī)魚2種池塘養(yǎng)殖模式為主。為了獲取研究區(qū)內(nèi)養(yǎng)殖水體類型的真實(shí)分布情況,于2021 年6 月對蟹塘和魚塘進(jìn)行了實(shí)地調(diào)研,使用手持GPS 記錄了采樣點(diǎn)的經(jīng)緯度信息、養(yǎng)殖類型,累積采集67 個(gè)養(yǎng)殖區(qū)樣本點(diǎn),其中蟹塘48 個(gè)、魚塘19個(gè)。此外,為增加樣本數(shù)量,基于同時(shí)期高分2號衛(wèi)星影像,采用目視解譯的方法獲取36 個(gè)蟹塘樣本,15 個(gè)魚塘樣本。因此,研究區(qū)內(nèi)共采集了蟹塘樣本84個(gè),魚塘樣本34個(gè)(圖2)。
圖2 通過實(shí)地GPS采集和目視解譯獲得的采樣點(diǎn)分布Fig.2 Distribution of sampling points obtained by field GPS acquisition and visual interpretation
相比于魚塘,蟹塘通常水深較淺,且需要大量種植伊樂藻等水草以提高水體含氧量并為螃蟹提供蛻殼場所[27‐28]?;谛诽恋木唧w特征,本研究設(shè)計(jì)了一種結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林的淡水養(yǎng)殖池塘識別方法(圖3)。首先根據(jù)圖像光譜特征,使用卷積神經(jīng)網(wǎng)絡(luò)模型識別養(yǎng)殖水體分布;進(jìn)而利用植被、水體指數(shù)的紋理差異,采用隨機(jī)森林算法從養(yǎng)殖水體中區(qū)分魚塘和蟹塘。
圖3 淡水養(yǎng)殖池塘識別技術(shù)流程Fig.3 The workflow of freshwater aquaculture pond identification
1.3.1 基于SE-Unet模型的養(yǎng)殖水體分布識別 本研究基于U-Net[29]模型引入注意力機(jī)制,改進(jìn)并設(shè)計(jì)了用于提取養(yǎng)殖水體的SE-Unet 神經(jīng)網(wǎng)絡(luò)模型(圖4)。模型整體為U型結(jié)構(gòu),包括編碼和解碼2個(gè)過程。編碼部分通過卷積和下采樣操作來降低圖像尺寸以獲取淺層特性,解碼部分則通過卷積和上采樣操作增加圖像尺寸提取深層特征,淺層輸出影像具有較高分辨率,能夠確定像素位置,深層輸出特征豐富,用來實(shí)現(xiàn)像素分類。每一層編碼后增加的通道注意力(SE-Inception)模塊可以提取不同尺度的空間信息[30],增強(qiáng)養(yǎng)殖池塘的整體位置特征。上采樣和下采樣之間增加的空間注意力(SESpatial)模塊能夠逐像素分配不同的權(quán)重以增強(qiáng)養(yǎng)殖水體的細(xì)節(jié)特征。
圖4 SE-Unet模型結(jié)構(gòu)Fig.4 Structure of the SE-Unet model
通道注意力機(jī)制結(jié)構(gòu)如圖5所示。人眼感知遙感影像時(shí),首先關(guān)注到的是池塘的整體位置,引入該機(jī)制的目的是為了增強(qiáng)養(yǎng)殖池塘與周圍環(huán)境的位置關(guān)聯(lián)特征。首先對C× H × W的影像進(jìn)行全局池化得到具有全局感受野的C× 1× 1 特征圖,然后進(jìn)行一次全連接,得到C/16 維度的特征圖,接著進(jìn)行ReLU 非線性激活,再進(jìn)行一次全連接,將特征圖變?yōu)镃 維,最后通過sigmoid 激活函數(shù)得到權(quán)重矩陣。通道注意力模塊為不同采樣大小的圖像提供不同的權(quán)重,從而保持目標(biāo)地物整體位置的一致性。
圖5 通道注意力模塊結(jié)構(gòu)Fig.5 Structure of channel attention module
空間注意力機(jī)制結(jié)構(gòu)如圖6所示。遙感圖像的語義分割中,融合不同編碼層的特征信息可以提高像素級預(yù)測精度,本研究設(shè)計(jì)的空間注意力機(jī)制能夠從行、列2個(gè)方向逐像素地增強(qiáng)特征。首先對C×H × W 的影像拆分為H、W 2 個(gè)方向進(jìn)行池化,然后將結(jié)果拼接后進(jìn)行卷積和ReLU 非線性激活得到C/16 × 1×(H + W) 的特征圖,接著再分割為C×H × 1 和C× 1× W 2 個(gè)維度進(jìn)行卷積和sigmoid 函數(shù)激活,最后加權(quán)得到每個(gè)像素的權(quán)重,與不同編碼層的特性信息融合后,可以增強(qiáng)預(yù)測圖斑的細(xì)節(jié)信息。
圖6 空間注意力模塊結(jié)構(gòu)Fig.6 Structure of spatial attention module
內(nèi)陸淡水養(yǎng)殖分布零散且復(fù)雜,模型的損失函數(shù)設(shè)置需考慮正負(fù)樣本的均衡情況。研究中選用Dice 函數(shù)和BCEWithLogitsLoss 函數(shù)的加權(quán)作為損失函數(shù):
其中,α是0到1之間的常量系數(shù),用來控制2個(gè)損失函數(shù)之間的權(quán)重平衡。
在損失函數(shù)中,Dice 函數(shù)用于針對研究區(qū)域內(nèi)正負(fù)樣本不均衡的情況。該函數(shù)將樣本區(qū)域的整體預(yù)測結(jié)果與整體真實(shí)結(jié)果進(jìn)行比較,而非逐像素地計(jì)算精度,適用于像素不平衡的情況。由于樣本數(shù)據(jù)集中存在集中養(yǎng)殖區(qū)和零散養(yǎng)殖區(qū),集中養(yǎng)殖區(qū)的正樣本數(shù)量遠(yuǎn)遠(yuǎn)大于負(fù)樣本數(shù)量,零散養(yǎng)殖區(qū)則與之相反,這種不均衡可能會影響神經(jīng)網(wǎng)絡(luò)模型的收斂。函數(shù)表達(dá)式為:
其中,pi是預(yù)測結(jié)果標(biāo)簽,qi是標(biāo)注樣本的真實(shí)標(biāo)簽,標(biāo)簽值為0或1,N是像素個(gè)數(shù)。
在損失函數(shù)中,BCEWithLogitsLoss 函數(shù)則是通過逐像素的比較實(shí)現(xiàn)對預(yù)測結(jié)果的評估??紤]到樣本數(shù)據(jù)集中也存在部分養(yǎng)殖區(qū)和非養(yǎng)殖區(qū)面積相近的情況,引入該函數(shù)能夠更加有效地利用背景像素的特征信息,提高卷積神經(jīng)網(wǎng)絡(luò)模型的精度。計(jì)算公式如下:
其中,ln是單個(gè)像素的評估結(jié)果,其余參數(shù)意義同Dice函數(shù)。
Dice 和BCEWithLogitsLoss 函數(shù)的結(jié)合,使得卷積神經(jīng)網(wǎng)絡(luò)模型既能聚焦前景像素,又能充分利用背景像素的特征信息,從而適應(yīng)樣本數(shù)據(jù)集中目標(biāo)地物占比值的隨機(jī)變化,提高模型的整體精度。
本研究模型的搭建基于PyTorch 深度學(xué)習(xí)框架[31],主要分為樣本數(shù)據(jù)集構(gòu)建和模型參數(shù)調(diào)整2個(gè)步驟。在樣本數(shù)據(jù)集構(gòu)建中,采用GeoTIFF作為樣本數(shù)據(jù)集標(biāo)準(zhǔn)格式。截取部分研究區(qū)域作為訓(xùn)練樣本,采用目視解譯的方式進(jìn)行樣本標(biāo)注,其中養(yǎng)殖水體標(biāo)注為1,其他要素標(biāo)注為0。為提高樣本的隨機(jī)性,采用隨機(jī)窗口的方式獲取樣本數(shù)據(jù)。模型提前加載全部樣本數(shù)據(jù)至計(jì)算機(jī)內(nèi)存中,訓(xùn)練和測試時(shí)每次隨機(jī)獲取樣本范圍內(nèi)100 個(gè)256×256 窗口大小的數(shù)據(jù),并按照一定比例進(jìn)行旋轉(zhuǎn)、反轉(zhuǎn)、鏡像、模糊等數(shù)據(jù)增強(qiáng)操作。
模型參數(shù)調(diào)整對模型的訓(xùn)練效率和分類精度起著決定性作用。根據(jù)多次預(yù)試驗(yàn)結(jié)果,設(shè)置初始學(xué)習(xí)率為0.001 并不斷進(jìn)行學(xué)習(xí)率的調(diào)整,每30 個(gè)迭代降低學(xué)習(xí)率為原來的0.9倍,迭代總數(shù)1 000次,批處理大小為8,線程數(shù)為4。基于預(yù)試驗(yàn)結(jié)果,損失函數(shù)的常量系數(shù)α設(shè)置為0.3。
1.3.2 基于隨機(jī)森林算法的養(yǎng)殖水體分類 在獲取養(yǎng)殖水體分布后,進(jìn)一步對其中的蟹塘和魚塘加以區(qū)分。蟹塘一般種植水草,水深較淺,而魚塘不種植水草,水位較深[32]。由于NDVI和NDWI分別反映了遙感影像的植被和水體信息[33‐34],隨機(jī)森林算法也已在遙感圖像處理中取得較好的效果[35‐37],因此,本研究提出一種基于NDVI 和NDWI 紋理特征的隨機(jī)森林分類方法,從養(yǎng)殖水體中區(qū)分蟹塘和魚塘。
首先分別計(jì)算逐像素NDVI 和NDWI 灰度共生矩陣[38]的均值、方差、對比度、均質(zhì)性、相異性、熵等12 個(gè)紋理特征,進(jìn)而計(jì)算養(yǎng)殖水體圖斑12 個(gè)紋理特征的平均值和標(biāo)準(zhǔn)差作為模型的輸入特征。根據(jù)調(diào)研數(shù)據(jù)定義養(yǎng)殖類型標(biāo)簽,其中魚塘為0,蟹塘為1。將總樣本按照7∶3 的比例劃分為訓(xùn)練樣本和驗(yàn)證樣本。決策樹個(gè)數(shù)N設(shè)置為200,隨機(jī)特征變量數(shù)K設(shè)為特征總數(shù)的平方根。
使用混淆矩陣來評價(jià)本研究方法的識別精度[8,23]。通過將養(yǎng)殖水體識別結(jié)果的30 m 緩沖范圍作為非養(yǎng)殖區(qū),在養(yǎng)殖區(qū)識別結(jié)果內(nèi)隨機(jī)生成200個(gè)點(diǎn),在非養(yǎng)殖區(qū)內(nèi)隨機(jī)生成100個(gè)點(diǎn),作為驗(yàn)證點(diǎn)進(jìn)行目視解譯,生成混淆矩陣。
為分析方法的有效性,將本研究構(gòu)建的SEUnet 與U-Net[29]、R-FCN[39]深度學(xué)習(xí)網(wǎng)絡(luò)模型進(jìn)行對比,其中R-FCN 是基于ResNet-50 改進(jìn)的FCN 網(wǎng)絡(luò)模型。為了避免隨機(jī)樣本帶來識別結(jié)果的偶然性,對每個(gè)模型進(jìn)行5 次試驗(yàn)后取平均值。將隨機(jī)森林與SVM、邏輯回歸(Logistic regression)算法進(jìn)行對比分析。SVM 創(chuàng)建時(shí),采用網(wǎng)格搜索的方式選擇擬合分?jǐn)?shù)最高的超平面系數(shù),正則化參數(shù)C等于0.001、0.01、0.1、1、10、100、1 000,核函數(shù)參數(shù)γ范圍為0.1、0.01、0.005、0.001、0.000 5、0.000 1。邏輯回歸的收斂最大迭代次數(shù)設(shè)置為100,分類方式設(shè)為ovr 二分類,使用L2 的懲罰項(xiàng)來防止過擬合。將生產(chǎn)者精度(Producer’s accuracy,PA)、總體精度(Overall accuracy,OA)、交并比(Intersection‐over‐Union,IoU)、kappa系數(shù)作為模型的定量評價(jià)指標(biāo)。
根據(jù)水產(chǎn)養(yǎng)殖池塘的提取和識別結(jié)果(圖7),宜興市2021 年淡水養(yǎng)殖池塘面積為121.25 km2,其中蟹塘面積74.48 km2,魚塘面積46.77 km2。從空間分布上看,2021 年宜興市蟹塘和魚塘的分布較不均勻。蟹塘主要分布在宜興市西北部的高塍(16.30 km2)、楊巷(14.58 km2)、徐舍(11.11 km2)、官林(11.08 km2)、新建(6.89 km2)、和橋(4.94 km2)6 個(gè)鄉(xiāng)鎮(zhèn),這些地區(qū)的蟹塘面積占全市總養(yǎng)殖面積的87.14%。其中,楊巷、新建和高塍3個(gè)鄉(xiāng)鎮(zhèn)的養(yǎng)殖密度最高,分別占該地區(qū)總面積的16.94%、15.53%、14.77%。魚塘則主要分布在徐舍(11.52 km2)、和橋(10.77 km2)和高塍(5.32 km2)。其中,和橋的養(yǎng)殖密度最高,占該地區(qū)總面積的10.00%。
圖7 2021年宜興市淡水養(yǎng)殖區(qū)提取結(jié)果Fig.7 Identification results of freshwater aquaculture ponds in Yixing City in 2021
養(yǎng)殖池塘識別結(jié)果的混淆矩陣表明,本研究提出的淡水養(yǎng)殖池塘識別方法具有較高的準(zhǔn)確性,OA為88.33%,kappa 系數(shù)為0.824 3(表2)。有7 個(gè)驗(yàn)證點(diǎn)被錯(cuò)分為非養(yǎng)殖區(qū),19個(gè)點(diǎn)被誤分為蟹塘,9個(gè)點(diǎn)被誤分為魚塘,蟹塘和魚塘之間容易出現(xiàn)錯(cuò)分。
表2 養(yǎng)殖區(qū)識別結(jié)果混淆矩陣Tab.2 Confusion matrix of identification results for aquaculture ponds
語義分割模型的精度評價(jià)結(jié)果表明,3 種深度學(xué)習(xí)模型的養(yǎng)殖水體分割的PA 均超過90%,都能夠較好地感知影像的空間語義信息(表3)。SEUnet 模型的PA、IoU 和kappa 系數(shù)分別為94.05%、0.815 1、0.878 4,均優(yōu)于U-Net和R-FCN。與U-Net模型相比,SE 注意力機(jī)制能夠?qū)⒛P偷腜A 提高2.61個(gè)百分點(diǎn)。
表3 養(yǎng)殖水體分割精度評價(jià)Tab.3 Evaluation of the accuracy of aquaculture water segmentation
圖8顯示了不同方法在集中養(yǎng)殖區(qū)和零散養(yǎng)殖區(qū)的分割效果,其中黑色為水產(chǎn)養(yǎng)殖區(qū),白色為其他背景地物,紅框標(biāo)注區(qū)域?yàn)楦鞣椒ㄗR別差異較大的區(qū)域。在集中養(yǎng)殖區(qū),3 種深度學(xué)習(xí)模型都能夠較好地分割和識別大部分養(yǎng)殖區(qū)域。相比R-FCN和U-Net,SE-Unet 模型在邊緣提取、細(xì)碎圖斑識別等細(xì)節(jié)方面表現(xiàn)更佳。在零散養(yǎng)殖區(qū),3 種方法的分割效果差距較大。其中,R-FCN 模型不僅忽略了面積較小的養(yǎng)殖區(qū),在面積中等的養(yǎng)殖區(qū)也僅能提取出部分區(qū)域;U-Net 模型雖然能夠檢測到不同面積養(yǎng)殖區(qū)的位置,但其提取的養(yǎng)殖區(qū)邊界較不清晰;相比之下,引入注意力機(jī)制的SE-Unet模型能夠提高對養(yǎng)殖區(qū)域岸堤邊界識別的精度。
圖8 不同養(yǎng)殖區(qū)水體識別效果Fig.8 Identification effect of water in different aquaculture regions
對比2 種不同養(yǎng)殖區(qū)域可以發(fā)現(xiàn),深度學(xué)習(xí)模型在集中養(yǎng)殖區(qū)的提取效果明顯優(yōu)于零散養(yǎng)殖區(qū)(圖8)。結(jié)合遙感影像可以看出,集中養(yǎng)殖區(qū)的地物圖斑更規(guī)則,其斑塊之間多以田埂堤壩或河溝鄰接,地面覆蓋類型相對簡單;而零散養(yǎng)殖區(qū)多分布在村莊附近,與道路農(nóng)田等相近,其周邊的土地利用類型復(fù)雜多樣。說明深度學(xué)習(xí)模型的性能依然會受到地表覆蓋復(fù)雜程度的影響。
通過比較3種養(yǎng)殖池塘水體分類方法的圖斑地塊精度發(fā)現(xiàn),隨機(jī)森林在訓(xùn)練集和驗(yàn)證集的準(zhǔn)確率均為最高,分別是93%、87%,其訓(xùn)練集準(zhǔn)確率比SVM、邏輯回歸分別高5、9個(gè)百分點(diǎn),驗(yàn)證集準(zhǔn)確率高6、5個(gè)百分點(diǎn)。
對于養(yǎng)殖區(qū)面積分類情況,3 種機(jī)器學(xué)習(xí)分類方法的總體精度都在85%以上,均能夠從養(yǎng)殖區(qū)中有效區(qū)分蟹塘和魚塘(表4)。其中,總體效果最好的是隨機(jī)森林算法,得到的蟹塘PA 為88.22%、魚塘PA 為99.77%,OA 達(dá)94.74%。邏輯回歸得到的蟹塘PA 最高,為92.80%,但其魚塘PA 最低,有較多魚塘誤分為蟹塘的情況。SVM 的蟹塘PA 為81.54%,魚塘PA為88.20%,OA為85.30%。
表4 3種算法的混淆矩陣、PA和OATab.4 Confusion matrix,PA and OA of the three algorithms
續(xù)表4 3種算法的混淆矩陣、PA和OATab.4(Continued) Confusion matrix,PA and OA of the three algorithms
利用遙感影像實(shí)現(xiàn)內(nèi)陸淡水養(yǎng)殖空間分布的快速提取對于水產(chǎn)養(yǎng)殖現(xiàn)代化管理具有重要意義。內(nèi)陸淡水養(yǎng)殖池塘具有空間分布復(fù)雜、養(yǎng)殖品種豐富等特點(diǎn),不同養(yǎng)殖品種的池塘外觀上都呈現(xiàn)矩形等規(guī)則形狀,光譜特征也較為相似,因此區(qū)分不同養(yǎng)殖池塘的水產(chǎn)品種是一項(xiàng)困難的任務(wù)?;诓煌B(yǎng)殖類型區(qū)域的空間特征,本研究提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林相結(jié)合的內(nèi)陸淡水養(yǎng)殖池塘水產(chǎn)類型識別方法,結(jié)合宜興市野外調(diào)研數(shù)據(jù),構(gòu)建了解譯標(biāo)志庫,實(shí)現(xiàn)了對宜興市淡水養(yǎng)殖區(qū)域的分類、提取和分析。通過充分利用卷積神經(jīng)網(wǎng)絡(luò)在空間模式方面的優(yōu)勢以及遙感植被指數(shù)和水體指數(shù)的紋理特征,實(shí)現(xiàn)了魚塘和蟹塘的準(zhǔn)確識別,得出了以下結(jié)論。
2021 年宜興市淡水養(yǎng)殖池塘識別面積121.25 km2,其中蟹塘面積74.48 km2,魚塘面積46.77 km2,識別結(jié)果總體精度為88.33%,kappa系數(shù)為0.824 3。《宜興市養(yǎng)殖水域?yàn)┩恳?guī)劃》顯示,近年來該地常規(guī)魚與河蟹養(yǎng)殖面積約127.33 km2,研究識別結(jié)果與真實(shí)值的誤差小于5%,表明SE-Unet模型結(jié)果能夠真實(shí)地反映區(qū)域淡水養(yǎng)殖狀況。在此前的研究中,ZENG 等[18]提出的RCSANet 模型通過在網(wǎng)絡(luò)中引入行列注意力機(jī)制,使得多個(gè)湖泊周圍的集中養(yǎng)殖區(qū)分類效果都較好。但零散的養(yǎng)殖池塘在整體環(huán)境中面積占比很小,且其周圍分布有大量影響識別精度的其他地物,針對這一問題,本研究提出的SE-Unet模型使用通道注意力提高了養(yǎng)殖區(qū)識別成功率,使用空間注意力提高了養(yǎng)殖池塘邊緣識別精度,有效提高了養(yǎng)殖水體語義分割精度。研究設(shè)計(jì)的Dice 和BCE 相結(jié)合的損失函數(shù),也在一定程度上有助于提高養(yǎng)殖池塘的識別效果。另外,統(tǒng)計(jì)數(shù)據(jù)顯示,2016 年宜興市蟹塘面積為82.67 km2,魚塘面積為44.67 km2[26],這與本研究提取的蟹塘和魚塘面積相近,說明NDVI 和NDWI 提供的特征作為養(yǎng)殖池塘分類的輸入因子對模型精度的提高具有重要意義,有助于從養(yǎng)殖區(qū)中進(jìn)一步區(qū)分出蟹塘和魚塘,為不同養(yǎng)殖品種提供空間分布信息。另外,通過將養(yǎng)殖水體提取方法SE-Unet 與R-FCN、U-Net 對比,發(fā)現(xiàn)結(jié)合SE 注意力機(jī)制和UNet 算法構(gòu)建的SE-Unet 在邊緣檢測和細(xì)碎圖斑識別中表現(xiàn)更加突出,模型的總體精度更高。而在養(yǎng)殖品種分類上,隨機(jī)森林算法的分類精度高于SVM和邏輯回歸算法。因此,研究提出的內(nèi)陸淡水養(yǎng)殖池塘識別方法是有效的。
隨著高密度養(yǎng)殖成為我國水產(chǎn)養(yǎng)殖的重要方式,內(nèi)陸的淡水養(yǎng)殖對周邊生態(tài)環(huán)境造成了不同程度的污染[8,40]。本研究提出的淡水養(yǎng)殖池塘識別方法可用于實(shí)時(shí)、動態(tài)監(jiān)測水產(chǎn)養(yǎng)殖區(qū)的分布和變化,能夠?yàn)轲B(yǎng)殖產(chǎn)業(yè)合理規(guī)劃和生態(tài)環(huán)境治理決策提供支撐。但研究中也存在一定的局限性。本研究的淡水養(yǎng)殖池塘識別方法雖然具有較高的精度,但前期樣本數(shù)據(jù)獲取仍需大量外業(yè)調(diào)查和目視解譯工作,未來還應(yīng)進(jìn)一步研發(fā)小樣本算法,解決標(biāo)注數(shù)據(jù)不足等問題[41]。部分蟹塘由于受到環(huán)境污染的影響,池塘里的水草會死亡,魚塘則由于長期不清理長出水花生、藍(lán)藻等懸浮雜質(zhì),導(dǎo)致二者之間難以區(qū)分,影響分類效果。在后續(xù)研究中可以進(jìn)一步融合長期的時(shí)間序列影像來提高養(yǎng)殖池塘的分類精度。另外,本研究區(qū)域內(nèi)養(yǎng)殖品種主要為魚塘和蟹塘2 種類型,未來可以將該方法擴(kuò)展到其他區(qū)域,以驗(yàn)證其在不同水產(chǎn)養(yǎng)殖品種分類研究中的適用性。