馮齊心,楊遼,王偉勝,陳桃,黃雙燕
(1 中國(guó)科學(xué)院新疆生態(tài)與地理研究所,烏魯木齊 830011; 2 中國(guó)科學(xué)院大學(xué),北京 100049)
精準(zhǔn)農(nóng)業(yè)是世界各國(guó)農(nóng)業(yè)現(xiàn)代化的共同選擇[1-2],及時(shí)、準(zhǔn)確地對(duì)農(nóng)作物進(jìn)行分類與制圖,獲取農(nóng)作物種植結(jié)構(gòu)和類型分布信息,可為國(guó)家宏觀調(diào)控農(nóng)作物種植結(jié)構(gòu)、估計(jì)農(nóng)作物產(chǎn)量、制定糧食政策等提供重要的數(shù)據(jù)參考[3-4]。遙感是一種對(duì)地綜合性觀測(cè)技術(shù),能對(duì)地表進(jìn)行大尺度的動(dòng)態(tài)觀測(cè),相比傳統(tǒng)基于人工調(diào)查的作物分類方法,可節(jié)省大量人力物力,是目前進(jìn)行農(nóng)作物種植結(jié)構(gòu)調(diào)查的主要方法[5-8]。
根據(jù)遙感影像時(shí)相數(shù)的不同,遙感農(nóng)作物分類方法可分為以下兩種:1)基于單期影像的快速分類法。該方法通過選取一期農(nóng)作物光譜特征差異最為明顯的“關(guān)鍵物候期”影像來實(shí)現(xiàn)農(nóng)作物的快速分類[9]。如劉佳等[10]在綜合考慮作物的生長(zhǎng)發(fā)育時(shí)期后,選擇2014年7月27日的一期RapidEye數(shù)據(jù),進(jìn)行短波紅外波段對(duì)玉米和大豆分類精度影響的試驗(yàn),結(jié)果表明,短波紅外波段的引入能顯著提高玉米和大豆的分離能力;Chauhan和Mohan[11]以位于印度中西部的羅那鎮(zhèn)為研究區(qū),采用EO-1高光譜數(shù)據(jù),提取研究區(qū)內(nèi)的小麥、高粱與鷹嘴豆等作物。單期影像分類法雖然能實(shí)現(xiàn)農(nóng)作物的快速解譯,但由于實(shí)際應(yīng)用中作物類型復(fù)雜多樣,單期遙感影像中作物的“異物同譜”現(xiàn)象明顯,分類結(jié)果往往存在缺陷[12]。2)時(shí)間序列分類法。時(shí)間序列數(shù)據(jù)中包含豐富的農(nóng)作物光譜與光譜變化信息,利用這些信息進(jìn)行農(nóng)作物分類的精度一般高于單期影像分類法[7,12-13],但由于時(shí)間序列數(shù)據(jù)具有較高的數(shù)據(jù)維度,數(shù)據(jù)之間存在較高的相關(guān)性與數(shù)據(jù)冗余,不利于常用遙感分類算法直接進(jìn)行分類[14-15],因此,研究者們一般先從時(shí)間序列數(shù)據(jù)中提取相關(guān)特征,再利用這些特征進(jìn)行分類。歸一化植被指數(shù) (normalized differential vegetation index, NDVI) 是時(shí)間序列分類法中應(yīng)用最多的特征[16-17],常以決策樹 (decision tree, DT)、支持向量機(jī) (support vector machine, SVM)、隨機(jī)森林 (random forest, RF) 等機(jī)器學(xué)習(xí)算法為組合來進(jìn)行分類。郭昱杉等[18]應(yīng)用該方法,提取黃河三角洲地區(qū)的主要農(nóng)作物;Belgiu和Csillik[19]以Sentinel-2 A的時(shí)間序列NDVI為特征,提取多種農(nóng)作物的種植結(jié)構(gòu)信息?;谔卣魈崛〉臅r(shí)間序列分類法是進(jìn)行遙感農(nóng)作物分類的有效方法,但特征提取仍然需要豐富而全面的專家知識(shí),否則容易忽略相關(guān)的有效特征[9,13,20-21],同時(shí),特征提取過程中涉及復(fù)雜的數(shù)據(jù)重建工作,不利于農(nóng)作物遙感的快速與自動(dòng)化分類[21]。
卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)方法中的一種,它的主要結(jié)構(gòu)單元包括卷積層與全連接層,卷積層的局部連接與參數(shù)共享結(jié)構(gòu)可自動(dòng)從圖像中提取特征[22],相比基于人工提取的特征更加深層[16,23],且魯棒性更好[24],可避免人工特征提取過程中相關(guān)特征的丟失以及復(fù)雜的數(shù)據(jù)重建;全連接層在卷積神經(jīng)網(wǎng)絡(luò)中是完成具體分類的模塊,它能基于卷積層所提取的特征完成高精度的圖片分類。2012年ImageNet圖像分類大賽中,AlexNet卷積神經(jīng)網(wǎng)絡(luò)模型[25]取得冠軍,將top-5錯(cuò)誤率從25%降低至17%,之后相繼提出的GoogleNet、VGGNet、ResNet、SE-Net等網(wǎng)絡(luò)模型通過對(duì)卷積神經(jīng)網(wǎng)絡(luò)的改進(jìn)[26],不斷刷新ImageNet圖像分類的精度,目前錯(cuò)誤率已經(jīng)降到2.25%。鑒于卷積神經(jīng)網(wǎng)絡(luò)具有自動(dòng)提取特征與高精度圖像分類與識(shí)別的能力,許多遙感領(lǐng)域的學(xué)者展開了基于卷積神經(jīng)網(wǎng)絡(luò)的遙感圖像分類與識(shí)別研究。Xu等[27]采用具有雙卷積結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)分別從高光譜與雷達(dá)數(shù)據(jù)中自動(dòng)提取光譜與空間特征,然后利用卷積網(wǎng)絡(luò)的全連接結(jié)構(gòu)進(jìn)行分類,在Houston與Trento數(shù)據(jù)集中分別達(dá)到87.98%與97.92%的總體精度。Ma等[20]采用跳躍型卷積神經(jīng)網(wǎng)絡(luò)分別對(duì)Indian Pines,Pavia center和Salinas 3個(gè)數(shù)據(jù)集進(jìn)行土地利用類型的分類,各數(shù)據(jù)集總體精度均高于以往的研究。
然而,以上基于卷積神經(jīng)網(wǎng)絡(luò)的遙感研究多集中在特定目標(biāo)識(shí)別與土地利用類型的提取,針對(duì)時(shí)間序列多光譜數(shù)據(jù)的農(nóng)作物遙感分類方法的研究較少。因此,本文針對(duì)單時(shí)相農(nóng)作物分類法難以滿足精度要求,傳統(tǒng)的時(shí)間序列分類法面臨手動(dòng)提取特征等問題,考慮到卷積神經(jīng)網(wǎng)絡(luò)的自動(dòng)特征提取與分類優(yōu)勢(shì),采取卷積神經(jīng)網(wǎng)絡(luò)分類方法,以新疆沙灣縣為實(shí)驗(yàn)區(qū),開展基于時(shí)間序列多光譜的農(nóng)作物遙感分類研究。
沙灣縣 (84°57′E~86°09′E, 43°29′N°~45°20′N) 位于新疆伊犁哈薩克自治州的塔城地區(qū),面積約1.31 萬km2,南連天山,北接古爾班通古特沙漠,年平均氣溫6.3~6.9 ℃,年降水140~350 mm,年蒸發(fā)量1 500~2 000 mm,日內(nèi)溫差大,氣候干燥,是典型的溫帶大陸性干旱氣候。沙灣縣境內(nèi)共有6條河流,其中有5條發(fā)源于其南部的天山山脈,是全縣主要的農(nóng)業(yè)灌溉水源。該區(qū)耕地主要分布在北部的沖積平原區(qū)、中部的洪積沖積扇區(qū)和南部的山前丘陵區(qū),作物種植類型包括棉花、小麥、玉米、番茄等,是新疆農(nóng)業(yè)大縣之一。
從歐空局 (https:∥scihub.copernicus.eu/) 獲得沙灣縣2016年4—10月期間6期(31景)Sentinel-2A遙感數(shù)據(jù)。Sentinel-2A是歐空局于2015年6月23日發(fā)射的一顆重訪周期為10 d的衛(wèi)星,其攜帶的多光譜成像儀共覆蓋13個(gè)波段,除可見光及近紅外、短波紅外等常用波段外,還包括3個(gè)對(duì)植被生長(zhǎng)與變化敏感的紅邊波段(表1),可為遙感農(nóng)作物分類提供更為豐富的農(nóng)作物生長(zhǎng)狀態(tài)信息[28]。樣本數(shù)據(jù)是2016年用手持GPS在野外實(shí)地調(diào)查的數(shù)據(jù),共169個(gè)采樣地塊(圖1)。其中包括91個(gè)地塊作為分類的訓(xùn)練樣本,含27塊棉花地、15塊冬小麥地、13塊春小麥地、14塊春玉米地、12塊番茄地以及10個(gè)其他類型;78個(gè)地塊作為驗(yàn)證樣本用于后期精度檢驗(yàn),含23塊棉花地、13塊冬小麥地、12塊春小麥地、11塊春玉米地、10塊番茄地以及9個(gè)其他類型。
表1 Sentinel-2A 波段信息Table 1 Band information of Sentinel-2A
采用歐空局提供的SNAP(sentinel application platform,版本5.0)軟件中的Sen2Cor、Sen2Three、Mosaicking等模塊對(duì)原始的31景SAFE格式Sentinel-2A數(shù)據(jù)分別進(jìn)行大氣校正、去云與拼接鑲嵌等處理,得到6期可反映研究區(qū)主要農(nóng)作物生長(zhǎng)變化的時(shí)間序列多光譜數(shù)據(jù)(表2)。本文選擇Sentinel-2A數(shù)據(jù)的紅、綠、藍(lán)、紅邊、近紅外、短波紅外等波段進(jìn)行農(nóng)作物的分類,由于藍(lán)、綠、紅、第二近紅外等波段分辨率為10 m,其他波段分辨率為20 m,為對(duì)分辨率進(jìn)行統(tǒng)一,采用最鄰近法將各20 m分辨率的波段重采樣至10 m[29-30]。
表2 影像日期與實(shí)驗(yàn)區(qū)主要農(nóng)作物物候Table 2 Imaging dates and phonological phases of the main corns in experimental area
時(shí)間序列多光譜數(shù)據(jù)具有時(shí)間與光譜兩個(gè)維度的特征,為讓卷積神經(jīng)網(wǎng)絡(luò)充分利用這些特征信息,對(duì)時(shí)間序列多光譜進(jìn)行時(shí)序光譜重構(gòu)。具體構(gòu)建過程如下:圖2(a)為具有n期遙感影像的時(shí)間序列數(shù)據(jù)集,p1、p2、p3、…、pn分別為各期遙感影像在i行、j列的影像像元,它們的集合P稱為時(shí)間序列數(shù)據(jù)集在i行、j列的像元基元。其中p1在各波段的反射率分別為p11、p12、…、p1 m,p2在各波段的反射率分別為p21、p22、…、p2 m,…,pn在各波段的反射率分別為pn1、pn2、…、pnm,在圖2(b)中,以時(shí)間維為縱軸,光譜維為橫軸,對(duì)各像元在各波段的反射率值進(jìn)行重組,得到一張具有n行m列的圖片,此圖被稱為像元基元P的時(shí)序光譜圖 (time series multispectral image,TSMI)。
本研究中的時(shí)序光譜圖的尺寸大小為6×10,從上至下分別是04-22、05-22、06-11、08-10、09-19、10-09等6個(gè)時(shí)間維度,從左至右分別為藍(lán)波段、綠波段、紅波段、3個(gè)紅邊波段、2個(gè)近紅外波段、2個(gè)短波紅外波段等10個(gè)光譜維度。圖2(c)為樣本中各作物類型的時(shí)序光譜圖,其表現(xiàn)為同種農(nóng)作物的時(shí)序光譜圖具有較高相似度,不同種農(nóng)作物的時(shí)序光譜圖差異明顯。
圖2 基于像元基元的時(shí)序光譜圖構(gòu)建及樣本中各農(nóng)作物的時(shí)序光譜圖Fig.2 TSMI construction based on pixel elements and TSMIs of crops in sample
以Anaconda軟件下的Python3.6為編譯環(huán)境,采用TensorFlow深度學(xué)習(xí)框架,基于GPU+CPU的硬件平臺(tái)搭建卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)為6×10的時(shí)序光譜圖,由于圖片尺寸較小,過深層的復(fù)雜卷積網(wǎng)絡(luò)結(jié)構(gòu)在本研究中并不適用[31]?;谠撛?,本文搭建了更適用于時(shí)序光譜圖分類的輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)中,除輸入層 (input layer) 與輸出層 (output layer),共包括2個(gè)卷積層 (convolution layer)、1個(gè)池化層 (pooling layer)與1個(gè)全連接層 (full connection layer)。第1卷積層先從時(shí)序光譜圖中提取8個(gè)維度的特征,第2卷積層在第1卷積層的基礎(chǔ)上再提取16個(gè)維度的特征,經(jīng)最大池化,全連接層基于16維度的特征對(duì)時(shí)序光譜圖進(jìn)行分類。
2.3.1 梯度下降法優(yōu)化
為加強(qiáng)CNN模型在本研究中的適用性,需結(jié)合本研究數(shù)據(jù)對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化。梯度下降法是常用的神經(jīng)網(wǎng)絡(luò)優(yōu)化算法,本文分別采用Momentum、AdaGrad、Adam、RMSProp等常用梯度下降法對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,如圖3(a)所示。在模型趨于穩(wěn)定后,基于Adam梯度下降的卷積神經(jīng)網(wǎng)絡(luò)在保持更小波動(dòng)的同時(shí),可達(dá)到更高精度,因此本研究采用Adam作為卷積神經(jīng)網(wǎng)絡(luò)的梯度下降優(yōu)化算法。
2.3.2 Dropout優(yōu)化
在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中,Dropout可通過隨機(jī)屏蔽部分神經(jīng)元,只允許部分神經(jīng)元參與神經(jīng)元連接來降低網(wǎng)絡(luò)復(fù)雜度,具有提高模型泛化能力的功能[32-33]。為尋求最適合于本文的最佳Dropout神經(jīng)元連接比例參數(shù),本研究分別采用不同的連接比例參數(shù)對(duì)數(shù)據(jù)進(jìn)行了訓(xùn)練,如圖3(b)所示。40%的Dropout連接比例參數(shù)在保持精度上升曲線穩(wěn)定的同時(shí),可達(dá)到更高精度,因此采用40%的連接比例參數(shù)對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行Dropout優(yōu)化。
圖3 CNN模型優(yōu)化Fig.3 Optimization of CNN
本文采用多個(gè)指標(biāo)對(duì)模型及其分類結(jié)果進(jìn)行評(píng)價(jià),包括總體精度 (overall accuracy, OA)、Kappa系數(shù) (Kappa coefficient, KC)、F1-score、制圖精度 (mapping accuracy, MA)、用戶精度 (user accuracy, UA)。其中,總體精度與Kappa系數(shù)是衡量分類方法總體性能的精度指標(biāo);F1-score、制圖精度與用戶精度是檢驗(yàn)各農(nóng)作物分類精度的指標(biāo)。Kappa系數(shù)是一種一致性評(píng)估方法,在類別不均衡的情況下更能反映實(shí)際分類精度。制圖精度與用戶精度可從不同的角度反映各農(nóng)作物分類精度,若某作物的制圖精度較低,說明該作物容易被分為其他類型;若某農(nóng)作物的用戶精度較低,說明有較多其他類型作物被錯(cuò)分為該作物。F1-score精度是制圖精度與用戶精度的綜合性指標(biāo),可更全面地反映各農(nóng)作物的分類精度。以上各分類評(píng)價(jià)指標(biāo)的計(jì)算公式如下:
(1)
(2)
MA=(ti/vi)×100%,
(3)
UA=(ti/mi)×100%,
(4)
(5)
各式中:n為待分種類數(shù);ti為第i類農(nóng)作物在驗(yàn)證樣本中被正確分類的數(shù)量;V為驗(yàn)證樣本總數(shù);vi為第i類農(nóng)作物的驗(yàn)證樣本數(shù)量;mi為驗(yàn)證樣本中被分類為i類農(nóng)作物的數(shù)量;MAi為第i類農(nóng)作物制圖精度,UAi為第i類農(nóng)作物用戶精度。
為進(jìn)一步評(píng)價(jià)與比較本研究中基于時(shí)間序列光譜圖的卷積神經(jīng)網(wǎng)絡(luò)分類法 (TSMI+CNN) 在分類精度上的表現(xiàn),采用時(shí)間序列NDVI、時(shí)間序列多光譜、隨機(jī)森林算法與卷積神經(jīng)網(wǎng)絡(luò),建立了3個(gè)對(duì)照組,分別為:基于時(shí)間序列多光譜數(shù)據(jù)的隨機(jī)森林分類 (TSM+RF);基于時(shí)間序列NDVI數(shù)據(jù)的隨機(jī)森林分類 (TSNDVI+RF);基于時(shí)間序列NDVI數(shù)據(jù)的卷積神經(jīng)網(wǎng)絡(luò)分類 (TSNDVI+CNN)。其中,NDVI的計(jì)算公式為
NDVI=(ρNIR-ρR)/(ρNIR+ρR),
(6)
式中:ρNIR為近紅外段的反射率,ρR為紅波段的反射率。Sentinel-2A有2個(gè)分辨率分別為10與20 m的近紅外波段,其中,參與NDVI計(jì)算的是與紅波段分辨率一致的第一近紅外波段。
3.1.1 總體精度對(duì)比分析
如表3所示,在所有的分類組中,TSMI+CNN分類法的總體精度與Kappa系數(shù)均最高,總體精度達(dá)到95.12%,相比TSM+RF、TSNDVI+RF、TSNDVI+CNN等對(duì)照組的88.58%、90.25%、91.79%,分別提高6.54%、4.87%、3.33%;Kappa系數(shù)達(dá)到0.940 5,相比各對(duì)照組的0.881 9、0.862 1、0.900 4,分別提升0.058 6、0.078 4、0.040 1,結(jié)果表明TSMI+CNN的分類法不僅可有效提高農(nóng)作物分類精度,其分類一致性也最好,有利于小樣本作物的分類。時(shí)序光譜圖在縱向上包含作物的生長(zhǎng)物候信息、橫向上包含各物候期農(nóng)作物的多光譜信息,借鑒卷積神經(jīng)網(wǎng)絡(luò)的高精度圖片識(shí)別能力,TSMI+CNN分類法基于時(shí)序光譜圖與卷積神經(jīng)網(wǎng)絡(luò)完成了高精度的農(nóng)作物分類。
表3 總體分類精度Table 3 Overall classification accuracy statistics
TSM+RF與TSMI+CNN分類法均基于時(shí)間序列多光譜進(jìn)行了分類,然而,TSMI+CNN分類法的總體精度比TSM+RF分類法高6.54%,有較大的精度優(yōu)勢(shì),表明對(duì)于高維度的時(shí)間序列多光譜,TSMI+CNN分類法的數(shù)據(jù)擬合能力優(yōu)于TSM+RF分類法。隨機(jī)森林等傳統(tǒng)機(jī)器學(xué)習(xí)算法只能根據(jù)分類對(duì)象的具體屬性值來區(qū)分目標(biāo),屬于一維“線”狀的識(shí)別;卷積神經(jīng)網(wǎng)絡(luò)是一種模擬動(dòng)物視覺神經(jīng)系統(tǒng)設(shè)計(jì)的人工神經(jīng)網(wǎng)絡(luò),對(duì)目標(biāo)具有“面”狀的把握能力,可更全面地考慮分類目標(biāo)的各個(gè)特征要素,完成更高精度的圖片識(shí)別。
TSNDVI+RF與TSNDVI+CNN對(duì)照組雖然分別取得90.25%與91.79%的高分類精度,但其錯(cuò)分率分別達(dá)到9.75%與8.21%,比TSMI+CNN分類法的錯(cuò)分率(4.87%) 高出近1倍,表明TSMI+CNN分類法可有效降低農(nóng)作物被錯(cuò)分的概率。基于NDVI提取的TSNDVI+RF分類法雖然有利于算法對(duì)數(shù)據(jù)的擬合,但NDVI提取過程所舍棄的綠波段、藍(lán)波段、紅邊波段與短波紅外波段中仍然存在對(duì)農(nóng)作物分類有效的特征,TSMI+CNN分類法可有效利用這些特征來降低作物被錯(cuò)分的概率。
3.1.2 各農(nóng)作物精度對(duì)比分析
TSMI+CNN分類法的F1-score精度均高于其他方法(圖4),分別達(dá)到97.5%、97.4%、97.0%、95.9%、89.9%,表明TSMI+CNN分類法對(duì)各農(nóng)作物均有較好的識(shí)別能力。其中,春玉米與番茄在各對(duì)照組中的最高精度分別為87.7%、81.6%,分別與TSMI+CNN分類法有8.2%、8.3%的精度差距,表明TSMI+CNN分類法可顯著提高對(duì)春玉米與番茄的識(shí)別能力。
圖4 各農(nóng)作物在各分類法中的F1-score精度Fig.4 F1-scores of crops using different classification methods
表4為各農(nóng)作物的制圖精度與用戶精度。其中,TSM+RF與TSNDVI+RF對(duì)照組的棉花用戶精度均顯著低于制圖精度,說明這兩種分類方法易將其他類作物歸為棉花,而不易將棉花歸為其他類作物。TSM+RF、TSNDVI+RF與TSNDVI+CNN對(duì)照組的番茄與春玉米制圖與用戶精度均較低,結(jié)合分類混淆矩陣(圖5)可知,分別約有9%、12%與7%的春玉米被錯(cuò)分為番茄,約10%、17%與15%的番茄被錯(cuò)分為春玉米,春玉米與番茄之間的混淆嚴(yán)重。TSMI+CNN分類法對(duì)于棉花、冬小麥、春小麥、春玉米的制圖與用戶精度均達(dá)到95%以上,證明該方法對(duì)這些作物均具有極強(qiáng)的分辨能力。
表4 各農(nóng)作物的制圖與用戶精度Table 4 Mapping accuracies and user accuracies of specific crops
圖5 各分類組的混淆矩陣Fig.5 Confusion matrix of every classification method
圖6為春玉米與番茄的時(shí)間序列多光譜與時(shí)間序列NDVI,從中可見,春玉米與番茄“異物同譜”現(xiàn)象明顯,難以直接進(jìn)行區(qū)分。TSMI+CNN分類法對(duì)于春玉米和番茄的制圖與用戶精度分別達(dá)到95.45%、96.33%和93.11%、86.91%,比各對(duì)照組中的最高精度分別有約7.2%、8.1%、11.2%、6.8%的提高(表4),說明TSMI+CNN分類法能有效提高對(duì)“異物同譜”作物,如春玉米與番茄的識(shí)別能力。
圖6 春玉米與番茄的時(shí)間序列NDVI和時(shí)間序列多光譜Fig.6 Time series NDVI and time series multispectral of spring corn and tomato
對(duì)各分類方法的制圖結(jié)果進(jìn)行對(duì)比分析(圖7),結(jié)果表明,不同分類組的制圖存在較大差異?;跁r(shí)間序列光譜與隨機(jī)森林算法的TSM+RF組“椒鹽”噪聲最多,地塊內(nèi)部不均勻,且邊界輪廓線模糊。TSNDVI+RF與TSNDVI+CNN組相比TSM+RF組“椒鹽”噪聲明顯減少,地塊內(nèi)部均勻,但邊界輪廓線仍較為模糊。相比各對(duì)照組,TSMI+CNN分類方法制圖結(jié)果最好,地塊內(nèi)部均勻,邊界輪廓線清晰,幾乎沒有“椒鹽”噪聲,有利于遙感農(nóng)作物的分類與制圖。
圖7 TSMI+CNN方法與其他方法的分類圖Fig.7 Crop classification maps using TSMI+CNN method and other methods
應(yīng)用TSMI+CNN分類法對(duì)沙灣縣全境主要農(nóng)作物進(jìn)行分類制圖(圖8),從圖中可見,棉花是沙灣縣境內(nèi)最主要的農(nóng)作物,廣泛分布在地塊連續(xù)、土壤肥沃、農(nóng)業(yè)設(shè)施完備的北部平原地區(qū)。冬小麥、春小麥、春玉米與番茄等在全縣境內(nèi)都有種植,但主要集中在中部的洪積沖積扇區(qū)與南部的山前丘陵區(qū)。最后對(duì)分類圖中各農(nóng)作物像元數(shù)進(jìn)行統(tǒng)計(jì),結(jié)合Sentinel-2A數(shù)據(jù)分辨率,計(jì)算得到沙灣縣棉花、小麥、春玉米與番茄的種植面積,將該結(jié)果與沙灣縣2017年統(tǒng)計(jì)年鑒對(duì)比(表5)表明,棉花、小麥、春玉米的百分誤差分別為5.48%、6.04%、8.65%,差異較小,與實(shí)際統(tǒng)計(jì)結(jié)果相近,證明了TSMI+CNN分類法分類結(jié)果的可靠性,具有良好的實(shí)際應(yīng)用價(jià)值。
表5 農(nóng)作物的面積統(tǒng)計(jì)對(duì)比Table 5 Comparison of crop area statistics
深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)具有良好的圖片識(shí)別能力,基于該特點(diǎn),本研究對(duì)時(shí)間序列多光譜進(jìn)行基于像元的重構(gòu),得到每個(gè)地面像元的時(shí)序光譜圖,采用TensorFlow深度學(xué)習(xí)框架,基于GPU+CPU的硬件平臺(tái)搭建卷積神經(jīng)網(wǎng)絡(luò),并利用Adam梯度下降法與Dropout 40%連接率優(yōu)化后的卷積神經(jīng)網(wǎng)絡(luò)對(duì)時(shí)序光譜圖進(jìn)行分類,成功提取研究區(qū)內(nèi)棉花、冬小麥、春小麥、春玉米和番茄等主要作物。主要結(jié)論如下:
1)本文所提出的TSMI+CNN分類法總體分類精度達(dá)到95.12%,相比TSM+RF、TSNDVI+RF、TSNDVI+CNN等對(duì)照組分別提高6.54%、4.87%、3.33%,說明該分類法可有效提高遙感農(nóng)作物分類精度。
2)對(duì)于“異物同譜”情況明顯,在各對(duì)照組中混淆相對(duì)嚴(yán)重的春玉米與番茄,TSMI+CNN分類法的F1-score綜合精度分別達(dá)到96.33%和90.73%,相比其他對(duì)比試驗(yàn)組中的最高精度分別提高8.66%與9.73%。說明TSMI+CNN的分類法可有效區(qū)分光譜相似性高的作物。
3)TSMI+CNN分類法對(duì)沙灣縣各主要農(nóng)作物的制圖精度均超過93%,制圖結(jié)果邊界清晰,地塊內(nèi)部均勻,無明顯“椒鹽”噪聲,表明TSMI+CNN分類法可完成高精度的遙感農(nóng)作物制圖,具有良好的現(xiàn)實(shí)應(yīng)用價(jià)值。
4)基于特征提取的傳統(tǒng)分類方法通常涉及復(fù)雜的特征提取與重建工作,通過對(duì)時(shí)間序列多光譜的時(shí)間維與光譜維的重新排列,本研究完成了實(shí)驗(yàn)區(qū)內(nèi)各農(nóng)作物的提取,不涉及復(fù)雜特征提取與重建,可有效提高遙感農(nóng)作物分類的自動(dòng)化水平。
TSMI+CNN分類法通過時(shí)序光譜的重構(gòu),將一維“線”型的時(shí)間序列多光譜重組為二維的“面”狀結(jié)構(gòu)化圖片,將農(nóng)作物的譜識(shí)別問題轉(zhuǎn)為圖識(shí)別問題,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)對(duì)圖片的深層特征自動(dòng)提取與分類能力,避免了時(shí)序法分類中手動(dòng)提取特征的缺陷,實(shí)現(xiàn)了機(jī)器提取特征,進(jìn)一步完成了高精度的農(nóng)作物遙感分類。該研究結(jié)果與Zhong等[34]、Kussul等[35]的相關(guān)研究結(jié)果同樣表明將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用到農(nóng)作物分類中可以獲得高精度的分類結(jié)果,且證明了卷積神經(jīng)網(wǎng)絡(luò)在農(nóng)作物遙感分類中的良好應(yīng)用價(jià)值,可為農(nóng)作物的自動(dòng)化精細(xì)制圖提供一定借鑒。
盡管本文中提出的TSMI+CNN農(nóng)作物分類法較以往的主要分類方法具有諸多分類優(yōu)點(diǎn),在本文的農(nóng)作物分類中取得了較好的分類成果,但該方法仍存在一定不足之處。本研究?jī)H采用Sentinel-2A數(shù)據(jù)進(jìn)行TSMI+CNN法的農(nóng)作物分類,數(shù)據(jù)源相對(duì)單一。目前,多源遙感數(shù)據(jù)的融合與綜合利用是遙感研究的重要內(nèi)容之一[36-37],在未來的研究中,將進(jìn)一步發(fā)展TSMI+CNN分類法,比如將不同數(shù)據(jù)源的時(shí)間序列多光譜構(gòu)造為圖片,再基于卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行分類。此外,開展基于卷積神經(jīng)網(wǎng)絡(luò)的有效特征可視化研究,確定各時(shí)相影像、各光譜波段的分類有效性也將是進(jìn)一步開展研究的重點(diǎn)。