張紅華 趙威成 劉強(qiáng)凱
摘要 獲取水稻種植信息對(duì)于指導(dǎo)水稻生產(chǎn),監(jiān)測(cè)作物生長(zhǎng)及合理分配水資源具有重要意義。針對(duì)基于單時(shí)相影像提取水稻信息精度有限,以Sentinel-2A/B多時(shí)相影像為數(shù)據(jù)源,構(gòu)建NDVI、EVI、NDWI和光譜特征4種時(shí)序特征數(shù)據(jù)集并設(shè)計(jì)6種試驗(yàn)方案,結(jié)合隨機(jī)森林算法對(duì)水稻種植信息進(jìn)行提取。結(jié)果表明,NDVI、EVI時(shí)序曲線可以較好反映出水稻生育期的物候特征,不同地類的光譜時(shí)序曲線和NDWI時(shí)序曲線可分離度較高,有利于提高分類精度;基于NDVI時(shí)序數(shù)據(jù)集的分類精度最低,基于光譜時(shí)序數(shù)據(jù)集的分類精度最高,總體精度達(dá)95.559 0%,Kappa系數(shù)為0.943 3,與基于NDVI的分類結(jié)果相比,總體精度、Kappa系數(shù)、水稻生產(chǎn)者精度和用戶精度分別提高了3.530 4%、0.044 9、8.64%和3.36%,水稻與旱地的混分現(xiàn)象得到有效抑制。該研究為區(qū)域水稻種植信息精確提取在數(shù)據(jù)源選擇、時(shí)序特征構(gòu)建方面提供了一種新的思路和技術(shù)手段。
關(guān)鍵詞 Sentinel-2A/B;多時(shí)相;時(shí)序特征;水稻
中圖分類號(hào) S127? 文獻(xiàn)標(biāo)識(shí)碼 A? 文章編號(hào) 0517-6611(2022)07-0234-05
doi:10.3969/j.issn.0517-6611.2022.07.056
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
Rice Planting Information Extraction Based on Multi-temporal Remote Sensing Images
ZHANG Hong-hua, ZHAO Wei-cheng, LIU Qiang-kai
(Heilongjiang University of Science and Technology, Harbin, Heilongjiang 150022)
Abstract Obtaining rice planting information is of great significance for guiding rice production, monitoring crop growth and rational allocation of water resources. In view of the limited accuracy of extracting rice information based on single temporal image, four time-series feature data sets of NDVI, EVI, NDWI and spectral features were created based on sentinel-2A/B multi-temporal images. Six experimental schemes were designed to extract rice planting information combined with random forest algorithm. The results showed that NDVI and EVI time series could better reflect the phenological characteristics of rice growth period, and the spectral time series and NDWI time series of different land types had a high degree of separation, which was conducive to improve the classification accuracy;the classification accuracy based on NDVI time series dataset was the lowest, and the classification accuracy based on spectral time series dataset was the highest, the overall accuracy was 95.559 0%, and the Kappa coefficient was 0.943 3. Compared with the classification results based on NDVI, the overall accuracy, Kappa coefficient, rice producer accuracy and user accuracy were improved by 3.530 4%, 0.044 9, 8.64% and 3.36%, respectively. And? the mixing of rice and dry land was effectively controlled. This research provided a new idea and technical means for accurate extraction of regional rice planting information in data sources selection and time series feature construction.
Key words Sentinel-2A/B;Multi-temporal;Timing characteristics;Rice
準(zhǔn)確獲取區(qū)域水稻種植結(jié)構(gòu)信息,對(duì)于作物產(chǎn)量估計(jì)、種植結(jié)構(gòu)調(diào)整具有重要意義[1]。與傳統(tǒng)的田間調(diào)查與統(tǒng)計(jì)匯總方法相比,利用遙感技術(shù)提取作物種植結(jié)構(gòu),更加直觀和準(zhǔn)確[2]。水稻常與背景信息在空間上相互交錯(cuò),由水稻植株、水體和土壤的混合地物組成,這種組合的季相變換帶來的光譜信息差異可作為區(qū)分水稻田和其他地物的重要依據(jù)。作物生育期內(nèi),僅基于單時(shí)相影像難以將水稻與其他作物區(qū)分,可利用多時(shí)相影像獲取作物的時(shí)間序列特征來提取水稻信息。以往研究多是通過構(gòu)建歸一化植被指數(shù)(Normalized Difference Vegetation Index,NDVI)時(shí)序數(shù)據(jù)集來進(jìn)行作物的提取,如利用MODIS NDVI時(shí)間序列實(shí)現(xiàn)作物的識(shí)別[3-5],基于Sentinel-2[6-8]或GF-1[9-11]數(shù)據(jù)構(gòu)建NDVI時(shí)間序列,基于多源影像構(gòu)建NDVI時(shí)間序列等[12]。然而,目前利用多時(shí)相數(shù)據(jù)進(jìn)行水稻提取多局限于構(gòu)建NDVI時(shí)序數(shù)據(jù),對(duì)其他時(shí)序特征很少關(guān)注和研究。鑒于此,筆者以黑龍江省五常市龍鳳山鎮(zhèn)為研究區(qū),利用作物整個(gè)生育期內(nèi)的多時(shí)相Sentinel-2A/B遙感影像構(gòu)建4種不同的時(shí)間序列特征,包括光譜特征、歸一化植被指數(shù)、增強(qiáng)植被指數(shù)(Enhanced vegetation index,EVI)、歸一化水體指數(shù)(Normalized difference water index,NDWI);同時(shí)設(shè)計(jì)6種時(shí)序特征組合方案,結(jié)合隨機(jī)森林分類方法提取水稻空間分布信息,以期提高區(qū)域尺度的水稻種植信息的提取精度,為精準(zhǔn)農(nóng)情監(jiān)測(cè)提供參考。
1 研究區(qū)及數(shù)據(jù)來源
該研究以黑龍江省五常市龍鳳山鎮(zhèn)為研究區(qū)(圖1),五常市位于黑龍江省南部(44°04′~45°26′N,126°33′~128°14′E),是五常大米主產(chǎn)地。五常市屬中溫帶大陸性季風(fēng)氣候,夏短冬長(zhǎng),寒暑懸殊,年均氣溫3~4 ℃,年均降水量500~800 mm。由于氣候特征的影響,水稻主要分布于五常市西南的C型盆地中,因其獨(dú)特的地形條件,有利于在4—9月份達(dá)到優(yōu)質(zhì)水稻所需要的活動(dòng)積溫。
根據(jù)五常水稻生育周期,選取了涵蓋2021年整個(gè)生長(zhǎng)季(5—10月)的10景Sentinel-2影像(表1),其中4景為Sentinel-2A數(shù)據(jù),6景為Sentinel-2B數(shù)據(jù)。數(shù)據(jù)均來源于歐空局(ESA)數(shù)據(jù)中心(https://scihub.copernicus.eu/),產(chǎn)品等級(jí)為L(zhǎng)evel-2A級(jí),其中紅綠藍(lán)和近紅外4個(gè)波段空間分辨率為10 m,坐標(biāo)系WGS-84,投影UTM,Zone 52 N。該研究樣本數(shù)據(jù)主要通過實(shí)地調(diào)查和依據(jù)天地圖進(jìn)行目視解譯2種方式獲取。于2021年8月對(duì)研究區(qū)進(jìn)行樣本采集,包括地物類型、經(jīng)緯度信息和生長(zhǎng)狀況。
2 研究方法
以10景不同時(shí)期的Sentinel-2A/B影像為數(shù)據(jù)源,構(gòu)建時(shí)間序列數(shù)據(jù)集,包括光譜特征、NDVI、EVI、NDWI,分析其時(shí)序曲線特征,利用隨機(jī)森林算法對(duì)水稻種植信息進(jìn)行提取并評(píng)定其精度。
2.1 時(shí)序特征數(shù)據(jù)集的構(gòu)建
2.1.1 時(shí)序光譜數(shù)據(jù)集。
該研究利用紅綠藍(lán)和近紅外4個(gè)10 m波段構(gòu)建時(shí)序光譜數(shù)據(jù)集,10景影像共計(jì)40個(gè)波段,分析不同地類光譜曲線特征,進(jìn)而完成分類。
2.1.2 NDVI時(shí)序數(shù)據(jù)集。
由于植被的紅邊效應(yīng),將紅光波段與近紅外波段進(jìn)行組合形成的植被指數(shù)可以較好反應(yīng)地表植被的生長(zhǎng)狀況,其中歸一化植被指數(shù)(NDVI)是遙感影像分類中應(yīng)用最廣泛的植被指數(shù),是植被生長(zhǎng)狀態(tài)和植被分布密度的最佳指數(shù)因子。NDVI時(shí)間序列可以反映出作物從播種、生長(zhǎng)、成熟到收割的作物生長(zhǎng)過程,以及植被覆蓋度的變化,并且消除一些輻射錯(cuò)誤。NDVI的計(jì)算方法如式(1)所示:
NDVI=(ρ nir-ρ red)/(ρ nir+ρ red)(1)
式中,ρ nir為近紅外波段的反射率;ρ red為紅波段的反射率。
2.1.3 EVI時(shí)序數(shù)據(jù)集。
增強(qiáng)植被指數(shù)(EVI)通過加入藍(lán)色波段以增強(qiáng)植被信號(hào),矯正土壤背景和氣溶膠散射的影響,該指數(shù)常用于植被茂密區(qū),計(jì)算方法見式(2)。
EVI=2.5ρ nir-ρ redρ nir+6ρ red-7.5ρ blue+1(2)
式中,ρ nir為近紅外波段的反射率;ρ red為紅波段的反射率。ρ blue為藍(lán)波段的反射率。
2.1.4 NDWI時(shí)序數(shù)據(jù)集。
歸一化水體指數(shù)(NDWI)是基于綠波段與近紅外波段的歸一化比值指數(shù)。該NDWI一般用來提取影像中的水體信息,效果較好。因水稻特有的水生特點(diǎn),使得其生長(zhǎng)環(huán)境離不開水體,所以引入NDWI,以便對(duì)水稻和其他植被或作物進(jìn)行區(qū)分,NDWI的計(jì)算方法見式(3)。
NDWI=(ρ green-ρ nir)/(ρ green+ρ nir)(3)
式中,ρ green為綠波段的反射率;ρ nir為近紅外波段的反射率。
2.2 隨機(jī)森林算法
隨機(jī)森林是以CART決策樹為基本分類器的集成學(xué)習(xí)模型[13],采用自助抽樣技術(shù)隨機(jī)抽取大約2/3的樣本作為訓(xùn)練樣本子集,未被抽中的1/3稱為袋外樣本(Out-Of-Bag,OOB),OOB數(shù)據(jù)可以通過內(nèi)部交叉驗(yàn)證的方法估算每一棵決策樹的泛化誤差,將隨機(jī)森林中所有決策樹的OOB誤差估計(jì)取平均值即可獲得整個(gè)隨機(jī)森林的泛化誤差估計(jì)。當(dāng)輸入待分類的樣本時(shí),最終的分類結(jié)果由單個(gè)決策樹的輸出結(jié)果投票決定。隨機(jī)森林克服了決策樹過擬合問題,對(duì)噪聲和異常值有較好的容忍性,在遙感影像信息提取方面取得了較好的分類效果[14-16]。
2.3 試驗(yàn)方案
該研究設(shè)計(jì)6種試驗(yàn)方案進(jìn)行對(duì)比研究(表2),通過不同方案之間的對(duì)比,探索提高水稻信息提取精度的方法。
3 結(jié)果與分析
3.1 時(shí)序特征曲線
利用10期5—10月的遙感影像,分地類計(jì)算每期訓(xùn)練樣本光譜特征、DNVI、EVI、NDWI的平均值,繪制時(shí)序曲線,如圖2~5所示。
從圖2可以看出,水體和建設(shè)用地的時(shí)序光譜曲線平穩(wěn),不同時(shí)期光譜反射率變化幅度較小,與綠色植被(林地、水稻、旱地)可分離度較高。水稻、旱地和林地在7—8月反射率值較高,整個(gè)生長(zhǎng)季波譜變化幅度較大,但從時(shí)序曲線上來看,綠色植被間也表現(xiàn)了明顯的差異性,有利于提高其分類精度。從圖3的NDVI時(shí)序曲線來看,5種地類均有獨(dú)特的時(shí)序特征,林地、建設(shè)用地和水體可分離性較高,水稻和旱地在7—8月間NDVI值極為接近,可分離性稍差,該時(shí)期為水稻拔節(jié)期和抽穗期,生長(zhǎng)旺盛,ENVI值較高,最大值達(dá)0.848 0。由圖4可知,各地類EVI時(shí)序曲線差異較明顯,但在7—8月間,水稻、旱地和林地的EVI值差異非常小,在7月24日、8月8日和8月18日的遙感影像上,綠色植被可分離性較差。由圖5中NDWI時(shí)序曲線可知,各地類間特征差異顯著,在生長(zhǎng)季易混分的水稻和旱地也具有較好的可分離性??傮w來看,4類時(shí)序曲線僅在少數(shù)時(shí)相上存在水稻和旱地的分離度較低的情況,但各地類均有獨(dú)特的時(shí)序特征,有利于分類精度的提高。
3.2 隨機(jī)森林分類結(jié)果及精度評(píng)價(jià)
依據(jù)6種特征組合方案進(jìn)行隨機(jī)森林分類,提取結(jié)果如圖6所示。該研究將研究區(qū)分為水稻、旱地、林地、建設(shè)用地和水體5種類型。通過與原始圖像對(duì)比可以看出,不同方案中旱地的提取結(jié)果存在差異,主要原因是水稻和旱地的混分;水體中大面積水域(即龍鳳山水庫(kù))提取精度高,而河流和溝渠提取精度較低,存在建設(shè)用地和水體混分的現(xiàn)象;林地提取結(jié)果較理想。
利用驗(yàn)證樣本計(jì)算混淆矩陣,通過總體精度、Kappa系數(shù)、各類別的生產(chǎn)者精度(Producer’s Accuracy,PA)、用戶精度(User’s Accuracy,UA)來評(píng)價(jià)不同試驗(yàn)方案的分類精度(表3)。從總體精度和Kappa系數(shù)來看,方案1和2的分類精度相近,方案3、4和5的分類精度接近并高于方案1、2,方案6總體精度最高,與總體精度最低的方案1相比,總體精度和Kappa系數(shù)分別提高了3.530 4%和0.044 9,說明利用時(shí)序光譜特征進(jìn)行分類的總體精度最高。由各地類的生產(chǎn)者精度和用戶精度可知,方案1即基于時(shí)序NDVI分類,旱地與水稻混分比例較高,旱地與水稻的生產(chǎn)者精度均低于90.00%,旱地的用戶精度低于70.00%,在方案2中混分現(xiàn)象沒有明顯改善,方案3中水稻和旱地的分類精度有較大提升,水稻的PA和UA分別提升了4.29%和2.68%,旱地分別提升了4.26%和8.95%;方案4和5的結(jié)果與方案3相比,分類精度提高有限,甚至方案4整體分類精度略低于方案3,說明在NDWI的基礎(chǔ)上加入NDVI或EVI,分類精度并沒有明顯提高;方案6總體精度最高,水稻和旱地的混分現(xiàn)象得到有效抑制,與方案1相比,水稻的PA和UA分別提升了8.64%和3.36%。綜上,方案6即利用時(shí)序光譜特征進(jìn)行分類,各地類的分類精度及總體精度均較高,方案3即基于時(shí)序NDWI的分類結(jié)果也較為理想。
4 結(jié)論
利用覆蓋水稻完整生育期的多時(shí)相Sentinel-2A/B數(shù)據(jù),構(gòu)建NDVI、EVI、NDWI和光譜特征時(shí)間序列數(shù)據(jù)集并設(shè)計(jì)6種試驗(yàn)方案,結(jié)合隨機(jī)森林算法進(jìn)行五常市龍鳳山鎮(zhèn)水稻信息提取,同時(shí)計(jì)算混淆矩陣來評(píng)價(jià)不同實(shí)驗(yàn)方案的水稻種植信息提取精度,主要結(jié)論如下:
(1)NDVI、EVI時(shí)序曲線可以明顯反映出水稻生長(zhǎng)季的物候特征;各類地物的光譜時(shí)序曲線和NDWI時(shí)序曲線均具有的特征,有利于提高分類精度。
(2)基于NDVI、EVI時(shí)序數(shù)據(jù)集的分類結(jié)果,水稻與旱地混分比例較高,分類精度較低;基于光譜特征時(shí)序數(shù)據(jù)集的分類結(jié)果,總體精度、Kappa系數(shù)、水稻生產(chǎn)者精度和用戶精度均較高,同時(shí)水稻與旱地的混分現(xiàn)象得到有效控制。
由于該研究采用的是基于像素的分類方法,分類結(jié)果存在一定的“椒鹽現(xiàn)象”,未來應(yīng)將時(shí)序數(shù)據(jù)集與基于對(duì)象的分類方法結(jié)合,減少“同物異譜”和“同譜異物”的產(chǎn)生。
參考文獻(xiàn)
[1] 陳安旭,李月臣.基于Sentinel-2影像的西南山區(qū)不同生長(zhǎng)期水稻識(shí)別[J].農(nóng)業(yè)工程學(xué)報(bào),2020,36(7):192-199.
[2] 麥麗素,烏蘭吐雅.基于Sentinel-2數(shù)據(jù)的水稻面積提取方法比較分析[J].北方農(nóng)業(yè)學(xué)報(bào),2019,47(5):119-126.
[3] 周思,何祺勝,劉寶柱.基于MODIS的黑龍江省農(nóng)作物種植結(jié)構(gòu)提取研究[J].地理空間信息,2018,16(1):79-82.
[4] 郭昱杉,劉慶生,劉高煥,等.基于MODIS時(shí)序NDVI主要農(nóng)作物種植信息提取研究[J].自然資源學(xué)報(bào),2017,32(10):1808-1818.
[5] 朱彤,張學(xué)霞,王士遠(yuǎn),等.基于物候特征和混合光譜信息的春玉米種植面積提取[J].沈陽農(nóng)業(yè)大學(xué)學(xué)報(bào),2017,48(3):328-337.
[6] 王利軍,郭燕,賀佳,等.基于決策樹和SVM的Sentinel-2A影像作物提取方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2018,49(9):146-153.
[7] 畢愷藝,牛錚,黃妮,等.基于Sentinel-2A時(shí)序數(shù)據(jù)和面向?qū)ο鬀Q策樹方法的植被識(shí)別[J].地理與地理信息科學(xué),2017,33(5):16-20.
[8] 杜保佳,張晶,王宗明,等.應(yīng)用Sentinel-2A NDVI時(shí)間序列和面向?qū)ο鬀Q策樹方法的農(nóng)作物分類[J].地球信息科學(xué)學(xué)報(bào),2019,21(5):740-751.
[9] 張海東,田婷,張青,等.基于GF-1影像的耕地地塊破碎區(qū)水稻遙感提取[J].遙感技術(shù)與應(yīng)用,2019,34(4):785-792.
[10] 楊閆君,占玉林,田慶久,等.基于 GF-1/WFV NDVI時(shí)間序列數(shù)據(jù)的作物分類[J].農(nóng)業(yè)工程學(xué)報(bào),2015,31(24):155-161.
[11] 萬叢,梁治華,張錦水.基于高分一號(hào)寬幅時(shí)序影像的冬小麥分布識(shí)別研究[J].安徽農(nóng)業(yè)科學(xué),2020,48(23):256-259.
[12] 王碧晴,韓文泉,許馳.基于圖像分割和NDVI時(shí)間序列曲線分類模型的冬小麥種植區(qū)域識(shí)別與提取[J].國(guó)土資源遙感,2020,32(2):219-225.
[13] 張磊,宮兆寧,王啟為,等.Sentinel-2 影像多特征優(yōu)選的黃河三角洲濕地信息提取[J].遙感學(xué)報(bào),2019,23(2):313-326.
[14] 何云,黃翀,李賀,等.基于Sentinel-2A影像特征優(yōu)選的隨機(jī)森林土地覆蓋分類[J].資源科學(xué),2019,41(5):992-1001.
[15] 馮文卿,眭海剛,涂繼輝,等.高分辨率遙感影像的隨機(jī)森林變化檢測(cè)方法[J].測(cè)繪學(xué)報(bào),2017,46(11):1880-1890.
[16] 詹國(guó)旗,楊國(guó)東,王鳳艷,等.基于特征空間優(yōu)化的隨機(jī)森林算法在GF-2影像濕地分類中的研究[J].地球信息科學(xué)學(xué)報(bào),2018,20(10):1520-1528.