烏云德吉,于利峰,承 昊,包珺瑋,許洪滔,趙佳樂,烏蘭吐雅
(1.內(nèi)蒙古自治區(qū)農(nóng)牧業(yè)科學(xué)院農(nóng)牧業(yè)經(jīng)濟(jì)與信息研究所,內(nèi)蒙古呼和浩特 010031;2.中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)資源與農(nóng)業(yè)區(qū)劃研究所/農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)遙感重點(diǎn)實(shí)驗(yàn)室,北京 100081)
農(nóng)田作物信息的快速獲取與解析是開展精準(zhǔn)農(nóng)業(yè)實(shí)踐的前提和基礎(chǔ),在農(nóng)作物識(shí)別和農(nóng)情信息提取上,遙感技術(shù)優(yōu)勢(shì)明顯[1]。作物種類復(fù)雜多樣,不同作物之間存在明顯的光譜重疊,利用單一時(shí)相的影像進(jìn)行農(nóng)作物分類時(shí)容易出現(xiàn)“錯(cuò)分、漏分”現(xiàn)象,很難達(dá)到理想的精度[2]。因此,采用多時(shí)相數(shù)據(jù)構(gòu)成時(shí)間序列逐步監(jiān)測(cè)[3-5]是提高分類精度的一個(gè)主要方法,其中基于植被指數(shù)的時(shí)間序列能夠有效地減少影像上“同譜異物”和“同物異譜”現(xiàn)象,補(bǔ)充單時(shí)相影像的不足,可在農(nóng)業(yè)資源調(diào)查和農(nóng)情評(píng)價(jià)中發(fā)揮重要作用[6]。
國(guó)內(nèi)外許多專家、學(xué)者針對(duì)農(nóng)作物精準(zhǔn)識(shí)別方法做了不同程度的研究,在低分辨率遙感影像應(yīng)用于農(nóng)作物識(shí)別方面:林文鵬等[7]利用TERRA/MODIS數(shù)據(jù),采用波譜分析方法,構(gòu)建了一種基于遙感影像全覆蓋秋季作物類型自動(dòng)提取方法,對(duì)北京地區(qū)主要秋季作物進(jìn)行了遙感自動(dòng)識(shí)別,精度達(dá)到了86%以上。JAKUBAUSKAS 等[8]利用傅里葉變換后的AVHRR 數(shù)據(jù)提取了美國(guó)堪薩斯州芬尼縣的玉米、大豆和苜蓿3 種作物類型,變換后振幅、相位與作物類型的對(duì)應(yīng)性更強(qiáng),能夠更為準(zhǔn)確地提取作物類型。在中高分辨率遙感影像方面,楊閆君等[2]利用GF-1/WFV 16 m寬覆蓋影像,構(gòu)建了16 m 分辨率的NDVI 時(shí)間序列,對(duì)河北唐山南部地區(qū)的主要農(nóng)作物進(jìn)行分類研究,支持向量分類方法精度達(dá)到了96.33%。劉佳[9]等利用國(guó)產(chǎn)環(huán)境星CCD 數(shù)據(jù)月度NDVI 時(shí)間序列數(shù)據(jù)對(duì)河北省衡水市完整的行政單元內(nèi)的冬小麥、夏玉米、春玉米、棉花、花生和大豆等主要農(nóng)作物進(jìn)行了分類,在全生育期波譜特征曲線分析基礎(chǔ)上,提取了主要農(nóng)作物的曲線特征,分類總體精度達(dá)到了90.9%。SOLBERG 等[10]將ERS-1/SAR(Earth observation satellite-1/Synthetic aperture radar) 雷達(dá)影像與TM-(Thematic mapper)全色圖像相結(jié)合進(jìn)行農(nóng)作物的分類提取工作,結(jié)果表明,其他輔助空間數(shù)據(jù)(高程、坡度、坡向等)的引入能夠顯著地改善分類精度。TURNER 等[11]利用3 個(gè)時(shí)相的SPOT-XS 20 m分辨率影像,采用非監(jiān)督分類與監(jiān)督分類相結(jié)合的方法,獲取了較高精度的非洲半干旱地區(qū)水稻分布圖。
遙感數(shù)據(jù)具有時(shí)效性高、客觀性強(qiáng)和可視性好等特點(diǎn),但是遙感數(shù)據(jù)在獲取處理分析過程會(huì)產(chǎn)生誤差,因此,非遙感的GIS 和GPS 輔助數(shù)據(jù)在微觀和中觀領(lǐng)域,特別是高精度的遙感監(jiān)測(cè)中非常有價(jià)值,輔助數(shù)據(jù)不僅用于對(duì)遙感數(shù)據(jù)的補(bǔ)充與糾正,而且用于對(duì)遙感最終結(jié)果的分析與精度評(píng)價(jià),外業(yè)采集和實(shí)地調(diào)查是輔助數(shù)據(jù)的主要來源之一[12]。
高時(shí)間頻率的中高空間分辨率遙感影像可以提供更為準(zhǔn)確的作物面積分布數(shù)據(jù),但國(guó)外提供的中高分辨率遙感影像回訪周期較長(zhǎng),如LandSat8 號(hào)衛(wèi)星的OLI(Operational land image)傳感器回訪周期為16 d,其他更高分辨率的衛(wèi)星影像也大于這個(gè)周期,加之獲取途徑、價(jià)格等因素的影響,在作物生長(zhǎng)周期內(nèi)可以獲得有效數(shù)據(jù)更少,大大限制了中高分辨率時(shí)間序列數(shù)據(jù)的應(yīng)用。但是國(guó)產(chǎn)高分衛(wèi)星的發(fā)射和衛(wèi)星圖像的開放應(yīng)用填補(bǔ)了這個(gè)空白。
目前,國(guó)產(chǎn)GF-1/WFV 數(shù)據(jù)具有16 m 的空間分辨率及4 d 的重訪周期,只需利用單一數(shù)據(jù)源就能有效地構(gòu)建高空間分辨率NDVI 時(shí)間序列,對(duì)時(shí)間序列數(shù)據(jù)作物分類識(shí)別研究具有重要意義,在遙感技術(shù)應(yīng)用農(nóng)業(yè)資源基礎(chǔ)調(diào)查方面有著廣闊的應(yīng)用前景。
本研究用2017年4月19日—10月20日9 個(gè)時(shí)相的GF-1/WFV 數(shù)據(jù)構(gòu)建了NDVI 時(shí)間序列,分析了臨河區(qū)春小麥、玉米、向日葵和蔬菜(西葫蘆、番茄)農(nóng)作物在歸一化植被指數(shù)(NDVI)時(shí)間序列上的變化特征,提取了變化曲線,通過5 種農(nóng)作物NDVI時(shí)間序列曲線來確定閾值進(jìn)而構(gòu)建了分類決策樹模型,獲取了研究區(qū)主要農(nóng)作物種植面積。
研究區(qū)位于內(nèi)蒙古自治區(qū)西部,黃河北岸,陰山南麓,河套平原中部,南臨黃河,故名“臨河”。地理坐標(biāo)為東經(jīng)107°6′~107°44′,北緯40°34′~41°17′。臨河區(qū)全境為黃河沖積平原,地面開闊平坦,地勢(shì)從西南向東北微度傾斜,海拔高度為1 209~1 045 m。臨河區(qū)屬于典型的溫帶大陸性氣候,全年日照時(shí)數(shù)高達(dá)3 211~3 306 h,年平均氣溫6.1~7.6 ℃,≥10 ℃的積溫2 876~3 221 ℃。得天獨(dú)厚的氣候和灌溉條件,適宜各類農(nóng)作物生長(zhǎng)。但是由于近年來水資源的過度浪費(fèi)、農(nóng)膜和化肥農(nóng)藥的大量使用,巴彥淖爾河套灌區(qū)在農(nóng)業(yè)資源可持續(xù)利用水平分級(jí)中被劃分為農(nóng)業(yè)資源可持續(xù)利用3 級(jí)區(qū)域(共4 級(jí),1 級(jí)為最優(yōu))[13]。
1.2.1 遙感數(shù)據(jù)獲取 本研究所利用的GF-1 數(shù)據(jù)均下載自:中國(guó)資源衛(wèi)星應(yīng)用中心http://www.cresda.com/CN/。
GF-1/WFV 重訪周期短,對(duì)研究范圍為縣級(jí)尺度來說,能夠獲取與地面數(shù)據(jù)相匹配關(guān)鍵期的遙感數(shù)據(jù)。本研究下載了覆蓋研究區(qū)5 種農(nóng)作物生長(zhǎng)周期內(nèi)能夠獲取的少云或無云的數(shù)據(jù)。數(shù)據(jù)獲取情況見表1。
表1 臨河區(qū)2017年GF-1 衛(wèi)星WFV 影像清單
數(shù)據(jù)預(yù)處理在ENVI5.3 平臺(tái)下進(jìn)行,對(duì)GF-1/WFV數(shù)據(jù)進(jìn)行幾何精校正、輻射定標(biāo)、大氣校正等操作,在預(yù)處理基礎(chǔ)上,分別計(jì)算了2017年4月19日—10月20日的9 景影像的NDVI 值,計(jì)算公式為:
式中,Ref4 和Ref3 分別對(duì)應(yīng)GF-1/WFV 第三和第四波段的反射率。
1.2.2 輔助數(shù)據(jù)獲取
地面解譯點(diǎn)數(shù)據(jù)。在采集外業(yè)數(shù)據(jù)時(shí),以手持GPS 為采集設(shè)備,平均每5 km 一個(gè)春小麥解譯點(diǎn),解譯點(diǎn)選擇在3.33 hm2以上較大地塊,區(qū)域包括平原、丘陵等地形,將點(diǎn)定位地塊中央,以“點(diǎn)代面”充分體現(xiàn)地塊信息,在種植結(jié)構(gòu)復(fù)雜,大量出現(xiàn)間種、套種耕作模式地區(qū),集中打點(diǎn),不同農(nóng)作物解譯點(diǎn)間隔>45 m。在臨河區(qū)均勻采集了33 個(gè)春小麥點(diǎn)、38 個(gè)玉米點(diǎn)、9 個(gè)向日葵點(diǎn)、21 個(gè)蔬菜(西葫蘆、番茄)點(diǎn)作為提取5 種農(nóng)作物感興區(qū)的依據(jù)。
為了精度驗(yàn)證的需求,研究利用2017年8月9日的5 m 分辨率RapidEye 影像,覆蓋研究區(qū)行政區(qū)劃面積達(dá)52.54%。本研究在設(shè)計(jì)分類精度驗(yàn)證時(shí)因影像覆蓋區(qū)耕地分布較為平均,所以選取了種植結(jié)構(gòu)較為規(guī)整的10 個(gè)樣方,結(jié)合地面數(shù)據(jù)用人工目視解譯的方法,將10 個(gè)樣地進(jìn)行了精細(xì)的勾繪。圖1給出了局部樣方的RapidEye 影像圖和樣方內(nèi)的作物種植情況。RapidEye 影像對(duì)該地區(qū)農(nóng)作物分類具有較大的優(yōu)勢(shì),用紋理特征和顏色就能較好地分辨出待分類的幾種農(nóng)作物[14],尤其本研究所用的8月影像上玉米、春小麥和向日葵的光譜特征差異較大。為保證GF-1 和RapidEye 影像位置的精確配準(zhǔn),所有野外調(diào)查數(shù)據(jù)和影像均以2017年8月TM 影像為基準(zhǔn),進(jìn)行了幾何精校正,誤差控制在1 個(gè)像元以內(nèi)。
12 個(gè)地面樣方總面積為509.29 hm2,其中,春小麥88.47 hm2、玉米107.97 hm2、向日葵153.72 hm2、蔬菜151.85 hm2、林地7.20 hm2,分別占樣方總面積的17.4%,21.2%,30.2%,29.8%,其他地物占1.4%。
圖1 驗(yàn)證樣方影像與樣方內(nèi)作物類型
在研究區(qū),春小麥、玉米、向日葵和蔬菜(包括西葫蘆、番茄)5 種作物中,春小麥最先播種,3月下旬播種,4月上旬出苗,6月中旬抽穗,7月中旬成熟,7月下旬基本收割完畢。因河套灌區(qū)春小麥?zhǔn)崭钶^早,收割后溫度適宜,且灌溉條件好,所以農(nóng)戶在收割后的部分春小麥地上重新種植其他農(nóng)作物,例如白菜等越冬蔬菜,所以在本研究數(shù)據(jù)處理過程中小麥地的NDVI 值在9月影像上有小幅上升,達(dá)到了另1 份波峰。2017年研究區(qū)的玉米因輪作相關(guān)政策的約束,玉米種植面積有所下調(diào),通常在5月上旬播種,5月末開始出苗,6月下旬進(jìn)入拔節(jié)期,10月成熟收獲,生長(zhǎng)季近180 d,是單季農(nóng)作物。
向日葵主要生長(zhǎng)時(shí)期有幼苗期、現(xiàn)蕾期、開花期和成熟期;5月中旬播種,6月中旬處于幼苗期、7月下旬進(jìn)入現(xiàn)蕾期,8月開花,進(jìn)入生長(zhǎng)最茂盛時(shí)期。向日葵是河套灌區(qū)最晚收割的大宗農(nóng)作物。
研究區(qū)蔬菜種類較為多樣,但大面積種植的蔬菜以西葫蘆和番茄為主,且生育期和生長(zhǎng)周期基本相近,光譜特征和紋理特征也類似,在時(shí)間序列影像上難以區(qū)分,所以合并為一類,生育期以西葫蘆為例說明:西葫蘆生長(zhǎng)周期大致可以分為發(fā)芽期、幼苗期、初花期和結(jié)瓜期4 個(gè)時(shí)期。河套灌區(qū)西葫蘆一般4月中旬播種,5月上旬發(fā)芽,5月中旬進(jìn)入幼苗期。6月上旬進(jìn)入初花期,7月中旬結(jié)瓜(表2)。
表2 主要農(nóng)作物生長(zhǎng)周期
分類過程中本研究結(jié)合地面解譯點(diǎn)數(shù)據(jù),基于9 期GF-1/WFV NDVI 時(shí)間序列,在ENVI 5.3 中畫出了每種農(nóng)作物的典型樣本,提取了5 種農(nóng)作物的NDVI 變化曲線,使用最大值、最小值、平均值、峰值、峰值出現(xiàn)時(shí)間等5 個(gè)特征閾值作為典型特征,構(gòu)建了5 級(jí)決策樹,將其他地區(qū)、背景和5 種農(nóng)作物逐層提取出來。結(jié)合地面解譯點(diǎn)文件,在解譯點(diǎn)輻射10 個(gè)像元內(nèi)畫出感興區(qū),依照此標(biāo)準(zhǔn)劃定了57 個(gè)玉米感興區(qū)、45 個(gè)春小麥感興區(qū)、37 個(gè)向日葵感興區(qū)、24 個(gè)蔬菜感興區(qū)和17 個(gè)林地感興區(qū)。
本研究基于驗(yàn)證樣方目視解譯分類結(jié)果,以總體分類精度、Kappa 系數(shù)、用戶精度和制圖精度4 個(gè)指標(biāo)表示分類精度[15-16]。
不同農(nóng)作物在不同生長(zhǎng)季節(jié)、生育時(shí)期具有不同的生理特征,并在某些方面(如群體特征)通過NDVI值來反應(yīng)[17]。因此,基于多時(shí)相遙感數(shù)據(jù)的NDVI 時(shí)間序列數(shù)據(jù)能表現(xiàn)不同植被在生育期內(nèi)的差異。
由表3可知,林地的NDVI 值4—10月一直大于0.2;春小麥的NDVI 值從4月19日至5月30日持續(xù)上升,在5月30日達(dá)到峰值,與研究區(qū)的春小麥生長(zhǎng)實(shí)際情況吻合。8月玉米和向日葵生長(zhǎng)旺季時(shí)春小麥已經(jīng)收獲完畢,春小麥NDVI 值處于最低值,但9月有小幅上升,造成這種情況的原因是河套地區(qū)積溫較高,且灌溉條件較好,春小麥地在收割后復(fù)種白菜等小日期蔬菜,但并非所有小麥地都復(fù)種。由表3可以看出,向日葵的生長(zhǎng)旺季出現(xiàn)在8月下旬至9月上旬,而玉米的生長(zhǎng)旺季出現(xiàn)在7月上旬至8月下旬,區(qū)分的關(guān)鍵閾值出現(xiàn)在7月上旬,二者NDVI 值有較大的差距;而蔬菜的生長(zhǎng)旺季出現(xiàn)在7月上旬,但8月部分蔬菜成熟收獲,所以從7—8月,NDVI 值有較大幅度的下降,這是蔬菜與玉米、向日葵區(qū)分的關(guān)鍵。
在分析研究區(qū)目標(biāo)農(nóng)作物的時(shí)間序列NDVI 值特征的基礎(chǔ)上,從全生育期時(shí)間覆蓋的角度上,提取了5 種農(nóng)作物的NDVI 值變化曲線,使用最大值、最小值、平均值、峰值、峰值出現(xiàn)時(shí)間5 個(gè)特征閾值作為典型特征,用于構(gòu)建決策樹的模型。其中主要農(nóng)作物的NDVI 平均值在決策樹構(gòu)建中發(fā)揮了最主要的作用,是用于確定區(qū)分農(nóng)作物種類的關(guān)鍵閾值。峰值和峰值出現(xiàn)時(shí)間是區(qū)分春小麥和其他作物的關(guān)鍵,并且根據(jù)峰值出現(xiàn)的時(shí)間,大致判斷出關(guān)鍵生育時(shí)期并用關(guān)鍵生育時(shí)期,NDVI 值區(qū)分玉米、向日葵和蔬菜。在ENVI 5.3 軟件平臺(tái)中按照?qǐng)D2所示的決策樹分類模型進(jìn)行分類,采用了12 個(gè)樣方對(duì)結(jié)果進(jìn)行了精度驗(yàn)證,當(dāng)精度驗(yàn)證結(jié)果較低時(shí),重新調(diào)試閾值進(jìn)行分類,當(dāng)精度改善不大時(shí)停止調(diào)試,接收目前的分類結(jié)果。
表3 臨河區(qū)主要作物歸一化植被指數(shù)NDVI 值變化特征
圖2 基于NDVI 閾值分割的決策樹分類模型
在分類過程中,首先判斷背景和非植被區(qū)域,一般認(rèn)為7—9月NDVI 值大于0.2 是植被,否則是非植被,但是河套灌區(qū)春小麥和部分蔬菜收割較早,地面裸露,NDVI 值趨于0,所以經(jīng)過反復(fù)調(diào)試閾值,滿足7月10日NDVI 值大于0.2 并且8—9月NDVI值大于0.1 的是植被覆蓋區(qū)域,否則是背景或非植被。林地的NDVI 值始終大于0.2,且7月的NDVI最小值也大于0.5,所以4—10月的NDVI 值均大于等于0.2,且7月NDVI 值大于等于0.5 為林地,沒有滿足上述條件的則是農(nóng)作物。春小麥?zhǔn)亲钕炔シN的農(nóng)作物,最早達(dá)到生長(zhǎng)旺季,并且最先收獲,所以如果滿足5月末至6月初的NDVI 值大于等于0.2,且8月NDVI 值減去6月NDVI 值小于0,則判定為春小麥,否則就是其他作物。蔬菜的生長(zhǎng)旺季僅次于春小麥,在7—8月NDVI 值有較大地下降,滿足8月NDVI 值減去7月NDVI 值大于0.1,否則是玉米或向日葵。玉米的播種比向日葵早,生長(zhǎng)旺季也明顯早于向日葵,在7月玉米的NDVI 值大于向日葵,而9月初的玉米NDVI 值有明顯的下降趨勢(shì),且比向日葵小。所以,決策樹最后一層,本研究用8月NDVI 值減去7月NDVI 值大于0,且6月NDVI 值小于等于0.15 的為玉米,否則為向日葵。
采用研究中構(gòu)建的決策樹分類模型對(duì)內(nèi)蒙古巴彥淖爾市臨河區(qū)2017年春小麥、玉米、向日葵和蔬菜進(jìn)行了識(shí)別分類。圖3給出了5 種農(nóng)作物的空間分布?;诜诸惤Y(jié)果統(tǒng)計(jì)出了研究區(qū)5 種農(nóng)作物的總面積為20.28 萬hm2,春小麥、玉米、向日葵和蔬菜面積分別為0.97 萬,6.52 萬,9.65 萬,3.14 萬hm2,分別占農(nóng)作物總面積的4.8%,32.1%,47.6%,15.5%。
圖3 農(nóng)作物種植分類結(jié)果
由圖3可以看出,向日葵主要分布在臨河區(qū)北部區(qū)域,北部區(qū)域土壤鹽堿化程度高,適宜向日葵種植;而玉米大面積種植區(qū)域主要在南部黃河沖積平原一帶,灌溉條件好,地力等級(jí)較高,種植意愿更傾向于玉米;春小麥種植面積小,且地塊破碎,連片種植較少,中部有一片春小麥連片種植區(qū)域?yàn)榕R河農(nóng)場(chǎng),春小麥實(shí)際種植面積要遠(yuǎn)低于統(tǒng)計(jì)數(shù)據(jù);蔬菜(西葫蘆、番茄)分布較為均勻,且面積大于春小麥,這與實(shí)地調(diào)查中了解到的情況基本一致。
在精度評(píng)價(jià)結(jié)果分析時(shí),文章采用了10 個(gè)地面樣方對(duì)基于決策樹的分類結(jié)果進(jìn)行了精度驗(yàn)證,表4給出了驗(yàn)證結(jié)果混淆矩陣。由表4可知,總體精度為76.29%,Kappa 系數(shù)為0.652 9,達(dá)到了高度一致性。從用戶精度和制圖精度上,春小麥分類精度最高,向日葵次之,蔬菜的分類精度最低。造成分類精度未能達(dá)到80.00%以上的原因有:(1)獲取圖像質(zhì)量問題,7月10日影像和8月24日影像上有部分云遮擋;(2)作物長(zhǎng)勢(shì)情況不均衡,從實(shí)際情況來看,玉米和向日葵錯(cuò)分的情況較為突出,北部干旱、南部水利條件較好,長(zhǎng)勢(shì)差的玉米有可能被錯(cuò)分為向日葵和蔬菜;(3)蔬菜分類精度較低,臨河區(qū)蔬菜種類較多,種植面積較廣泛的是西葫蘆、番茄,但是還有其他經(jīng)濟(jì)類的蔬菜和小部分瓜地,因反射率差異較小,未能全部分類,分類當(dāng)中產(chǎn)生了相混淆的情況;(4)研究區(qū)地塊較為破碎,分類難度較大。
表4 分類結(jié)果誤差矩陣(基于像元)
本研究采用的方法試圖在縣級(jí)尺度上建立快速、簡(jiǎn)單、操作性強(qiáng)的主要農(nóng)作物分類識(shí)別方法。該方法初步探索了研究區(qū)5 種作物在GF-1/WFV 原始光譜影像上難以識(shí)別的問題,研究結(jié)果證明,蔬菜的解譯精度未能達(dá)到以往文獻(xiàn)中報(bào)道的平均水平,但在局部區(qū)域取得了較好的分類效果,這證明基于植被指數(shù)時(shí)間序列的決策樹分類方法在識(shí)別北方地區(qū)春小麥、玉米、向日葵和蔬菜上的適用性較強(qiáng)。
通過決策樹分類模型發(fā)現(xiàn)春小麥識(shí)別影像窗口期為5—6月和8月春小麥?zhǔn)崭钪?,識(shí)別玉米和向日葵的影像窗口期在8月末至9月,蔬菜的窗口期在7月中旬。
本研究的結(jié)果表明,該方法的進(jìn)一步完善和細(xì)化應(yīng)側(cè)重原始光譜信息的深入分析和挖掘,達(dá)到針對(duì)性更強(qiáng)的目的,進(jìn)一步提高分類精度。