国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于XGBoost算法的多云多霧地區(qū)多源遙感作物識別

2022-05-12 09:29徐海清
農(nóng)業(yè)機械學報 2022年4期
關(guān)鍵詞:植被指數(shù)光譜煙草

張 超 陳 暢 徐海清 薛 琳

(1.中國農(nóng)業(yè)大學土地科學與技術(shù)學院,北京 100083;2.自然資源部農(nóng)用地質(zhì)量與監(jiān)控重點實驗室,北京 100083;3.安徽皖南煙葉有限責任公司,宣城 242000)

0 引言

快速、準確地獲取農(nóng)作物空間分布信息是區(qū)域作物長勢監(jiān)測、產(chǎn)量估測以及種植結(jié)構(gòu)調(diào)整的重要依據(jù)[1]。遙感以其覆蓋范圍廣、時效性強等特點,成為獲取農(nóng)作物信息的重要手段[2]。針對我國南方多云多霧地區(qū)農(nóng)作物遙感識別問題,YU等[3]以MODIS時間序列影像為數(shù)據(jù)源,采用植被指數(shù)和水體指數(shù),提取我國南部13個省地區(qū)的水稻種植區(qū)。馮實磊[4]綜合MODIS、Landsat、Sentinel系列多源衛(wèi)星遙感數(shù)據(jù),實現(xiàn)了多云雨霧地區(qū)大范圍水稻種植信息提取,精度達85%。于彬[5]設(shè)計多云雨地區(qū)多源遙感影像融合增強方法,采用面向?qū)ο蠓诸愑跋穹椒?,精度達88.17%。具有強穿透力的微波雷達為遙感作物識別提供了數(shù)據(jù)支撐[6-7]。綜合微波雷達和光學多光譜遙感影像等多源遙感數(shù)據(jù)進行作物識別具有很大潛力[8]。文獻[9-10]融合Sentinel-1和Sentinel-2多源遙感數(shù)據(jù)提高分類精度,評估現(xiàn)有監(jiān)督學習模型進行作物精確分類的可行性,分類精度均達90%以上。針對起壟覆膜作物遙感識別[11],尹楠[12]基于全極化雷達數(shù)據(jù),采用Oh模型分析壟行結(jié)構(gòu)參數(shù)對不同極化后向散射系數(shù)的影響。朱秀芳等[13]結(jié)合紋理特征數(shù)據(jù),研究無人機遙感在覆膜農(nóng)田面積及分布提取的方法。在分類方法上,隨機森林(Random forest,RF)算法[14]廣泛應(yīng)用于水稻[15]、玉米[16]、小麥[17]等作物識別[18],而有研究表明極端梯度提升樹模型(eXtreme gradient boosting,XGBoost)在高光譜圖像的光譜空間分類和雷達極化空間信息分類方面,優(yōu)于RF方法[19]。蔡林菲等[20]基于高分二號影像,采用支持向量機、RF和XGBoost等3種方法,對主要優(yōu)勢樹種進行分類,得出XGBoost優(yōu)于其他兩種方法。DONG等[21]利用高分三號PolSAR圖像進行土地覆被分類,在分類結(jié)果和時間成本方面,XGBoost方法相比RF更為有效。

我國皖南地區(qū),作物關(guān)鍵生育期多云多霧,光學遙感數(shù)據(jù)難以有效獲取,遙感作物識別的數(shù)據(jù)和精度都難以保障。本文根據(jù)研究區(qū)不同作物類別的物候差異,針對主要作物早期覆膜保溫保水等特點,以關(guān)鍵生育期的多時相遙感數(shù)據(jù),多光譜反射率結(jié)合SAR后向散射,研究我國南方多云多霧地區(qū)作物識別問題。

1 研究區(qū)及數(shù)據(jù)源

1.1 研究區(qū)概況

研究區(qū)選擇安徽省宣城市宣州區(qū),地處安徽省東南部,如圖1所示。研究區(qū)屬于亞熱帶季風氣候區(qū),年平均溫度15.6℃。雨量適中,年平均降水量約1 430 mm。該區(qū)域?qū)儆诘蜕角鹆甑貛В露绕骄?,適宜煙草、水稻、油菜、冬小麥等作物種植,煙草是該區(qū)域重要的經(jīng)濟作物。

圖1 研究區(qū)地理位置與遙感影像Fig.1 Location of study area and remote sensing data

研究區(qū)主要作物為煙草、水稻、冬小麥和油菜等。目前宣州區(qū)有超過4 000 hm2耕地實施稻-煙輪作的種植模式,該模式為7—10月底種植水稻,11月到次年3月進行土地休養(yǎng),3—7月種植煙草。煙草移栽前需要進行田間起壟覆膜,起壟高度30~40 cm,起壟寬度60~70 cm;起壟后覆膜,采用銀黑雙面地膜,地膜覆蓋寬度110~120 cm。研究區(qū)主要作物的生育期如表1所示。

表1 主要作物類型物候時期Tab.1 Phenological period of major crop types

1.2 數(shù)據(jù)源及預(yù)處理

1.2.1衛(wèi)星遙感數(shù)據(jù)

選取3—7月作物主要生育期多期Sentinel-1的SAR數(shù)據(jù)。Sentinel-1衛(wèi)星是歐洲航空局的地球觀測衛(wèi)星,搭載C波段SAR,可以全天候連續(xù)對地監(jiān)測。數(shù)據(jù)使用Sentinel-1干涉測量寬幅模式(IW)的L1級別GRDH數(shù)據(jù)類型,并經(jīng)過消除熱噪聲、輻射定標、幾何校正等預(yù)處理。同時,選用3—7月主要作物生育期內(nèi),能夠覆蓋研究區(qū)的多時相Sentinel-2數(shù)據(jù)。Sentinel-2是歐空局的高分辨率多光譜衛(wèi)星,由“Sentinel-2A”和“Sentinel-2B”2顆衛(wèi)星組成,覆蓋從可見光近紅外到短波紅外共13個波段的數(shù)據(jù),本文主要采用可見光至近紅外范圍的7個波段。Sentinel-2的2顆衛(wèi)星互補重訪周期可達到5 d,多光譜數(shù)據(jù)經(jīng)過大氣校正、幾何校正、輻射校正等預(yù)處理。

皖南地區(qū)多云多霧,光學遙感影像覆蓋的有效性及完整性難以保證,作物生育期(3—7月)內(nèi)光學影像總數(shù)量為127景,圖2為研究區(qū)逐像元可用光學影像數(shù)量,即3—7月各像元位置去除云霧干擾后的光學影像數(shù)量[22],分為兩種主要類型:受云霧影響小區(qū)域(A)和云霧覆蓋影響區(qū)域(B),所采用的遙感影像信息如表2所示。

圖2 宣州區(qū)可用光學影像分布(景)Fig.2 Distribution of available optical images

表2 主要遙感影像分辨率及時相Tab.2 Main remote sensing image resolution and time phase

1.2.2外業(yè)調(diào)查數(shù)據(jù)及其他專題數(shù)據(jù)

采用研究區(qū)分辨率為30 m Shuttle Radar Topography Mission (SRTM)的DEM數(shù)據(jù),提取坡度、高程等地形因子。此外,采用研究區(qū)2018年土地利用數(shù)據(jù)庫中的耕地矢量數(shù)據(jù),包括水田、水澆地和旱地等耕地二級地類,以耕地數(shù)據(jù)為約束,減少林地、園地、草地等地類對農(nóng)作物識別的干擾,提高識別精度。研究區(qū)耕地分布如圖3所示。

分別于2019年5月和7月在研究區(qū)進行兩次外業(yè)調(diào)查,此外,結(jié)合高分辨率GoogleEarth影像目視解譯增補樣本點,共計樣本點總數(shù)517個。其中煙草樣本點224個,其他作物類型樣點293個,包括冬小麥、水稻、油菜、蔬菜大棚等。按照7∶3的比例隨機抽取劃分為訓練樣本集和測試樣本集。樣本點分布如圖3所示。

圖3 宣州區(qū)作物識別樣本點及耕地分布Fig.3 Samples and farmland distribution in Xuanzhou District

2 研究方法

利用多源遙感數(shù)據(jù),構(gòu)建多時相光譜特征和SAR后向散射特征相結(jié)合的多云多霧地區(qū)作物識別體系。首先利用不同時期Sentinel-2多光譜遙感影像提取研究區(qū)典型地物類型的光譜特征,分析研究區(qū)隨著不同作物生長光譜變化特征,選取多種植被指數(shù);此外,分析不同作物的微波雷達后向散射特征,結(jié)合光學植被指數(shù)構(gòu)建地膜植被指數(shù)(SAR plastic-film vegetation index,SPVI);構(gòu)建多種指數(shù)時序數(shù)據(jù)集,利用XGBoost模型進行作物分類,并和RF分類結(jié)果對比,實現(xiàn)研究區(qū)作物遙感高精度識別,具體技術(shù)路線如圖4所示。

圖4 研究技術(shù)路線圖Fig.4 Technology flowchart for crop identification

2.1 作物識別特征選取

根據(jù)樣本點獲取Sentinel-2每個時相遙感數(shù)據(jù)的可見光至近紅外范圍7個波段各波段反射數(shù)據(jù),可見光至近紅外波段是常用植被指數(shù)的波段范圍,被廣泛用于獲取植被特征。不同時相遙感影像中不同地類的光譜反射曲線如圖5所示,不同作物在同一時期光譜反射存在差異,3月中旬油菜和小麥植被生長旺盛,紅外波段反射最高;兩圖間變化反映作物生長情況,從移栽至現(xiàn)蕾期,長勢達到峰值,煙草紅外波段反射率明顯高于其他作物。

圖5 研究區(qū)典型地類光譜曲線Fig.5 Spectral curves of typical class of study area

根據(jù)研究區(qū)主要作物的時序光譜特征情況,從3方面選取指標構(gòu)建分類特征集:

(1)光譜特征。根據(jù)上述反射光譜曲線特征,提取經(jīng)預(yù)處理后的3月多光譜影像的紅(B4)、綠(B3)、藍(B2)3個波段以及5月紅邊波段(B6、B7)、近紅外波段(B8),得到6個波段組合的光譜特征集。

(2)植被指數(shù)。本文對常用的植被指數(shù)進行相關(guān)性分析,選取增強型植被指數(shù)(EVI)、比值植被指數(shù)(RVI)、歸一化植被指數(shù)(NDVI)、土壤調(diào)節(jié)植被指數(shù)(SAVI)、歸一化差異水體指數(shù)(NDWI)等5種參與作物識別,并在作物種植特性和光譜特征的基礎(chǔ)上,結(jié)合SAR數(shù)據(jù),針對研究區(qū)作物的種植特點,改進構(gòu)建SPVI。

通過光譜反射差異及相關(guān)研究[23-24],藍波段對地膜覆蓋農(nóng)田識別較為敏感。選取添加藍波段的NDVIB反映覆膜農(nóng)田的地膜和植被特征,計算式為

(1)

式中N——Sentinel-2近紅外波段反射率

R——Sentinel-2紅色波段反射率

B——Sentinel-2藍色波段反射率

比值后向散射系數(shù)反映由田間起壟和植株高度產(chǎn)生的后向散射系數(shù)差異。綜合兩者構(gòu)建SPVI為

(2)

式中SVV——Sentinel-1的VV極化后向散射系數(shù)

SVH——Sentinel-1的VH極化后向散射系數(shù)

(3)地形因子。地形因子影響降水量、光照強度以及氣溫、土壤濕度,進一步?jīng)Q定了作物的空間分布。將研究區(qū)的坡度和高程因子特征作為輔助因素,參與作物分類,可提高作物識別精度。

2.2 XGBoost分類算法

XGBoost算法由CHEN等[25]提出,是在梯度提升算法(Gradient boosting,GDBT)基礎(chǔ)上優(yōu)化而來。Boosting算法是將基分類器組合提升為強分類器的算法,首先利用初始訓練集訓練一個基分類器,根據(jù)表現(xiàn)調(diào)整下一個基分類器中訓練樣本的權(quán)重,分類錯誤的樣本得到更多的關(guān)注,多次重復達到滿足條件為止,最后將訓練后的多個分類器加權(quán)組合。與GDBT相比,XGBoost具有準確度高、不易過擬合、可擴展性強等特點[20]。

XGBoost算法在決策樹算法的基礎(chǔ)上,添加包括葉子節(jié)點數(shù)及葉子節(jié)點數(shù)平方和的正則項,因此其目標函數(shù)包括損失函數(shù)和正則項兩部分。損失函數(shù)為預(yù)測值和真實值之差,通過減少損失來優(yōu)化目標函數(shù);正則項用來控制模型的復雜度,防止模型出現(xiàn)極端情況。XGBoost算法最優(yōu)的目標函數(shù)為

(3)

其中

(4)

式中λ——固定系數(shù)γ——復雜度參數(shù)

T——樹中葉節(jié)點的數(shù)量

Gj——葉子節(jié)點j所包含樣本的一階偏導數(shù)gi累加之和

Hj——葉子節(jié)點j所包含樣本的二階偏導數(shù)hi累加之和

XGBoost算法參數(shù)設(shè)置采用網(wǎng)格搜索法[26],為一種指定參數(shù)的窮舉搜索方法,在取值區(qū)域內(nèi),由步長決定的網(wǎng)格作為自變量分組依據(jù),通過劃分網(wǎng)格,逐一計算每個網(wǎng)格點上的約束值,自動輸出最佳參數(shù)的組合。

3 試驗與結(jié)果分析

3.1 時序曲線構(gòu)建

利用主要作物生育期可覆蓋多期多源遙感數(shù)據(jù)集,獲取的6種植被指數(shù)疊加合成時序影像數(shù)據(jù)集,以提取作物主要生育期的時序曲線。圖6為不同作物指數(shù)時序的變化曲線,其中煙草和早稻栽種及收獲時間較為一致,指數(shù)曲線的趨勢相似,但3月煙草覆膜時期SPVI和6、7月成熟期的SPVI、NDWI、RVI可將兩者較好區(qū)分;在3月,農(nóng)田覆膜反射與大棚類似,煙草處于移栽前后期,未表現(xiàn)出植被特征。圖6a煙田、大棚兩者反射率相差不大,煙草的SPVI指數(shù)略高于早稻。6—7月煙草和早稻進入成熟收獲期,煙草的植株高度可達150 cm,比值后向散射降低,使得早稻SPVI明顯高于煙草。圖6b~6f的植被指數(shù)時序曲線,5月煙草處于生長旺盛的現(xiàn)蕾期,指數(shù)處于峰值,EVI明顯高于早稻;6—7月植被指數(shù)逐步降低,此時煙草和早稻之間的NDWI以及RVI有明顯差異且趨勢相反,可用于區(qū)分作物。

圖6 多時相植被指數(shù)時序曲線Fig.6 Time series curves of multi-temporal vegetation index

圖6a中SPVI指數(shù)可表達覆膜起壟作物與其他作物的差異,3月冬小麥和油菜等進入拔節(jié)期和蕾薹期,在SPVI上兩者相似,但與煙草差別較大;圖6b~6f植被指數(shù)中可以看出冬小麥和油菜在4月達到生長旺盛期,指數(shù)出現(xiàn)峰值隨后逐漸降低,與煙草的植被指數(shù)變化趨勢相反。

3.2 分類模型訓練

利用研究區(qū)的多源遙感數(shù)據(jù),計算選取分類指標,綜合6個光譜特征,構(gòu)建30個多時相植被指數(shù)和兩個地形因子輔助特征的多指數(shù)分類特征集。隨機抽取70%樣本訓練XGBoost和RF模型,對研究區(qū)地物進行分類,30%作為測試樣本對作物識別結(jié)果進行精度評價。本文通過網(wǎng)格搜索法使用Python分別優(yōu)化XGBoost模型和RF模型的參數(shù)[27],最終確定兩個模型的最優(yōu)參數(shù)如表3所示,其余參數(shù)均為默認值。

表3 模型參數(shù)含義及調(diào)優(yōu)結(jié)果Tab.3 Implications of model parameters and tuning results

3.3 作物識別結(jié)果分析

根據(jù)云霧影響情況和作物種植分布,將研究區(qū)分塊,對不同區(qū)域,針對性的提出有差異的作物識別方法,并在區(qū)域A和B開展實例驗證。在區(qū)域A有效 Sentinel-2影像數(shù)量可達30景左右,綜合區(qū)域內(nèi)多時相多源遙感數(shù)據(jù),采用了XGBoost模型,依據(jù)光譜特征及時序指數(shù)特征差異,對耕地內(nèi)的作物進行分類,并和RF算法進行對比,兩者的總體精度分別為88.68%和86.22%,XGBoost模型總體精度略高于RF模型,識別結(jié)果如圖7b、7a所示。兩種分類方法主要作物煙草識別的精度評價如表4所示。兩種方法作物識別的漏分率接近,而XGBoost算法錯分率僅為1.42%,煙草識別效果更優(yōu)。

圖7 作物識別結(jié)果Fig.7 Crop identification results

表4 2種分類方法精度評價Tab.4 Accuracy evaluation of XGBoost and RF classification methods %

研究區(qū)主要作物煙草生長旺盛以及收獲期(5—7月)皖南地區(qū)云霧較多,光學影像難以覆蓋整個研究區(qū)域。在區(qū)域B整個生育期可用影像數(shù)量僅為7景左右,而在煙草現(xiàn)蕾以及成熟收獲期,受云霧影響,大部分區(qū)域可用影像數(shù)量僅有1景,難以保證作物識別精度。因此在5—7月云霧覆蓋區(qū)域,選取3月的紅、綠、藍波段為光學特征,5—7月Sentinel-1影像為后向散射特征,以已有多期Sentinel-2影像的NDVIB指數(shù)與Sentinel-1的比值后向散射結(jié)合,得到SPVI指數(shù)特征。采用XGBoost算法按照上述相同的樣本集以及模型訓練方法,對云霧區(qū)域的主要作物進行識別,識別總體精度為84.87%,煙草制圖精度88.69%,用戶精度95.51%,基本滿足作物識別的精度要求。RF算法總體精度為83.93%,略低于XGBoost算法。僅使用生育期Sentinel-2影像的作物識別總體精度79.01%,主要作物煙草識別制圖精度82.30%,用戶精度93.49%,表明本文構(gòu)建的作物識別方法可提高云霧影響地區(qū)作物識別的精度。

利用本文構(gòu)建的分區(qū)域作物識別方法,兩個典型區(qū)域識別結(jié)果如圖7所示。經(jīng)多區(qū)匯總和面積估算(圖8),得到研究區(qū)主要作物煙草的種植面積約為4 133.34 hm2,同2019年實際統(tǒng)計種植面積4 333.34 hm2對比,識別誤差約為4.6%,基本符合宣州區(qū)該作物種植分布和面積統(tǒng)計實際情況。

圖8 研究區(qū)作物識別結(jié)果Fig.8 Crop identification results in study area

4 結(jié)論

(1)綜合多光譜光學數(shù)據(jù)與雷達數(shù)據(jù),針對作物早春覆膜特點,構(gòu)建SPVI和NDVI、EVI、SAVI、NDWI、RVI等5種植被指數(shù),共同構(gòu)建多時相植被指數(shù)集,利用時間序列上的變化信息,提高了多云多霧地區(qū)作物識別精度。

(2)利用作物全生育期(3—7月)多時相Sentinel-1和Sentinel-2數(shù)據(jù),構(gòu)建多云多霧地區(qū)農(nóng)田作物識別體系,采用XGBoost分類模型,結(jié)合光譜特征、SAR后向散射特征及時序指數(shù)特征,分別對研究區(qū)的作物進行分類,并與RF算法進行對比。對于全生育期光學多光譜遙感覆蓋較密集區(qū)域,兩者的總體精度分別為88.68%和86.22%,XGBoost模型的總體精度略高于RF模型;對于5—7月云霧覆蓋,光學多光譜數(shù)據(jù)缺失嚴重區(qū)域,XGBoost模型和RF模型識別總體精度分別為84.87%和83.93%。表明本文構(gòu)建的基于XGBoost模型遙感作物識別方法在多云多霧地區(qū)有效。

猜你喜歡
植被指數(shù)光譜煙草
上海煙草包裝印刷有限公司
基于三維Saab變換的高光譜圖像壓縮方法
煤炭礦區(qū)耕地土壤有機質(zhì)無人機高光譜遙感估測
基于3D-CNN的高光譜遙感圖像分類算法
基于無人機圖像的草地植被蓋度估算方法比較
淺談植被指數(shù)的分類與應(yīng)用
全國首次青少年煙草調(diào)查
煙草鏡頭與歷史真實
百年煙草傳奇的云南敘事
盐边县| 拉萨市| 呼图壁县| 柏乡县| 曲靖市| 东山县| 安康市| 招远市| 黄平县| 容城县| 宁化县| 许昌县| 工布江达县| 光泽县| 蒙阴县| 安徽省| 泗洪县| 滨州市| 沁阳市| 蓬莱市| 嵊州市| 保德县| 迁安市| 尼木县| 阳朔县| 珲春市| 霸州市| 永德县| 常熟市| 靖西县| 西青区| 南昌县| 贞丰县| 额济纳旗| 蓝山县| 神木县| 法库县| 兴化市| 乌审旗| 中宁县| 漾濞|