摘要""本研究以安徽岳西縣為研究區(qū),多時相(10、12和5月)的Landsat 8/9 OLI影像為數(shù)據(jù)源,利用精確度評價證明隨機森林算法的可行性,利用ENVI 5.3和ArcGIS 10.8軟件分析7種典型地物(耕地、水體、建筑物、灌木、道路、林地和茶園)的時序光譜特征與NDVI變化,然后利用隨機森林算法提取研究茶園信息進(jìn)行茶園時空特征變化分析。結(jié)果表明,隨機森林算法提取茶園信息效果較好,精度較高。2022年10月、2022年12月和2023年5月隨機森林法提取茶園信息的總體精度分別為99.3%、98.2%和99.5%,Kappa系數(shù)分別為0.972、0.934和0.981;NIR、SWIR1和SWIR2是茶園的特征波段,茶園的NDVI值高于其他植被的NDVI值,可作為茶園與其他植被區(qū)分的重要節(jié)點。隨機森林法結(jié)果表明,研究區(qū)2022年10月、2022年12月和2023年5月茶園種植面積分別為130.59、126.79和137.47 km2,其時空特征變化明顯。綜上,隨機森林算法提取茶園信息效果較好,研究為隨機森林算法在茶園信息提取中的應(yīng)用提供參考。
關(guān)鍵詞""茶園信息提?。籐andsat 8/9 OLI;光譜特征;隨機森林算法
中圖分類號""S571.1;P237 """"""文獻(xiàn)標(biāo)識碼""A """"""文章編號""1007-7731(2025)04-0113-06
DOI號""10.16377/j.cnki.issn1007-7731.2025.04.023
Information extraction of tea garden in Yuexi County based on random forest features
NIU Haiqing CHEN Li "LIU Shuang FANG Gang
(1School of Environment and Surveying Engineering, Suzhou University, Suzhou 234000, China;
23S Technology Application Research Center in Northern Anhui, Suzhou 234000, China;
3Suzhou No.2 High School, Suzhou 234000, China)
Abstract "Yuexi County of Anhui Province was selected as the research area, and multi-temporal Landsat 8/9 OLI images (October, December and May) were used as the data source to prove the feasibility of the random forest algorithm by accuracy evaluation. ENVI 5.3 and ArcGIS 10.8 software were used to analyze the temporal spectral features and NDVI changes of 7 typical land features (cultivated land, water body, buildings, shrub, road, forest land, and tea garden), and then random forest algorithm was used to extract tea garden information in research area to analyze the spatio-temporal characteristics changes of tea gardens. The results showed that the random forest algorithm had good effect and high precision in extracting tea garden information in research area. The overall accuracy of tea garden information extraction by random forest method in October 2022, December 2022, and May 2023 were 99.3%, 98.2%, and 99.5%, respectively, and the Kappa coefficients were 0.972, 0.934, and 0.981, respectively. NIR, SWIR1 and SWIR2 were the characteristic bands of tea gardens, and the NDVI value of tea gardens was higher than that of other vegetation, which can be used as an important node to distinguish tea gardens from other vegetation. Random forest method calculation showed that the planting area of tea gardens in research area in October 2022, December 2022, and May 2023 was 130.59, 126.79, and 137.47 km2, respectively, and their spatio-temporal characteristics changed significantly. In summary, random forest algorithm has a good effect on extracting tea garden information, and this study provides a reference for the application of random forest algorithm in tea garden information extraction.
Keywords "tea plantation information extraction; Landsat 8/9 OLI; spectral signature; random forest algorithm
茶葉是一種農(nóng)業(yè)經(jīng)濟(jì)作物,具有重要的科研、文化和經(jīng)濟(jì)價值[1]。茶飲已成為人們生活中不可或缺的一部分[2]。中國茶樹種植范圍廣,面積較大,主要分布在湖南、福建和安徽等地區(qū)[3]。隨著經(jīng)濟(jì)的發(fā)展,茶葉產(chǎn)量迅速增加,經(jīng)濟(jì)效益顯著提高,一定程度上促進(jìn)了茶產(chǎn)業(yè)的發(fā)展[4]。隨著茶葉種植面積的不斷擴大,給茶園管理也帶來較多困難,其中如何快速、精確地掌握茶園空間分布情況,已成為其管理的一個重要難題。因此,研究茶園空間分布狀況在茶園管理中具有重要意義[5]。
傳統(tǒng)的茶園面積統(tǒng)計方法已不能滿足實際生產(chǎn)需求,遙感技術(shù)因具有易于獲取、分辨率高和覆蓋范圍廣等優(yōu)點,被廣泛應(yīng)用于茶園信息提取中。王斌等[6]以2019年Landsat-8 OLI影像為數(shù)據(jù)源,基于紋理特征、植被指數(shù)特征和隨機森林分類方法提取了安吉縣茶園種植面積,分類精度達(dá)92.4%。錢瑞等[7]以高分五號高光譜影像和數(shù)據(jù)高程模型(Data elevation model,DEM)數(shù)據(jù)為數(shù)據(jù)源,以普洱市南部為研究區(qū),在隨機森林分類算法基礎(chǔ)上構(gòu)建茶園信息提取新算法,用新算法提取研究區(qū)茶園面積,并與其他算法提取精度進(jìn)行了比較,新算法的茶園信息提取總體精度較高。李艷等[8]以多時相Sentinel-2影像為數(shù)據(jù)源,利用隨機森林算法和紋理特征提取廈門市茶園信息,研究表明,10月份的茶園提取總體精度和Kappa系數(shù)均較高,滿足茶園管理需求。
岳西是安徽省重要的茶葉生產(chǎn)地之一,茶產(chǎn)業(yè)是該地區(qū)的支柱產(chǎn)業(yè)和富民產(chǎn)業(yè)之一。因此,對岳西縣開展茶園信息提取與時空演變分析研究十分必要。本研究以岳西縣為研究區(qū),以Landsat 8/9 OLI影像為數(shù)據(jù)源,矢量數(shù)據(jù)、奧維影像為輔助數(shù)據(jù),ENVI 5.3和ArcGIS 10.8軟件為平臺,在相關(guān)研究成果基礎(chǔ)上結(jié)合茶樹最佳生長期,利用隨機森林法提取岳西縣茶園信息,并對其時空特征變化進(jìn)行分析。
1 材料與方法
1.1 研究區(qū)基本情況
研究區(qū)位于皖西南邊陲和大別山腹地,跨淮河和長江兩大流域,與湖北省相鄰,轄9個社居委、179個行政村和24個鄉(xiāng)鎮(zhèn),面積2 398 km2。該地區(qū)氣候?qū)俦眮啛釒駶櫺约撅L(fēng)氣候,平均氣溫14.4"℃,冷暖年平均溫差1.6"℃。雨熱同期,5—9月為降水盛期,年均降水量1 445.8"mm,年平均日照時數(shù)2 070.5"h。自然地理條件優(yōu)越,有利于茶樹生長,店前、冶溪、菖蒲、中關(guān)和和平等鄉(xiāng)鎮(zhèn)為茶園種植主產(chǎn)區(qū)。
1.2 數(shù)據(jù)來源
以岳西縣Landsat 8/9 OLI影像為數(shù)據(jù)源(2022年10月13日、2022年12月24日和2023年5月1日),每時相2景影像,共6景影像,云量均低于2%,影像清晰。6景OLI影像均為L1級數(shù)據(jù),數(shù)據(jù)來源于美國地質(zhì)調(diào)查局(USGS)網(wǎng)站。輔助數(shù)據(jù)主要為矢量數(shù)據(jù)和奧維地圖影像數(shù)據(jù)。
1.3 試驗方法
通過https://earthexplorer.usgs.gov下載研究區(qū)Landsat 8/9 OLI L1級數(shù)據(jù),云量均低于2%;利用奧維影像構(gòu)建感興趣區(qū),在ENVI 5.3中結(jié)合紋理特征進(jìn)行茶園信息提取精度評價;利用ENVI 5.3軟件對岳西縣Landsat 8/9影像進(jìn)行輻射定標(biāo)、大氣校正、影像拼接和矢量裁剪,在ArcGIS 10.8中尋找各地物樣本并進(jìn)行多值提取至點操作,在ENVI 5.3中分別利用反射率和歸一化植被指數(shù)(Normalized difference vegetation index,NDVI)公式進(jìn)行波段運算;利用Excel軟件作圖識別茶園與其他地物的光譜可分性,在ENVI 5.3中進(jìn)行紋理特征分析;為了更好地進(jìn)行多值提取至點操作,以奧維影像為輔助數(shù)據(jù),利用奧維數(shù)據(jù)采集地物樣本點(采用拼接式地圖影像),方便影像在ArcMap中加載,影像不容易出現(xiàn)卡頓現(xiàn)象,樣本點如圖1所示。
1.3.1""精度評價""""精度評價指標(biāo)包括總體評價精度(Overall accuracy,OA)和Kappa系數(shù)[9]。其中OA用表示,Kappa用K表示,總體評價精度計算如式(1),Kappa系數(shù)計算如式(2)。
1.3.2""NDVI計算""""NDVI在一定程度上可以反映研究區(qū)內(nèi)植被覆蓋變化情況。在光譜分析的基礎(chǔ)上,可進(jìn)一步分析歸一化植被指數(shù)時序特征曲線來研究茶園與其他植被的可區(qū)分性[10]。NDVI計如式(3)。
式(3)中,NIR表示近紅外波段的反射率;RED表示紅色波段的反射率。
1.3.3 隨機森林算法""""隨機森林算法是包含多個決策樹的一種分類器[11],由決策樹輸出類別數(shù)量決定輸出類別,采用Bootstrap重采樣方法對原始樣本進(jìn)行隨機抽樣,再將樣本逐漸回歸決策樹,進(jìn)行決策樹建模[12-13]?;诟鞯仡惞庾V特征變化、NDVI時序變化,選取NDVI值作為研究區(qū)茶園信息提取值。
2 結(jié)果與分析
2.1 精度評價分析
在前期分析的基礎(chǔ)上,選擇隨機森林分類法、最大似然法、神經(jīng)網(wǎng)絡(luò)法和支持向量機法分別提取研究區(qū)茶園信息,并進(jìn)行分類精度比較。隨機森林分類法的OA和Kappa系數(shù)均最高,分別為99.3%和0.972,因此本研究選擇隨機森林分類法(表1)。將該方法的分類圖通過混淆矩陣精度評價計算,得到研究區(qū)3時序茶園精度評價專題圖和精度評價表,結(jié)果如圖2和表2所示,2022年10月、12月和2023年5月岳西縣茶園信息提取的OA分別為99.3%、98.2%和99.5%,Kappa系數(shù)分別為0.972、0.934和0.981。以上結(jié)果說明,隨機森林提取茶園信息效果較好。
2.2 光譜特征曲線分析
圖3(A)~(C)分別表示2022年10月13日、2022年12月24日和2023年5月1日岳西縣7種地物(耕地、水體、建筑物、灌木、道路、林地和茶園)光譜特征折線圖。由圖3可知,7種地物光譜值在B波段和G波段差異較?。涣值?、耕地、灌木和茶園的亮度值在R波段上升較快;與2023年5月相比,2022年10月和2022年12月的6種地物(道路除外)在B波段起始亮度值較小;2022年10月和12月,茶園在NIR波段亮度值要高于其他地物。綜上,茶園與其他地物的光譜特征在NIR、SWIR1和SWIR2波段具有明顯的可分性。
林地、耕地、灌木和茶園4種植被樣本在NIR、SWIR1和SWIR2的波段光譜均值變化,如圖4所示。由圖4A可知,2022年10月茶園光譜值高于其他地物光譜均值;由圖4B可知,2023年5月茶園光譜值高于其他地物光譜均值(林地除外);由圖4C可知,只有茶園光譜值呈上升趨勢。綜上,在NIR、SWIR1和SWIR2波段,茶園與其他地物具有明顯的波譜可分性,可以作為區(qū)分茶園與其他地物的特征波段。
2.3 NDVI時序曲線分析
由圖5可知,2022年10—12月,只有茶園的NDVI值是增加的,其余植被的NDVI值均有所減少;2022年12月至2023年5月,茶園的NDVI值有所減少,而林地、灌木和耕地的NDVI值有所增加;2022年10月至2023年5月,林地與灌木的NDVI值有所增加,而茶園與耕地的NDVI值有所減少。綜上,茶園與其他3種植被的NDVI值變化特征明顯不同,2022年10月至2023年5月,茶園的NDVI值呈先上升后下降的趨勢,其中,在2022年10—12月,茶園的NDVI值高于其他植被的NDVI值,可作為茶園與其他植被區(qū)分的重要時間節(jié)點。
2.4 時空特征變化分析
茶園信息提取的關(guān)鍵在于區(qū)分茶園與其他植被,制作茶園分布圖可提取茶園種植面積和了解茶園分布情況[14]。研究區(qū)茶園種植面積分布如圖6所示,岳西縣2022年10月、12月和2023年5月茶園種植面積分別為130.59 km2、126.79 km2和137.47 km2。
岳西縣茶園種植面積變化如圖所示,2022年12月茶園種植面積比2022年10月減少了3.80 km2;2023年5月茶園種植面積比2022年10月增加了6.88 km2。2022年10—12月,研究區(qū)茶園種植面積減少的區(qū)域主要分布在包家鄉(xiāng)等;2022年12月至2023年5月,岳西縣茶園種植面積增加的區(qū)域主要分布在包家鄉(xiāng)等。綜上,由于季節(jié)變化,2022年10月至2023年5月,研究區(qū)茶園種植面積先減少后增加,茶園種植面積時空變化特征明顯(圖7)。
3 結(jié)論與討論
本研究以Landsat 8/9 OLI影像為數(shù)據(jù)源,矢量數(shù)據(jù)和奧維影像為輔助數(shù)據(jù),利用ENVI 5.3和ArcGIS 10.8軟件,采用隨機森林法結(jié)合NDVI算法提取岳西縣茶園信息,并對其光譜特征和時空特征變化進(jìn)行分析,得出以下結(jié)論。(1)隨機森林分類法的OA和Kappa系數(shù)都最高,用隨機森林分類法提取的岳西縣茶園信息精確度較好。(2)NIR在茶園信息提取中具有一定潛力,NDVI值對于提取茶園信息具有重要作用,10月與12月是利用多時相影像提取茶園信息的最佳組合;10月是利用單時相影像提取茶園特征的最佳時間窗口。(3)2022年10月、2022年12月和2023年5月的岳西縣茶園種植面積分別為130.59、126.79和137.47 km2,茶園種植面積時空變化特征明顯。本研究采用采樣點對人工依賴性較強,可能存在錯分漏分現(xiàn)象,后續(xù)研究可以考慮通過計算機編程得到更高的分類精度。
參考文獻(xiàn)
[1] 蔣永泉.基于多源遙感數(shù)據(jù)茶園識別及其識別精度尺度效應(yīng)研究[D]. 昆明:云南師范大學(xué),2021.
[2] 侯瑩坤.作為日常生活實踐的茶:從茶課與社會記憶探究茶的文化意義[J].遺產(chǎn),2024(1):335-349,376.
[3] 孔玉屏. 我國茶產(chǎn)業(yè)增長特點的實證研究[D]. 杭州:浙江大學(xué),2006.
[4] 袁觀杰. 基于后向散射時空特征的夏玉米種植范圍提取研究:以河南省為例[D]. 鄭州:鄭州大學(xué),2021.
[5] 梁晨欣,黃啟廳,王思,等. 基于多時相遙感植被指數(shù)的柑橘果園識別[J]. 農(nóng)業(yè)工程學(xué)報,2021,37(24):168-176.
[6] 王斌,何丙輝,林娜,等. 基于隨機森林特征選擇的茶園遙感提取[J]. 吉林大學(xué)學(xué)報(工學(xué)版),2022,52(7):1719-1732.
[7] 錢瑞,徐偉恒,黃邵東,等. 應(yīng)用GF-5高光譜遙感影像提取山區(qū)茶園[J]. 光譜學(xué)與光譜分析,2023,43(11):3591-3598.
[8] 李艷,張帆. 基于Sentinel-2影像的廈門市茶園遙感提取[J]. 亞熱帶植物科學(xué),2023,52(4):327-335.
[9] 林卉,陳杰,王長海. 遙感原理與應(yīng)用[M]. 徐州:中國礦業(yè)大學(xué)出版社,2022:296-297.
[10] BREIMAN L. Bagging predictors[J]. Machine learning,1996,24(2):123-140.
[11] 趙曉晴,王萍,荊林海,等. 時序Sentinel-2A影像光譜特征的茶園提取應(yīng)用[J]. 測繪科學(xué),2020,45(6):80-88.
[12] 張修遠(yuǎn),劉修國. 基于隨機森林算法的高維模糊分類研究[J]. 國土資源遙感,2014,26(2):87-92.
[13] 方匡南,吳見彬,朱建平,等. 隨機森林方法研究綜述[J]. 統(tǒng)計與信息論壇,2011,26(3):32-38.
[14] 黃艷紅. 基于多源遙感數(shù)據(jù)的茶園面積提取[D]. 杭州:浙江大學(xué),2020.
(責(zé)任編輯:胡立萍)