數(shù)據(jù)驅動的農作物遙感分類地面樣本點布設

2023-05-15 05:27吳清瀅余強毅段玉林吳文斌

農業(yè)工程學報 2023年6期

關鍵詞：底圖樣本量作物

吳清瀅，余強毅，段玉林，吳文斌

·土地保障與生態(tài)安全·

數(shù)據(jù)驅動的農作物遙感分類地面樣本點布設

吳清瀅，余強毅※，段玉林，吳文斌

（中國農業(yè)科學院農業(yè)資源與農業(yè)區(qū)劃研究所/農業(yè)農村部農業(yè)遙感重點實驗室，北京 100081）

地面樣本點是農作物遙感分類模型訓練的基礎，樣本點數(shù)量和質量是影響模型分類精度的2個主要因素。該研究構建了數(shù)據(jù)驅動的樣本點布設方法，利用待分類影像的光譜、植被指數(shù)等特征構造分層抽樣底圖，結合分層隨機抽樣方法進行地面樣本點布設，并分析不同抽樣策略對農作物遙感分類結果的影響。采取基于-means聚類分析的數(shù)據(jù)驅動方法，考慮6景哨兵2號影像提取的共78個分類特征，生成同一個最優(yōu)的聚類結果圖；設計等量分配和按面積比分配2種樣本量分配方式，樣本點數(shù)量為25、49、100、169、225的5個總樣本量；基于不同抽樣策略獲取地面樣本點信息，利用同一個支持向量機模型對待分類影像進行監(jiān)督分類，并通過與139個樣本點的理論總樣本量和400個樣本點的傳統(tǒng)方式總樣本量對比分析，定量解析不同抽樣策略對分類精度的影響。結果表明：1）在數(shù)據(jù)驅動非監(jiān)督聚類生成的底圖上進行抽樣（按面積比分層抽樣法、等量分層抽樣法）獲得的樣本點質量和分類精度明顯優(yōu)于沒有該底圖的抽樣策略（簡單隨機抽樣法、系統(tǒng)抽樣法）；2）當總樣本量低于理論總樣本量時，等量分層抽樣法能獲取比按面積比分層抽樣法更高的分類精度。例如，當理論樣本量為139時，總樣本量為25、49和100時等量分層抽樣法的分類精度均值（75.5%、80.5%和86.0%）均明顯高于按面積比分層抽樣法的分類精度均值（48.4%、69.0%和83.0%），而當總樣本量為169和225時，兩種分層抽樣的分類精度均值都在90.0%左右；3）當滿足總體精度需求時，分層抽樣法所需的實際總樣本量小于理論樣本量，可極大提高抽樣效率。例如，等量分層抽樣法的實際樣本量為理論樣本量的約70%便可滿足85.0%的總體精度需求；當分類精度與人工選取方式分類精度相同時（97.5%），等量分層抽樣法的實際樣本量僅為傳統(tǒng)方式樣本量的約90%。研究結果印證了分類精度及穩(wěn)定性隨著總樣本量的增加而增加這一普遍認識，但當總樣本量超過一定值時，精度增長速度變慢。該方法可以獲取類間均衡、類內多樣化的樣本集，為農作物遙感地面樣本點布設、快速高效分類提供參考。

農業(yè)；遙感；作物分類；樣本點布設；抽樣底圖；聚類分析

0 引言

地面樣本點信息是訓練遙感分類模型的基礎，樣本點的數(shù)量和質量是影響模型分類效果的2個主要因素[1-2]：高質量的樣本點可以顯著提高遙感分類精度[3]，相反，樣本點的代表性弱[4]或樣本點數(shù)量不足[5]會增加分類誤差。有研究通過樣本點遷移[6]、特征提取[7]等方式來解決樣本點問題，但這類方法依然需要一小部分高質量地面樣本點信息作為基礎輸入?，F(xiàn)有高質量樣本點數(shù)據(jù)集一般通過專業(yè)人員目視解譯得到[8]，解譯成本與專業(yè)性要求高，導致現(xiàn)有高質量樣本點數(shù)據(jù)集大多僅針對特定區(qū)域[9]，地面真實訓練樣本點數(shù)量不足、代表性差的問題依然未能得到徹底解決。

實地調查可更大程度保證地面樣本點信息的質量。近年來，將空間分層抽樣理論結合遙感技術用于指導地面樣本點獲取[10]，為遙感影像變化檢測[11]、空間數(shù)據(jù)產品精度驗證[12]等研究中樣本點“去哪采”的難題提供了科學支撐。其中，制作底圖是抽樣設計的關鍵，好的底圖能大大提高分層抽樣調查效率。例如，以接近反映地物真實分布的遙感影像分類結果為底圖，能減少農作物種植面積調查研究中外推估算面積的精度誤差[13-15]。當分類對象變化不頻繁時，通?？芍苯永闷錃v史分布數(shù)據(jù)作為分類調查研究的抽樣底圖[3]，例如WICKHAM等[8,16]利用歷史的土地利用數(shù)據(jù)產品作為當年土地利用分類抽樣調查的分層依據(jù)。

然而，在農作物遙感分類研究中，頻繁的農戶田間活動導致田塊大小變動和種植作物種類更換，將歷史作物空間分布數(shù)據(jù)產品[17-18]作為當季作物遙感分類的分層抽樣底圖是具有較大不確定性的[3]。一些學者在缺乏有效的當季農作物分布數(shù)據(jù)時，會采用復雜規(guī)則并綜合各種輔助信息數(shù)據(jù)來間接構造分層底圖，此時分層抽樣效率的高低往往取決于輔助信息數(shù)據(jù)選擇的好壞。例如FOODY等[19]根據(jù)土壤類型分布信息來約束農田和作物類型制圖訓練樣本點采集區(qū)域。也有研究表明相對于按行政區(qū)劃分層[20]，利用歷史信息提取的作物種植頻率[21]可以更有效率的構造分層抽樣底圖。然而，土壤類型和行政區(qū)劃數(shù)據(jù)與作物分布的相關性較弱；由作物種植頻率構建的底圖難以擺脫對歷史信息完整性的依賴，并且對新作物和新種植模式的識別具有滯后性。以數(shù)據(jù)作為驅動力的方法脫離了對專家知識的依賴，能夠“自下而上”地刻畫特征變量之間復雜的線性與非線性關系[22-23]，因此，相較于利用輔助信息，通過挖掘和構建遙感影像數(shù)據(jù)內在關系，獲得能直接反映當季調查作物的分布信息，從而大大減輕構造分層底圖的工作量，獲取高質量樣本點，提高抽樣效率。

在沒有可直接使用的當季作物分布數(shù)據(jù)前提下，本研究嘗試構建數(shù)據(jù)驅動的樣本點布設方法體系，利用傳統(tǒng)的基于數(shù)據(jù)驅動的無監(jiān)督聚類算法，生成可用于直接支撐抽樣的分層抽樣底圖；并驗證此分層抽樣底圖與不同抽樣策略結合后的樣本點獲取效果，及其對遙感分類精度和效率的影響，以期通過“事前優(yōu)化”科學獲取類內代表性和類間均衡性均較高的訓練樣本點，降低遙感作物分類樣本點信息冗余，提出提高抽樣方法效率的最佳抽樣策略。

1 試驗區(qū)域及研究數(shù)據(jù)

1.1 試驗區(qū)域

為測試生成的分層抽樣底圖對分類精度的提升效果，本研究以遼寧省鐵嶺市開原市的一個典型農區(qū)為研究區(qū)，研究區(qū)總面積為111.4 km2。開原市（123°43'43''E～124°48'55''E，42°6'55''N～42°53'23''N）位于鐵嶺市的東北部。冬季嚴寒干燥，夏季溫熱多雨，四季分明，氣候屬中溫帶大陸性季風氣候。全市耕地面積1 183.72 km2，土地肥沃，主要種植一年一熟制玉米、大豆、水稻等農作物，是國家重點產糧區(qū)和商品糧基地。

圖1 研究區(qū)位置

1.2 數(shù)據(jù)來源及預處理

1）鑒于多個研究表明中國自然資源部組織制作和發(fā)布的免費使用的全球30 m地表覆蓋數(shù)據(jù)產品（GlobeLand30）[24]在中國局部空間精度評價中精度較高[25]，本研究選擇了此數(shù)據(jù)產品2020年耕地數(shù)據(jù)。

2）遙感影像數(shù)據(jù)來自歐洲航天局生產的哨兵2號衛(wèi)星遙感數(shù)據(jù)，哨兵2號是高分辨率多光譜成像衛(wèi)星，地面分辨率分別為10、20和60 m，兩顆衛(wèi)星互補的重訪周期為5 d，可提供植被、土壤和水覆蓋等圖像，已經被作為主要數(shù)據(jù)源應用于作物分類研究。在Google Earth Engine（GEE）平臺[26]上篩選出2021年1—9月覆蓋研究區(qū)的云量較少的哨兵2號衛(wèi)星遙感數(shù)據(jù)作為試驗數(shù)據(jù)，并對影像進行云掩膜、缺失值填補。最終研究選取了作物生育期內所有可用的遙感影像數(shù)據(jù)，時間點分別為2021年4月18日、5月18日、6月7日、6月12日、7月7日、9月10日。

3）驗證地面樣本點來自于同步開展的地面調查。整個地面調查中發(fā)現(xiàn)該典型研究區(qū)的耕地分布集中，地塊規(guī)整，以一個縣需要2 000個樣本點為數(shù)量參考，篩選獲得研究區(qū)內均位于地塊中心的80個真實地面樣本點，其中水稻、大豆和玉米樣本點個數(shù)分別為30、20和30。

為排除非耕地像元對作物分類調查研究的影響[27]，首先借助2020年GlobeLand30數(shù)據(jù)集提供的耕地分布（類型編號10）作為掩膜文件并重采樣到10 m，使其空間分辨率與哨兵2號遙感影像空間分辨率一致，對影像進行掩膜得到農田植被的總體分布數(shù)據(jù)，在此基礎上進行耕地作物抽樣底圖制作、作物識別和分類。

1.3 分類特征構建和提取

利用哨兵2號影像數(shù)據(jù)的光譜信息、以及不同波段的組合指數(shù)信息提取作物信息，研究中使用的波段詳細數(shù)據(jù)及植被指數(shù)為：波段B2～B4為可見光波段；波段B5～B7常被用于監(jiān)測植被健康信息[28]；波段B8和B8A分別為近紅外波段（寬）和近紅外波段（窄）；波段B11～B12為短波紅外波段；歸一化差值植被指數(shù)（normalized difference vegetation index，NDVI）[29]、歸一化植被水分指數(shù)（normalized difference water index，NDWI）[30]、歸一化建筑指數(shù)（normalized difference built-up index，NDBI）[31]，分別對植被、水體和建筑物體敏感。最后基于6景哨兵2號影像選取的原始光譜波段和植被指數(shù)的特征組合作為非監(jiān)督分類的分類特征。

2 研究方法

分層抽樣方法在一定程度上可提高抽樣效率，它是將總體劃分為不同層，以增加某一類總體的代表性。以數(shù)據(jù)為驅動力的非監(jiān)督聚類算法可以根據(jù)數(shù)據(jù)本身特征，將數(shù)據(jù)劃分為不同的聚類簇。本研究在沒有可直接使用的當季作物分布數(shù)據(jù)前提下，將預處理后的待分類遙感影像和提取到的分類特征作為先驗知識引入抽樣底圖設計，通過影像特征聚類的方法構造分層抽樣底圖，以減輕抽樣設計工作量并提高遙感作物分類的效率，圖2所示主要步驟包括：1）基于已有先驗知識，采用非監(jiān)督聚類算法和手肘法實現(xiàn)研究區(qū)的空間最優(yōu)分層，并生成最佳抽樣底圖。2）給定總樣本量后，在同一分層抽樣底圖上為每種樣本分配方式創(chuàng)建了200個具有相同大小的不同樣本布設方案，以避免層內隨機抽樣的偏差。3）使用同一個監(jiān)督分類器對每個抽樣策略的200個樣本布設方案所獲樣本點進行訓練，并建立不同抽樣策略與同一套驗證地面樣本點的各精度評價指標對應關系，以探究實際總樣本量和理論總樣本量之間的關聯(lián)，并對樣本質量進行評價。

圖2 基于遙感影像的地面樣本點布設框架圖

2.1 分層抽樣底圖生成方法

一般來說，分層數(shù)目越多，層內差異越小，但分層層數(shù)過多會形成層數(shù)冗余。為得到最佳分層層數(shù)及其對應的最佳抽樣底圖，本研究基于-means聚類分析的數(shù)據(jù)驅動方法，利用光譜波段值和植被指數(shù)創(chuàng)建了聚類特征空間，在每輪聚類結束后，將誤差平方和數(shù)值作為反饋，形成“-means算法聚類-計算誤差平方和-修改聚類數(shù)值”的閉環(huán)，直至值達到最大取值范圍停止，其中，通過手肘法判定的最優(yōu)值為聚類類別數(shù)，利用最優(yōu)值聚類生成的原始土地覆蓋簇來構造抽樣最佳抽樣底圖。此時，最優(yōu)值對應的聚類類別數(shù)被認為是最優(yōu)層數(shù)，每一個像素所屬的聚類類別即為分層抽樣中的所屬層。

2.1.1 構造分層抽樣底圖

對于沒有類別標簽的數(shù)據(jù)，可以通過無監(jiān)督聚類算法將數(shù)據(jù)劃分為不同的簇[22]。-means算法[32]算法思想簡單，在對大規(guī)模數(shù)據(jù)集進行聚類分析時聚類效果較好且收斂速度較快，通常以歐式距離作為衡量數(shù)據(jù)對象間相似度的指標，相似度與數(shù)據(jù)對象間的距離成反比，即對象間距離越小，則相似度越大。在遙感分類中，種植同種作物的區(qū)域表現(xiàn)出高空間相關性，種植不同作物的兩個相鄰區(qū)域表現(xiàn)出高空間異質性。本研究基于哨兵2號提取的78個光譜特征和植被指數(shù)特征，采用-means聚類的方式獲得分層抽樣底圖，其中聚類類別數(shù)量為地層數(shù)量，每一類簇所含的像元為每層的對象。

2.1.2 確定分層層數(shù)

根據(jù)聚類性能評估方法，誤差平方和代表該聚類中心對于所有在該類中的數(shù)據(jù)的偏差程度，通常該值越小代表聚類效果越好[33]。手肘法利用誤差平方和與值的關系圖來確定最優(yōu)值[34]，該算法的核心思想是隨著聚類數(shù)值不斷增大，每個分組（簇）的聚合程度會不斷地提高，誤差平方和逐漸減?。寒斨敌∮谡鎸嵕垲悢?shù)時，隨著值的增大，誤差平方和值的變化比較大，關系圖顯示兩點之間的連線會比較陡峭；當大于真實聚類數(shù)時，隨著值的增大，誤差平方和值的變化較小，關系圖顯示兩點之間的連線會比較平緩。因此，可以在二維平面直角坐標系中作兩者間曲線并尋找斜率變化率最大時的拐點來確定最佳值[35]，誤差平方和S計算式如下：

式中C是第個簇，是C中的樣本點特征，m是C的質心（C中所有樣本點的均值）。

2.2 總樣本量和層內樣本分配方式

理論上，樣本量越大，遙感影像的分類精度越高，但樣本大小往往受收集樣本數(shù)據(jù)的資源經濟成本限制。已有研究將抽樣理論公式應用于遙感分類精度評價中，并將此評價樣本點作為新的訓練樣本點去訓練分類器[2]。

針對簡單隨機抽樣的預期總體精度根據(jù)COCHRAN[36]方法計算：

式中為總樣本量；是預期總體精度；是置信區(qū)間的期望半寬度；是標準正態(tài)分布的百分位。

為了方便與不同抽樣策略進行對照試驗，實際總樣本量取決于對照試驗中系統(tǒng)抽樣法的總樣本量，以理論總樣本量作為參考值，來探討實際總樣本量、理論總樣本量和總體精度之間的關系。

確定總樣本量后，分別采用兩種層內樣本分配方式進行對比試驗：1）面積比分配方式，即將總樣本點數(shù)量按各層層像元面積比例分配得到各層的樣本點數(shù)量；2）等量分配方式，即將總樣本點數(shù)量平均分配到各層中，使各層分配得到樣本點數(shù)量相同。

對于每一層，采用簡單隨機抽樣的方法來獲取每一目標類別的樣本點，這不僅最大限度的保障樣本點間類別均衡，還保障了類內每一點被抽取的概率相等。樣本點真實地類屬性通過目視解譯的方式確定。

2.3 遙感影像分類及其精度評價

支持向量機（support vector machine，SVM）在解決小樣本的非線性分類中有特別的優(yōu)勢[37]。因此，將分層樣本集作為訓練樣本集，將每個樣本對應的分類特征輸入到SVM分類器進行監(jiān)督分類，并輸出監(jiān)督分類結果圖。

本研究使用獨立于訓練樣本集的真實地面樣本集，通過混淆矩陣計算作物識別總體精度（overall accuracy，OA）、不同作物的制圖精度（producer accuracy，PA）和用戶精度（user accuracy，UA）[2]，用于對抽樣策略效率進行定量評價，并分析總樣本量和層內樣本分配方式對分類結果產生的影響。

2.4 樣本質量評價

樣本點質量對作物分類精度起積極作用。代表性可以衡量訓練樣本點集能否很好地反映全局其余數(shù)據(jù)的特征，具體指樣本點在光譜空間中對其他待分類像素點的反映程度。本研究采用MOUNTRAKIS等[38]提出的基于訓練集信息密度計算樣本集內任一樣本點的代表性值C的計算方法。該方法已被WALDNER等[39]在農田制圖采樣研究中證實了分類精度與樣本數(shù)據(jù)集的總體代表性值global之間是正向線性關系。本研究以代表性值來對樣本集進行質量評價，為了在獨立于任何分類情景下量化每種抽樣策略所獲樣本集總體代表性值global，將樣本集內所有樣本點的代表性值C求和取平均。

3 結果與分析

3.1 最佳分層抽樣底圖

將預處理后遙感影像內的所有像元作為輸入，將取值范圍（2～10）作為循環(huán)條件，對每個值進行聚類分析并繪制和誤差平方和及二者間斜率變化率關系圖。從圖3可以看出，隨著的增加，誤差平方和呈下降趨勢，但是肘部并不明顯，故通過斜率變化率來定量判斷拐點肘部值。發(fā)現(xiàn)第一肘部對應的值為4，第二肘部對應的值為7。

圖3 聚類中心個數(shù)k值對應分析結果

不同類型地物的光譜反射時序曲線特征不同。非植被地表的居民地道路裸地及河流湖泊的NDVI數(shù)值往往常年低于0.3；林草類植被由于沒有人工干預收割，全年的NDVI時序曲線呈平穩(wěn)的上升和下降；一年一熟制作物地類通常在3—5月份播種，NDVI時序曲線在6 —9月有比較高的數(shù)值，隨后在人工收割的干預下，NDVI數(shù)值會出現(xiàn)驟降。

第一肘部和第二肘部不同聚類類別的NDVI時序變化圖見圖4，從圖4a可以看出，第一肘部僅有兩個聚類類別的NDVI曲線呈作物生長曲線，另外兩類為非作物類型NDVI曲線；圖4b則表明第二肘部有5個聚類類別的NDVI曲線呈作物生長曲線，另外兩類為非作物類型NDVI曲線。因此，為了避免因聚類數(shù)過少或因引入的耕地數(shù)據(jù)精度誤差而導致部分特征不突出的作物被漏分，不選擇第一肘部，而是選取第二個肘部對應值的聚類結果作為最佳層數(shù)。

3.2 樣本點數(shù)量

根據(jù)式（2）可得，在置信水平為90%、取置信區(qū)間期望半寬度為0.05時，計算簡單隨機抽樣預期總體精度為0.85時的理論總樣本量為139。

圖4 第一肘部（k=4）和第二肘部（k=7）不同聚類類別的NDVI時序變化圖

將本研究方法和系統(tǒng)抽樣法、簡單隨機抽樣法的分類精度做對比，實際的總樣本量由系統(tǒng)抽樣法的5×5、7×7、10×10、13×13和15×15個格網點確定，分別為25、49、100、169和225。相應的，按面積比分配和等量分配方式分別得到的層樣本量見表1。可以看出，而當總樣本量為25時，面積占比最小的第七層所按面積比分配到的樣本點數(shù)量為1，第四層至第六層按面積比所分配到的樣本點數(shù)量為2，層間樣本數(shù)量具有明顯的不均衡性，進而影響了分類效果和樣本點獲取質量。

3.3 遙感影像作物分類結果及其精度評價

3.3.1 遙感影像作物分類結果圖

根據(jù)實地調查經驗，人工選取400個樣本點得到傳統(tǒng)方式的分類精度，其中訓練樣本點和驗證樣本點的比例為8：2（總體精度：97.5%；kappa系數(shù)：0.96）。在研究區(qū)內選擇一個地塊較為破碎的局部地區(qū)以更好地對比不同抽樣策略的分類效果，傳統(tǒng)方式的整體及局部地區(qū)的分類結果見圖5。

表1 分層抽樣層內樣本分配方式

注：按面積比分配方式中1～7層面積占比分別為0.35、0.26、0.11、0.09、0.08、0.06、0.05。

Note: Area ratios of stratum 1-7 are 0.35, 0.26, 0.11, 0.09, 0.08, 0.06, 0.05 in area-ratio sample allocation, respectively.

將本研究方法和系統(tǒng)抽樣法、簡單隨機抽樣法的分類精度做對比。除已經固定樣本點位置的系統(tǒng)抽樣法外，記錄每個抽樣策略的200個樣本布設方案所獲樣本點，并繪制各抽樣策略能達到最高分類精度的局部地區(qū)分類結果見圖6。

圖5 傳統(tǒng)方式分類結果

從圖6可以看出，除了總樣本量為25的系統(tǒng)抽樣法，其他抽樣策略在最高精度時均能明顯識別出玉米、水稻和大豆類，不同抽樣策略之間的差距主要體現(xiàn)在大豆類的識別上。當總樣本量小于100時，等量分層抽樣法能識別出局部地區(qū)內分布破碎的大豆類，而簡單隨機抽樣和按面積比分層抽樣法則僅識別出種植規(guī)模較大、分布較集中的大豆田塊；當總樣本量大于等于100時，除系統(tǒng)抽樣法外的3種抽樣方法能達到的最高分類精度均十分接近傳統(tǒng)方式的分類精度。

注：圖中n為總樣本數(shù)量。圖6范圍為圖5中的局部放大圖。

為了定量反映不同抽樣策略的分類精度及其穩(wěn)定性，每個抽樣策略樣本布設方案的總體精度箱線圖見圖 7?？梢钥闯觯S著總樣本量越多，3種抽樣方法的平均分類精度依次遞增，分類精度平均值和中位數(shù)之間的差距越小，上下邊緣之間的差距也越來越小，這表明隨著總樣本量增加，不同抽樣方法的抽樣效率和穩(wěn)定性增加，方法間的差異性減小。等量分層抽樣法的箱體較短，分類精度中位數(shù)較高，表示總體精度分布較為集中且都處于較高的精度水平上，當理論樣本量為139時，總樣本量為25、49和100時等量分層抽樣法的分類精度均值（75.5%、80.5%和86.0%）均明顯高于按面積比分層抽樣法的分類精度均值（48.4%、69.0%和83.0%），按面積比分層抽樣法和簡單隨機抽樣法在總樣本量為25和49時的箱體較長，分類精度中位數(shù)出現(xiàn)偏態(tài)現(xiàn)象且都偏向下四分位數(shù)，異常值較多，表示總體精度分布不均勻且數(shù)值較低。因此，增加總樣本量對總體精度的提高是起積極作用但影響有限的，本研究在總樣本量達到169時開始趨于穩(wěn)定。相比之下，不同抽樣策略對總體精度的影響更大。

圖7 各抽樣策略作物分類總體精度評價

Fig7 Crop classification overall accuracy assessment of each sampling method

做精度85.0%和97.5%的水平線與各抽樣策略的平均分類精度的連線相交。記錄精度為85.0%時水平線相交縱坐標對應的總樣本量分別為152、138和96，是簡單隨機抽樣理論總樣本量139的109.4%、99.3%和69.1%；記錄精度為97.5%水平線相交縱坐標對應的總樣本量分別為438、418和374，是傳統(tǒng)人工選取方法樣本量400的109.5%、104.5%、93.5%。

3.3.2 各作物類用戶精度和制圖精度

為了探究分層抽樣樣本分配方式對總體精度的影響，各抽樣策略單一作物類別的用戶精度（UA）、制圖精度（PA）、用戶精度方差（UA）和制圖精度方差（PA）見表2?？梢钥闯霾徽摽倶颖玖繛槎嗌?，簡單隨機抽樣法的水稻類的UA和PA小于0.08、UA和PA均值小于20.0%，等量分層抽樣法UA和PA均值均大于85.0%，UA和PA小于0.05，說明簡單隨機抽樣法的水稻分類效果總是很差，等量分層抽樣法的水稻分類效果表現(xiàn)優(yōu)異，當總樣本量小于100時，按面積比分層抽樣法的UA和PA均值較低，UA和PA較大，而當總樣本量增至100時，UA和PA均值超過90.0%，UA和PA小于0.01，這表明當水稻獲取足夠樣本量時，就能有較高分類精度；不論總樣本量為多少，簡單隨機抽樣法的大豆分類效果均好于分層抽樣法，其中，在總樣本量少于等于100時，兩種分層抽樣法的UA和PA均值都低于70.0%，UA和PA較大，而當總樣本量增長至100時，等量分層抽樣法的大豆類精度和穩(wěn)定性顯著提高，至169時，按面積比分層抽樣法的大豆類精度和穩(wěn)定性顯著提高并與等量分層抽樣法相當，說明獲得的樣本點數(shù)量和分類特征都是影響大豆分類精度的重要原因；隨總樣本量增長，3種抽樣方法的玉米類UA和PA增長趨勢一致，兩種分層抽樣法的UA和PA幾乎都小于0.05，簡單隨機抽樣法的UA和PA幾乎都大于0.05，說明分層抽樣法的分類效果較簡單隨機抽樣更為穩(wěn)定，且層內樣本分配方式對玉米類的分類效果影響較弱。

表2 各抽樣策略單一作物類別精度評價

注：PA、UA 分別代表制圖精度、用戶精度。UAPA分別代表PA、UA方差。

Note: PA and UA represent the producer's accuracy and the user's accuracy.UAandPArepresent the variance of UA and the variance of PA.

結合3種作物類的分類結果，可以得到簡單隨機抽樣法在3種作物分類效果上表現(xiàn)不穩(wěn)定，且影響總體精度的主要因素是水稻和大豆被分配的樣本量：等量分層抽樣法能夠使研究區(qū)內面積占比較小的類別獲得足夠的數(shù)量，而當總樣本量足夠多時，兩種分層抽樣法的差異并不明顯。

3.4 各抽樣方法所獲樣本點質量評價

以總樣本量為225的等量分層抽樣法為例，針對200個樣本布設方案的單一作物類型，以全部代表性值Cglobal為自變量，以對應制圖精度PA為因變量建立線性回歸模型結果見表3。從表中可以看出，global與PA之間的正向關系與已有研究的結論一致[38-39]：3個線性回歸模型的回歸系數(shù)大于0，值在0.05水平上顯著，決定系數(shù)R偏低，這是因為一次抽樣可能得到如高代表性玉米與低代表性水稻、大豆的樣本點組合，從而影響了單一作物類別的制圖精度。

表3 單一作物類型代表值與制圖精度的回歸分析結果

樣本點代表性與樣本點數(shù)量和特征有關，由于每個布設方案的同一類別樣本點數(shù)量均不同，對每個作物類型的global取平均值，通過均值代表性mean比較各抽樣方法的樣本獲取整體效果，結果見表4。從表4可以看出，在實際采樣過程中采集到的其他類樣本點由于其真實地類型復雜，mean小于0；不論總樣本量為多少，等量分層抽樣法大豆類和玉米類的mean一直處于較高水平，說明等量分層抽樣法的大豆和玉米樣本點質量較好，其次是按面積比分層抽樣法，且不同抽樣方法的樣本點mean差距隨實際總樣本量的增加逐漸減小，與分類精度差距隨實際總樣本量增長而逐漸減小的趨勢一致；隨總樣本量的增加，所有類別的樣本點mean逐漸向0趨近，這可能是因為樣本量的增大提高了樣本點的多樣性，降低了單個樣本點的代表性C，從而降低了樣本點集的global；對于面積占比很小的水稻地類，global計算受樣本點數(shù)量影響較大：當實際樣本量非常小時，3種抽樣方法只能獲得極個別甚至沒有水稻樣本點，難以計算mean，而不論總樣本量多少，隨機抽樣獲得的水稻樣本點均遠小于其他兩種分層抽樣方法，導致該水稻樣本點集的多樣性小，隨機抽樣法的mean比分層抽樣法高，等量分層抽樣法的mean高于按面積比分層抽樣法的mean。

表4 各抽樣策略的單一作物類別均值代表性Cmean

4 討論

本研究以開原市的一個典型農區(qū)試驗區(qū)為例，分析遙感影像數(shù)據(jù)本身特征，利用聚類算法和手肘法確定分層層數(shù)，獲得能反映不均勻數(shù)據(jù)分布的抽樣底圖以科學指導樣本點的采集。

數(shù)據(jù)驅動生成的抽樣底圖可以通過提高樣本點類內代表性來提高分類精度。由于作物種植區(qū)域、生長狀態(tài)不統(tǒng)一及遙感信息的不確定性，遙感影像上的“同物異譜”的現(xiàn)象反映在分層抽樣底圖中就是一個作物類別對應多個地層。通過分析遙感影像數(shù)據(jù)本身特征，聚類生成的抽樣底圖將總體劃分為不同類別，該底圖能反映類別的真實分布情況，減少分類特征和空間混淆。相比于簡單隨機和系統(tǒng)抽樣，在每個地層內抽取一定數(shù)量的樣本點能最大限度地保障樣本點類內多樣性，提高分類效率。

在生成抽樣底圖的基礎上，不同分層抽樣樣本分配方式對類間均衡性產生不同的影響，進一步影響了分類效率。多數(shù)分類研究會按面積比例獲取訓練樣本點[40]。然而在少樣本時，稀少類會因其極低的占比而缺乏足夠的樣本點，這可能會出現(xiàn)總體精度較高而稀少類分類精度較低的情況。等量分配樣本點數(shù)量能增加每個面積占比較小類別的樣本量，使分布破碎且占比較少的作物類別在分類中得到更多的信息，增加類間的均衡性，通過提高面積占比較小類別的精度以獲取較高總體精度；隨著總樣本量增大，每個類別提取了更豐富的信息，不同樣本分配方式之間的差異變小，此時所有抽樣方法都具有可比性。由于增加樣本量對分類精度提高是有限的，基于此，在確定抽樣底圖后，有必要根據(jù)總樣本量和聚類類別占比去權衡樣本分配方式。

分類精度誤差來源通常包括使用的分類器性能、驗證數(shù)據(jù)集、訓練樣本點質量等。研究結論是在使用SVM分類器的基礎上得出的，為探究研究結論在不同分類器之間是否具有普適性，僅將SVM分類器更改為隨機森林（forest random，RF）分類器，以相同的步驟進行新一輪試驗并作箱線圖見圖8，可看出改變分類器后的總體分類精度和穩(wěn)定性隨總樣本量增加而增加，呈現(xiàn)出與使用SVM分類器相同的變化趨勢；驗證樣本點受實際采集條件制約，大多分布在道路兩側，根據(jù)這些樣本點驗證得到的分類精度可能與真實分類精度有偏差；除樣本點的特征，樣本點代表性還與樣本點數(shù)量有關，本研究是在特定總樣本量下去計算不同作物類型的代表性，每個樣本布設方案采集到的各類型作物樣本點數(shù)量均不相同，雖然研究使用的是均值代表性，但該步驟仍可能存在偏差。基于此，在評估多種抽樣方法樣本量和分類精度間關系的研究基礎上，未來還可嘗試評估樣本點代表性和分類精度、類別代表性和對應樣本量之間的關系。

在作物制圖應用中，實際野外調查往往還要考慮通行成本和道路交通可達性等問題，沿道路收集訓練數(shù)據(jù)是一種常見的方式。然而，路邊隨機抽樣會降低了研究區(qū)的空間探索水平，對樣本點代表性的需求更高，已有研究證明未分層的傳統(tǒng)路邊采集方式的分類精度和穩(wěn)定性均低于全局隨機抽樣方式[39]?；诖耍磥硌芯靠梢蕴骄恳敕謱映闃拥讏D對路邊抽樣策略分類效率的影響，并制定一個科學樣本點采集路線。

圖8 基于隨機森林分類器的各抽樣策略作物分類精度評價

5 結論

數(shù)據(jù)驅動方法重在數(shù)據(jù)挖掘，通過監(jiān)督與非監(jiān)督機器學習等方法自動學習數(shù)據(jù)的參數(shù)特征，進而實現(xiàn)對遙感影像數(shù)據(jù)的信息提取。為證明在沒有可直接使用的當季作物分布數(shù)據(jù)前提下，遙感影像數(shù)據(jù)驅動生成的抽樣底圖能科學指導抽樣設計，本研究通過遙感技術、非監(jiān)督聚類算法與經典抽樣方法相結合，在同一個-means聚類最優(yōu)值對應的聚類結果圖上，設計等量分配和按面積比分配2種樣本量分配方式，樣本點數(shù)量為25、49、100、169、225的5個總樣本量，結合與139個樣本點的理論總樣本量和400個樣本點的傳統(tǒng)方式總樣本量對研究區(qū)作物分類的分類精度和抽樣效率進行了對比分析，結果表明：

1）在數(shù)據(jù)驅動非監(jiān)督聚類生成的底圖上進行抽樣（按面積比分層抽樣法、等量分層抽樣法）獲得的樣本點質量和分類精度明顯優(yōu)于沒有該底圖的抽樣策略（簡單隨機抽樣法、系統(tǒng)抽樣法）。

2）當總樣本量低于理論總樣本量時，等量分層抽樣法能獲取比按面積比分層抽樣法更高的分類精度。例如，當理論樣本量為139時，總樣本量為25、49和100時等量分層抽樣法的分類精度均值（75.5%、80.5%和86.0%）均明顯高于按面積比分層抽樣法的分類精度均值（48.4%、69.0%和83.0%），而當總樣本量為169和225時，兩種分層方式的分類精度均值都在90.0%左右。

3）當滿足總體精度需求時，分層抽樣法所需的實際總樣本量小于理論樣本量，例如，等量分層抽樣法的實際樣本量為其理論樣本量的69.1%時可滿足85.0%總體精度需求；當分類精度與人工選取方式分類精度一樣時（97.5%），等量分層抽樣法的實際樣本量為傳統(tǒng)方式的93.5%。研究結果印證了分類精度及穩(wěn)定性隨著總樣本量的增加而增加這一普遍認識，但當總樣本量超過一定值時，精度增長速度變慢。

總之，本研究構建數(shù)據(jù)驅動的樣本點布設方法體系，可以通過“事前優(yōu)化”科學獲取類間均衡、類內多樣化的樣本點，進而提高分類精度與效率，為農作物遙感地面樣本點布設、快速高效分類等提供參考。

[1] STEHMAN S, FOODY G. Key issues in rigorous accuracy assessment of land cover products[J]. Remote Sensing of Environment, 2019, 231: 111199.

[2] OLOFSSON, P, FOODY, G, HEROLD, M, et al. Good practices for estimating area and assessing accuracy of land change[J]. Remote Sensing of Environment, 2014, 148: 42-57.

[3] ZHANG C, DI L P, HAO P, et al. Rapid in-season mapping of corn and soybeans using machine-learned trusted pixels from Cropland Data Layer[J]. International Journal of Applied Earth Observation and Geoinformation, 2021, 102: 102374.

[4] 馮權瀧，陳泊安，李國慶，等. 遙感影像樣本數(shù)據(jù)集研究綜述[J]. 遙感學報，2022，26(4)：589-605. FENG Quanlong, CHEN Boan, LI Guoqing, et al. A review for sample datasets of remotesensing imagery[J]. National Remote Sensing Bulletin, 2022, 26(4): 589-605. (in Chinese with English abstract)

[5] EBRAHIMY H, MIRBAGHERI B, MATKAN A, et al. Per-pixel land cover accuracy prediction: A random forest-based method with limited reference sample data[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2021, 172: 17-27.

[6] GE S, ZHANG J, PAN Y, et al. Transferable deep learning model based on the phenological matching principle for mapping crop extent[J]. International Journal of Applied Earth Observation and Geoinformation, 2021, 102: 102451.

[7] WANG S, AZZARI G, LOBELL D. Crop type mapping without field-level labels: Random forest transfer and unsupervised clustering techniques[J]. Remote Sensing of Environment, 2019, 222: 303-317.

[8] WICKHAM J, STEHMAN S, SORENSON D, et al. Thematic accuracy assessment of the NLCD 2016 land cover for the conterminous United States[J]. Remote Sensing of Environment, 2021, 257: 112357.

[9] 馮權瀧，牛博文，朱德海，等. 土地利用/覆被深度學習遙感分類研究綜述[J]. 農業(yè)機械學報，2022，53(3)：1-17. FENG Quanlong, NIU Bowen, ZHU Dehai, et al. Review for deep learning in land use and land cover remote sensing classification[J]. Transactions of the Chinese Society for Agricultural Machinery, 2022, 53(3): 1-17. (in Chinese with English abstract)

[10] 任旭紅，潘瑜春，高秉博，等. 類別輔助變量參與下的土壤無偏采樣布局優(yōu)化方法[J]. 農業(yè)工程學報，2014，30(21)：120-128. REN Xuhong, PAN Yuchun, GAO Bingbo, et al. Optimization method of unbiased soil sampling and layout using categorical auxiliary variables information[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE),2014, 30(21): 120-128. (in Chinese with English abstract)

[11] 厲芳婷，張過，石婷婷，等. 耕地“非農化”遙感解譯樣本分類體系及應用[J]. 農業(yè)工程學報，2022，38(15)：297-304. LI Fangting, ZHANG Guo, SHI Tingting, et al. Classification system and application of remote sensing interpretation samples of cultivated land non-agriculturalization[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(15): 297-304. (in Chinese with English abstract)

[12] 李若溪，周翔，呂婷婷，等. 植被異質性樣區(qū)真實性檢驗的優(yōu)化采樣策略[J]. 農業(yè)工程學報，2021，37(8)：177-186. LI Ruoxi, ZHOU Xiang, Lyu Tingting, et al. Optimal sampling strategy for authenticity test in heterogeneous vegetated areas[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(8): 177-186. (in Chinese with English abstract)

[13] 譚建光，張錦水，高晨雪，等. 基于結構規(guī)模的冬小麥種植面積遙感抽樣估算[J]. 農業(yè)工程學報，2012，28(23)：114-122. TAN Jianguang, ZHANG Jinshui, GAO Chenxue, et al. Winter wheat area estimation based on structure and scale using remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(23): 114-122. (in Chinese with English abstract)

[14] 吳金勝，劉紅利，張錦水. 無人機遙感影像面向對象分類方法估算市域水稻面積[J]. 農業(yè)工程學報，2018，34(1)：70-77. WU Jinsheng, LIU Hongli, ZHANG Jinshui. Paddy planting acreage estimation in city level based on UAV images and object-oriented classification method[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(1): 70-77. (in Chinese with English abstract)

[15] 王迪，仲格吉，張影，等. 空間自相關性對冬小麥種植面積空間抽樣效率的影響[J]. 農業(yè)工程學報，2021，37(3)：188-197. WANG Di, ZHONG Geji, ZHANG Ying, et al. Effects of spatial autocorrelation on spatial sampling efficiencies of winter wheat planting areas[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(3): 188-197. (in Chinese with English abstract)

[16] WICKHAM J, STEHMAN S, GASS L, et al. Thematic accuracy assessment of the 2011 National Land Cover Database (NLCD)[J]. Remote Sensing of Environment, 2017, 191: 328-341.

[17] YOU N, DONG J, HUANG J, et al. The 10-m crop type maps in Northeast China during 2017–2019[J]. Scientific Data, 2021, 8(1): 1-11.

[18] LIANG S, WU W, SUN J, et al. Climate-mediated dynamics of the northern limit of paddy rice in China[J]. Environmental Research Letters, 2021, 16(6): 64008.

[19] FOODY G, MATHUR A. Toward intelligent training of supervised image classifications: Directing training data acquisition for SVM classification[J]. Remote Sensing of Environment, 2004, 93(1/2): 107-117.

[20] 曹志冬，王勁峰，李連發(fā)，等. 地理空間中不同分層抽樣方式的分層效率與優(yōu)化策略[J]. 地理科學進展，2008，27(3)：152-160. CAO Zhidong, WANG Jinfeng, LI Lianfa, et al. Strata efficiency and optimization strategy of stratified sampling on spatial population[J]. Progress in Geography, 2008, 27(3): 152-160. (in Chinese with English abstract)

[21] 楊倩倩，靳才溢，李同文，等. 數(shù)據(jù)驅動的定量遙感研究進展與挑戰(zhàn)[J]. 遙感學報，2022，26(2)：268-285. YANG Qianqian, JIN Caiyi, LI Tongwen, et al. Research progress and challenges of data-driven quantitative remote sensing[J]. National Remote Sensing Bulletin, 2022, 26(2): 268-285. (in Chinese with English abstract)

[22] 代浩，金銘，陳星，等. 數(shù)據(jù)驅動的應用自適應技術綜述[J]. 計算機研究與發(fā)展，2022，59(11)：2549-2568. DAI Hao, JIN Ming, Chen Xing, et al. Survey of data-driven application self-adaptive technology[J]. Journal of Computer Research and Development, 2022, 59(11): 2549-2568. (in Chinese with English abstract)

[23] BORYAN C, YANG Z, WILLIS P, et al. Developing crop specific area frame stratifications based on geospatial crop frequency and cultivation data layers[J]. Journal of Integrative Agriculture, 2017, 16(2): 312-323.

[24] CHEN J, CHEN L, CHEN F, et al. Collaborative validation of GlobeLand30: Methodology and practices[J]. Geo-spatial Information Science, 2021, 24(1): 134-144.

[25] 陳逸聰，邵華，李楊. 多源土地覆被產品在長三角地區(qū)的一致性分析與精度評價[J]. 農業(yè)工程學報，2021，37(6)：142-150. CHEN Yicong, SHAO Hua, LI Yang. Consistency analysis and accuracy assessment of multi-source land cover products in the Yangtze River Delta[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(6): 142-150. (in Chinese with English abstract)

[26] Gorelick N, Hancher M, Dixon M, et al. Google Earth Engine: Planetary-scale geospatial analysis for everyone[J]. Remote Sensing of Environment, 2017, 202(12):18-27.

[27] 劉園，蔡澤江，余強毅，等. 從作物輪作角度評價華南典型赤紅壤農區(qū)耕地質量空間差異[J]. 農業(yè)資源與環(huán)境學報，2021，38(6)：1051-1063. LIU Yuan, CAI Zejiang, YU Qiangyi, et al. Spatial variation evaluation of cultivated land quality from the perspective of crop rotation for a typical lateritic red soil farming area in South China[J]. Journal of Agricultural Resources and Environment, 2021, 38(6): 1051-1063. (in Chinese with English abstract)

[28] ZHAO Y, POTGIETER A, ZHANG M, et al. Predicting wheat yield at the field scale by combining high-resolution Sentinel-2 satellite imagery and crop modelling[J]. Remote Sensing, 2020, 12(6): 1024.

[29] DEVENTER V, WARD A, GOWDA P, et al. Using thematic mapper data to identify contrasting soil plains and tillage practices[J]. Photogrammetric Engineering and Remote Sensing, 1997, 63: 87-93.

[30] MCFEETERS S. The use of the Normalized Difference Water Index (NDWI) in the delineation of open water features[J]. International Journal of Remote Sensing, 1996, 17(7): 1425-1432.

[31] 查勇，倪紹祥，楊山. 一種利用TM圖像自動提取城鎮(zhèn)用地信息的有效方法[J]. 遙感學報，2003，7(1)：37-40. ZHA Yong, NI Shaoxiang, YANG Shan. An effective approach to automatically extract urban land-use from TM imagery[J]. National Remote Sensing Bulletin, 2003, 7(1): 37-40. (in Chinese with English abstract)

[32] ANCHANG J, ANANGA E, PU R. An efficient unsupervised index based approach for mapping urban vegetation from IKONOS imagery[J]. International Journal of Applied Earth Observation and Geoinformation, 2016, 50: 211-220.

[33] 王洋，丁志剛，鄭樹泉，等. 一種用戶畫像系統(tǒng)的設計與實現(xiàn)[J]. 計算機應用與軟件，2018，35(3)：8-14. WANG Yang, DING Zhigang, ZHENG Shuquan, et al. Design and implementation of a user portrait system[J]. Computer Applications and Software, 2018, 35(3): 8-14. (in Chinese with English abstract)

[34] 王建仁，馬鑫，段剛龍. 改進的k-means聚類k值選擇算法[J]. 計算機工程與應用，2019，55(8)：27-33. WANG Jianren, MA Xin, DUAN Ganglong. Improved k-means clustering k-value selection algorithm[J]. Computer Engineering and Applications, 2019, 55(8): 27-33. (in Chinese with English abstract)

[35] 姬鵬飛，孟偉娜，楊北方，等. 基于改進BP神經網絡的農業(yè)機械數(shù)據(jù)預測研究[J]. 中國農機化學報，2020，41(2)：200-205. JI Pengfei, MENG Weina, YANG Beifang, et al. Research on prediction of the number of agricultural machinery data based on an improving method of BP neural network[J]. Journal of Chinese Agricultural Mechanization, 2020, 41(2): 200-205. (in Chinese with English abstract)

[36] COCHRAN W．Sampling Techniques (3rd ed. )[M]. New York: John Wiley & Sons, 1977.

[37] CORTES C, VAPNIK V. Support-Vector Networks. [J]. Machine Learning, 1995, 20(3): 273-297.

[38] MOUNTRAKIS G, Xi B. Assessing reference dataset representativeness through confidence metrics based on information density[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2013, 78: 129-147.

[39] WALDNER F, BELLEMANS N, HOCHMAN Z, et al. Roadside collection of training data for cropland mapping is viable when environmental and management gradients are surveyed[J]. International Journal of Applied Earth Observation and Geoinformation, 2019, 80: 82-93.

[40] NDAO B, LEROUX L, GAETANO R, et al. Landscape heterogeneity analysis using geospatial techniques and a priori knowledge in Sahelian agroforestry systems of Senegal[J]. Ecological Indicators, 2021, 125: 107481.

Data-driven field sample location approach for crop classification using remote sensing

WU Qingying, YU Qiangyi※, DUAN Yulin, WU Wenbin

(,,,100081,)

The field sample points can be directly input into the crop classification models using remote sensing. Therefore, the quantities and quality of sample points can dominate both the classification accuracy and mapping. In this study, a data-driven approach was established for sampling strategies using the features of spectral bands and vegetation indices from image classification. A field sample points approach was carried out to combine a few stratified random sampling, and then followed by the multiple evaluation metrics, according to the dependence of the crop remote sensing classification upon the varied sampling. A data-driven approach based on-means unsupervised clustering was used to generate a graph of clustering with the same optimal, considering 78 classification features extracted from the 6-phase Sentinel-2 images. The comparison experiments consisted of two intra-stratified sample allocation strategies with equal and area-ratio sample allocation, five total sample sizes of 25, 49, 100, 169 and 225, one theoretical total sample size of 139 and one traditional method of total sample size of 400. The accuracy of the mapping was also evaluated by the Support Vector Machine (SVM) classification model. The experimental results showed: 1) Sampling on the data-driven basemap generated by unsupervised clustering (area-ratio, and equal stratified sampling) obtained the better quality sample dataset, which was significantly higher classification accuracy than that without the basemap (simple random, and systematic sampling); 2) In cases where the total sample size was less than the theoretical total sample size, the equal stratified sampling performed better than the area-ratio stratified sampling. For example, when theoretical sample size was 139, mean accuracies of classification with the equal stratified sampling method (75.5%, 80.5% and 86.0%) at total sample sizes of 25, 49 and 100 was significantly higher than that with the area-ratio stratified sampling method (48.4%, 69.0% and 83.0%), while mean accuracies of classification with the two stratified methods at total sample sizes of 169 and 225 were all around 90.0%; 3) The actual total sample size by stratified sampling was smaller than the theoretical sample size, in order to fully meet the overall requirement of accuracy, indicating the great improvement in the sampling efficiency. For example, equal stratified sampling was required about one-seventh of the theoretical sample size to satisfy the overall accuracy requirement of 85.0%. The classification accuracy was equal to that of the manual selection (overall accuracy=97.5%), and the actual sample size of the equal stratified sampling was about one-ninth of the traditional one. Therefore, the classification accuracy and stability increased with the total sample size and then tended to saturate at the end, even if the sample size continued to increase. A well-balanced inter-class and diverse within-class sample set can be expected to obtain for an optical field sample distribution using crop remote sensing classification

agriculture; remote sensing; crop classification; sample point distribution; sampling basemap; cluster analysis

10.11975/j.issn.1002-6819.202210229

S127

1002-6819(2023)-06-0214-10

吳清瀅，余強毅，段玉林，等. 數(shù)據(jù)驅動的農作物遙感分類地面樣本點布設[J]. 農業(yè)工程學報，2023，39(6)：214-223.doi：10.11975/j.issn.1002-6819.202210229 http://www.tcsae.org

WU Qingying, YU Qiangyi, DUAN Yulin, et al. Data-driven field sample location approach for crop classification using remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2023, 39(6): 214-223. (in Chinese with English abstract) doi：10.11975/j.issn.1002-6819.202210229 http://www.tcsae.org

2022-10-27

2023-02-14

國家重點研發(fā)計劃項目（2019YFE0125300）；現(xiàn)代農業(yè)產業(yè)技術體系北京市數(shù)字農業(yè)創(chuàng)新團隊“數(shù)字大田應用場景建設”項目（BAIC10-2022-E06）

吳清瀅，研究方向為農業(yè)遙感。Email：wuqingying@caas.cn

余強毅，副研究員，研究方向為農業(yè)遙感。Email：yuqiangyi@caas.cn

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

數(shù)據(jù)驅動的農作物遙感分類地面樣本點布設

0 引 言

1 試驗區(qū)域及研究數(shù)據(jù)

1.1 試驗區(qū)域

1.2 數(shù)據(jù)來源及預處理

1.3 分類特征構建和提取

2 研究方法

2.1 分層抽樣底圖生成方法

2.2 總樣本量和層內樣本分配方式

2.3 遙感影像分類及其精度評價

2.4 樣本質量評價

3 結果與分析

3.1 最佳分層抽樣底圖

3.2 樣本點數(shù)量

3.3 遙感影像作物分類結果及其精度評價

3.4 各抽樣方法所獲樣本點質量評價

4 討 論

5 結 論

0 引言

4 討論

5 結論