仲格吉,周清波,王 迪
(農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)遙感重點(diǎn)實(shí)驗(yàn)室/中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)資源與農(nóng)業(yè)區(qū)劃研究所,北京 100081)
我國是農(nóng)業(yè)生產(chǎn)大國,糧食作物的播種面積、產(chǎn)量等信息更是國家制定糧食政策和經(jīng)濟(jì)計(jì)劃的重要依據(jù)。長期以來,我國耕地和農(nóng)作物播種面積等重要農(nóng)業(yè)統(tǒng)計(jì)數(shù)據(jù),主要采用村級(jí)起報(bào)、逐級(jí)匯總上報(bào)的全面統(tǒng)計(jì)(國家統(tǒng)計(jì)局農(nóng)調(diào)總隊(duì),2002;國家統(tǒng)計(jì)局社會(huì)調(diào)查司,2006)方法。在全國范圍內(nèi)開展全面調(diào)查方式統(tǒng)計(jì)作物種植面積,存在調(diào)查工作量龐大、財(cái)力和物力耗費(fèi)高及調(diào)查周期長等諸多缺點(diǎn)。抽樣技術(shù)作為一種非全面統(tǒng)計(jì)調(diào)查技術(shù),因具有節(jié)省調(diào)查費(fèi)用、縮短調(diào)查周期及改善調(diào)查數(shù)據(jù)質(zhì)量等優(yōu)點(diǎn)得以在社會(huì)經(jīng)濟(jì)調(diào)查中被廣泛使用。隨著“3S”技術(shù)的發(fā)展,傳統(tǒng)抽樣方法與“3S”技術(shù)相結(jié)合的空間抽樣方法逐漸被應(yīng)用到大區(qū)域農(nóng)作物面積的監(jiān)測(cè)、估計(jì)及耕地與森林變化監(jiān)測(cè)等領(lǐng)域中[1-3]。
近年來,國內(nèi)外學(xué)者在利用空間抽樣方法進(jìn)行農(nóng)作物面積估計(jì)方面進(jìn)行了相關(guān)研究[4-9],選用的抽樣方法包括分層抽樣、整群抽樣和多階段抽樣,涉及的農(nóng)作物類型主要有小麥、玉米、水稻及棉花。
盡管基于傳統(tǒng)抽樣方法與“3S”技術(shù)相結(jié)合的空間抽樣方法有效解決了全面統(tǒng)計(jì)調(diào)查中存在的問題,但是傳統(tǒng)抽樣方法是建立在研究純隨機(jī)變量變化規(guī)律的經(jīng)典統(tǒng)計(jì)學(xué)理論基礎(chǔ)上,要求抽樣單元間需滿足相互獨(dú)立原則[10-11]。農(nóng)作物由于受自然條件(氣候、土壤類型、地形地貌等)、社會(huì)經(jīng)濟(jì)等因素的影響,在空間分布上并不完全具有獨(dú)立性和隨機(jī)性,而是存在一定程度的空間自相關(guān)性。關(guān)于農(nóng)作物種植面積調(diào)查單元在空間分布上的自相關(guān)性對(duì)空間抽樣外推總體的效率(抽樣精度和抽樣費(fèi)用)是否有影響、影響程度及如何影響等一系列問題,目前國內(nèi)外的相關(guān)研究明顯不足,尚不能科學(xué)解釋當(dāng)抽樣單元存在空間自相關(guān)性時(shí),空間抽樣調(diào)查效率的變化特征與規(guī)律,從而影響了空間抽樣方法在國家尺度范圍內(nèi)的進(jìn)一步推廣與應(yīng)用。
針對(duì)以上存在的問題,本文從空間自相關(guān)性的科學(xué)內(nèi)涵、研究方法和基本特征出發(fā),對(duì)國內(nèi)外專家學(xué)者在空間自相關(guān)領(lǐng)域的研究進(jìn)展進(jìn)行了系統(tǒng)梳理,總結(jié)了國內(nèi)外關(guān)于空間自相關(guān)性的抽樣調(diào)查與空間自相關(guān)性對(duì)抽樣效率產(chǎn)生影響的研究進(jìn)展,討論了當(dāng)前我國農(nóng)作物面積空間抽樣調(diào)查中存在的問題,并從空間自相關(guān)性對(duì)農(nóng)作物面積空間抽樣調(diào)查的精度、成本、樣本布局和可能產(chǎn)生的影響等方面對(duì)農(nóng)作物空間抽樣的應(yīng)用前景進(jìn)行了總結(jié)與展望。
Tobler于1969年提出的描述地理現(xiàn)象空間作用關(guān)系的地理學(xué)第一定律指出,“任何事物都是空間相關(guān)的,距離近的事物空間相關(guān)性大”,即空間數(shù)據(jù)間存在自相關(guān)性[20]。區(qū)域化特征或者變量在臨近范圍內(nèi)的變化往往表現(xiàn)出對(duì)空間位置的依賴關(guān)系,即空間自相關(guān)性,因此進(jìn)行空間自相關(guān)分析的目的是確定某一變量與其相鄰空間單元的屬性是否在空間上具有相關(guān)性及其相關(guān)程度如何[21]。“相鄰”的定義,關(guān)系到空間權(quán)重矩陣的建立,權(quán)重的確定主要依據(jù)地理特征,如地區(qū)邊界和距離等,它可以根據(jù)多邊形鄰接標(biāo)準(zhǔn)或距離鄰接標(biāo)準(zhǔn)來度量[22-26],不同的研究者對(duì)于空間權(quán)重矩陣的構(gòu)建往往存在差異,所以得到的分析結(jié)果也不盡相同。確定“相鄰”的空間關(guān)系之后,進(jìn)行全局空間自相關(guān)分析,依此判斷整個(gè)區(qū)域是否存在空間自相關(guān)現(xiàn)象或聚集分布狀態(tài)[27-29]。
衡量事物間的空間自相關(guān)特性可根據(jù)不同的數(shù)據(jù)類型選擇不同的空間自相關(guān)指數(shù)定量表達(dá),常用的自相關(guān)指數(shù)有全局 Moran’sI、Geary’sC和 Getis-OrdG等,前兩者的統(tǒng)計(jì)性質(zhì)與比較方法不同,但都是基于鄰近面積單元上變量值的比較,Getis-OrdG指數(shù)則為基于距離統(tǒng)計(jì)的空間關(guān)聯(lián)指數(shù)[22-23]。這3種相關(guān)指數(shù)都是較常用的空間自相關(guān)分析方法,基本原理大致相同,使用范圍和側(cè)重點(diǎn)各有不同。張松林[30]、洪國志[31]、陳彥光[32]等學(xué)者通過對(duì)3種指數(shù)進(jìn)行探討和對(duì)比分析,認(rèn)為Moran’sI是比較典型且實(shí)用性較強(qiáng)的一種方法。
全局Moran’sI指數(shù)的取值范圍為[-1,1]:小于0表示空間負(fù)相關(guān),等于0表示空間不相關(guān)或空間隨機(jī)性,大于0表示空間正相關(guān),值越大表示屬性值的空間相關(guān)性越強(qiáng),而無論是正值還是負(fù)值,強(qiáng)的空間自相關(guān)均意味著近鄰對(duì)象的屬性值高度接近(圖1)。C系數(shù)的取值范圍一般為[0,2]:大于1表示負(fù)相關(guān),等于1表示不相關(guān),小于1則表示正相關(guān)。
圖1 不同Moran’ I值的空間分布模式Fig.1 Schematic diagram of the spatial distribution pattern of different Moran’ I values
對(duì)于全局Moran’sI,在獲得理論I值的基礎(chǔ)上,可構(gòu)造服從正態(tài)分布的統(tǒng)計(jì)量Z,以此來檢驗(yàn)空間自相關(guān)性的顯著性[25]。對(duì)I值進(jìn)行Z統(tǒng)計(jì)量的顯著性檢驗(yàn)時(shí),5%/10%顯著性水平下的評(píng)價(jià)標(biāo)準(zhǔn)見表1。
表1 空間自相關(guān)性評(píng)價(jià)標(biāo)準(zhǔn)Table 1 Spatial autocorrelation evaluation criteria
自空間自相關(guān)的概念提出以來,以 Haining[4]、Anselin[27]、Cliff[33]、Fisher[34]、和Goodchild[35]為代表的眾多學(xué)者對(duì)空間數(shù)據(jù)的自相關(guān)性進(jìn)行了廣泛研究,研究領(lǐng)域主要集中在社會(huì)科學(xué)、生態(tài)環(huán)境、土壤、林業(yè)與農(nóng)業(yè)等方面。
在社會(huì)科學(xué)研究領(lǐng)域,已應(yīng)用于城市環(huán)境與氣候變遷、健康與疾病及犯罪行為等研究中。如Holmberg和Lundevaller提出了一種檢測(cè)空間自相關(guān)的新方法并使用該方法分析了瑞典老齡人口死亡率的空間自相關(guān)性[36]。饒華祥[37]根據(jù)疾病發(fā)病水平的監(jiān)測(cè)數(shù)據(jù)存在的時(shí)間、空間自相關(guān)性的特點(diǎn),利用Morans’I和Getis-OrdG空間自相關(guān)分析技術(shù)對(duì)青海省肺結(jié)核病進(jìn)行時(shí)空分布特征研究,結(jié)果表明肺結(jié)核年發(fā)病率地區(qū)的分布存在明顯的高發(fā)地區(qū)聚集傾向。基于中國285個(gè)城市的統(tǒng)計(jì)數(shù)據(jù),Cheng等[5]使用雙變量Moran’sI揭示了城市制造業(yè)聚集與環(huán)境污染之間存在顯著的空間自相關(guān)性。Zhu等[38]針對(duì)柴達(dá)木盆地特殊的地理位置和氣候特征,以5種環(huán)境因子(年降水量、蒸發(fā)量、徑流量、溫度和DEM)為獨(dú)立自變量、植被覆蓋度為因變量建立植被覆蓋多元逐步回歸模型(MSR)時(shí),引入Moran’sI值計(jì)算了根據(jù)模型得到的植被覆蓋度的空間自相關(guān)性,選擇了5個(gè)因子中與植被覆蓋度的相關(guān)系數(shù)最高的年降雨量與Moran’sI作為自變量構(gòu)建了最佳植被覆蓋度模型。
在森林資源與耕地資源的調(diào)查監(jiān)測(cè)中,可以通過對(duì)目標(biāo)樣地的參數(shù)進(jìn)行空間自相關(guān)分析,揭示森林蓄積量的分布狀況和耕地的變化信息。如Gilbert和Lowell利用Moran’sI分析了不同類型的森林群落內(nèi)存在的空間自相關(guān)性,結(jié)果表明在高蓄積量的森林群落中存在較強(qiáng)的空間正自相關(guān)性,而且空間自相關(guān)的探測(cè)需要一個(gè)空間密度非常大的地面樣本點(diǎn)[13]。Overmars等[7]為了克服土地利用多元線性回歸模型無法獲取土地利用數(shù)據(jù)中的所有空間自相關(guān)性的缺點(diǎn),采用Moran’sI指數(shù)描述了厄瓜多爾土地利用數(shù)據(jù)集在不同單元尺度下的空間自相關(guān),構(gòu)建了包含回歸和空間自相關(guān)的混合回歸—空間自相關(guān)回歸模型(空間滯后模型)。
在農(nóng)業(yè)資源利用研究方面,Ping[14]利用了兩種空間自相關(guān)性統(tǒng)計(jì)指標(biāo)(Moran’sI和Geary’sC)評(píng)價(jià)了美國德克薩斯州的棉花產(chǎn)量在干旱和濕潤年份的空間相關(guān)性,發(fā)現(xiàn)在干旱年份研究區(qū)的皮棉產(chǎn)量存在一個(gè)顯著的空間自相關(guān)現(xiàn)象。Frutos等[4]使用Moran’sI檢測(cè)了位于西班牙西北部一個(gè)面積為3.84萬hm2研究區(qū)內(nèi)黃爪隼的空間分布特征,發(fā)現(xiàn)每個(gè)方格內(nèi)的黃爪隼豐度間存在空間自相關(guān),相關(guān)距離為4~8 km。張貞等[39]運(yùn)用Global Moran’sI指數(shù)采用空間自相關(guān)分析方法得出重慶市合川區(qū)丘陵山區(qū)水田和旱地質(zhì)量等級(jí)在空間分布上存在極顯著空間正相關(guān)的結(jié)論。
然而,眾多研究并不能說明空間自相關(guān)性的分析已經(jīng)趨于完善。實(shí)際上,還存在大量的問題需要討論。不同的地學(xué)對(duì)象具有其特定的存在與發(fā)展形式,空間自相關(guān)的存在雖然為我們提供了關(guān)于空間格局、結(jié)構(gòu)和過程等一系列有用的信息[40],但是如何運(yùn)用正確的空間統(tǒng)計(jì)方法去分析處理它,是研究空間自相關(guān)問題的關(guān)鍵。在農(nóng)業(yè)領(lǐng)域的研究中,針對(duì)特定農(nóng)作物的種植和生長模式,如何根據(jù)不同的尺度特征選擇合適的權(quán)重矩陣與空間自相關(guān)統(tǒng)計(jì)量以及基于時(shí)間滯后問題的空間自相關(guān)分析方法的發(fā)展等,都值得繼續(xù)進(jìn)行分析和探討。
雖然傳統(tǒng)抽樣方法常被用于推斷各種目標(biāo)變量的總體參數(shù),但是這些方法應(yīng)用的前提是假定抽樣單元間相互獨(dú)立[7,33]。實(shí)際上,各種空間數(shù)據(jù)內(nèi)經(jīng)常存在空間自相關(guān)現(xiàn)象。以往諸多研究已經(jīng)表明對(duì)空間地物進(jìn)行抽樣調(diào)查方案設(shè)計(jì)時(shí)應(yīng)充分考慮地物間內(nèi)蘊(yùn)的空間自相關(guān)性[12-15,36]。如果忽略這種空間自相關(guān)性,可能會(huì)過高估計(jì)抽樣方差和樣本容量,甚至?xí)玫揭粋€(gè)錯(cuò)誤的結(jié)論[41-45]。隨著人們對(duì)地理空間事物自相關(guān)性的深入研究,越來越多的研究者開始認(rèn)識(shí)到傳統(tǒng)抽樣方法的局限性[4,46],發(fā)現(xiàn)研究抽樣單元內(nèi)存在的空間自相關(guān)性對(duì)于提高空間抽樣調(diào)查的統(tǒng)計(jì)精度,降低調(diào)查成本,改善調(diào)查效率具有重要意義。
王勁峰[47]等在其編著的《空間抽樣與統(tǒng)計(jì)推斷》一書中明確指出,若不能了解空間相關(guān)性特征對(duì)抽樣方法各個(gè)方面的影響作用,就很難制定出科學(xué)客觀的抽樣方案??v觀國內(nèi)外學(xué)者在抽樣單元空間自相關(guān)性對(duì)空間抽樣效率的影響方面的研究,其研究對(duì)象主要集中在土壤[48-49]、森林[50-54]、生態(tài)領(lǐng)域[55]等,對(duì)抽樣效率的影響大多從抽樣精度、樣本容量、樣方尺寸、分層效率等方面進(jìn)行分析。如Trangmar[56]以新西蘭坎特伯雷平原土壤為例,研究發(fā)現(xiàn)在滿足相同的精度條件下,考慮抽樣單元空間自相關(guān)性的空間抽樣方法比傳統(tǒng)抽樣方法所需的樣本容量要少。朱靜[57]在利用傳統(tǒng)抽樣方法(簡單隨機(jī)抽樣)和空間抽樣方法對(duì)森林蓄積量進(jìn)行監(jiān)測(cè)時(shí)發(fā)現(xiàn),相對(duì)于傳統(tǒng)抽樣方法而言,融入空間相關(guān)性的空間抽樣方法外推總體精度更高,且當(dāng)抽樣單元空間相關(guān)性越顯著時(shí),兩種抽樣方法之間的外推精度差距就越大。曹志冬等[58]以山東省細(xì)小耕地地物面積比例的抽樣調(diào)查為例,分析了空間自相關(guān)性特征對(duì)不同分層方式抽樣效率的影響。
以往對(duì)農(nóng)作物抽樣調(diào)查的研究主要集中在遙感與抽樣相結(jié)合的方案設(shè)計(jì)方面[59-64]和利用空間抽樣技術(shù)進(jìn)行農(nóng)作物種植面積估計(jì)過程中各抽樣要素對(duì)抽樣效率定量化的影響方面[65-67],旨在通過“3S”技術(shù)與傳統(tǒng)抽樣方法相結(jié)合來改善抽樣調(diào)查的精度,降低抽樣調(diào)查費(fèi)用,采用的抽樣方法包括簡單隨機(jī)、系統(tǒng)抽樣、分層抽樣、整群抽樣及多階段抽樣[57-59,68-70]。王迪等[71]鑒于抽樣單元尺寸的合理制定對(duì)提高農(nóng)作物面積空間抽樣效率所具有的重要意義,通過分析抽樣單元尺寸與其對(duì)應(yīng)的全局自相關(guān)指數(shù)的相關(guān)關(guān)系進(jìn)行樣方尺寸初選;在此基礎(chǔ)上,以相對(duì)誤差、變異系數(shù)和樣本容量為抽樣效率評(píng)價(jià)指標(biāo),定量評(píng)價(jià)了不同樣方尺寸下的冬小麥面積空間抽樣效率。Jardim和Ribeiro[72]通過改變樣本容量和空間布局設(shè)計(jì)了多種抽樣方案,并比較了各種方案的抽樣效率。王迪等[73]以正方形網(wǎng)格作為抽樣單元,計(jì)算了玉米種植面積在不同抽樣單元尺度下的空間相關(guān)性,選取相關(guān)性最弱的網(wǎng)格尺度作為最優(yōu)抽樣單元尺度,利用耕地面積作為分層標(biāo)志,評(píng)價(jià)了4種(簡單隨機(jī)、系統(tǒng)等距、分層隨機(jī)及分層系統(tǒng)等距)抽樣方案的空間抽樣效率。
以上研究結(jié)果均表明,在進(jìn)行抽樣調(diào)查方法優(yōu)化設(shè)計(jì)的過程中,考慮了抽樣單元間空間自相關(guān)性的抽樣方案,其抽樣效率在一定程度上都得到了很大提升,而對(duì)于抽樣單元間的空間自相關(guān)性對(duì)抽樣效率的影響規(guī)律及其定量化評(píng)價(jià)方法未曾提及。
抽樣是統(tǒng)計(jì)調(diào)查的常用手段,空間抽樣是針對(duì)地理分布上具有空間關(guān)聯(lián)性的研究對(duì)象的空間抽樣,農(nóng)業(yè)遙感空間抽樣的目的則是估計(jì)大區(qū)域內(nèi)農(nóng)作物的種植面積。
在國際上,美國最先利用遙感技術(shù)進(jìn)行了農(nóng)作物種植面積抽樣估算,1974年開展的“大面積農(nóng)作物估產(chǎn)計(jì)劃”(Large Area Crop Inventory Experiment,LACIE)對(duì)美國及世界其他地區(qū)小麥面積和總產(chǎn)量進(jìn)行了估算;隨后實(shí)施的“農(nóng)業(yè)和資源的空間遙感調(diào)查”(Agricultural and Resources Inventory Surveys though Aerospace Remote Sensing,AGRISARS)計(jì)劃對(duì)世界各地多種作物進(jìn)行了產(chǎn)量預(yù)報(bào),并將遙感技術(shù)成功地應(yīng)用于面積框抽樣。為實(shí)現(xiàn)歐盟地區(qū)的農(nóng)業(yè)發(fā)展,歐盟在1987年發(fā)起農(nóng)業(yè)遙感監(jiān)測(cè)項(xiàng)目(Monitoring Agriculture with Remote Sensing,MARS),其中2個(gè)行動(dòng)(行動(dòng)A:區(qū)域農(nóng)作物面積清查行動(dòng);行動(dòng)B:農(nóng)作物面積快速變化估計(jì)行動(dòng))均涉及農(nóng)作物面積空間抽樣調(diào)查。Pradhan等通過GIS、遙感和面積框抽樣方法的聯(lián)合應(yīng)用,設(shè)計(jì)開發(fā)了一套地理信息系統(tǒng)用于伊朗哈馬丹省的農(nóng)作物面積空間抽樣調(diào)查業(yè)務(wù)。這些研究均采用傳統(tǒng)抽樣與“3S”技術(shù)相結(jié)合的方法對(duì)大區(qū)域的農(nóng)作物面積進(jìn)行監(jiān)測(cè),有效地提高了農(nóng)作物面積信息的獲取精度與時(shí)效性[12-16]。法國、德國、加拿大、泰國等也相繼開展了對(duì)小麥、水稻、玉米等主要糧食作物種植面積的遙感抽樣估算[17]。
國內(nèi)作物面積抽樣研究主要集中在傳統(tǒng)抽樣方法應(yīng)用方面。如周華茂等[18]應(yīng)用遙感與抽樣技術(shù)相結(jié)合,建立了一套適合我國南方水稻播種面積的抽樣調(diào)查體系,但該方法在樣方布設(shè)及尺寸選取方面存在對(duì)樣本空間相關(guān)性考慮不足的問題。也有學(xué)者將多種抽樣方法聯(lián)合應(yīng)用,如吳炳方和李強(qiáng)子[19]提出基于作物種植結(jié)構(gòu)區(qū)劃,采用整群抽樣和樣條采樣技術(shù)相結(jié)合的方法,估算全國農(nóng)作物面積。然而該研究仍然存在未考慮樣本點(diǎn)的空間分布特征的問題。
盡管關(guān)于抽樣單元空間自相關(guān)的研究已經(jīng)持續(xù)了十余年,但是這些研究主要集中于生態(tài)保護(hù)[4,7,74]、生態(tài)資源調(diào)查[55]、森林群落結(jié)構(gòu)[13,51]以及土地利用變化[14,46]等方面,而關(guān)于農(nóng)作物面積抽樣單元空間自相關(guān)性的研究則尚鮮有報(bào)道,影響了空間抽樣技術(shù)在農(nóng)作物面積遙感監(jiān)測(cè)業(yè)務(wù)中的進(jìn)一步應(yīng)用。通過以上綜合分析可得出以下結(jié)論。
(1)農(nóng)作物面積空間抽樣調(diào)查在我國發(fā)展較快,應(yīng)用前景十分廣闊,但現(xiàn)行的空間抽樣調(diào)查方法大多采用傳統(tǒng)抽樣與“3S”技術(shù)相結(jié)合的研究思路進(jìn)行農(nóng)作物面積估計(jì),而就抽樣單元間空間自相關(guān)性對(duì)農(nóng)作物種植面積空間抽樣精度和費(fèi)用的影響研究還十分缺乏,研究工作明顯滯后。
(2)在抽樣單元空間相關(guān)性的特征方面,國內(nèi)外關(guān)注的研究對(duì)象主要集中在土壤、生態(tài)、林業(yè)等領(lǐng)域,在農(nóng)業(yè)領(lǐng)域,特別是農(nóng)作物面積抽樣單元空間相關(guān)性領(lǐng)域的研究很少,缺乏針對(duì)不同尺度、作物類型和耕地破碎度條件下的農(nóng)作物面積抽樣單元空間自相關(guān)特征的定量表達(dá)與評(píng)價(jià),致使在農(nóng)作物面積空間抽樣方案設(shè)計(jì)中無法很好地考慮這一因素。
(3)盡管國內(nèi)外就空間相關(guān)性對(duì)空間抽樣效率影響的重要性都有較深入的認(rèn)識(shí),但關(guān)于農(nóng)業(yè)資源抽樣單元間空間自相關(guān)性對(duì)抽樣效率的影響研究較少,缺乏空間自相關(guān)性對(duì)農(nóng)業(yè)資源空間抽樣效率影響的定量評(píng)價(jià)方法和指標(biāo),這一問題已經(jīng)影響到農(nóng)作物面積空間抽樣方案的優(yōu)化設(shè)計(jì)與實(shí)施。開展關(guān)于抽樣單元空間自相關(guān)性對(duì)農(nóng)作物面積抽樣效率影響的定量研究,可為農(nóng)作物空間抽樣調(diào)查方法在不同地區(qū)應(yīng)用的適宜性評(píng)價(jià)和抽樣效率的進(jìn)一步改善提供理論依據(jù),這將是未來的主要研究方向。