郤建軍,李新通
(福建師范大學(xué) 地理科學(xué)學(xué)院,福建 福州 350007)
Moran’s I指數(shù)與DEM網(wǎng)格大小關(guān)系的研究
郤建軍,李新通*
(福建師范大學(xué) 地理科學(xué)學(xué)院,福建 福州 350007)
數(shù)字高程模型(Digital Elevation Model,簡稱DEM)作為真實地形的一種數(shù)字化模擬,網(wǎng)格間存在著某種空間自相關(guān)性.Moran’s I是一種常見的空間自相關(guān)程度量化指標(biāo).為了研究Moran’s I與DEM網(wǎng)格大小之間的關(guān)系,文章在分辨率為30 m×30 m的DEM上隨機(jī)選取了35個采樣點.又以每個采樣點為中心,選取n×n(n=3,5,7,…,25)大小的DEM網(wǎng)格,計算并記錄對應(yīng)于每個網(wǎng)格的Moran’s I指數(shù)值,繪出各采樣點的Moran’s I指數(shù)值隨n變化的曲線.研究發(fā)現(xiàn):大多數(shù)采樣點的Moran’s I曲線呈現(xiàn)出一致的變化趨勢;同時發(fā)現(xiàn)少數(shù)采樣點的Moran’s I曲線出現(xiàn)局部的變化異常.對這些異常進(jìn)行分析后發(fā)現(xiàn),Moran’s I值隨n變化的趨勢與DEM網(wǎng)格高程值的離散程度(地形)有關(guān).
DEM;Moran’s I指數(shù);網(wǎng)格;空間自相關(guān)
Tobler W R[1]在1979年指出地理空間存在相關(guān)性,并在此基礎(chǔ)上提出了地理學(xué)第一定律:地理事物總在不同程度上互相聯(lián)系與制約,相距較近事物之間的影響通常大于相距較遠(yuǎn)事物之間的影響.地理事物或?qū)傩栽诳臻g分布上互為相關(guān),存在集聚、隨機(jī)、規(guī)則等幾種分布.要了解地理事物分布、發(fā)展、變化的規(guī)律,就要考慮它們之間存在的空間相關(guān)性.空間自相關(guān)是空間統(tǒng)計學(xué)的重要組成部分,被廣泛地應(yīng)用在各種研究中.Cai X M和Wang D B[2]在水文流域地形特征值的空間自相關(guān)研究中,使用全局Mo? ran’s I表示具體網(wǎng)格鄰域內(nèi)的空間自相關(guān).以某個網(wǎng)格為中心,選取n×n(n取從3開始的奇數(shù))大小的網(wǎng)格.依次計算10個流域地形特征值的Moran’s I,記錄并繪出Moran’s I隨鄰域增大而變化的曲線圖. Pogson M等人[3]引入一個gI/nI(n、g分別是聚合前、后的網(wǎng)格大小,I是Moran’s I值)因素,反映空間自相關(guān)性對空間數(shù)據(jù)不確定性的影響.該文章利用不同的柵格數(shù)據(jù)測試他們提出的公式的正確性.研究表明數(shù)據(jù)的空間自相關(guān)性會對空間分辨率引起的數(shù)據(jù)不確定性造成一定的影響.谷建立[4]等人通過計算各土地類型的全局Moran’s I研究谷城縣縣域整體的空間自相關(guān)性.對具體土地類型的Moran散點圖分布和局部關(guān)聯(lián)局域指標(biāo)分布進(jìn)行了解讀.隨后,基于DEM五個地形因子的統(tǒng)計數(shù)據(jù)對谷城縣的土地利用自相關(guān)格局進(jìn)行了剖析.張松林[5]等人研究了局部空間自相關(guān)指標(biāo)Moran’s I和G系數(shù)兩種方法之間的差異.首先隨機(jī)生成一個規(guī)則網(wǎng)格模擬地震帶,網(wǎng)格屬性為震級,使用固定大小的區(qū)域從規(guī)則網(wǎng)格的一角向中心移動,探測低值與高值集聚情況,并對兩種方法的結(jié)果進(jìn)行了比較分析.陳彥光[6]簡化了空間自相關(guān)分析過程,論述了計算Moran’s I指數(shù)的三種途徑.最后,針對河南省鶴壁市人口進(jìn)行了全局Mo?ran’s I、局部LISA、Moran散點圖空間自相關(guān)分析.結(jié)合鶴壁市實際情況對Moran散點圖結(jié)果進(jìn)行了詳細(xì)的分析.Zhu D和Dong Y F[7]根據(jù)黃土丘陵溝壑區(qū)的DEM數(shù)據(jù),以局部Moran’s I量化DEM網(wǎng)格間的空間自相關(guān),通過設(shè)置閾值來提取DEM的地形特征點,基于特征點構(gòu)建不規(guī)則三角網(wǎng),達(dá)到簡化生成DEM的效果.
在多數(shù)研究中,DEM作為一種數(shù)據(jù),Moran’s I作為一種量化空間自相關(guān)的方法被用在各種案例研究中.本文以DEM為研究對象,以Moran’s I為指標(biāo)研究DEM的空間自相關(guān)性的變化趨勢,更深入地探索DEM網(wǎng)格的空間自相關(guān).研究結(jié)果可以對使用DEM的案例(尤其是涉及對空間自相關(guān)敏感的研究)起到參考作用.同時,結(jié)合本文還可以做一些進(jìn)一步的研究:比如DEM有多種生成方法,不同方法生成的DEM網(wǎng)格表現(xiàn)在空間自相關(guān)變化趨勢上是否具有差異性,在具體研究中會對研究結(jié)果產(chǎn)生什么樣的影響;對于一些特殊的地形,例如斷崖,研究DEM空間自相關(guān)變化趨勢可以將地形異常性表現(xiàn)出來.在本文的研究中,使用Java程序計算DEM網(wǎng)格Mo?ran’s I,提升了數(shù)據(jù)處理的效率.
1.1 空間權(quán)重矩陣
要揭示地理事物之間的關(guān)系,首先需要定義地理事物之間的鄰接關(guān)系.空間權(quán)重矩陣是空間相鄰關(guān)系的主要表現(xiàn)方式.與空間位置屬性有關(guān)的、重要的空間概念有距離、鄰接、交互、近鄰.建立空間權(quán)重矩陣的關(guān)鍵在于空間位置的定義.空間權(quán)重矩陣主要有以下幾種:左右相鄰權(quán)重矩陣、上下相鄰權(quán)重矩陣、Queen(后步)權(quán)重矩陣、Rook(車步)權(quán)重矩陣、K最近點權(quán)重矩陣、基于距離權(quán)重矩陣、閾值權(quán)重矩陣、Dacey權(quán)重矩陣、Cliff-Ord權(quán)重矩陣[8].空間權(quán)重矩陣的選擇直接關(guān)系到空間自相關(guān)計算結(jié)果,所以一些學(xué)者建議采用與所研究的特定現(xiàn)象有更直接關(guān)系的權(quán)重矩陣[9].
空間權(quán)重矩陣用一個二維矩陣來表示,基本形式如下:
DEM網(wǎng)格空間鄰接有兩種:基于距離鄰接和基于網(wǎng)格鄰接[5].基于距離鄰接是指網(wǎng)格A與網(wǎng)格B距離小于規(guī)定的距離閾值時權(quán)重為1,否則權(quán)重為0;基于網(wǎng)格鄰接是指根據(jù)網(wǎng)格之間的鄰接情況,相鄰權(quán)重為1,否則權(quán)重為0.其中常用的有Rook空間權(quán)重矩陣、Queen空間權(quán)重矩陣.Rook空間權(quán)重矩陣易于理解且計算過程較為簡單,本文采用的是Rook空間權(quán)重矩陣,步長為1.Rook空間權(quán)重矩陣的定義為:中心網(wǎng)格與其他網(wǎng)格是否有公共邊,有公共邊,權(quán)重為1,否則權(quán)重為0.
1.2 Moran’s I指數(shù)
量化空間自相關(guān)的指標(biāo)主要有Moran’s I指數(shù)、Geary’s C.本文采用Moran’s I指數(shù)來計算DEM的空間自相關(guān)性.Moran’s I指數(shù)包括全局Moran’s I指數(shù)、局部Moran’s I指數(shù).全局Moran’s I指數(shù)的計算公式為:
其中,xi是要素i的屬性,n為要素的總數(shù),i、j代表不同的要素,wij是要素i和j之間的空間權(quán)重.是對應(yīng)屬性的平均值,S2表示所有要素的方差:
全局Moran’s I取值范圍為[-1,1].當(dāng)I大于0時,表示區(qū)域內(nèi)地理事物存在空間正相關(guān);當(dāng)I小于0時,表示區(qū)域內(nèi)地理事物相對離散;當(dāng)I接近0時,則表明區(qū)域內(nèi)地理事物不存在空間自相關(guān)性,呈隨機(jī)分布[10-11].
從全局Moran’s I的計算過程來看,所有局部貢獻(xiàn)值之和除以全部連接數(shù)∑∑wij就是全局Mo?ran’s I.其中,每個局部貢獻(xiàn)值為:
這些單個的要素Ii稱為局部空間關(guān)聯(lián)指標(biāo)(Local In?dicators of Spatial Association,簡稱LISA),可以用于制圖和顯著性檢驗,以提供關(guān)于研究區(qū)內(nèi)聚集格局的信息.
1.3 Moran散點圖
Moran散點圖也是一種局部空間自相關(guān)分析方法.能夠具體區(qū)分區(qū)域單元和其鄰接單元間的4種空間分布形式[12],包括High-High、Low-High、Low-Low、High-Low.四個類型區(qū)對應(yīng)Moran散點圖的四個象限,每個象限所代表的含義如下[6]:
1)第一象限:為HH區(qū)域,即自身為高觀測值的點或區(qū)域且其周圍鄰居也多是高值的點或區(qū)域,觀測值之間具有相似性,呈正的空間自相關(guān),這些點或區(qū)域之間在實際情況中呈高值集聚的空間關(guān)聯(lián)模式;
2)第二象限:為LH區(qū)域,即低觀測值的點或區(qū)域且被高觀測值的點或區(qū)域所包圍,觀測值之間具有異質(zhì)性,呈負(fù)的空間自相關(guān),這些點或區(qū)域之間在實際情況中呈離散分布的空間關(guān)聯(lián)模式;
3)第三象限:為LL區(qū)域,即低觀測值的點或區(qū)域且被同為低觀測值的點或區(qū)域所包圍,觀測值之間具有相似性,呈正的空間自相關(guān),這些點或區(qū)域之間在實際情況中呈低值集聚分布的空間關(guān)聯(lián)模式;
4)第四象限:為HL區(qū)域,即高觀測值的點或區(qū)域且被低觀測值的點或區(qū)域所包圍,觀測值之間具有異質(zhì)性,呈負(fù)的空間自相關(guān),這些點或區(qū)域之間在實際情況中呈離散分布的空間關(guān)聯(lián)模式.
2.1 方法及結(jié)果
DEM矩陣的內(nèi)容為以高程為屬性值的柵格數(shù)據(jù).本文目的是探究DEM網(wǎng)格大小對其網(wǎng)格間空間自相關(guān)性的影響,在一個空間分辨率為30 m*30 m的DEM中隨機(jī)選取35個點,以每個點為中心又分別選取3*3、5*5、7*7、9*9、11*11、13*13、15*15、17*17、19*19、21*21、23*23、25*25共12個大小遞增的DEM網(wǎng)格.圖1是在ArcGIS 10.1中加載顯示的樣本點位置分布圖(35個樣本點是在ArcGIS中隨機(jī)生成的),文章使用的DEM是山地地形,高程范圍在438-4361 m之間.
在ArcGIS10.1中將每個采樣點的DEM樣本轉(zhuǎn)為ASCII文件(*.txt),然后在Java編寫的程序中讀取ASCII文件,計算并記錄樣本網(wǎng)格對應(yīng)的Moran’s I值.關(guān)于空間權(quán)重矩陣的具體細(xì)節(jié)請讀者參考文后所附的程序源代碼,見附錄A.繪出Moran’s I值隨n變化的曲線即可得到圖2所示的結(jié)果.
圖1 樣本分布Fig.1 The distribution of samples
圖2 所有采樣點的Moran’s I指數(shù)變化曲線Fig.2 Moran’s I Index change curve of sample points
接下來,利用Geoda軟件對所有的DEM樣本進(jìn)行顯著性檢驗.圖3為樣本點15的3*3網(wǎng)格和25*25網(wǎng)格顯著性檢驗結(jié)果.容易看到,這兩種網(wǎng)格表現(xiàn)出一致的顯著性規(guī)律:3*3網(wǎng)格出現(xiàn)了Low-Low的集聚,對應(yīng)的區(qū)域出現(xiàn)了較高的顯著性;隨著DEM網(wǎng)格的擴(kuò)大,25*25網(wǎng)格出現(xiàn)High-High、Low-Low集聚現(xiàn)象,相應(yīng)的顯著性更加明顯.這些規(guī)律具體表現(xiàn)是:圖2的全局Moran’s I曲線呈上升態(tài)勢.
圖3 點15的3*3、25*25網(wǎng)格的LISA集聚圖及對應(yīng)的LISA顯著性圖Fig.3 LISA cluster map and LISA significance map of grids 3*3 and 25*25 of point 15
2.2 結(jié)果分析
分析圖2可以發(fā)現(xiàn)以下兩個顯著的規(guī)律:一、幾乎所有曲線都表現(xiàn)出一致的變化趨勢,即隨著DEM網(wǎng)格的逐漸增大,Moran’s I數(shù)值逐漸增大,Moran’s I數(shù)值增長率逐漸減??;二、大多數(shù)樣本點的3*3網(wǎng)格的Moran’s I值都在0.5左右,這是較高的小范圍集聚性的表現(xiàn).
同時,有少數(shù)樣本點的Moran’s I曲線出現(xiàn)兩種類型的異常.一、曲線走勢異常,即整個Moran’s I曲線的走勢存在異常,見圖4.具體而言:隨著DEM網(wǎng)格大小(n)的增加,在13-21區(qū)間內(nèi),樣本點24的Moran’s I曲線呈現(xiàn)下降走勢;在7-11、17-21兩個區(qū)間內(nèi),樣本點34的Moran’s I曲線也呈現(xiàn)出下降走勢.二、曲線初始值異常:Moran’s I曲線的初始值偏小.如圖5,對于最小的DEM網(wǎng)格(3*3),各異常樣本點的Moran’s I值都小于0.3,小于正常樣本點的相應(yīng)值.
是什么原因?qū)е逻@兩種異常的發(fā)生?這些異常表現(xiàn)在DEM上又會是什么地形?本文通過計算DEM網(wǎng)格的方差來分析這個問題.這是因為:Mo?ran’s I的計算公式表明,DEM相鄰網(wǎng)格之間的高程值的差值會直接影響Moran’s I數(shù)值,即,DEM相鄰網(wǎng)格之間的高程值的差異影響它們的空間自相關(guān)性的高低.本文計算3*3和25*25兩種DEM網(wǎng)格的方差.選擇3*3網(wǎng)格的主要原因是:Moran’s I曲線的初始值對應(yīng)于3*3的網(wǎng)格;選擇25*25網(wǎng)格的主要原因是:通過計算結(jié)果來查看整個DEM網(wǎng)格的高程值的離散程度.兩種尺寸DEM網(wǎng)格的方差從不同的角度說明Moran’s I曲線的異常.表1為35個樣本點的3*3和25*25兩種網(wǎng)格高程方差的計算結(jié)果.
圖4和圖5一共展示了7個異常采樣點的Mo?ran’s I曲線.從表1可以看出,7個異常采樣點的3*3網(wǎng)格方差值都較?。ㄖ饕性?.00-20.00這一范圍之內(nèi)),遠(yuǎn)小于大部分正常采樣點的對應(yīng)值.這說明,對于3*3的DEM網(wǎng)格,所有異常點高程值都集中在某一個值左右.異常采樣點9、24、34和35的25* 25網(wǎng)格方差分別為781.76、263.32、882.42和783.95,小于其他采樣點的對應(yīng)值;異常采樣點22和26的25*25網(wǎng)格方差分別為1983.22和2544.05,同樣小于大部分的正常采樣點對應(yīng)的值.
圖4 曲線走勢異常Fig.4The abnormal of curve trend
圖5 曲線初始值異常Fig.5 The initial values of the abnormal curves
圖6 異常點在整個DEM上的位置Fig.6 The distribution of abnormal sample points in DEM
表13 *3和25*25網(wǎng)格的高程方差值(單位:m2)Tab.1The elevation variances of 3*3 and 5*5 DEM’s grids(unit:m2)
結(jié)合本文研究區(qū)域的DEM高程圖(見圖6)和DEM坡度圖(見圖7),查看這些異常采樣點的位置分布可知,異常采樣點都位于地勢相對平坦之處,其中采樣點9、22、23、24、34、35位于坡度范圍在0-17的位置,采樣點26處于坡度范圍在18-34的位置.結(jié)合7個異常采樣點的3*3和25*25網(wǎng)格方差及其高程位置分布圖、坡度位置分布圖,可以推測,兩種Mo?ran’s I曲線異常都與采樣點所處位置的坡度有關(guān),因為山谷的地勢都較為平坦,而這些采樣點大多分布在山谷中.(注:圖6是對原DEM進(jìn)行了高程分布渲染操作所得,圖7是對原DEM進(jìn)行了求取坡度操作所得.兩幅圖的操作都是在ArcGIS 10.1中進(jìn)行的).
接下來,通過Moran散點圖分析異常采樣點與正常采樣點之間的區(qū)別.異常采樣點9以及正常采樣點1的25*25 DEM網(wǎng)格的散點圖對比見圖8和圖9.空間自相關(guān)的散點與趨勢線匹配的效果越好,則自相關(guān)性越強(qiáng)[6].從這兩幅圖的散點分布與直線匹配的情況看,采樣點的25*25 DEM網(wǎng)格空間自相關(guān)性較高,這也印證了圖2中Moran’s I曲線分布.從Mo?ran散點圖還可以看出,在正常采樣點的25*25 DEM網(wǎng)格中,HH、LL區(qū)域分布更為均衡,異常采樣點則相對集聚.DEM高程值的變化呈現(xiàn)有序遞增或遞減趨勢,沒有出現(xiàn)High-Low、Low-High兩種情況,相應(yīng)地,無論是在異常采樣點還是正常采樣點的散點圖中,散點的分布都沒有出現(xiàn)在二、四象限.
DEM是一種真實地形的數(shù)字高程表現(xiàn)形式,一般情況下,DEM矩陣網(wǎng)格之間存在正的空間自相關(guān);空間自相關(guān)量化指數(shù)Moran’s I同DEM網(wǎng)格大小之間存在關(guān)聯(lián)性:DEM中以一點為中心逐漸向外延伸,隨著DEM網(wǎng)格范圍的擴(kuò)大,空間集聚現(xiàn)象逐漸明顯,Moran’s I值逐漸增大,Moran’s I值增長率逐漸減小,在DEM網(wǎng)格達(dá)到一定范圍后,Moran’s I值趨于穩(wěn)定;Moran’s I值隨DEM網(wǎng)格的變化趨勢同DEM網(wǎng)格高程值的分布(地形)有關(guān);DEM的空間分辨率的大小決定著真實地形中細(xì)節(jié)的缺失與否,所以DEM空間分辨率的不同會影響Moran’s I的值.
從本文分析結(jié)果來看,異常采樣點都出現(xiàn)在地勢較為平坦,坡度較小的位置.但是并不是所有位于平坦地勢的采樣點都表現(xiàn)出異常.從表2中可以看出,正常采樣點8、10、13、18、20、29、31的3*3和25*25網(wǎng)格方差都較小,但是這些采樣點的Moran’s I曲線沒有出現(xiàn)文中提到的兩種異常.進(jìn)一步的分析將在別的研究中進(jìn)行.
圖7 異常點在坡度圖上的位置分布Fig.7 The distribution of abnormal sample points in slope DEM
圖8 采樣點9的散點圖分布Fig.8 The scatter diagram of sample point 9
圖9 采樣點1的散點圖分布Fig.9 The scatter diagram of sample point 1
[1]Tobler W R.A computer movie simulating urban growth in the Detroit region[J].Economic geography,1970,46(2):234-240.
[2]Cai X,Wang D.Spatial autocorrelation of topographic in?dex in catchments[J].Journal of Hydrology,2006,328(3):581-591.
[3]Pogson M,Smith P.Effect of spatial data resolution on un?certainty[J].Environmental Modelling&Software,2015,63:87-96.
[4]谷建立,張海濤,陳家贏,等.基于DEM的縣域土地利用空間自相關(guān)格局分析[J].農(nóng)業(yè)工程學(xué)報,2012,28(23):216-224.
[5]張松林,張昆.空間自相關(guān)局部指標(biāo)Moran指數(shù)和G系數(shù)研究[J].大地測量與地球動力學(xué),2007,27(3):31-34.
[6]陳彥光.基于Moran統(tǒng)計量的空間自相關(guān)理論發(fā)展和方法改進(jìn)[J].地理研究,2009,28(6):1449-1463.
[7]Zhu D,Dong Y.Terrain simplification from grid DEMs based on spatial autocorrelation[C]//2013 21st International Conference on Geoinformatics.IEEE,2013:1-5.
[8]徐彬.空間權(quán)重矩陣對Moran’s I指數(shù)影響的模擬分析[D].南京:南京師范大學(xué),2007.
[9]劉旭華,王勁峰.空間權(quán)重矩陣的生成方法分析與實驗[ J].地球信息科學(xué),2002,4(2):38-44.
[10]吳孟泉,趙玉.中國奧運獎牌空間分布區(qū)域性差異的Moran’s I指數(shù)分析研究[J].中國體育科技,2012(5):3-9.
[11]田力,張曉盼,袁艷斌.規(guī)則網(wǎng)格系統(tǒng)全局Moran指數(shù)計算的改進(jìn)方法[J].測繪科學(xué),2014,39(2):110-113.
[12]王新成,王斌之,黃建毅.基于空間自相關(guān)的水污染空間聚類研究[J].環(huán)境工程技術(shù)學(xué)報,2014,4(4):293-298.
附錄A
車步空間權(quán)重矩陣代碼
本附錄給出空間權(quán)重矩陣的核心代碼塊,詳細(xì)的介紹見正文第2.1節(jié).
其中,DEM網(wǎng)格的高程值存放在一個二維數(shù)組array[row][column]中,row表示行索引值,column表示列索引值.從代碼中可以看到有4個if判斷語塊,通過控制row、column的值,分別是對應(yīng)中心網(wǎng)格同上、下、左、右網(wǎng)格的判斷.
責(zé)任編輯:吳興華
Study of the Relationship Between the Moran’s I Index and the DEM’s Grid Size
XI Jianjun,LI Xintong*
(School of Geography,F(xiàn)ujian Normal University,F(xiàn)uzhou350007,China)
Digital Elevation Model(DEM)is a digital model of realistic terrain,and there exists spatial auto-correlation among DEM’s grids.The Moran’s I is a quantized index used to measure the spatial auto-correlation.To explore the rela?tionship between the Moran’s I index and the size of DEM’s grids,we compute and record the corresponding Moran’s I val?ues by selecting 35 samples in the DEM with a resolution of 30 m×30 m randomly and selectingn×n(n=3,5,7,…,25)DEM’s grids centering on each sample point.Finally,we plot the Moran’s I curves varying along withnfor all sample points.The results show that most Moran’s I curves have the same variation trend except for a few curves which have abnor?mal behaviors in somen-intervals.By analyzing these abnormal phenomena,we find that the variation trend of a Moran’s I curve along withnis related to the elevation dispersion degree of the corresponding DEM’s grids.
DEM;Moran’s I index;grid;spatial auto-correlation
P 282
:A
:1674-4942(2016)004-0418-07
10.12051/j.issn.1674-4942.2016.04.014
2016-08-28
*通訊作者