武秀艷,歐陽玲
摘 要:氣象站點分散在不同區(qū)域的不同的地點,空間上呈不連續(xù)分布,我們只能獲取某地有限點的氣象信息,不利于某區(qū)域的進一步研究,地理信息系統(tǒng)軟件ArcGIS可以利用空間插值的方法解決這一問題,但是空間差值方法的精度差別很大。本文分別運用普通克里金法、樣條函數(shù)法和反距離權(quán)重法對內(nèi)蒙古自治區(qū)38個氣象站在1991-2020年的累年日平均氣溫進行了空間插值,得出了內(nèi)蒙古自治區(qū)30年間氣溫的變化表面模型,利用獨立數(shù)據(jù)集對于插值精度進行了檢驗,最后得出精度最高的是普通克里金法插值,較次的是反距離權(quán)重法,精度最低的是樣條函數(shù)法,內(nèi)蒙古年均氣溫呈現(xiàn)東西部溫度高于中部地區(qū)且呈帶狀分布。
關(guān)鍵詞:地理信息系統(tǒng);空間插值;氣象要素;累年日平均氣溫
中圖分類號:P49? 文獻標(biāo)識碼:A? 文章編號:1673-260X(2022)05-0015-05
1 引言
氣象要素對于國家和人民有著至關(guān)重要的作用,它是人類生活環(huán)境的要素之一,并且為人類生產(chǎn)和生活的提供了重要資源。它在人類生活中的農(nóng)業(yè)、工業(yè)、商業(yè)、交通等方面占據(jù)著重要的地位,人類的各種生產(chǎn)活動都不可避免地受到氣象要素的影響。氣溫是氣象要素中很重要而且常見的變量之一,氣溫的影響在其中尤其重要,除此之外,氣溫也是研究人地關(guān)系之間相互作用的重要指標(biāo),并且在全球變化過程中占據(jù)著重要地位,因此,我們需要有面積廣大的、時序長的溫度來研究氣候現(xiàn)象,我國的氣象站點可以觀測到氣象數(shù)據(jù)并提供給我們進行研究,但是氣象站點不能覆蓋全部地區(qū),個數(shù)是可數(shù)的,而且代表的是有限區(qū)域內(nèi)的氣象要素的分布情況,我們只能利用推算這種方法來得到那些大量的沒有被氣象站觀測覆蓋的區(qū)域的氣象數(shù)據(jù)[1,2]??臻g插值可以將離散點的測量數(shù)據(jù)轉(zhuǎn)換為連續(xù)的數(shù)據(jù)曲面,所以要獲取大面積及準(zhǔn)確的溫度是可以利用空間插值來實現(xiàn),也能與其他空間現(xiàn)象的分布模式進行比較[3]。地理信息系統(tǒng)(GIS)是一種空間信息系統(tǒng):即在計算機各種軟硬件系統(tǒng)的支持下,具有進行采集、存儲、管理、運算、分析、顯示和描述等這些在地球表面(包括大氣層)空間中和地理分布有關(guān)的數(shù)據(jù)功能。近年來計算機科學(xué)、數(shù)學(xué)、測繪科學(xué)、地理學(xué)等諸多學(xué)科快速發(fā)展,GIS在這些學(xué)科的拉動下得到迅猛發(fā)展[4]。尤其是在近年來發(fā)展中的“數(shù)字城市”“數(shù)字地球”“智慧城市”之中,地理信息系統(tǒng)的發(fā)展前景廣大。隨著地理信息系統(tǒng)技術(shù)的發(fā)展,最近幾年,插值方法的應(yīng)用越來越廣泛,許多學(xué)者會用插值這種方法來估算各種需要卻不全面的數(shù)值,例如溫度數(shù)據(jù)[5]。高時空分辨率、空間柵格化的氣象要素數(shù)據(jù)的需求越來越大,因為現(xiàn)代科學(xué)和計算機的發(fā)展十分迅速。國內(nèi)外的生態(tài)學(xué)、地學(xué)研究的重要任務(wù)之一就有基于GIS技術(shù)利用地面觀測的氣象資料研究氣象要素柵格化方法[6]。
利用地理信息系統(tǒng)軟件ArcGIS10.2中的ArcMap對于內(nèi)蒙古自治區(qū)38個氣象站的氣溫數(shù)據(jù)進行空間插值分析。在1991和2020年間的內(nèi)蒙古累年日平均氣溫通過普通克里金插值法、樣條函數(shù)法、以及反距離權(quán)重法這三種常見的插值方法進行空間插值分析,得出通過這些方法得出內(nèi)蒙古自治區(qū)三十年前后氣溫的變化表面模型,最后分析內(nèi)蒙古自治區(qū)年均氣溫的時間空間變異規(guī)律。此外,本文以內(nèi)蒙古自治區(qū)為研究試驗區(qū),對內(nèi)蒙古自治區(qū)這一跨緯度大的城市進行研究,具有較好的代表性和典型性。
2 研究區(qū)域概況及實驗數(shù)據(jù)處理
2.1 研究區(qū)域概況
地處中國北部邊境的內(nèi)蒙古自治區(qū)簡稱內(nèi)蒙古,位于北緯37°24′至53°23′,東經(jīng)97°12′至126°04′之間,地域遼闊,從東到西直線距離有2400多公里,南北跨距達1700多公里,整體形態(tài)呈狹長型;全區(qū)面積廣大,達118.3萬平方公里,占據(jù)我國土地面積的12.3%,位列我國第三。
2.2 實驗數(shù)據(jù)介紹
本次研究采用的實驗數(shù)據(jù)主要是內(nèi)蒙古省界的全國行政區(qū)劃圖和氣象站點的shapefile文件,和由中國氣象數(shù)據(jù)網(wǎng)提供的1991-2020年內(nèi)蒙古自治區(qū)38個氣象站的每年的1月1號累年日平均氣溫數(shù)據(jù)。
2.3 數(shù)據(jù)處理方法
在中國氣象網(wǎng)下載的內(nèi)蒙古自治區(qū)1991—2020年的累年日均溫數(shù)據(jù)作為研究數(shù)據(jù),選擇內(nèi)蒙古自治區(qū)全部氣象站中的38個氣象站點數(shù)據(jù),選取其中28個氣象站點數(shù)據(jù)用于氣溫插值,留下10個站點數(shù)據(jù)用于對三種插值方法得到的結(jié)果精度的進行檢測,比較實驗的準(zhǔn)確性。
3 插值方法與精度驗證
3.1 空間插值方法
有普通克里金插值法、樣條函數(shù)插值法、反距離權(quán)重法三種插值方法。
3.1.1 普通克里金插值法
克里金插值(Kriging)也稱為空間局部插值法,作為基礎(chǔ)支撐它的是能在有限區(qū)域內(nèi)對區(qū)域化變量進行無偏最優(yōu)估計的變異函數(shù)理論和結(jié)構(gòu)分析的一種方法。采用克里金這種插值方法進行插值,預(yù)測結(jié)果和預(yù)測誤差可以同時被得到,這樣對于預(yù)測結(jié)果的不確定性很有利于被評估,從而增加結(jié)果的確定性,這些都是在地統(tǒng)計學(xué)的統(tǒng)計特征的基礎(chǔ)上能夠?qū)崿F(xiàn)的??死锝鸩逯捣椒ê芏?,在這次研究中選擇的是普通克里金(ordinary Kriging)進行插值。
區(qū)域化變量的原始數(shù)據(jù)和變異函數(shù)這樣的結(jié)構(gòu)特點被普通克里金法(OK)所利用,是最優(yōu)的一種方法,能對未采樣點的區(qū)域化變量的取值進行線性無偏最優(yōu)估計。
設(shè)研究區(qū)域為A,空間位置(一維、二維或三維坐標(biāo))用區(qū)域化變量(即待研究的物理屬性變量)為{Z(x)∈A}來表示,Z(x)在采樣點xi(i=1,2,…,n)處的屬性值(或稱為區(qū)域化變量的一次實現(xiàn))為Z(xi)(i=1,2,…,n),未采樣點x0處的屬性值Z(x0)估計值是n個已知采樣點屬性值的加權(quán)和,這能夠根據(jù)普通克里金插值原理得到的,即:
Z(x0)=■?姿iZ(xi)
為待求權(quán)系數(shù)。
假設(shè)二階平穩(wěn)這一條件能夠被區(qū)域化變量Z(x)在整個研究區(qū)域內(nèi)滿足
假設(shè):
(1)存在Z(x)的數(shù)學(xué)期望并且能夠等于常數(shù): E[Z(x)]=m(常數(shù))。
(2)只與兩點之間的相對位置有關(guān)的Z(x)的協(xié)方差Cov(xi,xj)存在?;驖M足本征假設(shè):
(3)E[Z(xi)-Z(xj)]=0。
(4)增量的方差存在且平穩(wěn):
Var[Z(xi)-Z(xj)]=E[Z(xi)-Z(xj)]2
無偏性要求:E[Z*(x0)]=E[Z(x0)]經(jīng)推導(dǎo)可得:
■?姿i=1
在無偏條件下使估計方差達到最小,即:
Min{Var[Z*(x0)-Z(x0)]-2?滋■(?姿i-1)}
其中?滋為拉格朗日乘子。
可得求解權(quán)系數(shù)?姿i(i=1,2,…,n)的方程組:
■?姿iCov(xi,xj)-?滋=Cov(xi,xj)■?姿i=1i=1,2,…,n
求出諸權(quán)系數(shù)?姿i(i=1,2,…,n)后,就可求出未采樣點x0處的屬性值Z*(x0)。
上述求解解權(quán)系數(shù)?姿i(i=1,2,…,n)的方程組中若用變異函數(shù)?酌(xi,xj)表示協(xié)方差Cov(xi,xj)時,形式為:
■?姿i?酌(xi,xj)-?滋=?酌(xi,xj)■?姿i=1i=1,2,…,n
變異函數(shù)的定義為:
?酌(xi,xj)=?酌(xi-xj)=■E[Z(xi)-Z(xj)]2
由計算普通克里金插值所得到的方差為
?滓2=Var[Z*(x0)-Z(x0)]
=Cov(x0,x0)-■?姿iCov(x0,xi)+?滋
或
?滓2=■?姿i?酌(x0,xi)-?酌(x0,x0)+?滋
3.1.2 樣條函數(shù)法(Spline)
樣條函數(shù)插值法是把一些有特征的節(jié)點利用起來,對一些限定的點值,通過控制估計方差,然后使用一種數(shù)學(xué)函數(shù),最終得到平滑的插值曲線,這種插值曲線是用多項式擬合的方法來產(chǎn)生的,如河水水位高度、溫度、某種氣體濃度等。使用公式表示:
Z=■Aidi2logdi=a+bx+cy
其中,Z為待估計的氣溫柵格值,di為插值點到第i個氣象站點的距離,氣溫的局部趨勢函數(shù)為a+bx+cy,x、y用來表示插值點的地理坐標(biāo),
■Aidi2logdi
可以通過它獲得作為一個基礎(chǔ)函數(shù)最小化表面的曲率,方程系數(shù)用Ai、a、b和c來表示,用于插值的氣象站點的個數(shù)用n來表示。
3.1.3 反距離權(quán)重法(Inverse Distance Weighing,簡稱IDW)
反距離權(quán)重法是對采樣點進行線性的加權(quán)來決定輸出的一種柵格值數(shù)據(jù),它的特征是距離與加權(quán)成反比,輸入點與輸出柵格的遠(yuǎn)近,決定了它對輸出柵格的影響大小[3],要想使它對輸出柵格的影響越小,就要使輸入點離輸出柵格的距離越大,使用公式表示為:
Z=■
其中,待估計的氣溫柵格值用z來表示,Z(xi)為第i(i=1,2,…,n)個氣象站點的氣溫值,用于氣溫插值的氣象站點數(shù)目用n來表示,插值點到第i個氣象站點的距離用di來表示,為距離的冪為p。
3.2 檢驗標(biāo)準(zhǔn)
本次研究的檢驗方法采用的是獨立數(shù)據(jù)集檢驗,把實驗數(shù)據(jù)分成實驗集和驗證集,這兩個相互獨立沒有交集,用實驗集插值后,拿驗證集檢驗用均方根誤差(RMSE)和決定系數(shù)(coefficient of determination)來檢驗精度,決定系數(shù)符號表示為R2,也稱為擬合優(yōu)度,是相關(guān)系數(shù)的平方,當(dāng)R2越接近于1時,相關(guān)方程式的參考價值越高,相反,越接近于0時,表示參考值越低,R2越大,自變量對因變量的解釋程度越高,自變量引起的變化占總變化的比值越高,試驗點在回歸直線附近越密集。RMSE表示可根據(jù)自變量的變異來解釋因變量的變異部分,采用均方根誤差的原因是它能夠把測量的精密度反映的很好,在實際測量中,觀測次數(shù)n總是有限的,真值只能用最佳值來代替,這是因為它是真值偏差的平方與觀測值和觀測次數(shù)n比值的平方根,方根誤差對一組測量中的特大或特小的誤差反映非常敏感。
RMSE=■
R2=■=1-■
式中:第i個站點的實際觀測值用obs,i來表示,估計值用model,i來表示。用于檢測的站點數(shù)目用n來表示。
4 結(jié)果
4.1 分析
利用ArcGIS工具箱中的Spatial Analyst工具下面的插值分析對于所有的氣象數(shù)據(jù)進行空間插值,然后通過Spatial Analyst中的提取分析下的按掩膜提取功能與內(nèi)蒙古政區(qū)圖進行提取分析,分別得出通過三種插值方法得出的內(nèi)蒙古年均氣溫模型,圖2是普通克里金法得到的內(nèi)蒙古年均氣溫模型。圖3是反距離權(quán)重法得到的內(nèi)蒙古年均氣溫模型,圖4是樣條函數(shù)法得到的內(nèi)蒙古年均氣溫模型。
圖2、圖3、圖4分別使用不同插值方法得到的年均氣溫預(yù)測圖。IDW和普通克里金插值結(jié)果大都分布在—11℃到22℃之間,但是IDW出現(xiàn)了幾個明顯的“牛眼”,樣條插值結(jié)果溫度差較大,分析出現(xiàn)這種現(xiàn)象的原因是在反常插值結(jié)果的地區(qū)沒有訓(xùn)練站點氣溫數(shù)據(jù),樣條插值函數(shù)如果是根據(jù)附近站點數(shù)據(jù)得出的,插值結(jié)果會不精確,往往偏大。
將三種插值方法所得的擬合值與檢驗數(shù)據(jù)(實際數(shù)據(jù))進行對比,計算均方根誤差(RMSE)和R2。對內(nèi)蒙古38個點的年均溫度進行精度檢驗,對誤差進行分析(表1),R2模擬值見圖5-7。
總體來看插值方法中均方根誤差總體最小者,通常插值效果更好,將各插值方法按照誤差均值由小到大排列,排列結(jié)果為:普通協(xié)克里金插值法<反距離加權(quán)插值法<樣條函數(shù)插值法;決定系數(shù)由小到大排列結(jié)果為:普通協(xié)克里金插值法>反距離加權(quán)插值法>樣條函數(shù)插值法。本實驗中IDW和OK法的誤差均值相當(dāng)接近,而OK法的誤差均方根小于IDW法,IDW插值易出現(xiàn)“牛眼”現(xiàn)象,故對于此次實驗普通格里金插值法更準(zhǔn)確。
權(quán)重如何選擇是克里金插值與IDW插值的兩者之間最大的區(qū)別,IDW用來作為權(quán)重僅僅將距離的倒數(shù),與克里金插值相比較,忽略了空間相關(guān)性的問題。IDW首先將每兩個點進行配對,這樣產(chǎn)生自變量為兩點之間距離的函數(shù)。對于這種方法,可能會改變原始的輸入點。要想使結(jié)果更加可靠就要用更多的數(shù)據(jù)點。
反距離權(quán)重插值和普通克里金插值的影響因素包括采樣點范圍、采樣點密度、采樣點屬性取值變化以及各自的參數(shù)影響,當(dāng)采樣點的密度足夠時,使用反距離權(quán)重插值能夠得到的效果較好,在那些空間連續(xù)變化且光滑的表面的生成中比較適用的是普通克里金插值[7,8]。
4.2 結(jié)論
(1)普通克里金法、反距離權(quán)重法、樣條函數(shù)法三種插值方法對內(nèi)蒙古年均氣溫插值結(jié)果表明:在三種插值方法中,誤差最小的是普通克里金插值方法,較次的是反距離權(quán)重插值法,樣條函數(shù)插值法的誤差的最大,并且從得到的年均氣溫插值的結(jié)果可以看出,內(nèi)蒙古年均氣溫呈現(xiàn)東部溫度高于西部且成條帶狀分布。
(2)GIS軟件有著對于空間數(shù)據(jù)的強大處理能力,空間插值作為GIS中極為重要的空間分析方法,在觀測站點稀少并且部分地區(qū)的測點分布極其不合理,空間插值時研究這些區(qū)域空間變量空間分布的基本方法,前提是能夠建立起空間模型。
(3)影響空間插值精度的一個重要因素是樣本本身的空間分布,對空間插值而言,如果想要能夠反映數(shù)據(jù)空間變化趨勢和周期的合理的采樣,就要把精度提高,這樣看來設(shè)計是十分必要的。在那些氣象站點較少的區(qū)域,把隨機插值方法和確定性方法結(jié)合起來,才能合理的估計氣候變量的空間分布。
(4)在任何相等條件下能夠找到一種最優(yōu)空間插值方法是不切實際的,我們只能說只有在特定條件下的最優(yōu)方法。因此,數(shù)據(jù)的定性分析和對研究區(qū)的先驗的地理知識是能夠找到特定條件下最優(yōu)方法的依據(jù),選擇最適合的空間插值方法就要依據(jù)對數(shù)據(jù)的分析與處理來通過多次的實驗得到的。
(5)在本次研究過程中對于一些的氣象站點的年平均氣溫在零度以下的即是負(fù)數(shù)的,并沒有把負(fù)數(shù)改為正數(shù),所以最后得出的內(nèi)蒙古年均氣溫會有一些誤差,需要改進。
參考文獻:
〔1〕王新宇,黃鵬程.基于GIS的氣象要素插值方法比較研究[J].測繪與空間地理信息,2020,43(05):167-170.
〔2〕楊艷昭,郎婷婷,張超,賈琨.基于GIS的“一帶一路”地區(qū)氣溫插值方法比較研究[J].地球信息科學(xué)學(xué)報,2020,22(04):867-876.
〔3〕解恒燕,張深遠(yuǎn),侯善策,鄭鑫.降水量空間插值方法在小樣本區(qū)域的比較研究[J].水土保持研究,2018,25(03):117-121
〔4〕任璇,鄭江華,穆晨,閆凱,徐廷豹.不同氣象插值方法在新疆草地NPP估算中的可靠性評價[J].草業(yè)科學(xué),2017,34(03):439-448.
〔5〕錢永蘭,呂厚荃,張艷紅.基于ANUSPLIN軟件的逐日氣象要素插值方法應(yīng)用與評估[J].氣象與環(huán)境學(xué)報,2010,26(02):7-15.
〔6〕姜曉劍,劉小軍,黃芬,姜海燕,曹衛(wèi)星,朱艷.逐日氣象要素空間插值方法的比較[J].應(yīng)用生態(tài)學(xué)報,2010,21(03):624-630.
〔7〕封志明,鄭海霞,楊艷昭.基于GIS的農(nóng)業(yè)氣候資源區(qū)域化問題研究——以甘肅省為例[J].地理科學(xué),2004,34(04):444-451.
〔8〕林忠輝,莫興國,李宏軒,李海濱.中國陸地區(qū)域氣象要素的空間插值[J].地理學(xué)報,2002,9(01):47-56.