白冬妹,郭滿才,郭忠升,陳亞楠
(1.西北農(nóng)林科技大學 理學院,陜西 楊凌712100;2.西北農(nóng)林科技大學 水土保持研究所,陜西 楊凌712100;3.中國科學院/水利部 水土保持研究所,陜西 楊凌712100)
(責任編輯 徐素霞)
黃土高原大部分地區(qū)水資源缺乏,土壤水分是限制植被建設(shè)的重要因素,一直受到人們的高度關(guān)注與重視。土壤水分含量受到很多因素的影響,如氣候條件、土壤、前期土壤水分存儲、土壤水分補給和消耗等[1],具有很大的隨機性。在黃土丘陵半干旱區(qū),多年生檸條林地土壤旱化嚴重,為了實現(xiàn)土壤水資源可持續(xù)利用,需要依據(jù)土壤水分狀況,調(diào)控檸條生長與土壤水關(guān)系[2],因此監(jiān)測和預(yù)報土壤水分是防旱抗旱、調(diào)控檸條生長與土壤水關(guān)系的基礎(chǔ)。
時間序列分析主要是采用參數(shù)模型對所觀測到的有序隨機數(shù)據(jù)進行分析和處理的一種方法[3],這種方法不僅可以分析因果關(guān)系,而且能根據(jù)時間序列過去的變化規(guī)律推斷以后的趨勢[4]。目前時間序列分析廣泛應(yīng)用于工農(nóng)業(yè)生產(chǎn)、自然科學、社會科學、醫(yī)學、金融及各種工程領(lǐng)域[4]。在土壤水分動態(tài)模擬方面,劉洪斌等[5]采用時間序列自回歸建模方法對紫色土丘陵旱坡地土壤水分動態(tài)進行了模擬和預(yù)測,取得了較好的成效;楊紹輝等[3]應(yīng)用ARIMA 時間序列模型對北京市大興區(qū)蘆城的土壤墑情建立模型并預(yù)測,認為ARIMA時間序列模型能很好地預(yù)測土壤墑情的變化趨勢,有實際的應(yīng)用價值;張和喜等[6]在干旱地區(qū)土壤墑情研究中用到了時間序列自回歸模型,認為該模型可以為干旱研究及治理提供依據(jù)。本文在研究黃土丘陵半干旱地區(qū)檸條林地土壤含水量動態(tài)變化方面運用時間序列自回歸模型,試圖建立合理的模型并預(yù)測土壤含水量,為黃土丘陵區(qū)植物與土壤水分關(guān)系調(diào)控和植被建設(shè)提供技術(shù)支撐。
自回歸模型就是用自身做回歸變量,q 階自回歸過程{Xt}滿足以下方程[7]:
式中:μ 為時間序列的均值;φ1,φ2,…,φq為系數(shù);時間序列{Xt}的當期值是自身最近q 階滯后項和et的線性組合,其中et包括了序列在t 期無法用過去值來解釋的所有新信息。
在時間序列分析中常用自相關(guān)系數(shù)反映不同時期觀測值之間的相互關(guān)系,t 時刻的觀測值與滯后k 時刻的觀測值之間的相關(guān)程度稱為時間延遲k 的自相關(guān)系數(shù),記為rk,即
一般情況下計算n/5 個自相關(guān)系數(shù)[8],即k =1,2,…,[n/5]。
模型定階的準則主要有自相關(guān)函數(shù)、偏自相關(guān)函數(shù)、AIC 和BIC[7]。本文選用研究最多的赤池信息量準則(Akaike’s Information Criterion,AIC)確定自回歸模型的階數(shù),計算公式為
式中:L 為似然函數(shù);m 為參數(shù)的數(shù)量,如果模型包含截距項或常數(shù)項,則m=q+1,否則m=q。
根據(jù)土壤含水量時間序列的自相關(guān)分析,確定模型的可能最高階,用最大似然估計法估計各階模型的參數(shù),取AIC 最小值對應(yīng)的階數(shù)作為模型的最佳階數(shù),最后確定AR 模型。
如果模型被正確識別,并且參數(shù)估計充分接近真值,那么擬合的殘差應(yīng)該是獨立同分布的具有零均值和相同標準差的白噪聲序列。擬合模型的適合性檢驗就是檢驗殘差是否是白噪聲序列,文中采用卡方檢驗法驗證白噪聲序列。
設(shè){εt}為選定AR 模型估計出的殘差序列,由式(2)得到殘差序列樣本自相關(guān)函數(shù)為
Ljung-Box 統(tǒng)計量[7]計算式為
試驗區(qū)位于黃土丘陵半干旱區(qū)的上黃生態(tài)試驗站(寧夏固原),該站地理位置為北緯35°59'—36°02'、東經(jīng)106°26'—106°30'。試驗地坡度為0 ~15°,海拔約為1 650 m。該地區(qū)年內(nèi)降水量分配不均,主要集中在6—9月,占年降水量的70%以上,年際降水量變化在634.7(1984年)~259.9 mm(1991年)之間,無霜期152 d,土壤為黃綿土,植被類型為灌叢草原。試驗區(qū)主要植物有長芒草(Stipa bungeana Trin.)、阿爾泰狗娃花(Heteropappus altaicus)、茭蒿(Artemisia giraldii Pamp.)、百里香(Thymus mongolicus Ronn.)等。
試驗小區(qū)為5 個立地條件基本相同的標準徑流小區(qū),每個小區(qū)長20 m、寬5 m,檸條林為2002年播種,各小區(qū)播種量分別為2.0、1.5、1.0、0.5、0 kg(對照)。在每個徑流小區(qū)中部安置兩個相距2 m 的PVD 套管,管長8 m,用CNC503A(DR)型智能中子水分儀測定土壤水分。測定前對中子儀進行標定,標定方程為y =55.76x+1.89,式中y 為容積含水量,x 為中子儀讀數(shù)[10]。土壤水分測定深度為5—780 cm,每20 cm 測定并記錄一次數(shù)據(jù)。用環(huán)刀取樣,測定5 和20 cm 深處土壤水分,對表層土壤水分資料進行驗證和校正。除表層5 cm 測點數(shù)值代表0—10 cm 平均值外,其他測點土壤水分值代表測點高度±10 cm 范圍內(nèi)土壤水分[10]。受當?shù)貧夂蛴绊?,檸條4月中旬開始生長,10月份之后停止生長,直到第二年4月中旬繼續(xù)生長,因此土壤含水量測定時間為:每年4月中旬到10月底每隔15 d 測定一次,11月到次年3月每月測定一次。本文選取2011年4月至2013年2月的土壤水分資料作為研究對象,對檸條林地土壤含水量動態(tài)變化進行分析及預(yù)測。
運用MATLAB 及R 軟件處理數(shù)據(jù)。
3.1.1 數(shù)據(jù)標準化
通過計算各層土壤含水量的變異系數(shù),發(fā)現(xiàn)各土層土壤變異系數(shù)存在以下規(guī)律:5、20、40 cm 土層土壤水分的變異系數(shù)范圍為20% ~30%,屬于比較劇烈的變異;60—120 cm 土層土壤水分的變異系數(shù)在10% ~20%之間,屬于中等程度的變異;而140 cm 以下土層土壤水分的變異系數(shù)均小于10%,屬于弱變異。這說明表層的土壤水分值變化較快,不穩(wěn)定,而深層土壤水分值變化緩慢,比較穩(wěn)定??紤]到各變異程度的土層土壤含水量變化,本研究選取20、80、160 cm 深處土層的土壤水分數(shù)據(jù)為例進行分析,建立時間序列模型。
為了滿足數(shù)據(jù)分析的需要,同時提高運算精度,首先應(yīng)對原始數(shù)據(jù)進行標準化處理。標準化公式為
式中:Yt為標準化后的時間序列;Xt為原始時間序列;X 是時間序列{Xt}的均值;σ 是時間序列{Xt}的標準差。以20 cm 深處土層土壤含水量序列為例,標準化后如圖1。
3.1.2 平穩(wěn)性
時間序列模型的分析都是建立在序列平穩(wěn)的基礎(chǔ)上的,一個平穩(wěn)的隨機過程有以下要求:均值不隨時間變化;自相關(guān)系數(shù)只與時間間隔有關(guān),而與所處的時間無關(guān)。實際上,自然界大多數(shù)時間序列都是不平穩(wěn)的[11],由圖1 可以看出,20 cm 深處土層土壤含水量序列是非平穩(wěn)的。本研究對各土層含水量序列進行了Dickey-Fuller 單位根檢驗,結(jié)果見表1。20、80 和160 cm 深處土層的含水量序列經(jīng)Dickey-Fuller 檢驗后p值依次為0.504 9、0.399 5、0.551 1,均大于0.1,序列存在單位根,所以原始序列為不平穩(wěn)的。通常經(jīng)過差分使得序列變得平穩(wěn),差分公式為Wt=Yt-Yt-1。經(jīng)過一階差分之后,檢驗得到的p 值分別為0.035 8、0.014 3、0.051 0,均小于0.1,據(jù)此可以認為經(jīng)過一階差分之后的時間序列為平穩(wěn)序列。
圖1 標準化后的20 cm 深土層土壤含水量序列
表1 各土層含水量時間序列的平穩(wěn)性檢驗
以20 cm 深處土層土壤含水量為例,差分后序列如圖2,可以看出差分后的序列沒有明顯的時間趨勢;有些時間點上序列波動較劇烈,這是由于20 cm 土層土壤含水量受降雨量影響較大,Dickey-Fuller 檢驗結(jié)果認為差分后的20 cm 土層土壤含水量序列為平穩(wěn)序列,符合時間序列的建模要求。
圖2 差分后的20 cm 土層土壤含水量序列
3.2.1 模型的定階及參數(shù)估計
應(yīng)用2011年4月到2012年11月的39 組土壤含水量序列數(shù)據(jù)進行自相關(guān)分析,分析39/5≈8 個自相關(guān)系數(shù),結(jié)果見表2。rk為滯后階數(shù)k 時的自相關(guān)系數(shù),當k 值取4 的時候,表2 中20、80、160 cm 三個土層的rk值都比較接近于0,故可以將模型參數(shù)估計時的最高階數(shù)定為4。
表2 土壤含水量時間序列自相關(guān)系數(shù)
確定階數(shù)后,運用最大似然估計法估計模型的參數(shù),并用式(4)計算各階次的AIC 值,結(jié)果見表3。選取AIC 最小值對應(yīng)的階次為模型的滯后階數(shù),可以看出20 cm 土層AIC 最小值為113.69,說明20 cm 土層含水量序列的模型為AR(1);80 cm 土層AIC 最小值為112.25,確定模型為AR(1);160 cm 土層AIC 最小值為77.35,確定模型為AR(2)。各層土壤含水量擬合模型見表4,Wt為差分后的土壤含水量時間序列。
表3 各土層含水量時間序列模型的參數(shù)估計結(jié)果
表4 各層土壤含水量時間序列模型的擬合結(jié)果
3.2.2 模型診斷
由式(1)可知AR 模型的殘差為
結(jié)合式(6)對20、80、160 cm 三個土層土壤含水量序列所對應(yīng)的模型殘差序列進行白噪聲檢驗,評價模型的擬合優(yōu)度,模型診斷結(jié)果見表5。
表5 各層土壤含水量序列模型的診斷結(jié)果
從表5 可以看出,這3 個模型都通過了檢驗,可以認為構(gòu)建時間序列自回歸模型預(yù)測黃土丘陵區(qū)半干旱地區(qū)檸條林地土壤含水量是合理的。
一個模型的擬合程度較好不僅在于模型診斷結(jié)果,還在于模型的實際驗證。本研究選取2011年4月至2012年11月的39 組數(shù)據(jù)進行模型擬合,經(jīng)模型診斷認為擬合較好,為了進一步檢驗?zāi)P偷膶嵱眯?,我們運用建立的模型預(yù)測2012年12月至2013年2月的6組土壤含水量數(shù)據(jù)。用Yt-Yt-1替換表4 中的Wt,得到預(yù)測模型,將式(6)變?yōu)閄t=σYt+X 得到原始時間序列{Xt},20、80、160 cm 土層土壤含水量實測值與預(yù)測值及相對誤差見表6。
由表6 可以看出,未來3 個月的預(yù)測數(shù)據(jù)與實測數(shù)據(jù)相對誤差較小,20 cm 土層土壤含水量預(yù)測值與實測值的相對誤差變化范圍為-5.76% ~5.92%,80 cm 土層實測值與預(yù)測值的相對誤差變化范圍為0.05% ~5.28%,160 cm 土層預(yù)測值與實測值之間的相對誤差范圍為-5.71% ~2.66%,均小于10%,所以認為本研究建立的自回歸時間序列模型能夠有效地預(yù)測土壤含水量,對不同變異程度的土層土壤含水量預(yù)測效果也較好,可為黃土丘陵區(qū)土壤水分與植物關(guān)系調(diào)控和植被建設(shè)提供技術(shù)支撐。
表6 各層土壤含水量序列模型的驗證結(jié)果 %
文中將3 個土層土壤含水量序列進行標準化及差分處理后,用Dickey-Fuller 單位根檢驗得出差分后的土壤含水量時間序列為平穩(wěn)序列,符合時間序列的建模要求。對于時間序列自回歸模型的階數(shù)問題,本研究選用AIC 準則確定了3 個土層的階數(shù)并建立模型,由卡方檢驗結(jié)果認為模型擬合得較好。最后用2012年12月至2013年2月的數(shù)據(jù)驗證模型,3 個土層預(yù)測值與實測值的相對誤差均小于10%,說明該模型對各變異系數(shù)的土層土壤含水量預(yù)測精度高,更進一步說明了時間序列自回歸模型能夠較好地預(yù)測黃土丘陵半干旱地區(qū)檸條林地土壤含水量,為該地區(qū)植物與土壤水關(guān)系的調(diào)控及植被建設(shè)提供技術(shù)支撐。
[1]尚松浩.土壤水分模擬與墑情預(yù)報模型研究進展[J].沈陽農(nóng)業(yè)大學學報,2004,35(5-6):455-458.
[2]郭忠升,李耀林.植物生長與土壤水關(guān)系調(diào)控起始期[J].生態(tài)學報,2009,29(10):5721-5729.
[3]楊紹輝,王一鳴,郭正琴,等.ARIMA 模型預(yù)測土壤墑情研究[J].干旱地區(qū)農(nóng)業(yè)研究,2006,24(2):114-118.
[4]祖元剛,趙則海,于景華,等.非線性生態(tài)模型[M].北京:科學出版社,2004.
[5]劉洪斌,武偉,魏朝富,等.AR 模型在土壤水分動態(tài)模擬中的應(yīng)用[J].山地學報,2003,22(1):121-125.
[6]張和喜,楊靜,方小宇,等.時間序列分析在土壤墑情預(yù)測中的應(yīng)用研究[J].水土保持研究,2008,15(4):82-84.
[7]Cryer Jonathan D,Chan Kung-Sik.時間序列分析及應(yīng)用:R語言[M].第2 版.潘紅宇,譯.北京:機械工業(yè)出版社,2011:1.
[8]秦華光,李家才,穆丹,等.時間序列自回歸模型預(yù)測茶園小綠葉蟬種群動態(tài)的探討[J].安徽農(nóng)業(yè)大學學報,2008,35(4):564-570.
[9]于寧莉,易冬云,涂先勤.時間序列中自相關(guān)與偏自相關(guān)函數(shù)分析[J].數(shù)學理論與應(yīng)用,2007,27(1):54-57.
[10]郭忠升,邵明安.人工檸條林地土壤水分補給和消耗動態(tài)變化規(guī)律[J].水土保持學報,2007,21(2):119-123.
[11]李慶雷,馬楠,付遵濤.時間序列非平穩(wěn)檢測方法的對比分析[J].北京大學學報:自然科學版,2013,49(2):252-260.