吳士夫,伏 琳,羅 興
(1.長江委水文中游局赤壁分局,湖北 赤壁 437302;2.長江委水文中游局河道勘測中心,武漢 430012)
水文時間序列中的暴雨序列、年最大洪峰流量序列等幾乎都是非線性、非平穩(wěn)、弱相依且高度復雜的時頻多變序列[1],對非平穩(wěn)時間序列進行分析,具有重大的意義。本文應用時間序列分析方法,將年最大流量時間序列分解為趨勢序列、周期序列和平穩(wěn)隨機序列,并采用時序遞階組合模型來預測。
水文時間序列x(t),一般由趨勢項f(t),周期項p(t)和隨機項η(t)組成,可以用以下組合模型描述:
趨勢項反映的是水文現(xiàn)象因水文或氣象因素而引起的季節(jié)性趨勢或多年變化趨勢,周期項反映的是水文現(xiàn)象的周期性變化,這兩項反映的是水文時間序列變化中的確定性成分。通過對序列趨勢項、周期項的識別和提取,剩余系列就是隨機項,可用平穩(wěn)的時間序列來分析。在此基礎上建立時序遞階組合模型,即可對年最大流量進行預測。
時間序列的趨勢性可以通過斯波曼(Spearman)秩次相關(guān)檢驗、肯德爾(Kendal)秩次相關(guān)檢驗、滑動平均以及游程檢驗等方法來檢驗。本文采用Kendall秩次相關(guān)檢驗法[2]進行趨勢性識別。
Kendall秩次相關(guān)法是建立在連續(xù)實測值的比例數(shù)基礎上,是一種非參數(shù)統(tǒng)計檢驗法。對于水文序列xi,先確定所有對偶值(xi,xj;j>i,i=1,2,…,n-1;j=i+1,i+2,…,n)中的xi<xj的出現(xiàn)個數(shù)p,對于無趨勢的序列,p的數(shù)學期望值為:
構(gòu)建Mann-Kendall秩次相關(guān)檢驗的統(tǒng)計量:
當n增加時,U很快收斂于標準化正態(tài)分布。假定序列無變化趨勢,當給定顯著水平α后,可在正態(tài)分布表中查得臨界值Ua/2,當|U|>Ua/2時,拒絕假設,即序列的趨勢性顯著。反之,趨勢不顯著。
確定序列存在趨勢項之后,一般采用線性關(guān)系式、對數(shù)關(guān)系式、指數(shù)關(guān)系式或者多項式關(guān)系式來對趨勢項進行曲線擬合。
水文時間序列經(jīng)分離出趨勢項后,將剩余的序列進行周期分析,本文采用方差分析法[3]分析水文時間序列的周期性,方法簡述如下。
(1)識別最大可能的周期數(shù)K。
則序列中可能存在的周期長度為2,3,4,…,[N/2]。
(2)按試驗周期排列數(shù)據(jù),計算組間和組內(nèi)離差平方和。
式中,j表示組別,j=1,2,…,b表示分為b組;i為每組含有的項數(shù),i=1,2,…,aj表示每組有aj個數(shù)據(jù)。
(3)計算試驗周期的方差比。
式中,f1=b-1,表示組間自由度,f2=n-b,表示組內(nèi)自由度。
(4)F檢驗確定顯著周期。選定某一信度α(常取0.05或0.1)。由α,f1,f2查F分布表,可得該信度下F值。若F>Fα,則該試驗周期顯著;若F<Fα,則該試驗周期不顯著。
(5)從所有的顯著試驗周期中選擇F最大的試驗周期為第一周期,并將其從初始序列中濾去。將剩余序列再重復上述步驟,直至不存在顯著周期。
(6)將各周期值疊加并外推,即可擬合周期項并進行周期項預報。
水文時間序列經(jīng)適當?shù)奶崛≮厔蓓椇椭芷陧椇?,剩余的最終余波即為平穩(wěn)隨機序列,因此可用線性自回歸模型AR(p)對其進行擬合和預報。
(1)模型的建立。
自回歸模型AR(p)的形式為:
式中,bp,i(i=1,2,…,p)為自回歸模型系數(shù),p為模型階數(shù),ε(t)為殘差項,自回歸模型系數(shù)可通過建立Yuler-Walker方程組[4],采用下列遞推公式求得:
式中,rk為序列的k階自相關(guān)系數(shù),用下式計算:
(2)模型的識別。
模型階數(shù)p的識別,對AR(p)模型來講甚為重要,可用FPE(最終預報誤差)準則來確定。
式中,k為所取階數(shù),n為樣本數(shù),為k階預報誤差方差,可由下式算得:
截止階數(shù)p的取法按經(jīng)驗來取。
在對最終余波建立合適的AR(p)模型后,便可對最終余波進行預測,設系列在t+1時刻的預測值為,將它與前面分析的各周期波疊加,再經(jīng)差分還原計算,即得到最終的預報值,即
式中,pi(t+1)為周期波i在時刻t+1的值。
毛家橋水文站位于湖北省崇陽縣白霓鎮(zhèn)橋局村,是控制陸水水庫小港南支高堤河水情的基本站,控制流域面積364km2,是一個典型的山溪性河流測站,水位暴漲暴落,洪峰時間持續(xù)較短。
采用毛家橋水文站1961~2010年的年最大流量資料,以1961~2000年共40年的資料建立時序遞階組合模型,用2001~2010年共10年的資料對模型進行檢驗,以確認模型的精度。
根據(jù)毛家橋水文站1961~2000年的年最大流量資料,用Kendall相關(guān)檢驗法對其進行分析,計算得Kendall統(tǒng)計量值U=1.174。
取顯著性水平α=0.05,則相應的檢驗臨界值為Uα/2=1.96,|U|<Uα/2,即表明毛家橋水文站年最大流量序列不存在明顯的趨勢成分,無須進行趨勢項擬合。
用方差分析法對年最大流量系列進行周期分析識別,選擇信度α=0.05,經(jīng)分析,第一周期T=8,方差比F=3.902>F(0.05)=2.3,第二周期T=13,方差比F=2.112>F(0.05)=2.07,從年最大流量系列中依次剔除這些周期項后,得到最終余波。
對最終余波進行自回歸分析,建立AR(p)模型。通過計算,確定AR(5)模型為最終預報模型,即:
將8年、13年兩個周期波與最終余波的預測值疊加,分別進行模擬和檢驗,即可得到序列的模擬值和檢驗值。
利用該組合模型對毛家橋水文站1961~2000年的年最大流量資料進行擬合,用2001~2010年的實測資料對模型進行檢驗,并將擬合值和實測值進行比較,擬合效果見圖1。按20%為允許誤差標準,擬合段合格率為82.5%,檢驗段合格率為70%。模型擬合效果較好,但外延效果一般。
圖1 毛家橋水文站時序遞階組合模型預測年最大流量過程
(1)模型擬合效果較好,但外延效果一般。在2001年到2010年共10年的年最大流量預測結(jié)果中,前5年預測值相對于實測值的誤差都小于10%,預測精度較高。后5年的預測誤差較大,這是由于平穩(wěn)隨機序列模型后一年的預測值依賴于前一年的預測值,預測誤差存在疊加放大的趨勢所致。在實際應用過程中,建議外推年限一般不要超過5年。
(2)時間序列分析方法是一種對歷史數(shù)據(jù)進行分析的數(shù)學方法,其精度取決于用于建模的歷史數(shù)據(jù),資料系列越長擬合精度就越高。一般建議資料系列長度不宜短于30年。
(3)平穩(wěn)隨機序列模型后一年的預測值依賴于前一年的預測值,因此在應用時序遞階組合模型進行外推預測時,應盡可能結(jié)合氣象要素等的變化特征或近幾年水文要素的演變趨勢等進行綜合分析,并把近年的新序列加到原序列中,重新建立模型,以提高預測的精度。
[1]王義民,張 玨.HHT在年最大洪峰流量規(guī)律分析中的應用[J].計算機工程與應用,2009,45,(34):204-211.
[2]李春暉,楊志峰.黃河流域分區(qū)天然徑流量趨勢性與持續(xù)性特征[J].水文,2005,25,(1):13-14.
[3]范鐘秀.中長期水文預報[M].南京:河海大學出版社,1999.
[4]丁 晶,鄧育仁.隨機水文學[M].成都:成都科技大學出版社,1988.