朱 聰,王文圣,程開宇,楊 娟
(1.中國水電顧問集團(tuán)華東勘測設(shè)計研究院,浙江 杭州 310014;2.四川大學(xué)水利水電學(xué)院,四川 成都 610065)
月徑流的變化常常受多種因素的影響,這些因素與月徑流之間存在著復(fù)雜的非線性關(guān)系。在月徑流展望預(yù)測 (即根據(jù)歷史月徑流資料,同時預(yù)測下一年各月的月平均徑流量)中,常用的統(tǒng)計方法很難描述多因子間的復(fù)雜關(guān)系。常規(guī)統(tǒng)計預(yù)測方法的一個共同特點(diǎn)是:先對數(shù)據(jù)的分布特征作某種假定,再按照一定準(zhǔn)則尋找最優(yōu)模擬,最后對建立的模型進(jìn)行證實(shí)。由于過于形式化、數(shù)學(xué)化,受束縛大,該類方法對月徑流這類高維非線性、非正態(tài)系統(tǒng)的適應(yīng)能力不強(qiáng)。
針對上述問題,近20年來,國際統(tǒng)計界提出了“直接從審視數(shù)據(jù)出發(fā)—通過計算機(jī)分析模擬數(shù)據(jù)—設(shè)計軟件程序檢驗”這樣一條探索性數(shù)據(jù)分析方法,投影尋蹤 (Projection pursuit,PP)方法就是這類方法的突出代表。投影尋蹤技術(shù)[1-2]是一種處理多因素復(fù)雜問題的統(tǒng)計方法,其基本思路是:把高維數(shù)據(jù)通過某種組合投影到低維子空間上,對于投影的構(gòu)形,采用投影指標(biāo)函數(shù)來衡量投影顯現(xiàn)某種結(jié)構(gòu)的可能性大小,尋找出使投影指標(biāo)函數(shù)達(dá)到最優(yōu)(能反映高維數(shù)據(jù)結(jié)構(gòu)或特征)的投影值,然后根據(jù)該投影值分析高維數(shù)據(jù)的結(jié)構(gòu)特征,或根據(jù)該投影值與研究系統(tǒng)輸出值之間的散點(diǎn)圖,構(gòu)造適當(dāng)?shù)臄?shù)學(xué)模型,來預(yù)測系統(tǒng)的輸出。
本文基于投影尋蹤分析與隨機(jī)分析提出了一種新的耦合預(yù)測模型:運(yùn)用投影尋蹤技術(shù)將年內(nèi)12個月徑流由遺傳算法優(yōu)化得投影值,獲取投影值與年徑流的相關(guān)關(guān)系;建立年徑流預(yù)測模型,由預(yù)測的年徑流推算對應(yīng)的投影值;尋找與最近鄰的h個模式,由最近鄰回歸進(jìn)行年內(nèi)月徑流展望預(yù)測。將耦合模型應(yīng)用于寶珠寺水電站和三峽水電站入庫月徑流展望預(yù)測,研究結(jié)果表明該耦合模型可行且預(yù)測效果較好。
設(shè) Q0i,j(i=1,2,…,n;j=1,2,…,12),為i年j月徑流量;n為年數(shù);y0i為i年徑流量。建立耦合模型的步驟如下。
(1)數(shù)據(jù)歸一化
式中,Q0j,max為j月徑流最大值;ymax為年徑流最大值;Qi,j、yi分別為歸一化月、年徑流。
(2)線性投影。將12維月徑流量投影到一維線性空間,得到投影指標(biāo)值
式中,zi為 i年投影特征值;=(a1,a2,…,a12)T為投影方向。
其相關(guān)關(guān)系可視具體情況而定。
(4)對年徑流建立預(yù)測模型,并預(yù)測來年年徑流量y^。本文采用最近鄰抽樣回歸模型[4]進(jìn)行預(yù)測,最近鄰抽樣回歸模型思路:構(gòu)造特征矢量Dt=(yt-1,yt-2, …, yt-p), 相應(yīng)后續(xù)值 yt(t=p+1, p+2, …,n);在Dt中,尋找k個與當(dāng)前特征矢量Di最近鄰(根據(jù) Dt和Di間的歐式距離來判斷)的特征矢量D1(i),D2(i),…,Dk(i);用下式計算 Di的后續(xù)值
式中,Wj(i)為抽樣權(quán)重。
式中,Q0l,j為抽取的第 l年各月徑流分配模式;Wl(j)為第j個月、第l個分配模式對應(yīng)的抽樣權(quán)重,算法如式(7)。
以寶珠寺水電站的入庫代表站三磊壩站38年(1964年~2001年)的年、月徑流資料為例。用其前34年(1964年~1997年)的月徑流資料建立模型,計算得到最優(yōu)投影方向=(0.065 2,0.128 9,0.161 0,0.208 2,0.213 6,0.198 0,0.207 9,0.440 9,0.484 9,0.248 0,0.426 9, 0.329 5), 并計算其投影指標(biāo)值{zi}34, 建立zi與歸一化年徑流量 yi的關(guān)系:zi=2.441yi+0.126。其相關(guān)關(guān)系非常密切,見圖1。
圖1 投影指標(biāo)值與歸一化年徑流量的關(guān)系
本例中,年徑流預(yù)測最近鄰數(shù)k=4,月徑流展望預(yù)測最近鄰數(shù)h=4。取后4年(1998年~2001年)作為檢驗?zāi)?,預(yù)測結(jié)果見表1及圖2。
表1 寶珠寺水電站1998年~2001年徑流預(yù)測結(jié)果
圖2 1998年~2001年月平均流量展望預(yù)測過程
類似地,用宜昌站前46年(1950年~1995年)月徑流資料建模,計算得最優(yōu)投影方向?a=(0.331 8,0.210 9, 0.455 4, 0.569 2, 0.435 0, 0.141 0,0.178 4, 0.072 8, 0.012 0, 0.204 9, 0.122 7,0.103 2),得到各年投影指標(biāo)值 {zi}46。建立zi與歸一化年徑流量yi的關(guān)系:zi=1.246yi+0.973。
本例中,年徑流預(yù)測的最近鄰數(shù)k=4,月徑流展望預(yù)測的最近鄰數(shù)h=2。展望預(yù)測后5年(1996年~2000年)月徑流量,結(jié)果見表2和圖3。
表2 三峽水電站1996年~2000年年徑流預(yù)測結(jié)果
圖3 1996年~2000年月平均流量展望預(yù)測過程
模型計算結(jié)果分析如表3。耦合模型在寶珠寺水電站應(yīng)用中,雖然投影值與年徑流關(guān)系密切,但由于采用的月徑流資料是一個小水文站前的資料,年際變化較大,使得預(yù)測效果一般;而在三峽水電站應(yīng)用中,采用的月徑流資料年際變化與小站的資料相比,比較穩(wěn)定,模型預(yù)測效果較好。其次,從圖3可以看出,預(yù)測過程會與其他模型類似,非汛期預(yù)測效果較好,汛期的預(yù)測效果較差,尤其在第一個例子中,某些年份還在汛期出現(xiàn)雙峰,年際變化復(fù)雜,使預(yù)測精度下降,但年內(nèi)月徑流展望預(yù)測本身具有一定的難度,原因在于月徑流分配形式取決于未來一年各月各日的降水量。而兩個例子都顯示,遇見期為1年時,該模型能較好地擬合出月徑流變化趨勢,展望預(yù)測效果較好。
表3 耦合模型月平均流量展望預(yù)測階段誤差
將投影尋蹤回歸分析與隨機(jī)分析相結(jié)合建立了一種新型耦合模型,該模型計算步驟簡潔合理,具有較強(qiáng)的理論性和較高的穩(wěn)健性。將耦合模型應(yīng)用于月徑流展望預(yù)測實(shí)例研究,結(jié)果表明是可行的。
[1]金菊良,魏一鳴,丁晶.投影尋蹤門限回歸模型在年徑流預(yù)測中的應(yīng)用[J].地理科學(xué),2002,22(2):171-175.
[2]王順久,張欣莉,丁晶,等.投影尋蹤聚類模型及應(yīng)用[J].長江科學(xué)院院報,2002,19(6):53-55.
[3]金菊良,丁晶.水資源系統(tǒng)工程[M].四川科學(xué)技術(shù)出版社,2002:65-67,162-163.
[4]王文圣,向紅蓮,丁晶.最近鄰抽樣回歸模型在水文水資源預(yù)報中的應(yīng)用[J].水電能源科學(xué),2001,19(2):8-10,14.