許鈺沐,牛秀嶺
(1.山西冶金巖土工程勘察有限公司,山西 太原 030024;2.山西水務(wù)交口供水開發(fā)建設(shè)管理有限公司,山西 太原 030024)
科學(xué)合理的汛期分期對(duì)于流域的防洪減災(zāi)及水資源合理利用與保護(hù)具有十分重要的意義[1]。不同年份降雨量在不同時(shí)間段變化較大,汛期在不同年份都具有隨機(jī)性、模糊性等變化規(guī)律[2]。目前,針對(duì)這些特點(diǎn),現(xiàn)行的分期方法中僅Fisher分割法既能處理多指標(biāo)的聚類問(wèn)題,又能同時(shí)考慮樣本時(shí)序性,在汛期分期中應(yīng)用廣泛[3-4]。但Fisher分割法在處理多指標(biāo)聚類問(wèn)題時(shí)缺乏對(duì)指標(biāo)權(quán)重的考慮,即便唐莉等人將主成分分析法(PCA,principal component analysis)[5]與Fisher最優(yōu)分割法結(jié)合,稱之為PCA-Fisher最優(yōu)分割,對(duì)水庫(kù)進(jìn)行汛期分期,克服了Fisher最優(yōu)分割法視各指標(biāo)等權(quán)重的不足[5],但以往人們?cè)谶\(yùn)用Fisher分割法汛期分期時(shí),存在人為確定汛期研究域與汛期分期的研究論域的問(wèn)題,對(duì)于汛期的界定及汛期分期基本時(shí)間單元的選取都帶有強(qiáng)烈的主觀性與不確定性[6-7]。為此,本文以張家莊水庫(kù)為例,首先定量確定汛期研究域,再分別以旬與候?yàn)檠芯空撚?,采用PCA-Fisher最優(yōu)分割法,對(duì)水庫(kù)進(jìn)行汛期分期。
Fisher最優(yōu)分割法是將樣本分成若干類,對(duì)一列有序樣本進(jìn)行分割,其分割原則是各類間的差異最大,各類內(nèi)部的差異最小。具體分割步驟如下:
(1)樣本數(shù)據(jù)處理。設(shè)n個(gè)有序樣本,各有m項(xiàng)評(píng)價(jià)指標(biāo),xij即為第i個(gè)樣本的第j個(gè)指標(biāo)特征值,構(gòu)造指標(biāo)特征值矩陣X,對(duì)各指標(biāo)無(wú)量綱化,得標(biāo)準(zhǔn)矩陣X′。即
xij′=xij/xmaxj
(1)
式中,xmaxj為第j個(gè)指標(biāo)中的最大值,xij′是無(wú)量綱化后的值。
(2)定義類直徑。設(shè)某類Gij={yi,yi+1,…,yj}j>i)的樣本離差平方和為其直徑D(i,j)V,即
(2)
(4)最優(yōu)解的確定。Fisher最優(yōu)分割法具有如下遞推定理
(3)
(4)
當(dāng)分k類時(shí),找ik分割點(diǎn)使得式(4)的值最小,即F(n,k)=F(ik-1,k-1)+D(ik,n);從而求出第k類。然后再求ik-1分割點(diǎn),使F(ik-1,k-1)=F(ik-1-1,k-2)+D(ik-1,n),以此類推得出所有分割點(diǎn)求出最優(yōu)解。
(5)最優(yōu)分類數(shù)的確定。F(n,k)~k曲線的轉(zhuǎn)折處的k值即為最優(yōu)分類數(shù);或當(dāng)β(k)較大時(shí)則表示分k類較優(yōu),β(k)=|F(n,k)-F(n,k-1)|,一般以β(k)最大值時(shí)對(duì)應(yīng)k值為最優(yōu)分類數(shù)目。
王賀佳等提出可以采用均值變點(diǎn)分析將尋找非汛期與汛期轉(zhuǎn)化為尋找降雨-徑流相關(guān)系數(shù)強(qiáng)度的變點(diǎn)[6]。均值變點(diǎn)分析的步驟如下:
對(duì)于有序相關(guān)系數(shù)數(shù)列{λθ}(θ=1,2,…,12),以λt為端點(diǎn)將{λθ}劃分為兩列:λ1,λ2,…,λt和λt,λt+1,…,λ12,其中λt=max(λ1,λ2,…,λ12)。
假定{λθ}在第θ個(gè)月與第θ+1個(gè)月處斷開,則可計(jì)算統(tǒng)計(jì)量Dt和D,即
(5)
(6)
β=D-Dt
(7)
式中,最大β對(duì)應(yīng)的第θ個(gè)月為變點(diǎn),從而可以求出汛期開始的月。
同理,對(duì)有序數(shù)列λt,λt+1,…,λ12進(jìn)行上述演算,也就可以得到汛期結(jié)束的月。根據(jù)汛期開始與結(jié)束的月,可以對(duì)汛期與非汛期進(jìn)行劃分。
張家莊水庫(kù)位于山西省孝義市城西2.5 km的孝河上,是一座綜合利用的中型水庫(kù),兼有防洪、農(nóng)業(yè)灌溉、生態(tài)供水等綜合效益。
本文以張家莊水庫(kù)1994年~2014年共21 a的月降雨-徑流資料為基礎(chǔ),得到了月降雨P(guān)和徑流R的平均相關(guān)系數(shù)矩陣X=[0.02 0.24 0.22 0.39 0.64 0.72 0.73 0.67 0.75 0.50 0.29 0.01]T,可得最大相關(guān)系數(shù)為0.75;以0.75為端點(diǎn),可將月降雨P(guān)和徑流R的平均相關(guān)系數(shù)矩陣劃分兩列,即1月到9月和9月到12月兩列,分別使用式(5)~(7)對(duì)兩列相關(guān)系數(shù)矩陣計(jì)算β。結(jié)果見圖1及圖2。由圖1、2可知,第1變點(diǎn)為第4個(gè)月,第2個(gè)變點(diǎn)為10月,即4月到10月為張家莊水庫(kù)汛期。
圖1 β隨 θ變化第1變點(diǎn)
圖2 β隨 θ變化第2變點(diǎn)
2.2.1樣本指標(biāo)選取及指標(biāo)權(quán)重計(jì)算
表3 以旬為基本單元的F(n,k)計(jì)算結(jié)果
以4月~10月為汛期研究域,可將整個(gè)汛期研究時(shí)段劃分為21個(gè)旬。以張家莊水庫(kù)1962年~2014年共53 a的逐日降雨資料為基礎(chǔ),選取表1中能反映張家莊水庫(kù)流域范圍內(nèi)暴雨洪水特征的4個(gè)指標(biāo)作為研究對(duì)象。運(yùn)用SPSS軟件對(duì)標(biāo)準(zhǔn)化的樣本數(shù)據(jù)進(jìn)行主成分分析[8],可得表1及表2。
表1 成分矩陣(成分1)
表2 解釋的總方差 %
由表2可知,主成分1特征累積方差貢獻(xiàn)率≥80%。因此,其能夠反映各指標(biāo)的大部分信息。
各指標(biāo)的權(quán)重ω=(0.745,0.188,0.035,0.032)。
2.2.2分期計(jì)算
由于各指標(biāo)間的單位不同,首先要將各指標(biāo)進(jìn)行無(wú)量綱化處理。再利用上面求得各指標(biāo)的權(quán)重系數(shù),對(duì)無(wú)量綱化的結(jié)果求加權(quán)平均值。最后計(jì)算得出初始分類樣本Y=[0.18 0.22 0.26 0.21 0.35 0.40 0.38 0.61 0.71 1.27 0.94 1.18 1.17 1.16 1.08 0.92 0.76 0.68 0.54 0.36 0.25]T;再計(jì)算各截?cái)鄻颖镜哪繕?biāo)函數(shù)F(n,k)值,計(jì)算結(jié)果見表3。
繪制目標(biāo)函數(shù)F(n,k)~k、β(k)~k曲線如圖3所示。從圖3可以看出,在k=3處F(n,k)~k曲線最陡并出現(xiàn)拐彎,且β(k)~k曲線,k=3時(shí),取值最大。所以可確最優(yōu)定分類數(shù)k=3。從表4可以得出{1,2,3,4,5,6,7,8}、{9,10,11,12,13,14}和{15,16,17,18}3類。即,4月1日到6月20日為前汛期,6月21日到8月20日為主汛期,8月21日到10月30日為后汛期。
圖3 以旬為論域的F(n,k)~k和 β(k)~k曲線
表4 以候?yàn)榛締卧腇(n,k)計(jì)算結(jié)果
2.3.1樣本指標(biāo)選取及指標(biāo)權(quán)重計(jì)算
以4月~10月為汛期研究域,可將整個(gè)研究時(shí)段劃分為42個(gè)候。資料指標(biāo)選取同上。運(yùn)用SPSS軟件對(duì)標(biāo)準(zhǔn)化的樣本數(shù)據(jù)進(jìn)行主成分分析[9],得到各指標(biāo)的權(quán)重ω=(ω1,ω2,ω3,ω4)=(0.865,0.073, 0.056, 0.005)。
2.3.2分期計(jì)算
以候?yàn)檎撚?,?duì)各樣本指標(biāo)無(wú)量綱化后,得出初始分類樣本向量為:Y=[0.10 0.16 0.16 0.19 0.21 0.14 0.18 0.15 0.24 0.23 0.31 0.23 0.28 0.23 0.38 0.33 0.34 0.58 0.86 0.69 0.52 0.59 0.52 1.00 0.90 0.43 0.84 0.50 0.54 0.76 0.53 0.52 0.41 0.47 0.39 0.51 0.33 0.31 0.28 0.18 0.20 0.14]T。
再計(jì)算各截?cái)鄻颖镜哪繕?biāo)函數(shù)F(n,k)值,計(jì)算結(jié)果見表4。
圖4 以候?yàn)檎撚虻腇(n,k)~k和 β(k)~k曲線
繪制目標(biāo)函數(shù)F(n,k)~k、β(k)~k曲線(見圖4)。由表4可得{1~17}、{18~29}和{30~42}3類,即4月1日到6月15日為前汛期,6月16日到8月31日為主汛期,9月1日到10月30日為后汛期。
張家莊水庫(kù)現(xiàn)行的汛期研究域?yàn)?月~9月,而采用均值變點(diǎn)得到張家莊水庫(kù)汛期研究域?yàn)?月~10月。其中,4月、5月和10月雖然不是北方地區(qū)公認(rèn)的入汛期;但張家莊的降雨數(shù)據(jù)顯示,4月份降雨總量于1994年首次超過(guò)7月,1994年后4月份降水總量頻繁偏大。在1963年與1980年5月降水總量為全年最大值,其余年內(nèi)有時(shí)5月比6月的降雨量還要多。研究期內(nèi)多年10月與9月的降雨量相當(dāng),因此考慮氣候變化和極端天氣這兩個(gè)因素,將4月、5月和10月劃分到汛期里是合理的。
以旬與候?yàn)榛镜难芯空撚蚍謩e對(duì)張家莊主汛期進(jìn)行劃分,得到主汛期時(shí)間段差異較大,以候?yàn)榛镜臅r(shí)間單元,得到張家莊水庫(kù)主汛期較以旬為基本時(shí)間單元長(zhǎng)15 d,表現(xiàn)為主汛期提前到來(lái)且推后結(jié)束。究其原因,以候?yàn)榛镜臅r(shí)間單元,汛期分期更為精細(xì),樣本間差異更為微小。在采用PCA-Fisher最優(yōu)分割法進(jìn)行汛期分期時(shí),主汛期的時(shí)間跨度會(huì)變大,實(shí)際中主汛期變長(zhǎng)有助于流域的防洪減災(zāi),更有利于保障下游城鎮(zhèn)居民的安全。因此,在進(jìn)行流域汛期分期時(shí),需要對(duì)比不同研究論域的汛期分期結(jié)果,盡可能地進(jìn)行科學(xué)合理的汛期分期,以保障下游人民生產(chǎn)及生活安全。
(1)采用PCA-Fisher最優(yōu)分割法可考慮各類指標(biāo)權(quán)重,有效進(jìn)行汛期分期。
(2)4月、5月和10月雖然不是北方地區(qū)公認(rèn)的入汛期,但采用均值變點(diǎn)分析將4月、5月和10月納入張家莊水庫(kù)汛期合理。在不同流域?qū)τ谘雌谘芯坑虻拇_定需要客觀的分析降雨-徑流的相關(guān)性,充分考慮氣候變化和極端天氣這兩個(gè)因素。
(3)以旬與候?yàn)榛镜难芯空撚蚍謩e對(duì)張家莊主汛期進(jìn)行劃分,得到主汛期時(shí)間段差異較大,研究論域越小,樣本間差異更為微小,汛期分期更為精細(xì)。在進(jìn)行流域汛期分期時(shí),需要對(duì)比不同研究論域的汛期分期結(jié)果,盡可能的科學(xué)合理的進(jìn)行汛期分期。