倪世緯 羅 蘭 饒品隆
(萬年縣水利局,江西 萬年 335500)
在水文要素分析中,運用理論頻率曲線對其特征進行分析是一種常見的研究手段,其主要的思路為根據(jù)水文要素的樣本數(shù)據(jù),使用曲線進行擬合,使樣本值和理論值之間的誤差盡量最小。以徑流量為例,國內(nèi)外學者對其分布規(guī)律進行了大量的研究。方彬等[1]概述了枯水徑流量頻率分析的研究進展,采用低定量取樣,應(yīng)用負二項和指數(shù)分布分別擬合低定量系列的年發(fā)生次數(shù)和量級構(gòu)成混合分布,并與皮爾遜Ⅲ型(P-Ⅲ)分布進行比較;孫照東等[2]采用頻率分析法、流量歷時曲線法分析了黃河部分水文站平均流量的特征;占潤進[3]根據(jù)賽江干流白塔站長系列徑流資料,采用累計曲線法、累積平均值曲線法等方法計算比較枯水流量,提出該地區(qū)生態(tài)用水量的合理取值。應(yīng)針對不同河流選擇不同的分布模型,常用的頻率分布模型主要有Weibull分布、P-Ⅲ分布、Gumbel分布、廣義極值分布和廣義Pareto分布等。
但是在自然界中,不同河域、不同河流、同一條河流的不同位置,其流量的概率分布情況也不一樣,目前常采用適線法進行流量累計頻率曲線的選型和累計頻率的計算,這種方法優(yōu)點在于比較靈活地考慮多種因素對分布曲線的影響,缺點在于人的主觀性較強,不同的人即使采用同一種分布函數(shù),得出的結(jié)果可能差異也較大,且計算時間較長。
因此,本文提出了一種基于偏態(tài)系數(shù)Cs和峰度系數(shù)Ck相對關(guān)系的徑流量累計頻率曲線初步選型的方法,并將此方法選出的曲線與Weibull分布曲線、Gumbel分布曲線和廣義極值分布曲線的擬合優(yōu)劣程度進行了對比,所得成果可為類似工程設(shè)計提供參考。
Weibull頻率分布是瑞典物理學家威布爾(W.Weibull)在1939年提出的[4]。隨機變量的分布函數(shù)表達式為
(1)
式中:ξ為位置參數(shù);α為尺度參數(shù);κ為形狀參數(shù)。
在3個參數(shù)確定下來之后,Weibull分布的頻率分布函數(shù)也能確定。當κ=1時即為指數(shù)分布函數(shù)。
位置參數(shù)、尺度參數(shù)、形狀參數(shù)與偏態(tài)系數(shù)Cs和峰度系數(shù)Ck的對應(yīng)關(guān)系如下:
(2)
(3)
Gumbel頻率分布函數(shù)是由耿貝爾(E.J.GUMBEL)于1941年提出[5],其頻率分布函數(shù)的表達式為
(4)
相關(guān)參數(shù)的含義與上式一致。
位置參數(shù)、尺度參數(shù)、形狀參數(shù)與Cs、Ck的對應(yīng)關(guān)系為:Cs為固定值1.14,Ck也為固定值5.4。
廣義極值分布(簡稱GEV分布)的表達式為
(5)
相關(guān)參數(shù)的含義與上式一致[6]。
位置參數(shù)、尺度參數(shù)、形狀參數(shù)與Cs、Ck的對應(yīng)關(guān)系為
(6)
(7)
廣義Pareto分布(簡稱GP分布)函數(shù)是專門用于描述超過某一閾值的所有數(shù)據(jù)資料的概率分布函數(shù)[7],其隨機變量的概率分布函數(shù)為
(8)
該分布函數(shù)的位置參數(shù)、尺度參數(shù)、形狀參數(shù)與Cs和Ck的對應(yīng)關(guān)系如下:
(9)
(10)
本文通過分析樣本的偏態(tài)系數(shù)Cs和峰度系數(shù)Ck,提出一種快速進行初步選型的新方法,過程為:首先通過4種分布函數(shù)的Cs和Ck的公式計算并繪制分布函數(shù)的Cs-Ck的關(guān)系曲線;然后計算出徑流量樣本的Cs與Ck的數(shù)值,并將其繪制到上述Cs-Ck曲線圖中;最后選擇與樣本點距離最近的理論分布曲線作為擬合曲線。
該方法的物理含義:偏態(tài)系數(shù)Cs反映樣本的對稱性,峰度系數(shù)Ck是反映樣本頻率分布曲線頂端尖峭或扁平程度的指標,當理論分布曲線能較好地擬合出樣本的對稱性和頻率曲線的扁平程度時,該理論分布曲線與樣本的吻合較好。
參數(shù)估計的方法主要有矩估計法和線性矩估計法,矩估計法是利用樣本矩與總體矩的相關(guān)關(guān)系進行參數(shù)估計,線性矩估計法是利用樣本線性矩與總體線性矩的相關(guān)關(guān)系進行參數(shù)估計,本文選擇利用樣本的矩估計法進行參數(shù)估計。
本文以江西省萬年縣荷塘水文站長序列(1978—2011年)的徑流量參數(shù)為統(tǒng)計樣本。荷塘水文站位于饒河水系昌江一級支流荷塘水中上游,鄱陽縣荷塘墾殖場路家?guī)X村,控制流域面積16.3km2。荷塘水文站于1978年1月設(shè)立并開始觀測,該徑流量樣本均已按規(guī)范要求整編,資料精度可靠,代表性較好。實測資料中包含了1993年、1998年等豐水年,1997年、2008年等平水年,1979年、2007年等枯水年,這些典型年在該地區(qū)水文系列年中具有一定的代表性。實測資料長達34年,也具有較高的代表性,能夠反映該位置處徑流的特點。
樣本的累計頻率計算公式為
(11)
式中:m為將樣本從大到小進行排序的編號;n為樣本的個數(shù);P為每個樣本值所對應(yīng)的累計頻率值。
將計算得到的每個樣本值對應(yīng)的P繪制到概率格紙中,即可得到樣本的累計頻率分布散點圖。
年徑流量分布曲線以年徑流量為橫坐標,累計頻率為縱坐標,從而反映出研究區(qū)域不同頻率所對應(yīng)的年徑流量的大小。
本文以實測的34年的荷塘水文站的年徑流量數(shù)據(jù)為樣本,首先計算常見的4種分布函數(shù)的Cs與Ck的關(guān)系,繪制Cs-Ck的關(guān)系曲線;然后計算出樣本的Cs與Ck的數(shù)值,并將其繪制到Cs-Ck曲線圖中;最后選擇與樣本點距離最近的理論分布曲線作為擬合曲線。根據(jù)34年的實測資料,可得年徑流量的時間過程線,期間年最大徑流量為1608m3(1993年),年最小徑流量為356.4m3(2007年),年平均徑流量為915.2m3,見圖1。
圖1 1978—2011年年徑流量過程
基于分布函數(shù)的Cs和Ck公式,計算得到4種分布函數(shù)的Cs與Ck的關(guān)系曲線以及樣本點的Cs、Ck值,見圖2。
圖2 偏態(tài)系數(shù)Cs和峰度系數(shù)Ck的關(guān)系曲線(樣本+4種分布函數(shù))
由圖2可知,樣本點距離GP分布曲線最近,而其與3種分布距離樣本點較遠,這說明GP分布曲線能夠較好地模擬出樣本的對稱性和樣本頻率分布曲線頂端的扁平程度。
曲線擬合的準則為照顧點群的趨勢,盡量使曲線通過點群中心。為了定量比較不同分布函數(shù)的擬合效果,對擬合的結(jié)果進行K-S檢驗,K-S檢驗是以兩位蘇聯(lián)數(shù)學家Kolmogorov和Smirnov的名字命名的,它是一個擬合優(yōu)度檢驗[8]。K-S檢驗通過對兩個分布之間的差異進行分析,判斷樣本的觀察結(jié)果是否有顯著性差異。檢驗統(tǒng)計量為
z=Max|Fn(x)-F(x)|
(12)
式中:F(x)為理論的頻率;Fn(x)為樣本的頻率。
根據(jù)荷塘水文站34年的年徑流量數(shù)據(jù),采用4種分布曲線,使用矩估計法繪制得到累計頻率分布曲線(見圖3)。由圖3可知,4種分布曲線在中部的擬合結(jié)果都較好,但是在頂端擬合效果相差較大,由于GP分布曲線在頂端穿過了點群中心,因而能更加準確反映徑流量的大值,擬合效果最好。
圖3 4種分布函數(shù)擬合結(jié)果
對4種分布曲線的擬合結(jié)果進行定量比較,4種分布對應(yīng)的頻率以及K-S檢驗結(jié)果見表1。
表1 4種分布對應(yīng)的頻率以及K-S檢驗結(jié)果
綜合分析頻率分布曲線和計算得到的頻率結(jié)果可知,對于荷塘水文站的徑流量擬合,采用GP分布曲線效果最好。
從數(shù)學意義上分析GP分布曲線擬合效果最優(yōu)的原因:因為GP分布能模擬出與樣本的偏態(tài)系數(shù)Cs和峰度系數(shù)Ck,從而可以較好地反映樣本的頂部特征,從而擬合效果最好。
在水利工程設(shè)計中,往往涉及對工程地區(qū)河流徑流量的累計頻率分析,目前常用的方法是使用理論分布曲線進行適線得到工程所在區(qū)域的徑流量重現(xiàn)期分布曲線,這種方法既有優(yōu)點也有缺點。本文通過分析荷塘水文站多年連續(xù)的徑流量樣本的偏態(tài)系數(shù)和峰度系數(shù),提出了對樣本進行快速初步選型的新方法,并將該方法選擇出的分布曲線與Weibull分布、Gumbel分布和廣義極值分布曲線得到的擬合結(jié)果進行定性和定量的擬合誤差分析,擬合結(jié)果充分表明:采用GP分布曲線對荷塘水文站徑流量的擬合效果最好。