劉可新,胡宇豐,李 匡,劉 鵬,梁犁麗
(1.中國(guó)水利水電科學(xué)研究院 北京中水科水電科技開(kāi)發(fā)有限公司,北京 100038;2.河南黃河水文勘測(cè)設(shè)計(jì)院,河南 鄭州 450000)
P-Ⅲ型分布廣泛應(yīng)用于我國(guó)水文頻率計(jì)算中[1],在推求設(shè)計(jì)暴雨、設(shè)計(jì)洪水等方面發(fā)揮著重要作用。水文過(guò)程受氣候、地形和下墊面條件等因素影響,存在諸多不確定性規(guī)律[2],如頻率計(jì)算時(shí)往往存在線型選擇、參數(shù)估計(jì)的不確定性等。近些年來(lái),國(guó)內(nèi)外學(xué)者圍繞水文不確定性進(jìn)行了大量研究工作[3-6],并取得了較好的效果,其中基于貝葉斯理論的研究最具代表性,早在1975年,Wood等[7]就應(yīng)用貝葉斯理論對(duì)統(tǒng)計(jì)參數(shù)不確定性做了分析,近年來(lái),圍繞貝葉斯理論在水文方面的應(yīng)用,我國(guó)學(xué)者也取得了大量研究成果,劉攀等[8]將貝葉斯理論應(yīng)用于水文頻率的線型選擇,結(jié)果表明線型的后驗(yàn)概率越大則擬合越好;梁忠民等[9]應(yīng)用貝葉斯理論進(jìn)行參數(shù)估計(jì),并介紹了貝葉斯理論在水文不確定性方面的研究進(jìn)展[10]。諸多學(xué)者研究表明,貝葉斯理論應(yīng)用于水文不確定性分析具有較好的效果[11-14],貝葉斯理論體系較完備,應(yīng)用于頻率計(jì)算參數(shù)不確定性分析效果較好,貝葉斯理論與經(jīng)典統(tǒng)計(jì)學(xué)理論有所不同,其特點(diǎn)是認(rèn)為不確定性既來(lái)自于參數(shù)的隨機(jī)性,也來(lái)自于樣本的隨機(jī)性,應(yīng)用貝葉斯理論分析參數(shù)不確定性需對(duì)其先驗(yàn)分布做出假設(shè),這將產(chǎn)生較大的主觀性。為盡量避免主觀性,本文將應(yīng)用經(jīng)典統(tǒng)計(jì)學(xué)理論分析P-Ⅲ型分布參數(shù)的不確定性,經(jīng)典統(tǒng)計(jì)學(xué)理論認(rèn)為分布參數(shù)應(yīng)看作常數(shù)處理,是確定性的,通常所說(shuō)的參數(shù)不確定性可理解為參數(shù)估計(jì)量的不確定性,這種不確定性往往是由于以有限的、離散的且存在不確定性的樣本去近似總體分布特征(如均值)而產(chǎn)生的,具體又可表述為兩方面,一是樣本總是有限的、離散的,而總體是無(wú)限的、連續(xù)的,以有限描述無(wú)限、離散描述連續(xù)必然存在一些不確定性;二是樣本本身存在不確定性,如洪水過(guò)程受復(fù)雜條件影響而產(chǎn)生不確定性。
鑒于貝葉斯理論分析參數(shù)不確定性存在主觀因素,本文從經(jīng)典統(tǒng)計(jì)學(xué)理論出發(fā),提出基于抽樣分布理論的P-Ⅲ型分布均值的不確定性分析方法,在總體分布的離勢(shì)系數(shù)和偏態(tài)系數(shù)已知情況下,應(yīng)用經(jīng)典統(tǒng)計(jì)學(xué)理論分析均值的不確定性。首先推導(dǎo)樣本均值的分布函數(shù),而后構(gòu)造輔助隨機(jī)變量并推導(dǎo)其分布函數(shù),最后應(yīng)用輔助隨機(jī)變量分析總體均值的不確定性。
我國(guó)水文系列頻率分析普遍采用P-Ⅲ型分布,為更好分析其參數(shù)不確定性,提出了基于抽樣分布理論的P-Ⅲ型分布均值的不確定性分析方法,該方法是指當(dāng)隨機(jī)變量服從P-Ⅲ型分布時(shí),采用抽樣分布理論分析其總體均值的不確定性,重點(diǎn)是研究總體均值的置信區(qū)間,分析該置信區(qū)間與樣本均值、離勢(shì)系數(shù)和偏態(tài)系數(shù)的關(guān)系,主要包括以下推導(dǎo)過(guò)程和實(shí)現(xiàn)步驟。首先闡述抽樣分布的概念,推導(dǎo)P-Ⅲ型分布樣本均值的分布函數(shù),然后構(gòu)造輔助隨機(jī)變量,該隨機(jī)變量自身含有總體均值,但分布函數(shù)與總體均值無(wú)關(guān),最后應(yīng)用輔助隨機(jī)變量,結(jié)合上、下概率分位點(diǎn)得到總體均值的置信區(qū)間。
2.1 P-Ⅲ型分布樣本均值分布P-Ⅲ型分布的樣本均值是指服從P-Ⅲ型分布的隨機(jī)變量樣本均值,簡(jiǎn)稱(chēng)為P-Ⅲ型分布的樣本均值。樣本均值的分布屬于抽樣分布的范疇,所謂抽樣分布是指在總體分布已知的情況下,由樣本系列經(jīng)連續(xù)函數(shù)構(gòu)造而成的各統(tǒng)計(jì)量的分布,如樣本均值的分布、樣本方差的分布等[15]。我國(guó)水文系列大都服從P-Ⅲ型分布,本文將基于該分布推導(dǎo)樣本均值的概率密度函數(shù)。P-Ⅲ型分布的概率密度函數(shù)如下式:
式中,a0、α 、 β 分別為P-Ⅲ型分布的位置、形狀和尺度參數(shù)。
為便于推導(dǎo),引入特征函數(shù)概念,設(shè)隨機(jī)變量X的概率密度函數(shù)為f (x) ,則有:
式(2)為隨機(jī)變量X的特征函數(shù),其中t為實(shí)數(shù),i為虛數(shù)單位。
由以上定義,對(duì)應(yīng)于P-Ⅲ型分布的特征函數(shù)為:
特征函數(shù)具有以下性質(zhì):
(1)性質(zhì)1。分布函數(shù)與特征函數(shù)是一一對(duì)應(yīng)關(guān)系;
(2)性質(zhì)2。設(shè)X,Y為兩隨機(jī)變量,且Y=cX+d(c、d為實(shí)常數(shù)),則Y的特征函數(shù)為:
(3)性質(zhì)3。設(shè)X,Y為二相互獨(dú)立的隨機(jī)變量,且Z=X+Y,則:
根據(jù)以上性質(zhì)推導(dǎo)樣本均值的特征函數(shù)。設(shè)隨機(jī)變量X 服從P-Ⅲ型分布,特征函數(shù)如式(3),X1,X2,…,Xn為總體的樣本,則它們均相互獨(dú)立,樣本均值為根據(jù)性質(zhì)2 和性質(zhì)3有的特征函數(shù)為:
比較式(6)與式(3)的形式,根據(jù)特征函數(shù)的性質(zhì)1 可知仍然服從P-Ⅲ型分布,令α′=nα , β′=nβ ,則其概率密度函數(shù)為:
2.2 輔助隨機(jī)變量及μ 的不確定性分析令稱(chēng)為輔助隨機(jī)變量,其分布函數(shù)為FY( y ),則有:
令Y的概率密度函數(shù)為fY( y ),則有:
整理得:
由式(11)可知,Y 服從P-Ⅲ型分布,且概率密度僅與X 的CV和CS有關(guān),與μ 無(wú)關(guān),其均值、離勢(shì)系數(shù)和偏態(tài)系數(shù)分別為:
當(dāng)X 的CV和CS為已知時(shí),可利用Y 的分布函數(shù)分析X 均值( μ )的不確定性,包括μ 的置信區(qū)間、 μ 處于某一有限區(qū)間的概率、 μ 大于或小于某特定值的概率等問(wèn)題,其中獲得μ 的置信區(qū)間是水文上經(jīng)常關(guān)心的問(wèn)題,因此本文對(duì)μ 的置信區(qū)間做如下推導(dǎo)。
給定置信度1-a,則有:
具體步驟如下:
(1)獲取水文系列總體X的離勢(shì)系數(shù)CV和偏態(tài)系數(shù)CS,可移用已有參數(shù)或通過(guò)矩法、極大似然法等方法估算之;計(jì)算樣本均值;
(4)對(duì)應(yīng)于置信度1-a的μ 的置信區(qū)間如式(13)所示。
μ 的不確定性分析包括但不限于獲取置信區(qū)間,置信區(qū)間是本文關(guān)注的重點(diǎn),它可進(jìn)一步應(yīng)用于對(duì)設(shè)計(jì)值的不確定性分析,轉(zhuǎn)步驟(5)。
2.3 μ 的置信區(qū)間與參數(shù)的關(guān)系μ 的置信區(qū)間與樣本均值、總體的離勢(shì)系數(shù)和偏態(tài)系數(shù)有關(guān),下面在理論上對(duì)其做定性分析。
式(13)可化簡(jiǎn)為:
上猶江屬江西省贛江水系章江的一條支流,發(fā)源于湖南省汝城縣和江西省崇義縣、上猶縣至南康縣的三江口匯入章江,全長(zhǎng)200 km。干流上修建有上猶江水庫(kù),壩址以上控制面積為2750 km2,上猶江水庫(kù)流域?qū)儆趤啛釒駶?rùn)季風(fēng)氣候,冬夏季風(fēng)盛行,冬季盛行極地大陸性氣團(tuán),氣候干冷而少雨雪;夏季盛行來(lái)自熱帶的海洋氣流,氣候濕潤(rùn)而多雨,多年平均降水量為1675.5 mm,分配極不均勻,4—9 月占全年70.3%,暴雨雖一年四季都會(huì)出現(xiàn),但主要出現(xiàn)在春夏兩季,暴雨出現(xiàn)的機(jī)率占全年的80%以上,而冬季(12、1、2月)暴雨日數(shù)僅占全年的1%,多年平均流量為79.5 m3/s。
本文將該方法應(yīng)用于上猶江流域,分別采用矩法和適線法以1997—2016年20年的水文資料推求洪峰系列的樣本均值、離勢(shì)系數(shù)和偏態(tài)系數(shù),并將樣本的離勢(shì)系數(shù)和偏態(tài)系數(shù)近似代替總體的離勢(shì)系數(shù)和偏態(tài)系數(shù),給定置信度為90%,計(jì)算洪峰系列均值的置信區(qū)間,并推求對(duì)應(yīng)于上述置信區(qū)間的十年一遇、百年一遇和千年一遇的設(shè)計(jì)洪峰。方法參數(shù)及設(shè)計(jì)洪峰結(jié)果如表1和表2。
表1 洪峰系列統(tǒng)計(jì)參數(shù)
表2 不同頻率設(shè)計(jì)洪峰
圖1 適線法結(jié)果
表3 輔助隨機(jī)變量Y的分布參數(shù)及上下概率分位點(diǎn)
表4 90%置信度洪峰均值及設(shè)計(jì)洪峰置信區(qū)間
以樣本離勢(shì)系數(shù)和偏態(tài)系數(shù)作為總體離勢(shì)系數(shù)和偏態(tài)系數(shù),計(jì)算隨機(jī)變量Y的分布參數(shù),并計(jì)算置信度為90%的上下概率分位點(diǎn)如表3。按式(13)得到洪峰均值的置信區(qū)間,進(jìn)而計(jì)算各頻率下的洪峰流量及置信區(qū)間如表4。
以上結(jié)果顯示新方法應(yīng)用于總體均值和設(shè)計(jì)值的不確定性分析是可行的,從表4結(jié)果看,90%置信度下,矩法和適線法的區(qū)間估計(jì)結(jié)果略有不同,矩法洪峰均值的置信區(qū)間為[1180,1724],其區(qū)間寬度略小于適線法[1172,1738];洪峰設(shè)計(jì)值的區(qū)間估計(jì)也有所差異,各頻率下矩法的結(jié)果整體偏小于適線法,但仍具有較大的重合部分,千年一遇、百年一遇和十年一遇區(qū)間重合率(重合部分/總區(qū)間寬度)分別為0.876、0.882和0.907,表明兩種方法的分析結(jié)果具有一定的一致性,且一致性隨預(yù)見(jiàn)期的減小而增大。
雖然矩法和適線法的分析結(jié)果具有一定的一致性,但其差異也較顯著,主要是離勢(shì)系數(shù)和偏態(tài)系數(shù)的估計(jì)值不同所致,下面通過(guò)實(shí)例分析離勢(shì)系數(shù)和偏態(tài)系數(shù)與總體均值置信區(qū)間的關(guān)系。
表1中,適線法的樣本均值取計(jì)算結(jié)果1420 m3/s;離勢(shì)系數(shù)經(jīng)調(diào)整后取0.54較合適;根據(jù)上猶江流域的水文特點(diǎn),偏態(tài)系數(shù)一般取離勢(shì)系數(shù)的3.5倍[16]為1.89,適線結(jié)果如圖1。
取適線法的相關(guān)參數(shù),僅對(duì)總體離勢(shì)系數(shù)做調(diào)整,總體均值的置信區(qū)間如表5,其寬度變化趨勢(shì)如圖2。
表5 不同離勢(shì)系數(shù)對(duì)應(yīng)總體均值的置信區(qū)間
圖2 離勢(shì)系數(shù)與總體均值置信區(qū)間的關(guān)系
表6 不同偏態(tài)系數(shù)對(duì)應(yīng)總體均值的置信區(qū)間
表5結(jié)果顯示,離勢(shì)系數(shù)對(duì)總體均值的置信區(qū)間具有較大影響,不同的離勢(shì)系數(shù)對(duì)應(yīng)的區(qū)間寬度具有較大差異。圖2顯示,當(dāng)其他條件一定時(shí),總體均值的置信區(qū)間下限隨離勢(shì)系數(shù)的增大而減小,上限則恰好相反,因此,正如圖中所示置信區(qū)間寬度將隨離勢(shì)系數(shù)的增大而增大,且較小的置信區(qū)間包含于較大者之中,這與2.3節(jié)理論分析結(jié)果是一致的。
同理可進(jìn)一步分析偏態(tài)系數(shù)的影響,結(jié)果如表6和圖3。
綜上,離勢(shì)系數(shù)與偏態(tài)系數(shù)對(duì)總體均值不確定性的分析結(jié)果具有一定影響,但其程度及影響效果不同,離勢(shì)系數(shù)的影響效果較為顯著,且隨著離勢(shì)系數(shù)增大置信區(qū)間寬度也增大;而偏態(tài)系數(shù)恰好相反,其影響遠(yuǎn)不如離勢(shì)系數(shù)顯著,且影響效果也與離勢(shì)系數(shù)相反,表現(xiàn)為隨偏態(tài)系數(shù)的增大,置信區(qū)間寬度略有減小。
圖3 偏態(tài)系數(shù)與總體均值置信區(qū)間的關(guān)系
4.1 結(jié)論本文首先闡述了對(duì)分布參數(shù)不確定性的理解,認(rèn)為通常所說(shuō)的參數(shù)不確定性可表述為參數(shù)估計(jì)量的不確定性,進(jìn)而提出了基于抽樣分布理論的P-Ⅲ型分布均值的不確定性分析方法,在分析過(guò)程中首先應(yīng)用抽樣分布理論,推導(dǎo)了P-Ⅲ型分布樣本均值的分布函數(shù),構(gòu)造了輔助隨機(jī)變量并推導(dǎo)了其分布,最終在總體離勢(shì)系數(shù)、偏態(tài)系數(shù)已知情況下推導(dǎo)了均值的置信區(qū)間并應(yīng)用于上猶江流域。經(jīng)理論推導(dǎo)與實(shí)際應(yīng)用,得到以下幾點(diǎn)結(jié)論:(1)P-Ⅲ型分布的樣本均值服從P-Ⅲ型分布,如果總體分布的均值、離均系數(shù)、偏態(tài)系數(shù)為μ 、CV、CS,則樣本均值的均值、離均系數(shù)、偏態(tài)系數(shù)為(2)如果水文系列X服從P-Ⅲ型分布(參數(shù)為μ,CV,CS),則輔助隨機(jī)變量服從參數(shù)為的P-Ⅲ型分布,可見(jiàn)其分布參數(shù)僅與CV和CS有關(guān),而與μ 無(wú)關(guān);(3)P-Ⅲ型分布已知總體的離均系數(shù)、偏態(tài)系數(shù)時(shí),應(yīng)用抽樣分布理論可分析總體均值的置信區(qū)間,并且可避免主觀因素影響;(4)實(shí)際流域應(yīng)用效果表明應(yīng)用新方法分析設(shè)計(jì)洪峰的不確定性是可行的,其分析結(jié)果受總體離勢(shì)系數(shù)的影響較大,而受偏態(tài)系數(shù)影響較小。
4.2 展望本文提出的新方法可分析P-Ⅲ型分布均值的不確定性,但前提是總體的離勢(shì)系數(shù)和偏態(tài)系數(shù)已知,該條件較為苛刻,今后將進(jìn)一步加強(qiáng)理論研究,以期放寬應(yīng)用條件,主要有以下幾點(diǎn)展望:(1)該方法無(wú)需先驗(yàn)分布假設(shè),很大程度上避免了主觀因素影響,在今后研究中應(yīng)把放寬應(yīng)用條件作為重點(diǎn),并通過(guò)理論推導(dǎo)逐步擴(kuò)展到對(duì)CV和CS的不確定性分析;(2)t分布和χ2分布是由正態(tài)分布衍生而來(lái),可用以輔助正態(tài)分布均值和方差的區(qū)間估計(jì),參考上述關(guān)系,有望推導(dǎo)相應(yīng)于P-Ⅲ型分布的衍生分布,在不附加任何條件的情況下,用以分析P-Ⅲ型分布各參數(shù)的不確定性。