周平朱仁義
(巢湖學(xué)院物理與電子科學(xué)系,安徽巢湖238000)
貝葉斯理論在水文不確定性分析中的應(yīng)用
周平朱仁義
(巢湖學(xué)院物理與電子科學(xué)系,安徽巢湖238000)
本文簡要介紹了貝葉斯理論的基本原理。闡述了貝葉斯理論在水文不確定性分析中的應(yīng)用,包括在模型參數(shù)、模型結(jié)構(gòu)、水文組合預(yù)報、區(qū)域洪水頻率分析中的應(yīng)用情況。并指出了貝葉斯理論在水文不確定性分析中的應(yīng)用前景。
貝葉斯理論;不確定性;參數(shù)
水文過程是一個高度復(fù)雜的非線性過程,其發(fā)生、發(fā)展過程中受眾多不確定性因素影響,本身呈現(xiàn)出隨機、模糊、混沌、灰色和未確知等自然不確定性。而現(xiàn)有的水文模型都是采用數(shù)學(xué)物理方法對復(fù)雜水文過程的一種簡化,使模擬的水文過程又受到水文輸入、模型結(jié)構(gòu)和模型參數(shù)不確定性的影響。
基于貝葉斯理論的水文不確定性分析,能將認(rèn)知的先驗信息和樣本信息有效結(jié)合,以概率分布的形式描述水文不確定性。不僅可以給出水文變量的均值,還能給出其方差和指定概率的置信區(qū)間,描述水文變量發(fā)生的不確定性程度,比確定性水文模型描述水文過程更具合理性和科學(xué)性?;谪惾~斯理論的水文不確定性分析能使決策者將風(fēng)險考慮到?jīng)Q策中去,實現(xiàn)水文分析與決策有機結(jié)合,更好地實現(xiàn)水文分析的作用,體現(xiàn)其價值。本文簡述貝葉斯理論在水文不確定性分析中的應(yīng)用現(xiàn)狀,并指出其應(yīng)用前景。
貝葉斯公式通常以事件形式或隨機變量形式表示。
事件形式:設(shè)事件A1,A2,…,An互不相容,并且有(Ω為必然事件),則對任一事件Ai,有:
若以隨機變量形式表示,為:
式中,x、y為隨機變量,f(.)是隨機變量的先驗概率密度函數(shù),一般根據(jù)經(jīng)驗知識確定是隨機變量x、y間關(guān)系,在x已知的條件下,表示為y的條件概率密度,在y已知的情況下,表示為x的似然函數(shù);已知(作為發(fā)生的樣本)情況下,x的后驗密度函數(shù)(又稱驗后密度函數(shù));X為隨機變量x的取值范圍。當(dāng)人們對變量x的先驗沒有任何信息時,認(rèn)為x在它允許取值的范圍內(nèi)機會是相等的,即認(rèn)為的先驗分布f(.)在其值域上是均勻分布的。
假設(shè)已獲取容量為n的樣本X=(x1,x2,…,xn),需估計與此樣本有關(guān)的隨機變量θ的概率密度,且假定在θ已知的情況下,樣本X的出現(xiàn)的概率為。則基于貝葉斯公式(1)和式(2)的貝葉斯統(tǒng)計推斷θ的后驗密度π(θX)主要包括以下2個步驟[1-4]。
步驟1:根據(jù)參數(shù)θ的先驗信息確定其先驗分布π(θ)。
步驟2:確定θ的后驗密度π(θX)。設(shè)h(θ,X)為θ和X的聯(lián)合概率密度函數(shù),則:
式中,m(X)為X的邊緣密度函數(shù),定義為:
由式(3)和式(4)得:
式中,p(X)為樣本X=(x1,x2,…,xn)的聯(lián)合概率密度函數(shù)。
正態(tài)分布似然函數(shù)表示如:
水文模型參數(shù)反映的是流域水文特征,是一些原則上可以實測的物理量,但由于實際中往往難以做到,通常都是根據(jù)一定的測站資料,通過一定的目標(biāo)函數(shù),率定出一組“最佳參數(shù)”。由于資料的代表性、測量誤差、目標(biāo)函數(shù)的選取、計算方法的簡化等局限性,一般只能得到局部最優(yōu)參數(shù),抑或出現(xiàn)“異參同效”現(xiàn)象,致使水文模型參數(shù)具有不確定性,導(dǎo)致根據(jù)此參數(shù)進行模擬和預(yù)測的水文過程具有不確定性。[5]
水文模型參數(shù)的后驗估計,只需將式(5)中的變量θ作為模型參數(shù)即可。式(5)通常情況下難以用解析形式表達。因此,通常通過Monte Carlo隨機模擬方法獲得水文模型參數(shù)θ的后驗密度估計。基于馬爾可夫鏈蒙特卡羅法(MCMC)常被用來產(chǎn)生后驗分布的概率密度函數(shù)。MCMC基本上是一種通過展開馬氏鏈來獲得相關(guān)樣本的混合型蒙特卡羅方法。MCMC的關(guān)鍵是如何選擇推薦分布(轉(zhuǎn)移密度)使抽樣更加有效。MCMC的性能很大程度上取決其采樣的算法,常用的采樣算法有Metropolis算法、Metropolis-Hastings算法、吉布斯(Gibbs)采樣和Adapative Metropolis算法等[3,6,7]。
將通過MCMC方法抽樣得到的模型參數(shù)θ帶入模型,即可獲得模擬樣本,通過對大量的模擬樣本進行統(tǒng)計分析,就可以得到模擬值或預(yù)報量的統(tǒng)計特征[5]。
模型結(jié)構(gòu)不確定性一般表現(xiàn)在兩個方面,一是同一模型的不同子結(jié)構(gòu)組成對預(yù)報結(jié)果產(chǎn)生的不確定性;二是采用不同模型給預(yù)報結(jié)果帶來的不確定性。不同模型各具優(yōu)缺點,若選擇一個較優(yōu)模型計算值的同時舍棄另外模型的計算值是不明智的,因為舍棄的模型計算值一般都蘊含某些有用的獨立信息。不同的模型組合往往能得到較好的模擬或預(yù)報計算值。實現(xiàn)模型組合的方法有很多種,如以模型計算與實測數(shù)據(jù)的殘差信息作為目標(biāo)函數(shù),采用組合權(quán)重法實現(xiàn)不同模型的組合;以不同模型的計算值作為神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點值,實測值作為網(wǎng)絡(luò)的輸出值,基于神經(jīng)網(wǎng)絡(luò)構(gòu)建組合預(yù)測模型等。假定k個模型對實測X的組合預(yù)測值為Y,它們間的關(guān)系為,通??梢酝ㄟ^線性回歸方法建立關(guān)系L或者將X、Y通過亞高斯模型實現(xiàn)正態(tài)分位數(shù)轉(zhuǎn)換后再建立線性回歸關(guān)系[2,8]。
若先驗密度函數(shù)g(X)與似然函數(shù)L(X Y)均采用正態(tài)分布函數(shù)表示,即
則f(X Y)也服從正態(tài)分布,其均值E(X Y)和方差D(X Y)分別為[1,9]:
若先驗密度和似然函數(shù)形式比較復(fù)雜,也可采用如神經(jīng)網(wǎng)絡(luò)等智能算法建立g(X)、L(XY)的函數(shù)關(guān)系[3]。
水文事件的總體是未知的。現(xiàn)行的洪水頻率計算方法,運用概率統(tǒng)計的理論,用單站資料作為樣本,對假設(shè)總體及參數(shù)進行統(tǒng)計推斷。由于觀測資料有限,在樣本資料較短的情況下,由單站樣本資料推求總體往往有較大的誤差和任意性。提高洪水頻率分析的精度方法主要有洪水分布線型和改進參數(shù)估計這兩條途徑。其中參數(shù)估計可以結(jié)合地區(qū)信息,以地區(qū)的區(qū)域化參數(shù)作為單站頻率曲線的先驗參數(shù),結(jié)合單站資料進行參數(shù)的后驗估計,可使推出的參數(shù)既含有單站信息也具有地區(qū)信息,增強估計參數(shù)的可靠性[1]。
若根據(jù)地區(qū)信息得到水文頻率曲線參數(shù)θ的先驗概率密度為g(θ),單站發(fā)生的樣本為X=(x1,x2,…,xn),則參數(shù)θ的后驗密度估計為:
參數(shù)θ的數(shù)學(xué)期望E(θ)為:
單站水文變量x的后驗密度函數(shù)f′(x)為:
Roman Krzysztofwicz等人[6,7]基于貝葉斯概率水文預(yù)報理論(Bayesian Forecasting system),認(rèn)為應(yīng)采用概率分布定量地描述水文預(yù)報的不確定度;同時,決策者應(yīng)當(dāng)根據(jù)這個概率分布,而不是直接根據(jù)預(yù)報來制定決策。該預(yù)報理論已經(jīng)獲得廣泛運用,其基本思路是:首先根據(jù)其特性和對水文預(yù)報的影響大小,將總不確定度分解成兩大部分,即輸入不確定度和水文不確定度,然后采用不同的方法進行處理。
以W表示模型輸入,S表示輸出,H表示預(yù)報變量,并以它們的小寫字母w、s和h表示相應(yīng)的現(xiàn)值、觀測值和估計量。設(shè)輸入W的不確定度以概率密度表示,V=1表示有雨,V=0表示無雨。以U表示所有確定性輸入,以Y表示狀態(tài)變量,并假定H過程是馬爾可夫過程。在時刻t,已知量為預(yù)報變量的前期過程h0、狀態(tài)變量y、輸入變量u、v。設(shè)模型響應(yīng)為s=γ(u,v),為模型輸入的條件概率密度函數(shù)[3,10-13]。
式中,Φ為水文不確定度,即h的后驗密度,定義為:
貝葉斯理論在水文不確定性分析中,已經(jīng)取得一定的進展,主要是應(yīng)用方面。未來在理論方面可以進一步研究的方向主要包括以下:
(1)先驗分布的確定,特別是一些無信息的先驗分布問題。
(2)貝葉斯分析的穩(wěn)健性問題。
(3)似然函數(shù)的選擇問題。
(4)后驗密度函數(shù)的隨機抽樣算法問題。
在應(yīng)用方面,可以進一步拓寬其應(yīng)用的領(lǐng)域。并和反映水文系統(tǒng)特性的灰色理論、模糊理論、隨機理論有機結(jié)合??梢詫⑾闰灧植伎紤]成灰色先驗分布,似然函數(shù)表示成模糊似然函數(shù),耦合這些表示水文不確定性的方法,實現(xiàn)對水文系統(tǒng)更深層次的認(rèn)識。
[1]吳伯賢.貝葉斯方法在洪水頻率分析中的應(yīng)用[J].成都科技大學(xué)學(xué)報,1990,(49):69-75.
[2]戴榮.貝葉斯模型平均法在水文模型綜合中的應(yīng)用研究[D].南京:河海大學(xué),2008.
[3]邢貞相.確定性水文模型的貝葉斯概率預(yù)報方法研究[D].南京:河海大學(xué),2007.
[4]黃偉軍,丁晶.水文水資源系統(tǒng)貝葉斯分析現(xiàn)狀與前景[J].水科學(xué)進展,19945,(3):242-247.
[5]梁忠民,戴榮.基于MCMC的水文模型參數(shù)不確定性及其對預(yù)報的影響分析[C].南京:中國水利水電出版社,2008.
[6]R K.Bayesian system for probabilistic river stage forecasting[J].Journal of Hydrology.2002,268(1-4):16-40.
[7]RK,JMC.Hydrologicuncertaintyprocessorforprobabilisticstagetransitionforecasting[J].JournalofHydrology.2004,293(1-4).
[8]黃偉軍,趙永龍,丁晶.徑流的最優(yōu)組合預(yù)測及其貝葉斯分析[J].成都科技大學(xué)學(xué)報,1996,(94):97-102.
[9]張銘,李承軍,張勇傳.貝葉斯概率水文預(yù)報系統(tǒng)在中長期徑流預(yù)報中的應(yīng)用[J].水科學(xué)進展,2009,20(1):40-44.
[10]王善序.貝葉斯概率水文預(yù)報簡介[J].水文,2001,21(5):33-34.
[11]錢名開,徐時進,王善序等.淮河息縣站流量概率預(yù)報模型研究[J].水文,2004,24(2):23-25.
[12]鄢來標(biāo),康玲.河道洪水概率預(yù)報方法研究[J].水力發(fā)電,2008,34(12):40-41.
[13]張洪剛,郭生練,劉攀.基于貝葉斯方法的實時洪水校正模型[J].武漢大學(xué)學(xué)報(工學(xué)版).2005,38(1):58-43.
Abstract:The basic principles of Bayesian analysis was introduced in this paper.Then the application of Bayesian analysis in hydrologic uncertainty was illustrated,including the application to watershed hydrologic forecasting,the application to river flood forecasting,the application to combined hydrologic forecasting,and the application to regionalization flood frequency analysis,etc.Finally,the prospect of the application of Bayesian analysis in hydrologic uncertainty was presented.
Key words:Bayesian analysis;uncertainty;parameter
責(zé)任編輯:宏彬
APPLICATIONS OF BAYESIAN THEOREM FOR HYDROLOGICAL UNCERTAINTY ANALYSIS
ZHOU PingZHU Ren-yi
(Physics Department of Chaohu College,Chaohu Anhui 238000)
O212.8
A
1672-2868(2010)03-0023-05
2010-03-06
周平(1982-),女,安徽巢湖人。巢湖學(xué)院物理與電子科學(xué)系教師,碩士。