邵 佳
(安徽省交通航務(wù)工程有限公司,安徽 合肥 235200)
涇河是黃河二級支流,始于寧夏涇源六盤山,流域總面積為45 421 km2,是渭河最大的支流之一,占渭河流域面積的33.7%,河道全長高達455.1 km。涇河流域?qū)儆跍貛Т箨憵夂颍涤昕偭科?,但過于集中。據(jù)初步統(tǒng)計,流域在1951—2019 年之間年均降水量約為517.9 mm,多集中在7~9 月之間,涇河流域年均流量為16.25 億m3,集水面積約為43 216 km2。
涇河流域的張家山水文站上游河段,作為黃河水沙聯(lián)合典型流域,流經(jīng)黃土高原,具有河段比降明顯、河床沖刷嚴(yán)重、流速快、四周植被覆蓋率低等特點。參照張家山水文站監(jiān)測數(shù)據(jù),獲取張家山上游涇河流域近一年徑流量及輸沙量,分析其變化過程??紤]該流域汛期徑流量占比大,且輸沙量多的問題,研究擇取汛期徑流量與輸沙量之和(6~10 月),作為水沙聯(lián)合分布模型數(shù)據(jù)依據(jù),流域水系如圖1 所示。
圖1 涇河流域水系圖
廣義極值分布、對數(shù)正態(tài)分布、P-Ⅲ分布、Gamma分布是水文分析中的常用概率分布類型。用上述4 種分布擬合張家山水文站徑流量與輸沙量邊緣分布,以AIC準(zhǔn)則選擇最優(yōu)的邊緣分布;基于Copula 函數(shù)建立水沙聯(lián)合分布模型,以AIC 準(zhǔn)則選擇最優(yōu)的聯(lián)合分布?;诖?,計算徑流量與輸沙量的聯(lián)合“或”重現(xiàn)期下的“最大可能組合”聯(lián)合設(shè)計值,應(yīng)用蒙特卡洛方法評估樣本不確定性對水沙聯(lián)合設(shè)計值的影響,利用二維自適應(yīng)核密度估計方法計算該聯(lián)合設(shè)計值的置信區(qū)間;為進一步分析該聯(lián)合設(shè)計值的不確定性隨重現(xiàn)期變化的關(guān)系,采用聯(lián)合熵量化不同重現(xiàn)期下該聯(lián)合設(shè)計值的不確定性。四種邊緣分布概率密度函數(shù)如下式:
式中:Γ(α)表示α 的伽瑪函數(shù);α 為形狀參數(shù);β 為尺度參數(shù);x0表示分布函數(shù)的位置未知參數(shù)。
式中:α 為形狀參數(shù);β 為尺度參數(shù);ξ 表示分布函數(shù)的位置參數(shù)。
式中:α 為形狀參數(shù),β 稱為尺度參數(shù)。
式中:μ 為函數(shù)的平均值;σ 為函數(shù)的標(biāo)準(zhǔn)差。
為便于研究,將X和Y設(shè)定為該流域年徑流量和年輸沙量,設(shè)計為x和y。參照上述四個密度函數(shù),邊緣分布值假設(shè)為Fx(x)和Fy(y)。根據(jù)條件分布定理,X和Y聯(lián)合分布函數(shù)可用平面Copula 函數(shù)C指代。由此可列出算式:
F(x,y)=Cθ(θ 為Copula 函數(shù)的參數(shù))(Fx(x),F(xiàn)y(y))
重現(xiàn)期是水工領(lǐng)域的概念,是評估流域量級的重要指標(biāo)。學(xué)術(shù)界將重現(xiàn)期分為“或”“且”和二次重現(xiàn)三種。限于篇幅,本文著重研究“或”重現(xiàn)期。
當(dāng)給定重現(xiàn)期T時,臨界概率水平為p,求得值為唯一解,此方式被廣泛應(yīng)用水工建設(shè)。針對兩種變量,求解相對復(fù)雜。當(dāng)給定水沙聯(lián)合TOR時,理論上包含數(shù)種流量和沙量組合方式,并且滿足二維坐標(biāo)標(biāo)準(zhǔn),可用等值線描述。水沙聯(lián)合等值線所有點位均可代表一種組合方式,并且取相同的TOR值。但是,為讓研究數(shù)據(jù)貼近實際,需找尋一組最大可能組合,即聯(lián)合概率密度函數(shù)取值最大時的設(shè)計值。
為測定張家山水文站上游涇河流域水沙聯(lián)合序列之間的關(guān)系,上文采用Kendall 秩的相關(guān)檢驗法,將水文站監(jiān)測數(shù)據(jù)輸入水沙聯(lián)合分布模型,得出P值約為8.003×10-9。P值遠(yuǎn)小于0.05,因此原假設(shè)不成立,初步認(rèn)為該流域水沙聯(lián)合分布特征,在二維序列上具有顯著的相關(guān)性,有必要研究涇河流域水沙耦合關(guān)系,全面分析徑流量和泥沙量的內(nèi)在關(guān)聯(lián),健全水沙分布模型。
應(yīng)用上文四個密度函數(shù)測試流域邊緣分布參數(shù)值,徑流量分布密度函數(shù)及概率密度函數(shù)見圖2。
圖2 徑流量分布密度函數(shù)及概率密度函數(shù)
輸沙量分布密度函數(shù)及概率密度函數(shù)見圖3。
圖3 輸沙量分布密度函數(shù)及概率密度函數(shù)
參照上圖,采用K-S 檢驗法對水沙聯(lián)合邊緣分布特征進行假設(shè),擇取最優(yōu)邊緣分布數(shù)據(jù)。結(jié)果表明,該流域從預(yù)設(shè)的四種水沙聯(lián)合分布特征中的P值均大于0.05,與原假設(shè)設(shè)定相符,初步認(rèn)為該結(jié)論驗證原假設(shè),意味著徑流量和輸沙量最優(yōu)擬合狀態(tài)均屬于正態(tài)分布趨勢。
本研究采用蒙特卡洛統(tǒng)計理論,分析分布特征計算的不確定性。抽調(diào)多例樣本,采用重復(fù)抽樣法,判斷不確定性對水沙聯(lián)合設(shè)計的影響。具體流程為:基于Copula函數(shù)聯(lián)合分布模型總體架構(gòu),調(diào)取二維樣本,用蒙特卡洛統(tǒng)計法隨機模擬1 000 次;應(yīng)用觀測值的水沙聯(lián)合分布模型相同估算參數(shù)方法,模擬樣本聯(lián)合分布模型,得到1 000 組數(shù)據(jù),評估置信水平下的估計區(qū)間;所有數(shù)據(jù)中,以20 a 為重現(xiàn)期起始點,按照10 a 一梯度上升到100 a,判斷最大可能組合的水沙聯(lián)合設(shè)計值。
信息熵可描述隨機變量的分散程度,是信息最為基本的組成單位。常規(guī)條件下,信息熵可針對一維數(shù)據(jù),也可應(yīng)對多維情況,將測的數(shù)據(jù)定義為聯(lián)合信息熵。由于信息熵可作為判斷變量的重要依據(jù),可認(rèn)為信息熵越大隨機變量的分散程度越大,也就是不確定性越明顯。
測驗過程中,需解決識別問題。從本質(zhì)上講,不確定性理論發(fā)展迭代了傳統(tǒng)優(yōu)參識別系統(tǒng)。為尋得最有可靠模型參數(shù),不確定思想在統(tǒng)計學(xué)基礎(chǔ)上可通過大量參數(shù)分布獲取更具現(xiàn)實意義的結(jié)論。采用蒙特卡洛統(tǒng)計法研究不確定性,獲取模型參數(shù)置信水平下的參考范圍,為理解水沙聯(lián)合模型提供了技術(shù)支撐。
根據(jù)表1,張家山站水沙聯(lián)合分布模型存在明顯的不確定性,聯(lián)合分布參數(shù)變幅高達55.64%。據(jù)此繪制“或”重現(xiàn)期等值線圖(見圖4),根據(jù)圖中克制,涇河流域水沙聯(lián)合分布模型給出不同程度徑流量和輸沙量遭遇組合的重現(xiàn)期。工程中多選用“或”重現(xiàn)期作為風(fēng)險控制參量,或安全評價標(biāo)準(zhǔn)。通過計算泥沙頻率和洪水頻率組合,確定流域不同時段的最大或最小淤積量。水沙聯(lián)合重現(xiàn)期與設(shè)計值是否準(zhǔn)確決定著流域工程是否經(jīng)濟、安全且科學(xué),既關(guān)乎周邊生態(tài),還關(guān)乎工程社會效益。設(shè)計過程中需合理評估設(shè)計標(biāo)準(zhǔn),降低誤差值,求解最優(yōu)解,為工程合理建設(shè)提供參考。
表1 水沙聯(lián)合分布模型參數(shù)估計區(qū)間
圖4 等值線圖
針對信息熵,可將其作為評價不確定性的指標(biāo),信息熵與不確定呈正相關(guān)關(guān)系。張家山站聯(lián)合設(shè)計值存在明顯的不確定性,在重現(xiàn)期影響下,聯(lián)合熵呈現(xiàn)明顯增加的趨勢(需要重現(xiàn)表述),意味著聯(lián)合設(shè)計值具有顯著的不可控性。
考慮到?jīng)芎恿饔蛩亮魇?yán)重的問題,建立了水沙聯(lián)合分布模型,對水沙組合潛在風(fēng)險進行評估,從中尋求最優(yōu)解。隨后基于蒙特卡洛方法對分布模型的不確定性進行評估,計算百年內(nèi)重現(xiàn)期的最大可能組合下的最優(yōu)設(shè)計值,并分析其信息熵。結(jié)果表明,涇河流域水沙聯(lián)合分布模型及水沙聯(lián)合設(shè)計值存在高度不確定性(需要重現(xiàn)表述),意味著涇河流域設(shè)計值面臨巨大挑戰(zhàn),在重現(xiàn)期年限增長的同時,設(shè)計值不確定性將進一步提升,將對水工建設(shè)提出更高的要求。