劉章君,郭生練,許新發(fā),許世超,成靜清
(1. 江西省水利科學研究院,江西南昌 330029;2. 武漢大學水資源與水電工程科學國家重點實驗室,湖北武漢 430072)
相關(guān)性普遍存在于水文事件內(nèi)部屬性間,例如暴雨的歷時和強度、洪水的洪峰和洪量、干旱的歷時和烈度等。此外,還存在由于外部原因(如空間聯(lián)系、因果關(guān)系等)引起的相關(guān)性,如洪水的遭遇和地區(qū)組成、降雨和徑流的關(guān)系等[1]。深入了解和研究水文現(xiàn)象中的這些相關(guān)性規(guī)律,對于提高水文分析計算成果的精度和可靠性大有裨益。
早期的多變量水文分析計算研究主要采用邊緣分布相同的多變量分布模型(如多變量正態(tài)分布、多變量對數(shù)正態(tài)分布和多變量Gumbel等)和Meta-Gaussian分布模型[2]。這些傳統(tǒng)模型通?;谧兞恐g的線性相關(guān)關(guān)系而建立,對于非線性、非對稱的隨機變量難以很好地描述;另外部分模型假定變量服從相同邊緣分布,同時對相關(guān)性大小也存在一定的限制,影響了其適用性和成果準確性。實際上,水文變量的相關(guān)性非常復雜,包括線性相關(guān)和非線性相關(guān);水文變量邊緣分布既可能服從正態(tài)分布,也可能服從偏態(tài)分布。因此,如何構(gòu)建非線性、非正態(tài)條件下的多變量聯(lián)合概率分布無疑具有很大的挑戰(zhàn)性。Copula函數(shù)是多變量聯(lián)合分布構(gòu)建理論與方法的重大突破,可以將邊緣分布和相關(guān)性結(jié)構(gòu)分開來研究,且對邊緣分布類型沒有任何限制,形式靈活多樣,可以描述變量間非線性、非對稱的相關(guān)關(guān)系[3]。1959年Sklar在統(tǒng)計學中提出Sklar定理,直到20世紀90年代末才開始廣泛應(yīng)用于金融、財經(jīng)、保險、精算和風險分析等領(lǐng)域。2003年,意大利水文學者de Michele[4]將Copula函數(shù)引入水文水資源領(lǐng)域,首次建立了邊緣分布為廣義Pareto分布的降雨強度和降雨歷時的聯(lián)合概率分布。2004年,熊立華和郭生練[5]采用Gumbel-Hougaard Copula函數(shù)構(gòu)建了長江流域某站點洪峰和洪量的聯(lián)合分布。近十幾年來,Copula函數(shù)引起了國內(nèi)外水文水資源界的高度關(guān)注和興趣,研究的廣度和深度不斷推進。大量的研究和應(yīng)用實踐表明,Copula函數(shù)作為構(gòu)造多變量聯(lián)合分布的一種有效工具,完整地保留了變量間相關(guān)性信息,具有很強的靈活性和良好的適用性[6]。
本文重點綜述近10年來Copula函數(shù)在水文事件多變量頻率分析、水文事件遭遇組合分析、水文隨機模擬、水文模型與預(yù)報以及其他問題中的最新研究進展,對未來發(fā)展方向進行展望,以期為繼續(xù)開展Copula函數(shù)在水文水資源中的應(yīng)用研究提供借鑒和參考。
Copula函數(shù)應(yīng)用基本流程包括:① 根據(jù)實際研究需要選定隨機變量;② 確定各隨機變量的邊緣分布;③ 計算相關(guān)系數(shù)及顯著性檢驗;④ 確定各備選Copula 函數(shù)的參數(shù);⑤ Copula 函數(shù)的擬合檢驗與優(yōu)選;⑥ 推求聯(lián)合概率分布和條件概率分布;⑦ 結(jié)合實際問題開展相關(guān)后續(xù)研究。各步驟相關(guān)具體方法可以參見文獻[2-3]。表1列出了Copula函數(shù)在水文水資源應(yīng)用領(lǐng)域的主要研究問題及變量。
表1 Copula函數(shù)在水文水資源應(yīng)用領(lǐng)域的主要研究問題及相應(yīng)變量
降雨、洪水、干旱等很多水文事件往往具有多個特征屬性,考慮這些屬性的相關(guān)性并進行多變量頻率分析可以更加科學合理、全面地評估水文事件的整體特征。水文事件多變量頻率分析研究的是發(fā)生在同一個站點/區(qū)域的同一個水文事件的多個特征屬性之間的相關(guān)性。
1.1.1 降雨事件
降雨事件通常包括降雨強度、降雨總量和降雨歷時等特征屬性,分析這些特征屬性變量的相關(guān)性,并建立聯(lián)合概率分布,有助于更加全面地認識降雨事件的變化規(guī)律。Zhang和Singh[7]采用4種Archimedean Copula函數(shù)分別對降雨強度和降雨總量、降雨歷時和降雨總量及降雨強度和降雨歷時進行兩變量聯(lián)合分析;許月萍等[8]比較分析了4種Copula函數(shù)在模擬不同歷時降雨量的聯(lián)合分布的差異及其對降雨頻率分析的影響;Vandenberghe等[9]基于比利時105 a的10 min降雨數(shù)據(jù),采用二維Copula函數(shù)擬合了暴雨特征量之間的相關(guān)性結(jié)構(gòu);Balistrocchi和Bacchi[10]采用Copula函數(shù)分析了暴雨總量和暴雨歷時之間的統(tǒng)計相關(guān)性;Jun等[11]通過Copula函數(shù)建立暴雨強度和暴雨歷時的兩變量聯(lián)合分布來計算場次暴雨事件的發(fā)生概率;Li等[12]分別采用時變GEV分布和Copula函數(shù)來模擬年最大降雨總量和降雨強度的邊緣分布和聯(lián)合分布,進行非一致性條件下兩變量降雨頻率分析。
工程實踐中,中小流域或城市排水暴雨洪水計算時常遇到流量資料不足情況,采用Copula函數(shù)構(gòu)建暴雨強度、暴雨歷時的聯(lián)合分布,分析確定當?shù)赜炅?頻率-歷時關(guān)系或暴雨強度公式,是提高用暴雨資料推求設(shè)計洪水精度的一條有效途徑。然而,目前降雨事件多變量頻率分析的系列抽樣方法多采用年最大取樣法,可能會遺漏一些數(shù)值較大的暴雨,造成小重現(xiàn)期部分明顯偏小,需要加強年多次取樣法在降雨事件多變量頻率分析的應(yīng)用研究,以擴大暴雨信息量,增強樣本代表性。
1.1.2 洪水事件
洪水事件屬性包括洪峰、洪量和洪水歷時等,考慮這些屬性的相關(guān)性并進行多變量頻率分析可以更好地掌握洪水事件特征,并應(yīng)用于設(shè)計洪水估算和和風險分析。這方面的研究最初主要是分析計算洪峰、洪量和洪水歷時等特征屬性的聯(lián)合和條件概率分布、聯(lián)合和條件重現(xiàn)期。Zhang和Singh[13]基于Copula函數(shù)建立洪峰、洪量和歷時的二維聯(lián)合概率分布,并對條件重現(xiàn)期和聯(lián)合重現(xiàn)期進行了探討。在此基礎(chǔ)上,如何在多變量框架下進行洪水聯(lián)合設(shè)計值估算成為學者們關(guān)心的熱點問題,核心是多變量重現(xiàn)期的定義和聯(lián)合設(shè)計值的選取[14]。多變量重現(xiàn)期以“或”(“OR”)、“且”(“AND”)和Kendall重現(xiàn)期應(yīng)用最為廣泛[15-18],最近興起的結(jié)構(gòu)荷載重現(xiàn)期也逐步引起了學者們的注意,聯(lián)合設(shè)計值選取的常用方法是最可能組合法[19-20]。針對變化環(huán)境導致的洪水非平穩(wěn)性特征,也有學者開展了非一致性多變量洪水頻率分析,包含洪峰、洪量邊緣分布的非一致性,以及洪峰、洪量相關(guān)結(jié)構(gòu)的非一致性[21-24]。同時,多變量洪水分析計算的不確定性評估也是一個前沿方向,不僅涉及邊緣分布的不確定性,還要考慮相關(guān)性結(jié)構(gòu)(Copula函數(shù))的不確定性。兩者又均涉及到樣本抽樣、線型(類型)選取和參數(shù)估計不確定性,評估綜合不確定性非常復雜[25-27]。此外,為了在水庫控制運用中充分考慮洪水的季節(jié)性變化規(guī)律,提高防洪興利綜合效益,基于Copula函數(shù)的分期設(shè)計洪水和水庫管運洪水也是學者們關(guān)注的焦點[28-30]。
目前洪水事件的多變量頻率分析仍然面臨一些挑戰(zhàn)。首先,多變量重現(xiàn)期的概念比單變量情形復雜,尚無公認和通用的定義方法,基本原則是要根據(jù)具體研究問題的物理背景而定。其次,對于同一防洪標準對應(yīng)無窮多種洪峰、洪量組合,如何科學合理地選擇設(shè)計值已成為另一個關(guān)鍵問題,當前應(yīng)用最廣泛的是最可能組合法。如何在多變量框架下進行洪水聯(lián)合設(shè)計值估算及風險評估仍然是一個有爭議的問題,需要進一步研究完善。最后,由于洪水通常關(guān)心的是上尾部稀遇頻率的設(shè)計值,多變量洪水分析模型比單變量模型具有更大的抽樣不確定性,導致模型成果不確定性很大。
1.1.3 干旱事件
描述干旱事件的特征屬性主要有干旱烈度、烈度峰值、干旱強度、干旱歷時和干旱間隔時間等,對多個干旱特征屬性進行多變量頻率分析可以更加科學地評估干旱風險。Copula函數(shù)早期主要被應(yīng)用在對干旱特征值的二元分析上,其中以干旱歷時和干旱烈度的聯(lián)合概率分布應(yīng)用最廣[31-33]。為了更全面地反映干旱事件的多維特征,多元Copula函數(shù)也被應(yīng)用于干旱問題的多特征分析中[34-36]。近年來,針對氣候變化和人類活動導致的干旱非一致性問題,有學者開展了變化環(huán)境下的多變量干旱頻率分析研究,通常采用時變Copula函數(shù)、滑動窗口或全球氣候模型(GCMs)氣候情景分析等方法[37-39]。
盡管目前采用的干旱指標很多,但這些指標大多數(shù)只是從某一方面(降水虧缺或地表徑流減少等)來評估旱情嚴重程度,未能全面地評估干旱風險,難以反映旱情在地區(qū)間和季節(jié)上的差異。因此,通過融合多種旱情指標,構(gòu)建能反映干旱發(fā)生機理和過程的綜合指標仍然是今后研究的重點之一。此外,受氣候變化和人類活動的影響,亟待開展基于非一致水文序列資料的水文干旱事件重現(xiàn)期和設(shè)計值估算及不確定性評估方法研究,以適應(yīng)變化環(huán)境帶來的影響。
水文事件遭遇組合分析主要針對具有物理聯(lián)系和相關(guān)性的不同時空水文事件變量之間,包括洪水遭遇中干支流不同站點的洪水遭遇、設(shè)計洪水地區(qū)組成中水庫斷面和區(qū)間洪水的遭遇組合、復合洪澇事件中多個致災(zāi)因子遭遇、不同站點或地區(qū)的豐枯遭遇等。
1.2.1 洪水遭遇
洪水遭遇是指干流與支流或支流與支流的洪峰在相差較短的時間內(nèi)到達同一河段的現(xiàn)象。閆寶偉等[40]和陳璐等[41]分別采用二維和四維Copula函數(shù)研究了最大洪水發(fā)生時間及發(fā)生量級遭遇的風險特征;Huang等[42]提出了一種干支流洪水過程遭遇概率分析方法;Peng等[43]研究了考慮歷史洪水信息的洪水遭遇概率;Feng等[44]采用時變Copula函數(shù)探討了氣候變化影響下的非一致性洪水遭遇風險。此外,河流交匯處的洪水遭遇組合和工程水文設(shè)計問題也受到學界關(guān)注[45-46]。
目前在洪水遭遇概率計算方面做了很多有益的探索,但大多數(shù)研究僅分析了年最大洪水遭遇情況,沒有考慮其他有可能危及保護目標安全的較大洪水遭遇情況,導致計算的遭遇概率與實際情況不完全相符。另外,如何將洪水遭遇分析成果應(yīng)用于干支流水庫群防洪補償調(diào)度、錯峰調(diào)度,以發(fā)揮其實際價值,也是值得繼續(xù)探討的課題。
1.2.2 設(shè)計洪水地區(qū)組成
設(shè)計洪水地區(qū)組成主要研究當防洪控制斷面發(fā)生設(shè)計洪水時,其上游水庫斷面、區(qū)間流域等各分區(qū)來水的分配及遭遇組合的形式。閆寶偉等[47]提出的基于Copula函數(shù)的最可能地區(qū)組成法統(tǒng)計意義明確、方案數(shù)唯一,應(yīng)用前景良好[48],也有學者提出了基于Copula函數(shù)的改進離散求和法克服了傳統(tǒng)離散求和法需要進行變量獨立性轉(zhuǎn)換的問題[49]。郭生練等[50]在此基礎(chǔ)上提出了水庫運行期設(shè)計洪水計算理論和方法,并在金沙江下游梯級水庫、三峽水庫運行期設(shè)計洪水及汛控水位推求中得到了應(yīng)用[51-53]。
洪水的空間分布情況對水庫群防洪系統(tǒng)設(shè)計與調(diào)度運用具有重要影響,設(shè)計洪水地區(qū)組成分析是不可回避的關(guān)鍵問題。在水庫群防洪聯(lián)合調(diào)度中采用運行期設(shè)計洪水及汛控水位作為依據(jù),并與實時洪水預(yù)報結(jié)合起來,是一個具有潛力和實用價值的方向。然而,目前實際中應(yīng)用最廣泛的方法是將設(shè)計斷面設(shè)計洪量分配給上游各分區(qū)以研究水庫調(diào)洪影響,這類方法假定水庫調(diào)蓄后設(shè)計斷面的洪水與天然情況同頻率,沒有充分考慮洪水地區(qū)組成的隨機特性和水庫調(diào)洪影響,此外還隱含假設(shè)了設(shè)計斷面洪水的洪峰、洪量同頻率,其合理性需要進一步探究。
1.2.3 復合洪澇事件
洪澇災(zāi)害有時是由多個致災(zāi)因子遭遇組成的復合水文事件[54]。例如,中國的許多沿江平原地區(qū)和三角洲河網(wǎng)地區(qū)大多地勢低平,暴雨澇水能否順利排除不僅取決于設(shè)計暴雨標準,還受到外江水位的極大制約,設(shè)計暴雨和外江水位的遭遇問題本質(zhì)上就是一個兩變量聯(lián)合分布問題。此外,沿海地區(qū)城市的外江通常為感潮河段,其洪水位既受上游河道洪水的作用,也受下游河口潮位的影響,任一時刻的洪水位都是上游河道洪水和下游河口潮位共同作用的結(jié)果。因此,可采用Copula函數(shù)構(gòu)造區(qū)間暴雨與外江水位、暴雨與潮位、上游洪水與河口潮位等多個致災(zāi)因子的聯(lián)合概率分布進行組合風險分析[55-58]。
多致災(zāi)因子影響下的復合洪澇事件分析最終目的是要研究多個荷載作用下的荷載效應(yīng)變量的概率分布問題,而當前的大多數(shù)研究局限于多個荷載本身的聯(lián)合概率。例如,感潮河段洪水位是上游河道洪水和下游河口潮位共同作用的結(jié)果,堤防工程結(jié)構(gòu)破壞機制是河段洪水位超過了某一指定高程(如堤防設(shè)計洪水位)。因此,在今后復合洪澇事件研究中應(yīng)試圖建立荷載效應(yīng)變量與荷載變量的功能函數(shù),基于隨機變量函數(shù)的概率分布理論推算出荷載效應(yīng)變量的概率分布,并據(jù)此進行工程設(shè)計和風險評估。
1.2.4 豐枯遭遇
豐枯遭遇實質(zhì)是氣象水文變量的多區(qū)域組合問題,通常涉及到調(diào)水工程水源區(qū)和受水區(qū)的降水或徑流組合、多條河流的徑流組合或枯水流量組合等形式。分析水源區(qū)和受水區(qū)的豐枯遭遇對于跨流域水資源調(diào)配、多水源聯(lián)合調(diào)度等都具有重要意義,康玲和何小聰[59]、Du等[60]分別采用Copula函數(shù)研究了南水北調(diào)中線工程和山東省沭河至付疃河調(diào)水工程的豐枯遭遇問題。此外,很多學者在多條河流的徑流組合、不同站點的枯水流量組合等方面作了有益的探索[61-62],Ahmadi等[63]還進行了基于時變Copula函數(shù)的兩變量非一致性枯水頻率聯(lián)合分析。
目前豐枯遭遇研究采用時間尺度一般為全年、汛期或非汛期,對于降雨徑流的變化描述不夠精細,后續(xù)研究應(yīng)盡可能細化到月尺度以增強實用性。此外,當前的豐枯遭遇研究通常采用天然徑流量資料,然而由于人類活動(水庫調(diào)蓄、土地利用等)影響了天然徑流的時空分布特征,原有的天然豐枯遭遇規(guī)律可能已經(jīng)發(fā)生變化,需要加強考慮人類活動影響的豐枯遭遇研究,更加真實地反映遭遇情況。
單站隨機模擬重點是描述水文事件多個特征屬性間的相關(guān)性結(jié)構(gòu)或水文時間序列的自相關(guān)特性,核心是如何構(gòu)造有效的聯(lián)合分布或條件分布。多站隨機模擬則要在此基礎(chǔ)上考慮站點間的空間相關(guān)性,同時模擬時間、空間2個相關(guān)結(jié)構(gòu)。Copula函數(shù)是刻畫變量相關(guān)性的有效工具,近年來也應(yīng)用于水文隨機模擬研究中。從隨機模擬的對象來看,主要可以分為降雨隨機模擬、洪水隨機模擬和徑流隨機模擬。
1.3.1 降雨隨機模擬
降雨事件隨機模擬首先基于Copula函數(shù)模擬降雨特征屬性,如降雨總量、降雨歷時、降雨強度、降雨間隔時間的相關(guān)性結(jié)構(gòu),然后模擬降雨的時程分配模式,最后對兩者進行耦合。大多數(shù)研究主要針對單站點降雨事件隨機模擬,時間尺度上可以實現(xiàn)日、小時和分鐘[64-67。Bárdossy和Pegram[68]利用多維Copula函數(shù)同時模擬各站點間降雨量和降水發(fā)生的空間相關(guān)性,開發(fā)了多站點降雨隨機模擬模型。
近些年來,由于人類活動的強烈干擾,徑流形成的條件發(fā)生顯著的變化,破壞了水文資料系列的一致性,過去的實測資料無法反映未來的變化規(guī)律,在人類活動影響后新的徑流形成條件下通過暴雨資料推求設(shè)計洪水是一種可行途徑。因此,很有必要將建立的能考慮暴雨特征量間內(nèi)在相關(guān)性的隨機降水模型與流域水文模型進行有機耦合,得到長系列的流量過程,從中統(tǒng)計得到洪水頻率曲線,推求變化環(huán)境下的設(shè)計洪水。目前這方面的研究剛剛起步,尚未進入實用階段。
1.3.2 洪水隨機模擬
洪水事件隨機模擬一般分為2個模塊,即基于Copula函數(shù)的洪峰、洪量的聯(lián)合隨機模擬和洪水過程線形狀的模擬[69]。de Michele等[70]采用二維Copula函數(shù)隨機模擬水庫洪峰、洪量進而生成大量入庫洪水過程線,Liu等[71]在此基礎(chǔ)上建立了大壩洪水漫頂風險率計算模型。也有學者直接采用三維Copula函數(shù)構(gòu)建了洪量、洪峰和洪水歷時的聯(lián)合概率分布隨機模擬洪水過程線[72]。
目前基于Copula函數(shù)的洪水隨機模擬研究主要集中在單站洪水過程模擬,對于多站洪水同步模擬研究較少,而多站洪水隨機模擬是水庫群系統(tǒng)地區(qū)組成分析和運行期設(shè)計洪水及汛控水位計算的有力工具,可以較好地克服水庫調(diào)蓄后設(shè)計斷面的洪水與天然情況同頻率假定的問題,建議加強這方面的研究。
1.3.3 徑流隨機模擬
徑流隨機模擬的核心是描述徑流時間序列的自相關(guān)結(jié)構(gòu),因此構(gòu)造徑流隨機模擬模型的重點就轉(zhuǎn)移到如何構(gòu)造有效的聯(lián)合分布或條件分布。閆寶偉等[73]建立了基于Copula函數(shù)的一階非平穩(wěn)時間序列季節(jié)性模型;Chen等[74]在此基礎(chǔ)上進一步提出了可以考慮二階自相關(guān)的日流量隨機模擬方法;Chen等[75]將基于Copula函數(shù)的徑流隨機模擬推廣到多站點的月或日流量序列。
徑流隨機模擬技術(shù)的正確使用,將有助于得到比傳統(tǒng)方法更為可靠的結(jié)果,但是目前基于Copula函數(shù)的徑流隨機模擬研究大都局限于徑流樣本隨機生成理論方法的研究,應(yīng)積極推動隨機模擬生成徑流系列在水資源工程規(guī)劃設(shè)計和管理運用實際中的應(yīng)用。另外,由于在徑流隨機模擬中所使用的模型缺乏物理機制,存在較大的模型不確定性,亟待加強模型與參數(shù)的不確定性研究工作。
水文模型與預(yù)報中大量存在變量相關(guān)性問題,例如評估水文預(yù)報結(jié)果的不確定性時需要模擬預(yù)報和實際流量之間的相關(guān)性,水文模型的輸入、參數(shù)和輸出之間也存在相關(guān)性[76]。應(yīng)用Copula函數(shù)解決水文模型預(yù)報相關(guān)問題主要包括水文預(yù)報不確定性評估和水文模型輸入、參數(shù)和輸出之間相關(guān)性模擬等。
1.4.1 水文預(yù)報不確定性評估
采用Copula函數(shù)構(gòu)建預(yù)報流量和實際流量的聯(lián)合概率分布,然后基于給定預(yù)報流量時實際流量的條件概率分布分析評估水文預(yù)報不確定性[76],或用條件概率分布推導描述貝葉斯先驗分布和似然函數(shù),再基于得到的后驗分布對水文預(yù)報不確定性進行評價[77]。Madadgar和Moradkhani[78]提出了耦合Copula函數(shù)的貝葉斯模式平均(BMA)方法;劉章君等[77, 79]提出了基于Copula函數(shù)的單變量和多變量水文不確定性處理器(HUP)。
近幾年,基于Copula函數(shù)的水文預(yù)報不確定性評估方法取得了快速發(fā)展,應(yīng)用非常靈活,可以實現(xiàn)非線性和非正態(tài)條件下的概率水文預(yù)報。但仍存在有待進一步深入研究的問題:一方面,基于Copula函數(shù)的概率水文預(yù)報應(yīng)逐步實現(xiàn)從單站點、單變量向多站點、多變量轉(zhuǎn)變,以期考慮水文變量間的時空相關(guān)性并降低預(yù)報不確定性;另一方面,要加強概率水文預(yù)報結(jié)果在洪水風險預(yù)警、水庫調(diào)度風險決策中的應(yīng)用,實現(xiàn)預(yù)報與風險決策過程的有機結(jié)合,真正體現(xiàn)概率水文預(yù)報的價值和效益。
1.4.2 水文模型輸入、參數(shù)和輸出之間相關(guān)性模擬
通過利用Copula函數(shù)建立水文模型各輸入、各參數(shù)或輸入和參數(shù)之間的聯(lián)合分布,捕捉其相關(guān)性結(jié)構(gòu),得到的結(jié)果比假定它們相互獨立更加合理。Xiong等[80]基于Copula函數(shù)和概率分布推導法得到了年徑流的概率分布。Fan等[81]提出了基于Copula函數(shù)的粒子濾波方法用于水文資料同化。Wang和Fu[82]基于Copula函數(shù)建立了二元概率Budyko方法框架,并應(yīng)用于全球水資源可利用量的概率評估。此外,也有學者以洪水或徑流作為因變量,采用Copula函數(shù)直接建立因變量與自變量(影響因子)的聯(lián)合分布,基于條件概率分布進行洪水或徑流模擬預(yù)測[83-84]。
不同水文模型各輸入、各參數(shù)或輸入和參數(shù)之間的相關(guān)性各具特點,建模時采用能準確捕捉相關(guān)性特征的Copula函數(shù)極為重要,如何有效地識別最優(yōu)Copula函數(shù)仍有待進一步研究。采用Copula函數(shù)建立洪水(或徑流)及其影響因子的條件概率分布涉及的主要影響因子通常有多個,便于構(gòu)建高維Copula函數(shù)的藤Copula模型得到普遍應(yīng)用,然而目前藤Copula函數(shù)的結(jié)構(gòu)和參數(shù)不確定性分析考慮較少,有必要加強這方面的研究。
除了上述幾個方面外,國內(nèi)外學者還在降雨—徑流關(guān)系變異診斷[85]、水文氣象站網(wǎng)優(yōu)化設(shè)計[86]、水庫隨機優(yōu)化調(diào)度[87]等方面進行了探索性研究,拓展了Copula函數(shù)在水文水資源領(lǐng)域的應(yīng)用范圍。
雖然Copula函數(shù)是描述變量間相關(guān)性結(jié)構(gòu)和多變量水文分析的一種有效數(shù)學工具,但要有一個客觀的認識,既要認識到其優(yōu)越性,也不能不加分析判斷盲目使用,在實際應(yīng)用中應(yīng)注意以下幾個方面的問題。
(1) Copula函數(shù)的應(yīng)用條件。Copula函數(shù)不是一種萬能工具,并不是所有關(guān)于相關(guān)性和多元分布的問題都可以套用。應(yīng)用Copula函數(shù)的前提條件是確保所分析的變量之間確實存有物理上的相關(guān)性,否則會得到錯誤的結(jié)論。
(2) Copula函數(shù)的參數(shù)估計。以水文領(lǐng)域中最常采用的阿基米德Copula函數(shù)族為例,目前二維情形可以采用Kendall秩相關(guān)系數(shù)法;對于三維及以上的Copula函數(shù),大多采用極大似然法。依據(jù)邊緣分布估計方法的不同,極大似然方法又可分為全參數(shù)、兩階段和半?yún)?shù)極大似然法,其中半?yún)?shù)法不受邊際分布的影響,穩(wěn)健性較好,推薦使用。也有學者提出貝葉斯方法和非參數(shù)方法進行參數(shù)估計,但目前實際中應(yīng)用較少。
(3) 對稱型和非對稱型Copula函數(shù)。對稱型Copula函數(shù)要求變量兩兩之間的相關(guān)性結(jié)構(gòu)相同或非常相似,要求變量之間的相關(guān)系數(shù)非常接近,但多變量水文分析實際中兩兩變量的相關(guān)性結(jié)構(gòu)往往并不相同。對于具有不對稱相關(guān)性的高維隨機變量,單參數(shù)難以真實反映其復雜的不對稱相關(guān)結(jié)構(gòu)。非對稱型Copula函數(shù)具有更加靈活的參數(shù)和結(jié)構(gòu)形式,更適用于擬合高維的水文隨機變量,在水文多變量分析計算實際應(yīng)用中更加合適。
(4) Copula函數(shù)的選擇。Copula函數(shù)本身不具有水文物理基礎(chǔ),不能從物理意義上確定各隨機變量的理論聯(lián)合分布模型。實際應(yīng)用中采用不同Copula函數(shù),計算結(jié)果有較大差異,因此選取合適的Copula函數(shù)尤其關(guān)鍵。實際工作中一般選取與已有實測資料配合最優(yōu)的Copula函數(shù),常用的擬合優(yōu)度準則有均方根誤差準則(RMSE值最小)、Akaike信息準則(AIC值最小)以及Cramér-von Mises檢驗法(P值大于0.05通過擬合檢驗,統(tǒng)計量Sn最小作為最優(yōu)Copula函數(shù))。
(5) Copula函數(shù)的尾部特性。不同水文事件表現(xiàn)出的尾部相關(guān)特性差異較大,不考慮尾部相關(guān)性可能會高估或低估風險。例如,通常認為Gumbel-Hougaard Copula函數(shù)能夠擬合洪水的上尾相關(guān)性,Clayton Copula函數(shù)可以擬合枯水的下尾相關(guān)性,若沒有考慮尾部相關(guān)性而誤用了其他的Copula函數(shù),對于洪水和枯水都會造成高估或低估災(zāi)害事件的風險。因此,擬合優(yōu)度只是選擇Copula函數(shù)的必要條件,而不是充分條件,應(yīng)根據(jù)水文事件特點選擇可以準確描述尾部相關(guān)特性的Copula函數(shù)。
(6) 多變量重現(xiàn)期的選取。單變量情況下,重現(xiàn)期和設(shè)計值存在唯一的對應(yīng)關(guān)系,計算方法清晰簡單。在多變量情況下,由于涉及到各變量的多種組合,目前對多變量重現(xiàn)期的定義也相應(yīng)有很多種,最常用的有“或”(“OR”)、“且”(“AND”)、Kendall和生存Kendall重現(xiàn)期以及最近興起的結(jié)構(gòu)荷載重現(xiàn)期。這些多變量重現(xiàn)期表征的物理意義和危險區(qū)域的劃分方式不同,實際應(yīng)用中尚沒有公認、通用的選擇方法,基本原則是要根據(jù)具體研究問題的物理背景而定,選擇能夠正確表征水文失事機理的多變量重現(xiàn)期,作為水文事件聯(lián)合設(shè)計和風險評估的依據(jù)。
(7) Copula函數(shù)模型成果的抽樣誤差。相同樣本容量下,基于Copula函數(shù)的多變量水文分析計算模型比單變量模型具有更大的抽樣不確定性,相同模型成果許可誤差下需要的樣本容量更大(如單變量模型需要幾十年資料,相應(yīng)多變量模型則可能需要幾百年)。因此,雖然Copula函數(shù)在理論上是構(gòu)建多變量水文分析計算模型的一種有效工具,但在應(yīng)用層面上,仍然難以擺脫工程實踐中樣本容量較小的制約,應(yīng)該重視模型成果不確定性分析。
自Copula函數(shù)理論與方法引入水文水資源領(lǐng)域以來,許多學者對其進行研究和探討,在水文事件多變量頻率分析、水文事件遭遇組合分析、水文隨機模擬、水文模型與預(yù)報及其他問題中的應(yīng)用研究迅速發(fā)展。經(jīng)過十幾年在水文水資源領(lǐng)域中的應(yīng)用,已證實Copula函數(shù)是一種靈活構(gòu)造多變量聯(lián)合分布和處理多變量問題的有效工具,并顯示出良好的適用性和不可替代的優(yōu)越性。鑒于水文現(xiàn)象的高度復雜性,仍存在不少需要繼續(xù)深入探討的問題,建議進一步開展以下幾個方面的研究工作。
(1) 繼續(xù)完善Copula函數(shù)的理論和方法。首先,高維Copula函數(shù)的構(gòu)建及其參數(shù)估計方法仍是Copula理論研究中的難點之一,藤Copula可以將高維Copula分解為若干二元Copula,在應(yīng)用中降低計算量,使得高維問題得到簡化,是今后研究的重點。其次,目前應(yīng)用最廣泛的阿基米德和橢圓類Copula函數(shù)都有其自身的局限性,后續(xù)研究可以拓展新的Copula函數(shù)簇,以適應(yīng)復雜多變的水文現(xiàn)象。最后,與其他水文分析計算方法相結(jié)合也是未來的一種發(fā)展趨勢,如Copula函數(shù)與熵理論、貝葉斯理論、馬爾可夫鏈等結(jié)合。
(2) 深入開展非一致性條件下的Copula函數(shù)建模方法研究。由于氣候變化及人類活動(水庫調(diào)蓄、土地利用和植被變化)的影響,應(yīng)用Copula函數(shù)建模時單個水文變量的邊緣分布和水文變量之間的相關(guān)結(jié)構(gòu)都可能發(fā)生變化。時變Copula函數(shù)模型的求解難度增大,仍需在實用化方面進一步研究。因此,建議深入開展非一致性條件下的Copula函數(shù)建模方法研究,以期得到更加科學實用的結(jié)論。
(3) 建立Copula函數(shù)多變量模型的不確定性分析框架。基于Copula函數(shù)建立的多變量模型往往比單變量模型具有更大的不確定性,不僅涉及邊緣分布的不確定性,還要考慮相關(guān)性結(jié)構(gòu)(Copula函數(shù))的不確定性。兩者又均涉及到樣本抽樣、線型(類型)選取和參數(shù)估計不確定性,評估綜合不確定性非常復雜,目前相關(guān)研究仍處于起步階段,亟待建立一套多變量模型不確定性分析框架。
(4) 推進Copula函數(shù)在水文水資源領(lǐng)域更深、更廣層次的應(yīng)用研究。深化Copula函數(shù)在水文事件多變量頻率分析、水文事件遭遇組合分析、水文隨機模擬、水文模型與預(yù)報等現(xiàn)有領(lǐng)域的應(yīng)用,改進和完善當前研究存在的問題和不足。此外,進一步拓展Copula函數(shù)的應(yīng)用范圍,例如水文系列插補延長、山洪災(zāi)害動態(tài)臨界雨量計算、水位—流量關(guān)系、相應(yīng)水位(流量)預(yù)報等。