趙淑饒 王懷柏 趙晶 劉煒 裴斌
摘要:為分析變動(dòng)河床斷面變化及其主要影響因素,快速獲取河道斷面過水面積,提高洪水過程流量測驗(yàn)的時(shí)效性,以黃河干流龍門、吳堡兩站為研究對(duì)象,利用隨機(jī)森林算法、水深代表垂線法等對(duì)洪水過程中的斷面沖淤、形態(tài)變化與水位、流速及流速橫向分布進(jìn)行了回歸分析,建立了洪水過程斷面形態(tài)預(yù)測模型。以斷面流速分布為參照,科學(xué)合理地預(yù)測過水?dāng)嗝嫠罴傲魉俜植?,快速?jì)算實(shí)時(shí)流量,并構(gòu)建了適用性較強(qiáng)的斷面借用技術(shù)體系,有效提高了現(xiàn)代測驗(yàn)技術(shù)條件下流量測驗(yàn)的時(shí)效性。
關(guān)鍵詞:適用性:水深代表垂線:斷面借用體系:變動(dòng)河床:水文測驗(yàn)
中圖分類號(hào):P333:TV882.1
文獻(xiàn)標(biāo)志碼:A
doi: 10.3969/j.issn.1000-1379.2018.06.002
1 概述
黃河干流河龍區(qū)間(河口鎮(zhèn)一龍門區(qū)間)河道窄深,其洪水表現(xiàn)為流速大、含沙量高、漲落急劇、歷時(shí)短、洪峰流量大、漂浮物多,洪水時(shí)斷面沖淤變化劇烈。在高洪測驗(yàn)過程中,受含沙量、流速、飄浮物等因素影響,測深儀器和設(shè)備的使用受到極大限制,往往無法施測過流斷面,采用浮標(biāo)或非接觸測流儀測得表面水流流速后,需借用測驗(yàn)之前或之后的實(shí)測斷面數(shù)據(jù)。由于洪水過程中斷面沖淤變化大,因此借用斷面會(huì)造成較大失真。據(jù)該河段有關(guān)測站歷史資料分析,根據(jù)斷面借用時(shí)機(jī)的不同,流量誤差會(huì)超過30%[1]
本文以河龍區(qū)間兩個(gè)重要控制站——吳堡和龍門水文站為研究對(duì)象,分析洪水過程中斷面沖淤及流速變化規(guī)律,建立斷面形態(tài)預(yù)測模型,研究流量計(jì)算中過水?dāng)嗝娴墨@取方法,提高實(shí)時(shí)流量計(jì)算精度。
2 斷面借用的理論依據(jù)
流速一面積法是最基本的流量測驗(yàn)方法之一,其基本原理是通過水深、流速沿橫斷面的分布來求算流量[2]計(jì)算公式為式中:Q為全斷面流量;v為測點(diǎn)流速;A為過水面積;h為水深:B為水面寬。
實(shí)際應(yīng)用中,將積分法變成有限差分的形式,即通過在斷面上布設(shè)有限的測速測深垂線,將斷面分割成有限個(gè)單元,采取單元流量求和的方式得到斷面流量。對(duì)特定水文站斷面,單次的流量Q為單元面積Ai和其上平均流速vi,乘積的總和,即
過水?dāng)嗝婷娣eA和斷面平均流速v為單次流量計(jì)算的基本要素。現(xiàn)代流速測驗(yàn)技術(shù)可以快速施測水面流速得到斷面流速分布。借用斷面的物理基礎(chǔ):后狀態(tài)斷面是由前期斷面演變而來的,是水流、泥沙作用的結(jié)果,研究這些因素的影響規(guī)律,可以科學(xué)、合理地借用后狀態(tài)斷面,快速計(jì)算流量。
3 斷面借用技術(shù)研究
3.1 基于隨機(jī)森林算法的斷面形態(tài)預(yù)測模型
3.1.1 隨機(jī)森林算法
隨機(jī)森林算法[3]是Bagging集成學(xué)習(xí)方法與隨機(jī)子空間相結(jié)合的一種分類器組合方法,其基礎(chǔ)是決策樹算法,該算法主要分為訓(xùn)練樣本子集和子分類兩部分。其中:訓(xùn)練樣本子集從原始訓(xùn)練集中通過隨機(jī)抽樣的方式獲取,由多個(gè)子分類模型可得到多個(gè)分類結(jié)果,然后通過對(duì)每個(gè)子分類模型的預(yù)測值進(jìn)行投票(預(yù)測對(duì)象為分類變量時(shí))或取平均值(預(yù)測對(duì)象為連續(xù)數(shù)值變量時(shí))來決定最終預(yù)測值。隨機(jī)森林算法流程見圖1。
3.1.2 斷面形態(tài)預(yù)測模型
本文將測次斷面流速分布作為初選預(yù)測因子(白變量),將對(duì)應(yīng)測次起點(diǎn)距的垂線水深作為預(yù)測對(duì)象(因變量),輸入Matlab逐步篩選程序,并設(shè)置F檢驗(yàn)的顯著性水平α= 0.1。以流速分布、水位、最大流速、起點(diǎn)距范圍、最大水深等為參數(shù),采用隨機(jī)森林算法逐步篩選預(yù)測因子,建立斷面形態(tài)預(yù)測模型,預(yù)測各個(gè)起點(diǎn)距對(duì)應(yīng)的水深,進(jìn)而得到斷面形態(tài)。
3.1.3 模型參數(shù)優(yōu)選
考慮研究成果的實(shí)際應(yīng)用,斷面形態(tài)預(yù)測模型分為兩種類型:一種不含實(shí)測水深,稱為119模型,模型參數(shù)為水位、起點(diǎn)距、垂線平均流速(分布);一種包含實(shí)測水深,稱為127模型,模型參數(shù)為水位、起點(diǎn)距、垂線平均流速(分布)、特征水深[最大、平均或者固定起點(diǎn)距水深(組合)]。兩種模型預(yù)測精度評(píng)估[4]對(duì)比見表1。
由表1可知,實(shí)測水深是斷面形態(tài)預(yù)測模型的一個(gè)顯著影響因子。三個(gè)斷面的分析結(jié)果表明,增加實(shí)測水深后,預(yù)測結(jié)果的決定系數(shù)均增大,均方差均減小。
根據(jù)兩模型預(yù)測的水深分別計(jì)算對(duì)應(yīng)斷面面積和流量,并與實(shí)測結(jié)果進(jìn)行對(duì)比,見表2、表3(E80誤差為誤差從小到大排列,累計(jì)80%時(shí)對(duì)應(yīng)的誤差絕對(duì)值)??梢钥闯觯黾铀顓?shù)對(duì)隨機(jī)森林模型的預(yù)測結(jié)果有良性改善,且效果明顯。
3.2 水深代表垂線法預(yù)測斷面平均水深
3.2.1 算法原理
河流過水?dāng)嗝婷娣e測驗(yàn)是由一定數(shù)目的測深垂線測得的部分面積組成的。對(duì)每個(gè)測次而言,面積是水面寬B和相應(yīng)平均水深H的乘積,即A= BH。
水面寬為水位Z的函數(shù),一般可表示為拋物線形式。對(duì)于特定斷面,該函數(shù)已知且基本保持不變。平均水深則較為復(fù)雜,對(duì)多沙河流而言,其與初始狀態(tài)和水位、流速、含沙量等有關(guān),且時(shí)刻處于變化中。就單個(gè)測次而言,平均水深可以推算出來,且一定有某一位置(或幾個(gè)位置)的水深與斷面平均水深日在數(shù)值上接近或相當(dāng),此種垂線稱為代表垂線,其水深稱為代表水深(h')。
通過對(duì)固定斷面的大量樣本進(jìn)行統(tǒng)計(jì)分析,可以得到代表垂線水深與平均水深的回歸函數(shù)關(guān)系,進(jìn)而可以優(yōu)選出一條或數(shù)條代表垂線的位置區(qū)域(以垂線數(shù)量少、代表性高為佳),在常規(guī)測量時(shí)只需實(shí)測這些代表垂線的水深,就可利用回歸公式計(jì)算目標(biāo)值,即H=f(h')。
其斷面面積可表示為
A=BH= f1(Z)f2(h')式中f1(Z)為某個(gè)斷面某一測次對(duì)應(yīng)的已知水位或易獲取的水面寬具體數(shù)值。
3.2.2 代表垂線優(yōu)選分析
以研究目標(biāo)站(龍門、吳堡)高于歷史最高的某一水位作為標(biāo)準(zhǔn)水位,其對(duì)應(yīng)河寬作為最大河寬。從斷面左岸至有岸,按某一步長對(duì)全部測次實(shí)測斷面起點(diǎn)距進(jìn)行最小分割和相應(yīng)垂線水深插補(bǔ),作為基本數(shù)據(jù)源。
以垂線位置(或位置組合)為基準(zhǔn),對(duì)每個(gè)測次對(duì)應(yīng)位置(或位置組合)垂線實(shí)測水深和對(duì)應(yīng)測次平均水深進(jìn)行回歸分析。單垂線回歸模型為雙垂線回歸模型為式中:h為預(yù)測平均水深;h1、h2為兩條代表垂線的水深:α、b分別為兩條垂線的改正系數(shù);c為常數(shù)。
經(jīng)分析,吳堡站河床為變動(dòng)河床,斷面形態(tài)呈V形,不同洪水(或不同時(shí)期)左右水邊線沿河寬變幅較大。水深代表垂線法的回歸分析中,單純用兩條垂線進(jìn)行二元回歸分析,結(jié)果不很理想??紤]水位、左/右起點(diǎn)距隨洪水量級(jí)的變化,增加了水位及左右水邊距等多個(gè)影響因子進(jìn)行多元回歸分析,得到吳堡站的雙垂線回歸模型為
h=αlhl+ α2 h2+α3z+α4 b左+α5 b右+c式中:α1,α2,…,α5為系數(shù);z為水位;b左、b右分別為左、有岸起點(diǎn)距;c為常數(shù)。
點(diǎn)繪每條垂線(或雙線組合)預(yù)測結(jié)果與實(shí)測平均水深的相關(guān)關(guān)系,分別計(jì)算決定系數(shù)(R2)和均方差(MSE),以決定系數(shù)作為評(píng)價(jià)指標(biāo)進(jìn)行優(yōu)選和評(píng)估,確定最佳垂線起點(diǎn)距位置和最佳代表垂線組合方案。結(jié)果見表4。
由表4可以看出,雙垂線回歸模型的效果比單垂線回歸模型的好。兩種模型除了最佳位置外,在代表性較好的前提下,優(yōu)選結(jié)果可以在一定范圍內(nèi)的起點(diǎn)距內(nèi)選擇,具體操作中可以不完全受最佳代表垂線位置的限制,同時(shí)也可有較好的測驗(yàn)精度。因此,以決定系數(shù)的大小作為判定標(biāo)準(zhǔn),確定各斷面起點(diǎn)距的優(yōu)選范圍,結(jié)果見表5。
4 斷面借用體系的適用性
4.1 隨機(jī)森林法斷面形態(tài)預(yù)測模型的適用性
(1)隨機(jī)森林法斷面形態(tài)預(yù)測模型適用于水深和流速沿河寬分布具有對(duì)稱性的斷面形態(tài),即二者沿河寬分布呈“蚌殼”形態(tài)(類似吳堡站),可以在多種測驗(yàn)條件下提供斷面形態(tài)回歸預(yù)測結(jié)果。
(2)對(duì)于龍門站河道斷面,洪水過程中流速、水深沿河寬的分布雖有一定的對(duì)稱性,但形態(tài)穩(wěn)定性較差。次洪過程中最大水深與最大流速往往沿河寬左右滾動(dòng)且不對(duì)應(yīng)。運(yùn)用該方法進(jìn)行斷面形態(tài)回歸預(yù)測時(shí)需特別考慮特征水深的影響。
表6為龍門站兩斷面兩種模型的分析結(jié)果對(duì)比,其中“127模型”所用水深因子為兩斷面雙垂線最優(yōu)位置的代表水深,可以看出雙垂線最優(yōu)位置的代表水深對(duì)預(yù)測結(jié)果有極大的良性改善作用。因此,在同類型河道斷面形態(tài)預(yù)測中應(yīng)重點(diǎn)考慮垂線最優(yōu)位置的代表水深。
(3)使用隨機(jī)森林法斷面形態(tài)預(yù)測模型時(shí),資料的選取需遵循以下原則:資料屬于同一個(gè)斷面,資料系列長、代表性好(洪水量級(jí)、含沙量、多種斷面形態(tài)變化實(shí)測資料等),訓(xùn)練集和檢驗(yàn)集按一定比例(3:1)隨機(jī)分配。
(4)“127模型”優(yōu)于“119模型”,為有限個(gè)實(shí)測斷面的統(tǒng)計(jì)學(xué)分析結(jié)果。不同斷面的預(yù)測精度不同,對(duì)于某一測次的預(yù)測成果,“119模型”也存在精度高于“127模型”的可能性,生產(chǎn)中可根據(jù)實(shí)際分析結(jié)果酌情選用。
(5)使用隨機(jī)森林法斷面形態(tài)預(yù)測模型時(shí)需按照約定格式對(duì)斷面資料進(jìn)行標(biāo)準(zhǔn)化處理并選用適當(dāng)?shù)哪P蛥?shù)。
4.2 水深代表垂線法的適用性基礎(chǔ)
(1)任何一個(gè)測驗(yàn)斷面均存在一條或多條與斷面平均水深有較好等效關(guān)系的垂線,可將其作為代表垂線(或垂線組合)施測水深。
(2)對(duì)于龍門站U形河道斷面形態(tài),水深代表垂線法的各級(jí)水位左右水邊線基本固定(或變動(dòng)較?。?,單、雙垂線水深回歸模型結(jié)果均比較穩(wěn)定,建模方法可用于其他同類斷面的水深代表垂線回歸分析中。
(3)對(duì)于吳堡站V形斷面形態(tài),變動(dòng)河床的測驗(yàn)河道斷面,不同洪水(或不同時(shí)期)左右水邊線沿河寬變幅較大。在水深代表垂線法的回歸分析中,需考慮流量級(jí)及左右水邊線(即加入水位、左/有起點(diǎn)距)等影響因子進(jìn)行多元回歸分析。
(4)該方法可在多種測驗(yàn)條件下為任何測站提供斷面面積回歸預(yù)測結(jié)果。但是,需要進(jìn)行具體斷面的回歸分析和優(yōu)選,包括代表垂線數(shù)目的確定。
5 結(jié)語
(1)隨機(jī)森林算法為機(jī)器學(xué)習(xí)算法,斷面形態(tài)預(yù)測模型的建立基于對(duì)長系列歷史資料的回歸分析。實(shí)際應(yīng)用中,應(yīng)通過足夠多的斷面資料進(jìn)行模型訓(xùn)練和結(jié)果檢驗(yàn),擬合度滿足規(guī)范要求后才可使用。
(2)對(duì)于游蕩型河道,需根據(jù)河道斷面位置對(duì)資料進(jìn)行歸類整理后才能應(yīng)用到斷面形態(tài)預(yù)測模型當(dāng)中。訓(xùn)練集要盡可能滿足時(shí)序長、代表性強(qiáng)等要求。
(3)雙垂線水深回歸模型水深的預(yù)測結(jié)果明顯優(yōu)于單垂線水深回歸模型的。從水深施測選擇范圍來看,雙垂線水深的兩條垂線基本位于斷面水邊部位,更利于實(shí)際操作。
(4)增加垂線數(shù)量理論上可以提高測量結(jié)果的準(zhǔn)確度,但從實(shí)際流量測驗(yàn)精度評(píng)估和時(shí)效性需求(快速、安全、保障一定精度)來看.雙垂線回歸模型的結(jié)果已基本接近實(shí)測值。繼續(xù)增加垂線數(shù)造成的決定系數(shù)和均方差變幅極小,對(duì)回歸結(jié)果影響微小,而且會(huì)因測時(shí)延長而影響流量信息的時(shí)效性。
(5)分析方法中充分考慮了斷面不同影響因素,并做到結(jié)果最優(yōu)化,成果不僅適用于各類水文站洪水測驗(yàn)的斷面獲取,而且能夠有效應(yīng)用于日常測報(bào)T作對(duì)監(jiān)測位置選?。ü潭c(diǎn)水面流速監(jiān)測)、新型流速監(jiān)測儀器應(yīng)用對(duì)斷面資料的需求以及水文監(jiān)測技術(shù)的優(yōu)化分析等方面,為多沙河流實(shí)現(xiàn)流量測驗(yàn)自動(dòng)化、快速化提供了技術(shù)支撐。
參考文獻(xiàn):
[1] 李文平,慕明清,陳三俊.多沙河流洪水期斷面借用方法探討[C]∥中國水力發(fā)電工程學(xué)會(huì)水文泥沙專業(yè)委員會(huì)第七屆學(xué)術(shù)討論會(huì)論文集(下冊(cè)).大連:中國水力發(fā)電工程學(xué)會(huì),2008:37-41.
[2]謝悅波.水信息技術(shù)[M].北京:中國水利水電出版社,2009:68.
[3] BREIMAN L Random Forests[Jl. Machine Learning, 2001, 45(1):5-32.
[4] 黃振平,陳元芳.水文統(tǒng)計(jì)學(xué)[M].北京:中國水利水電出版社,2011:101-128.