韓子晨,王 弋*,賀 斌
(1.華北電力大學(xué)水利與水電工程學(xué)院,北京 102206;2.廣東省科學(xué)院生態(tài)環(huán)境與土壤研究所,廣東 廣州 510650)
新疆作為中國西北的戰(zhàn)略屏障,是一帶一路的重要核心區(qū)和戰(zhàn)略資源的重要基地,同時由于地處亞洲中部干旱區(qū),水資源匱乏,分布不均,降水量少,蒸發(fā)損失較大,因此水資源的管理與規(guī)劃顯得尤為重要。對開都河這一干旱區(qū)多組分徑流的模擬結(jié)果可以作為預(yù)防洪水、干旱預(yù)警、環(huán)境保護(hù)、水電站運行和水資源分配等領(lǐng)域的重要參考。
徑流模擬的數(shù)學(xué)模型有很多,但對于具體流域的徑流模擬各不相同,需要考慮不同氣候環(huán)境、地理條件等因素具體確定,并通過分析、建模和檢驗等步驟判斷徑流模擬的準(zhǔn)確性和適用性。隨著近幾十年來計算機技術(shù)發(fā)展迅猛,計算機在功能上更加齊全,運算速度更快,因此憑借計算機高速計算能力而得以發(fā)展的人工智能技術(shù),如機器學(xué)習(xí)、模擬退火算法、支持向量機等,在包括水文學(xué)的諸多領(lǐng)域有了交叉與結(jié)合。使用人工智能技術(shù)從大量的實測數(shù)據(jù)中建立的模型可以稱為數(shù)據(jù)驅(qū)動模型[1]。對于事先假設(shè)一個模式而后用實測數(shù)據(jù)進(jìn)行生硬擬合的模型驅(qū)動模型,這種建模方式不考慮數(shù)據(jù)內(nèi)蘊含的物理意義和規(guī)律,只針對數(shù)據(jù)本身進(jìn)行分析、研究,從而總結(jié)出數(shù)據(jù)本身所存在的規(guī)律[2]。張少文等[3]于2005年通過遺傳算法優(yōu)化人工神經(jīng)網(wǎng)絡(luò),建立黃河上游徑流預(yù)測模型,與傳統(tǒng)預(yù)測模型相比,預(yù)報精度較高。李嬌等[4]于2013年應(yīng)用人工神經(jīng)網(wǎng)絡(luò)技術(shù)對泉州市山美水庫來水量進(jìn)行月時間尺度的模擬,模擬結(jié)果的誤差均在允許范圍內(nèi)且精確度較高。Agarwal等[5]于2004年在印度拿麥達(dá)河應(yīng)用梯度下降優(yōu)化技術(shù)預(yù)測徑流,結(jié)果優(yōu)于線性傳遞函數(shù)的模型。Boulmaiz等[6]于2016年在人工神經(jīng)網(wǎng)絡(luò)中引入EKF算法來改善非線性的輸入數(shù)據(jù)問題,提高了預(yù)報精度。
以人工神經(jīng)網(wǎng)絡(luò)為代表的機器學(xué)習(xí)正處于一個蓬勃發(fā)展的狀態(tài),運用人工神經(jīng)網(wǎng)絡(luò)的方法為水文計算提供了便捷的途徑,但現(xiàn)有研究仍存在許多不足:神經(jīng)網(wǎng)絡(luò)參數(shù)的選擇還只能依靠經(jīng)驗性的公式和大量重復(fù)性的實驗,流域情況發(fā)生變化時模型如何推廣;人工神經(jīng)網(wǎng)絡(luò)本身只是充當(dāng)了一個水文模擬的工具,當(dāng)更加深刻地研究水文規(guī)律和解決水文問題時需要與實際的水文意義相結(jié)合;西北干旱區(qū)流域面積大、流域地形復(fù)雜、氣象站與水文站數(shù)量稀少,以及河流補給類型為冰雪融水和降水混合補給型等特點,這造成了數(shù)據(jù)獲取的困難,從而制約了模型的效果。
在水文模擬領(lǐng)域通過采用新的技術(shù)理論、獲取更多的信息源來提高模擬的精度,這是水文模擬領(lǐng)域發(fā)展的趨勢。本研究嘗試應(yīng)用人工神經(jīng)網(wǎng)絡(luò)技術(shù),考慮氣候等因素的影響,將人工神經(jīng)網(wǎng)絡(luò)與水文模型相結(jié)合,對干旱區(qū)內(nèi)陸目標(biāo)流域徑流過程進(jìn)行分析、模擬與預(yù)測。
本論文的研究背景是新疆維吾爾自治區(qū)開都河流域。開都河流域位于新疆維吾爾自治區(qū)天山南坡,焉耆盆地北緣,流域面積22 000 km2,山區(qū)流域平均海拔3 100 m,流域地形復(fù)雜,河流發(fā)源于天山中部海拔5 000 m的薩爾明山的哈爾尕特和扎克斯臺溝,流域介于82°52′~86°55′E,41°47′~43°21′N 之間,山區(qū)流域平均海拔3 100 m,流域地勢北高南低,地形復(fù)雜。出山口以上流域集水面積約1.9×104km2,從河源至入湖口全長560 km,是唯一能常年補給博斯騰湖的河流。開都河屬于冰雪融水和降水混合補給型河流,春季季節(jié)性積雪融化補給河流,夏季則以高山冰雪融水和山區(qū)降水補給為主,雨雪降水混合占徑流總量的45.3%,冰川融水占14.1%,流域內(nèi)年降水量分配不均,受季節(jié)影響明顯,連續(xù)最大4個月降水量發(fā)生在5—8月;蒸發(fā)年內(nèi)分布不均,全年蒸發(fā)量約為680 mm,多年平均徑流量約35.31×108m3,4—9月豐水期徑流量占全年徑流量的73.8%,10至次年3月枯水期徑流量占全年徑流量的26.2%。因此開都河具有干旱區(qū)的代表性和典型性,流域概況具體見圖1。
圖1 開都河流域
1.2.1BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)包括輸入層(input layer)、隱含層(hidden layer)和輸出層(output layer)[7],其中隱含層可以為一層或多層。BP神經(jīng)網(wǎng)絡(luò)有以下特點。
a)網(wǎng)絡(luò)為多層結(jié)構(gòu),相鄰兩層的每個神經(jīng)元都與鄰層所有的神經(jīng)元連接,而同一層的神經(jīng)元之間不存在連接。這樣的網(wǎng)絡(luò)結(jié)構(gòu),使BP神經(jīng)網(wǎng)絡(luò)可以完成復(fù)雜的計算工作。
b)網(wǎng)絡(luò)的激活函數(shù)可微,例如常用的Sigmoid函數(shù)和線性函數(shù)。Sigmoid函數(shù)根據(jù)映射后的區(qū)間范圍又可分為Log-Sigmoid函數(shù)和Tan-Sigmoid函數(shù),它們的數(shù)學(xué)表達(dá)見式(1)[8]:
(1)
其中x的取值為任意實數(shù),函數(shù)的輸出區(qū)間分別為[0,1]和[-1,1],為網(wǎng)絡(luò)的分類工作提供便利。
c)網(wǎng)絡(luò)采用誤差反向傳播算法(Back-Propagation Algorithm)。BP算法的原理為,有監(jiān)督學(xué)習(xí)中,實際輸出與期望輸出差值的均方值作為誤差信號可以沿網(wǎng)絡(luò)反向傳播,在傳播的過程中網(wǎng)絡(luò)的每一層權(quán)值都會得到調(diào)整,這個過程將重復(fù)至誤差低于目標(biāo)值后神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)結(jié)束[9]。
這種算法可以有效地訓(xùn)練具有優(yōu)秀非線性擬合能力的多層前向神經(jīng)網(wǎng)絡(luò),所以多年來該算法一直受到研究人員廣泛的關(guān)注[10]。
1.2.2SRM原理
Snowmelt-Runoff Model(SRM)是由Martincc和Rango等人在1980s開發(fā)的,最初主要用于濕潤和半濕潤地區(qū),后通過應(yīng)用發(fā)現(xiàn)該模型對于干旱區(qū)的流域也有著很好的效果。
SRM在開發(fā)之初的目的就是為了解決山區(qū)流域融雪徑流模擬的問題。這個水文模型的基礎(chǔ)為度日因子法,模型需要的數(shù)據(jù)為日平均氣溫、日降水和積雪覆蓋率[11]。因開都河流域的積雪覆蓋率數(shù)據(jù)的獲取較為困難,所以直接以度日模型計算冰雪融水量,將其代替積雪覆蓋率為BP神經(jīng)網(wǎng)絡(luò)增加一個輸入。
度日模型的建立依靠的是冰雪消融與氣溫之間存在的線性關(guān)系,該模型的優(yōu)點在于氣溫作為其主要輸入,比別的氣象因素較容易獲取,整個模型的計算較為簡單。雖然模型存在如無法描述冰雪融化的物理過程的缺點等,但因其簡單易用,還是被廣泛地應(yīng)用于相關(guān)研究中。度日模型的一般形式如下[12]:
M=DDF·PDD
(2)
式中M——某時段內(nèi)冰川或積雪的消融量,mm;DDF——冰川或積雪的度日因子,mm·d-1·℃-1,開都河流域高程變化較大,經(jīng)過高程分帶,選取平均高程帶的度日因子0.35為代表;PDD——某一時段內(nèi)的正積溫,其取值通常由式(3)計算[12]:
(3)
式中Tt——某天的日平均氣溫,℃;Ht——邏輯變量,其取值規(guī)則為,當(dāng)Tt>0℃時,Ht=1,當(dāng)Tt≤0℃時,Ht=0。
1.2.3自相關(guān)系數(shù)法
對于一組依次排列的變量,它們之間相關(guān)關(guān)系的強弱通過各階自相關(guān)系數(shù)反映,所以可以把開都河的日均流量當(dāng)作這樣的一組變量,然后選擇某一天的日均流量,再分別計算其前幾天的日均流量與該天日均流量的自相關(guān)系數(shù)大小,便可以使用這幾日的日均流量作為輸入進(jìn)行模擬。
自相關(guān)系數(shù)的計算公式見式(4)[13]:
(4)
式中xt——第t天日均流量;x——年均流量;n——徑流序列長度;k——步長。
開都河流域所處地區(qū)的氣候類型為溫帶大陸性氣候,全年平均氣溫為-4.16 ℃,平均最大積雪深度為12 cm,高寒氣候特征顯著。開都河的補給類型為冰雪融水和降水混合補給型,其年徑流量約35億 m3,全年徑流量年內(nèi)分布不均勻:春季的河流補給來源為冰雪融水,多年平均春季(3—5月)徑流總量近8億 m3;夏季的河流補給來源則包括冰雪融水和山區(qū)降水,多年平均夏季(6—8月)徑流總量約為15.5億 m3;冬季流域平均氣溫在0℃以下,基本沒有冰雪融水來補給河流,降水的形式為降雪,只能以積雪的形式積累在流域,河流主要依靠地下水補給。開都河流域面積大,且流域內(nèi)氣象站與水文站數(shù)量較少,河流的補給來源較復(fù)雜,這些不利條件給徑流模擬帶來了很大的困難。本文將采用BP神經(jīng)網(wǎng)絡(luò)研究開都河的徑流模擬。
初始的BP神經(jīng)網(wǎng)絡(luò)的輸入是日平均氣溫和降水,為了確定哪一個在模型中起決定作用,因此,把日平均氣溫和降水分別作為神經(jīng)網(wǎng)絡(luò)的輸入,分析得到的圖像結(jié)果[14]。
將日降水作為輸入,得到的結(jié)果見圖2??梢詮哪M結(jié)果圖中看到,預(yù)測日均流量的實線與實測日均流量的虛線吻合度較差,特別是在冬春季節(jié),模擬成功的只有在兩曲線的交點及其附近。
圖2 日降水作為輸入的模擬結(jié)果(2012年)
將日平均氣溫作為輸入,得到的結(jié)果見圖3??梢詮哪M結(jié)果圖中看到,預(yù)測日均流量的實線與實測日均流量的虛線整體吻合度相較于把日降水作為輸入時有了很大的提高與改善。
圖3 日平均氣溫作為輸入的模擬結(jié)果(2012年)
通過對圖像的分析,可以得到結(jié)論,日平均氣溫是流域模型的主要影響因子[15]。因此對這個BP神經(jīng)網(wǎng)絡(luò)的徑流模擬模型的改進(jìn),應(yīng)該圍繞氣溫進(jìn)行[16]。
根據(jù)開都河流域的氣候與水文特點,本文基于SRM的原理來對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn)后,將日平均氣溫、日降水及日冰雪消融量作為神經(jīng)網(wǎng)絡(luò)的輸入,得到的結(jié)果見圖4。
圖4 基于SRM原理改進(jìn)后的模擬結(jié)果(2012年)
根據(jù)圖4所示,夏季和冬季的模擬效果較好,春季的模擬效果較差,分析可能的原因如下。
a)開都河夏季的河流補給主要依靠冰雪融水和山區(qū)降水,開都河冬季的河流補給主要依靠地下水,由于開都河流域的主要影響因子氣溫在這2個季節(jié)幅度較小,因此這2個時段內(nèi)河流補給較為穩(wěn)定,不易受到偶然因素的影響而使河流的日均徑流量發(fā)生較大幅度的波動。
b)春季的徑流來源主要依靠冰川和積雪的融水,決定冰川和積雪消融量的影響因子為氣溫,而在春季的氣溫并不穩(wěn)定,再加上開都河流域山區(qū)地形復(fù)雜,海拔變化劇烈,氣溫?zé)o法穩(wěn)定地保持在0 ℃以上[17]。這種氣溫的不穩(wěn)定性有時甚至?xí)斐纱貉春樗^夏季洪水。除此之外,大山口水文站在春季的實測日均流量存在異常,原因有可能是巴音布魯克草原牧草在這個時段為發(fā)芽期,需要大量用水,也有可能為上游水庫調(diào)度導(dǎo)致流量變化,使得實測日均流量非自然流量。
因此,基于當(dāng)前BP神經(jīng)網(wǎng)絡(luò)的徑流模擬模型的實際表現(xiàn)情況,以及該地區(qū)人民生產(chǎn)生活的需要,該論文研究的時段集中在汛期?,F(xiàn)選取2012年7月16日至8月15日期間共計31 d的數(shù)據(jù),作為神經(jīng)網(wǎng)絡(luò)的測試集,結(jié)果見圖5。開都河7月16日至8月15日BP神經(jīng)網(wǎng)絡(luò)的日均流量模擬詳細(xì)結(jié)果見表1。
表1 實測、預(yù)測日均流量對比
圖5 2012年7月16日至8月15日的徑流模擬結(jié)果
從表中數(shù)據(jù)可得出,31個測試樣本數(shù)據(jù)中,誤差在20%以內(nèi)的有28個,超過20%的則有3個,根據(jù)《水文情報預(yù)報規(guī)范》中的規(guī)定[18],預(yù)報結(jié)果合格的標(biāo)準(zhǔn)為誤差不超過20%。由此計算可得,BP神經(jīng)網(wǎng)絡(luò)對開都河7月16日至8月15日期間的預(yù)報精度為90.32%,精度達(dá)到評定標(biāo)準(zhǔn)甲級。
研究了將日平均氣溫和降水作為輸入的BP神經(jīng)網(wǎng)絡(luò)徑流模擬模型后,接著建立基于自相關(guān)系數(shù)法的BP神經(jīng)網(wǎng)絡(luò)徑流模擬模型,用日均徑流作為模型的輸入,最后根據(jù)模擬結(jié)果做進(jìn)一步的分析與對比。
根據(jù)計算結(jié)果,選取前1、2、3、4、5 d的日均流量作為輸入,當(dāng)天的日均流量為輸出,從而建立了基于自相關(guān)系數(shù)法的BP神經(jīng)網(wǎng)絡(luò)徑流模擬模型,模擬結(jié)果見圖6。
圖6 基于自相關(guān)系數(shù)法的模擬結(jié)果(2012年)
根據(jù)模擬結(jié)果,全年的預(yù)測日均流量的實線與實測日均流量的虛線整體吻合度很高。在366個測試樣本數(shù)據(jù)中,誤差在20%以內(nèi)的有244個,由此計算可得,基于自相關(guān)系數(shù)法的BP神經(jīng)網(wǎng)絡(luò)對開都河2012年的預(yù)報精度為66.67%,精度達(dá)到評定標(biāo)準(zhǔn)丙級。
根據(jù)模擬結(jié)果,2種BP神經(jīng)網(wǎng)絡(luò)徑流模擬模型都可以便捷地進(jìn)行徑流模擬,但兩者存在不同之處?;赟RM原理改進(jìn)的模型以日平均氣溫、降水以及冰雪融水作為輸入,有明確的物理意義,基于自相關(guān)系數(shù)法的模型以日均徑流為輸入,模型的底層邏輯為數(shù)據(jù)本身之間的聯(lián)系。兩者相比較,基于自相關(guān)系數(shù)法的模型模擬精度高,但基于SRM原理改進(jìn)的模型可以進(jìn)行更大時間廣度的模擬。因此,基于自相關(guān)系數(shù)法的模型適用于較短時間內(nèi)的徑流模擬,基于SRM原理改進(jìn)的模型適用于較大時間尺度上的徑流模擬。
徑流模擬的結(jié)果可以作為預(yù)防洪水、干旱預(yù)警、環(huán)境保護(hù)和水電站運行等領(lǐng)域的重要參考,但是由于徑流模擬問題的復(fù)雜性和艱巨性,雖然現(xiàn)有許多模擬方法,但仍不滿足實際應(yīng)用的需要。自人工神經(jīng)網(wǎng)絡(luò)出現(xiàn)以來,尤其是近10年中,其發(fā)展速度令人驚喜,這為徑流的快速模擬找到了一條新的途徑。本論文中研究了BP神經(jīng)網(wǎng)絡(luò)在徑流模擬中的應(yīng)用,并取得了如下的成果。
a)建立了基于BP神經(jīng)網(wǎng)絡(luò)的開都河流域徑流模擬模型,確定了日平均氣溫是模型的主要影響因子,并根據(jù)SRM這一融雪徑流模型的原理,通過度日因子法為網(wǎng)絡(luò)增加了冰川和積雪的消融量的輸入,模型的性能有了改善,模型的物理意義也得到了加強。
b)運用自相關(guān)系數(shù)法,將經(jīng)過處理的日均流量序列作為神經(jīng)網(wǎng)絡(luò)的輸入,相較于以日平均氣溫、日降水和日冰雪消融量為輸入,全年日均流量的模擬結(jié)果的精度提升很大,尤其是對于后者無法有效模擬的3—5月這一時段的日均流量。