劉惟飛,陳 兵,余 周
(1.華南理工大學(xué)環(huán)境與能源學(xué)院,廣東廣州 510006;2.廣東省環(huán)境風(fēng)險(xiǎn)防控與應(yīng)急處置工程技術(shù)研究中心,廣東廣州 510006)
隨著氣候變化和城市化進(jìn)程加速,城市內(nèi)澇災(zāi)害越來越嚴(yán)重。精確的水位預(yù)測(cè)對(duì)于城市內(nèi)澇預(yù)警至關(guān)重要,是解決城市內(nèi)澇問題的關(guān)鍵技術(shù)[1]。目前常用的水位預(yù)測(cè)方法是以數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)模型。近年來,機(jī)器學(xué)習(xí)方法中循環(huán)神經(jīng)網(wǎng)絡(luò)(Recur‐rent Neural Network,RNN)被廣泛應(yīng)用于時(shí)間序列預(yù)測(cè)的研究[2,3]。但是傳統(tǒng)RNN 并不能很好地處理長時(shí)依賴問題,在訓(xùn)練過程容易出現(xiàn)梯度消失[4]。梯度消失即距離當(dāng)前時(shí)間步越長,信息反饋的梯度信號(hào)越不顯著。信息隨時(shí)間步數(shù)增加在網(wǎng)絡(luò)中記憶值變小的情況,這意味著RNN長時(shí)學(xué)習(xí)能力失效。而深度學(xué)習(xí)算法中的長短時(shí)記憶網(wǎng)絡(luò)(LSTM)可以有效的改善傳統(tǒng)RNN模型的缺陷,在近幾年成為了水文時(shí)序預(yù)測(cè)的主流方法之一[5,6]。但是LSTM 存在訓(xùn)練時(shí)間長、參數(shù)較多、內(nèi)部計(jì)算復(fù)雜的缺點(diǎn)[7]。因此,Cho等人于提出了LSTM 簡化變體——門控循環(huán)單元(GRU)[8]。此外,組合模型理論上能夠克服單一模型的局限[9]。因此部分學(xué)者利用GRU 模型和組合模型理論對(duì)傳統(tǒng)的基于LSTM 的水位預(yù)測(cè)方法進(jìn)行了優(yōu)化。如:2020 年,Pan M 等[10]將卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)和GRU 網(wǎng)絡(luò)結(jié)構(gòu)結(jié)合應(yīng)用于預(yù)測(cè)長江水位變化,發(fā)現(xiàn)CNN-GRU預(yù)測(cè)性能優(yōu)于LSTM;Miau S等[11]利用CNN-GRU 模型對(duì)臺(tái)灣某河流的洪水水位進(jìn)行預(yù)測(cè),結(jié)果表明CNN-GRU 模型預(yù)測(cè)精度較LSTM、CNN分別提高了35.8%和32.3%。
為探索GRU組合模型應(yīng)用于水文時(shí)序預(yù)測(cè)的有效性,本文提出了一種基于GRU 和BP 神經(jīng)網(wǎng)絡(luò)的水位預(yù)測(cè)模型。與CNN-GRU 及單一模型對(duì)比,該組合預(yù)測(cè)方法具有更好的擬合精度及穩(wěn)定性,為湖泊預(yù)測(cè)水位提供了一種新的方法。
研究區(qū)域?yàn)楂C德涌的源頭西湖區(qū)域,獵德涌位置重要,是廣州市僅有的一條流經(jīng)天河區(qū)珠江新城中央商務(wù)區(qū)的河涌,獵德涌下游沿線水位過高是造成獵德涌流域低洼處水浸嚴(yán)重主要成因之一[12]。獵德涌的源頭西湖位于天河區(qū)華南理工五山校區(qū)內(nèi),最大水深8.9 m,集水面積0.031 km2,通過雙向閥門往獵德涌排水。西湖水源主要依靠降雨或“三涌補(bǔ)水工程”補(bǔ)充[13]。日常補(bǔ)水流量為1.2~2 m3∕s,時(shí)間為6∶00-18∶00。西湖與獵德涌水位存在顯著的相關(guān)性,源頭水位變化對(duì)于研究獵德涌流域內(nèi)澇具有重要的意義。獵德涌流域概況及西湖監(jiān)測(cè)點(diǎn)位置見1(a),西湖區(qū)域見圖1(b),獵德涌流域位置見圖1(c)。
圖1 研究區(qū)域概況圖Fig.1 Generalized diagram of the study area
利用課題組自主研發(fā)設(shè)計(jì)的智慧排水內(nèi)澇云服務(wù)系統(tǒng)[14]采集的2021 年3 月11 日至8 月31 日的西湖每十分鐘間隔時(shí)刻的水位值和雨量數(shù)據(jù)建立湖泊水位預(yù)測(cè)模型。包括25 056(24 h×6×174 d)組水位數(shù)據(jù)和降雨數(shù)據(jù),其中降雨量數(shù)據(jù)允許存在零值,數(shù)據(jù)包含雨前晴天數(shù)、降雨歷時(shí)等隱藏特征信息。雨量及水位數(shù)據(jù)見圖2。
圖2 監(jiān)測(cè)點(diǎn)降雨量及水位變化Fig.2 Rainfall and water level data from monitoring stations
深度學(xué)習(xí)的水位預(yù)測(cè)模型編程語言采用python3.8實(shí)現(xiàn),深度學(xué)習(xí)框架采用谷歌開發(fā)的TensorFlowCPU2.0版本。
組合模型的本質(zhì)思想是通過多個(gè)方面和多角度的集成學(xué)習(xí)方式修正模型誤差,因此能彌補(bǔ)單一模型的缺陷。BP神經(jīng)網(wǎng)絡(luò)已廣泛用于水文時(shí)間序列預(yù)測(cè)領(lǐng)域,具備較強(qiáng)的非線性映射能力,但缺乏時(shí)序概念,而GRU 神經(jīng)網(wǎng)絡(luò)可以比較好地解決上述問題。故本文選用GRU 與BP 組合預(yù)測(cè),組合模型技術(shù)路線見圖3。
圖3 GRU-BP技術(shù)路線圖Fig.3 GRU-BP technology route
樣本共25056 組數(shù)據(jù),前20016 組數(shù)據(jù)(3 月11 日-7 月27日)用于訓(xùn)練,5 040 組數(shù)據(jù)(7 月28 日-8 月31 日)用于測(cè)試,時(shí)間間隔為10 min。為了消除雨量與水位數(shù)據(jù)間量綱影響,將訓(xùn)練集S及測(cè)試集T歸一化。組合模型有兩個(gè)輸入層和一個(gè)融合輸出層,采用直接預(yù)測(cè)方式,預(yù)測(cè)步長為6,即預(yù)測(cè)時(shí)長為1 h。
訓(xùn)練過程中,組合模型的訓(xùn)練集為:S==GRU-BP組合模型的測(cè)試集為:T=X為樣本中的自變量,R為雨量值,Y為水位值,為因變量。
為了準(zhǔn)確評(píng)估模型的精度,采用均方根誤差(Root Mean Square Error,RMSE)、均方誤差(Mean Square Error,MSE)和平均絕對(duì)誤差(Mean Absolute Error,MAE)及平均絕對(duì)百分誤差(Mean Absolute Percentage Error,MAPE)作為誤差分析指標(biāo),對(duì)模型誤差進(jìn)行量化評(píng)價(jià)。
通過控制變量法[15]依次選取模型關(guān)鍵參數(shù),其中GRU融合層數(shù)始終設(shè)為1,優(yōu)化方法使用均方差傳播(Root Mean Square prop,RMSprop)算法。根據(jù)經(jīng)驗(yàn)調(diào)試模型初始化參數(shù)之后,保持模型其他參數(shù)不變,每次只更改某一變量比較進(jìn)行貪心式尋優(yōu),最終確定模型參數(shù)組合,見表1。
表1 模型參數(shù)設(shè)置Tab.1 Model parameter Setting
以1 h 預(yù)測(cè)時(shí)長為例,為了驗(yàn)證GRU-BP 模型預(yù)測(cè)湖泊水位的優(yōu)點(diǎn),使用了3層中間層的LSTM、GRU模型與BP神經(jīng)網(wǎng)絡(luò)(隱藏層層數(shù)為2)以及CNN-GRU(卷積層為1 層,卷積核個(gè)數(shù)為1,卷積核尺寸為9)模型對(duì)西湖水位進(jìn)行預(yù)測(cè),并作對(duì)比分析。對(duì)比模型的超參數(shù)與GRU-BP 模型設(shè)定一致。模型預(yù)測(cè)結(jié)果見圖4,誤差見表2。
表2 不同模型預(yù)測(cè)誤差指標(biāo)Tab.2 Prediction error index of different models
圖4 不同模型預(yù)測(cè)結(jié)果Fig.4 The results predicted by different models
由圖5 和表2 可知,對(duì)于測(cè)試集的整體區(qū)間水位預(yù)測(cè),模型的預(yù)測(cè)精度從高至低依次為GRU-BP、CNN-GRU、GRU、LSTM、BP。整體的測(cè)試集可劃分為降雨期和未降雨期,降雨期又分為暴雨期、大雨期、中雨期、小雨期。對(duì)比各模型在不同時(shí)期下的預(yù)測(cè)性能,評(píng)估模型在不同情況下的多因素特征學(xué)習(xí)能力。統(tǒng)計(jì)的降雨期數(shù)據(jù)為降雨起始時(shí)至降雨結(jié)束后一個(gè)小時(shí)之間的數(shù)據(jù)。
(1)降雨期預(yù)測(cè)。測(cè)試集包含兩場(chǎng)暴雨、六場(chǎng)大雨、四場(chǎng)中雨、四場(chǎng)小雨。不同模型的預(yù)測(cè)結(jié)果分別見圖5~8。
圖5 暴雨時(shí)期預(yù)測(cè)結(jié)果Fig.5 Forecast result of rainstorm period
由圖5~8 可知,西湖水位與補(bǔ)水量、排水量、降雨量相關(guān)。隨著降雨總量變小,雨量與水位間的相關(guān)性減弱,水位隨降雨總量減少逐漸呈現(xiàn)線性上升或下降趨勢(shì)。
GRU-BP 的預(yù)測(cè)誤差較小,在暴雨期、大雨期、中雨期及小雨期與實(shí)際水位的最大偏差分別為20、14、8、5 cm。CNN-GRU曲線擬合度優(yōu)于GRU 與LSTM,GRU 與LSTM 擬合曲線在某些時(shí)期十分接近。BP模型的擬合曲線則隨降雨量變化波動(dòng)較大。
大雨及暴雨期間,各模型對(duì)雨強(qiáng)峰值段期間的水位預(yù)測(cè)精度要明顯低于雨量小且均勻分布的降雨時(shí)段。當(dāng)峰值雨量大于6 mm∕(10 min)時(shí),模型在雨峰出現(xiàn)后1 h 時(shí)段內(nèi)的預(yù)測(cè)誤差顯著增大;這也表明在歷時(shí)短、雨強(qiáng)大的時(shí)段區(qū)間,模型不易挖掘多特征因素對(duì)水位增量影響。
各模型的預(yù)測(cè)精度會(huì)隨著變量因素增加而減少。相似降雨總量下,由于白天時(shí)刻增加補(bǔ)水變量因素,模型在夜間的預(yù)測(cè)精度會(huì)優(yōu)于白天。
圖6 大雨時(shí)期預(yù)測(cè)結(jié)果Fig.6 Forecast results of heavy rain period
(2)未降雨期預(yù)測(cè)。未降雨期,水位沒有雨量因素干擾,雨量輸入為零值。西湖白天的水位主要由補(bǔ)水量和排水量決定;傍晚至夜間的水位主要由排水量決定。未降雨期的排水量和補(bǔ)水量對(duì)水位的增量值為ΔY,在一段時(shí)間內(nèi)基本保持恒定。此時(shí)水位波動(dòng)較小,理論上可視為線性變化。將測(cè)試集中降雨時(shí)期數(shù)據(jù)剔除,計(jì)算未降雨期的預(yù)測(cè)誤差。
(3)模型預(yù)測(cè)效果對(duì)比。為了方便比較模型在不同時(shí)期的預(yù)測(cè)精度,總結(jié)各模型在不同時(shí)期的RMSE值并以直方圖的形式顯示,見圖9。
圖7 中雨時(shí)期預(yù)測(cè)結(jié)果Fig.7 Forecast result of moderate rain period
圖8 小雨時(shí)期預(yù)測(cè)結(jié)果Fig.8 Forecast result of light rain period
圖9 模型均方根誤差指標(biāo)直方圖Fig.9 Model root mean square error index histogram
由圖9 可知,大多時(shí)期,基于GRU 和LSTM 模型的RMSE都優(yōu)于BP 模型。這反映了RNN 在水文時(shí)序領(lǐng)域預(yù)測(cè)的優(yōu)勢(shì);GRU-BP 及CNN-GRU 組合模型的預(yù)測(cè)精度都高于單一模型,且在大雨時(shí)段預(yù)測(cè)具有明顯的優(yōu)勢(shì)。一方面原因在于,與暴雨期相比,大雨期雨量對(duì)水位增量更小,誤差也更??;另一方面原因是大雨期的訓(xùn)練數(shù)據(jù)更多。這表明了合適的組合模型能有效集合單一模型優(yōu)點(diǎn)并克服其局限性。
卷積神經(jīng)網(wǎng)絡(luò)能有效提取多變量特征,因而CNN-GRU 應(yīng)用于多變量下的水位預(yù)測(cè)具備明顯的優(yōu)勢(shì)[10,11]。但GRU 組件自帶的特征提取能力就足以應(yīng)對(duì)特征變量較少的情況,卷積組件對(duì)模型整體的預(yù)測(cè)精度提升有限。除了小雨期精度高于GRU-BP模型,整體預(yù)測(cè)精度低于GRU-BP。
大多情況下,GRU-BP模型的評(píng)價(jià)指標(biāo)都優(yōu)于其他的模型,具有最高的精度,特別在暴雨及大雨期預(yù)測(cè)具有顯著優(yōu)勢(shì)。GRU-BP 水位預(yù)測(cè)模型的優(yōu)勢(shì)在于:在未降雨期,GRU 模型框架利用獨(dú)特門控機(jī)制通過歷史水位的時(shí)序變化規(guī)律學(xué)習(xí)短期內(nèi)補(bǔ)水量、排水量對(duì)水位增量值ΔY。獨(dú)特的門控機(jī)制既注重短時(shí)序列聯(lián)系又可以捕捉長時(shí)序列的影響,抑制梯度消失。在降雨期,增加雨量向量值輸入,GRU 以ΔY為依據(jù)進(jìn)一步挖掘出三者影響因素(補(bǔ)水量、排水量、雨量)對(duì)水位增量值ΔY′。BP 模型框架對(duì)降雨期的雨量輸入比較敏感,預(yù)測(cè)結(jié)果上有明顯的峰值與低值,雨量對(duì)于水位增量影響較大,可以彌補(bǔ)GRU 模型某些時(shí)刻增量值ΔY學(xué)習(xí)過大的問題,增強(qiáng)模型降雨短時(shí)預(yù)測(cè)能力。GRU 融合層根據(jù)預(yù)測(cè)方差非線性調(diào)整GRU、BP 模型框架輸出向量信息反饋的權(quán)重。該集成方式實(shí)質(zhì)上能更精確考慮補(bǔ)水、排水時(shí)序變化及雨量等信息對(duì)水位增量影響權(quán)重,可以平衡模型的線性與非線性預(yù)測(cè)能力,并削弱某些時(shí)刻異常輸出向量的干擾,提高了預(yù)測(cè)精度。
為評(píng)價(jià)增加訓(xùn)練數(shù)據(jù)后各模型的水位預(yù)測(cè)性能是否有所改善,測(cè)試數(shù)據(jù)集劃分與上述保持一致?;谒臅r(shí)間序列數(shù)據(jù)自身的特點(diǎn),利用了參數(shù)優(yōu)化好的各模型,設(shè)計(jì)了3種不同的訓(xùn)練方案對(duì)水位進(jìn)行預(yù)測(cè),見圖10(a)。模型參數(shù)保持不變,以1 h 預(yù)測(cè)時(shí)長為例,比較了3 種不同訓(xùn)練集數(shù)據(jù)下的擬合效果,均方根誤差見圖10(b)。
由圖10(b)可知,對(duì)比3 種情形下各模型預(yù)測(cè)性能,GRUBP預(yù)測(cè)精度最高,特別在樣本量小的時(shí)候也表現(xiàn)出不錯(cuò)的泛化能力。在訓(xùn)練過程中,各學(xué)習(xí)模型在增加訓(xùn)練數(shù)據(jù)后都表現(xiàn)出更好的預(yù)測(cè)性能。與用35%訓(xùn)練數(shù)據(jù)訓(xùn)練模型相比,輸入65%的典型雨季期數(shù)據(jù)訓(xùn)練的模型預(yù)測(cè)性能提升程度最大。但在進(jìn)一步將訓(xùn)練數(shù)據(jù)從65%提高到100%時(shí),預(yù)測(cè)性能提升非常有限。
圖10 不同訓(xùn)練集下的模型預(yù)測(cè)性能Fig.10 Model prediction performance under different training sets
在實(shí)際應(yīng)用中,暴雨及大雨的水位預(yù)報(bào)提前期越早,防洪方法就越有效。因此本文探索了該測(cè)試集下暴雨及大雨期下最佳適應(yīng)預(yù)測(cè)步長。模型參數(shù)保持不變,對(duì)比各模型在不同預(yù)測(cè)步長下的均方根誤差,見圖11。
由圖11(a)可知,隨著預(yù)測(cè)長度的增加,各模型在暴雨期的模擬誤差越來越大。大多情況下,GRU-BP 的預(yù)測(cè)精度都要高于其他模型;LSTM 在部分情形下(暴雨時(shí))的預(yù)測(cè)結(jié)果要優(yōu)于GRU。與從10 min 增加到30 min 相比,預(yù)測(cè)時(shí)長從30 min 增加到1 h時(shí),各模型的預(yù)測(cè)誤差提升較大。
由圖11(b)可知,組合模型的結(jié)構(gòu)優(yōu)勢(shì)更易從大雨時(shí)期數(shù)據(jù)中挖掘與水位相對(duì)應(yīng)的特征關(guān)系。當(dāng)預(yù)測(cè)時(shí)長大于30 min時(shí),可以看出單一模型(GRU、LSTM、BP)的預(yù)測(cè)誤差明顯增大。綜合分析,各模型參數(shù)保持不變的情況下,組合模型穩(wěn)定性好,模型的適用性強(qiáng),不同預(yù)測(cè)步長都能達(dá)到相對(duì)穩(wěn)定的預(yù)測(cè)效果。
圖11 預(yù)測(cè)時(shí)長對(duì)模型預(yù)測(cè)精度影響Fig.11 The influence of prediction time on model prediction accuracy
首次嘗試將GRU-BP 組合模型應(yīng)用于湖泊水位預(yù)測(cè)方面并探討其適用性。結(jié)果表明:
(1)GRU-BP 模型可以作為水位預(yù)測(cè)的簡單有效工具,與CNN-GRU 相比,在暴雨期具有明顯的優(yōu)勢(shì)。大多情況下,與GRU、LSTM 和BP模型相比,GRU-BP集成學(xué)習(xí)的組合方式擁有更高的預(yù)測(cè)精度,且分布式并聯(lián)結(jié)構(gòu)使得模型的適用性強(qiáng)及穩(wěn)定性高。
(2)在缺乏足夠多的樣本數(shù)據(jù)支撐時(shí),選取典型及代表性的水文數(shù)據(jù),也可以達(dá)到較好的模型預(yù)測(cè)效果。且模型預(yù)測(cè)湖泊的暴雨和大雨期水位時(shí),預(yù)測(cè)步長設(shè)置為30 min 最佳。在該預(yù)測(cè)步長下即可以保證有一定提前期的時(shí)間,也能獲得不錯(cuò)的模型預(yù)測(cè)效果。