呂海峰 冀肖榆 丁勇
摘要:
準(zhǔn)確的水位和水量等水文時(shí)間序列預(yù)測(cè)是水資源管理的重要依據(jù)。受上游支流流量、水位等因素影響,傳統(tǒng)的單因素水位預(yù)測(cè)模型不能有效考慮眾多因素,水位預(yù)測(cè)精度面臨嚴(yán)峻挑戰(zhàn)。以典型西江干線梧州站水位精準(zhǔn)預(yù)測(cè)為研究對(duì)象,建立了基于splice-LSTM的多因素水位預(yù)測(cè)模型,采用拼接的長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)和全連接線性模型(Linear),對(duì)2020~2021年西江干線多站點(diǎn)的流量數(shù)據(jù)進(jìn)行分析,預(yù)測(cè)梧州站點(diǎn)的水位。研究結(jié)果表明:① 由于splice-LSTM中引入了非線性層,提高了近期歷史輸入數(shù)據(jù)的權(quán)重,使得模型預(yù)測(cè)值更加接近歷史真實(shí)值,降低了預(yù)測(cè)誤差,Linear部分可以提高模型對(duì)于線性成分的敏感性,使得模型在水位峰值處的預(yù)測(cè)更加準(zhǔn)確;② splice-LSTM模型與傳統(tǒng)單因素的ARIMA模型、LSTM模型相比,在水位預(yù)測(cè)方面準(zhǔn)確度分別提升14.4%,10.1%。研究成果可為西江船閘運(yùn)行調(diào)度中心精準(zhǔn)預(yù)調(diào)度船舶提供參考。
關(guān) 鍵 詞:
水位預(yù)測(cè); 船閘調(diào)度; splice-LSTM模型; 西江流域
中圖法分類號(hào): TV698.1
文獻(xiàn)標(biāo)志碼: A
DOI:10.16232/j.cnki.1001-4179.2023.07.012
0 引 言
精準(zhǔn)的水位預(yù)測(cè)對(duì)于江河流域安全及水資源的合理調(diào)度具有重要意義。考慮到江河水位存在波動(dòng)性、季節(jié)性等眾多特點(diǎn),且影響水位的因素較多,如各個(gè)上游支流的流量、潮汐和降雨量等,多因素作用使得水位規(guī)律難以預(yù)判,水位精準(zhǔn)預(yù)測(cè)的難度大大提升。隨著大數(shù)據(jù)、人工智能等技術(shù)的快速發(fā)展,對(duì)于水位長(zhǎng)時(shí)段預(yù)測(cè)問題,國(guó)內(nèi)外眾多水文學(xué)者利用機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘以及深度學(xué)習(xí)方法[1-2],研究改進(jìn)現(xiàn)有水位預(yù)測(cè)方法和模型,提出了一系列可行的預(yù)測(cè)模型。對(duì)于該領(lǐng)域,學(xué)者們主要從兩方面進(jìn)行研究:一方面是水位預(yù)測(cè)模型構(gòu)建的時(shí)間序列、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)算法;另一方面是用于提升模型泛化能力的特征抽取算法及模型,且在水位預(yù)測(cè)方面,學(xué)者們的研究方法主要側(cè)重于傳統(tǒng)的單因素時(shí)間序列處理,即只考慮將水位作為輸入變量。目前,國(guó)內(nèi)外主要基于以下幾種時(shí)間序列學(xué)習(xí)算法進(jìn)行水位預(yù)測(cè)領(lǐng)域的模型研究。
一種是應(yīng)用十分廣泛的時(shí)間序列預(yù)測(cè)模型——基于差分自回歸移動(dòng)平均模型(Autoregressive Integrated Moving Average model,ARIMA)[3]時(shí)間序列的水位預(yù)測(cè)。其核心為非平穩(wěn)時(shí)間序列向平穩(wěn)時(shí)間序列轉(zhuǎn)變,接著以因變量對(duì)其誤差隨機(jī)項(xiàng)和滯后值建立回歸模型。King等[4]在2017年提出改進(jìn)的ARIMA模型,以預(yù)測(cè)美國(guó)新墨西哥州海洛因水庫(kù)月流量,Pearson系數(shù)高達(dá)0.968。余珍[5]在2018年采用ARIMA模型對(duì)漢口、監(jiān)利、安慶站歷史水位時(shí)間序列進(jìn)行預(yù)測(cè)分析,逐日平均水位的預(yù)測(cè)與觀測(cè)值擬合程度較高,但是汛期水位頻繁劇烈的波動(dòng)在一定程度上會(huì)降低預(yù)測(cè)精度。
另一種是基于神經(jīng)網(wǎng)絡(luò)模型的水位預(yù)測(cè)。常用的神經(jīng)網(wǎng)絡(luò)水位預(yù)測(cè)模型包括:遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)和人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)。其中ANN也被稱為前饋神經(jīng)網(wǎng)絡(luò),一般由輸入層、隱藏層和輸出層構(gòu)成,是一個(gè)多數(shù)神經(jīng)元互相連接構(gòu)成且具有適應(yīng)性的運(yùn)算模型。每一層由多個(gè)激活函數(shù)組成的神經(jīng)元構(gòu)成,神經(jīng)元間的連接包括對(duì)當(dāng)前信號(hào)輸出的權(quán)重。ANN可以學(xué)習(xí)非線性函數(shù),但容易丟失空間特征。Deo等[6]在2017年利用ANN構(gòu)建了澳大利亞新南威爾士州達(dá)令河月平均水位預(yù)測(cè)模型,預(yù)測(cè)效果較好,均方根誤差(RMSE)約為0.49 m。許國(guó)艷等[7]將CNN應(yīng)用于水位時(shí)間序列模型的預(yù)測(cè),取得了RMSE為0.028、預(yù)報(bào)準(zhǔn)確率為91%的理想預(yù)測(cè)結(jié)果。劉青松等[8]在2020年提出基于AR-RNN多變量模型,對(duì)四川省清溪河流域的水位進(jìn)行預(yù)測(cè),實(shí)現(xiàn)了較低相對(duì)誤差的預(yù)測(cè)效果。LSTM[9]是RNN的一個(gè)變種,它通過增加門控機(jī)制來緩解RNN梯度消失或爆炸的問題,門控的值可以決定信息的丟失或保留,使得LSTM可以真正有效地學(xué)習(xí)長(zhǎng)距離的時(shí)序信息。目前基于LSTM 模型的時(shí)間序列預(yù)測(cè)已經(jīng)得到廣泛應(yīng)用,如馮銳[10]在2019年基于LSTM模型構(gòu)建九龍江流域單站點(diǎn)水位預(yù)測(cè)模型及三水位站聯(lián)動(dòng)預(yù)測(cè)模型,對(duì)長(zhǎng)江沿線水位進(jìn)行預(yù)測(cè),取得較好的效果。LSTM遺忘門結(jié)構(gòu)能夠保留或丟失過去的順序信息,用來預(yù)測(cè)時(shí)間序列數(shù)據(jù)較為合適。因此,本文采用Kulisz等[11]提出的擴(kuò)展多個(gè)隱藏層的LSTM結(jié)構(gòu),根據(jù)歷史數(shù)據(jù)來進(jìn)行水位預(yù)測(cè)研究。
盡管基于數(shù)據(jù)驅(qū)動(dòng)的神經(jīng)網(wǎng)絡(luò),尤其是RNN模型的水位預(yù)測(cè)模型取得了較好效果。然而水位預(yù)測(cè)并不是與所有輸入數(shù)據(jù)呈現(xiàn)正相關(guān),不相關(guān)的數(shù)據(jù)容易成為影響水位預(yù)測(cè)的干擾因素。由此可見,基于純數(shù)據(jù)驅(qū)動(dòng)的水位預(yù)測(cè)存在下列局限:① 水位受上游支流、周邊雨量、潮汐等因素的影響,這些長(zhǎng)期的歷史數(shù)據(jù)驅(qū)動(dòng)模型難以保存,導(dǎo)致預(yù)測(cè)達(dá)不到預(yù)期效果;② 數(shù)據(jù)驅(qū)動(dòng)模型預(yù)測(cè)效果隨著預(yù)測(cè)步長(zhǎng)增加而急劇降低。
鑒于上述模型存在的不足,本文在傳統(tǒng)的單因素水位預(yù)測(cè)基礎(chǔ)之上,以西江流域梧州站水位預(yù)測(cè)為例,引入上游支流的流量、水位等多因素進(jìn)行水位預(yù)測(cè),提出了一種基于splice-LSTM的多因素水位預(yù)測(cè)模型,并根據(jù)實(shí)驗(yàn)確定較優(yōu)預(yù)測(cè)時(shí)間間隔,利用均方根誤差(RMSE)、Pearson相關(guān)系數(shù)平方(R2)和Nash-Sutcliffe 效率系數(shù)(NSE)等評(píng)價(jià)指標(biāo)確定較優(yōu)模型參數(shù)。
1 研究區(qū)域與方法
1.1 研究區(qū)概況
西江,古稱郁水、浪水和牂牁江,是珠江干流,東連粵港澳,西接云貴,貫穿廣西[12]。發(fā)源地為云南省曲靖市烏蒙山余脈馬雄山東麓,貫穿粵、桂、黔、滇等4個(gè)省(區(qū)),至廣東省三水思賢滘與北江、東江匯集,融匯珠江三角洲多條河,經(jīng)過磨刀門流入南海。珠江-西江流域徑流量和水運(yùn)量處在全國(guó)第2位,僅次于長(zhǎng)江。2014年珠江-西江經(jīng)濟(jì)帶發(fā)展規(guī)劃的批復(fù)標(biāo)志著西江黃金水道上升為國(guó)家戰(zhàn)略。西江干流在廣西境內(nèi)的內(nèi)河航道以梧州為總匯,梧州是西江黃金水道的龍頭城市,也是西江水情、航運(yùn)數(shù)據(jù)的主要測(cè)量點(diǎn)和匯聚點(diǎn)。
西江全流域有600多個(gè)水文站監(jiān)測(cè)實(shí)時(shí)數(shù)據(jù)(流量、水位),部分水文站位置如圖1所示。本次研究以緩解西江船舶[13]滯航的問題為目的,預(yù)測(cè)船舶在枯水期及汛期適合通航的水位點(diǎn)。對(duì)西江流域梧州站點(diǎn)水位數(shù)據(jù)進(jìn)行采集后,構(gòu)建基于splice-LSTM的水位預(yù)測(cè)模型進(jìn)行梧州站單站點(diǎn)的水位預(yù)測(cè)。為更好地保障船舶正常安全通航,應(yīng)設(shè)計(jì)更為精準(zhǔn)的水位預(yù)測(cè)方法。
1.2 評(píng)價(jià)指標(biāo)與原始數(shù)據(jù)
1.2.1 評(píng)價(jià)指標(biāo)
為了檢驗(yàn)?zāi)P陀行?,本文利用西江干線梧州站點(diǎn)2020~2021年的流量和水位數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。模型評(píng)價(jià)指標(biāo)選取Pearson相關(guān)系數(shù)平方R2、均方根誤差RMSE和Nash-Sutcliffe效率系數(shù)NSE[14]進(jìn)行衡量。
1.3 數(shù)據(jù)預(yù)處理
考慮到有些傳感器不能正常工作,原始數(shù)據(jù)里可能存在異常值和缺失值。假如把帶有異?;蛉笔е档脑紨?shù)據(jù)作為模型輸入,可能會(huì)降低模型的擬合效果。實(shí)驗(yàn)中對(duì)異常值和缺失值的處理均采用插補(bǔ)法進(jìn)行填充,具體做法是對(duì)缺失值或者異常值所處的時(shí)刻t最近n個(gè)時(shí)刻數(shù)據(jù)(xt-n,xt-n+1,…,xt-1)求均值填充。考慮到處理后的數(shù)據(jù)不同因素的單位不一樣(比如單位為m3 /s的流量,單位為m的水位),數(shù)據(jù)的大小也不一致,需要將各個(gè)因素的值進(jìn)行歸一化處理[15]。歸一化后的數(shù)據(jù)有助于模型更好發(fā)現(xiàn)每個(gè)因素之間的聯(lián)系,提高模型訓(xùn)練的收斂速度,減少模型的訓(xùn)練時(shí)間。歸一化數(shù)據(jù)的表達(dá)式如下。
x*=x-xminxmax-xmin(4)
式中:xmax表示輸入數(shù)據(jù)的最大值;xmin表示輸入數(shù)據(jù)的最小值。歸一化后每個(gè)樣本數(shù)據(jù)的范圍在[0,1]之間,每個(gè)因素的趨勢(shì)如圖3所示。
1.4 研究方法
一個(gè)有效的對(duì)多因素進(jìn)行建模的水位預(yù)測(cè)模型,對(duì)提升水位預(yù)測(cè)效果至關(guān)重要[16]。考慮到水位的長(zhǎng)短期模式,圖4展示了基于splice-LSTM的多因素水位預(yù)測(cè)模型的框架。
1.4.1 模型原理
由模型框架圖可知,splice-LSTM模型由輸入層、LSTM層、全連接層和輸出層構(gòu)成,除了全連接層數(shù)為2之外,其余層數(shù)均為1。預(yù)測(cè)的輸入由當(dāng)前預(yù)測(cè)時(shí)間節(jié)點(diǎn)t+i往前推t時(shí)刻的歷史輸入數(shù)據(jù)x1,x2,…,xt在基于LSTM層的非線性單元和全連接層的線性單元共同決定。該架構(gòu)不僅能有效解決水文序列間復(fù)雜非線性依賴的問題,而且能夠大大降低非線性層帶來的線性元素敏感性。其具體步驟為:
① 首先,將由當(dāng)前預(yù)測(cè)時(shí)間節(jié)點(diǎn)t+i往前推t時(shí)刻的歷史輸入數(shù)據(jù)x1,x2,…,xt作為輸入層。其中t表示神經(jīng)單元步長(zhǎng),即當(dāng)前預(yù)測(cè)值依賴前t個(gè)時(shí)刻的輸入,i表示預(yù)測(cè)間隔,即預(yù)測(cè)未來第i個(gè)時(shí)刻的水位值。
② 然后,為了提高近期歷史輸入數(shù)據(jù)的權(quán)重,降低預(yù)測(cè)誤差,LSTM層對(duì)不同時(shí)刻的輸入分別編碼t次,并對(duì)每一次最后時(shí)刻的狀態(tài)進(jìn)行拼接,分別得到t個(gè)維度為[(batch_size,t,1),(batch_size,t-1,1),…,(batch_size,1,1)]的隱藏狀態(tài),對(duì)這t個(gè)隱藏狀態(tài)按dim=1進(jìn)行拼接,以圖4所示中的表示。
③ 接著將LSTM層的輸出結(jié)果(batch_size,1+2+…+t,1)經(jīng)過降維后輸入至由兩個(gè)線性函數(shù)FFN1和FFN2組成的全連接層,得到預(yù)測(cè)當(dāng)前時(shí)刻水位預(yù)測(cè)值,輸出維度為(batch_size,1)。
下面簡(jiǎn)單闡述非線性層的LSTM網(wǎng)絡(luò)結(jié)構(gòu)。
LSTM在RNN結(jié)構(gòu)上有遺忘門(Forget Gate)、輸入門(Input Gate)和輸出門(Output Gate)3個(gè)門控機(jī)制,互相連接的具體結(jié)構(gòu)如圖5所示。經(jīng)過設(shè)置神經(jīng)網(wǎng)絡(luò)的記憶單元和別的連接末尾處的系數(shù)控制信息流的細(xì)胞單元(Memory cell)、輸出和輸入狀態(tài)。
在當(dāng)前時(shí)刻t,由多個(gè)神經(jīng)元組成輸入數(shù)據(jù)xt;在前一時(shí)刻t-1,隱狀態(tài)ht-1包含多個(gè)神經(jīng)元;xt先后經(jīng)過遺忘門、輸入門和輸出門。
遺忘門:控制上一時(shí)刻記憶單元的信息是否保留到當(dāng)前時(shí)刻記憶單元,記為ft,公式如下。
ft=σWfxt+Ufht-1+bf(5)
式中:Wf和Uf分別為當(dāng)前t時(shí)刻輸入數(shù)據(jù)xt和前一時(shí)刻t-1隱狀態(tài)ht-1相關(guān)權(quán)重系數(shù);bf為偏置項(xiàng);σ為sigmoid激活函數(shù)。
輸入門:決定當(dāng)前時(shí)刻輸入信息能否進(jìn)入記憶單元的過程稱為輸入門,記為it。輸入數(shù)據(jù)與輸入門兩類特征源的混合的來源公式如下。
it=σWixt+Uiht-1+bi(6)
Ct~=tanhWcxt+Ucht-1+bc(7)
式中:Wi,Ui,Wc和Uc分別表示其對(duì)應(yīng)門控的循環(huán)連接權(quán)值;tanh為雙曲正切激活函數(shù);Ct~為t時(shí)刻臨時(shí)的cell,它來源于當(dāng)前的輸入xt及上一時(shí)刻的隱狀態(tài)ht-1;bc為偏置項(xiàng)。xt和ht-1都有對(duì)應(yīng)的權(quán)重,通過一個(gè)非線性tanh函數(shù),得到一個(gè)[-1,1]之間的數(shù)值向量。
神經(jīng)元細(xì)胞狀態(tài)即cell單元,具有重置、讀取、保存及更新LSTM單元長(zhǎng)距離依賴關(guān)系的功能,以ct表示。通過變量ft,it,Ct~組合成公式(8),ct是通過遺忘門和輸入門來進(jìn)行控制的。遺忘門ft控制之前需遺忘多少,則輸入門cell控制當(dāng)前臨時(shí)cell有多少要存儲(chǔ)到這條主線上。
ct=ftct-1itCt~(8)
式中:表示矩陣點(diǎn)積運(yùn)算,表示矩陣點(diǎn)和運(yùn)算。
輸出門:決定當(dāng)前時(shí)刻內(nèi)存細(xì)胞單元能否進(jìn)入當(dāng)前隱藏狀態(tài)ht,用ot表示,公式為
ot=σWoxt+Uoht-1+bo(9)
式中:Wo,Uo分別為當(dāng)前t時(shí)刻輸入數(shù)據(jù)xt和前一時(shí)刻t-1隱狀態(tài)ht-1相關(guān)權(quán)重系數(shù);bo為偏置項(xiàng)。最后當(dāng)前cell信息經(jīng)過一個(gè)非線性tanh函數(shù)得到[-1,1]的向量,將該向量與輸出門相乘,就得到了最終當(dāng)前t時(shí)刻的隱狀態(tài)輸出ht,公式為
ht=ottanh(ct)(10)
隱藏層cell結(jié)構(gòu)如圖6所示。
神經(jīng)網(wǎng)絡(luò)LSTM模型訓(xùn)練流程包括:把時(shí)刻t的嵌入特征送至輸入層,通過sigmoid激活函數(shù)獲取輸出;再把時(shí)刻t-1細(xì)胞單元保存的數(shù)據(jù)、t-1時(shí)刻的隱藏層輸出和激活函數(shù)輸出輸入LSTM神經(jīng)元,經(jīng)過上述3個(gè)門控機(jī)制及細(xì)胞單元的計(jì)算,輸出結(jié)果到輸出層或下一個(gè)隱藏層,將LSTM神經(jīng)元結(jié)果傳遞到輸出層神經(jīng)元,接著通過輸入數(shù)據(jù)真實(shí)值與輸出層的預(yù)測(cè)值計(jì)算反向傳播誤差,以此來更新每一個(gè)權(quán)重參數(shù)。有了這種門控機(jī)制,模型不用記憶過去所有的信息,只用記住它認(rèn)為有用的信息,同時(shí)有用的信息可以直接傳遞到后續(xù)記憶單元,緩解了模型訓(xùn)練過程中的梯度消失與梯度爆炸問題。
splice-LSTM與傳統(tǒng)LSTM模型相比,對(duì)輸入層不同時(shí)刻的歷史輸入數(shù)據(jù)進(jìn)行多次編碼,并對(duì)編碼結(jié)果進(jìn)行拼接作為下一全連接層的輸入。一方面提高了近期歷史輸入數(shù)據(jù)對(duì)計(jì)算下一時(shí)刻水位值的貢獻(xiàn)度;另一方面編碼多次進(jìn)行拼接,增加了模型LSTM層的權(quán)重參數(shù),使得模型能夠捕獲更多的特征,從而使得模型具有更好的學(xué)習(xí)能力和預(yù)測(cè)效果。
1.4.2 模型的輸入與輸出
splice-LSTM模型可接收多因素(多個(gè)上游支流流量及待預(yù)測(cè)站點(diǎn)的流量及水位)的輸入,輸出單因素的水位預(yù)測(cè)結(jié)果。本文以西江流域梧州站點(diǎn)水位預(yù)測(cè)為對(duì)象,以上游支流對(duì)應(yīng)站點(diǎn)長(zhǎng)洲、京南、大藤峽、桂平等站點(diǎn)的流量和梧州站點(diǎn)水位歷史值為輸入,梧州站點(diǎn)未來第i個(gè)時(shí)刻水位的預(yù)測(cè)值為輸出。此外多因素輸入還包括長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM的神經(jīng)單元步長(zhǎng)t和預(yù)測(cè)間隔i。本文采用西江流域京南、長(zhǎng)洲、大藤峽、桂平站點(diǎn)的小時(shí)出庫(kù)流量以及梧州站點(diǎn)小時(shí)水位數(shù)據(jù)進(jìn)行預(yù)測(cè)?,F(xiàn)階段的模型暫時(shí)沒有考慮降雨影響因子,主要原因是未能有效采集降雨量數(shù)據(jù),下一步將研究如何獲取降雨量數(shù)據(jù)優(yōu)化模型。盡管沒有降雨的數(shù)據(jù),但在遇到降雨天氣時(shí)模型表現(xiàn)尚可,因?yàn)榘l(fā)生區(qū)間降雨時(shí),當(dāng)?shù)卣军c(diǎn)的實(shí)時(shí)流量會(huì)如實(shí)反映,對(duì)目標(biāo)站點(diǎn)的水位預(yù)測(cè)也會(huì)隨之產(chǎn)生變化。本文提出的splice-LSTM預(yù)測(cè)模型中使用單元步長(zhǎng)大小為30,預(yù)測(cè)時(shí)間間隔為12 h,即用過去30 h的各站點(diǎn)流量、梧州站點(diǎn)水位值來預(yù)測(cè)未來第12個(gè)小時(shí)梧州站點(diǎn)的水位值。這兩個(gè)數(shù)值并非一成不變,而是可調(diào)整的超參數(shù)。一般情況下,預(yù)見期越短,預(yù)測(cè)精度越高,但不能一味追求過高的預(yù)測(cè)精度選擇最小的預(yù)見期,這樣的預(yù)測(cè)對(duì)于航運(yùn)的指導(dǎo)意義不大,但也不能把預(yù)見期一味調(diào)高,否則將會(huì)導(dǎo)致預(yù)測(cè)精度急劇下降,預(yù)測(cè)的指導(dǎo)意義也不大。此外,盡管梧州站點(diǎn)時(shí)間距離較遠(yuǎn)的京南站點(diǎn)有10 h,但對(duì)預(yù)測(cè)模型而言,只需要接收相同時(shí)刻的輸入數(shù)據(jù),時(shí)間的延遲和數(shù)據(jù)平滑可通過模型在訓(xùn)練過程中學(xué)習(xí),不需要人為干預(yù)。因此本文通過實(shí)驗(yàn)采用較合理的12 h預(yù)見期,同時(shí)根據(jù)西江開發(fā)投資集團(tuán)有限公司船閘管理部相關(guān)專家的建議,在枯水期12 h預(yù)見期能夠滿足一般的航運(yùn)需求。
1.4.3 模型訓(xùn)練
由于本文的預(yù)測(cè)模型是基于深度神經(jīng)網(wǎng)絡(luò)進(jìn)行構(gòu)建,故可運(yùn)用Keras、Pytorch和Tensorflow等主流的深度學(xué)習(xí)框架進(jìn)行構(gòu)建。本次實(shí)驗(yàn)使用Linux操作系統(tǒng)Ubuntu20.04,Python版本為3.6.5,keras 2.2.4 以及Tensorflow 1.4.1版本深度學(xué)習(xí)框架構(gòu)建和訓(xùn)練所提出的基于splice-LSTM多因素水位預(yù)測(cè)模型。開發(fā)者只需將定義好的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行組合,調(diào)用Keras框架提供的損失函數(shù)、激活函數(shù)及優(yōu)化器,輸入訓(xùn)練數(shù)據(jù),調(diào)用其訓(xùn)練接口完成訓(xùn)練。為了進(jìn)一步提升模型最終預(yù)測(cè)效果,模型的超參數(shù)設(shè)置也是至關(guān)重要的,比如LSTM隱藏層數(shù)、網(wǎng)絡(luò)神經(jīng)元大小、學(xué)習(xí)率learning rate、損失函數(shù)loss等參數(shù)設(shè)置。splice-LSTM模型的超參數(shù)設(shè)置如表3所列。
模型的隱藏層是由30個(gè)單向單層且神經(jīng)元數(shù)量等于1的 LSTM網(wǎng)絡(luò)組成,以提高模型預(yù)測(cè)效果,降低預(yù)測(cè)誤差。
2 結(jié)果分析
2.1 預(yù)測(cè)值與實(shí)際值對(duì)比
為了驗(yàn)證模型的預(yù)測(cè)效果,本文對(duì)2021年12月1日24 h水位進(jìn)行樣本預(yù)測(cè)(見表4),這里的預(yù)測(cè)間隔設(shè)置為12 h,即分別預(yù)測(cè)兩次12 h的水位值進(jìn)行匯總。從表4預(yù)測(cè)結(jié)果可知,預(yù)測(cè)值與實(shí)際值不管是絕對(duì)誤差,還是相對(duì)誤差,均比較小,平均相對(duì)誤差僅為2.06%,最大相對(duì)誤差為4.00%,最大絕對(duì)誤差僅為0.113 2 m,預(yù)測(cè)效果對(duì)西江船閘運(yùn)行調(diào)度中心精準(zhǔn)預(yù)調(diào)度船舶具有重要指導(dǎo)價(jià)值。目前,梧州站水位預(yù)測(cè)實(shí)際預(yù)報(bào)精度基本保持在90%左右,基本達(dá)到實(shí)用精度,個(gè)別時(shí)刻預(yù)測(cè)誤差超過10%,一般是由于站點(diǎn)根據(jù)發(fā)電計(jì)劃進(jìn)行發(fā)電放水導(dǎo)致的預(yù)測(cè)誤差較大。
2.2 splice-LSTM與其他模型比較
為了提高所提出模型性能說服力,實(shí)驗(yàn)將80%原始數(shù)據(jù)集作為訓(xùn)練集,20%作為測(cè)試集,對(duì)比單因素ARIMA 模型、傳統(tǒng)單因素LSTM模型、傳統(tǒng)多因素LSTM模型與多因素splice-LSTM模型實(shí)驗(yàn)結(jié)果。單因素模型是只考慮因變量數(shù)據(jù)的時(shí)間序列預(yù)測(cè)模型,是根據(jù)歷史一段時(shí)間內(nèi)的因變量數(shù)據(jù)預(yù)測(cè)未來n個(gè)時(shí)刻的趨勢(shì),無須考慮其他相關(guān)影響因子,盡管在較長(zhǎng)預(yù)見期下預(yù)測(cè)效果不理想,但仍然可以作為時(shí)間序列預(yù)測(cè)問題的基線,具有典型的參考意義。對(duì)比模型在測(cè)試集上的表現(xiàn)如表5所列,其中預(yù)測(cè)間隔為12 h。從表5可知,多因素splice-LSTM 模型分別比ARIMA、傳統(tǒng)單因素LSTM、多因素LSTM模型的NSE提升0.147,0.113和0.050。在評(píng)價(jià)指標(biāo)R2中,splice-LSTM 分別比ARIMA、傳統(tǒng)單因素LSTM、多因素LSTM模型提升0.144,0.1010和0.049。在評(píng)價(jià)指標(biāo)RMSE中,splice-LSTM 模型分別比ARIMA、傳統(tǒng)單因素LSTM、多因素LSTM降低了41.3%,24.5%,14.3%。
實(shí)驗(yàn)結(jié)果表明,多因素splice-LSTM 水位預(yù)測(cè)模型的記憶遺忘能力能夠較好預(yù)測(cè)非線性時(shí)間序列數(shù)據(jù),對(duì)西江干線水位的預(yù)測(cè)效果較好。每個(gè)模型在測(cè)試集數(shù)據(jù)的擬合情況如圖7所示。
2.3 splice-LSTM模型在不同預(yù)測(cè)間隔測(cè)試集上的表現(xiàn)
理論上預(yù)測(cè)間隔越小,預(yù)測(cè)水位值就越精準(zhǔn),但不能為了追求高精準(zhǔn)率選擇最小預(yù)測(cè)間隔,而忽略實(shí)際指導(dǎo)意義。為了確定所提出模型的較優(yōu)預(yù)測(cè)間隔,本文對(duì)多個(gè)不同預(yù)測(cè)間隔在測(cè)試集上進(jìn)行驗(yàn)證,測(cè)試結(jié)果如表6所列。
從表6可知,盡管預(yù)測(cè)間隔為6 h的表現(xiàn)最優(yōu),但預(yù)測(cè)間隔為12 h的精度與6 h的差異不大,考慮到水位預(yù)測(cè)的實(shí)際指導(dǎo)價(jià)值,在效果下降不明顯的情況下,越長(zhǎng)預(yù)測(cè)間隔,越具備競(jìng)爭(zhēng)力和指導(dǎo)價(jià)值,因此,最終選擇較優(yōu)預(yù)測(cè)間隔為12 h。
3 結(jié) 論
本文在傳統(tǒng)的單因素水位預(yù)測(cè)模型的基礎(chǔ)上,提出了一種基于splice-LSTM的多因素水位預(yù)測(cè)模型,并將其運(yùn)用在西江干線梧州站的水位預(yù)測(cè)中,通過對(duì)比其他模型的水位預(yù)測(cè)效果,驗(yàn)證了基于splice-LSTM的模型具有更高的預(yù)測(cè)精度。
(1) 傳統(tǒng)的單因素預(yù)測(cè)模型,如ARIMA模型和傳統(tǒng)LSTM只考慮歷史水位的因素,僅僅能夠預(yù)測(cè)水位值的一般趨勢(shì)。splice-LSTM模型則考慮了影響水位的因素,例如上游支流的流量和歷史的水位,在細(xì)微處的預(yù)測(cè)效果明顯比上述的單因素模型好,且模型的泛化能力更強(qiáng)。
(2) 相對(duì)于傳統(tǒng)多因素LSTM模型,splice-LSTM模型通過堆疊多個(gè)LSTM模型,增加近期歷史輸入數(shù)據(jù)的權(quán)重,使得模型預(yù)測(cè)更加接近歷史真實(shí)值,降低了預(yù)測(cè)誤差。準(zhǔn)確預(yù)測(cè)西江河流水位水量,對(duì)西江船閘運(yùn)行調(diào)度中心精準(zhǔn)預(yù)調(diào)度船舶具有重要意義。
參考文獻(xiàn):
[1] 武連洲,白濤,哈燕萍,等.水文序列變異對(duì)水庫(kù)調(diào)度運(yùn)行的影響研究[J].水資源與水工程學(xué)報(bào),2016,27(4):88-92.
[2] 劉曉陽(yáng),姚華明,張海榮,等.基于機(jī)器學(xué)習(xí)的三峽水庫(kù)小時(shí)尺度壩前水位預(yù)測(cè)[J].人民長(zhǎng)江,2023,54(2):147-151.
[3] 次必聰,張品一.基于ARIMA-LSTM模型的金融時(shí)間序列預(yù)測(cè)[J].統(tǒng)計(jì)與決策,2022,38(11):145-149.
[4] SABZI H Z,KING J P,ABUDU S.Developing an intelligent expert system for streamflow prediction,integrated in a dynamic decision support system for managing multiple reservoirs:a case study[J].Expert Systems with Applications,2017,83:145-163.
[5] 余珍.基于時(shí)間序列分析的航道水位預(yù)測(cè)研宄[J].中國(guó)水運(yùn)(月),2018,18(10):148-150.
[6] DEO R C,KISI O,SINGH V P.Drought forecasting in eastern Australia using multivariate adaptive regression spline,least square support vector machine and M5Tree model[J].Atmospheric Research,2017,184:149-175.
[7] 許國(guó)艷,朱進(jìn),司存友,等.基于CNN和MC的水文時(shí)間序列預(yù)測(cè)組合模型[J].計(jì)算機(jī)與現(xiàn)代化,2019(11):23-28,33.
[8] 劉青松,嚴(yán)華,盧文龍.基于AR-RNN的多變量水位預(yù)測(cè)模型研究[J].人民長(zhǎng)江,2020,51(10):94-99.
[9] 徐楊,劉亞新,汪濤,等.基于LSTM的三峽水庫(kù)短期上游水位預(yù)測(cè)方法研究[J].水利水電快報(bào),2022,43(10):13-18.
[10] 馮銳.基于LSTM模型的九龍江流域徑流序列預(yù)測(cè)研究[D].西安:長(zhǎng)安大學(xué),2019.
[11] KULISZ M,KUJAWSKA J,PRZYSUCHA B,et al.Forecasting water quality index in groundwater using Artificial Neural Network[J].Energies,2021,14(18):1-16.
[12] 劉興坡,陳翔,胡小婷,等.基于正交極差分析的青龍河流域 HSPF模型參數(shù)尋優(yōu)模式[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2018,50(2):131-138.
[13] 張冬梅,李金平,李江,等.基于門控權(quán)重單元的多變量時(shí)間序列預(yù)測(cè)[J].湖南大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,48(10):105-112.
[14] 李冠城,侯敏馳,李梓君,等.珠江流域“十三五”水污染防治成效與經(jīng)驗(yàn)[J].環(huán)境保護(hù),2021,49(19):9-13.
[15] 國(guó)家市場(chǎng)監(jiān)督管理總局,中國(guó)國(guó)家標(biāo)準(zhǔn)化管理委員會(huì).內(nèi)河過閘運(yùn)輸船舶標(biāo)準(zhǔn)船型主尺度系列第3部分:西江航運(yùn)干線GB 38030.3-2019[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2019.
[16] 王萍,程冰,孫金領(lǐng).基于ARIMA的新城疫風(fēng)險(xiǎn)預(yù)測(cè)模型[J].青島農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,33(1):68-71.
(編輯:謝玲嫻)
Research on Xijiang River water level prediction model of multi-factor based on splice-LSTM
LYU Haifeng1,2,JI Xiaoyu1,2,DING Yong3
(1.Guangxi Key Laboratory of Machine Vision and Intelligent Control,Wuzhou University,Wuzhou 543002,China; 2.Guangxi Colleges and Universities Key Laboratory of Industry Software Technology,Wuzhou University,Wuzhou 543002,China; 3.School of Computer Science and Information Security,Guilin University of Electronic Technology,Guilin 541004 China)
Abstract:
Accurate hydrologic time series prediction of water level and water volume is an important basis for water resources management and plays an important role in water transfer detection.Affected by factors such as the flow and water level of upstream tributaries,traditional single-factor water level prediction models cannot effectively consider these factors and water level prediction of Xijiang River faces severe challenges.Taking the typical Wuzhou Station on Xijiang River mainstream as the research object,a multi-factor water level prediction model based on splice-LSTM is established.The spliced Long Short-term Memory network(LSTM) and the fully connected linear model(Linear) were used to analyze and predict the flow and water level of the Xijiang River mainstream like Wuzhou station and other stations from 2020 to 2021.Research results show that:①The splice-LSTM can link to a non-linear layer and thus increase the weight of recent historical input data,making the model prediction closer to the historical value and reducing the prediction error.The linear part can improve the sensitivity of the model to linear components and the model to linear components,making the model′s prediction at the water level peak more accurate.②Compared with the traditional single factor ARIMA model and LSTM model,the accuracy of the split-LSTM model in water level prediction has increased by 14.4% and 10.1% respectively.The research results can provide a scientific reference for the precise pre-scheduling of ships by the Xijiang Shiplock Operation and Dispatching Center.
Key words:
water level prediction;shiplock dispatching;splice-LSTM model;Xijiang River basin