顧乾暉,胡 翌,涂振宇
(1.南昌工程學院 信息工程學院,江西 南昌,330099;2.江西省贛撫平原水利工程管理局,江西 南昌,330096)
水位預測的精確性對于防汛抗旱、航道管理和水資源調(diào)度與利用有著重大意義。河流水位具有復雜性、季節(jié)性、波動性等特點[1]。并且受到降水量、支流和氣候變化等多種因素的影響,特別是近年來的異常氣候,這使得對河流水位預測變得更加復雜、更加困難。
近些年,隨著人工智能和大數(shù)據(jù)的快速發(fā)展,越來越多的學者利用機器學習和深度學習對水位進行預測。許國艷和朱進[2]等人利用CNN和MC組合模型對水位進行預測,并與其他模型進行對比,實驗結(jié)果表明取得良好的效果。郭燕和賴軍[3]把支流作為影響因子輸入LSTM神經(jīng)網(wǎng)絡預測鄱陽湖水位,取得不錯的精度。商其亞和程耀東[4]等人利用混沌粒子群優(yōu)化SVM參數(shù),以此來對水位進行預測。要震[5]等人利用遺傳算法優(yōu)化Elman模型對水位進行預測,實驗結(jié)果表明精確度得到了提高。
在實際環(huán)境下,影響河流水位的因素眾多,河流水文數(shù)據(jù)不僅呈現(xiàn)出非線性特征也有時序性、復雜性和波動性特征[6]。SVR雖然在捕捉非線性數(shù)據(jù)上表現(xiàn)出強大的能力,但無法考慮時序變化。同時影響水位數(shù)據(jù)因素眾多并且水文數(shù)據(jù)中包含許多復雜和不確定信息,運用單一模型往往預測效果不理想。而LSTM神經(jīng)網(wǎng)絡不僅能處理多元變量之間的非線性映射關(guān)系,也能很好的處理時間序列數(shù)據(jù)[7]。
因此,為了更好的提高預測效果,本文首先利用PSO分別對SVR和LSTM這兩種模型進行尋優(yōu),之后將優(yōu)化后的SVR和LSTM這兩種模型進行按比例組合。本文提出的模型既可以處理水位變化的非線性特征,也能同時考慮水位變化的時序性和復雜性。利用該組合模型去預測修河水系的萬家埠逐日水位量變化,取得很好的預測效果。
LSTM神經(jīng)網(wǎng)絡是從RNN神經(jīng)網(wǎng)絡基礎上改進而來,LSTM神經(jīng)網(wǎng)絡中的門控單元(輸入門、輸出門、遺忘門)使得模型具有較長時間的“記憶功能”,因此LSTM神經(jīng)網(wǎng)絡適用于長時間非線性序列預測問題,LSTM神經(jīng)網(wǎng)絡的結(jié)構(gòu)圖如圖1所示。
圖1 LSTM基本單元結(jié)構(gòu)
模型的輸入數(shù)據(jù)分別為t時刻的輸入數(shù)據(jù)xt,t-1時刻的記憶值ct-1和t-1時刻的LSTM的輸出值ht-1,輸出數(shù)據(jù)分別為t時刻的記憶值ct和LSTM輸出值ht。
“遺忘門”通過ft保留和丟棄上一時刻的記憶單元ct-1的信息來影響當前時刻的細胞狀態(tài)[8]。ft公式如下:
式中,σ為 sigmoid激活函數(shù);bf為偏置頂;wht-1為輸入數(shù)據(jù)ht-1對應的權(quán)重;wxt為輸入數(shù)據(jù)xt對應的權(quán)重。
“輸入門”通過激活函數(shù)sigmoid將變量控制在[0,1]之間,并輸出 it。公式如下:
“遺忘門”和“輸入門”的變化決定了細胞狀態(tài)ct的變化。公式如下:
式中,bg為偏置頂;其余符號意義同前。
“輸出門”用來控制當時時刻細胞狀態(tài)值的輸出。公式如下:
SVR(支持向量回歸機)是Vapnik等人[9]在1995年提出的一種以統(tǒng)計學理論為基礎的回歸預測算法。SVR以結(jié)構(gòu)風險最小化的核心思想,通過構(gòu)建非線性映射,將原始數(shù)據(jù)集從低維空間映射到更高維的特征空間,然后在高維空間中通過創(chuàng)建一個線性函數(shù)得到預測值,改線性函數(shù)公式為:
式中:φ(x)為原始數(shù)據(jù)映射到高維空間的映射函數(shù);w為權(quán)值向量;b為偏置頂。
在SVR訓練過程中可以將建模問題轉(zhuǎn)換為二次凸規(guī)劃問題,其形式如下:
式中:c為懲罰項系數(shù);ξi,ξ^i為松弛變量;ε 為不敏感損失函數(shù)。通過引入拉格朗日乘子算法將約束條件融入到公式(8)中,最終得到SVR模型如下所示:
式中:a 為大于 0 的拉格朗日乘子;K(x,xi)為滿足Mercer條件的核函數(shù)。
2.3.1 粒子群(PSO)優(yōu)化SVR和LSTM
SVR模型的預測效果受到懲罰系數(shù)c以及核參數(shù)g取值的影響,因此c和g的選擇對SVR模型的性能有著重大影響[10]。LSTM神經(jīng)網(wǎng)絡雖然在處理長時間序列數(shù)據(jù)上有著很好的效果,但是LSTM計算過于復雜,并且當輸入越長,數(shù)據(jù)間包含的信息量就越大,傳統(tǒng)的LSTM模型在訓練過程中會表現(xiàn)出明顯的不穩(wěn)定性,甚至會出現(xiàn)梯度消失的現(xiàn)象[11]。
粒子群優(yōu)化算法(PSO)是一種群智能優(yōu)化算法。粒子群的優(yōu)化是將種群中的個體當成多維搜索空間的粒子,每個粒子都有一個由目標函數(shù)決定的適應度值,在每一次迭代中,每一個粒子通過尋找個體最優(yōu)位置和全局最優(yōu)位置來不斷更新自己的位置和速度,直至到達尋優(yōu)條件[12]。
因此本文通過粒子群優(yōu)化(PSO)算法自動迭代尋優(yōu)LSTM模型兩個重要參數(shù):神經(jīng)元個數(shù)(m)和學習率(lr)以及SVR模型的兩個重要參數(shù)懲罰系數(shù)c以及核參數(shù)g,并把水位預測結(jié)果的均方誤差(MSE)作為目標函數(shù),MSE公式如下所示:
式中:yt是真實數(shù)據(jù),pt是預測值。
2.3.2 SVR-LSTM模型組合
多變量時序單元的輸入即LSTM神經(jīng)網(wǎng)絡的輸入,把前7天的日均水位、日均水流量、日降水量值作為LSTM模型的輸入,后1天的水位值作為輸出。輸入數(shù)據(jù)表達式見公式(11)。
式中:x、a、b分別表示日均水位、日均水流量、日降水量數(shù)據(jù)。
非線性單元的輸入即SVR模型的輸入,把前7天的水位值作為SVR模型的輸入,后1天的水位值作為輸出。輸入數(shù)據(jù)表達式見公式(12)。
式中:x表示水位數(shù)據(jù)。
2.3.3 PSO優(yōu)化SVR-LSTM組合模型
通過PSO優(yōu)化SVR-LSTM組合模型,得到PSOSVR-LSTM組合模型的輸出值為PSO-LSTM時序單元的預測值和PSO-SVR非線性單元的預測值的比例組合,組合模型的表達式如下:
式中,XT表示1日水位預測值;LT表示PSO-LSTM時序性單元輸出的1日水位預測值;ST表示PSO-SVR非線性單元輸出的1日水位預測值;a表示為(0,1)之間的數(shù)值。圖2為PSO-SVR-LSTM組合模型結(jié)構(gòu)圖。
圖2 PSO-SVR-LSTM組合模結(jié)構(gòu)圖
組合預測模型流程圖如圖3所示,其具體步驟如下。
圖3 PSO-SVR-LSTM組合模型流程圖
Step1:為了降低數(shù)據(jù)的波動性,對日均水位、日降水量和日均水流量這三組數(shù)據(jù)進行最大最小值歸一化。
Step2:構(gòu)建LSTM神經(jīng)網(wǎng)絡時序水位預測單元。把日均水位、日降水量、日均水流量這三組數(shù)據(jù)作為LSTM模型的輸入,在LSTM模型中進行訓練,同時把LSTM模型預測到的水位數(shù)據(jù)作為該模型的輸出。
Step3:構(gòu)建SVR非線性水位預測單元。把水位這個單獨變量作為SVR模型的輸入,同時把SVR模型預測到的水位數(shù)據(jù)作為該模型的輸出。
Step4:利用粒子群(PSO)分別優(yōu)化SVR和LSTM模型參數(shù),選取均方誤差MSE作為評價標準和各粒子的適應度值,得到兩組模型的最優(yōu)參數(shù)。
Step5:令經(jīng)過PSO優(yōu)化后的LSTM模型的權(quán)重值為a。同時令經(jīng)過PSO優(yōu)化后的SVR模型的權(quán)重值為(1-a)。分別利用各自的權(quán)重值組合成水位組合預測模型,其表達式具體見公式(13)。
Step6:通過不斷迭代尋找最優(yōu)的權(quán)值參數(shù)a,并利用組合模型對水位進行預測,得到最終水位預測值。
實驗所使用計算機配置如下:處理器為(英特爾)Intel(R) Core(TM) i5-8400 CPU@2.80GHz,顯卡為NVIDIA GeForce GTX 1050 Ti,內(nèi)存為 16 GB,操作系統(tǒng)為windows10;程序設計語言為Python3.7;集成開發(fā)環(huán)境為Anaconda和Visual Code;程序中TensorFlow由2.1.0版本實現(xiàn),scikit-learn由0.2.0版本實現(xiàn)。
本文所用的數(shù)據(jù)是江西南昌潦水水域萬家埠水文站,選擇從2017年1月1號至2020年12月30號的逐日平均水位、日均流量、日降水量數(shù)據(jù),共1462條數(shù)據(jù),其中日降水量為整個潦水流域的日降水量的算術(shù)平均值。將前三年數(shù)據(jù)作為訓練集,后一年數(shù)據(jù)作為測試集。訓練集與測試集按比例分別劃分為80%與20%,數(shù)據(jù)集劃分如圖4所示。
圖4 萬家埠水位數(shù)據(jù)集
由于水文數(shù)據(jù)類型不同,為了提高模型的收斂速度和計算精度,需要對樣本數(shù)據(jù)進行最大最小值歸一化處理,即:
式中,ximax表示變量i的最大值;ximin表示變量i的最小值。
將收集到的在線水文數(shù)據(jù)經(jīng)過數(shù)據(jù)歸一化后作為PSO-SVR-LSTM組合模型的輸入?yún)?shù),并利用均方誤差MSE作為評價指標。
為了驗證本文提出的預測模型的有效性,選取BP、SVR、PSO-SVR、PSO-LSTM 和 PSO-BP-LSTM 等預測模型與PSO-SVR-LSTM模型進行對比實驗。這幾種預測模型均在相同的實驗平臺和環(huán)境下進行實驗。
首先利用粒子群算法(PSO)分別對LSTM神經(jīng)網(wǎng)絡的神經(jīng)元個數(shù)m1、學習率lr和擁有rbf核函數(shù)SVR的懲罰因子c、核參數(shù)g以及單隱含層的BP神經(jīng)網(wǎng)絡的神經(jīng)元個數(shù)m2進行尋優(yōu),將MSE作為目標函數(shù),最后優(yōu)化后的各個模型的參數(shù)取值見表1。
表1 對比模型參數(shù)設置
接著對于PSO-SVR-LSTM組合模型,利用不斷迭代尋找組合的模型的最優(yōu)權(quán)重a。最終經(jīng)過PSO尋優(yōu)后,得出權(quán)重值a為0.82。
為了更加直觀的看出本文提出的PSO-SVR-LSTM模型在預測精度上的提高,分別對各個模型進行繪圖。如圖5和圖6所示,經(jīng)過PSO優(yōu)化后的LSTM和BP模型都要比普通LSTM和BP的準確度效果要好。如圖7所示,雖然PSO-SVR模型與水位真實數(shù)據(jù)偏離度較高,但是相對于其他模型,PSO-SVR在波峰點以及線型上與真實數(shù)據(jù)更相似。如圖8所示PSO-SVR-LSTM模型在精確度以及擬合度上都要比PSO-LSTM和PSOSVR效果好。
圖5 BP與PSO-BP模型預測值
圖6 LSTM、PSO-LSTM預測值
圖7 PSO-BP、PSO-LSTM預測值
圖8 PSO-SVR-LINEAR與PSO-SVR-RBF預測值
為了更加精確體現(xiàn)各種模型之間的性能對比,根據(jù)真實數(shù)據(jù)與預測數(shù)據(jù)繪制出這四種模型的性能對比表,如表2。可以從表中看出,PSO-SVR-LSTM組合模型在MSE、MAE、R2以及RMSE四種評價指標上都比其他模型效果要好。
表2 模型性能對比表
從以上實驗結(jié)果可知,本文提出的PSO-SVRLSTM組合模型預測模型均方誤差(MSE)和平均絕對誤差(MAE)最小,決定系數(shù)(R2)最大。相對于其他水位模型,PSO-SVR-LSTM組合模型有著較強的泛化能力和預測精度。因此本文提出的PSO-SVR-LSTM模型可以有效運用于河流的水位預測當中。
圖9 PSO-LSTM-BP、PSO-LSTM、PSO-SVR-LSTM 預測值
本文首先將河流日均水位、日降水量、日均水流量數(shù)據(jù)通過均值平滑法填補缺失值。為了減少數(shù)據(jù)的波動,通過最大最小值歸一化方法對數(shù)據(jù)進行處理。然后把處理后水位數(shù)據(jù)放入SVR非線性單元中,把日均水位、日降水量、日均水流量數(shù)據(jù)放入LSTM單元中。通過粒子群(PSO)分別優(yōu)化SVR和LSTM,再通過迭代找出最優(yōu)權(quán)值a。實驗結(jié)果表明本文提出的PSO-SVRLSTM預測模型的誤差最小,與真實數(shù)據(jù)更加吻合,預測模型的性能比 PSO-LSTM、PSO-SVR、PSO-BP和PSO-BP-LSTM等預測模型更加準確、取得更好的預測效果,為水位預報決策和防洪抗旱提供更有力的參考依據(jù)。