楊坪宏, 胡 奧, 崔東文, 楊 杰
(1.云南省水文水資源局, 云南 昆明 650106; 2.臨滄潤汀水資源科技服務(wù)有限公司,云南 臨滄 677000; 3.云南省文山州水務(wù)局, 云南 文山 663000; 4.北京全路通信信號研究設(shè)計院集團有限公司昆明分公司, 云南 昆明 650041)
提高水質(zhì)時間序列預(yù)測精度對于水環(huán)境治理和水生態(tài)保護具有重要意義[1]。當(dāng)前,除MIKE 21等水質(zhì)模擬模型外,有關(guān)水質(zhì)預(yù)測的方法可分為3類。第1類是以逐步回歸為代表的傳統(tǒng)預(yù)測方法;第2類是以機器學(xué)習(xí)為代表的預(yù)測方法,如BP(back propagation)神經(jīng)網(wǎng)絡(luò)[2-3]、支持向量回歸機[4]、長短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory networks,LSTM)[5-6]、非線性自回歸神經(jīng)網(wǎng)絡(luò)[7]等,此類方法提高了對非線性問題的處理能力,但權(quán)值閾值或關(guān)鍵參數(shù)的合理選取制約了其預(yù)測精度的提升,目前普遍采用群體智能算法進(jìn)行尋優(yōu),并獲得較好的預(yù)測效果。第3類是組合預(yù)測法,組合預(yù)測法分兩種方式,一種是基于兩個或兩個以上預(yù)測器的組合預(yù)測,如TimeGAN-CNN(convolutional neural networks)-LSTM模型[8]、GRNN(general regression neural network)-Markov模型[9]、STG(spatial-temporal graph)-LSTM模型[10]等,組合預(yù)測方法的特點是利用各模型的優(yōu)勢來克服單一預(yù)測模型的不足,但預(yù)測結(jié)果往往存在較大的不確定性;另一種是基于信號分解技術(shù)的預(yù)測方法,該方法利用分解技術(shù)將時序數(shù)據(jù)分解為若干更具規(guī)律的子序列分量,通過對子序列分量進(jìn)行預(yù)測、重構(gòu)后得到最終預(yù)測結(jié)果。由于基于信號分解技術(shù)的預(yù)測方法具有較好的預(yù)測精度,該方法已在水質(zhì)時間序列預(yù)測研究中得到廣泛應(yīng)用,如孫銘等[11]提出的小波分解-長短期記憶網(wǎng)絡(luò)(W-LSTM)時間序列預(yù)測模型;金昌盛等[12]提出的奇異譜分析-遺傳算法-BP神經(jīng)網(wǎng)絡(luò)(SSA-GA-BP)預(yù)測模型;顧乾暉等[13]提出的變分模態(tài)分解-粒子群優(yōu)化算法-長短期記憶神經(jīng)網(wǎng)絡(luò)(VMD-PSO-LSTM)預(yù)測模型;李建文等[14]提出的集合經(jīng)驗?zāi)B(tài)分解-支持向量回歸機(EEMD-SVR)預(yù)測模型;白雯睿等[15]提出的變分模態(tài)分解-卷積神經(jīng)網(wǎng)絡(luò)-長短期記憶神經(jīng)網(wǎng)絡(luò)(VMD-CNN-LSTM)組合水質(zhì)預(yù)測模型。
近年來,隨著大數(shù)據(jù)和人工智能的發(fā)展,LSTM、門控循環(huán)單元(gated recurrent unit,GRU)已被應(yīng)用于水質(zhì)預(yù)測[15-16]的研究中。LSTM是循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)的變種,其克服了RNN面臨的梯度消失和梯度爆炸問題 ,在問題分類[17]、預(yù)測研究[18-21]等領(lǐng)域應(yīng)用廣泛。GRU是LSTM的變種,與LSTM相比,GRU擁有更低的復(fù)雜度以及更好的預(yù)測性能,被應(yīng)用于各類預(yù)測研究[22-24]之中。在實際應(yīng)用中,GRU/LSTM超參數(shù)(包括層數(shù)、學(xué)習(xí)率、隱含層節(jié)點數(shù)、dropout、LearnRateDropPeriod等)對GRU/LSTM預(yù)測性能具有較大影響,需要通過人工不斷調(diào)整試錯得到GRU/LSTM超參數(shù),不僅要求操作人員具有豐富的調(diào)參經(jīng)驗,而且極易陷入局部極值,難以滿足GRU/LSTM的預(yù)測需求。目前,海洋捕食者算法[18]、粒子群優(yōu)化算法等[25-28]群體智能算法(swarm intelligence algorithms,SIA)已在尋優(yōu)GRU/LSTM超參數(shù)中得到應(yīng)用,并取得了較好的調(diào)優(yōu)效果。
為提高pH值及CODMn、DO、NH3—N濃度時間序列的預(yù)測精度,改進(jìn)GRU/LSTM的預(yù)測性能,拓展SIA在GRU/LSTM超參數(shù)調(diào)優(yōu)中的應(yīng)用范疇,本文基于小波包變換(wavelet packet transform,WPT)分解技術(shù)和“分解算法+智能算法+預(yù)測模型+疊加重構(gòu)”思想,研究提出采用變色龍優(yōu)化算法(chameleon swarm algorithm,CSA)、獵豹優(yōu)化(cheetah optimization,CO)算法、山瞪羚優(yōu)化(mountain gazelle optimization,MGO)算法分別調(diào)優(yōu)GRU/LSTM超參數(shù)的水質(zhì)時間序列預(yù)測模型,并構(gòu)建WPT-GRU、WPT-LSTM模型及基于SVM預(yù)測器的WPT-CSA-SVM、WPT-CO-SVM、WPT-MGO-SVM模型進(jìn)行對比分析,然后通過云南省昆明市觀音山斷面pH值、DO、CODMn、NH3—N預(yù)測實例對各模型進(jìn)行檢驗。
本文以云南省昆明市觀音山斷面2004—2015年逐周pH值及CODMn、DO、NH3—N濃度時間序列預(yù)測為例對各模型進(jìn)行驗證。原始pH值及CODMn、DO、NH3—N濃度數(shù)據(jù)來源于原環(huán)境保護部數(shù)據(jù)中心的水質(zhì)周報,共624組,對于個別缺失數(shù)據(jù)采用線性法進(jìn)行插補,昆明市觀音山斷面水質(zhì)時間序列3D圖見圖1。從圖1可以看出,該斷面水質(zhì)pH值及CODMn、DO、NH3—N濃度時序數(shù)據(jù)呈現(xiàn)出非線性、多尺度等特征,起伏變化激烈。
圖1 昆明市觀音山斷面水質(zhì)時間序列3D圖
2.2.1 小波包變換(WPT) WPT能同時對信號低頻部分和高頻部分進(jìn)行分解,更適用于水質(zhì)時間序列分解。WPT對pH值及CODMn、DO、NH3—N濃度原始信號進(jìn)行分解的公式為[29-32]:
(1)
重構(gòu)算法為:
(2)
式中各參數(shù)意義見文獻(xiàn)[32]。
2.2.2 變色龍優(yōu)化算法(CSA) CSA是Malik等于2021年提出的一種新型智能優(yōu)化算法,該算法通過對變色龍搜索獵物、鎖定獵物、攻擊獵物3種行為進(jìn)行數(shù)學(xué)建模來求解待優(yōu)化問題[33-34],CSA數(shù)學(xué)描述具體見文獻(xiàn)[34]。
2.2.3 獵豹優(yōu)化(CO)算法 CO算法是Akbari等[35]于2022年受自然界獵豹狩獵啟發(fā)而提出的一種新型智能優(yōu)化算法。該算法通過模擬獵豹在狩獵過程中搜索、坐等和攻擊3種策略來實現(xiàn)位置更新,即待優(yōu)化問題的求解。CO算法數(shù)學(xué)描述如下:
(1)初始化。與其他群體智能優(yōu)化算法類似,CO算法也是從種群初始化開始。設(shè)在d維搜索空間中,獵豹初始化位置描述為:
Xi,j=LBj+rand·(UBj-LBj)
(3)
(i=1,2,…,n;j=1,2,…,d)
式中:Xi,j為第i頭獵豹第j維位置;UBj、LBj為第j維搜索空間上、下限值;rand為介于0和1之間的隨機數(shù);n為獵豹種群規(guī)模;d為問題維度。
(2)搜索策略。獵豹在其領(lǐng)地(搜索空間)或周圍區(qū)域進(jìn)行全范圍掃描或主動搜索,以找到獵物。該策略數(shù)學(xué)描述為:
(4)
(3)坐等策略。在搜索模式下,獵物可能會暴露在獵豹視野中,在這種情況下,獵豹的每一個動作都可能會導(dǎo)致獵物逃跑。為避免該情況發(fā)生,獵豹采取坐等伏擊策略(躺在地上或躲進(jìn)灌木叢)以接近獵物。該策略數(shù)學(xué)描述為:
(5)
該策略不但可提高狩獵成功率(獲得最優(yōu)解),而且還避免了CO過早收斂。
(4)攻擊策略。在CO算法中,種群中每頭獵豹都可以根據(jù)逃跑獵物、領(lǐng)頭獵豹或附近獵豹的位置來調(diào)整自己的位置,以獲得最佳攻擊位置。該策略數(shù)學(xué)描述為:
(6)
2.2.4 山瞪羚優(yōu)化(MGO)算法 MGO是Abodollahzadeh等[36]于2022年受自然界中瞪羚生存能力啟發(fā)而提出的一種新型群體智能優(yōu)化算法。該算法通過對瞪羚覓食(開發(fā)階段,在沒有捕食者或在捕食者跟蹤情形下)、逃離(探索階段,發(fā)現(xiàn)捕食者)行為進(jìn)行數(shù)學(xué)建模求解待優(yōu)化問題。MGO算法數(shù)學(xué)描述如下:
(1)初始化。與其他群體智能優(yōu)化算法類似,MGO也是從種群初始化開始。設(shè)在d維搜索空間中,瞪羚種群為N的個體初始化位置描述為:
xi,j=LBj+rand·(UBj-LBj)
(7)
(i=1,2,…,N;j=1,2,…,d)
式中:xi, j為第i只瞪羚第j維位置;UBj、LBj為第j維搜索空間上、下限值;rand為介于0和1之間的隨機數(shù);N為瞪羚種群規(guī)模;d為問題維度。
(2)覓食(開發(fā))階段。MGO中,假設(shè)在沒有捕食者或在捕食者跟蹤情形下,瞪羚悠閑地覓食,并在覓食時以布朗運動進(jìn)行移動,瞪羚位置更新數(shù)學(xué)描述為:
(8)
(3)逃離(探索)階段。MGO中,瞪羚一旦發(fā)現(xiàn)捕食者就迅速奔跑,并通過快速奔跑和突然改變方向來逃離捕食者。假設(shè)瞪羚起步階段采用布朗運動,奔跑階段改用Lévy飛行。瞪羚發(fā)現(xiàn)捕食者時,其位置更新描述為:
(9)
捕食者追逐瞪羚時,其位置更新描述為:
(10)
式中:CF為捕食者移動的控制參數(shù),描述為CF=(1-l/T)(2l/T);l為當(dāng)前迭代次數(shù);T為最大迭代次數(shù);其他參數(shù)意義同上。
(4)捕食成功率。研究表明,雖然瞪羚不是瀕危物種,但其年存活率為66%,這意味著捕食者捕食成功率僅為34%。MGO通過捕食者成功率PSR來避免算法陷入局部最小值,數(shù)學(xué)描述如下:
(11)
2.2.5 長短期記憶神經(jīng)網(wǎng)絡(luò) LSTM在隱藏層單元中設(shè)計了遺忘門、輸入門和輸出門,利用輸出門來控制單元狀態(tài)ct的當(dāng)前輸出值ht,LSTM結(jié)構(gòu)如圖2所示。
圖2 LSTM結(jié)構(gòu)示意圖
設(shè)輸入序列為(x1,x2,…,xT),隱含層狀態(tài)為(h1,h2,…,hT),則在t時刻有[18-22]:
it=σ(Whiht-1+Wxixt+bi)
(12)
ft=σ(Whfht-1+Whfxt+bf)
(13)
ct=ft·ct-1+it·g(Whcht-1+Wxcxt+bc)
(14)
ot=σ(Whoht-1+Woxxt+Wcoct+bo)
(15)
ht=o·g(ct)
(16)
為使LSTM滿足預(yù)測目的,需加上一個線性回歸層,即:
yt=Wyoht+by
(17)
上式中各參數(shù)意義見文獻(xiàn)[18]、[19]。
2.2.6 門控循環(huán)單元 GRU結(jié)構(gòu)與LSTM類似,是將LSTM的更新門和遺忘門整合為新的更新門,相比于LSTM,其結(jié)構(gòu)更加簡單、訓(xùn)練參數(shù)更少,因此收斂速度也就更快[22-25],GRU結(jié)構(gòu)如圖3所示。
圖3 GRU結(jié)構(gòu)示意圖
GRU的迭代公式如下:
zt=σ(Wz·[ht-1,xt])
(18)
rt=σ(Wr·[ht-1,xt])
(19)
(20)
(21)
式中:z為更新門;r為重置門;W為權(quán)重矩陣;σ為sigmoid函數(shù);h為輸出值; *為哈達(dá)瑪積(Hadamard product); 下標(biāo)t表示t時刻。
WPT-CSA-GRU、WPT-CO-GRU、WPT-MGO-GRU、WPT-CSA-LSTM、WPT-CO-LSTM、WPT-MGO-LSTM模型的預(yù)測步驟歸納如下:
步驟1:利用WPT將pH值及CODMn、DO、NH3—N濃度時序數(shù)據(jù)進(jìn)行2層分解,分別得到1個趨勢項分量[2,4]和3個周期項分量[2,1]~[2,3],其中趨勢項分量可有效反映原始水質(zhì)數(shù)據(jù)的趨勢性,周期項分量可反映原始水質(zhì)數(shù)據(jù)的微小震蕩變化,如圖4所示。
圖4 pH值及CODMn、DO、NH3—N濃度時間系列數(shù)據(jù)的WPT分解
本文選取pH值及CODMn、DO、NH3—N濃度時序數(shù)據(jù)的70%作為訓(xùn)練樣本,剩余30%作為預(yù)測樣本。
步驟2:基于SPSS軟件,利用偏自相關(guān)函數(shù)(partial autocorrelation function, PACF)確定各分解分量的輸入步長k。經(jīng)計算,pH值及CODMn、DO、NH3—N濃度趨勢項分量[2,4]的k值均為1;周期項分量[2,1]~[2,3]的k值均為2,即利用前k周的水質(zhì)數(shù)據(jù)預(yù)測當(dāng)前水質(zhì)。各模型的輸入、輸出可表述為:
(22)
(23)
式中:l為樣本數(shù)量;k為輸入步長。
步驟3:GRU/LSTM預(yù)測性能的優(yōu)劣取決于其超參數(shù)的選擇。本文利用2層GRU/LSTM網(wǎng)絡(luò)進(jìn)行預(yù)測,并利用各分量訓(xùn)練樣本構(gòu)建變色龍優(yōu)化算法(CSA)、獵豹優(yōu)化(CO)算法、山瞪羚優(yōu)化(MGO)算法調(diào)優(yōu)GRU/LSTM超參數(shù)的適應(yīng)度函數(shù)f:
(24)
式中:m1、m2分別為第1、第2隱藏層神經(jīng)元數(shù);dr1、dr2分別為dropout_1、dropout_2參數(shù);c為學(xué)習(xí)率;L1為Learn Rate Drop Period參數(shù);L2為Learn Rate Drop Factor參數(shù);下標(biāo)min、max分別為各調(diào)優(yōu)參數(shù)搜索空間上、下限值;其他參數(shù)意義同上。
步驟4:設(shè)置變色龍優(yōu)化算法(CSA)、獵豹優(yōu)化(CO)算法、山瞪羚優(yōu)化(MGO)算法種群規(guī)模為30,最大迭代次數(shù)為100,其他采用算法默認(rèn)值初始化變色龍、獵豹、山瞪羚空間位置。
設(shè)置GRU/LSTM超參數(shù)[m1,m2,dr1,dr2,c,L1,L2]搜索空間下限為[8,8,0.001,0.001,0.001,0.0001,0.1],上限為[128,128,0.5,0.5,0.5,1,1],激活函數(shù)選用tanh函數(shù);SVM懲罰因子、核函數(shù)參數(shù)、損失系數(shù)搜索空間下限設(shè)置為[0.01,0.01,0.001],上限設(shè)置為[100,100,0.1],交叉驗證折數(shù)設(shè)置為3,原始數(shù)據(jù)采用[-1,1]進(jìn)行歸一化處理。本文WPT-LSTM、WPT-GRU模型中的超參數(shù)采用試錯法確定。
步驟5:基于公式(24)計算變色龍優(yōu)化算法(CSA)、獵豹優(yōu)化(CO)算法、山瞪羚優(yōu)化(MGO)算法計算個體的適應(yīng)度值,找到并保存最佳個體位置。令t=1。
步驟6:分別利用上述變色龍優(yōu)化算法(CSA)、獵豹優(yōu)化(CO)算法、山瞪羚優(yōu)化(MGO)算法位置更新算子更新個體新位置。
步驟7:利用個體位置更新后的變色龍優(yōu)化算法(CSA)、獵豹優(yōu)化(CO)算法、山瞪羚優(yōu)化(MGO)算法計算個體適應(yīng)度值,再比較并保存當(dāng)前最佳個體位置。
步驟8:令t=t+1,若t=T,則結(jié)束算法;否則返回步驟6。
步驟9:輸出最佳個體位置,該位置即為最佳GRU/LSTM超參數(shù)向量。利用該向量建立WPT-CSA-GRU等6種模型對各分量進(jìn)行預(yù)測和重構(gòu)。
步驟10:利用平均絕對百分比誤差MAPE、平均絕對誤差MAE、均方根誤差RMSE和決定系數(shù)DC對模型進(jìn)行評價。其中,MAPE、MAE用于反映模型預(yù)測誤差大小,RMSE用于衡量觀測值與真值之間的偏差,MAPE、MAE、RMSE越小則說明模型性能越優(yōu)、預(yù)測精度越高;DC反映變量之間相關(guān)關(guān)系的密切程度,其值越大則說明模型性能越好。
構(gòu)建WPT-CSA-GRU等11種模型對實例斷面(云南省昆明市觀音山斷面)pH值等4個水質(zhì)指標(biāo)進(jìn)行訓(xùn)練及預(yù)測,預(yù)測結(jié)果評價及對比見表1,預(yù)測相對誤差見圖5。
注:預(yù)測模型序列1~11分別為WPT-CSA-GRU、WPT-CO-GRU、WPT-MGO-GRU、WPT-CSA-LSTM、WPT-CO-LSTM、WPT-MGO-LSTM、WPT-GRU、WPT-LSTM、WPT-CSA-SVM、WPT-CO-SVM、WPT-MGO-SVM模型圖5 各預(yù)測模型對實例斷面4個水質(zhì)指標(biāo)預(yù)測結(jié)果的相對誤差
依據(jù)表1及圖5可以得出以下結(jié)論:
(1)WPT-CSA-GRU等6種模型對實例pH值預(yù)測的MAPE為0.230%~0.459%、MAE為0.019~0.037 mg/L、RMSE為0.023~0.046 mg/L,決定系數(shù)DC>0.993;對CODMn濃度預(yù)測的MAPE為0.991%~1.823%、MAE為0.096~0.182 mg/L、RMSE為0.129~0.228 mg/L,決定系數(shù)DC>0.991;對DO濃度預(yù)測的MAPE為1.200%~2.685%、MAE為0.073~0.154 mg/L、RMSE為0.094~0.201 mg/L,決定系數(shù)DC>0.984;對NH3—N濃度預(yù)測的MAPE為5.391%~11.383%、MAE為0.014~0.030 mg/L、RMSE為0.019~0.042 mg/L,決定系數(shù)DC>0.992,預(yù)測精度優(yōu)于WPT-GRU、WPT-LSTM,遠(yuǎn)優(yōu)于WPT-CSA-SVM、WPT-CO-SVM、WPT-MGO-SVM模型。以MAPE評價指標(biāo)為例,WPT-CSA-GRU等6種模型對pH值及CODMn、DO、NH3—N濃度的預(yù)測精度較WPT-GRU、WPT-LSTM模型分別提高了45.1%、32.7%、15.9%、41.3%以上,較WPT-CSA-SVM、WPT-CO-SVM、WPT-MGO-SVM模型分別提高了68.2%、70.0%、67.7%、69.7%以上。可見,本文提出的WPT-CSA-GRU等6種模型具有較好的預(yù)測效果,應(yīng)用于水質(zhì)預(yù)測是可行的。其中,WPT-CSA-GRU、WPT-CO-GRU、WPT-MGO-GRU模型的預(yù)測效果優(yōu)于WPT-CSA-LSTM、WPT-CO-LSTM、WPT-MGO-LSTM模型,具有更高的預(yù)測精度和更好的泛化能力。
(2)WPT-CSA-GRU、WPT-CO-GRU、WPT-MGO-GRU模型對pH值及CODMn、DO、NH3—N濃度預(yù)測的MAPE較WPT-GRU模型分別提高了62.9%、59.6%、40.8%、63.7%以上;WPT-CSA-LSTM、WPT-CSA-LSTM、WPT-CSA-LSTM模型預(yù)測的MAPE較WPT-LSTM模型分別提高了34.4%、36.7%、20.7%、43.6%以上,表明CSA、CO、MGO能有效優(yōu)化GRU/LSTM超參數(shù),不但提高了GRU/LSTM預(yù)測性能,而且還克服了人工調(diào)節(jié)超參數(shù)帶來的高不確定性和效果不佳的缺點,其中CSA優(yōu)化效果最佳。
(3)從模型預(yù)測效果對比來看,WPT-CSA-GRU、WPT-CO-GRU、WPT-MGO-GRU模型的預(yù)測效果最佳,WPT-CSA-LSTM、WPT-CO-LSTM、WPT-MGO-LSTM模型預(yù)測效果次之,WPT-GRU、WPT-LSTM模型預(yù)測效果一般,WPT-CSA-SVM、WPT-CO-SVM、WPT-MGO-SVM模型預(yù)測效果最差;從4個水質(zhì)指標(biāo)的時序數(shù)據(jù)變化及預(yù)測效果對比來看,pH值時序數(shù)據(jù)起伏變化不大,預(yù)測效果最好;CODMn、DO時序數(shù)據(jù)起伏變化較大,預(yù)測效果較好;NH3—N時序數(shù)據(jù)起伏變化最大,預(yù)測效果相對較差。
深度學(xué)習(xí)是由多個非線性映射隱含層組成的一種神經(jīng)網(wǎng)絡(luò),能較好地挖掘數(shù)據(jù)之間的非線性。近年來,隨著深度學(xué)習(xí)的快速發(fā)展,以LSTM、GRU為代表的深度學(xué)習(xí)已經(jīng)成為當(dāng)前研究的熱點,并被廣泛應(yīng)用于水質(zhì)預(yù)測[37-39]領(lǐng)域。LSTM是RNN的變種,克服了RNN面臨的梯度消失和梯度爆炸問題,能夠解決其他深度學(xué)習(xí)算法無法處理的時間長期依賴問題;GRU是LSTM的變種,是為解決長期記憶和反向傳播中的梯度等問題而提出來的,與LSTM相比,GRU擁有更低的復(fù)雜度以及更好的預(yù)測性能。在實際應(yīng)用中,LSTM、GRU預(yù)測精度和收斂性在很大程度上依賴于超參數(shù)(如層數(shù)、學(xué)習(xí)率、隱含層節(jié)點數(shù)等),而超參數(shù)的設(shè)置普遍采用手工試錯的方法,難以滿足GRU/LSTM預(yù)測需求。CSA、CO、MGO具有良好的全局搜索能力,應(yīng)用CSA、CO、MGO調(diào)優(yōu)GRU/LSTM超參數(shù)得到全局最優(yōu)解,不但克服了LSTM、GRU易陷入局部最優(yōu)從而影響預(yù)測精度的缺點,而且還使模型獲得了較好的智能化水平。此外,水質(zhì)時間序列具有較強的非線性和多尺度等特征,采用WPT進(jìn)行分解處理,將水質(zhì)時間序列分解為多個更具規(guī)律的模態(tài)分量,不但可降低模型預(yù)測器的預(yù)測難度,而且還大大減少了模型的預(yù)測誤差。
GRU與LSTM相比,其在結(jié)構(gòu)上更具優(yōu)勢,從WPT-CSA-GRU、WPT-CO-GRU、WPT-MGO-GRU模型與WPT-CSA-LSTM、WPT-CO-LSTM、WPT-MGO-LSTM模型的pH值及CODMn、DO、NH3—N濃度預(yù)測結(jié)果對比來看,WPT-CSA-GRU、WPT-CO-GRU、WPT-MGO-GRU模型利用重置門控制當(dāng)前信息和記憶信息的數(shù)據(jù)量,并生將成新的記憶信息繼續(xù)向前傳遞,具有更好的適應(yīng)性與預(yù)測能力。
當(dāng)然,本文提出的WPT-CSA-GRU等6種預(yù)測模型存在訓(xùn)練時間長、系統(tǒng)資源消耗大等缺點和不足。同時本文僅利用了云南省昆明市觀音山斷面pH值及DO、CODMn、NH3—N濃度的歷史數(shù)據(jù)作為輸入,未考慮滇池補水、水溫以及降水等因素的影響,因此,該模型及預(yù)測精度仍有進(jìn)一步提升的空間。
為提高水質(zhì)時間序列的預(yù)測精度,本文提出了WPT-CSA-GRU、WPT-CO-GRU、WPT-MGO-GRU、WPT-CSA-LSTM、WPT-CO-LSTM、WPT-MGO-LSTM預(yù)測模型,并構(gòu)建了若干個對比模型,結(jié)合云南省昆明市觀音山斷面2004—2015年逐周pH值及CODMn、DO、NH3—N濃度預(yù)測算例,得到如下結(jié)論:
(1)本文提出的WPT-CSA-GRU等6種模型預(yù)測誤差小于其他對比模型,具有較高的預(yù)測精度和較好的泛化能力,將其用于水質(zhì)時間序列預(yù)測是可行的。其中WPT-CSA-GRU、WPT-CO-GRU、WPT-MGO-GRU模型對pH值及CODMn、DO、NH3—N濃度預(yù)測的MAPE分別在0.230%~0.310%、0.991%~1.093%、1.200%~1.891%、5.391%~7.030%之間,DC均在0.99以上,具有更好的預(yù)測效果。
(2)針對隨機性、波動性較強的水質(zhì)時間序列,利用WPT對其進(jìn)行平穩(wěn)化處理,可得到更具規(guī)律的趨勢項分量和周期項分量,大大減少了混合模型的預(yù)測誤差。
(3)針對GRU/LSTM因超參數(shù)選擇不當(dāng)而導(dǎo)致預(yù)測性能低下的問題,利用CSA、CO、MGO調(diào)優(yōu)GRU/LSTM超參數(shù),不但提高了GRU/LSTM的預(yù)測性能,而且克服了人工調(diào)節(jié)超參數(shù)帶來的高不確定性和效果不佳的缺點。
(4)本文提出的模型及方法可為相關(guān)時間序列數(shù)據(jù)處理、GRU/LSTM超參數(shù)調(diào)優(yōu)以及時間序列預(yù)測研究提供參考。