袁梅雪, 魏守科,2, 孫 銘, 趙金東
1(煙臺大學(xué) 計(jì)算機(jī)與控制工程學(xué)院, 煙臺 264005)
2(北京迪普迅智能信息技術(shù)有限公司, 北京100089)
水是生命體最重要的組成部分, 是生命繁衍的基本條件. 隨著經(jīng)濟(jì)的迅速發(fā)展, 工業(yè)和生活排放廢水量增加, 大量未處理污水排入河流或地下水中, 不僅導(dǎo)致水體使用功能大幅下降, 還加劇了水資源匱乏問題[1].據(jù)相關(guān)文獻(xiàn)[2,3]的研究, 世界上只有很少的部分河流未受污染的影響. 水污染也是造成一些發(fā)展中國家疾病和死亡的重要原因之一[4]. 聯(lián)合國發(fā)表的資料表明, 全球有11 億人缺乏安全飲用水, 每年有500 多萬人死于與水有關(guān)的疾病[5]. 水質(zhì)的惡化, 已經(jīng)構(gòu)成制約和引發(fā)一個地區(qū)或城市經(jīng)濟(jì)發(fā)展甚至社會不安定的重要因素[6].因此, 建立水質(zhì)模型預(yù)測水質(zhì)變化是保障飲用水安全和人類健康的關(guān)鍵.
水質(zhì)數(shù)據(jù)通常是按時間順序排列的時間序列數(shù)據(jù).循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是一種適合于時間序列數(shù)據(jù)預(yù)測的方法[7,8]. 如Kumar 等人[7]對河流月流量數(shù)據(jù)進(jìn)行了預(yù)測研究, 并將RNN 與前饋神經(jīng)網(wǎng)絡(luò)進(jìn)行了比較, 預(yù)測效果較好. Jia 等人[8]使用RNN 對湖泊溫度和水質(zhì)數(shù)據(jù)進(jìn)行建模, 并通過與ANN 模型的對比, 證明RNN 在時間序列數(shù)據(jù)預(yù)測中具有更高的準(zhǔn)確性. 然而,RNN 模型存在梯度消失、梯度爆炸和對長距離序列數(shù)據(jù)的信息依賴性較差等問題. 為了解決這些問題,Hochreiter[9]提出了LSTM 模型, 并證明了LSTM 在預(yù)測時間序列數(shù)據(jù)方面具有獨(dú)特的優(yōu)勢, 與RNN 相比有效地提高了預(yù)測精度. Hu 等人[10]對ANN 和LSTM 模型對降雨徑流量的預(yù)測進(jìn)行了比較, 結(jié)果表明LSTM模型具有更好的仿真性和更高的智能性. Hu 等人[11]和Liu 等人[12]使用LSTM 分別對海水養(yǎng)殖區(qū)的海水質(zhì)量和長江的飲用水質(zhì)量進(jìn)行了研究, 證明LSTM 能更準(zhǔn)確地反映水質(zhì)變化的發(fā)展趨勢. 然而, 對于波動范圍大的數(shù)據(jù), 單一的LSTM 模型難以確保預(yù)測的準(zhǔn)確性[13].
為了提高模型的泛化能力和預(yù)測精度, Vinyals 等人[14]提出了用于時間序列預(yù)測的序列對序列(Seq2Seq)模型. Seq2Seq 是一種具有編解碼結(jié)構(gòu)的網(wǎng)絡(luò)模型, 不限制輸入序列和輸出序列的長度, 使模型更加靈活. 同時, 引入注意機(jī)制, 減少了早期序列信息的壓縮, 進(jìn)一步提高了遠(yuǎn)程信息依賴能力. Xiang 等人[15]運(yùn)用Seq2Seq模型估算每小時降雨徑流量, 結(jié)果表明其預(yù)測精度優(yōu)于試驗(yàn)中所有其他對比模型. Kao 等人[16]以臺灣石門水庫流入量為預(yù)測對象, 證明了Seq2Seq 模型的可靠性. 然而, 目前Seq2Seq 模型在水質(zhì)數(shù)據(jù)預(yù)測中的研究還處于起步階段.
此外, 其他研究將LSTM 和小波分解相結(jié)合, 以提高單一LSTM 模型的精度. 孫銘等人[17]建立了水質(zhì)小波分解和LSTM 時間序列預(yù)測模型(W-LSTM), 與傳統(tǒng)的LSTM 模型相比, 此模型具有更高的預(yù)測精度和泛化能力. Barzegar 等人[18]提出了一種用于多尺度湖泊水位預(yù)測的混合CNN-LSTM 深度學(xué)習(xí)和邊界校正最大重疊離散小波變換(DWT)模型, 成功地提高了湖泊水位預(yù)測的精度. Du 等人[19]提出了一種DWT、主成分分析(PCA)預(yù)處理技術(shù)和LSTM 結(jié)合的混合模型, 用于需水量預(yù)測, 與其他參照預(yù)測模型的結(jié)果比較,證明了其所提出混合模型的優(yōu)越性. Xie 等人[20]提出了一種結(jié)合LSTM 和DWT 的深度學(xué)習(xí)方法(WA-LSTM)來預(yù)測長江6 個代表性河段的日水位, 結(jié)果表明該方法在應(yīng)用中穩(wěn)定可靠.
基于以上研究, 本文提出了一種更為先進(jìn)的小波(Wavelet) Seq2Seq 模型(W-Seq2Seq), 通過小波分解去噪和LSTM 雙層雙向Seq2Seq 模型(BiSeq2Seq)相結(jié)合來的方法來預(yù)測水質(zhì)變化. 通過與其他5 種不同結(jié)構(gòu)的模型的對比實(shí)驗(yàn), 驗(yàn)證了所提出方法的有效性.
傅里葉變換是信號處理中廣泛使用的分析工具,它將時域信號轉(zhuǎn)換為頻域信號; 但傅里葉變換在時域上缺乏辨別能力[21]. 小波變換的發(fā)展解決傅里葉變換時域信息丟失的現(xiàn)象, 小波利用一系列帶通濾波器用于將原始時域信號分解為二維時頻信息, 這大大提高了局部信號的性能, 并提高了模型的抗噪聲性能[22,23].
小波變換是一種數(shù)據(jù)分解和重構(gòu)的方法, 使用低通濾波器和高通濾波器將原始數(shù)據(jù)分解為低頻小波系數(shù)cAn和高頻小波系數(shù)cD1, …,cDn[24].
小波變換包括連續(xù)小波變換(CWT)和離散小波變換(DWT)兩種. 其中, CWT 基小波ψ(t)變換公式為:
其中,a為尺度因子(a>0),b為位移因子(b∈R). 小波變換尺度通過調(diào)整a和b的值, 把實(shí)現(xiàn)時間序列信號分解高頻時間和低頻時間系數(shù).
CWT 公式如下所示:
分別重構(gòu)低頻和高頻小波系數(shù), 得到低頻信號rAn和高頻信號rD1, …,rDn; 其中低頻信號表示近似信息, 高頻信號表示詳細(xì)信息.
最后, 低頻信號和高頻信號相加, 實(shí)現(xiàn)原始信號的重構(gòu), 其重構(gòu)公式如下.
小波分解的兩個重要任務(wù)是選擇最優(yōu)小波和確定分解層數(shù). 常用的小波有Haar、Daubechies、Sym、Bior、Coif、Morlet、Mexican Hat 和Meyer. 本文選取Daubechies5 (db5)作為基小波, 其原因db5 是dbN 小波族中常用的小波之一, 比較適合相對平滑數(shù)據(jù)集的分解[17].
根據(jù)文獻(xiàn)[25], 小波變換的最大分解層數(shù)用式(7)計(jì)算得出.
其中,levelmax表示最大分解層數(shù),floor表示向下取整函數(shù),L用來表示數(shù)據(jù)長度,wl表示小波分解低通濾波器的長度.
Seq2Seq 模型由編碼器和解碼器兩部分組成, 每部分相當(dāng)于一個獨(dú)立的LSTM 模型. 不同之處在于編碼器將時間序列數(shù)據(jù)作為輸入(每個LSTM 對應(yīng)于一個時間步長), 生成指定長度的向量C作為輸出. 向量C由編碼器中最后一個LSTM 的隱藏層狀態(tài)和單元狀態(tài)組成. 在解碼器中, 向量C解碼為隱藏層狀態(tài)和單元狀態(tài)作為輸入時, 每個LSTM 單元將產(chǎn)生預(yù)測結(jié)果作為輸出. 實(shí)驗(yàn)對兩層雙向Seq2Seq 模型(Bi2)結(jié)果與一層單向Seq2Seq 模型(Uni1)、一層雙向模型(Bi1)和兩層單向模型(Uni2)的結(jié)果進(jìn)行了對比.
Uni1 是最基礎(chǔ)的Seq2Seq 模型, 其中編碼器中只有一個正向?qū)? 對于Bi1, 與Uni1 的區(qū)別在于其編碼器包含兩個獨(dú)立的循環(huán)結(jié)構(gòu)(LSTM), 一個正向, 一個反向.與Uni1 的編碼器類似, Bi1 的前向結(jié)構(gòu)用于計(jì)算隱藏層信息和單元狀態(tài), 而反向結(jié)構(gòu)用來反向讀取序列數(shù)據(jù)(從n到1), 并計(jì)算反向結(jié)構(gòu)生成的一組隱藏層和單元狀態(tài). 正向結(jié)構(gòu)產(chǎn)生的隱層和單元狀態(tài)與反向結(jié)構(gòu)不同, 最后通過連接兩種結(jié)構(gòu)的相應(yīng)部分得到向量C. 反向結(jié)構(gòu)允許網(wǎng)絡(luò)先學(xué)習(xí)后續(xù)數(shù)據(jù), 并根據(jù)反向數(shù)據(jù)調(diào)整其參數(shù),這可能有助于網(wǎng)絡(luò)獲得前向LSTM 不具備的依賴性.
在Uni2 中, 兩個層堆疊在一起, 其中編碼器和解碼器的第一層LSTM 的輸出被傳遞到第2 層作為其輸入.理論上, 具有更多隱藏層的深層Seq2Seq 體系結(jié)構(gòu)可以有效地學(xué)習(xí)復(fù)雜模式, 并逐步建立輸入序列數(shù)據(jù)的更高級別表示. Bi2 的編碼器和解碼器與Uni2 類似的方式堆疊, 而區(qū)別在于第1 層的正向和反向結(jié)構(gòu)的輸出分別傳遞給第2 層的正向和反向結(jié)構(gòu)(圖1). 在理論上, 由于具有更多的隱藏層和前后向?qū)? Bi2 比其他3 種Seq2Seq模型結(jié)構(gòu)具有更強(qiáng)大的能力, 學(xué)習(xí)較復(fù)雜的模式.
圖1 兩層雙向Seq2Seq 模型(Bi2)
1.3.1 均值平滑
運(yùn)用均值平滑方法, 通過取缺失數(shù)據(jù)或異常值左右相鄰值的平均值來替換數(shù)據(jù)集中的缺失值和異常值,如式(8)所示.
其中,xt是數(shù)據(jù)t時刻缺失或異常值的替代值,xt–1是時間t–1 上的數(shù)據(jù)值,xt+1是時間t+1 上的數(shù)據(jù)值.
1.3.2 標(biāo)準(zhǔn)化
為加快模型訓(xùn)練收斂速度, 提高預(yù)測精度, 通常將數(shù)據(jù)集歸一化為[?1, 1]或[0, 1]之間的值. 本文使用了最大-最小歸一化方法, 其計(jì)算方法為式(9).
其中,xnorm表示歸一化后的數(shù)據(jù);x為原始數(shù)據(jù);xmax和xmin分別代表原始數(shù)據(jù)的最大值和最小值;maxnew和minnew表示范圍的上限和下限, 分別等于1 和0.
小波分解去燥和Seq2Seq 結(jié)合的混合預(yù)測建模方法(W-Seq2Seq) (圖2), 使用小波將數(shù)據(jù)集分解為高頻信號和低頻信號; 其中僅保留低頻信號作為原始數(shù)據(jù)的近似值進(jìn)行建模, 而高頻信號細(xì)節(jié)作為噪聲去除. 所提出的W-Seq2Seq 建模方法不僅繼承了Seq2Seq 模型強(qiáng)大的預(yù)測精度, 而且通過有效降低數(shù)據(jù)噪聲, 為高頻復(fù)雜數(shù)據(jù)集提供了一個更優(yōu)化、更通用的操作系統(tǒng).
圖2 W-Seq2Seq 模型原理流程圖
本文的研究數(shù)據(jù)來自山東省煙臺市福山區(qū)門樓鎮(zhèn)以西2000 m 處青巖河下游的門樓水庫, 該水庫面積約為14.65 平方公里, 是煙臺市區(qū)主要水源地, 煙臺市區(qū)70%以上工業(yè)生產(chǎn)和居民生活用水都來自這里[26]. 水庫總庫容2 億立方米, 是一座防洪、灌溉、發(fā)電、飼魚、參觀、游覽的綜合性水庫. 然而, 隨著當(dāng)?shù)亟?jīng)濟(jì)的發(fā)展, 水庫水質(zhì)也在逐年惡化, 富營養(yǎng)化已成為水庫所面臨的主要生態(tài)問題. 因此, 控制水庫污染, 防止水質(zhì)進(jìn)一步惡化已迫在眉睫.
選擇pH、氨氮(NH3-N)、電導(dǎo)率和濁度4 項(xiàng)水質(zhì)指標(biāo), 用無線傳感器每3 s 自動采集數(shù)據(jù)一次. 采樣時間為2020 年3 月6 日至2020 年4 月24 日, 每項(xiàng)指標(biāo)共采集數(shù)據(jù)1440000. 最后, 采取每1200 個數(shù)據(jù)的平均值, 把數(shù)據(jù)轉(zhuǎn)化為小時數(shù)據(jù)來分析和建模, 每項(xiàng)指標(biāo)的小時數(shù)據(jù)集有1200 個值. 4 項(xiàng)指標(biāo)的可視化圖清楚地顯示了pH 值和電導(dǎo)率數(shù)據(jù)系列中存在異常值(圖3),使用式(8)的平均平滑法替換數(shù)據(jù)集中的異常值. 清洗后的數(shù)據(jù)集作為最后實(shí)際使用數(shù)據(jù), 其中每項(xiàng)指標(biāo)數(shù)據(jù)的前1080 個值(90%)用于模型訓(xùn)練, 最后120 個值(10%)用于模型的測試.
圖3 清洗前的數(shù)據(jù)集曲線圖
數(shù)據(jù)集劃分及其統(tǒng)計(jì)分析如表1 所示, 濁度測試數(shù)據(jù)集的平均值為152.195、最小值為100.42、最大值為232.974、第25 個百分位數(shù)、50 個百分位數(shù)和75 個百分位分別為120.897、145.721 和178.031, 都遠(yuǎn)大于訓(xùn)練數(shù)據(jù)集中相應(yīng)數(shù)據(jù), 這意味著測試數(shù)據(jù)擁有序列的最大值, 且變化幅度較大, 這表明訓(xùn)練數(shù)據(jù)可能難以訓(xùn)練一個模型來準(zhǔn)確預(yù)測測試數(shù)據(jù)值. 然而, 氨氮和電導(dǎo)率的測試數(shù)據(jù)集和訓(xùn)練數(shù)據(jù)集之間沒有太大差異, 表明訓(xùn)練數(shù)據(jù)集足以訓(xùn)練一個模型來準(zhǔn)確預(yù)測測試數(shù)據(jù)值.關(guān)于pH 值, 統(tǒng)計(jì)分析結(jié)果和數(shù)據(jù)可視化結(jié)果顯示數(shù)據(jù)集具有高頻特征, 所以需要更復(fù)雜的模型來準(zhǔn)確預(yù)測其測試數(shù)據(jù).
表1 清理后數(shù)據(jù)的統(tǒng)計(jì)分析結(jié)果
實(shí)驗(yàn)中使用的計(jì)算機(jī)環(huán)境配置如下: Windows 10(64 位), 采用Intel Core I5-6500 中央處理器, CPU 頻率為3.2 GHz, 內(nèi)存為4 GB. 編程語言采用Python 3.6; 科學(xué)計(jì)算庫采用Numpy 1.18.5、數(shù)據(jù)分析庫采用Pandas 1.1.0、數(shù)據(jù)可視化庫采用Matplotlib 3.3.0. 機(jī)器學(xué)習(xí)庫采用TensorFlow 2.0、集成開發(fā)環(huán)境(IDE)是PyCharm Professional Edition 2020.1.1.
選取MSE, RMSE和MAPE作為模型訓(xùn)練和預(yù)測精度的評價指標(biāo). 3 個評價指標(biāo)的計(jì)算方法用式(10)、式(11)和式(12)表示.
每項(xiàng)指標(biāo)的長度為1200, 所以根據(jù)式(7), db5 小波對各指標(biāo)序列最大分解層數(shù)為7 層. 然而, 根據(jù)實(shí)際經(jīng)驗(yàn)最大分解層的一半通常是最佳分解層數(shù)[19]. 因此在實(shí)驗(yàn)中選擇了4 個分解層.
表2 顯示了實(shí)際數(shù)據(jù)和db5 小波分解的四階低頻信號(rA4)之間的差異. 氨氮的rA4比其他3 個指標(biāo)的誤差更小, 如MSE≈1.65E–07,RMSE≈0.00046 和MAPE≈0.0085. 電導(dǎo)率的rA4和實(shí)際數(shù)據(jù)值之間的誤差也非常小,MSE≈0.000082,RMSE≈0.0091 和MAPE≈0.0091.相對氨氮和電導(dǎo)率, pH 值的rA4值和實(shí)際數(shù)據(jù)值之間的誤差較大,MSE≈0.018,RMSE≈0.133, 但是MAPE(≈ 0.012)表明pH 的rA4值代表實(shí)際數(shù)據(jù)集的準(zhǔn)確率也非常高, 約為98.8%.對于濁度,rA4的MSE(60.38)和RMSE(7.77)非常大, 而MAPE(< 0.109)表明濁度rA4代表其實(shí)際數(shù)據(jù)集的準(zhǔn)確率也達(dá)到89.1%. 圖4 顯示了4 個指標(biāo)的實(shí)際數(shù)據(jù)集與其分解后的rA4之間的比較結(jié)果, 進(jìn)一步表明了低頻信號rA4在降低數(shù)據(jù)噪聲影響的同時很好地保持了原數(shù)據(jù)變化的趨勢.
表2 db5 小波分解的四階低頻信號(即近似值)與每個指標(biāo)的實(shí)際數(shù)據(jù)值之間的誤差
圖4 db5 小波分解近似值曲線(rA4)和實(shí)際數(shù)據(jù)集比較圖
此項(xiàng)研究中, Bi2 模型和其他5 個比較模型(Uni1、Bi1、Uni2、LSTM、W-LSTM)都在相同的實(shí)驗(yàn)平臺和環(huán)境下運(yùn)行. 為了避免實(shí)驗(yàn)中的隨機(jī)因素, 每個模型均訓(xùn)練10 次, 每次運(yùn)行100 輪次(epoch),最后取結(jié)果的平均值. 在訓(xùn)練過程中, 訓(xùn)練數(shù)據(jù)集的10%進(jìn)一步用于模型驗(yàn)證, 表3 總結(jié)了4 種Seq2Seq模型和傳統(tǒng)LSTM 模型, 以及孫銘等人[17]提出的基于小波分解的LSTM 模型(W-LSTM)的訓(xùn)練評估對比結(jié)果.
表3 4 種Seq2Seq 模型和LSTM、小波LSTM (W-LSTM) 的訓(xùn)練評估對比結(jié)果
對于pH 值, 訓(xùn)練的比較結(jié)果顯示Bi2 模型在訓(xùn)練和驗(yàn)證數(shù)據(jù)集上具有最小誤差值(MSE≈0.0002,RMSE≈0.014 和MAPE≈0.00002), 表明此模型對歷史數(shù)據(jù)的擬合性能最好. 對于氨氮, Bi1 具有最佳的擬合和驗(yàn)證誤差, 其MSE、RMSE和MAPE分別約為0.0001,0.01 和0.0001. 關(guān)于電導(dǎo)率, 與Bi2 相比, 雖然Uni1 具有略小的訓(xùn)練誤差MSE(≈0.0025)和RMSE(≈0.0501); 但Bi2 具有較小的訓(xùn)練誤差MAPE(≈0.000083)和驗(yàn)證誤差MSE(0.0037)、RMSE(0.0608)和MAPE(0.000093),并且與LSTM 和W-LSTM 模型相比, Bi2 具有更小的誤差值. 此結(jié)果表明, 在訓(xùn)練過程中Bi2 具有最佳的模擬性能. 對于濁度, 在訓(xùn)練和測試集上Uni1 具有相對較小評估誤差, 但是總體而言, Bi2 和其他兩個Seq2Seq 模型的評估誤差也非常小, 如MSE(0.000187–0.000467)、RMSE(0.0137–0.0216)和MAPE (0.000016–0.000064), 此外4 種Seq2Seq 模型與LSTM 和W-LSTM相比總體上誤差較小. 訓(xùn)練集和驗(yàn)證集上的評估比較結(jié)果表明4 個Seq2Seq 模型都具有非常好的性能, 能夠高精度地?cái)M合4 項(xiàng)水質(zhì)指標(biāo)的歷史數(shù)據(jù)集, 與其他模型相比具有更好的性能.
6 種模型的測試結(jié)果的對比如表4 和圖5 所示, 具體而言, 在pH 值測試數(shù)據(jù)集上, Bi2 具有最佳的預(yù)測性能, 預(yù)測精度極高, 其MSE、RMSE和MAPE分別為7.33E–04、0.0271 和0.0025 (表4). 然而, 其他5 個對比模型Uni1、Bi1、Uni2、LSTM 以及W-LSTM 的MSE、RMSE和MAPE測試誤差較大, 表明其他5 個對比模型的預(yù)測性能相對較低. 模型的預(yù)測對比曲線圖(圖5(a))進(jìn)一步顯示, Bi2 對pH 的預(yù)測曲線與實(shí)際數(shù)據(jù)變動趨勢吻合較好; 而Uni1 的預(yù)測值圖卻是一條直線, 表明該模型的預(yù)測能力不足. 雖然Bi1、Uni2、LSTM 和W-LSTM 都可以預(yù)測到pH 指標(biāo)的波動趨勢, 但它們放大了其波動幅度(圖5(a)).
就氨氮而言, Uni2 和Bi2 都具有非常好的預(yù)測性能, 因其較小測試誤差,MSE(3.30E–07 和4.16E–07)、RMSE(5.75E–04 和6.45E–04)和MAPE(0.0197 和0.0239) (表4). Uni1 和Bi1 雖也預(yù)測到氨氮的趨勢, 但這兩個模型的誤差遠(yuǎn)大于Uni2 和Bi2 (圖5(b)), LSTM和W-LSTM 與Uni1 和Bi1 相比, 誤差較大, 不能很好地預(yù)測氨氮的趨勢. 至于電導(dǎo)率, 測試評估結(jié)果顯示Bi2 具有最小的MSE(6.84E–05)、RMSE(0.0083)和MAPE(0.0074), 表明Bi2 具有最好的預(yù)測性能; 而Uni1 和Bi1 的預(yù)測值曲線幾乎是線性的, 其分別低估和高估了氨氮測試數(shù)據(jù)曲線的波動(圖5(c)).
就濁度而言,MSE、RMSE和MAPE測試評估誤差較大, 表明6 個模型對濁度的整體預(yù)測精度不如對其他3 個指標(biāo)的預(yù)測精度高(表4). 因?yàn)闈岫葴y試數(shù)據(jù)集含有整個數(shù)據(jù)集中的最大值, 且變化浮動較大, 所以模型可能難以準(zhǔn)確預(yù)測測試數(shù)據(jù)集, 沒有捕捉到測試數(shù)據(jù)集的波動(圖5(d)). 然而, 與其他5 個模型相比,Bi2 的MSE 和RMSE評估誤差較小; 表明Bi2 也有良好的預(yù)測結(jié)果. 較小的MAPE(0.1142)誤差, 進(jìn)一步表明Bi2 模型的預(yù)測準(zhǔn)確率為88.6% (表4). 評估比較曲線圖直觀地顯示了Bi2 較好的預(yù)測性能, 其能夠捕捉測試數(shù)據(jù)的波動行為; 而其他5 個模型預(yù)測結(jié)果僅為平滑的遞減曲線, 不能很好地預(yù)測測試數(shù)據(jù)(圖5(d)).
圖5 4 種Seq2Seq 模型、LSTM、W-LSTM 模型預(yù)測結(jié)果對比曲線
表4 4 種小波Seq2Seq 模型和LSTM、小波W-LSTM 的測試評估結(jié)果
本文提出一種新穎的小波分解去噪和雙層雙向Seq2Seq 的混合水質(zhì)預(yù)測模型(W-Bi2Seq2Seq). 小波分解的結(jié)果證實(shí), 最大分解層數(shù)的一半是最佳分解層數(shù), 即在這種情況下的四階低頻信號(rA4): (1)是實(shí)驗(yàn)實(shí)際數(shù)據(jù)集的最佳近似值; (2)降低數(shù)據(jù)復(fù)雜性和噪聲對實(shí)驗(yàn)數(shù)據(jù)影響的有效方法; (3)提高模型的泛化能力.
所采用的小波雙層雙向模型(Bi2)的評估結(jié)果與小波單層單向模型(Uni1)、小波單層雙向模型(Bi1)、小波雙層單向模型(Uni2)、LSTM 模型以及W-LSTM模型的結(jié)果進(jìn)行比較. 訓(xùn)練評估結(jié)果表明, 提出4 種Seq2Seq 模型整體上優(yōu)于LSTM 和W-LSTM 模型, 并且對不同復(fù)雜程度的水質(zhì)數(shù)據(jù)都有良好的擬合能力.然而, 測試比較結(jié)果表明, Bi2 與其他3 種Seq2Seq模型相比, 在預(yù)測復(fù)雜性程度較高的水質(zhì)數(shù)據(jù)時更具優(yōu)勢. 因?yàn)槠鋸?fù)雜的建模結(jié)構(gòu), 能夠顯著提高模型的預(yù)測精度和泛化能力.