摘 要:溶解氧是衡量水質(zhì)的重要指標,對溶解氧濃度的準確預測,可以為水環(huán)境管理和水污染防治工作提供科學依據(jù)??紤]溶解氧受外界多種復雜因素影響,數(shù)據(jù)具有強烈的非線性和非平穩(wěn)性特征,提出了DA-CNN-BiLSTM 溶解氧濃度預測模型,其中CNN層用于提取數(shù)據(jù)局部特征,空間注意力機制關(guān)注對預測結(jié)果具有更高影響的特征,BiLSTM 挖掘輸入序列的前向和后向鄰域信息,時間注意力機制捕捉不同時刻的時間依賴性。將模型應用于福建閩江3 個水質(zhì)監(jiān)測站的溶解氧濃度預測中,通過與基線模型的對比表明:相較于基線模型,DA-CNN-BiLSTM 模型對DO 濃度具有更好的預測效果,模型的預測值更接近于實測值,溶解氧濃度預測性能最優(yōu);加入空間注意力機制后,模型的預測性能得到提升。
關(guān)鍵詞:注意力機制;CNN-BiLSTM 模型;時間序列預測;溶解氧濃度預測
中圖分類號:X32 文獻標志碼:A doi:10.3969/ j.issn.1000-1379.2024.07.016
引用格式:謝小良,吳琳琳.基于DA-CNN-BiLSTM 的河流溶解氧濃度預測[J].人民黃河,2024,46(7):92-97,111.
0 引言
水環(huán)境質(zhì)量與自然界中生物的生存和發(fā)展息息相關(guān),水質(zhì)預測是水環(huán)境管理的重要依據(jù)之一,溶解氧(DO)是衡量水質(zhì)優(yōu)劣的重要指標[1-3] 。溶解氧濃度過低會導致河流中厭氧細菌快速繁殖,有機物在缺氧條件下被微生物分解發(fā)生腐敗,從而造成河流水體變黑發(fā)臭。此外,溶解氧濃度影響水體中重金屬的分解轉(zhuǎn)化速度和水生生物的生命活動[4] 。準確預測和判斷溶解氧濃度變化情況,可以為水環(huán)境管理和水污染防治工作提供科學依據(jù)[5] 。
傳統(tǒng)的基于物理動力學模型的水質(zhì)預測方法能夠從機理層面解析河流水動力特征及其形成機制[6] ,但需要大量水文資料支撐,模型的關(guān)鍵參數(shù)具有不確定性,導致水質(zhì)預測精度不高,泛化能力差[7] 。以自回歸綜合移動平均(ARIMA)模型為代表的統(tǒng)計模型計算簡單,但僅適用于線性系統(tǒng)預測,難以捕捉水質(zhì)數(shù)據(jù)的非線性關(guān)系,同時在模型識別階段要求監(jiān)測數(shù)據(jù)具有平穩(wěn)性[8] ,因此模型應用具有一定局限性。近年來,隨著人工智能技術(shù)的發(fā)展,支持向量機[9 -10] 、隨機森林[11 -12] 、神經(jīng)網(wǎng)絡(luò)[13 -14] 等機器學習算法被廣泛應用于水質(zhì)預測領(lǐng)域。卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是目前主要使用的深度學習算法[15-16] ,其中:CNN 能夠提取水質(zhì)數(shù)據(jù)的局部特征,且參數(shù)較少,能夠緩解模型參數(shù)多引起的過擬合問題[17] ;長短期記憶網(wǎng)絡(luò)(LSTM)克服了RNN 梯度消失的問題,能夠很好地提取中長期水質(zhì)序列的特征[18-19] ,但標準LSTM 模型只對水質(zhì)序列進行正向處理;此外,隨著時間步長的增加,LSTM 模型捕捉數(shù)據(jù)長期依賴性的能力下降,容易造成一些重要特征被遺忘,對長期時序規(guī)則的挖掘有待優(yōu)化[20-21] 。雙向長短期記憶網(wǎng)絡(luò)(BiL?STM)能夠?qū)W習輸入數(shù)據(jù)中的前向和后向鄰域信息,從而獲得更準確的預測結(jié)果[22] 。