李余隆 張?zhí)m 李立
摘 要:流域水質(zhì)數(shù)據(jù)存在時(shí)間和空間上的雙重依賴性,針對(duì)現(xiàn)有水質(zhì)預(yù)測(cè)模型大多建立在時(shí)間維度上,不能有效利用水質(zhì)空間相關(guān)性問(wèn)題,提出了基于圖卷積神經(jīng)網(wǎng)絡(luò)GCN 和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)LSTM 的水質(zhì)預(yù)測(cè)模型。首先建立流域監(jiān)測(cè)點(diǎn)間的拓?fù)浣Y(jié)構(gòu),并將監(jiān)測(cè)點(diǎn)沿河道的距離作為權(quán)重表征監(jiān)測(cè)點(diǎn)間連接的強(qiáng)弱;然后采用圖卷積神經(jīng)網(wǎng)絡(luò)GCN 捕獲每個(gè)輸入時(shí)刻監(jiān)測(cè)點(diǎn)間的空間關(guān)系,再通過(guò)LSTM 捕獲其時(shí)間上水質(zhì)變化特征;最后通過(guò)多層感知器MLP 得到水質(zhì)預(yù)測(cè)結(jié)果。將錢(qián)塘江南源作為研究對(duì)象,對(duì)流域內(nèi)15 個(gè)監(jiān)測(cè)點(diǎn)的pH 值、溶解氧DO、高錳酸鹽指數(shù)CODMn進(jìn)行預(yù)測(cè),結(jié)果表明:相較于LSTM,GCN-LSTM 模型水質(zhì)預(yù)測(cè)結(jié)果平均百分比誤差MAPE 分別下降15.29%、11.77%、9.8%;監(jiān)測(cè)點(diǎn)間的連接具有差異性,通過(guò)距離來(lái)表示監(jiān)測(cè)點(diǎn)間連接強(qiáng)弱可以使水質(zhì)預(yù)測(cè)結(jié)果更為精確。
關(guān)鍵詞:水質(zhì)預(yù)測(cè);圖卷積神經(jīng)網(wǎng)絡(luò);長(zhǎng)短時(shí)記憶網(wǎng)絡(luò);時(shí)空預(yù)測(cè)模型;錢(qián)塘江南源
中圖分類(lèi)號(hào):P338 文獻(xiàn)標(biāo)志碼:A doi:10.3969/ j.issn.1000-1379.2023.12.015
引用格式:李余隆,張?zhí)m,李立.基于GCN-LSTM 的錢(qián)塘江南源水質(zhì)預(yù)測(cè)研究[J].人民黃河,2023,45(12):83-87,95.
錢(qián)塘江位于浙江省西部,受亞熱帶季風(fēng)氣候影響,流域內(nèi)降水豐富、氣象災(zāi)害種類(lèi)繁多,加上工廠排污、畜禽養(yǎng)殖場(chǎng)糞便排放等人為因素影響,流域水量年際變化幅度較大,水環(huán)境污染嚴(yán)重[1] 。水體污染會(huì)對(duì)當(dāng)?shù)鼐用裆a(chǎn)生活造成一定影響,甚至制約社會(huì)經(jīng)濟(jì)發(fā)展。水質(zhì)評(píng)價(jià)及預(yù)測(cè)可以清晰地反映水體污染現(xiàn)狀及水質(zhì)未來(lái)變化趨勢(shì),據(jù)此可及時(shí)調(diào)整水資源保護(hù)措施,將水體污染由事后治理轉(zhuǎn)變?yōu)槭虑邦A(yù)防,降低水污染治理成本[2] 。
常用的水質(zhì)預(yù)測(cè)模型分為機(jī)理模型和神經(jīng)網(wǎng)絡(luò)模型兩種,其中:機(jī)理模型包括SWAT 模型、HSPF 模型等[3-6] ,通常需要大量實(shí)測(cè)數(shù)據(jù)支撐,且計(jì)算過(guò)程復(fù)雜、模擬精度較低[7] ;神經(jīng)網(wǎng)絡(luò)模型擁有很強(qiáng)的非線性表達(dá)能力,常用的時(shí)間序列預(yù)測(cè)模型包括循環(huán)神經(jīng)網(wǎng)絡(luò)RNN[8] 、長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)LSTM[9] 等,這些序列模型能夠提取水體水質(zhì)時(shí)間序列特征并對(duì)其進(jìn)行預(yù)測(cè)[10-15] 。流域水質(zhì)預(yù)測(cè)時(shí),某點(diǎn)的水質(zhì)變化不僅與其歷史變化規(guī)律有關(guān),而且與其上游水質(zhì)變化有關(guān),而這種空間維度上的傳播影響在單一時(shí)間序列模型中無(wú)法表現(xiàn),應(yīng)合理利用流域各監(jiān)測(cè)點(diǎn)間的空間關(guān)系輔助模型進(jìn)行水質(zhì)預(yù)測(cè)。常見(jiàn)的空間信息提取模型有卷積神經(jīng)網(wǎng)絡(luò)CNN,但其只適合在歐氏空間內(nèi)進(jìn)行特征提取,對(duì)于交通網(wǎng)、水網(wǎng)等復(fù)雜的非歐空間,若強(qiáng)行將非歐空間轉(zhuǎn)化為歐氏空間,則會(huì)丟失空間上各監(jiān)測(cè)點(diǎn)間的連接信息,無(wú)法反映各監(jiān)測(cè)點(diǎn)間的空間位置關(guān)系及連接的強(qiáng)弱。圖卷積神經(jīng)網(wǎng)絡(luò)GCN 是一種可以提取非歐空間特征的網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)圖中心節(jié)點(diǎn)與其周?chē)?jié)點(diǎn)之間的拓?fù)浣Y(jié)構(gòu),對(duì)圖的拓?fù)浣Y(jié)構(gòu)和節(jié)點(diǎn)屬性進(jìn)行編碼,進(jìn)而學(xué)習(xí)得到各節(jié)點(diǎn)的空間依賴關(guān)系。有關(guān)學(xué)者[16-18] 將圖卷積神經(jīng)網(wǎng)絡(luò)GCN 應(yīng)用于交通網(wǎng)路段速度預(yù)測(cè)等表明,其具有高可靠性。水網(wǎng)相對(duì)于交通網(wǎng)更為復(fù)雜,監(jiān)測(cè)點(diǎn)之間有明顯的上下游關(guān)系,在構(gòu)建拓?fù)浣Y(jié)構(gòu)時(shí)要考慮監(jiān)測(cè)點(diǎn)間的地理位置信息、流域地理地貌特征等[19-20] 。