師鵬飛 趙酉鍵 徐輝榮 李振亞 楊濤 馮仲愷
摘要:發(fā)展對數(shù)據(jù)依賴程度低、快捷實用和精準的模擬預(yù)報技術(shù),可為資料缺乏地區(qū)徑流模擬預(yù)測提供有效的解決辦法。從數(shù)據(jù)驅(qū)動的角度,提出一種融合相空間重構(gòu)(PSR)和長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)的徑流預(yù)測復(fù)合模型PSR-LSTM,在國內(nèi)外不同氣候分區(qū)的10個流域(站點)進行驗證。結(jié)果表明:PSR-LSTM能夠提取水文變量的多維子空間特征,并較好預(yù)測不同時間尺度的徑流變化過程;相較于LSTM,PSR-LSTM預(yù)測未來1、3、5、7、9時間步長的納什效率系數(shù)在10個流域平均提高1.49%~9.77%,均方根誤差平均降低17.01%~19.72%,對訓(xùn)練數(shù)據(jù)量的依賴程度相比LSTM降低25%~33%。研究成果可為廣大資料短缺流域水文過程模擬和預(yù)測提供參考。
關(guān)鍵詞:徑流預(yù)測;數(shù)據(jù)驅(qū)動;人工智能;相空間重構(gòu)(PSR);長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)
中圖分類號:TV122
文獻標志碼:A
文章編號:1001-6791(2023)03-0388-10
收稿日期:2022-11-22;
網(wǎng)絡(luò)出版日期:2023-05-23
網(wǎng)絡(luò)出版地址:https:∥kns.cnki.net/kcms2/detail/32.1309.P.20230522.1828.002.html
基金項目:國家自然科學(xué)基金資助項目(52279009);中央高?;究蒲袠I(yè)務(wù)費專項經(jīng)費資助項目(B220201010)
作者簡介:師鵬飛(1987—),男,副教授,博士,主要從事流域水文物理規(guī)律模擬及水文預(yù)報方面研究。
E-mail:pfshi@hhu.edu.cn
水文預(yù)警預(yù)報對防洪減災(zāi)至關(guān)重要,受資料條件和科技水平等制約,在監(jiān)測資料不足的河流,傳統(tǒng)水文模型往往無法建立[1]。近年來,受氣候變化和高強度人類活動共同影響,極端水文事件發(fā)生頻次及量級遠超歷史,流域安全風(fēng)險問題更加突出。2021年鄭州“7·20”洪澇災(zāi)害再次凸顯及時預(yù)警預(yù)報的重要性[2]。因此,創(chuàng)新水文預(yù)報的技術(shù)和方法,發(fā)展對數(shù)據(jù)依賴程度低、快捷實用和精準的模擬預(yù)報技術(shù),對于難以建模的資料缺乏地區(qū)具有重要的科學(xué)和現(xiàn)實意義。
基于物理過程的水文模型是常用的徑流模擬預(yù)測方法,由于建立物理過程模型所需的降水、徑流、蒸散發(fā)、流域特性、斷面形狀、閘閥工況等數(shù)據(jù)往往難以全部獲取,水文過程建模常存在難度[3],在資料稀缺的中小河流域尤為突出。另一方面,數(shù)據(jù)驅(qū)動的模擬預(yù)測技術(shù)正在經(jīng)歷空前的快速發(fā)展。國際上,Ham等[4]研究表明,數(shù)據(jù)驅(qū)動的人工智能(AI)模型用于模擬預(yù)測ENSO,相比經(jīng)典動力學(xué)模型,納什效率系數(shù)提升顯著;Ravuri等[5]研究表明,以人工神經(jīng)網(wǎng)絡(luò)為代表的機器學(xué)習(xí)方法,利用歷史氣象水文時間序列數(shù)據(jù)即可對洪水進行模擬和實時預(yù)測,能夠模擬復(fù)雜的非線性水文過程,具有精度高、時效性強等優(yōu)點。大量研究表明,數(shù)據(jù)驅(qū)動的預(yù)報方法不失為一種有效途徑。
長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)作為一種先進、穩(wěn)定的深度學(xué)習(xí)算法,被廣泛應(yīng)用在時間序列預(yù)測中[6]。然而,直接將水文時間序列作為輸入,驅(qū)動LSTM進行預(yù)測,由于缺乏對水文多維特征復(fù)雜信息的挖掘與表征,存在易過度擬合、對訓(xùn)練樣本量依賴程度高、精度不足等問題[7],限制了模擬預(yù)測效能,特別是在資料短缺流域。如何全面挖掘水文數(shù)據(jù)中蘊含的水文系統(tǒng)變化規(guī)律,提高深度學(xué)習(xí)算法的徑流模擬預(yù)測效能,有待深入探究。
針對上述問題,本研究引入動力系統(tǒng)理論,考慮水文序列的混沌特性,提出基于相空間重構(gòu)(PSR)的水文變量相空間特征自適應(yīng)快速挖掘和重建技術(shù),建立基于PSR-LSTM復(fù)合模型的數(shù)據(jù)驅(qū)動模擬技術(shù)框架,在國內(nèi)外不同氣候分區(qū)的多個流域進行應(yīng)用驗證,以期提升數(shù)據(jù)驅(qū)動模型的模擬預(yù)測效能,為資料缺乏地區(qū)徑流模擬預(yù)測提供便捷、有效的方法工具。
1?相空間重構(gòu)和長短期記憶神經(jīng)網(wǎng)絡(luò)方法
1.1?相空間重構(gòu)方法
相空間重構(gòu)理論最早由Takens等[8]提出,其目的為在高維相空間中重建混沌吸引子?;煦缥幼鳛榛煦缦到y(tǒng)的特征之一,體現(xiàn)著混沌系統(tǒng)的規(guī)律性(圖1)。決定系統(tǒng)長期演化任一變量的時間序列,均包含了系統(tǒng)所有變量長期演化信息,因此可由已知的時間序列,恢復(fù)并重建原動力系統(tǒng)。
研究表明,水文序列可視為混沌系統(tǒng)[9],對于某一時間序列X=[x1,x2,x3,…,xN],在估計出恰當(dāng)?shù)那度刖S數(shù)(m)和延遲時間()后,可以重構(gòu)相空間,形成N-(m-1)個m維向量:
式中:N為時間序列長度;M為項點數(shù),M=N-(m-1)。
1.2?最大Lyapunov指數(shù)
通過最大Lyapunov指數(shù)(λ>0)可以判斷時間序列是否具有混沌特性,目前已經(jīng)廣泛應(yīng)用在混沌判別和混沌時間序列預(yù)測領(lǐng)域中。最大Lyapunov指數(shù)可由Wolf法求解[10]。Wolf法求解最大Lyapunov指數(shù)的計算公式為
1.3?長短期記憶神經(jīng)網(wǎng)絡(luò)
以LSTM、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)為代表的深度學(xué)習(xí)算法,因強大的自適應(yīng)和自學(xué)習(xí)能力,近年來被廣泛應(yīng)用于電力系統(tǒng)的電力負荷和氣象水文要素的預(yù)測預(yù)報中[11-12]。LSTM通過增加門控機制來控制歷史時刻對當(dāng)前時刻的影響程度,從而解決了RNN容易產(chǎn)生梯度彌散和梯度爆炸的問題。詳細介紹可見文獻[13]。
2?PSR-LSTM復(fù)合模型構(gòu)建
2.1?建模流程
資料匱乏地區(qū)用于建模的水文變量種類單一、樣本短缺,難以構(gòu)建概念性或物理過程模型。采用數(shù)據(jù)驅(qū)動模型也面臨因特征變量少而陷入過擬合或泛化能力不足的問題。針對此,本研究充分挖掘PSR在相空間特征自適應(yīng)挖掘與重建方面的優(yōu)勢及LSTM在非線性時間序列預(yù)測方面的優(yōu)勢,將水文變量信息投映到高維空間中,將重構(gòu)后的特征向量作為LSTM的特征變量進行建模,構(gòu)建PSR-LSTM復(fù)合模型,以實現(xiàn)快速高效建模,減少數(shù)據(jù)依賴的同時、提高模擬預(yù)測精度。PSR-LSTM模型分析計算流程如下:
(1) 數(shù)據(jù)準備。水文過程建模常用數(shù)據(jù)一般包括降水、蒸散發(fā)、流量、水位等時間序列數(shù)據(jù)(逐日或逐小時)以及下墊面空間數(shù)據(jù)(DEM、地貌、植被覆蓋、水系、土壤類型、土壤厚度等)??紤]水文預(yù)報預(yù)測快捷建模的需求,結(jié)合當(dāng)前多數(shù)中小流域資料短缺的客觀實際,本研究僅選取流域中最為常見的水位或流量時間序列用于建模。數(shù)據(jù)前80%作為模型訓(xùn)練集,后20%作為測試集。
(2) 相空間重構(gòu)??紤]僅有徑流(水位或流量)數(shù)據(jù),屬水文“小數(shù)據(jù)”,為充分挖掘數(shù)據(jù)中包含的復(fù)雜信息,盡可能全面地考慮水文變量中蘊含的系統(tǒng)規(guī)律,采用PSR方法對徑流數(shù)據(jù)進行挖掘分析,獲取徑流時間序列中蘊含的多維子特征,將一維數(shù)據(jù)映射到多維相空間中。
(3) 數(shù)據(jù)標準化。對重構(gòu)后的多維矩陣序列進行歸一化處理,范圍控制在0~1之間。
(4) 預(yù)測模型構(gòu)建。搭建LSTM模型,將基于PSR重構(gòu)后的每一維特征向量作為LSTM的時間步長輸入網(wǎng)絡(luò),根據(jù)PSR中求取的嵌入維數(shù)確定LSTM輸入層節(jié)點數(shù)。按批構(gòu)造實測徑流數(shù)據(jù),調(diào)整超參數(shù)確定神經(jīng)網(wǎng)絡(luò)的深度,采用Adam優(yōu)化算法求得模型相對最優(yōu)解,并在各層之間采用Dropout技術(shù)避免模型出現(xiàn)過擬合情況,最后通過反歸一化處理得到模型預(yù)測值。
(5) 模型效能評價。采用納什效率系數(shù)、均方根誤差、洪峰相對誤差、峰現(xiàn)時間誤差等指標進行精度評價,評估模型效能。
2.2?情景模擬分析
為分析評估PSR-LSTM模型效能,設(shè)置S1、S2、S3、S4和S5共5種情景(表1),其中,S1、S2為利用重構(gòu)后的水文變量進行PSR-LSTM建模的情景,分別采用中等和較少數(shù)據(jù)量;S3、S4和S5為利用原始水文變量進行LSTM建模的情景,分別采用中等、較少和較多數(shù)據(jù)量。較多數(shù)據(jù)量指采用盡可能長的水文時間序列(即表2中序列長度),中等數(shù)據(jù)量約取較多數(shù)據(jù)量的80%,較少數(shù)據(jù)量取60%,通過遞減數(shù)據(jù)量,分析模型訓(xùn)練對數(shù)據(jù)的依賴程度。通過幾種情景的對比分析,闡述PSR-LSTM和LSTM模型的預(yù)測精度、預(yù)見期及對數(shù)據(jù)依賴程度的異同。
2.3?模型效能評價指標
采用納什效率系數(shù)(ENS)、均方根誤差(ERMS)、洪峰相對誤差(EPF)和峰現(xiàn)時間誤差對模型效能進行評價,公式如下:
式中:Qs(j)為模擬預(yù)測值;Qo(j)為實測值;Qo為實測值的平均值;Qsp和Qop分別為模擬和實測洪峰值。ENS越大、ERMS越小,表示模擬精度越高,ENS取值最大為1。按照水文情報預(yù)報規(guī)范要求[14],采用洪峰相對誤差、峰現(xiàn)時間誤差對逐小時尺度的模擬預(yù)測結(jié)果進行評價,對逐日模擬預(yù)測值不予評價。
3?實例分析
3.1?研究區(qū)及數(shù)據(jù)介紹
為充分驗證模型的魯棒性,考慮不同氣候分區(qū)下流域水文規(guī)律的差異性,選取了涵蓋中國和澳大利亞濕潤區(qū)、半濕潤半干旱區(qū)和干旱區(qū)共10個流域(站點)進行模型應(yīng)用驗證。其中,中國流域數(shù)據(jù)均來自當(dāng)?shù)厮木郑ㄖ行模┱帞?shù)據(jù),澳大利亞數(shù)據(jù)來自CSIRO建模者數(shù)據(jù)集[15],數(shù)據(jù)可靠性高。數(shù)據(jù)時間尺度為逐日或逐小時,有多次水位/流量上漲過程,具有代表性。詳見表2。
3.2?相空間重構(gòu)參數(shù)估計
相空間重構(gòu)的關(guān)鍵在于估計合適的嵌入維數(shù)和延遲時間。Kim等[16]提出的基于時間窗口的C-C法被廣泛應(yīng)用,本文采用C-C法估計相空間重構(gòu)的參數(shù),詳見文獻[16]。利用Wolf法計算的最大Lyapunov指數(shù)均大于0,表明徑流系列均具備混沌特性,參數(shù)估計結(jié)果見表3。
3.3?PSR-LSTM模型訓(xùn)練及參數(shù)設(shè)置
按照預(yù)見期分別為1、3、5、7、9個時間步長進行建模。建模前,對輸入數(shù)據(jù)進行歸一化處理,采用Adam(梯度下降法)作為模型優(yōu)化器,選擇EMS作為代價函數(shù),檢驗?zāi)P皖A(yù)測值和真實值之間的偏差,EMS公式如下:
式中:EMS為均方誤差;Yi為真實值;Y^i為模型預(yù)測值。
滑窗長度、滑窗數(shù)均為深度學(xué)習(xí)模型的超參數(shù),據(jù)此可將數(shù)據(jù)按批次放入模型中訓(xùn)練。通常將參數(shù)設(shè)置為2的倍數(shù),可較好符合計算機硬件尺寸陣列(如計算機內(nèi)存單元為210),提升訓(xùn)練效率?;谠囧e法,將滑窗長度設(shè)置為16,每批數(shù)據(jù)包含128個滑窗。
3.4?模擬結(jié)果與分析
3.4.1?PSR-LSTM與LSTM對比
考慮到在實際應(yīng)用中,往往較難獲取完整的水文時間序列數(shù)據(jù)。故本文選擇中等樣本數(shù)據(jù)量進行模型訓(xùn)練,通過對比PSR-LSTM和LSTM模型在S1、S3情況下的模擬結(jié)果,驗證PSR-LSTM的模型性能。
圖2所示為PSR-LSTM和LSTM模型在10個流域(站點)模擬效能的納什效率系數(shù)。隨著預(yù)見期的增加,2個模型的ENS均呈下降趨勢,而PSR-LSTM下降過程更平緩,箱體變化范圍PSR-LSTM較LSTM更小,表明在不同流域的離散程度更低。箱體上延線、下延線及內(nèi)部中位數(shù)橫線均較LSTM更高,特別是5步長以后,模型效能更優(yōu)。在大部分流域的模擬預(yù)測中,PSR-LSTM模型預(yù)測精度優(yōu)于LSTM模型,不同預(yù)見期下的ENS中位數(shù)(箱圖中值線)在10個流域平均提升1.49%~9.77%,ERMS平均降低17.01%~19.72%,詳見表4。
如表5所示,PSR-LSTM預(yù)測未來1、3、5、7時間步長的EPF大部分在許可誤差(峰值的20%)內(nèi),三門峽站從5步長以后預(yù)測均超出許可誤差,干旱區(qū)、半濕潤半干旱區(qū)站點的9步長預(yù)測相對誤差超出許可誤差。整體而言,PSR-LSTM在9個時間步長的EPF平均值,不同流域下較LSTM平均降低0.49%~8.93%。在逐小時模擬預(yù)測(信宜、三都站)的峰現(xiàn)時間方面,PSR-LSTM相比LSTM結(jié)果相近,但在三都站的3個步長和5個步長預(yù)測中,峰現(xiàn)時間均有1 h的提升,其他步長的結(jié)果一致。
3.4.2?PSR-LSTM與LSTM模型對訓(xùn)練數(shù)據(jù)量的依賴程度
通過對比S1、S2、S3、S5等4種建模情景,分析模型對訓(xùn)練數(shù)據(jù)量的依賴程度,結(jié)果見表6和圖3。
表6展示了在不同預(yù)見期下,各流域S1、S2、S3和S5情景的ENS系數(shù)對比。結(jié)果表明:① S1和S5在濕潤區(qū)、半濕潤半干旱區(qū)精度相似,在干旱區(qū)3個步長以后,S1的預(yù)測精度均優(yōu)于S5,即PSR-LSTM在中等樣本量下的效能優(yōu)于較多樣本量下的LSTM。② S2在部分流域優(yōu)于S3,在部分流域劣于S3,總體精度基本相當(dāng),可認為PSR-LSTM在小樣本量下與LSTM在中等樣本量下的效能相似。總體而言,從10個流域采用的數(shù)據(jù)量來看,在相似精度條件下,PSR-LSTM對訓(xùn)練樣本的依賴程度較LSTM更低,平均降低約25%~33%。
為展示模擬預(yù)報過程,受限于篇幅長度,僅選擇三都站作為代表,繪制了各情景下不同預(yù)見期長度的洪水模擬預(yù)報過程(小時尺度),見圖3(圖示為驗證期結(jié)果,20%的數(shù)據(jù)長度)??梢钥闯觯耗P驮?~7 h預(yù)見期時對洪峰預(yù)測均取得良好效果,在低流量過程情況時預(yù)測值偏高,模型預(yù)測實際偏安全,滿足洪水預(yù)報要求。對比各預(yù)見期不同情景下的洪水預(yù)測過程,1~7 h中等數(shù)據(jù)量PSR-LSTM(S1)與較多數(shù)據(jù)量LSTM(S5)的預(yù)測效果相似,在9 h預(yù)見期PSR-LSTM(S1)預(yù)測更優(yōu)。洪峰預(yù)測和低流量預(yù)測中較少數(shù)據(jù)量PSR-LSTM(S2)效果與中等數(shù)據(jù)量LSTM(S3)基本相當(dāng),表明數(shù)據(jù)量減少情況下,PSR-LSTM模型仍能保持預(yù)測效果的穩(wěn)定。
4?結(jié)?論
為對資料短缺流域的水文過程進行快捷實用的建模及預(yù)測,本文提出了一種融合相空間重構(gòu)和長短期記憶神經(jīng)網(wǎng)絡(luò)的徑流預(yù)測復(fù)合模型PSR-LSTM,建立了包括數(shù)據(jù)準備、相空間重構(gòu)、數(shù)據(jù)標準化、預(yù)測模型構(gòu)建、模型效能評價等步驟的數(shù)據(jù)驅(qū)動建??蚣?,并將模型在10個不同氣候分區(qū)流域(站點)進行了應(yīng)用驗證,結(jié)論如下:
(1) 得益于PSR挖掘徑流數(shù)據(jù)中的多維復(fù)雜信息,PSR-LSTM模型較LSTM模型具有更高的預(yù)測精度。預(yù)測未來1、3、5、7、9時間步長的ENS在10個流域平均提高1.49%~9.77%,個別流域在長預(yù)見期時最高可達29.18%,均方根誤差平均降低17.01%~19.72%,峰值誤差平均降低0.49%~8.93%。在逐小時預(yù)測的峰現(xiàn)時間誤差方面,PSR-LSTM較LSTM有少量降低。
(2) PSR考慮了水文數(shù)據(jù)中蘊含的系統(tǒng)變化規(guī)律,通過挖掘多維子空間特征,有助于減少對歷史數(shù)據(jù)量的依賴程度。PSR-LSTM利用較少樣本量建??蛇_到LSTM利用中等樣本量的效能,利用中等樣本可優(yōu)于LSTM利用較多樣本的效能,建模所需數(shù)據(jù)量較LSTM減少25%~33%。表明PSR-LSTM模型更適用于樣本短缺的流域,對數(shù)據(jù)缺乏地區(qū)的水文預(yù)報工作具有參考意義。
(3) 整體而言,在國內(nèi)外不同氣候分區(qū)的10個流域(站點)的模擬結(jié)果表明,PSR-LSTM能夠較好捕捉不同流域水文過程變化規(guī)律,具有良好的適用性和魯棒性。
需指出的是,本文僅從水文變量自相關(guān)角度進行建模,分析了PSR-LSTM相較LSTM的提升效果,一方面為驗證PSR的作用,另一方面旨在為無資料或缺資料流域提供參考方法,因此長預(yù)見期時,不可避免出現(xiàn)納什效率系數(shù)精度不高的問題。在實際應(yīng)用時,可通過增加和調(diào)整特征變量(預(yù)報因子)進行建模,以達到更佳效果。由于通常需要利用多種水文變量進行建模預(yù)報,后續(xù)將研究多變量相空間重構(gòu)法,對多種水文變量(比如增加降雨、前期影響雨量、蒸散發(fā)等)進行相空間重構(gòu),最大程度提取水文變量蘊含的復(fù)雜信息,以進一步提高模型的預(yù)測能力。
參考文獻:
[1]雍斌,張建云,王國慶.黃河源區(qū)水文預(yù)報的關(guān)鍵科學(xué)問題[J].水科學(xué)進展,2023,34(2):159-171.(YONG B,ZHANG J Y,WANG G Q.Key scientific issues of hydrological forecast in the headwater area of Yellow River[J].Advances in Water Science,2023,34(2):159-171.(in Chinese))
[2]楊宇涵,殷杰,王丹丹,等.基于ABM的城市暴雨洪澇災(zāi)害應(yīng)急疏散仿真研究:以河南鄭州“7·20”特大暴雨洪澇災(zāi)害為例[J].中國科學(xué):地球科學(xué),2023,53(2):267-276.(YANG Y H,YIN J,WANG D D,et al.ABM-based emergency evacuation modelling during urban pluvial floods:a “7·20” pluvial flood event study in Zhengzhou,Henan Province[J].Scientia Sinica Terrae,2023,53(2):267-276.(in Chinese))
[3]雷曉輝,王浩,廖衛(wèi)紅,等.變化環(huán)境下氣象水文預(yù)報研究進展[J].水利學(xué)報,2018,49(1):9-18.(LEI X H,WANG H,LIAO W H,et al.Advances in hydro-meteorological forecast under changing environment[J].Journal of Hydraulic Engineering,2018,49(1):9-18.(in Chinese))
[4]HAM Y G,KIM J H,LUO J J.Deep learning for multi-year ENSO forecasts[J].Nature,2019,573(7775):568-572.
[5]RAVURI S,LENC K,WILLSON M,et al.Skillful precipitation nowcasting using deep generative models of radar[EB/OL].2021:arXiv:2104.00954.https:∥arxiv.org/abs/2104.00954.
[6]李大洋,姚軼,梁忠民,等.基于變分貝葉斯深度學(xué)習(xí)的水文概率預(yù)報方法[J].水科學(xué)進展,2023,34(1):33-41.(LI D Y,YAO Y,LIANG Z M,et al.Hydrologic probabilistic prediction method based on variational Bayes deep learning[J].Advances in Water Science,2023,34(1):33-41.(in Chinese))
[7]SKOULIKARIS C,ANAGNOSTOPOULOU C,LAZOGLOU G.Hydrological modeling response to climate model spatial analysis of a south eastern Europe international basin[J].Climate,2019,8(1):1-17.
[8]TAKENS F.Detecting strange attractors in turbulence[J].Lecture Notes in Mathematics,1981,898:366-381.
[9]李祿德,崔東文.基于小波包分解與相空間重構(gòu)的SSA-ELM水文時間序列預(yù)報模型[J].人民珠江,2022,43(8):100-108.(LI L D,CUI D W.SSA-ELM hydrological time series forecast model based on wavelet packet decomposition and phase space reconstruction[J].Pearl River,2022,43(8):100-108.(in Chinese))
[10]NEPOMUCENO E G,MARTINS S A M,LACERDA M J,et al.On the use of interval extensions to estimate the largest Lyapunov exponent from chaotic data[J].Mathematical Problems in Engineering,2018,2018:1-8.
[11]王欣然,馮磊華,楊鋒,等.基于PSR-LSTM的機組負荷短期預(yù)測研究[J].熱能動力工程,2021,36(5):66-72.(WANG X R,F(xiàn)ENG L H,YANG F,et al.Study on short-term load forecasting of units based on PSR-LSTM[J].Journal of Engineering for Thermal Energy and Power,2021,36(5):66-72.(in Chinese))
[12]李步,田富強,李鈺坤,等.融合氣象要素時空特征的深度學(xué)習(xí)水文模型[J].水科學(xué)進展,2022,33(6):904-913.(LI B,TIAN F Q,LI Y K,et al.Development of a spatiotemporal deep-learning-based hydrological model[J].Advances in Water Science,2022,33(6):904-913.(in Chinese))
[13]BULUT M.Hydroelectric generation forecasting with long short term memory (LSTM) based deep learning model for turkey[EB/OL].2021:arXiv:2109.09013.https:∥arxiv.org/abs/2109.09013.
[14]水文情報預(yù)報規(guī)范:GB/T 22482—2008[S].北京:中國標準出版社,2009.(Standard for hydrological information and hydrological forecasting:GB/T 22482—2008[S].Beijing:Standards Press of China,2009.(in Chinese))
[15]ZHANG Y Q,VINEY N,F(xiàn)ROST A,et al.Collation of Australian modeller′s streamflow dataset for 780 unregulated Australian catchments[R].ACT:CSIRO,2013:115.
[16]KIM H S,EYKHOLT R,SALAS J.Nonlinear dynamics,delay times,and embedding windows[J].Physica D:Nonlinear Phenomena,1999,127(1/2):48-60.
Abstract:Developing low data-dependent,efficient,practical and accurate modeling techniques can provide effective solutions for hydrological simulation and prediction in areas with limited data availability.From a data-driven perspective,a composite streamflow prediction model,PSR-LSTM,which integrates Phase Space Reconstruction (PSR) and Long Short-Term Memory (LSTM) networks,was proposed in this study and validated globally over ten river basins (stations) in different climate zones.The results indicate that the PSR-LSTM can effectively extract multi-dimensional sub-space hydrological features and accurately predict streamflow changes at different time scales.Compared to LSTM,the Nash efficiency coefficient of PSR-LSTM in predictions of future 1 to 9 timesteps is increased by an average of 1.49% to 9.77% over the ten river basins;the root mean square error is reduced by an average of 17.01% to 19.72%.The dependency on the amount of training data is reduced by 25% to 33% for PSR-LSTM compared to LSTM.The research findings obtained in this study provide insights into hydrological simulation and prediction in data-scarce river basins.
Key words:streamflow prediction;data-driven;artificial intelligence;Phase Space Reconstruction (PSR);Long Short-Term Memory (LSTM) networks