国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于CEEMDAN-LightGBM模型的洪水預(yù)測研究

2024-09-23 00:00:00王軍張宇航崔云燁等
人民黃河 2024年9期

關(guān)鍵詞:洪水預(yù)測;LightGBM 模型;CEEMDAN 算法;CEEMDAN-LightGBM 模型;LSTM 模型;利津水文站;花園口水文站

中圖分類號:P333;TP183;TV882.1 文獻(xiàn)標(biāo)志碼:A doi:10.3969/ j.issn.1000-1379.2024.09.014

引用格式:王軍,張宇航,崔云燁,等.基于CEEMDAN-LightGBM 模型的洪水預(yù)測研究[J].人民黃河,2024,46(9):99-105.

0引言

洪水是一種自然災(zāi)害,會造成嚴(yán)重的經(jīng)濟(jì)損失和人員傷亡[1] 。洪水風(fēng)險管理是預(yù)防洪水和減小洪水不利影響的一項關(guān)鍵任務(wù),其措施包括結(jié)構(gòu)性和非結(jié)構(gòu)性兩種。開發(fā)洪水早期預(yù)警系統(tǒng)[2] 和實時預(yù)測河流水位是主要的非結(jié)構(gòu)性措施,可以在應(yīng)對洪水發(fā)生時輔助實施有效的應(yīng)急策略?,F(xiàn)有的水文預(yù)測模型可分為概念模型、物理模型和“黑箱”模型。概念模型和物理模型可通過一維或二維偏微分方程來描述水文現(xiàn)象,采用這2 種模型預(yù)測降水過程、徑流過程、河流演變時,需要大量的地形、土地利用等信息,而收集這類信息需要大量的人力和物力,資源消耗過大,同時物理模型因其計算時間較長而難以被廣泛使用。“黑箱”

模型又被稱為“數(shù)據(jù)驅(qū)動”模型[3] 或機(jī)器學(xué)習(xí)(ML)模型,其訓(xùn)練速度快,預(yù)測結(jié)果較為準(zhǔn)確,因此在水文領(lǐng)域越來越受歡迎。

在河流洪水預(yù)測中,模型輸入通常包括給定站點的降水量、溫度、風(fēng)速、水位等[4-5] ,模型輸出通常是水位或流量[6-8] ,以上變量中水位實際上更容易獲取,更適合于洪水預(yù)警[9] 。傳統(tǒng)的ML 模型訓(xùn)練數(shù)據(jù)通常呈現(xiàn)表格形式,當(dāng)數(shù)據(jù)量太過龐大時,會出現(xiàn)計算資源消耗過大、數(shù)據(jù)清洗和標(biāo)注困難以及數(shù)據(jù)集不平衡等問題,從而影響模型訓(xùn)練效果。為了解決這一問題,本文以黃河利津水文站2022 年3 月19 日至2023 年3 月8日的水文數(shù)據(jù)為模型輸入, 將CEEMDAN 算法與LightGBM(Light Gradient Boosting Machine) 模型相結(jié)合,對洪水?dāng)?shù)據(jù)進(jìn)行多尺度分解和特征提取,構(gòu)建CEEMDAN-LightGBM 模型,并將其與LSTM、LightGBM模型進(jìn)行對比,以驗證該模型的預(yù)測效果。此外,采用CEEMDAN-LightGBM 模型預(yù)測利津、花園口這2 個氣候環(huán)境不同的水文站的水位和流量,比較預(yù)測結(jié)果,驗證該模型的適應(yīng)性和穩(wěn)定性,以期為洪水預(yù)測提供新的理論依據(jù)和實踐指導(dǎo)。

1模型構(gòu)建

為了清晰展示CEEMDAN-LightGBM 模型的優(yōu)勢,將其與LightGBM 模型和具有代表性的LSTM 模型進(jìn)行對比,以下是各模型的簡要介紹。

1.4 CEEMDAN-LightGBM 模型

CEEMDAN 算法在時間序列分解方面具有優(yōu)勢,而LightGBM 模型在回歸分析中表現(xiàn)出色,將這2 種方法結(jié)合起來,得到一種新模型CEEMDAN-LightGBM。該模型運(yùn)行包括3 個階段:分解、個體預(yù)測和集成。在第1 階段,采用CEEMDAN 模型將水文站的水位觀測數(shù)據(jù)分解為k 個組件,也就是k 個IMF,這些組件分別顯示出原始序列的高頻特性或者低頻特性。在第2 階段,對于每個組件,使用LightGBM 分別構(gòu)建1 個預(yù)測模型,并對每個組件進(jìn)行預(yù)測,得到單獨(dú)的預(yù)測結(jié)果。在第3 階段,將所有組件的預(yù)測結(jié)果集成為最終結(jié)果。在眾多組件預(yù)測結(jié)果集成方法中,選用加法進(jìn)行集成。CEEMDAN-LightGBM 模型的預(yù)測流程見圖2。

從圖2 中可以看出,基于“分解與集成” 框架的CEEMDAN-LightGBM 模型建模策略為典型的“分而治之”策略。該模型具有以下3 個優(yōu)點:1)將基于原始序列預(yù)測水位的任務(wù)分為幾個子任務(wù),從更簡單的組件進(jìn)行預(yù)測。2)原始序列是非線性和非平穩(wěn)的,而CEEMDAN-LightGBM 模型對每個分解組件都有相對簡單的預(yù)測形式。3)使用簡單的加法將子任務(wù)的結(jié)果集成為最終結(jié)果。

2數(shù)據(jù)來源及預(yù)處理

2.1數(shù)據(jù)來源

黃河水情呈現(xiàn)明顯的季節(jié)性變化,極易受氣候影響,流量波動大。為了保證實驗的真實性與可靠性,選取黃河利津水文站2022 年3 月18 日至2023 年3 月8日每日12 時的水文觀測數(shù)據(jù)作為原始數(shù)據(jù)。為了保證所用數(shù)據(jù)的真實性、可訪問性和透明性,主要使用公開數(shù)據(jù)源[17] ,其中水位和流量數(shù)據(jù)源自全國水雨情信息網(wǎng)站,溫度、濕度、風(fēng)力和降水量源自中國氣象局網(wǎng)站。

2.2數(shù)據(jù)預(yù)處理

1)歸一化處理。歸一化常被稱為標(biāo)準(zhǔn)化,為消除各變量之間量綱不同的影響,同時加快模型訓(xùn)練速度,往往需要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理[18] 。根據(jù)本文數(shù)據(jù)特征,采用最大最小標(biāo)準(zhǔn)化進(jìn)行處理,使模型的輸入數(shù)據(jù)為[0,1],公式為

2)樣本劃分。為了評估模型性能并驗證其預(yù)測效果,選取樣本數(shù)據(jù)中75%數(shù)據(jù)作為訓(xùn)練集用于模型訓(xùn)練,其余25%為預(yù)測集用于驗證模型的預(yù)測效果。

3模型訓(xùn)練與預(yù)測結(jié)果分析

3.1LSTM 模型

LSTM 模型包含1 個LSTM 層和1 個全連接層(Dense),LSTM 層有50 個單元,使用adam 優(yōu)化器訓(xùn)練模型,學(xué)習(xí)率為0.001,迭代次數(shù)為100。完成上述訓(xùn)練后,輸入數(shù)據(jù)得出LSTM 模型的水位預(yù)測結(jié)果,見圖3。

3.2LightGBM 模型

LightGBM 模型通過迭代訓(xùn)練多棵決策樹來提高預(yù)測準(zhǔn)確性。模型學(xué)習(xí)率為0.01,葉節(jié)點數(shù)(num_leaves)為31,特征抽樣率為0.9,每次迭代時用的數(shù)據(jù)比例(bagging_fraction)為0.8,迭代次數(shù)為5后停止訓(xùn)練,如果在連續(xù)5 次迭代過程中驗證集的均方根誤差沒有減小,則停止訓(xùn)練,避免過擬合。LightGBM 模型的水位預(yù)測結(jié)果見圖4。

3.3CEEMDAN-LightGBM 模型

CEEMDAN- LightGBM 結(jié)合CEEMDAN 算法和LightGBM 模型預(yù)測水位。CEEMDAN 算法的主要參數(shù)如下:max_imf(最大本征模態(tài)函數(shù)數(shù)量)為2,控制白噪聲強(qiáng)度為0.2,使用SIFT(單步插值優(yōu)化的快速正則化)次數(shù)為10。LightGBM 主要參數(shù)如下:提升類型(boosting_type)為gbdt,使用梯度提升決策樹;目標(biāo)函數(shù)為regression,表示執(zhí)行回歸任務(wù);每棵樹貢獻(xiàn)的學(xué)習(xí)率為0.01;每棵決策樹的葉節(jié)點數(shù)為31;每次迭代過程中隨機(jī)選擇的特征比例(feature_fraction)為0.9;每次迭代過程中隨機(jī)選擇的數(shù)據(jù)比例為0.8;每5 次迭代進(jìn)行一次bagging。

通過預(yù)測水位和流量變化趨勢,能夠及時預(yù)警和應(yīng)對潛在的洪水事件,最大限度地減少損失,因此采用CEEMDAN-LightGBM 模型分別預(yù)測水文站的水位和流量。此外,為評估CEEMDAN-LightGBM 模型預(yù)測不同氣候環(huán)境水文站水位和流量的適應(yīng)性與穩(wěn)定性,選取花園口水文站水文數(shù)據(jù),比較模型的預(yù)測結(jié)果,見圖5~圖8。

4結(jié)論

本文提出了一種CEEMDAN-LightGBM 模型,預(yù)測給定水文站水位。將2022 年3 月19 日至2023 年3月8 日利津水文站的水文數(shù)據(jù)作為模型輸入,以LSTM、LightGBM 為對照模型,與CEEMDAN-LightGBM模型的預(yù)測水位進(jìn)行對比。另基于與利津水文站氣候差別較大的花園口水文站水文數(shù)據(jù),研究CEEMDANLightGBM模型的適用性。研究結(jié)果顯示, 相比于LSTM、LightGBM 模型,CEEMDAN-LightGBM 模型在洪水預(yù)測方面表現(xiàn)得更加優(yōu)秀,其預(yù)測值更接近觀測值,預(yù)測精度更高。這表明在時間序列預(yù)測中,CEEM?DAN-LightGBM 模型的兼容性更強(qiáng),能加快數(shù)據(jù)處理速度、提高精確度,從而提升洪水預(yù)報的效率。

黃河水情極為復(fù)雜,尤其在極端氣候事件頻發(fā)的情況下,水文數(shù)據(jù)常常出現(xiàn)突變。黃河及其支流水位呈非線性變化,這些變化往往受到多種氣象因素(如強(qiáng)降水、強(qiáng)風(fēng)等)的影響?,F(xiàn)有的預(yù)測模型在捕捉水文數(shù)據(jù)突變及其后續(xù)影響上存在挑戰(zhàn),尤其是在極端氣候事件頻發(fā)時。當(dāng)前采用的CEEMDAN-LightGBM模型面對突變數(shù)據(jù)的預(yù)測能力存在一定不足,需要進(jìn)一步改進(jìn)和優(yōu)化。未來的改進(jìn)方向包括但不限于增強(qiáng)模型對突變數(shù)據(jù)的適應(yīng)能力,可能需要引入更靈活的模型結(jié)構(gòu)或者加強(qiáng)數(shù)據(jù)預(yù)處理能力,以進(jìn)一步提高模型的穩(wěn)健性和準(zhǔn)確性。此外,對于極端氣候事件的響應(yīng)機(jī)制也需要加強(qiáng),以更有效地預(yù)測和應(yīng)對黃河水情的突發(fā)變化。

钦州市| 繁昌县| 滕州市| 荣昌县| 威信县| 咸阳市| 海丰县| 闽清县| 九寨沟县| 鸡西市| 财经| 黄梅县| 历史| 长兴县| 平南县| 吴堡县| 道真| 洛浦县| 迁安市| 德清县| 杨浦区| 永济市| 翁牛特旗| 卓资县| 离岛区| 梁河县| 大足县| 金华市| 嘉荫县| 靖边县| 临澧县| 阳城县| 丰原市| 吴川市| 农安县| 庆阳市| 利辛县| 常德市| 九龙县| 抚宁县| 包头市|