国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于VMD-LSSVM的月徑流預(yù)測(cè)方法研究

2020-08-22 07:27呂晗芳趙雪花桑宇婷祝雪萍張麗娟
中國(guó)農(nóng)村水利水電 2020年8期
關(guān)鍵詞:汾河徑流分量

呂晗芳,趙雪花,桑宇婷,祝雪萍,張麗娟

(太原理工大學(xué)水利科學(xué)與工程學(xué)院,太原 030024)

0 引 言

徑流預(yù)測(cè)是水資源管理、調(diào)度和高效利用的基礎(chǔ)[1]。徑流過(guò)程是一個(gè)涉及水文、氣象及力學(xué)等的復(fù)雜過(guò)程,既受確定性因素的作用又受隨機(jī)因素的影響[2],并呈現(xiàn)出非線(xiàn)性、非平穩(wěn)性的特點(diǎn)。隨著計(jì)算機(jī)技術(shù)和數(shù)學(xué)算法的不斷發(fā)展,涌現(xiàn)出了一大批與機(jī)器學(xué)習(xí)和人工智能方法結(jié)合的研究。Suykens在傳統(tǒng)支持向量機(jī)(Support Vector Machines,SVM)的目標(biāo)函數(shù)中引入誤差平方和項(xiàng),并提出最小二乘支持向量機(jī)(Least-Square Support Vector Machines,LSSVM)方法,該方法收斂精度高,具有較好的非線(xiàn)性擬合能力[3,4]。目前最小二乘支持向量機(jī)在信號(hào)處理和時(shí)間序列預(yù)測(cè)等領(lǐng)域得到了廣泛應(yīng)用,周秀平[5]將LSSVM-馬爾科夫鏈組合模型成功應(yīng)用于年徑流預(yù)測(cè);張楠[6]利用最小二乘支持向量方法,構(gòu)建了基于多因子量化指標(biāo)的徑流預(yù)測(cè)模型。

然而,僅用一個(gè)預(yù)測(cè)方法建立的預(yù)報(bào)模型很難反映水流序列的變化機(jī)制,這樣的單一模型會(huì)丟失隱含在原始序列中的重要信息。有研究指出,徑流時(shí)間序列的預(yù)處理對(duì)于提高預(yù)測(cè)精度是十分必要的。因此,當(dāng)前提高精度的關(guān)鍵在于對(duì)數(shù)據(jù)的預(yù)處理,充分挖掘有限樣本包含的信息,并提取反映其變化規(guī)律的成分,再對(duì)這些成分建立模型,進(jìn)而形成組合預(yù)測(cè)的建模思路以提高預(yù)測(cè)精度[7]。

小波分析、經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)和完備總體經(jīng)驗(yàn)?zāi)B(tài)分解法(Complete Ensemble Empirical Mode Decomposition with adaptive noise,CEEMDAN)是基于信號(hào)分析的分解方法,已常見(jiàn)于徑流數(shù)據(jù)的預(yù)處理階段。小波分析具有良好的時(shí)頻局域化特性,但自適應(yīng)差且受人為因素影響較大;EMD自適應(yīng)強(qiáng),卻存在端點(diǎn)效應(yīng)和過(guò)包絡(luò)等問(wèn)題;CEEMDAN減小了白噪聲引起的誤差,但分解后會(huì)存在虛假模態(tài),影響算法的精確度[8-11]。為了解決上述分解方法出現(xiàn)的問(wèn)題,Dragomiretskiy[12]提出了是一種新的信號(hào)分解方法----變模態(tài)分解(Variational Mode Decomposition,VMD)[13-14]。相比EMD的遞歸篩選模式,VMD是一種完全非遞歸的變分模態(tài)分解,具有堅(jiān)實(shí)的理論基礎(chǔ),表現(xiàn)出更好的噪聲魯棒性。本文采用VMD對(duì)汾河上游月徑流數(shù)據(jù)進(jìn)行預(yù)處理,分解出一系列含有單一頻率信息的分量,再對(duì)這些分量建立LSSVM預(yù)測(cè)模型,最后重構(gòu)預(yù)測(cè)分量得到徑流預(yù)測(cè)結(jié)果,并對(duì)結(jié)果進(jìn)行分析以驗(yàn)證該方法的有效性。

1 模型與方法

1.1 變分模態(tài)分解(VMD)

VMD的目標(biāo)是將原始信號(hào)分解為一系列具有特殊稀疏性的離散模態(tài)分量,該方法能夠自適應(yīng)地確定相關(guān)波段并同時(shí)計(jì)算各模態(tài)分量,并更好的平衡解決各部分存在的噪聲。構(gòu)造變分模型和求模型最優(yōu)解的主要步驟如下:

(1)對(duì)模態(tài)函數(shù)進(jìn)行Hilbert(希爾伯特)變換,并在得到的單側(cè)頻譜中加入各模態(tài)的中心頻率,使得解析信號(hào)轉(zhuǎn)換為其對(duì)應(yīng)的基頻帶信號(hào)。計(jì)算該信號(hào)的梯度平方L2范數(shù),并定義它為各模態(tài)分量的帶寬,此時(shí)VMD模型轉(zhuǎn)化為約束變分問(wèn)題。

(1)

式中:x為徑流序列;uk為模態(tài)分量;ωk為模態(tài)的中心頻率;k為模態(tài)分量數(shù);t為時(shí)間變量。

(2)在求解模型時(shí),引入二次懲罰函數(shù)項(xiàng)和拉格朗日乘子算子,將上述約束變分問(wèn)題轉(zhuǎn)化為非約束變分問(wèn)題,并運(yùn)用乘子交替方向法求解模型計(jì)算最優(yōu)解。

L({uk},{ωk},λ)=

(2)

(3)最終,各模態(tài)分量解得,

(3)

式中:λ為拉格朗日乘子;α為二次懲罰系數(shù);i和k為模態(tài)分量數(shù)。

(4)根據(jù)式(3)不斷更新ukωkλ,直到滿(mǎn)足約束條件:

(4)

式中:ε為預(yù)先設(shè)置的極小值實(shí)數(shù),本文取值10-7。

1.2 最小二乘支持向量機(jī)(LSSVM)

最小二乘支持向量機(jī)(LSSVM)是對(duì)支持向量機(jī)(SVM)的改進(jìn),其代替?zhèn)鹘y(tǒng)二次規(guī)劃方法解決函數(shù)估計(jì)問(wèn)題,引入最小二乘線(xiàn)性系統(tǒng)到支持向量機(jī)中,具體步驟如下:

(1)對(duì)于給定訓(xùn)練樣本集{xi,yi},其中i=1,2,…,N,xi為輸入數(shù)據(jù),yi為輸出數(shù)據(jù),應(yīng)用核函數(shù)將樣本轉(zhuǎn)換到高維空間中,則樣本滿(mǎn)足線(xiàn)性規(guī)律:

f(x)=βTφ(x)+b

(5)

式中:βT為高維空間超平面的法向量;b為偏置量;φ(x)為非線(xiàn)性映射函數(shù)。

(2)依據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,將回歸問(wèn)題轉(zhuǎn)化成一個(gè)等式約束的優(yōu)化問(wèn)題:

(6)

式中:ei為誤差;γ為正則化參數(shù)。

(3)針對(duì)目標(biāo)函數(shù)建立拉格朗日等式:

(7)

式中:θ為拉格朗日乘子。

1.3 VMD-LSSVM預(yù)測(cè)模型

由于VMD處理復(fù)雜信號(hào)的突出優(yōu)勢(shì),本文嘗試建立VMD-LSSVM組合預(yù)測(cè)模型以提高復(fù)雜徑流序列預(yù)測(cè)的精度,其模型結(jié)構(gòu)如圖1所示。具體模型計(jì)算步驟如下:

(1)各站點(diǎn)的月徑流時(shí)間序列總長(zhǎng)516,首先經(jīng)過(guò)EMD、CEEMDAN和VMD分解,可得到一系列具有單一頻率信號(hào)的固有模態(tài)函數(shù)(IMF),即為圖中IMF1,IMF2,…,IMFn,VMD法的分解個(gè)數(shù)設(shè)定與CEEMDAN的分解個(gè)數(shù)相同,選擇二次懲罰系數(shù)為2 000,噪聲容忍度為0。

(2)將一系列IMF分別輸入LSSVM中,使用網(wǎng)格搜索進(jìn)行最優(yōu)調(diào)參并加入歸一化提高擬合度,得到各IMF對(duì)應(yīng)的輸出值序列,即為圖中Y1,Y2,…,Yn。

(3)各輸出值重構(gòu)為最終的預(yù)測(cè)徑流序列。

圖1 VMD-LSSVM模型預(yù)測(cè)流程圖Fig.1 Flowchart of the VMD-LSSVM model proposed

2 實(shí)例分析

汾河作為山西的母親河,是黃河的第二大支流,位于黃河的中游段,流域面積達(dá)38 728 km2。汾河的上游段從寧武縣的管涔山河源到太原北郊的蘭村,是太原重要的水源地和最大的飲用水功能區(qū),本文研究的4個(gè)水文站點(diǎn)均位于汾河上游。上靜游站位于汾河支流嵐河上,此站上游控制面積為1 140 km2;汾河水庫(kù)站處于嵐河與汾河的交匯處;寨上站坐落于古交市寨上村,控制面積約1 500 km2;蘭村站在汾河的中上游,位于太原市西北22.5 km的上蘭村。4個(gè)水文站1958-2000年月徑流數(shù)據(jù)資料來(lái)自山西省水文局,已被運(yùn)用于多個(gè)科研項(xiàng)目及工程,因此可以保證可靠性;且該徑流序列較長(zhǎng),資料精度較高,具有很好的代表性,能夠客觀反映汾河上游徑流演變特征。

2.1 月徑流資料VMD分解

利用VMD法對(duì)4個(gè)水文站的月徑流資料進(jìn)行分解,各站原始徑流序列和其分解IMF分量的頻譜圖如圖2所示。原始徑流數(shù)據(jù)包含多頻率的徑流序列信息,呈現(xiàn)“雜亂無(wú)章”的特點(diǎn),很難找到其中蘊(yùn)含的變化規(guī)律。隨著頻率的增大,原始徑流序列的幅值變化出現(xiàn)多個(gè)峰值,代表在某段頻率周期中徑流序列出現(xiàn)了大幅度變化,相較其他的小幅變化這種變化能夠主導(dǎo)序列的趨勢(shì),這類(lèi)峰值變化信息為主要頻率信息,包含主要頻率信息的分量為主要頻率分量。而VMD法分解出的各IMF分量能夠?qū)⒃夹蛄械亩鄠€(gè)頻率分解開(kāi)來(lái),并且這些預(yù)處理后的分量能夠自適應(yīng)的提取重要變化信息。蘭村站的IMF1、IMF3、IMF4、IMF6與其他站點(diǎn)的IMF1、IMF2、IMF4、IMF6分別包含了各主要頻率信息,剩余的IMF包含其他相關(guān)信息。各IMF分量在主要頻率信息的其余各處幅值基本為0,說(shuō)明VMD可以在不影響重要信息的情況下自適應(yīng)地去除不利于模型預(yù)測(cè)的噪聲,在分解與提取的同時(shí)體現(xiàn)了優(yōu)秀的除噪效果,更突出了重要變化信息,使得原始數(shù)據(jù)變化過(guò)程易于讀取。

圖2 月徑流序列的VMD分解結(jié)果圖Fig.2 VMD decomposition results of monthly runoff series

2.2 預(yù)測(cè)結(jié)果分析

本文使用上靜游站、汾河水庫(kù)站、寨上站和蘭村站1958-2000年總計(jì)516個(gè)月徑流資料,其中前492個(gè)數(shù)據(jù)即1958年1月至1998年12月徑流資料為訓(xùn)練集,這組數(shù)據(jù)用于模型模擬及訓(xùn)練,后24個(gè)數(shù)據(jù)即1999年1月至2000年12月徑流資料為測(cè)試集用于測(cè)試模型預(yù)測(cè)效果。

為對(duì)比模型預(yù)測(cè)效果,本文選擇4種模型進(jìn)行分別預(yù)測(cè),包括單一預(yù)測(cè)LSSVM模型、組合預(yù)測(cè)EMD-LSSVM模型、CEEMDAN-LSSVM模型以及VMD-LSSVM模型。各模型預(yù)測(cè)結(jié)果與原徑流數(shù)據(jù)的對(duì)比見(jiàn)圖3。

圖3 4個(gè)水文站各模型預(yù)測(cè)結(jié)果對(duì)比圖Fig.3 Forecast results by using each model at four hydrological stations

由圖3可知:①在單一LSSVM預(yù)測(cè)模型下,4個(gè)站點(diǎn)的預(yù)測(cè)效果并不理想,只能夠顯示出大致的變化趨勢(shì),并且大部分預(yù)測(cè)數(shù)據(jù)比實(shí)測(cè)數(shù)據(jù)高60%左右,在4種模型中預(yù)測(cè)效果最差。其中最為明顯的是,上靜游站1999年6-10月與2000年7-9月預(yù)測(cè)值明顯遠(yuǎn)大于實(shí)測(cè)值。②組合模型EMD-LSSVM的預(yù)測(cè)效果相較單一預(yù)測(cè)模型更好,更接近實(shí)測(cè)值,但仍有部分?jǐn)?shù)據(jù)存在趨勢(shì)相反或誤差大于50%的情況。③在使用組合模型CEEMDAN-LSSVM時(shí),預(yù)測(cè)結(jié)果的變化趨勢(shì)已基本與實(shí)測(cè)序列相同,誤差相較EMD-LSSVM模型減少了約40%,在4個(gè)模型中預(yù)測(cè)效果僅次于VMD-LSSVM模型,僅有個(gè)別數(shù)據(jù)存在誤差較大的情況。這說(shuō)明CEEMDAN比EMD減少了模態(tài)混疊的現(xiàn)象,使預(yù)測(cè)效果得到提高。④組合模型VMD-LSSVM的預(yù)測(cè)效果與實(shí)測(cè)徑流曲線(xiàn)擬合度最好,變化趨勢(shì)與原序列相同,且無(wú)極端值出現(xiàn),可以初步判斷,VMD分解方法較經(jīng)驗(yàn)?zāi)B(tài)系列方法能更好地應(yīng)對(duì)序列中包含的復(fù)雜頻率信息,且與LSSVM組合應(yīng)用效果更好。

為了更清晰地闡述模型預(yù)測(cè)效果,平均絕對(duì)誤差MAE、均方根誤差RMSE、平均絕對(duì)百分比誤差MAPE和納什效率系數(shù)NS4個(gè)指標(biāo)將用于分析預(yù)測(cè)精度,計(jì)算公式如下:

(8)

(9)

(10)

(11)

式中:σi為i時(shí)刻的預(yù)測(cè)值;σ0為i時(shí)刻的實(shí)測(cè)值;σ為實(shí)測(cè)值的均值。

根據(jù)《水文情報(bào)預(yù)報(bào)規(guī)范(GB/T 22482-2008)》的規(guī)定,當(dāng)NS≥0.90時(shí),預(yù)測(cè)精度為甲級(jí);0.70≤NS<0.90時(shí),預(yù)測(cè)精度為乙級(jí);0.50≤NS<0.70時(shí),預(yù)測(cè)精度為丙級(jí)。

表1為汾河上游4個(gè)水文站的精度指標(biāo)結(jié)果,從中可以分析得到:①各模型在訓(xùn)練期的NS指標(biāo)為0.7以上,達(dá)到丙級(jí)以上水平,且隨著模型的優(yōu)化,從單一預(yù)測(cè)模型到組合預(yù)測(cè)模型,從應(yīng)用遞歸的經(jīng)驗(yàn)?zāi)B(tài)系列方法到應(yīng)用非遞歸、分解更完全的變分模態(tài)分解方法,MAE、MAPE和RMSE指標(biāo)逐漸減小,NS逐漸靠近1。②測(cè)試期預(yù)測(cè)結(jié)果關(guān)于模型的比較更加明顯,VMD-LSSVM模型的MAE、MAPE和RMSE與單一LSSVM模型相比分別減少了80%~90%、75%~90%、50%~90%;與EMD-LSSVM模型相比分別減少了70%~80%、60%~85%、50%~80%;與CEEMDAN-LSSVM模型相比分別減少了50%~75%、40%~70%、40%~70%。VMD-LSSVM模型的NS為0.81~0.92,預(yù)測(cè)精度為甲級(jí);EMD-LSSVM模型的NS為0.50~0.68;CEEMDAN-LSSVM模型的NS為0.69~0.83;LSSVM模型的NS為0.21~0.31,預(yù)測(cè)結(jié)果不可信。③訓(xùn)練期整體比測(cè)試期預(yù)測(cè)效果要好,各模型都存在不同程度的過(guò)學(xué)習(xí)現(xiàn)象。以寨上站為例,LSSVM模型測(cè)試期RMSE為訓(xùn)練期的近10倍,而VMD-LSSVM模型測(cè)試期RMSE為訓(xùn)練期的3倍。LSSVM單一模型對(duì)訓(xùn)練樣本內(nèi)的噪聲和孤立點(diǎn)比較敏感,由于徑流序列的復(fù)雜多頻特性,其含有的不利噪聲表現(xiàn)為頻譜圖中各個(gè)頻率段摻雜的無(wú)序低幅值波動(dòng),這會(huì)影響LSSVM的回歸擬合,而VMD分解能夠使復(fù)雜信息轉(zhuǎn)化為主要頻率信息和其他信息,并且有優(yōu)秀除噪效果,有利于LSSVM尋找最優(yōu)回歸參數(shù)以降低輸出誤差,所以將分解后的IMF分量再輸入LSSVM進(jìn)行預(yù)測(cè)能夠減少噪聲對(duì)模型預(yù)測(cè)精度的影響。④整體來(lái)看,上靜游站和蘭村站的VMD-LSSVM模型預(yù)測(cè)效果最為理想,NS達(dá)到甲級(jí),而汾河水庫(kù)站與寨上站的預(yù)測(cè)精度最高只能達(dá)到乙級(jí)。

表1 4個(gè)水文站各模型預(yù)測(cè)誤差對(duì)比Tab.1 Prediction error of each model at four hydrological stations

表2 4個(gè)水文站兩類(lèi)分量的預(yù)測(cè)誤差及權(quán)重對(duì)比Tab.2 Prediction error and weight of each types of components at four hydrological stations

為了更加深刻地描述VMD分解方法在預(yù)測(cè)中的應(yīng)用效果,做出4個(gè)水文站兩類(lèi)分量的預(yù)測(cè)誤差及權(quán)重對(duì)比(見(jiàn)表2)。通過(guò)VMD法分解后可以得到各站的IMF分量,提取出各站的主要頻率分量與其他頻率分量,對(duì)這組原始數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)進(jìn)行NS誤差分析,并計(jì)算兩類(lèi)分量的線(xiàn)性權(quán)重。主要頻率分量的NS接近1,預(yù)測(cè)精度高,而其他頻率分量精度稍低,并且主要頻率分量較其他頻率分量在預(yù)測(cè)序列中權(quán)重大,說(shuō)明主要頻率分量在預(yù)測(cè)中有重要地位,該分量精度的提升可以帶動(dòng)總體VMD-LSSVM模型精度的提高,研究這類(lèi)信息的提取和預(yù)測(cè)對(duì)于提高整體預(yù)測(cè)精度具有重要意義,這也表明了VMD-LSSVM組合模型對(duì)于月徑流序列預(yù)測(cè)的優(yōu)勢(shì)所在。

綜上所述,汾河上游徑流序列的預(yù)測(cè)效果優(yōu)劣排序應(yīng)如下:VMD-LSSVM > CEEMDAN-LSSVM > EMD-LSSVM > LSSVM,組合模型較單一預(yù)測(cè)模型在預(yù)測(cè)精度上有一定的優(yōu)勢(shì),其中VMD-LSSVM模型相較EMD-LSSVM和CEEMDAN-LSSVM在訓(xùn)練期和測(cè)試期都能達(dá)到較高精度,該模型用于復(fù)雜多頻信息的徑流序列預(yù)測(cè)是可行、有效的。

3 結(jié) 語(yǔ)

(1)在對(duì)復(fù)雜的徑流序列進(jìn)行預(yù)測(cè)時(shí),單一LSSVM模型的預(yù)測(cè)結(jié)果不可信,需要將序列進(jìn)行預(yù)處理后再預(yù)測(cè),經(jīng)過(guò)分解后進(jìn)行預(yù)測(cè)再重構(gòu)的組合模型法可以大幅提高預(yù)測(cè)精度。

(2)相比經(jīng)驗(yàn)?zāi)B(tài)系列方法的遞歸篩選模式,變模態(tài)分解法是一種完全非遞歸的變分模態(tài)分解,具有堅(jiān)實(shí)的理論基礎(chǔ),能夠提取出主要頻率信息,表現(xiàn)出更好的噪聲魯棒性,從而有利影響預(yù)測(cè)效果,進(jìn)一步提高預(yù)測(cè)精度。

(3)VMD-LSSVM模型首先將實(shí)測(cè)徑流數(shù)據(jù)分解為一系列子序列,并提取出主要頻率分量和其他相關(guān)信息,再把該組序列分別輸入LSSVM進(jìn)行預(yù)測(cè),得到對(duì)應(yīng)的一組預(yù)測(cè)序列,經(jīng)重構(gòu)后為最終的預(yù)測(cè)數(shù)據(jù)。該方法的預(yù)測(cè)效果與EMD-LSSVM、CEEMDAN-LSSVM和LSSVM相比誤差最小,NS為乙級(jí)以上。VMD-LSSVM模型用于包含多頻率信息的復(fù)雜徑流序列預(yù)測(cè)是可行且有效的,該模型可以推廣到與汾河上游地理環(huán)境相似的流域。

猜你喜歡
汾河徑流分量
陪汾河走一走
格陵蘭島積雪區(qū)地表徑流增加研究
流域徑流指標(biāo)的構(gòu)造與應(yīng)用
陪汾河走一走
基于SWAT模型的布爾哈通河流域徑流模擬研究
畫(huà)里有話(huà)
雅魯藏布江河川徑流變化的季節(jié)性規(guī)律探索
一斤生漆的“分量”——“漆農(nóng)”劉照元的平常生活
一物千斤
汾河水韻