王應(yīng)武,白栩嘉,崔東文
(1.云南省水利水電勘測(cè)設(shè)計(jì)研究院,云南 昆明 650021;2.云南省文山州水務(wù)局,云南 文山 663000)
準(zhǔn)確的月徑流量時(shí)間序列預(yù)測(cè)為防澇減災(zāi)、水資源的合理配置和調(diào)度提供科學(xué)依據(jù)和指導(dǎo)性建議。月徑流受降水、氣候、人類活動(dòng)等因素影響,時(shí)序數(shù)據(jù)表現(xiàn)出高噪聲、非線性、非平穩(wěn)性和多尺度等特征,導(dǎo)致未經(jīng)數(shù)據(jù)分解處理的模型難以獲得滿意的預(yù)測(cè)效果[1-4]。由于月徑流影響因素眾多,并最終體現(xiàn)在隨時(shí)間變化的月徑流監(jiān)測(cè)數(shù)據(jù)中,因此,可采用時(shí)間預(yù)測(cè)模型挖掘月徑流數(shù)據(jù)的潛藏規(guī)律,進(jìn)一步預(yù)測(cè)其變化趨勢(shì)。近年來(lái),時(shí)間序列預(yù)測(cè)模型已廣泛應(yīng)用于月徑流預(yù)測(cè),如王文川等[5]建立完全集合經(jīng)驗(yàn)?zāi)B(tài)分解方法(CEEMDAN)、變分模態(tài)分解(VMD)和BP神經(jīng)網(wǎng)絡(luò)相融合的月徑流預(yù)測(cè)模型;劉尚東等[6]將極點(diǎn)模態(tài)分解法(ESMD)與最近鄰抽樣回歸模型(NNBR)結(jié)合構(gòu)建耦合月徑流預(yù)測(cè)模型;張璐等[7]建立VMD、相空間重構(gòu)(PSR)和貝葉斯神經(jīng)網(wǎng)絡(luò)(BNN)相融合的月徑流預(yù)測(cè)模型;徐冬梅等[8]基于CEEMDAN、小波分解(WD)二次組合分解技術(shù),構(gòu)建CEEMDAN-WD-粒子群優(yōu)化(PSO)-最小二乘支持向量機(jī)(LSSVM)月徑流組合預(yù)測(cè)模型;孫國(guó)梁等[9]構(gòu)建VMD、麻雀搜索算法(SSA)與長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)相耦合的月徑流預(yù)測(cè)模型;梁曉鑫等[10]建立奇異譜分析(SSA)、梯度優(yōu)化算法(GBO)與相關(guān)向量機(jī)(RVM)、支持向量機(jī)(SVM)相融合的月徑流預(yù)測(cè)模型;李新華等[11]構(gòu)建小波包分解(WPD)-金槍魚(yú)優(yōu)化算法(TSO)-極限學(xué)習(xí)機(jī)(ELM)組合月徑流預(yù)測(cè)模型;楊瓊波等[12]建立WPD、人工水母搜索算法(AJS)、數(shù)據(jù)分組處理方法(GMDH)組合月徑流預(yù)測(cè)模型;席東潔等[13]建立經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)與Elman神經(jīng)網(wǎng)絡(luò)組合月徑流預(yù)測(cè)模型;桑宇婷等[14]建立互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMD)與BP神經(jīng)網(wǎng)絡(luò)組合月徑流預(yù)測(cè)模型;王麗麗等[15]構(gòu)建SSA、灰狼優(yōu)化算法(GWO)、回歸支持向量機(jī)(SVR)融合月徑流預(yù)測(cè)模型。
正則化極限學(xué)習(xí)機(jī)(Regularized extreme learning machine,RELM)主要為解決極限學(xué)習(xí)機(jī)(Extreme learning machine,ELM)泛化能力差、預(yù)測(cè)不穩(wěn)定等問(wèn)題而提出,具有訓(xùn)練速度快、泛化能力好等優(yōu)點(diǎn),已在各行業(yè)領(lǐng)域得到廣泛應(yīng)用。但在實(shí)際應(yīng)用中,隨機(jī)給定的輸入層權(quán)值和隱含層偏差(簡(jiǎn)稱“超參數(shù)”)在很大程度上影響了RELM的穩(wěn)定性和預(yù)測(cè)精度。針對(duì)這一問(wèn)題,PSO算法[16-17]、天牛群優(yōu)化算法(BSO)[18]、蜉蝣算法(MA)[19]、鳥(niǎo)群算法(BSA)[20]等已被用于RELM超參數(shù)優(yōu)化。
為提高月徑流時(shí)間序列預(yù)測(cè)的精度,驗(yàn)證改進(jìn)蛇群算法(Improve snake optimization,ISO)優(yōu)化RELM超參數(shù)對(duì)模型性能的影響,提出小波包變換(Wavelet packet transform,WPT)-ISO-RELM預(yù)測(cè)模型,并構(gòu)建WPT-SO-RELM、WPT-GWO-RELM、WPT-變色龍群算法(CSA)-RELM、WPT-鯨魚(yú)優(yōu)化算法(WOA)-RELM、WPT-樽海鞘群體算法(SSA)-RELM、WPT-侏獴優(yōu)化算法(DMO)-RELM、WPT-PSO-RELM模型、WPT-ISO-LSSVM、WPT-SO-LSSVM、WPT-GWO-LSSVM、WPT-CSA-LSSVM、WPT-WOA-LSSVM、WPT-SSA-LSSVM、WPT-DMO-LSSVM、WPT-PSO-LSSVM、WPT-RELM、ISO-RELM模型作對(duì)比分析模型,通過(guò)黑河流域鶯落峽水文站、討賴河水文站1956年1月~2009年12月月徑流預(yù)測(cè)實(shí)例對(duì)各模型進(jìn)行驗(yàn)證。
WPT能同時(shí)對(duì)信號(hào)低頻部分和高頻部分進(jìn)行分解,更適用于波動(dòng)激烈的月徑流時(shí)間序列分解。WPT對(duì)月徑流原始信號(hào)進(jìn)行分解,具體參考文獻(xiàn)[11,21-22],其公式為
(1)
重構(gòu)算法公式為
(2)
SO是F. A. Hashim等人于2022年提出的一種新型元啟發(fā)式優(yōu)化算法。該算法靈感來(lái)自于蛇的覓食和繁殖行為,即通過(guò)模擬探索階段(覓食過(guò)程)和開(kāi)發(fā)階段(繁殖過(guò)程)進(jìn)行位置更新來(lái)達(dá)到求解優(yōu)化問(wèn)題的目的[23]?;維O數(shù)學(xué)描述簡(jiǎn)述如下:
Xi=Xmin+r(Xmax-Xmin)
(3)
式中,Xi為第i個(gè)個(gè)體位置;r為介于0和1之間的隨機(jī)數(shù);Xmax、Xmin分別為搜索空間上、下限值。
(2)定義溫度和食物量。SO算法中,其探索、開(kāi)發(fā)階段主要受溫度Temp和食物量Q的影響,溫度Temp和食物量Q定義為
(4)
式中,t、T分別為當(dāng)前迭代次數(shù)和最大迭代次數(shù);c1為常數(shù),取0.5。
(3)探索階段。SO算法中,若食物量Q<0.25,則蛇群個(gè)體選擇任何隨機(jī)位置來(lái)搜索食物并更新位置。位置更新描述為
(5)
(4)開(kāi)發(fā)階段。SO開(kāi)發(fā)階段相對(duì)復(fù)雜,分為靠近獵物、戰(zhàn)斗、交配等3種策略,3種策略均受溫度Temp和食物量Q的影響。
靠近獵物策略。SO算法中,若食物量Q>0.25且溫度Temp>0.6時(shí),則蛇靠近獵物,位置更新如下
(6)
戰(zhàn)斗或交配策略。若溫度Temp≤0.6時(shí),則蛇執(zhí)行戰(zhàn)斗或交配策略。
戰(zhàn)斗策略位置更新為
(7)
交配策略位置更新為
(8)
(5)種群更新。SO算法中,若有蛇蛋孵化,則隨機(jī)生成位置替換最差雄性或雌性個(gè)體位置,數(shù)學(xué)描述為
(9)
SO已被驗(yàn)證具有較好的尋優(yōu)性能[23],但對(duì)于復(fù)雜優(yōu)化問(wèn)題,SO仍然存在搜索能力不足和搜索精度低等不足。為進(jìn)一步提高SO的全局和局部搜索性能,本文針對(duì)常數(shù)c1、c2、c3改進(jìn)如下
(10)
ELM是一種廣義的單隱層前饋神經(jīng)網(wǎng)絡(luò),具有較快的學(xué)習(xí)速度和良好的泛化能力。給定M個(gè)樣本Xk={xk,yk},k=1,2,…,M,其中xk為輸入數(shù)據(jù),yk為真實(shí)值,激勵(lì)函數(shù)為f(·),隱層節(jié)點(diǎn)為m個(gè),ELM輸出可表示為[24-25]
(11)
式中,oj為輸出值;Wi={ωi1,ωi2,…,ωim}′為輸入層節(jié)點(diǎn)與第i個(gè)隱含層節(jié)點(diǎn)的連接權(quán)值;bi為第i個(gè)輸入節(jié)點(diǎn)和隱含層節(jié)點(diǎn)的偏值;λi為第i個(gè)隱含層節(jié)點(diǎn)與輸出節(jié)點(diǎn)的連接權(quán)值。
在實(shí)際應(yīng)用中,ELM存在過(guò)擬合、可控性弱等缺點(diǎn)。為克服ELM不足,Deng等[26]在ELM中引入結(jié)構(gòu)風(fēng)險(xiǎn)和正則化系數(shù)C,通過(guò)參數(shù)C來(lái)調(diào)節(jié)結(jié)構(gòu)風(fēng)險(xiǎn)與經(jīng)驗(yàn)風(fēng)險(xiǎn)的比例,以改善ELM過(guò)擬合問(wèn)題[27-28]。RELM數(shù)學(xué)模型目標(biāo)函數(shù)表述為
(12)
受限于
(13)
步驟1。利用2層WPT對(duì)鶯落峽水文站、討賴河水文站月徑流時(shí)序數(shù)據(jù)進(jìn)行分解,得到2個(gè)高頻分量[2,1]、[2,2]和2個(gè)低頻分量[2,3]、[2,4],見(jiàn)圖1。從圖1可以看出,高頻分量波動(dòng)激烈,頻率大、振幅小,大致反映了月徑流時(shí)序數(shù)據(jù)的隨機(jī)變化情況;低頻分量波動(dòng)較緩,頻率小、振幅大,大致反映了月徑流時(shí)序數(shù)據(jù)的變化趨勢(shì)。本文選取鶯落峽水文站、討賴河水文站月徑流時(shí)序數(shù)據(jù)的80%作為訓(xùn)練樣本,剩余的20%作為預(yù)測(cè)樣本。
圖1 月徑流時(shí)序數(shù)據(jù)2層WPT分解
步驟2。參考文獻(xiàn)[11,21-22],利用Cao方法確定圖1中低頻和高頻分量的輸入步長(zhǎng)a,并利用前a個(gè)月的徑流分量預(yù)測(cè)未來(lái)1個(gè)月的分量值,即輸入層節(jié)點(diǎn)數(shù)為a,輸出層節(jié)點(diǎn)數(shù)為1。利用同樣的方法確定原始月徑流的輸入步長(zhǎng)a,計(jì)算結(jié)果見(jiàn)表1。
表1 輸入步長(zhǎng)a的計(jì)算結(jié)果
依據(jù)表1,預(yù)測(cè)模型的輸入、輸出可表述為
(14)
式中,M為樣本數(shù)量;a為輸入步長(zhǎng),即嵌入維度。
步驟3。利用低頻和高頻分量的訓(xùn)練樣本擬合值與實(shí)際值構(gòu)建均方誤差(MSE),并將其作為ISO、SO、GWO、CSA、WOA、SSA、DMO、PSO算法優(yōu)化RELM超參數(shù)的適應(yīng)度函數(shù),其公式為
(15)
步驟4。設(shè)置ISO、SO、GWO、CSA、WOA、SSA、DMO、PSO算法的種群規(guī)模為50,最大迭代次數(shù)為200,其他參數(shù)采用算法默認(rèn)值(本文著重介紹ISO算法優(yōu)化過(guò)程,其他7種算法優(yōu)化過(guò)程可參考ISO算法實(shí)現(xiàn))。利用式(3)隨機(jī)初始化蛇群個(gè)體位置Xi,將蛇群規(guī)模N分為相等的兩組Nm、Nf。
RELM、LSSVM參數(shù)設(shè)置如下:RELM選用含有一個(gè)隱含層的3層網(wǎng)絡(luò)結(jié)構(gòu),隱含層節(jié)點(diǎn)數(shù)設(shè)置為a(a為輸入步長(zhǎng)),激活函數(shù)選擇sigmoid函數(shù),超參數(shù)搜索空間設(shè)置為[-1,1],其中RELM網(wǎng)絡(luò)正則化系數(shù)C設(shè)置為1×10-10;LSSVM核函數(shù)g和正則化參數(shù)γ搜索空間均設(shè)置為[0.01,2 000],式(15)為8種算法優(yōu)化的適應(yīng)度函數(shù)。為驗(yàn)證優(yōu)化效果,RELM模型參數(shù)設(shè)置同上;所有模型的原始數(shù)據(jù)進(jìn)行[0,1]歸一化處理。
步驟5。計(jì)算蛇群所有個(gè)體適應(yīng)度值,找到并保存當(dāng)前最佳獵物位置Xfood。令當(dāng)前迭代次數(shù)t=1。
步驟6。計(jì)算c1、c2、c3值,分別將其代入式(4)~式(8)。若食物量Q<0.25,則利用式(5)更新雄性和雌性位置;若食物量Q>0.25且溫度Temp>0.6,則利用式(6)更新位置;若溫度Temp≤0.6,則利用式(7)、式(8)更新位置。
步驟7?;谑?9)替換具有最差位置的雄性或雌性個(gè)體。
步驟8。利用更新后的蛇群個(gè)體位置計(jì)算適應(yīng)度值,比較并保存當(dāng)前最佳獵物位置Xfood。
步驟9。重復(fù)步驟6~步驟9直至滿足算法終止條件。
步驟10。 輸出全局最佳獵物位置Xfood,該位置即為RELM最佳超參數(shù)。利用該超參數(shù)建立WPT-ISO-RELM等模型對(duì)低頻、高頻分量進(jìn)行預(yù)測(cè)和重構(gòu)。
步驟11。利用平均絕對(duì)百分比誤差MAPE、平均絕對(duì)誤差MAE和納什效率系數(shù)NSE對(duì)模型進(jìn)行評(píng)價(jià)。
數(shù)據(jù)來(lái)源于國(guó)家冰川凍土沙漠科學(xué)數(shù)據(jù)中心(http:∥www.ncdc.ac.cn)提供的鶯落峽水文站、討賴河水文站1956年1月~2009年12月共648組月徑流時(shí)序數(shù)據(jù),月徑流過(guò)程如圖1所示。從圖1可以看出,鶯落峽水文站、討賴河水文站月徑流序列波動(dòng)性較大,復(fù)雜程度較高,呈現(xiàn)出較強(qiáng)的非線性和非平穩(wěn)性,不利于直接預(yù)測(cè)。
為驗(yàn)證ISO優(yōu)化性能,基于式(15)構(gòu)建8個(gè)RELM超參數(shù)尋優(yōu)適應(yīng)度函數(shù)fMSE,利用ISO、SO、GWO、CSA、WOA、SSA、DMO、PSO分別對(duì)各適應(yīng)度函數(shù)fMSE進(jìn)行20次尋優(yōu),并利用最優(yōu)值fB、最劣值fW和平均值fA對(duì)8種算法的實(shí)際優(yōu)化性能進(jìn)行評(píng)估,見(jiàn)表2、3,某次尋優(yōu)曲線見(jiàn)圖2。
表2 鶯落峽水文站月徑流8種算法優(yōu)化結(jié)果評(píng)估指標(biāo)對(duì)比 10-3
表3 討賴河水文站月徑流8種算法優(yōu)化結(jié)果評(píng)估指標(biāo)對(duì)比 10-3
圖2 ISO等8種算法實(shí)例適應(yīng)度函數(shù)尋優(yōu)曲線
從表2、3和圖2可以得出:
(1)ISO尋優(yōu)精度均優(yōu)于SO、GWO、CSA、WOA、SSA、DMO、PSO等7種算法,表現(xiàn)出更好的尋優(yōu)精度和全局優(yōu)化性能,表明通過(guò)改進(jìn)c1、c2、c3參數(shù),ISO優(yōu)化性能得到大幅提升。總體而言,8種算法優(yōu)化性能依次是ISO>SO>GWO>SSA>PSO>DMO>CSA。
(2)從圖2可以直觀看出,ISO尋優(yōu)精度高、收斂速度快,表現(xiàn)最好;PSO、DMO、CSA在實(shí)例適應(yīng)度函數(shù)尋優(yōu)過(guò)程中陷入局部極值,表現(xiàn)較差。
利用WPT-ISO-RELM等模型對(duì)鶯落峽水文站、討賴河水文站的月徑流低頻、高頻分量進(jìn)行訓(xùn)練及預(yù)測(cè),將預(yù)測(cè)結(jié)果加和重構(gòu)后得到最終預(yù)測(cè)結(jié)果,同時(shí)構(gòu)建ISO-RELM模型對(duì)原始月徑流序列進(jìn)行訓(xùn)練及預(yù)測(cè),見(jiàn)表4。
表4 鶯落峽、討賴河水文站月徑流預(yù)測(cè)結(jié)果評(píng)估指標(biāo)對(duì)比
由表4可知:
(1)WPT-ISO-RELM模型對(duì)鶯落峽水文站月徑流預(yù)測(cè)的MAPE、MAE、NSE分別為0.854%、0.245 m3/s、0.999 9,對(duì)討賴河水文站月徑流預(yù)測(cè)的MAPE、MAE、NSE分別為0.447%、0.068 m3/s、0.999 9,預(yù)測(cè)精度優(yōu)于WPT-SO-RELM模型、WPT-GWO-RELM模型、WPT-CSA-RELM模型,遠(yuǎn)優(yōu)于其他對(duì)比模型,具有更高的預(yù)測(cè)精度和更好的穩(wěn)健性能,將其用于月徑流時(shí)間序列預(yù)測(cè)是可行的。
(2)在相同預(yù)測(cè)器情形下,對(duì)于鶯落峽水文站月徑流序列,WPT-ISO-RELM模型預(yù)測(cè)的MAPE較WPT-SO-RELM模型、WPT-GWO-RELM模型、WPT-CSA-RELM模型、WPT-WOA-RELM模型、WPT-SSA-RELM模型、WPT-DMO-RELM模型、WPT-PSO-RELM模型分別提高12.4%、50.2%、61.0%、82.7%、53.7%、82.3%、69.2%,對(duì)討賴河水文站月徑流序列分別提高9.1%、55.2%、68.5%、81.6%、61.9%、83.5%、74.6%,表明ISO優(yōu)化RELM超參數(shù)的效果要優(yōu)于其他算法,算法優(yōu)化性能越強(qiáng),尋優(yōu)精度越高,優(yōu)化獲得的RELM超參數(shù)越優(yōu),由此構(gòu)建的模型預(yù)測(cè)精度越高。
(3)與WPT-RELM模型相比,通過(guò)優(yōu)化RELM超參數(shù)構(gòu)建的模型,其預(yù)測(cè)性能均得到大幅提升,表明采用智能算法優(yōu)化RELM超參數(shù),能大大改善RELM網(wǎng)絡(luò)的預(yù)測(cè)性能。
(4)與ISO-RELM模型相比,采用WPT對(duì)月徑流時(shí)序數(shù)據(jù)進(jìn)行分解,其預(yù)測(cè)精度得到顯著提升,表明WPT能有效將月徑流原始序列分解為更具規(guī)律的低頻和高頻分量,大大提高了模型的預(yù)測(cè)精度。
(5)由于RELM超參數(shù)優(yōu)化維度Dim=inputnum×hiddennum+hiddennum(inputnum、hiddennum分別為輸入層、隱藏層神經(jīng)元個(gè)數(shù)),因此,本文RELM超參數(shù)優(yōu)化維度在132~756之間,屬高維優(yōu)化問(wèn)題;而LSSVM超參數(shù)僅有2個(gè),屬2維優(yōu)化問(wèn)題。從表4預(yù)測(cè)結(jié)果來(lái)看,對(duì)于高維優(yōu)化問(wèn)題,ISO優(yōu)化效果最好,SO、GWO、SSA次之,PSO、DMO、CSA優(yōu)化效果較差;對(duì)于2維優(yōu)化問(wèn)題,雖然ISO優(yōu)化效果最好,但與其他算法優(yōu)化效果差別不大,其他7種算法均對(duì)LSSVM超參數(shù)有著較好的優(yōu)化效果。可見(jiàn),基于c1、c2、c3參數(shù)改進(jìn)的ISO算法,無(wú)論是高維還是低維優(yōu)化,均具有較好的全局極值尋優(yōu)能力;同時(shí)也可看出,對(duì)于高維RELM超參數(shù)優(yōu)化問(wèn)題,算法的尋優(yōu)性能對(duì)提升RELM預(yù)測(cè)精度十分關(guān)鍵。
為驗(yàn)證ISO改進(jìn)效果和優(yōu)化算法尋優(yōu)能力對(duì)RELM超參數(shù)尋優(yōu)效果的影響,基于WPT分解方法和ISO、SO、GWO、CSA、WOA、SSA、DMO、PSO共8種群體智能算法,提出了WPT-ISO-RELM、WPT-SO-RELM、WPT-GWO-RELM、WPT-CSA-RELM、WPT-WOA-RELM、WPT-SSA-RELM、WPT-DMO-RELM、WPT-PSO-RELM等8種組合時(shí)間序列預(yù)測(cè)模型,并構(gòu)建若干對(duì)比模型,以黑河流域鶯落峽水文站、討賴河水文站月徑流預(yù)測(cè)實(shí)例對(duì)各模型性能進(jìn)行驗(yàn)證,得到以下結(jié)論:
(1)對(duì)于實(shí)例適應(yīng)度函數(shù)fMSE,ISO尋優(yōu)效果均優(yōu)于SO、GWO、CSA、WOA、SSA、DMO、PSO,具有較好尋優(yōu)精度和收斂性能,通過(guò)改進(jìn)c1、c2、c3參數(shù),能有效提升ISO極值尋優(yōu)能力和平衡能力。
(2)WPT-ISO-RELM模型對(duì)鶯落峽水文站、討賴河水文站月徑流的預(yù)測(cè)效果均優(yōu)于其他對(duì)比模型,具有更高的預(yù)測(cè)精度和更好的穩(wěn)健性能。
(3)對(duì)于高維優(yōu)化問(wèn)題(RELM超參數(shù)優(yōu)化),ISO優(yōu)化效果最好,SO、GWO、SSA次之,PSO、DMO、CSA優(yōu)化效果較差;算法尋優(yōu)性能對(duì)提升RELM預(yù)測(cè)精度十分關(guān)鍵,算法優(yōu)化性能越強(qiáng),尋優(yōu)精度越高,由此獲得的RELM超參數(shù)越優(yōu),所構(gòu)建的模型預(yù)測(cè)性能越好。對(duì)于低維優(yōu)化問(wèn)題(LSSVM超參數(shù)優(yōu)化),ISO、SO、GWO、CSA、WOA、SSA、DMO、PSO等8種算法均具有較好的優(yōu)化效果,但I(xiàn)SO優(yōu)化效果最好。
(4)WPT能有效挖掘原始序列中的內(nèi)部特征信息,獲得更具規(guī)律的低頻和高頻分量,更容易建模預(yù)測(cè)。
(5)本文提出的模型及組合方法可為相關(guān)預(yù)測(cè)研究提供參考,具有較好的實(shí)際應(yīng)用和推廣價(jià)值。