摘要:提出一種改進(jìn)的回聲狀態(tài)神經(jīng)網(wǎng)絡(luò)模型,用于復(fù)雜系統(tǒng)的長期行為分析和預(yù)測,模型通過引入隱層狀態(tài)的延遲反饋體現(xiàn)系統(tǒng)過去時(shí)刻的信息對當(dāng)前狀態(tài)的影響,避免了傳統(tǒng)回聲狀態(tài)網(wǎng)絡(luò)方法記憶能力弱的缺點(diǎn)以及獲得最優(yōu)參數(shù)的困難,
關(guān)鍵詞:回聲狀態(tài)網(wǎng)絡(luò);混沌時(shí)間序列;儲(chǔ)備池計(jì)算;穩(wěn)定性;長期預(yù)測
中圖分類號(hào):0193文獻(xiàn)標(biāo)志碼:A文章編號(hào):1671-5489(2024)05-1017-05
Delayed Echo State Neural Network for Analysisand Application of Complex Systems
XU Yichen1,Eric Li2-3
(1.School of Information,Renmin University of China,Beijing 100872,China
2.School of Computing,Engineeringamp;DigitalTechnologies,TeessideUninversityMiddlesbrough TS1 4,North Yorkshire,United Kingdom
3.College of Mathematics,JilinUniversity,Changchun 130012,China)
Abstract:We proposed an improved echo state neural network model for the analysis and prediction of long-term behavior of complex systems.The model introduced the delayed feedback of hidden layer state to reflect the influence of the past time information on the current state of the system,avoiding the shortcomings of weak memory ability and difficulty of obtaining optimal parameters in traditional echo state network methods.
Keywords:echo state network;chaotic time series;reservoircomputing;stability;long-term prediction
回聲狀態(tài)網(wǎng)絡(luò)(ESN)是一種新型的回歸人工神經(jīng)網(wǎng)絡(luò)(RNN)模型,由于其在復(fù)雜動(dòng)態(tài)系統(tǒng)預(yù)測問題上性能優(yōu)異,因此在科學(xué)和工程領(lǐng)域已引起廣泛關(guān)注[4],ESN的核心思想是先通過使用儲(chǔ)備池(reservoir)將訓(xùn)練數(shù)據(jù)投影到高維特征空間中,然后通過讀出權(quán)重將高維狀態(tài)映射到輸出數(shù)據(jù),讀出權(quán)重可通過線性嶺回歸算法計(jì)算,克服了使用梯度下降算法帶來的梯度爆炸和梯度消失的困難[5-12]但現(xiàn)有的ESN模型所體現(xiàn)的系統(tǒng)特征隨著時(shí)間的推移逐漸消失,在當(dāng)前時(shí)間附近的輸入特征顯著,而對于遠(yuǎn)離當(dāng)前時(shí)間的輸入特征太弱而無法回憶,ESN模型這種重視短期行為導(dǎo)致記憶能力不足的特點(diǎn)限制了其解決復(fù)雜系統(tǒng)長期預(yù)測問題的能力.基于此,本文提出一種具有延遲反饋的回聲狀態(tài)網(wǎng)絡(luò)模型(delay-ESN),通過考慮儲(chǔ)備層中神經(jīng)元的延遲效應(yīng),引入隱層狀態(tài)的延遲反饋體現(xiàn)系統(tǒng)過去時(shí)刻信息對當(dāng)前狀態(tài)的影響,從而提高系統(tǒng)的記憶性能.
1回聲狀態(tài)網(wǎng)絡(luò)
回聲狀態(tài)網(wǎng)絡(luò)是一種特殊的回歸神經(jīng)網(wǎng)絡(luò)模型,由輸入層、輸出層和儲(chǔ)備池層組成.儲(chǔ)備池層由大量隨機(jī)相連的神經(jīng)元構(gòu)成,將輸入信號(hào)映射到更高維度的狀態(tài)空間.假設(shè)一個(gè)ESN的輸入層包含D個(gè)單元,儲(chǔ)備池層有N個(gè)單元,輸出層有d個(gè)單元.若u(t)∈RD,x(t)∈RN,y(t)∈Rd分別表示外界的輸入、儲(chǔ)備池的輸出及整個(gè)網(wǎng)絡(luò)的輸出,則儲(chǔ)備池層節(jié)點(diǎn)的動(dòng)力學(xué)可以表示為
其中Wm∈RNxD,W∈RNxN分別是輸入-儲(chǔ)備池層的權(quán)值和儲(chǔ)備池層權(quán)值,這些權(quán)值隨機(jī)產(chǎn)生并且在運(yùn)行過程中不需要更新.整個(gè)ESN網(wǎng)絡(luò)的輸出為
這里[·;·]表示縱向串聯(lián).在回歸任務(wù)中,f(·)通常為單位函數(shù),W∈Rdx(N+D)可以通過嶺回歸算法計(jì)算[2.矩陣W的設(shè)計(jì)是ESN是否成功的關(guān)鍵,其主要受稀疏度和譜半徑rm等參數(shù)的影響,其中稀疏度通常為10%~20%,譜半徑通常被歸一化為mlt;1以獲得回聲狀態(tài)特性[2]。
Leaky-ESN(L-ESN)是一種改進(jìn)的ESN模型[5],儲(chǔ)備池層動(dòng)力學(xué)描述為
L-ESN通過引入?yún)?shù)a∈[0,1]建立系統(tǒng)當(dāng)前與其上一步狀態(tài)之間的關(guān)系.
2延遲反饋回聲狀態(tài)網(wǎng)絡(luò)
本文提出一種具有延遲自反饋效應(yīng)的ESN模型(delay-ESN),若引入隱層狀態(tài)的延遲反饋Yx,-m,則其隱層輸出可表示為
這里f(·)表示隱層節(jié)點(diǎn)的激活函數(shù),滿足
且
xm表示延遲自反饋,y為反饋強(qiáng)度,m≥0為反饋延遲.延遲自反饋建立了儲(chǔ)備層狀態(tài)的當(dāng)前和先前m時(shí)間步之間的關(guān)系,提供了反映系統(tǒng)動(dòng)態(tài)特性的有效途徑,其模型結(jié)構(gòu)如圖1所示,其中虛線箭頭表示延遲反饋,m表示m步延遲,y為反饋增益.
在訓(xùn)練階段,回聲狀態(tài)x(t)按列堆登到狀態(tài)X中,對應(yīng)的教師輸出值y(t)按列堆登成向量Y.當(dāng)輸出單元的激活函數(shù)是單位函數(shù)時(shí),輸出層變成線性組合器.因此,網(wǎng)絡(luò)訓(xùn)練的目的是通過求解如下優(yōu)化問題:
找到最優(yōu)的輸出權(quán)值:
這里‖·‖表示Euclid范數(shù),I表示單位矩陣,是正則化參數(shù).
當(dāng)獲得了最優(yōu)的權(quán)值W后,將網(wǎng)絡(luò)的輸出反潰到輸入層作為輸入信號(hào),即令u()=y(t),則可以對系統(tǒng)的動(dòng)態(tài)行為進(jìn)行預(yù)測,表達(dá)式為
delay-ESN具有以下特點(diǎn):
1)引入延遲反饋可以更好地模擬神經(jīng)元之間信號(hào)的有限傳輸速度和延遲交互作用;
2)通過引入延遲狀態(tài)反饋,考慮了系統(tǒng)過去狀態(tài)對系統(tǒng)的影響,提高了記憶能力;
3)如果沒有自反饋,則delay-ESN退化為標(biāo)準(zhǔn)ESN;
4)L-ESN只考慮了隱含層與其上一個(gè)時(shí)刻的狀態(tài)的線性組合,而delay-ESN考慮了隱含層與其之前m個(gè)時(shí)間步的狀態(tài)之間的非線性關(guān)系,具有更好的動(dòng)態(tài)性能.
3回聲狀態(tài)特性分析
ESN模型中最重要的特征是回聲狀態(tài)特性(ESP),即驅(qū)動(dòng)的儲(chǔ)備池需要對小擾動(dòng)具有魯棒性13.當(dāng)不滿足該條件時(shí),兩個(gè)非常接近的輸入信號(hào)可能導(dǎo)致兩個(gè)非常不同的儲(chǔ)層表示,進(jìn)而導(dǎo)致ESN對監(jiān)督學(xué)習(xí)任務(wù)毫無用處.事實(shí)上,在擾動(dòng)或噪聲存在的情況下,沒有ESP的網(wǎng)絡(luò)準(zhǔn)確性會(huì)很差:一個(gè)小擾動(dòng)即可能使網(wǎng)絡(luò)達(dá)到前所未有的狀態(tài),破壞網(wǎng)絡(luò)的預(yù)測能力.
假設(shè)1非線性激活函數(shù)f(u,x,z)在集合D∈RN上滿足局部Lipchitz條件:
這里a和3是已知常數(shù).
定理1如果delay-ESN模型滿足下列條件:
1)f(·)滿足假設(shè)1;
2)apmax+B|y|lt;1,這里pmax是矩陣Wres的范數(shù).
則delay-ESN模型具有回聲狀態(tài)特性.
證明:設(shè)x2和z2分別是不同初始條件下儲(chǔ)備池的輸出狀態(tài),這里x2(0)≠z2(0),則有
因此根據(jù)文獻(xiàn)[1,3]的結(jié)論,如果滿足條件1)和2),則delay-ESN模型有回聲狀態(tài)特性.
4數(shù)值實(shí)驗(yàn)
下面通過混沌時(shí)間序列預(yù)測實(shí)驗(yàn)驗(yàn)證delay-ESN模型的有效性.實(shí)驗(yàn)中,輸入數(shù)據(jù)和教師數(shù)據(jù)都被歸一化為具有均值0和標(biāo)準(zhǔn)差1.儲(chǔ)備池層的節(jié)點(diǎn)數(shù)設(shè)為500,Wm和W中的元素由(-0.5,0.5)內(nèi)隨機(jī)均勻分布的隨機(jī)數(shù)組成,用均方根誤差(RMSE)衡量模型的性能:
其中y。(t)表示輸出的教師信號(hào),y(t)表示預(yù)測值,T為預(yù)測的時(shí)間步長.
考慮Rossler混沌系統(tǒng),定義為
其中a=0.15,3=0.2,0=10.則系統(tǒng)展現(xiàn)出混沌特性.
Rossler系統(tǒng)分量的軌跡表現(xiàn)出不規(guī)則的跳躍行為,許多ESN方法很難準(zhǔn)確預(yù)測該系統(tǒng).選擇初始條件(xo,yo,zo)=(0,1,0),使用Runge-Kutta方法生成6000個(gè)數(shù)據(jù)點(diǎn)的三維時(shí)間序列,時(shí)間步長為0.01.其中前1000個(gè)樣本用于預(yù)熱,2500個(gè)數(shù)據(jù)作為訓(xùn)練儲(chǔ)層的輸入,其余的2500個(gè)數(shù)據(jù)用于測試ESN的預(yù)測性能,實(shí)驗(yàn)中參數(shù)的設(shè)定滿足定理1條件,并且r=0.9,7=0.1,=10-8.
選擇參數(shù)y=-0.22,m=6,圖2為delay-ESN和ESN的預(yù)測曲線和RMSE,其中陰影部分表示delay-ESN的RMSE.由于Rossler混沌系統(tǒng)對初始值的敏感性,因此由圖2可見,當(dāng)離散時(shí)間步長約小于153時(shí),ESN有較好的預(yù)測結(jié)構(gòu),其中RMSElt;10-2.但隨著時(shí)間的延長,ESN的預(yù)測逐漸偏離了實(shí)際軌跡,當(dāng)離散時(shí)間大于900時(shí),RMSEgt;10-1,預(yù)測性能不佳.但當(dāng)離散時(shí)間步長達(dá)2000時(shí),delay-ESN的預(yù)測軌跡仍可以準(zhǔn)確地跟蹤實(shí)際的混沌曲線,預(yù)測RMSElt;10~2.實(shí)驗(yàn)結(jié)果表明,本文提出的delay-ESN可以實(shí)現(xiàn)混沌系統(tǒng)的長期預(yù)測.
對參數(shù)(y,m)進(jìn)行網(wǎng)絡(luò)劃分,在參數(shù)的交叉點(diǎn)上計(jì)算RMSE,則可以得到RMSE的區(qū)域顏色圖,其中顏色深淺表示了RMSE的大小.當(dāng)參數(shù)位于綠色和藍(lán)色區(qū)域時(shí),預(yù)測誤差非常?。≧MSElt;0.1).圖3為delay-ESN在Y-m平面內(nèi)的預(yù)測誤差顏色圖.由圖3可見:
1)delay-ESN 可以在很大的(γ,m)參數(shù)范圍內(nèi)給出更好的預(yù)測結(jié)果,因此更容易選擇參數(shù)γ 和 m,以獲得更好的預(yù)測結(jié)果,降低了經(jīng)典 ESN 方法選擇最優(yōu)參數(shù)的困難;
2)與經(jīng)典 ESN 相比,負(fù)反饋增益可實(shí)現(xiàn)良好的收斂性,這與許多現(xiàn)有的帶有參數(shù)的 ESN 方法 (如LeakyESN)非常不同,這些模型中參數(shù)通常是正的;
3)隨著延遲的增加,具有更好預(yù)測精度的參數(shù)逐漸減小,呈現(xiàn)出近似周期性變化模式;
4)預(yù)測精度較高的參數(shù)通常位于具有小延遲和小反饋增益的區(qū)域,在實(shí)際問題中,可以從這些區(qū)域搜索參數(shù)以獲得更好的精度.
綜上可見,作為一種新型的回歸神經(jīng)網(wǎng)絡(luò)模型,回聲狀態(tài)網(wǎng)絡(luò)有效克服了傳統(tǒng)RNN建模中遇到的梯度爆炸和梯度消失問題,在混沌時(shí)間序列預(yù)測中取得了優(yōu)異的效果.但由于ESN的短期記憶能力,其動(dòng)態(tài)性能略有不足,難以實(shí)現(xiàn)復(fù)雜系統(tǒng)的長期行為分析和預(yù)測。本文考慮了神經(jīng)元信號(hào)有限的傳播速度,將儲(chǔ)備池層神經(jīng)元的延遲反饋引入到儲(chǔ)備池狀態(tài)的更新過程中,提高了傳統(tǒng)ESN方法記憶能力不足的問題,并且對模型的回聲狀態(tài)特性進(jìn)行了分析,給出了確保delay-ESN穩(wěn)定收斂的充分條件,雖然提出的模型引入了兩個(gè)額外參數(shù),但易通過對這些參數(shù)的搜索獲得更優(yōu)的計(jì)算性能.數(shù)值實(shí)驗(yàn)結(jié)果表明,本文提出的方法在混沌時(shí)間序列數(shù)據(jù)的分析和預(yù)測中效果很好。本文的數(shù)值實(shí)驗(yàn)雖然只與經(jīng)典的ESN模型進(jìn)行了對比,但可以在一些改進(jìn)的模型中引入延遲反饋獲得更好的記憶性能,從而更有利于在實(shí)際問題中應(yīng)用.
參考文獻(xiàn)
[1]JAEGER H,HASS H.HarnessingNonlinearity:Predicting Chaotic Systems and Saving Energy in Wireless Communications[J].Science,2004,304:78-80.
[2]GAUTHIER D J,BOLLT E,GRIFFITH A,etal.Next Generation Reservoir Computing[J].Nature Communications,2021,12:5564-1-5564-7.
[3]GONG Z C,CHEN H H,YUAN B,etal.Multiobjective Learning in the Model Space for Time Series Classification[J].IEEE Transactions on Cybernetics,2019,49(3):918-932.
[4]BIANCHI F M,SCARDAPANE S,L?KSE S,etal.Reservoir Computing Approaches for Representation and Classification of Multivariate Time Series[J].IEEE Transactions on Neural Networks and Learning Systems,2021,32(5):2169-2179.
[5]GALLICCHIO C.MICHELI A,PEDRELLI L.Deep Reservoir Computing:A Critical Experimental Analysis[J].Neurocomputing,2017,268:87-99.
[6] GALLICCHIO C,MICHELI A,PEDRELLI L.Design of Deep Echo State Networks[J].Neural Networks,2018,108:33-47.
[7]OTTE S,BUTZ M V.KORYAKIN D.et al.Optimizing Recurrent Reservoirs with Neuro-Evolution[J].Neurocomputing,2016,192:128-138.
[8]QIAO J F,LI F J.HAN H G.et al.Growing Echo-State Network with Multiple Subreservoirs[J].IEEE Transactions on Neural Networks and Learning Systems,2016,28(2):391-404.
[9]WANG H S,LIU Y X.WANG D S,etal.Discriminative and Regularized Echo State Network for Time Series Classification[J].Pattern Recognition,2022,130:108811-1-108811-14.
[10]ROY M,MANDAL S,HENS C.et al.Model-Free Prediction of Multistability Using Echo State Network[J].Chaos,2022,32(10):101104-1-101104-8.
[11]PATHAK J,HUNT B,GIRVAN M,etal.Model-Free Prediction of Large Spatiotemporally Chaotic Systems from Data:A Reservoir Computing Approach[J].Physical Review Letters,2018,120(2):024102-1-024102-5.
[12]ZHANG H,F(xiàn)AN H W,WANG L,etal.Learning Hamiltonian Dynamics with Reservoir Computing[J].Physical Review E,2021,104(2):024205-1-024205-12.
(責(zé)任編輯:趙立芹)