国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于小波去噪的ARIMA-LSTM混合模型及對股票價格指數(shù)的預測

2021-04-29 13:23:54婁磊劉璐劉先俊施三支
關(guān)鍵詞:股票價格神經(jīng)網(wǎng)絡(luò)混合

婁磊,劉璐,劉先俊,施三支

(長春理工大學 理學院,長春 130022)

ARIMA模型由Box與Jenkins于上世紀七十年代提出[1],廣泛應用于時間序列的預測,并取得了非常好的效果,因此ARIMA模型也被應用在了股票價格指數(shù)的預測上。我國經(jīng)濟學者陳守東、孟慶順、楊興武等人[2]最早于1998年對中國股票市場的有效性進行檢驗分析,并且應用ARIMA模型驗證了上海、深圳股市的同步性,得出我國股票市場還在發(fā)展初期,但他們并沒有對股指進行預測。趙志峰[3]于2003年建立ARIMA模型對我國股票價格指數(shù)進行預測,并得出干預模型更好的結(jié)果,同時也說明了我國市場是一個政策市場。吳玉霞、溫欣[4]在2016年使用“華泰證券”250期的股票收盤價格作為時間序列分析數(shù)據(jù),建立ARIMA模型進行實證檢驗,證明了ARIMA模型在短期動態(tài)、靜態(tài)預測效果好的特點。

早在二十世紀八、九十年代,許多專家學者開始探討循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),并在二十一世紀將其發(fā)展成為深度學習算法之一[5]。由于循環(huán)神經(jīng)網(wǎng)絡(luò)無法克服梯度消失和梯度爆炸的缺點,Sepp Hochreiter和 Jurgen Schmidhuber于 1997年提出長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)來進行長期預測[6],主要應用領(lǐng)域是語言模型以及文本生成[7-8]、機器翻譯[9-11]、語音識別[12]、圖像生成等。近十多年隨著機器學習的興起,越來越多的學者用神經(jīng)網(wǎng)絡(luò)對股票價格指數(shù)進行預測。林春燕、朱東華[13]于2006年利用了Elman神經(jīng)網(wǎng)絡(luò)對股票價格進行預測,并得到了不錯的效果。隨著時間的推移,我國經(jīng)濟學家開始使用混合模型進行預測?;匦齕14]認為股票市場是一個極其復雜的非線性動力學系統(tǒng),具有高噪聲、非線性和投資者的盲目任意性等因素,造成其價格的波動往往表現(xiàn)出較強的非線性特征,針對這些問題提出了TS模糊規(guī)則與神經(jīng)網(wǎng)絡(luò)結(jié)合的模型,并對綠景地產(chǎn)等進行實證檢驗。彭燕、劉宇紅[15]結(jié)合LSTM神經(jīng)網(wǎng)絡(luò)的特點,先對數(shù)據(jù)進行插值、小波去噪預處理,再通過調(diào)整LSTM層數(shù)與隱藏神經(jīng)元的個數(shù)提高預測精準度。于水玲[16]于2018年基于深度學習對金融市場的波動率進行了預測,也取得了不錯的效果。

綜上,對股票價格指數(shù)的研究大致可以分為三個階段。第一階段使用ARIMA模型對股票價格指數(shù)進行預測;第二階段使用神經(jīng)網(wǎng)絡(luò)對股票價格指數(shù)進行預測;第三階段使用各種混合模型對股票價格指數(shù)進行預測,旨在不斷提高預測精準度。

為了提高預測精度,提出了使用小波去噪后的數(shù)據(jù),采用ARIMA-LSTM混合模型的方法進行預測。采集2009年7月至2018年12月共計114個月上證指數(shù)每日收盤價格,經(jīng)小波去噪法預處理后做為訓練集,對2019年1月至2019年6月共計6個月的上證指數(shù)進行實證預測,預測結(jié)果與單獨使用ARIMA模型與LSTM神經(jīng)網(wǎng)絡(luò)模型相比,ARIMA-LSTM混合模型效果較好。

1 相關(guān)的模型理論簡介

1.1 ARIMA模型

假設(shè)有時間序列輸入為x1,x2,…,xT,{εt}是高斯白噪聲,則:

為求和自回歸滑動平均模型,記為ARIMA(p,d,q),其中d為差分的階數(shù),p,q為自回歸與滑動平均的階數(shù),且:

式中,B表示后移算子。根據(jù)平穩(wěn)性的要求,多項式φ(z)和θ(z)的根在單位圓外,即|z|>1。

1.2 LSTM模型

當序列長度很大時,RNN模型會發(fā)生爆炸/消失梯度,因此很難捕獲序列數(shù)據(jù)中的長期相關(guān)性,為了克服RNN模型缺點,Sepp Hochreiter和Jurgen Schmidhuber提出了 LSTM模型[6]。

假設(shè)有時間序列輸入為x1,x2,…,xT,LSTM模型有如下形式:

其中,W是具有適當維數(shù)的大權(quán)重矩陣,且:

根據(jù)LSTM的結(jié)構(gòu),單元狀態(tài)向量Ct表示攜帶序列信息,遺忘門ft決定Ct-1的值在時間t內(nèi)保留多少,輸入門it控制單元狀態(tài)的更新量,輸出門Ot給出Ct向ht顯示多少,b表示偏差權(quán)重向量(例如,bi是輸入門的偏差權(quán)重向量),σ為sigmoid或relu函數(shù)。LSTM具有類似RNN的鏈式結(jié)構(gòu),如圖1所示,但是與RNN相比較而言,LSTM的結(jié)構(gòu)相對復雜。

圖1 LSTM結(jié)構(gòu)圖

LSTM包含一個特殊的單元,即遞歸隱藏層中的內(nèi)存塊。這些內(nèi)存塊包含具有自連接的內(nèi)存單元,這些內(nèi)存單元存儲網(wǎng)絡(luò)的時間狀態(tài),此外還包含特殊乘法單元“門”,用于控制信息流。每個內(nèi)存塊都包含一個輸入門和一個輸出門和遺忘門。

假設(shè)包含一個LSTM層的三層長短期記憶網(wǎng)絡(luò)輸入向量序列為x=(x1,…,xT),輸出向量序列h=(h1,…,hT),則LSTM的向前傳播流程可以用如下具體表示:

其中,t=1,…,T。內(nèi)模塊輸出ht受到四個輸入的加權(quán)影響,并且在學習時還要將拼接的權(quán)重W進行分割,即:

1.3 ARIMA-LSTM混合模型

假設(shè)有時間序列輸入為x1,x2,…,xT,ARIMALSTM混合模型有如下形式:

ARIMA模型對數(shù)據(jù)線性部分有很好的擬合效果,而LSTM模型對非線性數(shù)據(jù)有好的預測效果,而上證指數(shù)的收盤價也同時具有線性和非線性成分,基于誤差的補償思想給出ARIMA-LSTM混合模型可對上證指數(shù)進行預測.由于股票數(shù)據(jù)的高波動性,因此在預測前對數(shù)據(jù)進行小波去噪預處理,來剔除異常數(shù)據(jù)可以提高預測準確率,這里用平均絕對誤差(MAE)和均方根誤差(RMSE):

作為評價模型預測效果,預測步驟如下:第一步使用小波去噪法對數(shù)據(jù)進行預處理;第二步建立ARIMA預測模型;第三步進行模型檢驗;第四步使用ARIMA模型預測;第五步建立LSTM模型預測殘差序列;第六步加和得到ARIMA-LSTM混合模型的預測結(jié)果;第七步進行誤差分析。預測的流程圖如圖2所示。

圖2 基于小波去噪的ARIMA-LSTM預測模型流程圖

2 實證分析

以原始的和經(jīng)小波去噪后的2009年7月至2018年12月共計114個月的上證指數(shù)每日收盤價格作為訓練集,建立ARIMA模型處理數(shù)據(jù)的線性部分,再利用LSTM模型擬合非線性數(shù)據(jù)效果好的優(yōu)點,對ARIMA模型無法擬合的殘差進行擬合,用ARIMA-LSTM混合模型對2019年1月至2019年6月共計6個月的上證指數(shù)每日收盤價格進行預測。

由Occam’s Razor法則知,誤差相同時模型越小其效果就會越好。因此常用AIC信息準則、BIC信息準則來對ARIMA模型進行定階。由于股票價格指數(shù)高波動性等因素,有時通過理論知識選出的最優(yōu)模型不一定是預測效果最好的,所以根據(jù)不同的訓練集,分別建立幾組不同的模型,對模型檢驗后,用平均絕對誤差(MAE)和均方根誤差(RMSE)作為評價模型預測效果的標準進行預測誤差分析,選出不同訓練集下的誤差最小的模型。

在建立LSTM模型預測時,通過增加訓練次數(shù)來提高預測精度。在實證分析中參數(shù)Dropout設(shè)為0.2,采用3層神經(jīng)網(wǎng)絡(luò),時間步長設(shè)置為20,每批訓練60個樣本數(shù)據(jù),學習率設(shè)為0.000 6,輸入層到隱藏層之間的激活函數(shù)使用tanh函數(shù),預測時將訓練次數(shù)從800次增加到2 000次,每次訓練都增加100次并記錄結(jié)果。

建立不同模型在不同訓練集下的最優(yōu)模型誤差對比如表1所示。

表1 不同訓練集下的最優(yōu)模型誤差對比

根據(jù)表1的誤差對比可以看出:訓練集經(jīng)小波去噪預處理后,再進行建模預測得到的預測結(jié)果要好于用未經(jīng)預處理作為訓練集的預測結(jié)果,去噪后的混合模型和單模型預測效果圖、誤差對比分別如圖3、表2所示。

圖3 單模型和去噪后的混合模型預測效果圖

表2 三種去噪后的模型預測誤差對比

根據(jù)表2的誤差對比可以看出:第一,去噪后的ARIMA模型的MAE和RMSE均遠遠小于去噪后的LSTM模型,由此說明比起LSTM模型,ARIMA模型可以更好的擬合我國股票價格指數(shù),而ARIMA模型主要用來擬合時間序列中的線性部分,所以股票價格指數(shù)中大部分數(shù)據(jù)是線性的,但是股票價格具有高波動性等不可控因素,因此對非線性因素預測也至關(guān)重要;第二,去噪后的ARIMA-LSTM混合模型的MAE和RMSE均稍微小于單獨建立去噪后的ARIMA模型的MAE和RMSE,因此建立LSTM模型對殘差進行擬合,將結(jié)果與單獨建立ARIMA模型預測的結(jié)果相加后得到結(jié)果更加接近真實值,所以去噪后的ARIMA-LSTM混合模型可以提高預測精度。

3 結(jié)論

通過實證分析對ARIMA模型、LSTM模型以及ARIMA-LSTM混合模型的預測效果進行了對比,結(jié)果表明基于小波去噪的ARIMA-LSTM混合模型對上證指數(shù)收盤價格進行預測效果最好,其次是ARIMA模型,最后是LSTM模型。這是因為股票價格指數(shù)中大部分數(shù)據(jù)是呈線性趨勢的,與LSTM模型相比ARIMA模型可以更好的擬合線性數(shù)據(jù),所以單獨建立ARIMA模型預測的效果要比單獨建立LSTM模型的預測效果好;由于股票價格指數(shù)具有高波動性等因素,線性數(shù)據(jù)中也會參雜非線性數(shù)據(jù),因此給出基于誤差補償思想的去噪ARIMA-LSTM混合模型,在建立ARIMA模型對線性數(shù)據(jù)擬合后,再建立LSTM模型對非線性殘差數(shù)據(jù)進行擬合,進一步提高了預測的精準度;該模型只適用于對我國上證指數(shù)的預測,并不適用于其它個股以及創(chuàng)業(yè)板指數(shù)的預測。

猜你喜歡
股票價格神經(jīng)網(wǎng)絡(luò)混合
混合宅
基于GARCH族模型的重慶啤酒股票價格波動研究
一起來學習“混合運算”
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
油水混合
基于神經(jīng)網(wǎng)絡(luò)的拉矯機控制模型建立
重型機械(2016年1期)2016-03-01 03:42:04
論股票價格準確性的社會效益
復數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應用
我國股票價格指數(shù)與“克強指數(shù)”的關(guān)系研究
基于支持向量機回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
成安县| 梁河县| 甘德县| 延津县| 辽源市| 徐汇区| 塔河县| 油尖旺区| 翁源县| 安国市| 浙江省| 普兰县| 镇江市| 萨迦县| 普兰店市| 保康县| 巴南区| 合作市| 贡山| 永胜县| 余庆县| 登封市| 泰州市| 普洱| 方城县| 阜平县| 九寨沟县| 汨罗市| 忻州市| 金塔县| 开平市| 巴里| 班戈县| 五莲县| 清水县| 安徽省| 青海省| 河东区| 青田县| 金华市| 封丘县|