国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于組合神經(jīng)網(wǎng)絡模型的金融時序預測

2023-01-16 12:46卜鈺家
現(xiàn)代計算機 2022年22期
關鍵詞:集上預測值殘差

卜鈺家

(澳門大學協(xié)同創(chuàng)新研究院,澳門 999078)

0 引言

股票價格預測是量化金融領域中的一個熱門課題,如何利用這些股票市場中海量交易數(shù)據(jù)來預測股票價格成為了研究熱點。以前研究股價預測問題時,常常選用的是單一模型,最開始使用ARIMA模型來進行股價預測[1-2],真實數(shù)據(jù)中包含著線性信息和非線性信息,但ARIMA 模型更多地只利用信息中的線性部分。隨著機器學習的發(fā)展,具有很好的非線性擬合能力的BP神經(jīng)網(wǎng)絡[3-4]和適合處理時間序列數(shù)據(jù)的LSTM 模型[5-6]也逐漸被應用在研究股價方面,學者也開始探究具有最好預測性的模型,但是單一的傳統(tǒng)模型總是難以兼顧精度和效率[7-8]。

由于單一的模型不足以提取數(shù)據(jù)中的復雜關系,組合模型的概念開始被提出[9-10]。本文提出了BP-LSTM 模型和ARIMA-LSTM 模型,結合兩種單一模型的優(yōu)點,將數(shù)據(jù)中有效信息都描述出來,來提高預測結果的準確性。前者結合LSTM 模型處理時間序列的優(yōu)點和BP 模型優(yōu)秀的非線性映射能力和訓練時間段的優(yōu)點,后者結合LSTM 模型對非線性數(shù)據(jù)的極強處理能力和ARIMA模型有效提取數(shù)據(jù)中線性信息的能力。

1 模型基本原理

1.1 LSTM模型

LSTM 模型在循環(huán)神經(jīng)網(wǎng)絡的基礎上進行改進,適用于從時間序列中提取時序特征,具有學習長期時間序列依存關系的能力。LSTM 模型主要規(guī)避了標準循環(huán)神經(jīng)網(wǎng)絡結構中梯度爆炸和梯度消失問題,在其基礎上加入門控的概念,通過輸入門、遺忘門和輸出門對數(shù)據(jù)信息流動進行控制,因此,訓練速度也會更快。

其中各個部分的解釋如下:

(1)遺忘門ft:控制輸入量和上一層隱藏層輸出被遺忘的程度大小。

(2)輸入門it:控制輸入量和當前計算的狀態(tài)更新到記憶單元的程度大小。

(3)輸出門ot:決定需要輸出的部分。

1.2 ARIMA模型

ARIMA 模型全稱為差分整合移動平均自回歸模型,是一種對時間序列數(shù)據(jù)進行分析和預測的算法模型。ARIMA模型預測原理可簡括為:模型將時間序列數(shù)據(jù)默認為一組隨機序列,使非平穩(wěn)的數(shù)據(jù)經(jīng)過差分后趨于平穩(wěn),轉換為平穩(wěn)的時間序列,并對以往數(shù)據(jù)間的線性關系構建模型,以預測數(shù)據(jù)未來值。

1.3 BP神經(jīng)網(wǎng)絡模型

BP 神經(jīng)網(wǎng)絡通常有三層或三層以上結構。BP 神經(jīng)網(wǎng)絡包括輸入層、輸出層,以及一個或多個隱含層。圖2是一種三層BP神經(jīng)網(wǎng)絡結構。BP 神經(jīng)網(wǎng)絡采用梯度下降法,通過反向傳播不斷調整網(wǎng)絡的權值和閾值,使網(wǎng)絡的實際輸出值和期望輸出值之間的均方誤差最小。其訓練過程包括輸入信號正向傳播和誤差信號反向傳播。這兩個過程循環(huán)進行,不斷計算輸出誤差和調整權值,直到均方誤差達到設定標準。

圖1 LSTM模型的基本結構圖

圖2 BP神經(jīng)網(wǎng)絡模型的基本結構圖

1.4 BP-LSTM模型

BP-LSTM 模型(見圖3)是混合模型,分為兩層,第一層采用BP 網(wǎng)絡;第二層采用LSTM模型。BP 神經(jīng)網(wǎng)絡結構訓練速度快,能提高預測效率,但在處理時間序列上精度不如LSTM模型,BP 模型接受訓練集數(shù)據(jù)的輸入,通過梯度下降算法不斷修正權值和閾值,最后輸出預測結果和預測殘差,將殘差輸入到后端LSTM 模型中,LSTM 再對輸入進行訓練??梢蕴嵘W(wǎng)絡的非線性映射能力,同時避免過度擬合。最后得到股票的最終預測值是BP 神經(jīng)網(wǎng)絡的預測值加上LSTM修正的殘差值之和。

圖3 BP-LSTM 組合模型的基本流程圖

1.5 ARIMA-LSTM模型

ARIMA-LSTM 模型(見圖4)是混合模型,分為兩層,第一層采用ARIMA 網(wǎng)絡;第二層采用LSTM 模型。ARIMA 模型只局限于預測數(shù)據(jù)的線性部分,而LSTM 神經(jīng)網(wǎng)絡模型更適合對數(shù)據(jù)的非線性部分信息進行提取,因此提出一種能夠提取數(shù)據(jù)線性及非線性特點的ARIMALSTM 混合模型對復雜的股票數(shù)據(jù)進行擬合。其思想是:通過ARIMA 模型建模提取股票數(shù)據(jù)存在的線性關系,充分利用時間序列上數(shù)據(jù)間的關聯(lián)性;根據(jù)自回歸差分平均模型可知殘差序列理應不呈現(xiàn)線性相關,因此進一步利用LSTM 神經(jīng)網(wǎng)絡模型訓練修正殘差序列,再將修正后的殘差序列作為輸出。最終結合ARIMA 模型預測的線性部分和LSTM 模型對殘差的修正得到最終的股票預測值。

圖4 ARIMA-LSTM 組合模型的基本流程圖

2 數(shù)據(jù)表示和處理

2.1 數(shù)據(jù)集選擇和特征選擇

本文研究選擇了上證指數(shù)2017年1月3日到2022年7月4日共計1336 條股票數(shù)據(jù)作為數(shù)據(jù)集,來進行訓練和測試。將數(shù)據(jù)集的前80%作為訓練集,后20%作為測試集,即2017年1月3日到2021年7月1日的數(shù)據(jù)為訓練集,2021年7月2日到2022年7月4日的數(shù)據(jù)為測試集。本研究選擇了8個股票交易數(shù)據(jù),分別為最高價、最低價、開盤價、前收盤、漲跌額、漲跌幅、成交量和成交金額。

2.2 數(shù)據(jù)預處理

股票的各個交易指標具有不同的量綱和量綱單位,這容易影響數(shù)據(jù)分析的結果,為消除指標之間的量綱影響和提高模型的訓練效率,需要對數(shù)據(jù)進行標準化處理。本文采用最大最小標準化的方式處理數(shù)據(jù),標準化公式如式(1)所示:

2.3 模型評估指標

為了更好地評估模型的預測結果,本文選擇三個性能指標,均方誤差(Mean Square Error,MSE)、平均絕對誤差(Mean Absolute Error,MAE)和平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE),來評估和對比模型的預測能力。MSE是真實值與預測值的差值的平方然后求和平均;MAE揭示誤差絕對值的均值情況;MAPE是統(tǒng)計預測準確性的一種方法。以上三類誤差均是數(shù)值越小表示模型預測效果越好。方程如下所示:

3 實證分析

本文使用Python 語言來編程,深度學習框架Tensorflow 為后臺。組合神經(jīng)網(wǎng)絡模型,利用LSTM 優(yōu)化預測殘差,此處的LSTM 神經(jīng)網(wǎng)絡中引入Adam算法。

3.1 LSTM模型

圖5為在測試集上用LSTM 模型預測的值和真實值的對比圖。圖5顯示,LSTM 模型預測出的值和真實值有相似的整體趨勢,能夠反映出股價的局部變化。但可以看出預測值具有明顯的滯后性,并且精度不高。

圖5 LSTM模型真實值與預測值

3.2 BP神經(jīng)網(wǎng)絡模型

圖6為在測試集上用BP 模型預測的值和真實值的對比圖。圖6顯示,BP 模型預測效果不太好。但在局部的一些位置可以反映出股票的發(fā)展趨勢,但是整體精度不夠,當股價急劇變化時,不具有敏感性。模型不能準確地預測出股價,但是符合股價的基本走勢,更適合用于預測股價的漲跌,而非具體的值。

圖6 BP神經(jīng)網(wǎng)絡模型真實值與預測值

3.3 構建ARIMA模型

圖7和圖8分別為上證指數(shù)的收盤價時序圖和一階差分圖。

圖8 上證指數(shù)的收盤價的一階差分圖

根據(jù)一階差分后股價序列的自相關和偏自相關圖,選取可能的ARIMA 模型進行參數(shù)顯著性、模型顯著性檢驗,選出針對上證指數(shù)的最優(yōu)模型——ARIMA(2,1,5)。圖9為在測試集上,用ARIMA(2,1,5)模型預測的值和真實值的對比圖。圖9顯示ARIMA(2,1,5)模型擬合結果與真實值高度接近。但存在滯后性的問題,并且在局部預測精度偏低。

圖9 ARIMA(2,1,5)神經(jīng)網(wǎng)絡模型真實值與預測值

3.4 構建BP-LSTM模型

圖10為在測試集上用BP-LSTM 模型預測的值和真實值的對比圖。圖10顯示,BP-LSTM 模型在一些峰值處呈現(xiàn)較大的誤差,說明BPLSTM 模型對于一些急劇變化過于敏感。但可以看出BP-LSTM模型預測效果優(yōu)于BP模型,首先BP-LSTM 模型的預測值更加貼近真實值,且預測值的走勢更符合真實值。

圖10 BP-LSTM 組合模型的真實值與預測值

3.5 構建ARIMA-LSTM模型

圖11為在測試集上用ARIMA-LSTM 模型預測的值和真實值的對比圖。圖11顯示,ARIMALSTM 模型預測效果優(yōu)于單一模型,結合了兩個模型的優(yōu)點,首先ARIMA-LSTM 模型的滯后性優(yōu)于ARIMA 模型,而且預測值更貼合真實值,這一點優(yōu)于LSTM模型。

圖11 ARIMA-LSTM 組合模型的真實值與預測值

4 實驗評估

綜合對比以上五個模型的預測值和真實值的差異,可以得出ARIMA-LSTM 模型的預測效果最好,其次是ARIMA 模型,LSTM 模型,BPLSTM 模型,BP模型最差。

由表1可知,這五種模型中ARIMA-BP 模型的MSE 和MAE 最小,說明在本文所選的數(shù)據(jù)集上ARIMA-LSTM 模型的預測效果最好,而BP模型的預測效果最差。對比BP 模型、BP-LSTM模型、ARIMA 模型和ARIMA-LSTM 模型可知,單一模型的預測效果沒有多模型組合的預測效果好,可能是因為單一模型對數(shù)據(jù)的有效性較低。ARIMA-LSTM 模型的MAPE 值最低,說明這個模型具有不錯的預測能力。

表1 不同模型的評論指標

5 結語

本文選取了上證指數(shù)的1336 條數(shù)據(jù),通過建立LSTM、BP、ARIMA、BP-LSTM、ARIMALSTM 這五種神經(jīng)網(wǎng)絡模型,利用Python 語言實現(xiàn)對應算法,對數(shù)據(jù)集進行訓練分析和對比,探索組合神經(jīng)網(wǎng)絡模型是否優(yōu)于單一模型。從兩個方面來建立組合神經(jīng)網(wǎng)絡模型,BP-LSTM模型結合BP 網(wǎng)絡預測時間短和LSTM 模型精度高的優(yōu)點,利用BP 模型提取數(shù)據(jù)中的非時序信息,再用LSTM 模型提取數(shù)據(jù)中的時序信息。ARIMA-LSTM 模型結合ARIMA 模型有效讀取數(shù)據(jù)中線性信息和LSTM 適合提取數(shù)據(jù)中非線性信息的優(yōu)點。提出的兩種組合模型都是希望更高效地提取數(shù)據(jù)中的信息,實現(xiàn)更有效的預測,同時也是對股價預測的新的探索。本文得出ARIMA-LSTM 組合神經(jīng)網(wǎng)絡模型優(yōu)于單一模型,減少滯后性,同時在股價預測方面具有更高的準確度。BP-LSTM 組合模型優(yōu)于BP 模型,能預測股市的大概走勢,但是準確性并不高,并且在峰值處容易過度預測,更適合來做股價漲跌的預測。

猜你喜歡
集上預測值殘差
基于雙向GRU與殘差擬合的車輛跟馳建模
加拿大農(nóng)業(yè)部下調2021/22年度油菜籽和小麥產(chǎn)量預測值
GCD封閉集上的冪矩陣行列式間的整除性
±800kV直流輸電工程合成電場夏季實測值與預測值比對分析
AI講座:ML的分類方法
基于殘差學習的自適應無人機目標跟蹤算法
基于遞歸殘差網(wǎng)絡的圖像超分辨率重建
R語言在統(tǒng)計學教學中的運用
綜合電離層殘差和超寬巷探測和修復北斗周跳
師如明燈,清涼溫潤