国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于神經(jīng)網(wǎng)絡的金融時間序列預測

2022-01-24 07:40:18趙翔安徽大學
品牌研究 2021年31期
關鍵詞:人工神經(jīng)網(wǎng)絡股價神經(jīng)網(wǎng)絡

文/趙翔(安徽大學)

一、研究背景

股票作為金融行業(yè)必不可少的一部分,日漸受到人們的關注,越來越多的人參與股票投資。在股票投資中人們最為關心的就是股價的波動,因為股價的波動直接影響著股市的穩(wěn)定以及金融市場與國民經(jīng)濟的健康發(fā)展。

擁有一個準確的股價和趨勢預測方法有助于加強投資者活力,同時也可以給政府部門的市場監(jiān)管與指導提供支撐。因此,如何預測股票市場在金融領域是一個重要并且十分具有價值的課題。

現(xiàn)如今預測股票漲跌的方法五花八門,每個方法都有其優(yōu)點和缺點,并沒有十全十美的預測方法。考慮到當下預測方法眾多本文篇幅有限不能一一采用,所以本文選取了如今最熱門的方法之一人工神經(jīng)網(wǎng)絡。

人工神經(jīng)網(wǎng)絡通過效仿人大腦中神經(jīng)元功能,在股票市場中利用之前的數(shù)據(jù)和其他有關信息來對股價未來的變化趨勢進行預測,并且其具有十分強大的自組織與自適應的能力。正因如此,神經(jīng)網(wǎng)絡適用于處理具有非線性時間序列特征的股價預測問題,這也是神經(jīng)網(wǎng)絡如此受人推崇的原因。

神經(jīng)網(wǎng)絡是一個大的整體,而不僅僅是某一個方法,它包括了很多種方法。本文提出了一種基于BP神經(jīng)網(wǎng)絡針對股價預測問題的模型。首先從影響股價的眾多市場因素中討論并確定了11個針對股價預測的評價指標,然后通過相關關系分析把指標個數(shù)降至6個;同時探討了樣本數(shù)據(jù)的選取、隱藏層節(jié)點個數(shù)和預處理等問題;最后多次運行所建立的模型,得到一個具有最好預測精度和穩(wěn)定性的綜合模型。理論和實驗的結果表明,本文建立的基于BP神經(jīng)網(wǎng)絡的股價預測綜合模型是可行且有效的,有著非常良好的應用前景。

二、理論分析

(一)神經(jīng)網(wǎng)絡基本原理

人工神經(jīng)網(wǎng)絡在人工智能領域扮演著重要角色,它通過模擬人腦神經(jīng)元的結構,找出隱藏在數(shù)據(jù)中的非線性關系。目前為止,人工神經(jīng)網(wǎng)絡被廣泛地應用于包括醫(yī)學、經(jīng)濟學、圖像識別等在內的各個領域。神經(jīng)網(wǎng)絡的結構大致可以分為輸入層、隱含層和輸出層三個部分,數(shù)據(jù)傳入輸入層,通過閾值,權重和激勵函數(shù)在神經(jīng)元中進行運算,經(jīng)過隱含層,層層傳遞,最后在輸出層得到結果。神經(jīng)網(wǎng)絡利用誤差反向傳遞,逐次調整閾值和權重,通過多次的迭代,參數(shù)進行反復優(yōu)化,最后便可得到一個擁有某種作用的神經(jīng)網(wǎng)絡。

人工神經(jīng)網(wǎng)絡只是大量人工智能技術中的一種,其之所以引起人們廣泛的關注,是因為相對于其他人工智能技術,具有以下幾個優(yōu)勢:

1.容錯與聯(lián)想存取能力

人工神經(jīng)網(wǎng)絡的參數(shù)大部分是由閾值與連接權重組成,人工神經(jīng)網(wǎng)絡的整個學習過程就是在對這些參數(shù)進行更新和調整,最終人工神經(jīng)網(wǎng)絡就會把通過學習所得到的數(shù)據(jù)之間的關系存儲在這些參數(shù)中。同時如果BP神經(jīng)網(wǎng)絡部分的神經(jīng)元結構遭到破壞時,它不會對整個訓練結果造成很大的影響,也就是說整個神經(jīng)網(wǎng)絡部分結構出現(xiàn)問題后它依然可以正常的運行,并且得到的結果不會受到太大的影響。這就是BP神經(jīng)網(wǎng)絡的容錯能力。

2.高速尋優(yōu)能力

人工神經(jīng)網(wǎng)絡可以通過計算機進行并行計算,加快訓練速度,同時利用各種優(yōu)化函數(shù),讓神經(jīng)網(wǎng)絡能以最快的速度得出最優(yōu)參數(shù)。

3.自學能力

通常我們所得到的原始數(shù)據(jù)看似毫無關聯(lián),但其中往往隱藏著某種較為復雜的非線性關系,人工神經(jīng)網(wǎng)絡按照某種特定的機制對這些雜亂的數(shù)據(jù)進行訓練與學習,當完成訓練與學習后,再把其他的同種雜亂的數(shù)據(jù)輸入到這個人工神經(jīng)網(wǎng)絡模型中,模型便會利用它之前通過學習得到的這種規(guī)律給出比較精確的結果。

4.非線性映射能力

BP神經(jīng)網(wǎng)絡實際上是輸入層到輸出層的一個映射,相關理論證明三層的人工神經(jīng)網(wǎng)絡就可以以任意的精度去迫近任意的非線性連續(xù)函數(shù)。這也是為什么它特別合適解決內部機制復雜的問題。

5.泛化能力

泛化能力就是保證人工神經(jīng)網(wǎng)絡對所需分類對象正確進行分類的前提下,還要求人工神經(jīng)網(wǎng)絡在經(jīng)過訓練學習后,對未知模式或者含有噪聲的模式進行正確分類。

(二)BP算法

其算法流程圖如圖1。

圖1 算法流程圖

BP算法是BP神經(jīng)網(wǎng)絡的參數(shù)調節(jié)機制,給定一個由n組訓練樣例構成的訓練數(shù)據(jù)集,x代表特征數(shù)據(jù),y代表標簽數(shù)據(jù)(圖2)。

圖2 神經(jīng)網(wǎng)絡架構

以(xk,yk)為例。敘述BP算法具體的流程,xk輸入網(wǎng)絡,經(jīng)過層層計算,最終輸出的結果為:即:

以yk作對比計算出均方誤差為:

每一輪迭代運算 ,均會對參數(shù)做一次更新調整,參數(shù)更新公式為:

這里選取隱含層到輸出層的鏈接權ωhj作為樣例,描述神經(jīng)網(wǎng)絡中各參數(shù)的更新過程。BP算法采用非線性規(guī)劃中的梯度下降法對參數(shù)進行調整,因此選取目標的負梯度方向對參數(shù)進行調整,給定學習率η,有:

數(shù)據(jù)在網(wǎng)絡的傳遞過程中,先用計算第j個輸出神經(jīng)元的輸入值βj,然后再通過激活函數(shù)計算其輸出值進而得到Ek。

三、實證分析

金融時間序列指的是把金融數(shù)據(jù)在特定的時間內按照時間前后順序所獲得值進行排列,它有一個最明顯的特征就是與“時間”緊密相連。金融時間序列主要受到行業(yè)周期、供求關系、宏觀經(jīng)濟政策等眾多外部條件影響。所以怎樣利用這些外部條件對股票進行研究十分重要。一般我們認為,宏觀經(jīng)濟和外界環(huán)境的變化,會以某種形式表現(xiàn)在數(shù)據(jù)里,我們所面臨的問題是怎么去對數(shù)據(jù)進行挖掘,研究各種信息融合對序列趨勢所產生的影響,突發(fā)事件對序列的影響也會通過數(shù)據(jù)的突然變化體現(xiàn)出來。本文對金融時間的選取,數(shù)據(jù)的處理,機器學習模型,分類回歸預測模型評價指標進行相應的描述。

(一)數(shù)據(jù)來源及指標選取

本文實驗所選取的數(shù)據(jù)為五糧液(000858)2018年 1月 2號 到2020年12月16號日線數(shù)據(jù)集。該數(shù)據(jù)集是網(wǎng)易財經(jīng)網(wǎng)站的一個子數(shù)據(jù)集,一共有720條數(shù)據(jù)。除了收集股票數(shù)據(jù)外,我們還需要知道引起股價變化的具體因素,并選取影響股價的主要因素建立一個合適的股價預測模型。在建立模型之前,我們需要采集盡可能多的信息方便我們從各個不同的角度和層面來分析股票。首先我們需將數(shù)據(jù)分成兩個部分,如表1所示,第一部分為2018年1月2號到2020年12月16號每日的歷史股票數(shù)據(jù)(選取70%的數(shù)據(jù))我們用它來當訓練數(shù)據(jù)集(如表),用于人工神經(jīng)網(wǎng)絡算法學習和訓練,剩下的數(shù)據(jù)就為我們的測試數(shù)據(jù)集。我們利用經(jīng)過學習的人工神經(jīng)網(wǎng)絡模型對測試集股價趨勢進行預測,將得到預測結果與實際數(shù)據(jù)進行一個對比(表1)。

表1 樣本劃分數(shù)據(jù)說明

本文從最高價、最低價、開盤價等維度選取了11個評價指標。日線數(shù)據(jù)的每一行代表的為每一天的記錄,主要記錄了當天股票的開盤和收盤價、最低價和最高價格以及成交量等幾個關鍵指標,開盤價為當天早上9:30所給出的開盤價,收盤價為當天下午3:00所給出的收盤價,最低價和最高價分別為當天價格最低時候和最高時候所對應的值,成交量是一整天的累積,其原始數(shù)日線部分數(shù)據(jù)如表2。

表2 數(shù)據(jù)說明

(二)數(shù)據(jù)預處理

我們需要對原始數(shù)據(jù)進行一定程度的預處理,前期數(shù)據(jù)的一些準備工作對我們所得到的序列預測效果有著十分重大的影響,可以說我們所得到模型的精度很大程度上取決于對原始數(shù)據(jù)預處理的效果。因此,利用一些有效的技術手段對金融時間序列數(shù)據(jù)進行前期預處理變得十分有必要,它可以讓數(shù)據(jù)更加可靠和完整,可以在一定程度上提高數(shù)據(jù)的質量,從而能提高模型預測的準確率和精確度。

(1)異常值和空缺值處理:目前比較流行的解決方法有以下幾種,例如直接把缺失值刪除或者運回歸值、前一時刻的正常值、平均值等填充,但是金融數(shù)據(jù)整體數(shù)據(jù)一般波動幅度較大,用平均值填充缺失值或者代替異常值的話非常容易產生較大的誤差,因此我們通常選擇采用前一時刻的正常值來替換比較合適。

(2)數(shù)據(jù)標準化處理:在現(xiàn)實中,即使同種類型的數(shù)據(jù)集所使用的量綱也會不同,因此,一般需要對時間序列進行一定的標準化處理,如果直接利用它們進行一系列的處理和分析,得到的結果將會產生一定程度的偏差,不能體現(xiàn)真正的預測結果甚至產生違背事實的結果。一般時間序列的標準化方法有:線性函數(shù)歸一化處理,Z-Score,反正切函數(shù)轉化,對數(shù)轉化,本文使用的是線性歸一化處理數(shù)據(jù),下面簡單介紹一下線性歸一化處理,計算公式如下:

輸入數(shù)據(jù)為 X=(x1,x2 ...xn),xmin為輸入數(shù)據(jù)的最小值,xmax為輸入數(shù)據(jù)的最大值,通過線性歸一化處理線性函數(shù),使得輸入數(shù)據(jù)在同一個量綱上,有效地減少預測的誤差,提高預測的精確度。

(三)模型參數(shù)的確定

1.隱含層數(shù)的確定

1989 年 Robert Hecht - Nielsen用數(shù)學理論證明了在任何一個閉區(qū)間內的任意一個連續(xù)函數(shù)都可以采用含有一層隱含層的BP神經(jīng)網(wǎng)絡來逼近,即我們可以用一個含有三層隱含層的BP網(wǎng)絡完成任意的m維到n維的映射。因此,本文選定含有一層隱含層的BP神經(jīng)網(wǎng)絡預測模型。

2.隱含層節(jié)點數(shù)的確定(表3)

表3 不同隱含層節(jié)點數(shù)誤差分析

一般來說,對于較為復雜的股價預測問題,BP神經(jīng)網(wǎng)絡預測按照經(jīng)驗公式,隱含層一般含有神經(jīng)元個數(shù)的大致范圍為3-10,然后采用比較法,找到最適合的隱含層結點個數(shù)。實驗結果如表3所示:通常BP神經(jīng)網(wǎng)絡模型的誤差隨著節(jié)點個數(shù)的增加會呈現(xiàn)先減少后增加的趨勢。我們通過比較不同隱含層節(jié)點數(shù)的測試均方誤差,表3表明,在本文的實驗中隱含節(jié)點數(shù)為6時,網(wǎng)絡預測誤差最小。因此,本文確定隱含層節(jié)點數(shù)為6。

四、描述性統(tǒng)計分析

從五糧液收盤價的趨勢圖可以看出(如圖3),五糧液的股價呈現(xiàn)出先下降后上升的趨勢,在2018年到2019年期間,五糧液的股價是逐漸下降的,2019年到2021年改變了以往的趨勢,表現(xiàn)出一路上漲的形態(tài),雖然中間略微波動且下降,從圖中可以直觀地看出,2020年到2021年上漲的速度比上一年還要快。五糧液作為“濃香型”白酒之一,股價的上漲可能與五糧液公司的業(yè)績良好有很大的關系。

圖3 五糧液趨勢圖

根據(jù)圖3、圖4和圖5可以明顯地看出五糧液股票的收盤價時間序列的確出現(xiàn)尖峰厚尾性,對比標準正態(tài)分布,兩段的尾部更厚,也就是極值更多,峰度更高。通過圖6明顯看出五糧液的股票價格收益率序列在樣本區(qū)間內都顯示出一定程度的聚集性和波動性,其中,在2018到2021的三年中波動幅度十分的明顯。

圖4 五糧液收益率分布

圖5 QQ 圖

圖6 收益率波動

五、模型建立及分析

在數(shù)據(jù)規(guī)范化中選擇線性歸一化處理方法對數(shù)據(jù)進行操作,圖7是數(shù)據(jù)處理前的收盤價價格變化走勢,圖8是數(shù)據(jù)處理后的收盤價價格變化趨勢,從圖中可以清晰地看出,基本保持了原始數(shù)據(jù)的走勢規(guī)律,說明歸一化不改變數(shù)據(jù)要表達的原始意義。

圖7 原始數(shù)據(jù)分布

圖8 處理后數(shù)據(jù)分布

進一步,對處理后的數(shù)據(jù)進行變量的篩選,參考相關文獻的變量選擇和相關性分析,最終選出與標簽變量相關度大的變量,選取收盤價為輸出變量即因變量,最高價、最低價、開盤價、前收盤、成交量、總市值為輸入變量即自變量,設置模型的學習率為0.01,對其建立金融時間序列預測的神經(jīng)網(wǎng)絡模型,以探究神經(jīng)網(wǎng)絡預測效果及其模型在金融時間序列的數(shù)據(jù)的可行性。

運用綜合代碼進行十次交叉檢驗,記錄每一次模型的均方誤差,并計算其均值,由表4、圖9可知,模型的均方誤差是 0.0202。由箱線圖可知,只有一個異常值,其余的值都在0到0.045之間。

表4 多次運行誤差分析

圖9 均方誤差箱線圖

通過實證分析結果可以發(fā)現(xiàn),其預測結果如圖,對于處理后的數(shù)據(jù),從圖10訓練集預測效果圖可以看出,神經(jīng)網(wǎng)絡模型在訓練集表現(xiàn)出較好的預測效果,而在驗證集上,神經(jīng)網(wǎng)絡模型在短期內的股票預測較為準確,但是從圖11可以看出,長期的擬合效果有點差,測試誤差均在0周圍波動。(圖12、圖13)

圖10 訓練集預測效果

圖11 訓練集誤差

圖12 測試集預測效果

圖13 測試集誤差

六、結論與不足

本文綜合考慮造成股市市場變化的各個方面因素,從成交量、總市值、股票價格等方面選取了11個評價指標,然后我們通過相關關系方法減少評價指標的個數(shù),找到了6個主要影響股市市場的評價指標。以此建立基于BP神經(jīng)網(wǎng)絡的股價預測綜合模型。

一般短期股價的波動隱藏著非線性的映射關系,BP神經(jīng)網(wǎng)絡相比其他算法有著很強的非線性映射能力,所以它可以完美地解決非線性映射關系,并且它擁有十分強大的自主學習能力。

因此,BP神經(jīng)網(wǎng)絡可以實現(xiàn)對短期股票收盤價比較精準的預測。我們由圖12所得出的結果也可以驗證這一點,在短期時間內對股票的預測還是十分精準的。但BP神經(jīng)網(wǎng)絡也存在一定的缺點,如果我們想要對股票做一個長期預測,最好不要采用BP神經(jīng)網(wǎng)絡,因為它得到的結果并不是很理想,如圖12、圖13所顯示的結果。所以我們在現(xiàn)實生活中進行股票投資的時候,可以用BP神經(jīng)網(wǎng)絡模型對股價進行預測,給自己提供一個短期時間內股票走勢參考。如果想要利用BP神經(jīng)網(wǎng)絡對股票進行一個長期的投資預測,我們首先要對其算法原理存在的缺陷進行一定的改進,現(xiàn)在已經(jīng)出現(xiàn)了很多改進后的方案,在這里就不細說。

猜你喜歡
人工神經(jīng)網(wǎng)絡股價神經(jīng)網(wǎng)絡
?十不該(股市)
理財周刊(2023年11期)2023-11-08 00:37:19
利用人工神經(jīng)網(wǎng)絡快速計算木星系磁坐標
神經(jīng)網(wǎng)絡抑制無線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
盤中股價升跌引起持股者情緒變化
人工神經(jīng)網(wǎng)絡實現(xiàn)簡單字母的識別
電子制作(2019年10期)2019-06-17 11:45:10
股價創(chuàng)股災以來新低的股票
基于神經(jīng)網(wǎng)絡的拉矯機控制模型建立
重型機械(2016年1期)2016-03-01 03:42:04
復數(shù)神經(jīng)網(wǎng)絡在基于WiFi的室內LBS應用
基于支持向量機回歸和RBF神經(jīng)網(wǎng)絡的PID整定
基于聲發(fā)射和人工神經(jīng)網(wǎng)絡的混凝土損傷程度識別
肇源县| 彭州市| 大厂| 武乡县| 扎兰屯市| 类乌齐县| 宁阳县| 庄浪县| 阳曲县| 招远市| 黄平县| 通渭县| 同江市| 芜湖县| 丰顺县| 砚山县| 阿克苏市| 曲周县| 磴口县| 赤峰市| 鲜城| 四子王旗| 南郑县| 若尔盖县| 宁化县| 哈密市| 阳朔县| 崇礼县| 安阳市| 托克逊县| 汕头市| 阿合奇县| 鹤壁市| 互助| 松原市| 隆回县| 贡觉县| 兴义市| 临桂县| 开化县| 昌黎县|