国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

構(gòu)建多層循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對金融指標(biāo)數(shù)據(jù)的驗證分析

2021-03-24 03:26:22劉超云謝瑋
關(guān)鍵詞:時刻向量神經(jīng)網(wǎng)絡(luò)

劉超云 謝瑋

(1.中國聯(lián)合網(wǎng)絡(luò)通信有限公司廣西分公司,廣西南寧 530022;2.廣西財經(jīng)學(xué)院,廣西南寧 530022)

1 傳統(tǒng)的金融分析機(jī)器學(xué)習(xí)方法

在金融數(shù)據(jù)分析領(lǐng)域(股票、期貨),我們最常用的指標(biāo)有MA、RSI、MACD等,預(yù)測分析用機(jī)器學(xué)習(xí)方法常用的有線性回歸計算、SVM支持向量機(jī),樸素貝葉斯和隨機(jī)森林(決策樹)算法等。這些傳統(tǒng)的機(jī)器學(xué)習(xí)算法大多都是回歸算法的衍生,對過去時刻的數(shù)據(jù)的特征學(xué)習(xí)缺乏連續(xù)性記憶[1]。

還有一個常用于預(yù)測的馬爾科夫模型(Markov models),其最基本的模型就是馬爾科夫鏈,就是用來確定一系列時間序列狀態(tài)之間的關(guān)系[2],預(yù)測狀態(tài)輸出則由當(dāng)前狀態(tài)矩陣(各狀態(tài)的概率矩陣)與狀態(tài)之間的概率對稱矩陣進(jìn)行乘積;

Pn(t-1)為時刻t-1的第n個狀態(tài)單元發(fā)生概率,Pn(t)為時刻t的第n個狀態(tài)單元發(fā)生概率,而[P1(t)…Pn(t)]則為各個狀態(tài)的概率向量(矩陣),最后可以算出哪個狀態(tài)單元發(fā)生的概率最大。

但是馬爾科夫鏈預(yù)測的狀態(tài)輸出只和上一時刻狀態(tài)的概率矩陣有關(guān)系,和過去其他時刻的狀態(tài)分布無關(guān),其并不依賴過去其他時刻的狀態(tài),有一定的局限性。

2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

自循環(huán)神經(jīng)網(wǎng)絡(luò)Recurrent Neuralnetwork被提出以來,作為機(jī)器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)一種,已經(jīng)廣泛被人們用于金融、識別和安全等領(lǐng)域。rnn在處理連續(xù)序列數(shù)據(jù)(Sequential Data)的分析上十分有效[3],克服傳統(tǒng)神經(jīng)網(wǎng)絡(luò)對歷史權(quán)值參數(shù)(Hyperparameter)關(guān)聯(lián)性聯(lián)系弱的缺點,對數(shù)據(jù)信息狀態(tài)能夠進(jìn)行記憶。同時,基礎(chǔ)的rnn非常依賴前一時刻的網(wǎng)絡(luò)狀態(tài)(Previous States),在每個時刻(Timestep)都會與前一時刻的網(wǎng)絡(luò)狀態(tài)相關(guān)聯(lián)(一般為輸入向量卷積狀態(tài)向量)通過rnn內(nèi)部結(jié)構(gòu)得出輸出和下一時刻的狀態(tài),以此反復(fù)循環(huán)訓(xùn)練并得出最佳結(jié)果,也可以用到金融分析[4]。

循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)其實是前饋神經(jīng)網(wǎng)絡(luò)的進(jìn)一步延伸,但是其結(jié)構(gòu)并不是單一的循環(huán)結(jié)構(gòu),其只是在輸入和輸出在連續(xù)時間節(jié)點上的循環(huán)(Timestep),同時其輸入并不是最初的輸入值,而是不斷更新的新輸入數(shù)據(jù)。x(t)表示時刻t的輸入數(shù)據(jù),S(t)表示時刻t的網(wǎng)絡(luò)狀態(tài),y(t)表示時刻t的輸出數(shù)據(jù),Wx代表時刻t輸入訓(xùn)練參數(shù)向量(矩陣),Ws代表時刻t網(wǎng)絡(luò)狀態(tài)訓(xùn)練參數(shù)向量(矩陣)。因此根據(jù)rnn的特征,在t時刻的輸出y(t),是受到t-1時刻的輸入x(t-1)影響的,因而有如下公式0:

其中bs為狀態(tài)的偏置量參數(shù)(parameters)。

regress_function是回歸函數(shù),可以是softmax也可以是logistic回歸,Wy是輸出狀態(tài)參數(shù)向量,by為狀態(tài)的偏置量參數(shù)(parameters),y(t)為通過輸入x(t)經(jīng)過網(wǎng)絡(luò)后得出的實際輸出值。

3 金融數(shù)據(jù)前期計算處理

現(xiàn)在有很多的數(shù)據(jù)都有每日的交易量和OHLS基本數(shù)據(jù)如股票、期貨、貨幣指數(shù)等,所以我們選擇基本的股票數(shù)據(jù)即可,這些股票的歷史數(shù)據(jù)可以從各大金融網(wǎng)站接口直接獲取。

在股票數(shù)據(jù)分析里,我們主要對股票的趨勢指數(shù)平滑移動平均線(M AC D)和開盤收盤價進(jìn)行分析。MA CD 我們采用普遍的12日快指數(shù)移動平均線(EMA)減去26日慢指數(shù)移動平均線求得。通過構(gòu)建循環(huán)神經(jīng)網(wǎng)絡(luò)(R N N)分析MACD和其他移動平均線的歷史數(shù)據(jù),預(yù)測每日的開盤和收盤價格[5]。

4 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計

用神經(jīng)網(wǎng)絡(luò)分析預(yù)測股票數(shù)據(jù),以及驗證指標(biāo)和指標(biāo)組合可行性,可以用不同類型的網(wǎng)絡(luò)進(jìn)行分析,如C N N、R N N 等,這里我們主要使用循環(huán)神經(jīng)網(wǎng)絡(luò)R N N 來做我們的金融數(shù)據(jù)分析和驗證。

我們在分析金融數(shù)據(jù)的時候,通常會使用到很多指標(biāo)公式,常用的有M A C D、M A、E M A、W M A、R S I、D IF、A B I、MP中間價指數(shù)等指標(biāo),如何驗證這些指標(biāo)或者指標(biāo)組合在某一個金融數(shù)據(jù)、股票或者期貨適用,我們可以使用神經(jīng)網(wǎng)絡(luò)來驗證。

圖1 多層RNN 單元結(jié)構(gòu)Fig.1 Structure of multilayer RNN unit

在單個循環(huán)神經(jīng)網(wǎng)絡(luò)單元里,我們訓(xùn)練數(shù)據(jù),一般是設(shè)置好rnn單元的狀態(tài)數(shù)量,同時設(shè)置好step每次輸入數(shù)據(jù)數(shù)目,把數(shù)據(jù)分成多維的數(shù)據(jù)序列或者向量矩陣,輸入到神經(jīng)單元里,然后得到一個step數(shù)和狀態(tài)數(shù)的向量序列;拿這個向量序列做預(yù)測或驗證,同時可以與樣本標(biāo)簽結(jié)果進(jìn)行比較或者做回歸計算,并且最小化損失函數(shù),訓(xùn)練出的參數(shù)模型來改進(jìn)預(yù)測結(jié)果。

在本篇我們主要設(shè)計一個多層的rnn單元結(jié)構(gòu),來測試我們的股票指標(biāo)算法組合的可行性。多層的rnn結(jié)構(gòu),我們可以把一個rnn單元cell看做一個神經(jīng)層,多個rnn單元并聯(lián),前一個rnn單元的狀態(tài)輸出為下一個rnn單元的輸入,如圖1,t時刻輸入向量input從一個rnn單元進(jìn)入,經(jīng)過n個單元層,輸出向量o u t p u t,如果數(shù)據(jù)輸入的批量數(shù)batchsize為b和輸出狀態(tài)數(shù)為h,那單次輸出狀態(tài)向量矩陣的維度為3個維度Ot=(b,n,h)。然后我們需要取第n個單元層的狀態(tài)輸出向量作為預(yù)測輸出P,通過轉(zhuǎn)化Ot矩陣到(n,b,h),取第一個維度n的最后一組數(shù)據(jù)作為預(yù)測用的輸出數(shù)據(jù)O’維度為(b,h)。對O’再經(jīng)過一個全鏈接層和加上偏置量,得出預(yù)測值Pt,如下公式。

其中Wt為時刻t 時神經(jīng)層r nn 單元最后一層權(quán)值參數(shù)矩陣,*為矩陣的乘積,為O’的狀態(tài)矩陣,bt為偏置量。

有了以上的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),我們可以把數(shù)據(jù)批量分成b數(shù)量的輸入值input集合{xn}和每個輸入值相對應(yīng)的實際標(biāo)簽值集合{yn},{xn}輸出到網(wǎng)絡(luò),得出狀態(tài)向量輸出{Pt}集合,通過損失函數(shù)(loss function)對預(yù)測值Pt和實際標(biāo)簽值y做比較[6],通過梯度反向計算最小化損失函數(shù)參數(shù)值。

我們可任意選取一個標(biāo)準(zhǔn)普爾500指數(shù)的公司股票數(shù)據(jù)(S&P500),我們在這里選微軟公司的從1986年起的數(shù)據(jù)作為分析對象。我們?yōu)榱蓑炞C指標(biāo)數(shù)據(jù)組合是否適合用來預(yù)測股票結(jié)果,我們用8000組的12天MA、MACD、DIFF和12天RSI的指標(biāo)組合數(shù)據(jù),進(jìn)行10次(Epochs)以上的循環(huán)訓(xùn)練、最后得到預(yù)測值(Predict)和標(biāo)準(zhǔn)化以后每日收盤價格(Close)曲線如圖2。

圖2 預(yù)測價格predict 標(biāo)準(zhǔn)化值與收盤價close 標(biāo)準(zhǔn)化值對比Fig.2 Comparison of predicted normalized value and close normalized value of forecast price

我們對8000個樣本數(shù)據(jù)進(jìn)行訓(xùn)練循環(huán)次數(shù)(Epochs)在10次以上,得到了預(yù)測標(biāo)準(zhǔn)值最后的0.700036接近實際的最后收盤價格標(biāo)準(zhǔn)值0.744255,由此可以看出MA、MACD、DIFF和RSI的指標(biāo)組合對股票還是有比較好的預(yù)測性。

如果我們單純用MACD數(shù)據(jù)做訓(xùn)練輸入,會得到圖3的預(yù)測值曲線,和圖2實際收盤價格曲線有很大的差距,這也符合我們做金融股票數(shù)據(jù)分析時候,使用多個股票指標(biāo)組合來分析,對判斷數(shù)據(jù)走勢準(zhǔn)確度有很大的幫助。

5 總結(jié)

我們通過構(gòu)建多層的循環(huán)神經(jīng)網(wǎng)絡(luò),對金融股票數(shù)據(jù)指標(biāo)算法組合進(jìn)行驗證,可以有效推斷出比較合適的金融分析方法,有助于金融分析工具使用。我們在構(gòu)建循環(huán)神經(jīng)網(wǎng)絡(luò)時使用了多個的神經(jīng)網(wǎng)絡(luò)單元并聯(lián)對神經(jīng)元狀態(tài)信息進(jìn)行多層過濾和篩選,最后輸出預(yù)測結(jié)果去與實際值做對比并得到有效的驗證效果。在數(shù)據(jù)源方面,除了金融股票的數(shù)據(jù)和指標(biāo)數(shù)據(jù),還可以利用公司其它披露的經(jīng)營信息和大盤總趨勢信息進(jìn)行量化作為數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和分析,將能得到更好的效果。

猜你喜歡
時刻向量神經(jīng)網(wǎng)絡(luò)
向量的分解
冬“傲”時刻
捕獵時刻
聚焦“向量與三角”創(chuàng)新題
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
向量垂直在解析幾何中的應(yīng)用
基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
向量五種“變身” 玩轉(zhuǎn)圓錐曲線
復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
街拍的歡樂時刻到來了
和田市| 洞头县| 双柏县| 米脂县| 会泽县| 楚雄市| 宝应县| 温宿县| 乐陵市| 奉贤区| 揭东县| 衡水市| 渭源县| 镶黄旗| 剑阁县| 兴海县| 富裕县| 余姚市| 南充市| 清徐县| 门头沟区| 望都县| 牙克石市| 凤城市| 辽中县| 石林| 皋兰县| 廉江市| 平遥县| 玉龙| 兴山县| 宁夏| 吉首市| 铜山县| 民丰县| 长春市| 珠海市| 疏勒县| 兰坪| 图木舒克市| 肇庆市|