国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于CNN-LSTM的股票中長期趨勢預測

2020-06-10 07:41:00宋睿
電子技術與軟件工程 2020年4期
關鍵詞:特征提取排序股票

宋睿

(上海海事大學信息工程學院 上海市 201306)

1 引言

曾安提出使用LSTM網(wǎng)絡對股票進行短期價格擬合,但預測周期的變長使效果極具變差[1],Kim使用CNN對股票數(shù)據(jù)生成圖片進行特征提取[2],但是無法有效的提取股票結構特征。黃志輝研究了CNN不同結構對股票短期擬合的影響[3],發(fā)現(xiàn)小卷積核深層網(wǎng)絡具有更好的效果,但對稍長周期效果較差,本文提出基于CNNLSTM的股票長期趨勢預測算法,同時利用CNN和LSTM網(wǎng)絡的對結構和時序特征提取的優(yōu)勢,對股票中長期趨勢進行分類預測,并可以由分類評分依照歷史樣本反推新股票樣本的預期漲跌幅和趨勢。

2 基于CNN-LSTM的股票中長期趨勢預測

2.1 特征提取

現(xiàn)有的股票數(shù)據(jù)的特征提取大多只使用簡單的收盤價和MACD指標。這種特征提取方法沒有考慮到特征的特點。本文為完成股票中長期趨勢預測任務,根據(jù)文獻和市場經(jīng)驗,選擇價格、成交量、乖離率[4]、波動率[5]四大類指標并結合MACD計算方法對四大類指標進行長期趨勢特征提取。特征提取流程圖如圖1所示。

2.2 CNN-LSTM趨勢分類網(wǎng)絡

本文提出的CNN-LSTM股票分類網(wǎng)絡模型是基于CNN和LSTM網(wǎng)絡構建的分類網(wǎng)絡。CNN網(wǎng)絡具有較好的空間具有局部視野和共享權值的特點。股價數(shù)據(jù)的局部形態(tài)特征符合局部視野和權值共享的思想因此CNN網(wǎng)絡可以提取單一LSTM網(wǎng)絡無法提取的股價形態(tài)等高度抽象的特征;股票數(shù)據(jù)是金融時間序列。LSTM網(wǎng)絡具有時序信息保留和長期記憶的能力,對于超長時間跨度的股票數(shù)據(jù)在經(jīng)過CNN處理后,時間序列變短,將CNN網(wǎng)絡的輸出作為LSTM網(wǎng)絡的輸入可以同時發(fā)揮CNN和LSTM的優(yōu)勢。softmax對多分類問題具有優(yōu)異表現(xiàn)的特性,使用 softmax分類器對股票漲跌幅進行分類預測,不同的分類結果對應不同的漲跌形態(tài)。網(wǎng)絡結構圖如圖2所示。

3 實驗

3.1 實驗設計

本文將提取2.1中提到的全部特征,應用2.2中的CNN-LSTM網(wǎng)絡,并采用平均池化的方法進行模型訓練。最后對實驗結果進行分析。

3.2 評價體系

圖1:特征提取流程圖

圖2:CNN-LSTM股票分類網(wǎng)絡結構圖

本文選取分類準確率CA(Classification Accuracy)、平均絕對誤差MAE(Mean Absolute Error)、0.96MR(Mean Ratio評分大于0.96的樣本比例)、DM(最大回撤率Drawdown Max)以及MRR(Mean Rate Of Return平均收益率)來定量的評價CNN-LSTM網(wǎng)絡模型的預測性能

分類準確率CA:

平均絕對誤差MAE:

MMR(其中rise代表分類評分大于0.96樣本的真實漲跌幅):

表1:模型訓練過程及正確率

表2:不同排序的指標分析

表3:回推驗證結果分析表

4 實驗結果分析

依照模型流程將訓練集數(shù)據(jù)輸入神經(jīng)網(wǎng)絡訓練,結果如表1:在60個epoch時模型達到最大測試集正確率86.5%。

本文將測試集樣本交由神經(jīng)網(wǎng)絡進行分類打分。按照上漲評分,下跌評分,橫盤震蕩評分對訓練樣本數(shù)據(jù)進行排序,并計算每樣本的真實漲跌幅。上漲、下跌、震蕩展示圖如圖3至圖5所示: 黃線:評分;粗黑線:真實漲跌幅均線;藍點:樣本點;中間細黑線:漲幅為0。

觀察上漲下跌評分排序展示圖和下跌評分排序展示圖,分類評分與股票漲跌具有極強的相關性。如表2所示。

本文將評分大于0.96的股價樣本提取出來,按照時間順序與深證成指相對應,結果如表3所示。表格說明,高評分個股的比例對市場環(huán)境也有極強的表現(xiàn)能力。

圖3:上漲評分排序展示圖

圖4:下跌評分排序展示圖

圖5:震蕩評分排序展示圖

5 總結

基于CNN-LSTM的股票長期趨勢預測算法可以較為準確地預測到股價中期的漲跌趨勢情況,并且利用高上漲評分的股票占比可以較好地估計此時市場環(huán)境的好壞和牛熊市運行階段,可以很好為中長線投資者提供參考。本文提出的CNN-LSTM模型對于輸入數(shù)據(jù)數(shù)量有較高要求,無法涵蓋交易日小于850日(特征抽取會剔除250個交易日的數(shù)據(jù))的新股,同時不能預測短期趨勢,無法滿足短線投資者的需求。本文會繼續(xù)改進算法,嘗試對短期趨勢和漲跌幅進行預測。

猜你喜歡
特征提取排序股票
排序不等式
恐怖排序
節(jié)日排序
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
刻舟求劍
兒童繪本(2018年5期)2018-04-12 16:45:32
Bagging RCSP腦電特征提取算法
本周創(chuàng)出今年以來新高的股票
本周創(chuàng)出今年以來新高的股票
本周連續(xù)上漲3天以上的股票
近期連續(xù)漲、跌3天以上的股票
南宁市| 天峨县| 特克斯县| 公安县| 通海县| 武安市| 阳江市| 门头沟区| 周至县| 渝北区| 上饶市| 新巴尔虎右旗| 新竹市| 马尔康县| 右玉县| 鹤山市| 香港| 望奎县| 临夏县| 姜堰市| 射阳县| 灵璧县| 海丰县| 鹤峰县| 大足县| 宜州市| 汶上县| 绩溪县| 新河县| 哈密市| 吉木乃县| 双柏县| 崇左市| 抚远县| 陕西省| 永吉县| 峨眉山市| 晋州市| 潢川县| 北宁市| 安达市|