楊進(jìn) 陳亮
摘 要 為了實(shí)現(xiàn)對(duì)股票價(jià)格變化的短期預(yù)測(cè),提出了一種基于小波神經(jīng)網(wǎng)絡(luò)(WNN)與自回歸積分滑動(dòng)平均模型(ARIMA)的組合預(yù)測(cè)模型.將股票的收盤(pán)價(jià)序列數(shù)據(jù)劃分為線(xiàn)性以及非線(xiàn)性(誤差項(xiàng))兩個(gè)部分,分別利用統(tǒng)計(jì)學(xué)中ARIMA模型和小波神經(jīng)網(wǎng)絡(luò)分別對(duì)兩部分?jǐn)?shù)據(jù)進(jìn)行預(yù)測(cè)并得到結(jié)果,將兩部分結(jié)果組合相加合成為整個(gè)股票價(jià)格的預(yù)測(cè)結(jié)果.實(shí)驗(yàn)結(jié)果表明該組合模型在預(yù)測(cè)精度方面有提高,是一種比較有效的預(yù)測(cè)模型.
關(guān)鍵詞 應(yīng)用數(shù)學(xué);組合預(yù)測(cè)股票價(jià)格;ARIMA模型;小波神經(jīng)網(wǎng)絡(luò)
中圖分類(lèi)號(hào) TP301.6 文獻(xiàn)標(biāo)識(shí)碼 A
Abstract To realize the prediction capacity of short-term stock price, an integrated prediction model is proposed based on Wavelet Neural Network (WNN) and ARIMA. The stock price data is firstly divided into linear parts and nonlinear parts. On this basis, ARIMA model is used to predict the linear parts and get the first result. WNN model is used to predict the nonlinear parts and get another result. Finally, the final prediction result of the stock price is obtained by adding the two partial results. The final prediction result is better than those obtained by other neural networks, which verifies the feasibility and effectiveness of the proposed model of predicting stock price.
Key words applied mathematics; combination forecast for stock price; ARIMA model; wavelet neural network
1 引 言
股票投資市場(chǎng)是一種風(fēng)險(xiǎn)與收益共存的金融場(chǎng)所,對(duì)于決策者來(lái)說(shuō),若能獲得更加精確的預(yù)測(cè),就能更有效的規(guī)避未來(lái)的風(fēng)險(xiǎn).對(duì)于監(jiān)管機(jī)構(gòu)來(lái)說(shuō),獲得準(zhǔn)確的股票走勢(shì),能有效加強(qiáng)對(duì)股票市場(chǎng)的把控.
股票價(jià)格預(yù)測(cè)是對(duì)股票市場(chǎng)這個(gè)非線(xiàn)性系統(tǒng)進(jìn)行量化分析并預(yù)測(cè)的一個(gè)過(guò)程,而這一過(guò)程最早興起于投資活躍的國(guó)外資本市場(chǎng).隨著傳統(tǒng)理論與技術(shù)的發(fā)展進(jìn)入瓶頸期,想利用單一模型進(jìn)行高精度預(yù)測(cè)閉住你的愈發(fā)困難,在此情況下,組合預(yù)測(cè)則逐漸開(kāi)始得到發(fā)展.總體而言,目前國(guó)內(nèi)外關(guān)于股票預(yù)測(cè)的研究方向現(xiàn)在多往組合模型方向發(fā)展,研究的形式也多樣化,也取得了很多成果,但是大量證券報(bào)告表明現(xiàn)存股票預(yù)測(cè)模型在實(shí)際應(yīng)用中依然存在精確度低、測(cè)試集數(shù)量大、只能適應(yīng)部分股票等.這些問(wèn)題表明股票預(yù)測(cè)的研究依然還處于探索階段.
關(guān)于股票預(yù)測(cè)的現(xiàn)有研究中,除了經(jīng)典的基于傳統(tǒng)統(tǒng)計(jì)方法,如時(shí)間序列分析、擬合、回歸等,一些智能算法也應(yīng)用于股票預(yù)測(cè)或相似的案例當(dāng)中.如蔡紅(2011)等[1]提出PCA-BP神經(jīng)網(wǎng)絡(luò)模型,模型對(duì)股票序列進(jìn)行主成分分析,降低輸入維數(shù)從而加快網(wǎng)絡(luò)預(yù)測(cè)速度并提升預(yù)測(cè)精度.李松(2012)等[2]提出粒子群算法—BP神經(jīng)網(wǎng)絡(luò)模型,模型通過(guò)引入自適應(yīng)變異算子對(duì)陷入局部最優(yōu)的粒子進(jìn)行變異,從而提升了全局最優(yōu)預(yù)測(cè)值的尋找性能.李玉(2017)等[3]提出LM遺傳神經(jīng)網(wǎng)絡(luò)模型,模型通過(guò)LM算法改進(jìn)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中的梯度下降算法并利用遺傳算法來(lái)優(yōu)化網(wǎng)絡(luò)中的參數(shù),提高網(wǎng)絡(luò)搜索全局最優(yōu)的能力并提高整體收斂速度來(lái)獲得更加準(zhǔn)確的股價(jià)預(yù)測(cè)值.
除了上述方法之外,隨著機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的大范圍應(yīng)用,相對(duì)應(yīng)的各種方法也逐漸開(kāi)始應(yīng)用到股票預(yù)測(cè)中.如Gorenc Novak(2016)[4]提出基于SVM分類(lèi)器為基礎(chǔ)的模型,模型將目標(biāo)集中在少數(shù)特定波動(dòng)性較低的數(shù)據(jù)集,并利用這種分類(lèi)器方法訓(xùn)練模型來(lái)提升最終的股價(jià)預(yù)測(cè)精度.除了利用常規(guī)分類(lèi)器方法之外,Gao Tingwei(2016)[5]等提出一種深度信念網(wǎng)絡(luò)(DBNs)模型,模型充分考慮股市的噪聲環(huán)境,綜合利用股票技術(shù)指標(biāo)以及二維主成分分析來(lái)得到最終的股價(jià)預(yù)測(cè)結(jié)果.Chuan-xiang(2012)等[6]提出一種基于遺傳算法與BP神經(jīng)網(wǎng)絡(luò)的結(jié)合模型,模型充分考慮多種類(lèi)型數(shù)據(jù),利用小生境遺傳算法原理來(lái)優(yōu)化BP網(wǎng)絡(luò)并得到最終的股票預(yù)測(cè)值.除了分析常規(guī)的數(shù)據(jù)之外,V Rajput(2016)等[7]提出一種基于情感挖掘以及機(jī)器學(xué)習(xí)算法的模型,模型充分考慮到個(gè)人思想與情感,并利用聚類(lèi)算法充分挖掘數(shù)據(jù)隱藏信息來(lái)訓(xùn)練得到最終的預(yù)測(cè)模型.
在股票預(yù)測(cè)中,除了改進(jìn)算法之外,同時(shí)還需要考慮預(yù)測(cè)誤差方差的計(jì)算中常見(jiàn)但關(guān)鍵的錯(cuò)誤[8]以及可能會(huì)影響股價(jià)波動(dòng)的其他各種經(jīng)濟(jì)指標(biāo)等[9],并提供對(duì)后果的估計(jì)方案.充分考慮前文的各種預(yù)測(cè)方法,結(jié)合現(xiàn)有數(shù)據(jù)來(lái)源以及研究方向,這里提出采用傳統(tǒng)統(tǒng)計(jì)學(xué)模型—差分自回歸滑動(dòng)平均模型(ARIMA)和小波神經(jīng)網(wǎng)絡(luò)(WNN)兩種模型來(lái)構(gòu)建組合模型,分別對(duì)股票收盤(pán)價(jià)格的線(xiàn)性部分和非線(xiàn)性部分(誤差項(xiàng))進(jìn)行預(yù)測(cè),最終兩部分結(jié)果相加組合得到未來(lái)一周的準(zhǔn)確預(yù)測(cè)值.
2 ARIMA及改進(jìn)型小波神經(jīng)網(wǎng)絡(luò)模型基礎(chǔ)
2.1 ARIMA模型[10]
2.1.1 ARIMA基本理論
ARIMA是在自回歸滑動(dòng)平均模型(ARMA)的基礎(chǔ)上發(fā)展而來(lái).在該模型當(dāng)中,首先對(duì)非平穩(wěn)的時(shí)間序列數(shù)據(jù)進(jìn)行多次查分運(yùn)算使得原始數(shù)據(jù)成為平穩(wěn)時(shí)間序列(這里用參數(shù)d來(lái)表示差分次數(shù)),接著對(duì)處理后的數(shù)據(jù)進(jìn)行運(yùn)算來(lái)建立參數(shù)為p,q的ARMA模型,最后通過(guò)反變換來(lái)實(shí)現(xiàn)原來(lái)的非平穩(wěn)時(shí)間序列.其中參數(shù)為p,d,q的ARIMA模型的預(yù)測(cè)方程為:
2.2.2 小波神經(jīng)網(wǎng)絡(luò)基本算法步驟
(1) 首先初始化學(xué)習(xí)速率,伸縮因子,平移因子以及網(wǎng)絡(luò)權(quán)值.
(2) 分析數(shù)據(jù):計(jì)算ARIMA模型的擬合值與原始值之間的誤差項(xiàng)序列記為E.
(3) 預(yù)測(cè)輸出:輸入訓(xùn)練樣本E,獲得預(yù)測(cè)輸出,計(jì)算預(yù)測(cè)輸出與期望輸出之間的誤差.
(4) 權(quán)值修正:通過(guò)上文構(gòu)造的誤差函數(shù)與修正公式修正網(wǎng)絡(luò)權(quán)值與網(wǎng)絡(luò)參數(shù),逐步減小誤差.
(5) 設(shè)置一定的閾值判斷程序是否結(jié)束,若沒(méi)有,則返回步驟(3)繼續(xù)循環(huán)計(jì)算.
3 ARIMA及改進(jìn)型小波神經(jīng)網(wǎng)絡(luò)
組合預(yù)測(cè)模型
股票這種時(shí)間序列數(shù)據(jù)既有線(xiàn)性特征又有非線(xiàn)性特征,因此僅靠單一的傳統(tǒng)統(tǒng)計(jì)學(xué)方法和機(jī)器學(xué)習(xí)都很難完整的反映出其內(nèi)在的線(xiàn)性與非線(xiàn)性特征.因此分別采用ARIMA與WNN對(duì)股票數(shù)據(jù)的線(xiàn)性部分以及非線(xiàn)性部分進(jìn)行預(yù)測(cè),得到線(xiàn)性部分與非線(xiàn)性部分的兩部分預(yù)測(cè)值,最終將兩部分預(yù)測(cè)值分別對(duì)應(yīng)相加從而得到最終的預(yù)測(cè)值,通過(guò)這種組合預(yù)測(cè)可以提升最終股票預(yù)測(cè)的精度.
為了解決傳統(tǒng)股票預(yù)測(cè)中需要大量測(cè)試集數(shù)據(jù)的弊端,在后續(xù)步驟中提出了一種新的測(cè)試集處理方法.在該方法中,首先通過(guò)將測(cè)試集數(shù)據(jù)代入系統(tǒng)中進(jìn)行循環(huán)計(jì)算,得到初步的權(quán)值矩陣,接下來(lái)又將該權(quán)值矩陣作為初始矩陣帶入網(wǎng)絡(luò)結(jié)構(gòu)中,進(jìn)行測(cè)試集數(shù)據(jù)的循環(huán)計(jì)算,從而通過(guò)這種大規(guī)模循環(huán)計(jì)算少量測(cè)試集來(lái)達(dá)到需要大量測(cè)試集的效果.
通過(guò)表5的數(shù)據(jù)可以看出,原始的ARIMA與WNN模型所得的誤差在組合模型的兩倍以上,另外單獨(dú)參考的NN模型誤差也大大超過(guò)本文提出的組合模型的誤差.同時(shí)將該模型結(jié)果與其他相關(guān)文獻(xiàn)的研究結(jié)果進(jìn)行對(duì)比,剔除數(shù)據(jù)相異等因素外,本文所得誤差大小均在合理區(qū)間之內(nèi).根據(jù)以上分析,可以認(rèn)定該組合模型的效果良好.
4 結(jié) 論
通過(guò)將小波神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)的統(tǒng)計(jì)學(xué)ARIMA模型應(yīng)用到股票價(jià)格的短期預(yù)測(cè)中,利用小波神經(jīng)網(wǎng)絡(luò)的非線(xiàn)性擬合上的強(qiáng)大功能并結(jié)合ARIMA在時(shí)間序列數(shù)據(jù)上的優(yōu)勢(shì),提出一種在短期股票預(yù)測(cè)中較為準(zhǔn)確地方法,在實(shí)際場(chǎng)景中具有重要作用,為統(tǒng)籌股票市場(chǎng)具有一定的指導(dǎo)性作用.
通過(guò)對(duì)民生銀行的股價(jià)驗(yàn)證結(jié)果表明了WNN與ARIMA結(jié)合模型在短期股票預(yù)測(cè)中的有效性,可以較準(zhǔn)確的進(jìn)行未來(lái)的短期預(yù)測(cè).股票價(jià)格通常受變化受很多因素的影響,而由于市場(chǎng)因素以及政策具有一定穩(wěn)定性,所以股票數(shù)據(jù)內(nèi)部既存在規(guī)律數(shù)據(jù)又存在不規(guī)律性數(shù)據(jù),如果能準(zhǔn)確的將這兩部分?jǐn)?shù)據(jù)分別開(kāi)來(lái),則股票數(shù)據(jù)中的多種復(fù)雜規(guī)律可以更加容易預(yù)測(cè).
將股票數(shù)據(jù)這種沒(méi)有明顯規(guī)律的復(fù)雜時(shí)間序列進(jìn)行數(shù)據(jù)劃分,進(jìn)而將其內(nèi)部隱藏規(guī)律逐漸挖掘出來(lái),最終達(dá)到對(duì)股票數(shù)據(jù)短期價(jià)格進(jìn)行預(yù)測(cè)的目的.在該方向進(jìn)一步的工作是考慮對(duì)數(shù)據(jù)的進(jìn)一步劃分,并考慮隨機(jī)因素及市場(chǎng)因素的的影響,進(jìn)而提高預(yù)測(cè)的整體精確度.
參考文獻(xiàn)
[1] 蔡紅,陳榮耀. 基于PCA-BP神經(jīng)網(wǎng)絡(luò)的股票價(jià)格預(yù)測(cè)研究[J].計(jì)算機(jī)仿真,2011,28(3):365-368.
[2] 李松,劉力軍,翟曼.改進(jìn)粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的短時(shí)交通流預(yù)測(cè)[J].系統(tǒng)工程理論與實(shí)踐,2012,32(9):2045-2049.
[3] 郭建峰,李玉,安東.基于LM遺傳神經(jīng)網(wǎng)絡(luò)的短期股價(jià)預(yù)測(cè)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2017,27(1):152-159.
[4] Gorenc Novak, Marija1,2,Veluek, Dejan2,3. Prediction of stock price movement based on daily high prices [J]. Quantitative Finance.2016,16(5):793-826.
[5] Gao Tingwei,Li Xiu,Chai, Yueting,Tang, Youhua. Deep learning with stock indicators and two-dimensional principal component analysis for closing price prediction system [C]. proceedings of 2016 IEEE 7th international conference on software engineering and service science(ICSESS 2016).2016:166-169.
[6] Chuan-xiang Ren,Cheng-bao Wang. The prediction of short-term traffic flow based on the niche genetic algorithm and BP neural network [J].Proceedings of the 2012 International Conference on Information Technology and Software Engineering 2012(211):775-781.
[7] V Rajput,S Bobde. Stock market prediction using hybrid approach [J]. International Conference on Computing, Communication and Automation. india: IEEE, 2016:82-86.
[8] Steve Morlidge,Aris Syntetos. Recoupling the forecasting and stock-control processes [J].Foresight: The International Journal of Applied Forecasting.2017(44):9-19.
[9] Anthony Joseph,Maurice Larrain,Claude Turner. Daily stock returns characteristics and forecastability [J].Procidia computer science.2017(114):481-490.
[10]王燕.應(yīng)用實(shí)踐序列分析[M].北京:中國(guó)人民大學(xué)出版社,2016.