姚金海
(中共江西省委黨校 經(jīng)濟(jì)學(xué)教研部,江西 南昌 330108)
投資者基于股票價(jià)格波動(dòng)的正確把握所帶來的價(jià)差收益,是除股息分紅之外的另一重要收益來源。對(duì)于二級(jí)市場(chǎng)投資者而言,基于合理假設(shè)準(zhǔn)確預(yù)測(cè)股票價(jià)格未來波動(dòng)趨勢(shì)事關(guān)收益高低甚至投資成敗。但在充滿不確定性的股票市場(chǎng)中,投資者行為會(huì)受到個(gè)體心理特征、風(fēng)險(xiǎn)偏好、學(xué)識(shí)素養(yǎng)等內(nèi)部因素和宏觀經(jīng)濟(jì)、行業(yè)發(fā)展、公司質(zhì)量等外部因素的綜合影響。因此,投資者基于價(jià)格預(yù)測(cè)進(jìn)行證券投資的過程本身就是一場(chǎng)風(fēng)險(xiǎn)之旅。
最早由Markowitz發(fā)展起來的均值—方差模型為靜態(tài)資產(chǎn)組合選擇問題提供了一個(gè)理論分析框架,但該模型以資產(chǎn)的歷史收益代表預(yù)期收益,以歷史資產(chǎn)收益的協(xié)方差代表資產(chǎn)風(fēng)險(xiǎn)和相關(guān)性,在風(fēng)險(xiǎn)資產(chǎn)價(jià)格寬幅波動(dòng)的情況下,必然導(dǎo)致建模所需的未來實(shí)際協(xié)方差矩陣與作為假設(shè)參數(shù)的歷史協(xié)方差矩陣之間產(chǎn)生較大偏差。股票資產(chǎn)就是這樣一種具有波動(dòng)性、混沌性和復(fù)雜性特征的風(fēng)險(xiǎn)資產(chǎn)。行為金融學(xué)相關(guān)研究表明,在股票市場(chǎng)上升行情和下跌行情中,基于回報(bào)率衡量的資產(chǎn)相關(guān)性有明顯差別,且這種非對(duì)稱相關(guān)效應(yīng)在不同市場(chǎng)、不同行業(yè)、不同資產(chǎn)類別間均顯著存在[1]。
基于科學(xué)方法和技術(shù)對(duì)股票價(jià)格進(jìn)行合理預(yù)測(cè),并在重構(gòu)預(yù)期資產(chǎn)收益率協(xié)方差矩陣的基礎(chǔ)上,動(dòng)態(tài)調(diào)整投資組合中各類資產(chǎn)的配置權(quán)重,對(duì)于投資組合績(jī)效具有決定性作用。隨著數(shù)據(jù)挖掘、智能算法等技術(shù)的迅猛發(fā)展,投資者對(duì)股價(jià)進(jìn)行合理預(yù)測(cè),并據(jù)此對(duì)投資組合實(shí)施積極管理具有一定可行性。本文基于ARIMA與信息粒化SVR組合預(yù)測(cè)技術(shù),構(gòu)建時(shí)間序列組合預(yù)測(cè)模型,對(duì)股價(jià)指數(shù)進(jìn)行預(yù)測(cè),力求捕捉股價(jià)指數(shù)的變化趨勢(shì)與波動(dòng)區(qū)間,從而為養(yǎng)老基金等機(jī)構(gòu)投資者實(shí)施積極投資和動(dòng)態(tài)管理提供支持。
股票價(jià)格或者股價(jià)指數(shù)是否可預(yù)測(cè)?據(jù)此進(jìn)行擇時(shí)交易是否可能?20世紀(jì)80年代行為金融理論興起之前以有效市場(chǎng)假說為代表的正統(tǒng)金融理論通常認(rèn)為,市場(chǎng)價(jià)格會(huì)完全反映時(shí)效信息,根本不可能存在產(chǎn)生超額收益的資產(chǎn)價(jià)格預(yù)測(cè)模式[2],擇時(shí)交易獲取超額收益幾乎是不可能實(shí)現(xiàn)的目標(biāo)[3]。有效市場(chǎng)理論學(xué)派所立基的三道防線“理性投資者、非理性投資者的隨機(jī)交易會(huì)使得錯(cuò)誤相互抵消和完美套利”[4]一直飽受詬病并不斷受到實(shí)證檢驗(yàn)的挑戰(zhàn)?,F(xiàn)實(shí)中,非財(cái)富最大化預(yù)期、啟發(fā)式偏見和定式心理誤會(huì)等因素導(dǎo)致的投資者行為偏差具有普遍性和系統(tǒng)性。投資者經(jīng)常而不是偶然以同樣的方式偏離理性,他們的錯(cuò)誤不但不會(huì)相互抵消反而會(huì)循環(huán)放大。這使得有效市場(chǎng)理論“非理性投資者的隨機(jī)交易會(huì)使得錯(cuò)誤相互抵消”的假設(shè)條件難以成立。對(duì)于有效市場(chǎng)理論基于一價(jià)定律的無風(fēng)險(xiǎn)套利的實(shí)證檢驗(yàn)表明,因?yàn)橥顿Y者成熟度、信息透明度、套利風(fēng)險(xiǎn)及套利成本等局限性因素的存在,套利往往是有限的,并不能在短期內(nèi)糾正非理性投資者造成的價(jià)格偏差[5]。然而,正統(tǒng)觀點(diǎn)一旦形成往往會(huì)變得根深蒂固,甚至逐漸固化為學(xué)術(shù)教條而難以被沖破。過去幾十年間,來自外部尤其是行為金融學(xué)的挑戰(zhàn)雖然有力地沖擊了有效市場(chǎng)假說的三道防線,但是對(duì)于現(xiàn)代金融學(xué)理論將有效市場(chǎng)界定為“不可預(yù)測(cè)、不可戰(zhàn)勝的市場(chǎng)”這一假設(shè)和檢驗(yàn)邏輯的實(shí)證批判卻很乏力。這種有效市場(chǎng)的界定和檢驗(yàn)邏輯成為以Fama為代表的現(xiàn)代金融理論學(xué)派捍衛(wèi)有效市場(chǎng)理論的強(qiáng)大武器,從CAPM到Fama-French三因子模型,再到Carhart四因子模型,以及后來發(fā)展的五因子模型都以這種實(shí)證檢驗(yàn)為手段,通過證明市場(chǎng)“不可預(yù)測(cè)、不可戰(zhàn)勝”,進(jìn)而認(rèn)定市場(chǎng)是有效的[6]。然而,股價(jià)不可預(yù)測(cè)、市場(chǎng)難以戰(zhàn)勝并不必然意味著市場(chǎng)是完全有效的。有學(xué)者對(duì)“不可預(yù)測(cè)、不可戰(zhàn)勝”與完全有效市場(chǎng)之間的關(guān)聯(lián)性和一致性提出了質(zhì)疑。日歷異象、賭徒謬誤、反應(yīng)過度等諸多無法被有效市場(chǎng)理論和檢驗(yàn)所解釋的市場(chǎng)“異象”的出現(xiàn),成為行為金融學(xué)質(zhì)疑和批判有效市場(chǎng)理論正確性及其檢驗(yàn)合理性的有力武器[7]。從Barberis和Thaler提出“可預(yù)測(cè)性之謎”以來,關(guān)于股票收益可預(yù)測(cè)性的研究一直是過去30多年間金融經(jīng)濟(jì)學(xué)研究的焦點(diǎn),并產(chǎn)生了大量的研究成果。雖然早期有效市場(chǎng)理論學(xué)派的實(shí)證研究沒有發(fā)現(xiàn)機(jī)構(gòu)投資者存在顯著的擇時(shí)能力,但是許多變量能預(yù)測(cè)股票收益率這一有效市場(chǎng)理論所難以解釋的市場(chǎng)異象越來越多地得到行為金融學(xué)派的實(shí)證檢驗(yàn)支持[8]?,F(xiàn)實(shí)中,巴菲特、索羅斯和西蒙斯等優(yōu)秀的投資者在數(shù)十年的較長(zhǎng)時(shí)期內(nèi)獲得了較大的超額收益,表現(xiàn)出較強(qiáng)的擇時(shí)能力也已是不爭(zhēng)的事實(shí)。隨著計(jì)算機(jī)技術(shù)和大數(shù)據(jù)、人工智能的發(fā)展,數(shù)據(jù)挖掘在量化投資中的應(yīng)用日益廣泛而深入,市場(chǎng)擇時(shí)也逐漸具備技術(shù)基礎(chǔ)。
通過合適的技術(shù)方法來預(yù)測(cè)股票價(jià)格或者股價(jià)指數(shù)的波動(dòng),始終是理論界和實(shí)務(wù)界關(guān)注的焦點(diǎn)問題。為了實(shí)現(xiàn)基于股市價(jià)格波動(dòng)預(yù)測(cè)的擇時(shí)交易并進(jìn)而獲取超額收益的目標(biāo),經(jīng)典的統(tǒng)計(jì)回歸模型、現(xiàn)代的人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)及其他多種智能數(shù)據(jù)挖掘算法均被國(guó)內(nèi)外學(xué)術(shù)界廣泛采用,并在不斷豐富發(fā)展的過程中取得了較為豐碩的成果[9]。Dufour和Stevanovic[10]運(yùn)用VARMA模型對(duì)股票價(jià)格走勢(shì)進(jìn)行了預(yù)測(cè)。董子靜等[11]運(yùn)用SVM方法對(duì)股指期貨與股指現(xiàn)貨之間的關(guān)系開展了研究,并對(duì)股指趨勢(shì)進(jìn)行了預(yù)測(cè)。為克服單一預(yù)測(cè)方法的局限性,也有很多學(xué)者開始嘗試運(yùn)用組合方法進(jìn)行股指預(yù)測(cè)。黃宏運(yùn)等[12]利用具有良好非線性尋優(yōu)能力的遺傳算法對(duì)傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)模型加以優(yōu)化,并運(yùn)用它對(duì)上證指數(shù)進(jìn)行預(yù)測(cè),結(jié)果表明能有效提升收斂速度和預(yù)測(cè)精度。武大碩等[13]基于遺傳算法改進(jìn)LSTM神經(jīng)網(wǎng)絡(luò)模型對(duì)納斯達(dá)克數(shù)據(jù)進(jìn)行預(yù)測(cè)后發(fā)現(xiàn),組合模型較單一模型而言能顯著提升預(yù)測(cè)效度。
股指預(yù)測(cè)尤其是基于組合方法的股指預(yù)測(cè)方法與技術(shù)研究已成為智能信息處理的熱點(diǎn)和前沿領(lǐng)域。學(xué)術(shù)界已取得不少頗具價(jià)值的理論成果,但仍有很多問題亟待解答。股票等風(fēng)險(xiǎn)資產(chǎn)市場(chǎng)價(jià)格波動(dòng)的實(shí)踐表明,其價(jià)格和收益率序列經(jīng)常表現(xiàn)出非線性、混沌性和復(fù)雜性特征,背后的動(dòng)因既可能是宏觀經(jīng)濟(jì)波動(dòng)性外溢,也可能是行業(yè)生命周期變化的沖擊,甚至也可能是投資者情緒波動(dòng)所致。這使得任何單一預(yù)測(cè)模型都可能失效。因而,基于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)發(fā)展起來的智能組合算法可能成為某種替代性選擇。本文基于ARIMA與信息粒化SVR組合預(yù)測(cè)技術(shù)模型,構(gòu)建時(shí)間序列組合預(yù)測(cè)模型,對(duì)股票市場(chǎng)指數(shù)價(jià)格和收益變化進(jìn)行趨勢(shì)預(yù)測(cè),以期得出股價(jià)指數(shù)較為可靠的變化趨勢(shì)與波動(dòng)區(qū)間,從而為投資者的決策優(yōu)化提供有效的理論支撐和實(shí)踐指導(dǎo)。
自回歸積分滑動(dòng)平均模型(ARIMA)由自回歸模型(AR)與滑動(dòng)平均模型(MA)組合而成,是在ARMA模型上通過進(jìn)一步優(yōu)化實(shí)現(xiàn)的,適合于預(yù)測(cè)非平穩(wěn)時(shí)間序列,廣泛應(yīng)用于物理科學(xué)、經(jīng)濟(jì)學(xué)、生物學(xué)等領(lǐng)域隨機(jī)現(xiàn)象的預(yù)測(cè)[14]。該預(yù)測(cè)模型主要通過觀察相關(guān)函數(shù)截尾和拖尾特征自回歸階數(shù)(P)、差分次數(shù)(d)和移動(dòng)平均階數(shù)(q)等參數(shù),進(jìn)而對(duì)非平穩(wěn)時(shí)間序列使用差分法進(jìn)行平穩(wěn)化處理,并在此基礎(chǔ)上進(jìn)行預(yù)測(cè)分析。模型表達(dá)式如下:
(1)
2.2.1 信息粒化建模
L.A.Zadeh教授1979年提出的信息?;谴嬖谟谥T多領(lǐng)域中的現(xiàn)象,它能夠把大量復(fù)雜信息按各自的特征和性能將其劃分成若干較簡(jiǎn)單的塊,而每個(gè)如此劃分出來的塊被看成一個(gè)粒,有利于我們將一個(gè)信息體劃分為多個(gè)部分進(jìn)行分類細(xì)化研究[15]。信息?;念愋蛣澐种饕谢谀:碚?、粗糙集理論和熵空間理論等三種方法,本文采用基于模糊集理論的模糊信息?;椒āD:畔⒘;饕譃閯澐执翱诤湍:瘍蓚€(gè)步驟,信息粒則可以表示為:P?(xisG)isλ,其中,P是基于X而構(gòu)建的模糊信息粒子,x是論域U中取值的變量,G是U的凸模糊子集,由隸屬函數(shù)μG來刻畫,λ是單位區(qū)間的模糊子集,表示可能性概率,一般假設(shè)U為實(shí)數(shù)集R(Rn)。本文采用三角形模糊粒子,隸屬函數(shù)的表達(dá)式為:
(2)
公式(2)中,輸入的時(shí)間序列由x表示;a,m,b均為參數(shù)。對(duì)于單個(gè)模糊粒子而言,原始數(shù)據(jù)變化的最小值、原始數(shù)據(jù)變化的平均水平和原始數(shù)據(jù)變化的最大值分別由參數(shù)a,m,b表示。
2.2.2 構(gòu)造SVR最優(yōu)決策函數(shù)
支持向量回歸機(jī)(SVR)是在SVM分類的基礎(chǔ)上引入不敏感損失函數(shù)提升、改善回歸擬合性能和效果的一種智能預(yù)測(cè)算法[16]。SVR模型算法的復(fù)雜度能有效處理樣本多維度問題,避免了神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型存在的局部極值問題,能夠保證解的唯一性和全局最優(yōu)性。SVR模型算法實(shí)現(xiàn)過程如下:
設(shè)xi∈Rn為輸入數(shù)據(jù),yi∈R為對(duì)應(yīng)于xi的預(yù)測(cè)值,則可以得到訓(xùn)練樣本集{(x1,y1),…,(xn,yn)),4},于是在高維特征空間中構(gòu)造的最優(yōu)決策函數(shù)為:
f(x)=ω·φ(xi)+b
(3)
其中,ω為權(quán)重矢量,b為偏差。
2.2.3 尋求最優(yōu)回歸超平面[17]
(4)
并通過拉格朗日方程轉(zhuǎn)換后得到上式的對(duì)偶形式:
(5)
2.2.4 構(gòu)造SVR回歸函數(shù)
在徑向基核函數(shù)K(xi,xj)=e-(‖x-xi‖2/2g2)基礎(chǔ)上構(gòu)造支持向量機(jī),得到SVR回歸函數(shù):
(6)
第三步,對(duì)上證指數(shù)時(shí)間序列數(shù)據(jù)進(jìn)行歸一化處理,利用模糊?;幚砗蟮臄?shù)據(jù)對(duì)SVM 進(jìn)行訓(xùn)練,確定SVR最優(yōu)懲罰參數(shù)C和徑向基核最優(yōu)參數(shù)g,在此基礎(chǔ)上構(gòu)建模糊信息?;疭VM預(yù)測(cè)模型,對(duì)窗口化殘差值進(jìn)行預(yù)測(cè)。
本文選取上證指數(shù)1990年12月20日到2017年5月5日期間內(nèi)上證指數(shù)時(shí)間周期分別為周和月的開盤價(jià)作為樣本數(shù)據(jù),以樣本交易日數(shù)據(jù)為訓(xùn)練集分別預(yù)測(cè)接下來的4周和4個(gè)月的時(shí)間周期內(nèi),上證指數(shù)開盤價(jià)的變化情況。樣本數(shù)據(jù)來源于東方財(cái)富Choice金融終端。
根據(jù)信息量最小的判定標(biāo)準(zhǔn),本文選取最優(yōu)ARIMA模型進(jìn)行預(yù)測(cè),得到樣本觀測(cè)值與ARIMA模型預(yù)測(cè)值曲線圖(圖1)。
圖1 上證指數(shù)觀測(cè)值與ARIMA模型預(yù)測(cè)值結(jié)果
對(duì)殘差序列進(jìn)行模糊信息?;?,我們針對(duì)每個(gè)窗口均可得到三個(gè)模糊粒子,分別以Low、R、Up表示,與之對(duì)應(yīng)的是公式(2)中的aa,m,b。對(duì)于單個(gè)模糊粒而言,Low、R、Up分別代表輸入數(shù)據(jù)變化的最小范圍、平均范圍和最大范圍。在對(duì)數(shù)據(jù)進(jìn)行預(yù)處理的基礎(chǔ)上,將模糊信息?;瘮?shù)據(jù)進(jìn)行歸一化,并利用網(wǎng)格尋優(yōu)算法對(duì)備選模型參數(shù)進(jìn)行甄別。經(jīng)過大范圍內(nèi)粗略的參數(shù)尋優(yōu)和較小范圍內(nèi)精細(xì)的參數(shù)尋優(yōu)兩個(gè)階段之后,我們可以得出對(duì)Low、R和Up進(jìn)行參數(shù)選擇的結(jié)果。因?yàn)槿齻€(gè)變量的預(yù)測(cè)過程類似,此處僅對(duì)R變量進(jìn)行參數(shù)選擇的結(jié)果加以展示(圖2)。
利用最佳參數(shù)確定的模型對(duì)訓(xùn)練集進(jìn)行訓(xùn)練,并利用公式(2)中的三角模糊隸屬函數(shù)將訓(xùn)練集數(shù)據(jù)進(jìn)行模糊信息?;Y(jié)果如圖3所示。
圖2 對(duì)R變量進(jìn)行參數(shù)選擇的結(jié)果
圖3 模糊信息粒化可視化結(jié)果
最后,我們對(duì)窗口化ARIMA模型預(yù)測(cè)值與窗口化殘差預(yù)測(cè)值進(jìn)行合并,分別可以得到上證指數(shù)預(yù)測(cè)結(jié)果與真實(shí)值的對(duì)比圖(圖4)以及誤差變化圖(圖5)。
圖4 基于ARIMA與信息粒化SVR組合預(yù)測(cè)的結(jié)果
圖5 基于ARIMA與信息?;疭VR組合預(yù)測(cè)的誤差變化圖
作為上證指數(shù)時(shí)間序列組合模型的預(yù)測(cè)結(jié)果,下面的表1和表2分別展示了基于ARIMA與信息?;疭VR組合預(yù)測(cè)上證指數(shù)周數(shù)據(jù)和月度數(shù)據(jù)的結(jié)果。
表1 基于ARIMA與信息?;疭VR組合預(yù)測(cè)上證指數(shù)周數(shù)據(jù)的結(jié)果
表2 基于ARIMA與信息?;疭VR組合預(yù)測(cè)上證指數(shù)月數(shù)據(jù)的結(jié)果
本文基于ARIMA與信息?;疭VR組合方法構(gòu)建了股指時(shí)間序列預(yù)測(cè)模型,并對(duì)上證指數(shù)變化的空間和趨勢(shì)進(jìn)行了預(yù)測(cè)。實(shí)證研究表明:(1)在以周和月為周期的時(shí)間窗口范圍內(nèi),上證指數(shù)的變化空間預(yù)測(cè)結(jié)果與其實(shí)際變化趨勢(shì)基本一致;(2)該組合預(yù)測(cè)技術(shù)能有效提高預(yù)測(cè)精度和效度,能在一定時(shí)間周期內(nèi)對(duì)股票等風(fēng)險(xiǎn)資產(chǎn)價(jià)格波動(dòng)區(qū)間進(jìn)行較為可信的預(yù)測(cè),有助于投資者基于價(jià)格預(yù)測(cè)的投資組合優(yōu)化;(3)該組合預(yù)測(cè)技術(shù)還只能大致確定時(shí)間序列的波動(dòng)范圍而不能精確地預(yù)測(cè)具體指數(shù)點(diǎn)位?;贏RIMA與信息?;疭VR組合預(yù)測(cè)的回歸預(yù)測(cè)方法具有一定的預(yù)測(cè)效果,有助于我們實(shí)現(xiàn)中長(zhǎng)期股指走勢(shì)的預(yù)判與把握。但該預(yù)測(cè)技術(shù)建立在時(shí)間序列平穩(wěn)性、隨機(jī)性等系列假設(shè)之上,預(yù)測(cè)效果受到模糊粒子類型、核函數(shù)以及參數(shù)范圍選擇等因素的影響,未來仍需通過進(jìn)一步優(yōu)化以提升組合預(yù)測(cè)模型的應(yīng)用效果。