王惠星+林嘉喜
【摘要】上證50指數(shù)是中國股票指數(shù)期貨中一個重要的品種,它是挑選上海證券交易所上規(guī)模大、流動性好的最具代表性的50只樣本股構成,從而反映市場上最具有影響力的一批龍頭企業(yè)的整體狀況,因此對其研究具有非常重要的意義。本文根據(jù)數(shù)據(jù)的時間序列的特性,選取2004年1月到2016年11月每日收盤價為原始數(shù)據(jù)作為研究對象,利用數(shù)據(jù)時間序列特性具有優(yōu)勢性的差分自回歸移動平均模型(ARIMA模型)建立ARIMA模型對其進行定量分析,并且對未來走勢進行預測。
【關鍵詞】上證50指數(shù) ARIMA模型 定量分析
一、研究背景
在股市投資中,如何通過分析及預測股票指數(shù)來指導投資者的操作非常重要。股票指數(shù)是指描述一攬子股票價格的總體水平及變動情況,而上證50指數(shù)的成分股是由在上海證券交易所掛牌上市的最具代表性的50只股票構成,是上海證券交易所流動性、規(guī)模最大的優(yōu)質藍籌股,因此上證50指數(shù)對中國股市的行情具有指引作用。
本文研究對象為上證50股指期貨,它的走勢可以反映出市場對上證50指數(shù)漲跌的預期,因此投資者可以根據(jù)股指期貨的行情變動來預測股票市場動向和變動趨勢,從而來衡量自身的投資策略。文中以上證50股指期貨為例進行實證分析。通過圖1可以看出從2004年到2006年,上證50基本在1000點上下,在2005年6月達到歷史最低693.530點,之后快速上漲,在2007年10月達到最高點4772.93點,隨后由于2008年全球金融危機的影響,上證50快速下降,隨后窄幅波動,到2015年6月又到達一個新高位,在2016年11月上證指數(shù)為2334.68點,并且通過圖1的走勢可以看出上證50指數(shù)為非平穩(wěn)性時間序列,且又因為金融數(shù)據(jù)具有易變性,因此選取2004年到2016年之間每日收盤價的數(shù)據(jù)進行收集整理,將處理時間數(shù)列特性優(yōu)勢的差分自回歸移動平均模型(ARIMA模型),建立ARIMA模型對其進行定量分析,并對上證50指數(shù)的未來走勢進行預測。
二、ARIMA模型介紹
自回歸模型AR(p)和滑動平均模型MA(q)組合構成描述平穩(wěn)性隨機過程的自回歸滑動平均模型ARMA(p,q),其表達式為其表達式為:
其中這個表達式的前半部分為自回歸部分AR(p),非負整數(shù)p為自回歸階數(shù),φ1,…φp為自回歸系數(shù),后半部分為滑動平均部分MA(q),非負整數(shù)q為滑動平均階數(shù),θ1,…,θq為滑動平均系數(shù);Xt為上證50收盤價數(shù)據(jù)相關序列,εt為白噪聲序列WN(0,σ2)。
因為ARMA(p,q)為平穩(wěn)性隨機過程的模型,而經(jīng)濟類數(shù)據(jù)大多呈現(xiàn)非平穩(wěn)性,進而利用差分法進行非平穩(wěn)性隨機過程的處理,將初始數(shù)據(jù)轉化為平穩(wěn)時間序列,然后建立差分自回歸移動平均模型ARIMA(p,d,q),其中p為自回歸項,q為移動平均項數(shù),d為差分次數(shù),該模型建立之后就可以根據(jù)時間序列的過去值及現(xiàn)在值預測未來值。
三、基于ARIMA的上證50指數(shù)的分析及預測
(一)數(shù)據(jù)提取與處理
1.數(shù)據(jù)提取。本文選取上證50指數(shù)作為研究對象,從東方財富網(wǎng)上提取2004年1月2日至2016年11月18日收盤價格共3128個交易日的數(shù)據(jù)為研究樣本通過統(tǒng)計分析軟件SPSS 22.0進行分析,此樣本可以反映上海證券交易所年度整體趨勢。
2.原始時間序列數(shù)據(jù)。首先對原序列SZ50_Y進行分析,通過圖2可以初步確定為非平穩(wěn)性時間序列,為驗證平穩(wěn)性進行應進一步檢驗。
通過自相關系數(shù)(ACF)圖可以看出,呈周期衰減的速度非常緩慢,且大部分數(shù)據(jù)未落入置信區(qū)間內,因而判定原序列為非平穩(wěn)性時間序列。
3.平穩(wěn)化時間序列數(shù)據(jù)。經(jīng)上述分析可知,原序列SZ50_Y為非平穩(wěn)性時間序列,應采用差分法對原始數(shù)據(jù)進行適當階數(shù)的差分處理,便可清除非平穩(wěn)性,形成平穩(wěn)性時間序列,因此進行一階差分處理,使原序列平穩(wěn)化,對原始序列進行一階差分形成新的序列SZ50_Y_1的差分方法為:SZ50_Y_1(t)=SZ50_Y(t)-SZ50_Y(t-1),并觀察新序列的平穩(wěn)性。由圖3可知,差分序列基本分布在0刻度線上下兩側,因此基本可以認為差分序列SZ50_Y_1為平穩(wěn)性。
又根據(jù)差分序列的自相關系數(shù)(ACF)和偏自相關系數(shù)(PACF)圖可知,大部分數(shù)據(jù)落入置信區(qū)間內,數(shù)據(jù)基本平穩(wěn),最佳差分階數(shù)d=1,因而適合對原始序列建立ARIMA(p,1,q)模型。
(二)模型建立
1.模型定階。通過以上對序列SZ50_Y_1的偏自相關系數(shù)和自相關系數(shù)計算,并且根據(jù)標準化BIC準則最小化,經(jīng)過反復檢驗,從而得出p=0,q=6,因此所建立的模型為ARIMA(0,1,6),由表3-1所示。
由表3-3所示,標準化BIC準則的數(shù)值為7.474,與之前的幾個模型的數(shù)值相比,滿足最小的原則,且平穩(wěn)R平方為0.005,大于0,說明當前模型優(yōu)于基準模型,并根據(jù)模型的擬合情況看出,R平方為0.997,接近于1,說明模型的可解釋的變異占總變異的比例較大,擬合效果很好,并且說明該模型可以解釋99.7%的現(xiàn)象,由此可以得出此模型為最優(yōu)模型。
3.模型參數(shù)估計。
由表3-4可知,MA(6)的參數(shù)估計系數(shù)為0.071,AR的系數(shù)為0,結合前面的一階差分,還原得到的自回歸移動平均模型ARIMA(0,1,6)如下:
(三)模型的檢驗與預測
1.模型的診斷檢驗。為對擬合模型進行診斷檢驗,給出了殘差的自相關和偏相關函數(shù)(如下圖所示)。由下圖可以看出,各滯后階數(shù)的ACF和PACF的數(shù)值都位于臨界值內,并且沒有顯著性的趨勢變化,因此模型ARIMA(0,1,6)是最優(yōu)模型。
2.模型預測結果。圖4為擬合圖形和預測結果,線性圖描繪了觀測值、擬合值及預測值,通過圖4看出使用的模型比較合理,且根據(jù)以上分析可知,模型的精度是比較高的,盡管隨著ARIMA模型預測區(qū)間的延長,模型誤差會逐步加大,但它仍然比傳統(tǒng)時間序列模型的精度高,比較適合做短期預測,圖中預測了2017年全年的上證50的一個大體趨勢,可以看出在置信區(qū)間范圍逐步加大,誤差也在逐步加大,但大體可以得出結論,2017年全年上證50指數(shù)處于一個回升階段,且保持波動性。endprint
四、結論
本文通過以2004年1月2日至2016年11月18日的上證50指數(shù)的收盤價格作為樣本進行研究,采用時間序列分析法建立ARIMA模型。首先根據(jù)原數(shù)據(jù)的時序圖可以看出此數(shù)據(jù)為非平穩(wěn)性隨機過程,因此采用差分法進行平穩(wěn)化處理,再通過對模型定階和參數(shù)估計,最終得出模型ARIMA(0,1,6),經(jīng)過對此模型進行檢驗,檢驗有效后,并對2017年全年走勢進行預測得出實際值和預測值。
通過本文的建模及實證研究分析,可得出以下結論:第一,選取的觀察期間的上證50指數(shù)的每日收盤價,繪制出時序圖,可以看出其原數(shù)據(jù)序列為非平穩(wěn)性時間序列,說明此數(shù)據(jù)具有明顯的趨勢性和波動性;第二,此模型擬合效果很好且精度較高,說明此模型作為上證50指數(shù)的預測模型可行的;第三,此模型作為短期預測的效果最好,因為隨著預測時間的延長,誤差也逐步加大;第四,對于一個相同的序列,可建立多個不同的ARIMA模型,通過其他的統(tǒng)計量及實用性,選擇出最優(yōu)的模型;第五,通過預測結果可知,未來上證50指數(shù)的趨勢有輕微回升且保持波動性;第六,本文在研究時,只考慮到時間序列的特性,又因為市場存在諸多不確定因素存在,但這些因素只能體現(xiàn)在隨機擾動項中,無法在預測結果中反應出來。
參考文獻
[1]白營閃.基于ARIMA模型對滬深300指數(shù)的預測分析[D].華南理工大學,2010.
[2]劉美霞.基于ARIMA模型的深證指數(shù)分析及預測[J].經(jīng)濟觀察,2011.
[3]趙國慶.經(jīng)濟分析中的時間序列模型[M].南開大學出版社,2012.
[4]蔣濤,吳俊芳.ARIMA模型在基金指數(shù)預測中的應用[J].統(tǒng)計教育,2007(7).
[5]高鐵梅.計量經(jīng)濟分析與建模[M].清華大學出版社,2008:120-150.
[6]區(qū)詩德,覃思乾.基于60分鐘線的ARIMA模型分析日K線走勢[J].統(tǒng)計與決策,2005(24).
[7]王振龍,胡永宏.應用時間分析[M].中國人民大學出版社,2005.07.
[8]詹姆斯·D·漢密爾著,劉志明譯.時間序列分析[M].中國社會科學出版社.1999,12.
作者簡介:王惠星(1994-),天津財經(jīng)大學經(jīng)濟學院金融系金融工程專業(yè)學生。endprint