王 瑩
(上海工程技術(shù)大學(xué) 管理學(xué)院,上海 201620)
一直以來,股票市場在金融領(lǐng)域中有著舉足輕重的地位。股票價格的波動能夠在一定程度上反映一個國家經(jīng)濟(jì)周期的變化。尤其作為權(quán)重股的銀行股,其價格波動對于整個股市的變化趨勢有著重要的影響[1]。而股票價格往往對時間因素非常敏感,所以建立時間序列模型能夠有效地對股票價格進(jìn)行分析及預(yù)測[2]。常用的時間序列預(yù)測方法有自回歸(AR)模型、移動平均(MA)模型和自回歸移動平均(ARMA)模型[3]。本文將運(yùn)用ARMA模型對中國銀行股票開盤價歷史數(shù)據(jù)進(jìn)行擬合分析,并對未來三天的開盤價進(jìn)行預(yù)測。
ARMA模型是由AR自回歸過程和MA移動平均過程組成的自回歸移動平均模型,是時間序列分析模型的一種,其基本思想是通過揭示歷史時間序列的運(yùn)行規(guī)律,從而對未來的事物發(fā)展進(jìn)行預(yù)測。在ARMA(p,q)模型中,p為自回歸階數(shù),q為移動平均階數(shù)。
一般的ARMA(p,q)模型的形式可以表示為:
式(1)中,{εt}是白噪聲序列,AR和MA模型都是特殊的ARMA(p,q)模型,當(dāng)p=0 時,ARMA(0,q)就是MA(q);當(dāng)q=0 時,ARMA(p,0)就是AR(p)。當(dāng)時間序列不平穩(wěn)時,不能直接運(yùn)用ARMA模型,而是需經(jīng)過差分或取對數(shù)等處理后,形成一個新的平穩(wěn)的時間序列[4]。
對于非平穩(wěn)時間序列,可以擬合模型ARIMA(p,d,q),其方程式如下:
其中:d為差分階數(shù);
B為滯后算子;
特別地,當(dāng)d=0 時,ARIMA模型就是ARIMA模型。
ARMA模型的定階方法主要是通過觀察自相關(guān)圖和偏自相關(guān)圖,根據(jù)其系數(shù)的相關(guān)特性來判斷階數(shù)。若AC是拖尾的,PAC是p階截尾的,則選擇AR(p)模型;若PAC是拖尾的,AC是q階截尾的,則選擇MA(q)模型;若AC和PAC都表現(xiàn)為拖尾性,則選擇ARMA(p,q)模型,然后通過模型的參數(shù)檢驗,進(jìn)一步判斷p、q的階數(shù)。
但由于樣本具有隨機(jī)性,相關(guān)系數(shù)并不會表現(xiàn)出完美截尾的情況,通常會呈現(xiàn)出小值振蕩的情況,這就給模型的定階帶來了一定的困難。根據(jù)以往的經(jīng)驗,如果樣本自相關(guān)系數(shù)或偏自相關(guān)系數(shù)在初始的d階明顯大于兩倍標(biāo)準(zhǔn)差范圍,其后幾乎95%的自相關(guān)系數(shù)都在兩倍標(biāo)準(zhǔn)差范圍內(nèi),并且由非零自相關(guān)系數(shù)衰減為小值波動的過程非常突然。這時可以視為自相關(guān)系數(shù)或偏自相關(guān)系數(shù)d階截尾[5]。
單位根檢驗是通過檢驗特征根距離單位圓的位置來判斷序列的平穩(wěn)性的。通常采用的是ADF檢驗,ADF檢驗主要有三種類型:無趨勢無截距、有截距無趨勢、有截距有趨勢。形式如下:ADF 檢驗主要步驟如下:首先進(jìn)行第三種情形的檢驗,若拒絕原假設(shè),則檢驗時間趨勢項系數(shù)的顯著性,若顯著性拒絕原假設(shè),則該序列為趨勢平穩(wěn)。反之進(jìn)行第二種情形的檢驗,若拒絕原假設(shè),則檢驗截距項系數(shù)的顯著性,若顯著性拒絕原假設(shè),則為含截距項平穩(wěn);若不拒絕原假設(shè),則進(jìn)行第一種情形的檢驗,若拒絕原假設(shè),則該序列為不含截距項和時間趨勢項平穩(wěn)。若三種情形均不能拒絕原假設(shè),則應(yīng)綜合第一種和第二種的AIC、SC、HQ 判斷選擇哪種情形下的單位根檢驗。
本文通過東方財富網(wǎng)選取了中國銀行(601988)2019 年8 月20 日至2020 年8 月21 日的股票日開盤價數(shù)據(jù),一共245 個樣本。運(yùn)用Eviews 10 軟件進(jìn)行建模分析對未來三天的股價進(jìn)行預(yù)測。
1.時序圖檢驗。首先對數(shù)據(jù)的平穩(wěn)性進(jìn)行判斷:將原始數(shù)據(jù)輸入Eviews 軟件,生成時間序列圖(見圖1)。平穩(wěn)時間序列的圖像始終圍繞著某一個值上下波動且波動范圍有界,沒有明顯的趨勢和周期性。由圖1 所示,序列趨勢不太明顯,存在上下波動的狀態(tài),可以初步判斷中國銀行股票開盤價大致平穩(wěn)的。
圖1 中國銀行股票開盤價時序圖
2.單位根(ADF)檢驗。為了準(zhǔn)確判斷原始序列是否平穩(wěn),進(jìn)一步對原始數(shù)據(jù)進(jìn)行三種情況下ADF檢驗(結(jié)果如圖2、圖3、圖4 所示),其ADF test statistic值分別為-3.410 698、-2.954 879 和-0.152 588,P值分別為0.052 3、0.040 7、0.630 1,經(jīng)分析發(fā)現(xiàn)三種情況中,在有截距情況下的單位根檢驗的P值小于0.05,拒絕原假設(shè),可以認(rèn)為原始數(shù)據(jù)為平穩(wěn)時間序列。
圖2 有截距有趨勢項的單位根檢驗
圖3 有截距的單位根檢驗
圖4 無截距無趨勢項的單位根檢驗
在對時間序列數(shù)據(jù)進(jìn)行平穩(wěn)性檢驗之后,我們需要根據(jù)樣本相關(guān)系數(shù)的拖尾性和截尾性來識別模型的類型,并確定滯后階數(shù)p和q的值。
觀察樣本自相關(guān)圖和偏自相關(guān)圖(見圖5),其中p值均為0,說明原始序列為平穩(wěn)非白噪聲序列,可以進(jìn)行模型擬合。由圖5 可知,序列自相關(guān)系數(shù)緩慢衰減且過程相當(dāng)連續(xù),呈現(xiàn)拖尾性質(zhì)。而偏自相關(guān)系數(shù)除了滯后一階的數(shù)值較大,其他數(shù)值均在兩倍標(biāo)準(zhǔn)差范圍內(nèi)作小值隨機(jī)波動,并且相關(guān)系數(shù)衰減的過程非常突然,所以可以判斷偏自相關(guān)系數(shù)為一階截尾。綜上所述,可以考慮擬合模型為AR(1)。
圖5 序列自相關(guān)圖和偏自相關(guān)圖
根據(jù)上文,選擇AR(1)模型作為最佳預(yù)測模型進(jìn)行擬合,如圖6 所示,根據(jù)圖中結(jié)果,模型AR(1)對應(yīng)的p值為0,小于0.05,模型參數(shù)顯著有效。進(jìn)行參數(shù)估計,可以寫出表達(dá)式為:xt=0.999950xt-1+εt,其中εt為殘差序列。
圖6 AR(1)模型擬合
參數(shù)估計完成后,還需要對模型進(jìn)行顯著性檢驗。目的是檢驗?zāi)P褪欠癯浞值奶崛×藭r間序列中的信息,即殘差序列是否為白噪聲序列。若殘差序列為非白噪聲序列,那就說明殘差序列中還有殘留的相關(guān)信息未被提取,還需對模型進(jìn)一步完善。
對擬合AR(1)模型進(jìn)行殘差檢驗,結(jié)果如圖7 所示,延遲6 階和12 階的Q統(tǒng)計量值分別為4.150 5和8.322 3,P值分別為0.528 和0.684。由于P 值大于顯著性水平α,所以該序列不能拒絕原假設(shè),即殘差序列為白噪聲序列,模型顯著有效。事實上,DW檢驗同樣可以判斷殘差序列的自相關(guān)性。圖6 中DW 檢驗值為2.016 319,十分接近2,因此可以認(rèn)為殘差序列不具有自相關(guān)性。
圖7 殘差序列自相關(guān)圖
從圖8 的模型擬合效果圖來看,擬合值和真實值還是十分貼合的,殘差也為圍繞著某個值隨機(jī)波動,殘差信息提取的較為充分。
圖8 模型擬合效果圖
最后用擬合的ARMA模型對中國銀行股票未來三天的開盤價進(jìn)行預(yù)測,并將預(yù)測結(jié)果與真實數(shù)據(jù)進(jìn)行對比,結(jié)果如表1 所示。
表1 中國銀行未來三天股價的預(yù)測結(jié)果
根據(jù)表1,用模型預(yù)測出的股票價格與真實價格較為接近,誤差較小,說明ARMA模型預(yù)測股票價格的效果比較理想。但由于影響股票長期價格的因素較多,在利用ARMA模型進(jìn)行時間跨度大的預(yù)測時,誤差也隨之增大,因此本模型更適合于股票價格的短期預(yù)測[6]。
股票價格預(yù)測一直是一個值得關(guān)注的問題。本文采用ARMA模型對中國銀行股票開盤價進(jìn)行預(yù)測的實證,表明了時間序列模型對于股票價格的短期預(yù)測是可行的。模型對價格信息提取比較充分,擬合效果較好,預(yù)測值與真實值的誤差相對較小。但由于下一期的預(yù)測是根據(jù)上一期的預(yù)測值計算的,因此產(chǎn)生的累計誤差將越來越大。對于股票價格的長期預(yù)測來說,ARMA模型的預(yù)測效果會大大降低。而且股票價格的長期趨勢受到行業(yè)政策等環(huán)境因素的影響較大,而短期預(yù)測受到的干擾因素的影響較小。因此投資者應(yīng)該選擇模型的短期預(yù)測值作為投資決策的參考。