孫冠華
(南京大學(xué) 商學(xué)院,南京 210093)
時(shí)間序列分析是處理以時(shí)間為指標(biāo)集的隨機(jī)變量序列{xt:t∈T}的理論。指標(biāo)集T可以是區(qū)間,如[0, ∞);也可以是離散數(shù)集,如N+,對(duì)應(yīng)的時(shí)間序列分別稱為連續(xù)時(shí)間序列和離散時(shí)間序列。時(shí)間序列分析理論內(nèi)容豐富,包括數(shù)據(jù)描述性統(tǒng)計(jì)、模型的定階、參數(shù)的估計(jì)和檢驗(yàn)以及分析和預(yù)測(cè)等。研究時(shí)間序列有各種各樣的目的,包括對(duì)數(shù)據(jù)生成機(jī)制的理解和描述、對(duì)未來值的預(yù)報(bào),以及對(duì)系統(tǒng)的最優(yōu)化控制等。時(shí)間序列的本質(zhì)特征主要表現(xiàn)為:觀察值之間是相互依賴的或相關(guān)的,以及觀察值是有序的。因此,建立在獨(dú)立性假設(shè)基礎(chǔ)之上的統(tǒng)計(jì)技術(shù)和方法不再適用,需要建立不同的統(tǒng)計(jì)方法。
作為數(shù)理統(tǒng)計(jì)學(xué)的一個(gè)組成部分,時(shí)間序列分析的發(fā)展和主流統(tǒng)計(jì)學(xué)理論的發(fā)展有很大的一致性。20世紀(jì)上半葉,伴隨著多元線性回歸模型的廣泛應(yīng)用,一批時(shí)間序列模型包括自回歸模型、移動(dòng)平均模型以及移動(dòng)平均自回歸模型相繼建立起來。近年來,隨著科學(xué)技術(shù)的發(fā)展以及人類實(shí)踐活動(dòng)范圍的擴(kuò)大,非線性理論受到廣泛關(guān)注。以核方法為代表,統(tǒng)計(jì)學(xué)中出現(xiàn)了一系列的非線性回歸分析技術(shù)。同時(shí),在時(shí)間序列領(lǐng)域,以bilinear模型為代表的非線性時(shí)間序列模型隨之建立并得到廣泛應(yīng)用,Tong(1990)提供了一個(gè)很好的介紹。
金融時(shí)間序列分析是時(shí)間序列分析理論中較為活躍的一個(gè)分支。20世紀(jì)70年代以來,伴隨著科技的進(jìn)步、計(jì)算機(jī)的普及,金融交易成本和準(zhǔn)入門檻均有較大的降低,這為金融市場(chǎng)的活躍提供了有利條件。在參與積極性提高的同時(shí),出于對(duì)超額收益的追求,人們普遍希望建立準(zhǔn)確預(yù)測(cè)金融市場(chǎng)的模型,因而ARCH、GARCH等波動(dòng)模型相繼出現(xiàn),極大促進(jìn)了金融時(shí)間序列理論的研究。然而,21世紀(jì)初,一場(chǎng)由次級(jí)按揭貸款引發(fā)的全球金融危機(jī)席卷全球金融市場(chǎng),大量金融機(jī)構(gòu)破產(chǎn)、工人失業(yè),冷酷的現(xiàn)實(shí)提醒著人們:理論界對(duì)金融市場(chǎng)的認(rèn)識(shí)與真正的金融市場(chǎng)之間還有很大距離。
總體而言,對(duì)時(shí)間序列的建模分析可以歸結(jié)為尋找合適的多元函數(shù)f(?),使得下式成立:
這里X1,X2,...,Xt-1為往期觀察值,a1,a2,...,at為隨機(jī)誤差,二者間相互獨(dú)立,且a在X給定條件下服從正態(tài)分布。根據(jù)函數(shù)f(?)性質(zhì)不同,可將時(shí)間序列分為兩類:當(dāng)函數(shù)f(?)為線性函數(shù)時(shí),該時(shí)間序列為線性時(shí)間序列;當(dāng)函數(shù)f(?)為非線性函數(shù)時(shí),該時(shí)間序列為非線性時(shí)間序列。
本文設(shè)計(jì)兩個(gè)實(shí)驗(yàn),用對(duì)比的方式來說明ARMA模型與bilinear模型在數(shù)值擬合方面所具有的不同特性。
為了能更好地顯現(xiàn)結(jié)論的對(duì)比性,本文選擇使用比較簡(jiǎn)潔的模型進(jìn)行模擬。并且,為了不致于使實(shí)驗(yàn)過程更加繁瑣,此處暫不考慮定階問題。采取以下兩個(gè)模型:
一階ARMA模型rt=φ0+φ1rt-1+θ1at-1+at
bilinear模型rt=φ0+φ1rt-1+θ1at-1+η11rt-1at-1+at
可以看到,兩者最大的不同在于bilinear模型中引進(jìn)的非線性項(xiàng)η11rt-1at-1。該項(xiàng)的引入會(huì)使模型的估計(jì)出現(xiàn)兩方面變化:一方面,參數(shù)的增加往往會(huì)使計(jì)量模型估計(jì)的精度有所增加,經(jīng)典線性模型尤其如此。另一方面,由于樣本的有限性,參數(shù)的估計(jì)存在誤差,增加的參數(shù)會(huì)將誤差引入模型,使得模型的精確度降低。引入?yún)?shù)最終給模型精確度帶來的變化取決于兩種力量的對(duì)比。
為了比較兩個(gè)模型在數(shù)據(jù)擬合方面的精確性,本文進(jìn)行如下實(shí)驗(yàn):首先,用如上的ARMA模型產(chǎn)生數(shù)據(jù),然后分別用系數(shù)未知的ARMA模型與bilinear模型進(jìn)行擬合,考察兩個(gè)模型擬合的殘差并進(jìn)行比較。隨后再用bilinear模型產(chǎn)生數(shù)據(jù),并用同樣的方式進(jìn)行擬合,分別得到另一組殘差序列。將兩組殘差序列進(jìn)行比較,若某一組殘差明顯小于另一組,則說明對(duì)應(yīng)的模型在數(shù)值擬合方面具有優(yōu)勢(shì),否則,說明兩個(gè)模型擬合數(shù)據(jù)能力相當(dāng)。
本文選取的數(shù)據(jù)產(chǎn)生模型為:
考慮到單次實(shí)驗(yàn)的不確定性,本文采用重復(fù)實(shí)驗(yàn)進(jìn)行模擬。實(shí)驗(yàn)設(shè)計(jì)如下:共分兩組進(jìn)行,第一組用模型(2)產(chǎn)生收益率序列,分別用含有未知參數(shù)的ARMA模型和bilinear模型進(jìn)行數(shù)據(jù)擬合,求解未知參數(shù)并計(jì)算得到的殘差值。將此實(shí)驗(yàn)分別重復(fù)500次和1000次,計(jì)算殘差序列均值、標(biāo)準(zhǔn)差。第二組改用模型(3)產(chǎn)生收益率序列,其他設(shè)置相同。兩組實(shí)驗(yàn)的誤差均值和標(biāo)準(zhǔn)差分別見表1和表2所示。
表1 重復(fù)次數(shù)為500次時(shí)誤差結(jié)果對(duì)照表
表2 重復(fù)次數(shù)為1000時(shí)誤差結(jié)果對(duì)照表
在表1和表2中,行用來表示原始數(shù)據(jù)模型,列用來表示擬合模型。如表1第二行表示數(shù)據(jù)是用ARMA模型產(chǎn)生的,而第二列表示用ARMA模型擬合,交叉處的0.7553(0.9404)表示實(shí)驗(yàn)重復(fù)500次時(shí),由ARMA模型產(chǎn)生的數(shù)據(jù)用ARMA模型擬合誤差均值為0.7553,標(biāo)準(zhǔn)差為0.9404。
從實(shí)驗(yàn)一中可以看到,當(dāng)原始數(shù)據(jù)是由ARMA模型產(chǎn)生,即數(shù)據(jù)結(jié)構(gòu)為線性時(shí),用bilinear模型與ARMA模型擬合準(zhǔn)確度相近,分別只相差0.29和0.23個(gè)百分點(diǎn)。而當(dāng)原始數(shù)據(jù)是由bilinear模型產(chǎn)生,即帶有非線性結(jié)構(gòu)時(shí),用bilinear模型具有較明顯的優(yōu)勢(shì),精度比ARMA模型分別提高了1.91和1.92個(gè)百分點(diǎn)。這說明作為ARMA模型的擴(kuò)展,bilinear模型無論在處理線性或是非線性模型方面都有較好的表現(xiàn),并沒有產(chǎn)生參數(shù)增加引起誤差增大的問題。
在上述實(shí)驗(yàn)中,可以看到對(duì)于帶有非線性結(jié)構(gòu)數(shù)據(jù)的擬合,bilinear模型要優(yōu)于ARMA模型。一個(gè)比較自然的問題是:是否隨著數(shù)據(jù)序列中非線性成分的逐漸增加,bilinear模型在數(shù)據(jù)擬合上的優(yōu)勢(shì)會(huì)逐漸增加?這是一個(gè)值得研究的問題,本文設(shè)計(jì)第二個(gè)實(shí)驗(yàn)如下:
將數(shù)據(jù)產(chǎn)生模型(3)中非線性項(xiàng)rt-1at-1前系數(shù)由0.1順次增加到1。對(duì)每個(gè)確定的系數(shù)值,分別重復(fù)上述實(shí)驗(yàn),按同樣的方式比較所得結(jié)果如表3所示。
表3 不同程度非線性條件下兩模型擬合誤差對(duì)照表
可以看到,隨著非線性項(xiàng)系數(shù)的增加,bilinear模型的估計(jì)效果仍然較好,而ARMA模型的誤差增長(zhǎng)較快,更加直觀的對(duì)比可見圖1所示??梢哉J(rèn)為,在非線性結(jié)構(gòu)較為顯著的數(shù)據(jù)下,ARMA模型幾乎失效。
圖1 非線性部分占比增加時(shí)兩模型誤差比較
本文從數(shù)值擬合這一特定視角,選取了線性模型和非線性模型的各自代表——ARMA模型和bilinear模型進(jìn)行分析,得到了如下結(jié)論:(1)對(duì)于線性數(shù)據(jù),兩模型擬合程度相近,而對(duì)于具有非線性結(jié)構(gòu)的數(shù)據(jù),bilinear模型擬合準(zhǔn)確度優(yōu)于ARMA模型。(2)原始數(shù)據(jù)中非線性結(jié)構(gòu)所占比重越大,bilinear模型在擬合方面的優(yōu)勢(shì)越明顯。鑒于bilinear模型可以認(rèn)為是ARMA模型的非線性擴(kuò)展,這個(gè)結(jié)果是符合直覺的。
在模型選擇問題中,模型的準(zhǔn)確性并不必然隨著參數(shù)數(shù)目的增加而提高。如著名的三因子模型,僅用三個(gè)因子就可以解釋股價(jià)收益率變化的90%,提高空間十分有限。但在本文中,交叉項(xiàng)的引入確實(shí)使得模型的擬合精度有所增加。說明模型的選擇并不能遵循公理性法則,而應(yīng)具體問題具體分析,靈活取舍。
為了更加簡(jiǎn)潔明了地體現(xiàn)模型差異,本文并沒有考慮模型定階問題,而是預(yù)先選定了模型滯后階數(shù)。一個(gè)自然的問題是當(dāng)滯后階數(shù)沒有事先給定時(shí)是否還有類似結(jié)論成立,可以繼續(xù)就此問題進(jìn)行研究。另外,bilinear模型是通過ARMA模型引入交叉項(xiàng)得到的,可以認(rèn)為是式(1)中函數(shù)f(?)進(jìn)行泰勒展開至二階的結(jié)果,比只展開到一階的ARMA模型更準(zhǔn)確是合理的。是否可以沿此方向研究更高階的模型?這樣的模型是否有比bilinear模型更加有效的擬合性質(zhì)?仍然是值得考慮的問題。
[1]Bollerslev T.Generalized Autoregressive Conditional Heteroskedasticity[J].Journal of Econometics,1986,(31).
[2]Engle R F.Autoregressive Conditional Heteroscedasticity With Estimates of Variance of United Kindom Inflations[J].Econnometrica,1982,50(4).
[3]Tsay R S.Time Series and Forecasting:Brief History and Future Research[J].Journal of the American Statistical Association,2000,95(450).
[4]Yule G U.On a Method of Investigating Periodicities in Disturbed Series,With Special Reference to Wolfer’s Sunspot Number[J].Philosophical Transactions of the Royal Society B Biological Sciences,1927,(226).
[5]Box G,Jenkins G,Reinsel G.Time Series Analysis:Forecasting and Control[M].Englewood Cliffs,N.J.:Prentice Hall,1994.
[6]Granger C W J,Anderson A P.An Introduction to Bilinear Time Series Models[M].Gottingen:Vandenhoek and Ruprecht,1978.
[7]H?rdle W.Applied Nonparametric Regression[M].Cambridge:Cambridge University Press,1990.
[8]Rao T S,Gabr M M.An Introduction to Bispectral Analysis and Bilinear Time Series Models[M].New York:Springer Verlag,1984.
[9]Tsay R S.Analysis of Financial Time Series[M].New Jersey:John Wiley&Sons,2010.
[10]Tong H.Threshold Models[M].New York:Springer,1983.
[11]Tong H.Non-linear Series:A Dynamical System Approach[M].Oxford:Oxford University Press,1990.
[12]魏武雄.時(shí)間序列分析:?jiǎn)巫兞亢投嘧兞糠椒╗M].北京:中國(guó)人民大學(xué)出版社,2009.