楊濤 付英姿 李薛莎
摘要:波動(dòng)率可以衡量金融市場(chǎng)風(fēng)險(xiǎn),在資產(chǎn)配置和風(fēng)險(xiǎn)管理等方面有重要意義。文章在基于高頻交易數(shù)據(jù)的HAR模型上對(duì)其進(jìn)行修正,利用藤Copula對(duì)HAR模型涉及的四個(gè)波動(dòng)率成分聯(lián)合建模(CV-HAR模型),并基于歷史數(shù)據(jù)的條件期望提取波動(dòng)率預(yù)測(cè)值。實(shí)證分析以上證交易所的20支股票作為研究樣本,對(duì)CV-HAR模型和歷史模型(HAR)性能進(jìn)行評(píng)估,結(jié)果表明,CV-HAR模型克服傳統(tǒng)模型線性結(jié)構(gòu)限制,并充分描述了聯(lián)合分布依賴關(guān)系,在對(duì)未來波動(dòng)率的預(yù)測(cè)行為方面更加精準(zhǔn)。
關(guān)鍵詞:波動(dòng)率;藤Copula;HAR模型
一、引言
金融資產(chǎn)波動(dòng)率的估計(jì)與預(yù)測(cè)是金融計(jì)量經(jīng)濟(jì)學(xué)的主要研究領(lǐng)域。自Andersen和Bollerslev(1998)首次利用高頻交易數(shù)據(jù)提出的已實(shí)現(xiàn)波動(dòng)率(RV)以來,高頻數(shù)據(jù)成為研究波動(dòng)率的重要手段。隨后Corsi(2004,2009)根據(jù)異質(zhì)市場(chǎng)假說理論,將市場(chǎng)波動(dòng)劃分為三種波動(dòng)形式(短期波動(dòng)、中期波動(dòng)和長(zhǎng)期波動(dòng)),提出了異質(zhì)自回歸已實(shí)現(xiàn)波動(dòng)率模型(HAR-RV),其實(shí)證結(jié)果表明該模型的預(yù)測(cè)能力明顯優(yōu)于GARCH和ARFIMA-RV等波動(dòng)率預(yù)測(cè)模型。與此同時(shí),許多學(xué)者在HAR族模型基礎(chǔ)上構(gòu)建新的預(yù)測(cè)模型,提高模型對(duì)市場(chǎng)波動(dòng)率的預(yù)測(cè)能力。
HAR族模型最大的一個(gè)特點(diǎn)就是線性,受特定的回歸形式所限制,這使得模型在預(yù)測(cè)方面沒有很好的應(yīng)用。一般回歸問題的表達(dá)式為RV=f(X,β)=IE[RV|X],其中X是回歸向量,β是參數(shù)向量。本文的工作是直接利用條件分布函數(shù)FRV|X計(jì)算得到IE[RV|X],其中條件分布函數(shù)可由聯(lián)合分布FRV,X獲得。該方法并沒限制回歸函數(shù)的特定形式,而是通過聯(lián)合分布函數(shù)來確定函數(shù)變量間相關(guān)關(guān)系。Copula(Nelsen,2000)將復(fù)雜的聯(lián)合分布拆分為單變量的邊緣分布和變量間的相關(guān)結(jié)構(gòu)來獨(dú)立研究,能夠更加靈活地描述變量間復(fù)雜依賴關(guān)系。Sokolinskiy和van Dijk(2011)提出了一種基于Copula的已實(shí)現(xiàn)波動(dòng)率(RV)估計(jì)方法和預(yù)測(cè)方法,實(shí)證分析表明Copula可以靈活而簡(jiǎn)潔地捕捉波動(dòng)率相關(guān)特征,在預(yù)測(cè)方面的準(zhǔn)確性和效率都由于傳統(tǒng)預(yù)測(cè)方法(HAR模型)。而本文主要是對(duì)HAR模型進(jìn)行修正,即對(duì)三種不同的波動(dòng)率成分使用Copula函數(shù)進(jìn)行聯(lián)合建模。在選取Copula函數(shù)時(shí),本文采用了更為靈活地藤Copula(Joe,1996)來描述多個(gè)變量間的相關(guān)關(guān)系。藤Copula把多元聯(lián)合密度函數(shù)分解為條件邊緣分布密度函數(shù)和一系列Pair-Copula的乘積。
因此,本文利用藤Copula在HAR模型上對(duì)回歸函數(shù)進(jìn)行一般化,通過條件分布函數(shù)確定(簡(jiǎn)稱CV-HAR模型)。在實(shí)證分析中,本文考慮了2015~2019年上證交易所20支股票的高頻交易數(shù)據(jù),并采用不同的估計(jì)和預(yù)測(cè)方案來評(píng)估本文模型與HAR模型。
二、理論
(一)HAR模型
1. 已實(shí)現(xiàn)核(Realized Kernel,RK)波動(dòng)率
令pt表示t時(shí)刻的對(duì)數(shù)資產(chǎn)價(jià)格,假設(shè)每日有M個(gè)觀測(cè)值,為{p1,…,pi,…,pM},則每日已實(shí)現(xiàn)波動(dòng)率(RV)為:
Barndorff-Nielsen(2008)提出的已實(shí)現(xiàn)核(RK)波動(dòng)是一種新的波動(dòng)率非參數(shù)估計(jì)方法,該方法在最優(yōu)時(shí)間窗口構(gòu)造RV的核密度估計(jì)式。RK能有效濾出噪音更貼近于真實(shí)波動(dòng)率,其估計(jì)形式如下:
其中,γh為自協(xié)方差過程,wh=(w-H,…,w-1,w0,w1,…,wH)′是核加權(quán)函數(shù)。
2. HAR-RK模型
HAR模型的理論基礎(chǔ)是異質(zhì)市場(chǎng)假說,將異質(zhì)市場(chǎng)中的交易者分為短期交易者、中期交易者和長(zhǎng)期交易者,分別表現(xiàn)為昨日已實(shí)現(xiàn)核波動(dòng)率(RK)、周已實(shí)現(xiàn)核波動(dòng)率(RK)和月已實(shí)現(xiàn)核波動(dòng)率(RK)。則HAR-RK模型可表示為:
其中RK是今日已實(shí)現(xiàn)核波動(dòng)率,β0是截距項(xiàng),β(d)、β(w)和β(m)分別表示周以及月已實(shí)現(xiàn)核波動(dòng)率的回歸系數(shù),εt是具有獨(dú)立性和零均值特點(diǎn)。
(二)CV-HAR模型
HAR模型中實(shí)質(zhì)上是RK滯后項(xiàng)的線性組合,該模型存在著模型結(jié)構(gòu)固化和無法描述非線性特征的缺陷。本文研究RK,RK,RK,RK的聯(lián)合分布F,并通過提取條件分布F得到RK的條件期望:
式中εt為隨機(jī)誤差項(xiàng)。該模型可以作為式(3)的一般化,HAR模型的f是線性函數(shù),而本文討論的模型是無固定結(jié)構(gòu)的條件期望形式。因此,本文利用藤Copula對(duì)四種波動(dòng)率的聯(lián)合分布進(jìn)行建模,該方法在多變量聯(lián)合建模方面優(yōu)勢(shì)尤為突出。
1. CV-HAR定義
由于四種波動(dòng)率(RK,RK,RK,RK)的特殊性,本文使用C藤Copula對(duì)這四種波動(dòng)率進(jìn)行建模(簡(jiǎn)稱CV-HAR)。C藤是所有藤中最常見的一個(gè)子類,具有典型的“星型”結(jié)構(gòu),其中每棵樹都有一個(gè)唯一的節(jié)點(diǎn)連接其他所有節(jié)點(diǎn)。假設(shè)d有個(gè)變量(X1,X2,…,Xd),F(xiàn)表示分布函數(shù),f表示密度函數(shù),則C藤的密度函數(shù)有如下分解式:
關(guān)于C藤結(jié)構(gòu)的確定,通過變量間的相關(guān)關(guān)系簡(jiǎn)化其選擇問題,使其結(jié)構(gòu)更有解釋性。本文四種波動(dòng)率在時(shí)間方面是存在特殊關(guān)系的,由于月已實(shí)現(xiàn)核波動(dòng)率(RK)驅(qū)動(dòng)著其他三種波動(dòng)率,因此將RK作為C藤中第一棵樹的中心節(jié)點(diǎn)。同理,考慮四種波動(dòng)率中當(dāng)前波動(dòng)率會(huì)受到歷史波動(dòng)率的影響,可得到C藤的結(jié)構(gòu)圖如下。
其中,第一棵樹所有的依賴關(guān)系都是是RK與其他波動(dòng)率之間的,最后一個(gè)樹中描述在周和月的已實(shí)現(xiàn)核波動(dòng)率條件下今日和昨日波動(dòng)率(RK和RK)之間的關(guān)系。
2. CV-HAR模型估計(jì)與條件期望
關(guān)于CV-HAR模型的估計(jì),本文采用邊際推斷函數(shù)法(IFM):
(1)估計(jì)四種波動(dòng)率的邊際分布函數(shù)。本文采用以下方法進(jìn)行估計(jì):參數(shù)估計(jì)(偏t分布);核密度估計(jì);經(jīng)驗(yàn)分布函數(shù)估計(jì)(ECDF)。
(2)藤結(jié)構(gòu)的確定。由于變量特殊性,C藤呈現(xiàn)一個(gè)特殊的結(jié)構(gòu)圖(見圖1)。
(3)利用信息準(zhǔn)則(AIC或則BIC)對(duì)所有雙變量Copula進(jìn)行選擇。其中存在類似C23|1的雙變量Copula包含條件分布函數(shù)F3|1和F2|1,可以通過下式求得:
其中v是m維向量,vj是v的任意分量,v-j是v從中除去vj的m-1維向量,C(·,·)是雙變量Copula函數(shù)。
(4)利用式(11)可得基于C藤結(jié)構(gòu)的多元變量聯(lián)合分布。
對(duì)于評(píng)估條件期望IE[X|v]的首要條件是計(jì)算條件分布函數(shù),而條件分布函數(shù)可以通過藤分解遞歸地求出見式(6)。
三、實(shí)證分析
(一)數(shù)據(jù)描述
為體現(xiàn)出CV-HAR模型性能的一般性特征,本文隨機(jī)挑選了上海證券交易所中20支股票的5分鐘高頻交易數(shù)據(jù)作為研究樣本。數(shù)據(jù)來源于微盛投資(http://www.wstock.net/),樣本的跨度為2015年1月至2019年12月,共計(jì)1219天。由于需要計(jì)算今日已實(shí)現(xiàn)核波動(dòng)率(RK)、昨日已實(shí)現(xiàn)核波動(dòng)率(RK)、周已實(shí)現(xiàn)核波動(dòng)率(RK)和月已實(shí)現(xiàn)核波動(dòng)率(RK),數(shù)據(jù)需要從第23天開始截?cái)?,因此觀測(cè)數(shù)據(jù)一共1197個(gè)。
(二)估計(jì)和預(yù)測(cè)方案
本文在三種不同的方案下,分別對(duì)HAR模型和CV-HAR模型進(jìn)行估計(jì),并制定相應(yīng)的預(yù)測(cè)措施。
1. 固定窗口(Fixed Window,F(xiàn)W)
將分別使用W={500,750,1000}個(gè)觀測(cè)值進(jìn)行模型估計(jì)。第1天到第W天的觀測(cè)部分用于樣本內(nèi)分析,其余W+1天到最后一天用于樣本外分析。
2. 增加窗口(Increasing Window,IW)
首先估計(jì)1到初始值W0天的HAR模型和CV-HAR模型,然后依次改變W=W0+i,i=1,…,1191-1-W0,并重新對(duì)1到W天進(jìn)行估計(jì),每次估計(jì)都進(jìn)行一次提前一步預(yù)測(cè)(即預(yù)測(cè)W+1天)。初始值W0={500,750,1000}。
3. 滾動(dòng)窗口(Rolling Window,RW)
類似于增加窗口(IW),不同的是估計(jì)的時(shí)間窗口是滾動(dòng)變化。初始值為W0={500,750,1000},對(duì)W-W0到W天進(jìn)行模型估計(jì),并預(yù)測(cè)W+1天的波動(dòng)率值。
本文選取四種常見的損失函數(shù)來評(píng)價(jià)HAR和CV-HAR模型的性能:均方誤差(MSE)、平均絕對(duì)誤差(MAE)、異質(zhì)調(diào)整均方誤差(HMSE)和異質(zhì)調(diào)整平均絕對(duì)誤差(HMAE)。
(三)結(jié)果分析
首先,利用固定窗口對(duì)HAR模型和CV-HAR模型進(jìn)行估計(jì)。表1的結(jié)果顯示,固定窗口的大小對(duì)模型的結(jié)果有重要的影響,隨著窗口的擴(kuò)大,四種損失函數(shù)都有著顯著的改善。將模型結(jié)果分為樣本內(nèi)和樣本外分析,可以看出呈現(xiàn)的結(jié)果有明顯的區(qū)別。樣本內(nèi)的結(jié)果顯示HAR模型總體上表現(xiàn)出更好的性能,而樣本外的結(jié)果顯示CV-HAR模型都有著明顯的優(yōu)勢(shì)。HAR模型在樣本內(nèi)有著很好的擬合效果,但不能應(yīng)用于對(duì)未來的預(yù)測(cè),然而CV-HAR模型利用藤Copula的靈活性,充分描述了波動(dòng)率之間的依賴關(guān)系,對(duì)未來的預(yù)測(cè)提供了更可靠結(jié)果。此外,在擬合CV-HAR模型的三種邊際擬合函數(shù)中,經(jīng)驗(yàn)分布函數(shù)擬合效果最佳,經(jīng)驗(yàn)分布函數(shù)估計(jì)不受模型的限制,很好地刻畫了波動(dòng)率的分布。圖2給出了關(guān)于HAR模型和CV-HAR模型的樣本外預(yù)測(cè)圖,圖中HAR模型的預(yù)測(cè)值整體上高估了RK值,而CV-HAR模型更加接近真實(shí)的值。
其次,表2展示的是HAR模型和CV-HAR模型在不同窗口下的三種樣本外預(yù)測(cè)方案的性能比較。最為明顯是在任意窗口下的不同預(yù)測(cè)方案呈現(xiàn)的結(jié)果都表明CV-HAR模型都要比HAR模型更優(yōu)秀,這說明本文考慮的模型的確克服了HAR固有的模型限制,并且允許非線性特征的存在,更加靈活地構(gòu)建了波動(dòng)率間的依賴關(guān)系,從而獲得更精準(zhǔn)的預(yù)測(cè)結(jié)果。此外,表中基于IW和RW方案的預(yù)測(cè)結(jié)果都顯著的比FW方案好,這是因?yàn)镮W和RW方案考慮了變量間的時(shí)變特征,這種變化是FW方法無法描述的。圖3給出了CV-HAR模型在IW方案下的Copula依賴關(guān)系變化趨勢(shì)??梢钥闯觯S著時(shí)間的變化,雙變量Copula的選擇各不相同,其Kendall's Tau相關(guān)系數(shù)也會(huì)隨著變化,這充分展現(xiàn)了Copula靈活刻畫變量間依賴關(guān)系的特點(diǎn)。
四、結(jié)語
本文使用藤Copula對(duì)不同尺度波動(dòng)率形式的聯(lián)合分布進(jìn)行建模,并在此基礎(chǔ)上對(duì)波動(dòng)率進(jìn)行預(yù)測(cè)分析。在實(shí)證分析中,本文收集了上海證券交易所中20支股票的5分鐘高頻交易數(shù)據(jù)(計(jì)算已實(shí)現(xiàn)核波動(dòng)率,RK)作為研究樣本,并采用了不同的建模和預(yù)測(cè)方案(FW、IW和RW)來比較模型的性能。研究分析表明本文模型相比于HAR模型有著明顯的優(yōu)勢(shì),CV-HAR模型不將任何函數(shù)結(jié)構(gòu)強(qiáng)加于條件期望(即變量間的線性關(guān)系),而是借助藤Copula允許更一般的函數(shù)連接不同波動(dòng)率形式,對(duì)波動(dòng)率的條件期望估計(jì)考慮了直接從聯(lián)合分布中提取,并沒有任何函數(shù)形式限制,放寬了原始HAR模型線性形式,結(jié)果也顯示都很大程度上的改進(jìn)。
參考文獻(xiàn):
[1]Torben G. Andersen and Tim Bollerslev.Answering the Skeptics: Yes, Standard Volatility Models do Provide Accurate Forecasts[J].International Economic Review,1998,39(04):885-905.
[2]Fulvio Corsi.A Simple Approximate Long-Memory Model of Realized Volatility[J].JOURNAL OF FINANCIAL ECON OMETRICS,2009,7(02):174-196.
[3]Nelsen,R.B.An introduction to copulas[J].Technometrics,2000,42(03).
[4]Harry Joe.Families of m-Variate Distributions with Given Margins and m(m-1)/2 Bivariate Dependence Parameters[J].Lecture Notes-Monograph Series,1996,28:120-141.
[5]Barndorff-Nielsen,O.E.,Hansen,P. R.,Lunde,A.,& Shephard,N.Designing realized kernels to measure the ex post variation of equity prices in the presence of noise[J].Econometrica,2008,76(06):1481-1536.
(作者單位:昆明理工大學(xué)理學(xué)院)