孫文鳳
摘要: VaR是使投資風(fēng)險(xiǎn)數(shù)量化的工具,旨在估計(jì)給定金融資產(chǎn)或組合在正常的資產(chǎn)價(jià)格波動下未來可能的或潛在的最大損失。支持向量機(jī)是一種基于傳統(tǒng)統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)算法。波動率作為金融風(fēng)險(xiǎn)的度量,是風(fēng)險(xiǎn)管理中的重要指標(biāo)。在對VaR的計(jì)算中,本文將最小二乘支持向量機(jī)與傳統(tǒng)的蒙特卡羅模擬法結(jié)合,對波動率進(jìn)行估計(jì)。實(shí)證分析表明,該方法可行有效。
Abstract: VaR is a tool making the investment risk quantification, which aims at estimating the possible or potential maximum loss in the future of a given financial asset or portfolio under the normal asset price fluctuations. Support vector machine is a kind of machine learning algorithm based on traditional statistical learning theory. As a measure of financial risk, volatility is the important indicator of risk management. In this paper, when calculating VaR, the least squares support vector machine is combined with the traditional monte carlo simulation method to estimate volatility. The empirical analysis shows that the method is feasible and effective.
關(guān)鍵詞: VaR;支持向量機(jī);最小二乘支持向量機(jī);蒙特卡羅模擬
Key words: VaR;support vector machine;least squares support vector machine;monte carlo simulation
中圖分類號:F224;F832.5 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-4311(2017)06-0212-04
0 引言
在近幾年,基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)學(xué)習(xí)方法[1]備受關(guān)注。遵循“結(jié)構(gòu)風(fēng)險(xiǎn)最小化”目標(biāo)建立起來的支持向量機(jī)(SVM)具有較強(qiáng)的泛化能力。最小二乘支持向量機(jī)(LS-SVM)[2]的原理是通過等式約束取代以往的不等式約束,使優(yōu)化課題轉(zhuǎn)換為對某個(gè)線性方程組求解的課題,從而進(jìn)一步提升算法的運(yùn)算速度。
波動率作為金融風(fēng)險(xiǎn)的度量,是風(fēng)險(xiǎn)管理中的重要指標(biāo)[3]??紤]到支持向量機(jī)在處理回歸問題(時(shí)間序列分析)和模式識別(分類問題、判別分析)等諸多問題有著成功的應(yīng)用,在對VaR進(jìn)行計(jì)算時(shí),本文將最小二乘支持向量機(jī)與傳統(tǒng)的蒙特卡羅模擬法結(jié)合對波動率進(jìn)行估計(jì),最后對上證指數(shù)進(jìn)行實(shí)證分析,說明本文所給方法的有效性。
1 最小二乘支持向量機(jī)
2.1 VaR的概念
VaR[4,5]即“處于風(fēng)險(xiǎn)中的價(jià)值”,其含義最早出自
J.P.Morgan的理論學(xué)說,它是指某一金融資產(chǎn)或證券組合在正常波動的市場環(huán)境的最大可能損失。從嚴(yán)格意義上講,VaR實(shí)際是在一定的概率水平下,某一金融資產(chǎn)或證券組合在未來特定時(shí)間段內(nèi)的最大可能損失,其表達(dá)式為:P=(?駐P>VaR)=1-?琢(10)
在上式中,?駐P表示“持有期?駐t內(nèi)證券組合的損失”,VaR則表示“置信水平?琢下處于風(fēng)險(xiǎn)中的價(jià)值”。
2.2 基于蒙特卡羅模擬法的VaR計(jì)算方法
蒙特卡羅模擬方法[6]的原理是反復(fù)模擬支配我們感興趣的金融工具的價(jià)格或回報(bào)的隨機(jī)過程。禾祺夫,董麗娟[7],基于該原理的計(jì)算和分析在學(xué)者張玉[8]和郭繁[9]的相關(guān)文獻(xiàn)中都有涉及,綜合四人的文獻(xiàn)和理論學(xué)說可總結(jié)出基于蒙特卡羅模擬法的VaR計(jì)算步驟:
①選擇能夠體現(xiàn)價(jià)格調(diào)整的隨機(jī)模型和分布,估算出相關(guān)參數(shù)。假設(shè)選擇股票價(jià)格調(diào)整模型服從幾何布朗運(yùn)動(GBM),不考慮資產(chǎn)價(jià)值的變動時(shí)間,則可通過下列公式來表達(dá)其離散形式:
3 基于最小二乘支持向量機(jī)的實(shí)證分析
本文選取上海證券交易所的日收盤指數(shù)作為樣本,選取的樣本期間為2012年1月4日到2016年8月25日,共得到1130個(gè)交易日的收盤指數(shù)數(shù)據(jù)。其中,選取2012年1月4日-2015年8月10日共874天上證指數(shù)收盤價(jià)數(shù)據(jù)作為訓(xùn)練樣本,用于波動模型的構(gòu)建以及參數(shù)的確定,而2015年8月12日-2016年8月25日共255天的數(shù)據(jù)則作為測試樣本用于預(yù)測檢驗(yàn),驗(yàn)證模型的有效性。其中,日收益率的計(jì)算方法為:?滋t=lnSt-lnSt-1(13)
其中,St表示上證指數(shù)第t個(gè)交易日收盤價(jià)。
3.1 統(tǒng)計(jì)學(xué)檢驗(yàn)
其中,N為樣本容量,S和K分別為偏度和峰度。在正態(tài)分布原假設(shè)下,Jarque-Bera證明了上述JB統(tǒng)計(jì)量漸進(jìn)地(大樣本情況下)服從自由度為2的?字2分布。故根據(jù)樣本序列計(jì)算JB統(tǒng)計(jì)值,然后與?字2分布臨界值對比,可推斷收益序列是否服從正態(tài)分布。
用Eviews軟件對訓(xùn)練樣本數(shù)據(jù)收益率進(jìn)行
Jarque-Bera檢驗(yàn),其Jarque-Bera檢驗(yàn)結(jié)果如圖1。
在95%的顯著水平上,JB統(tǒng)計(jì)量的臨界值是5.99,JB統(tǒng)計(jì)量的值大于該臨界值則表明拒絕正態(tài)分布的原假設(shè)。從Jarque-Bera檢驗(yàn)結(jié)果可以看出,訓(xùn)練樣本數(shù)據(jù)日收益率的JB統(tǒng)計(jì)量為1283.060,遠(yuǎn)大于臨界值5.99,表明訓(xùn)練樣本數(shù)據(jù)的收益率不服從正態(tài)分布。
②上證指數(shù)對數(shù)收益率時(shí)間序列分析及異方差檢驗(yàn)。
如果一個(gè)時(shí)間序列無明顯的上升或下降趨勢,各觀測值圍繞其均值上下波動,這個(gè)均值相對于時(shí)間來說是一個(gè)常數(shù),則該時(shí)間序列為平穩(wěn)序列。從表1中可以看出t統(tǒng)計(jì)量的值為-12.81567,對應(yīng)p值接近于零,表明收益序列是平穩(wěn)的。根據(jù)表2中自相關(guān)函數(shù)和偏自相關(guān)函數(shù)的數(shù)值,可以判定?滋t與?滋t-4的相關(guān)性較大,因此可對上證指數(shù)收盤價(jià)的對數(shù)收益率序列建立AR(4)模型。模型的參數(shù)估計(jì)結(jié)果如表3所示。估計(jì)模型可以表示為:
4階滯后項(xiàng)的系數(shù)的檢驗(yàn)p值小于0.05,說明在0.05的置信水平下,系數(shù)顯著不為0,即上述模型是有效的。
進(jìn)一步對上述模型的殘差項(xiàng)進(jìn)行ARCH檢驗(yàn),考察殘差項(xiàng)是否存在自回歸條件異方差。檢驗(yàn)結(jié)果如表4所示。
由表4可知,ARCH檢驗(yàn)得到F和LM統(tǒng)計(jì)量對應(yīng)的概率均小于0.05,即落入原假設(shè)(殘差項(xiàng)不存在自相關(guān))的拒絕域,可認(rèn)為模型的殘差序列存在自回歸條件異方差。
3.2 基于最小二乘支持向量機(jī)的蒙特卡羅模擬法
上證指數(shù)收益率的異方差性已通過上文的模型進(jìn)行了分析和驗(yàn)證,并且得到一個(gè)初步的結(jié)論:收益率的條件方差不是固定不變的,并且呈現(xiàn)出集聚性波動的現(xiàn)象。而通常情況下,蒙特卡羅模擬法主要通過樣本數(shù)據(jù)標(biāo)準(zhǔn)差來衡量波動性,這種集聚性波動現(xiàn)象在基于蒙特卡羅模擬法的分析過程中表現(xiàn)并不明顯,因此并不能作為分析收益率序列的尖峰厚尾特性的依據(jù)。接下來,我們將最小二乘支持向量機(jī)對波動率的估計(jì)引入到蒙特卡羅模擬法中且用t分布代替正態(tài)分布,以提高基于模型預(yù)測集聚性損失和分布尾部損失的準(zhǔn)確度。
在金融波動率模型中,GARCH類模型是一種統(tǒng)計(jì)類模型。一般都采用最大似然法(MLE)或準(zhǔn)最大似然法(QMLE)來估計(jì)GARCH類模型。其中應(yīng)用較廣的是GARCH(1,1)模型:[10]
②參數(shù)選擇。本文選擇高斯核函數(shù)作為最小二乘支持向量機(jī)的核函數(shù),參數(shù)的確定主要就是選擇高斯核函數(shù)的核寬?滓和支持向量機(jī)的正則化參數(shù)r的過程。本文選取2012年1月4日到2015年8月10日共874天上證指數(shù)收盤價(jià)作為訓(xùn)練樣本,使用網(wǎng)格搜索法確定最優(yōu)參數(shù):?酌=922.7212,?滓2=92.94345。
③模型訓(xùn)練。選取2012年1月4日到2015年8月10日共874天上證指數(shù)收盤價(jià)作為訓(xùn)練樣本,可以得到2012年1月5日到2015年8月10日共873天的收益率,以及2012年1月11日到2015年8月10日共869天的波動率。選取2012年1月12日到2015年8月10日共868天的波動率作為輸出向量y,2012年1月11日到2015年8月7日共868天的收益率平方及波動率作為輸入向量x,根據(jù)上文中對最小二乘支持向量機(jī)的介紹,對模型進(jìn)行訓(xùn)練。
④波動率估計(jì)。選取2015年8月4日到2016年8月24日共260天的收盤價(jià),可計(jì)算得到2015年8月11日到2016年8月24日共255天的收益率及波動率,根據(jù)上一步訓(xùn)練的模型我們可估計(jì)出2015年8月12日到2016年8月25日共255天的波動率。如圖2所示。
⑤計(jì)算VaR。估計(jì)出波動率之后,將最小二乘支持向量機(jī)估計(jì)出的條件方差?滓t代入到上一節(jié)用一般的蒙特卡羅模擬法計(jì)算VaR 的步驟中,取代用標(biāo)準(zhǔn)差計(jì)算的?滓,即可計(jì)算出VaR。利用最小二乘支持向量機(jī)計(jì)算2016年8月12日上證指數(shù)VaR的具體步驟如下:
1)估計(jì)均值和標(biāo)準(zhǔn)差。
本文選取考察天數(shù)為255天,即考察2015年8月12日到2016年8月25日共255個(gè)交易日。在上一部分的基礎(chǔ)上,將窗口向后推 255次,即用Matlab軟件重復(fù)計(jì)算255次,即可得到2015年8月12日到2016年8月25日這255個(gè)交易日每日 的VaR。然后,我們又分別對97.5%和99%的置信水平進(jìn)行計(jì)算,將95%置信水平得到的結(jié)果繪于圖3中。
計(jì)算出VaR之后,將VaR與實(shí)際損失進(jìn)行比較,得到VaR模型的檢驗(yàn)結(jié)果,如表5所示。
從表5中可以看出,改進(jìn)后的基于最小二乘支持向量機(jī)的蒙特卡羅模擬法預(yù)測的VaR在95%、97.5%、99%的置信水平上模型預(yù)測的失敗天數(shù)均落在了非拒絕域,表明在這三個(gè)置信水平上該模型是可以接受的。
4 結(jié)論
通過統(tǒng)計(jì)學(xué)檢驗(yàn)的方法驗(yàn)證了我國上證指數(shù)收益率數(shù)據(jù)是不服從正態(tài)分布的,存在明顯的尖峰厚尾和波動性的集聚性現(xiàn)象。而一般的蒙特卡羅模擬法使用樣本數(shù)據(jù)的標(biāo)準(zhǔn)差來衡量波動性,故不能反映出波動的集聚性現(xiàn)象,也無法解釋收益率序列的尖峰厚尾的特性,故一般的蒙特卡羅模擬法在計(jì)算VaR時(shí)就存在一定的局限性。本文將最小二乘支持向量機(jī)與傳統(tǒng)的蒙特卡羅模擬法結(jié)合對波動率進(jìn)行估計(jì)且用t分布代替正態(tài)分布,從模擬結(jié)果中可以看出,在95%、97.5%、99%的置信水平上模型預(yù)測的失敗天數(shù)均落在了非拒絕域,表明在這三個(gè)置信水平上該模型可以接受,說明本文所給方法有效。
參考文獻(xiàn):
[1]Vapnik V N, Vapnik V. Statistical learning theory[M]. New York: Wiley, 1998.
[2]Suykens J A K, Vandewalle J. Least squares support vector machine classifiers[J]. Neural processing letters, 1999, 9(3): 293-300.
[3]Chen S, Hardle W K, Jeong K. Forecasting volatility with support vector machine-based GARCH model[J]. Journal of Forecasting, 2010, 29(4): 406-433.
[4]Fernandez V.Risk Management Under Extreme Events[J].International Review of Financial Analysis,2005( 14) : 113-148.
[5]Jorion P. Value at risk: the new benchmark for controlling market risk[M]. Irwin Professional Pub, 1997.
[6]王春峰,萬海暉,張維.金融市場風(fēng)險(xiǎn)測量模型——VaR[J]. 系統(tǒng)工程學(xué)報(bào),2000,15(1): 67-75.
[7]禾祺夫,董立娟.基于蒙特卡羅模擬的 VaR 對香港恒生指數(shù)期貨的實(shí)證研究[J].內(nèi)蒙古科技與經(jīng)濟(jì),2010(1):13-15.
[8]張玉.基于蒙特卡羅模擬的幾種 VaR 模型度量效果比較[J].統(tǒng)計(jì)與決策,2009(7):54-55.
[9]郭繁.基于蒙特卡羅模擬法的風(fēng)險(xiǎn)價(jià)值(VAR)及其在中國股票市場中的運(yùn)用[D].山東大學(xué),2006.
[10]Perez-Cruz F, Afonso-Rodriguez J A, Giner J. Estimating GARCH models using support vector machines[J]. Quantitative Finance, 2003, 3(3): 163-172.
[11]Ou P, Wang H. Financial volatility forecasting by least square support vector machine based on GARCH, EGARCH and GJR models: evidence from ASEAN stock markets[J]. International Journal of Economics and Finance, 2010, 2(1): 51.