楊思思
(重慶工商大學(xué)融智學(xué)院 經(jīng)濟(jì)學(xué)院,重慶 巴南401320)
基金經(jīng)理經(jīng)常面臨如何將大額資金快速而方便地投入或撤出股票市場(chǎng),然而買進(jìn)或賣出如此大量的個(gè)別股票必定會(huì)造成價(jià)格的劇烈波動(dòng),而且也可能違背基金分散投資的宗旨,就要承擔(dān)非系統(tǒng)風(fēng)險(xiǎn)。因此,市場(chǎng)的流動(dòng)性與投資組合的結(jié)構(gòu)是大型基金經(jīng)理非常關(guān)心的課題。
一般情況下,個(gè)別股票的操作績(jī)效取決于三個(gè)因素:整個(gè)市場(chǎng)、所屬產(chǎn)業(yè)和個(gè)別公司[1]。絕大多數(shù)分析家認(rèn)為,整體市場(chǎng)的走勢(shì)方向最重要,個(gè)股績(jī)效可能有70%取決于整體市場(chǎng)的走勢(shì)。第二個(gè)重要因素是產(chǎn)業(yè)的基本面發(fā)展趨勢(shì),個(gè)股績(jī)效可能有20%來(lái)自于這方面的影響。所以,個(gè)別股票的操作績(jī)效大約只有10%來(lái)自于特定公司的營(yíng)運(yùn)表現(xiàn)。此外,當(dāng)重大經(jīng)濟(jì)事件發(fā)生的時(shí)候,通常很容易預(yù)測(cè)整體股票市場(chǎng)受到的影響,卻難以判別個(gè)股反應(yīng)。為了實(shí)現(xiàn)對(duì)“整個(gè)市場(chǎng)”進(jìn)行交易,而不是個(gè)別股票,金融市場(chǎng)發(fā)展出了新的交易工具——股指期貨。不同于其他期貨合約,由于經(jīng)常劇烈波動(dòng),給期貨持有者帶來(lái)巨大風(fēng)險(xiǎn),指數(shù)期貨便應(yīng)運(yùn)而生。這些產(chǎn)品讓基金經(jīng)理得以針對(duì)市場(chǎng)而不是個(gè)別股票來(lái)進(jìn)行交易。于是,各種股票指數(shù)與其權(quán)重股的研究備受關(guān)注[2-3],能更準(zhǔn)確地對(duì)實(shí)際市場(chǎng)波動(dòng)情況進(jìn)行擬合,以及更加真實(shí)地反映上證指數(shù)的市場(chǎng)風(fēng)險(xiǎn)特性成為建立上證指數(shù)模型的重要目標(biāo)[4]。
本文以中證100股票數(shù)據(jù)為研究對(duì)象,建立中證100股票指數(shù)與其成分股的線性回歸模型,利用嶺估計(jì)和彈性約束估計(jì)分別探討模型中嚴(yán)重存在的多重共線性。再通過(guò)限定最低門限修正彈性約束估計(jì)回歸模型結(jié)果,解決模型中部分估計(jì)系數(shù)為負(fù)值的問(wèn)題。然后去除系數(shù)估計(jì)值為最低門限值的回歸變量,得到中證100股票指數(shù)模型。
數(shù)據(jù)來(lái)自大智慧軟件,選取中證100指數(shù)從2014年6月16日到2014年12月12日之間的日線數(shù)據(jù)。利用R軟件分析數(shù)據(jù)并建立模型。
金融市場(chǎng)中的很多變量是相互依存的,但是沒(méi)有嚴(yán)格的函數(shù)關(guān)系。線性回歸模型常用來(lái)刻畫證券市場(chǎng)眾多的變量關(guān)系。然而分析變量間的相關(guān)性是建立線性回歸模型的首要任務(wù),于是利用R軟件對(duì)因變量Y(中證100指數(shù))與各成分股X1,X2,…,X100之間的相關(guān)性進(jìn)行分析,得到Y(jié)與X1,X2,…,X100的相關(guān)系數(shù),結(jié)果表明有75%的相關(guān)系數(shù)均大于0.8。因此,建立因變量Y與自變量X1,X2,…,X100的線性回歸模型的初步設(shè)想是合理的。
中證100指數(shù)與大多數(shù)成分股存在較強(qiáng)的相關(guān)關(guān)系,因此可以建立中證100指數(shù)與各只股票間的線性回歸模型:
將樣本數(shù)據(jù)代入上述回歸模型,基于最小二乘法[5],得到回歸系數(shù)β的最小二乘估計(jì)值。進(jìn)一步用模型F檢驗(yàn)得到p=2.2×10-16,說(shuō)明模型整體擬合效果不錯(cuò),但是仍然存在很多回歸系數(shù)無(wú)法通過(guò)顯著性檢驗(yàn)。此外,回歸模型中回歸系數(shù)估計(jì)值出現(xiàn)負(fù)值,這顯然與實(shí)際意義不符。
線性回歸模型的建立是基于殘差項(xiàng)服從正態(tài)分布的假設(shè)。為了驗(yàn)證線性回歸模型(1)的正態(tài)假定是否合理,需要對(duì)其殘差做夏皮羅-威爾克(Shapiro-Wilk)正態(tài)性檢驗(yàn)[6]。通過(guò)R程序計(jì)算得到W=0.995 8,顯著概率為0.977,結(jié)果表明殘差滿足正態(tài)性假設(shè)。
另一方面,自變量相關(guān)系數(shù)矩陣的條件數(shù)是度量多重共線性嚴(yán)重程度的一個(gè)重要指標(biāo)。實(shí)際經(jīng)驗(yàn)表明,如果條件數(shù)小于100,則認(rèn)為變量間多重共線性程度較輕微,當(dāng)條件數(shù)大于1 000,則認(rèn)為存在嚴(yán)重的多重共線性。
經(jīng)計(jì)算,模型(1)的100個(gè)自變量間相關(guān)矩陣的條件數(shù)為10 084 240,遠(yuǎn)遠(yuǎn)大于1 000。再計(jì)算其特征值,得到最大特征值為7.55,最小特征值僅為0.000 036 8,均表明模型(1)存在嚴(yán)重的多重共線性。此外,計(jì)算得到模型的均方誤差(MSE)為429 794。
綜上所述,說(shuō)明基于所有自變量X1,X2,…,X100的線性回歸模型效果不好,因此需要進(jìn)一步對(duì)模型進(jìn)行改進(jìn)。
因?yàn)槟P痛嬖趪?yán)重的多重共線性,所以必須對(duì)模型進(jìn)行改進(jìn),而有偏估計(jì)是解決多重共線性最直接的方法。其中最常用的是Hoerl和Kennard提出的嶺估計(jì)[7]。
嶺估計(jì)含有一個(gè)參數(shù)k,需要利用嶺跡法來(lái)選擇參數(shù)。其原理在于:嶺估計(jì)得到的每個(gè)回歸系數(shù)βi(k)(i=1,…,100)均是k的函數(shù),當(dāng)k在[0,+∞)變化時(shí),在平面直角坐標(biāo)系所描出圖形稱為嶺跡,將100個(gè)βi(k)的嶺跡畫在同一個(gè)圖上,選擇k使得每個(gè)回歸系數(shù)的值大體穩(wěn)定,并且兼顧殘差平方和上升不太多等約束。
通過(guò)R程序,繪出嶺跡圖如圖1所示。當(dāng)k=0.2時(shí),各條曲線基本趨于穩(wěn)定。
圖1 嶺跡圖
進(jìn)一步通過(guò)函數(shù)Select計(jì)算,得到如下三種嶺參數(shù):HKB的k值是0.04,L-W的k值是0.004,GCV的最小值是0.04。三種k值均小于0.2,但是L-W的k值太小,計(jì)算出來(lái)的MSE仍然會(huì)很大,于是選擇k=0.04,得到如下的經(jīng)驗(yàn)線性回歸方程:
計(jì)算得到殘差平方和為81.27,MSE為5 669.44,即表明嶺估計(jì)得到的線性回歸方程能夠很好地刻畫中證100股指的趨勢(shì)。但是從方程的系數(shù)來(lái)看,負(fù)系數(shù)估計(jì)值仍然較多并且其絕對(duì)值較大,說(shuō)明模型仍然有待進(jìn)一步調(diào)整。
證券市場(chǎng)中的很多變量是相互依存的,導(dǎo)致多重共線性。因此沒(méi)有必要將高度關(guān)聯(lián)的自變量均考慮到線性回歸模型的建立中。反映在股票上,同一行業(yè)內(nèi)的股票具有很強(qiáng)的相關(guān)性,應(yīng)當(dāng)選取該行業(yè)內(nèi)具有代表性的一支或者幾支來(lái)實(shí)現(xiàn)股票指數(shù)跟蹤。另一方面,各只股票對(duì)指數(shù)的影響程度不同,對(duì)于影響甚微的股票,沒(méi)有必用其成分股來(lái)模擬中證100指數(shù)。
2005年Zou和Hastie通過(guò)合并嶺回歸和LASSO[8-9],提出了彈性約束估計(jì)(Elastic net)正好可以解決上述問(wèn)題。利用R軟件中的Glmnlet程序包計(jì)算得到上述線性回歸模型的彈性約束估計(jì),經(jīng)過(guò)CV交叉驗(yàn)證[10],確定最佳λ值為4.53。于是得到含25個(gè)自變量的線性回歸模型:
在實(shí)際投資實(shí)踐中,基金經(jīng)理需要用最少的股票達(dá)到對(duì)股票指數(shù)的跟蹤。這里通過(guò)彈性約束估計(jì)得到的最優(yōu)解僅僅包含了25支成分股,已經(jīng)能夠滿足持股和利用股指期貨實(shí)現(xiàn)風(fēng)險(xiǎn)對(duì)沖的目的。此外,計(jì)算得到殘差平方和為7 144.95,彈性約束估計(jì)殘差圖如圖2所示。因此,根據(jù)彈性約束估計(jì)建立的線性回歸模型基本上可以模擬出中證100指數(shù)的實(shí)際走勢(shì),但是擬合效果仍然不是很好。
圖2 彈性約束估計(jì)殘差圖
利用彈性約束估計(jì)從100只股票中選出了25只,下面將進(jìn)一步建立股票指數(shù)與25只股票的最小二乘線性回歸方程并檢驗(yàn)其顯著性。
計(jì)算結(jié)果表明F檢驗(yàn)高度顯著,大部分變量通過(guò)了顯著性檢驗(yàn)。此外,通過(guò)殘差正態(tài)性檢驗(yàn)得到對(duì)數(shù)正態(tài)QQ圖,如圖3所示,只有第60日和第115日的數(shù)據(jù)不在虛線上。經(jīng)查看第60日的股票價(jià)格和指數(shù)并無(wú)太多異常,但第115日下一日的股價(jià)和指數(shù)出現(xiàn)了異常的全體上漲??傮w上,修正后的線性回歸模型擬合效果整體不錯(cuò),但不足之處在于部分回歸系數(shù)仍為負(fù)值。
圖3 對(duì)數(shù)正態(tài)QQ圖
而根據(jù)實(shí)際情況,中證100指數(shù)是其成分股走勢(shì)的線性組合,受成分股走勢(shì)的影響應(yīng)該為正的。下面對(duì)選出來(lái)的25個(gè)變量建立正回歸,限定最低門限為0.001 36。利用R軟件計(jì)算,得到如下的線性回歸模型:
該模型的殘差平方和為3 432,表明模型(4)明顯好于修正前的彈性約束估計(jì)模型(3)。
此外,模型(4)中有7個(gè)變量的回歸系數(shù)是最低門限值,即這7個(gè)變量在中證100指數(shù)追蹤中所起的作用不是特別明顯。于是嘗試將其舍去,用剩下的18個(gè)變量建立中證100指數(shù)線性回歸模型為:
模型(5)的F檢驗(yàn)高度顯著,只有3個(gè)變量未通過(guò)p=0.01的顯著性檢驗(yàn),并且所有回歸系數(shù)估計(jì)值均為正數(shù)。此外,殘差平方和為1 956,表明它比25支成分股建立的線性回歸模型的效果好。均方誤差(MSE)為142 904,遠(yuǎn)遠(yuǎn)小于最初100個(gè)變量建立的線性回歸模型的MSE。綜上所述,經(jīng)過(guò)此次修正后的股票指數(shù)線性回歸模型是最可行有效的。表1是中證100指數(shù)回歸模型中成分股股票以及對(duì)應(yīng)的回歸系數(shù)。圖4是其股指追蹤效果圖,表明這18只股票可以有效地模擬出指數(shù)的實(shí)際走勢(shì)。
表1 中證100指數(shù)回歸模型成分股的權(quán)重系數(shù)
圖4 股指追蹤圖
本文以中證100股票指數(shù)及其成分股為研究對(duì)象,結(jié)合模型檢驗(yàn)并不斷修正模型結(jié)果,得到了可行有效、總體效果最佳的中證100股票指數(shù)回歸模型。實(shí)證分析表明,本文所建立的中證100股票指數(shù)回歸模型具有很好的股指追蹤模擬效果,對(duì)投資者具有較高的參考價(jià)值,能夠在一定程度上降低投資風(fēng)險(xiǎn),提高股票投資的持續(xù)性和穩(wěn)定性。
[1]彭春.權(quán)重股對(duì)股票指數(shù)影響的實(shí)證分析[J].科技經(jīng)濟(jì)市場(chǎng),2010(9):57-58.
[2]孫秀琳,宋軍.基于權(quán)重股的股指期貨操縱模式研究:2007—2008交易數(shù)據(jù)的實(shí)證檢驗(yàn)[J].世界經(jīng)濟(jì)情況,2009(1):81-89.
[3]楊先明,梁任敏.貨幣供應(yīng)量對(duì)我國(guó)股票價(jià)格影響的實(shí)證分析[M].昆明:云南大學(xué)出版社,2013.
[4]周炳均,王沁,鄭興.基于兩種分布下的SV模型與GARCH模型的VAR比較[J].重慶文理學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2016(5):133-137.
[5]陳希孺,王松桂.線性模型中的最小二乘法[M].上海:上??萍汲霭嫔?2003.
[6]SHAPIRO S S,WILK M B.An analysis of variance test for normality(complete samples)[J].Biometrika,1965(3-4):591-611.
[7]HOERL A E,KENNARD R W.Ridge regression:Biased estimation for nonorthogonal problems[J].Technometrics,1970(1):55-67.
[8]ZOU H,HASTIE T.Regularization and variable selection via the elastic net[J].Journal of the Royal Statistical Society:Series B,2005(2):301-320.
[9]TIBSHIRANI R.Regression shrinkage and selection via the lasso[J].Journal of the Royal Statistical Society:Series B,1996(1):267-288.
[10]GEISSER S.Predictive inference[M].New York:Chapman and Hall,1993.
重慶文理學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版)2018年2期