張誼然
(南京大學(xué),江蘇 南京 210000)
在計(jì)算股票收益率時(shí),人們往往運(yùn)用收盤價(jià)計(jì)算股票的收益率,而忽略當(dāng)日股價(jià)變化情況。如果在每日閉市之前,能觀察出今日的開盤價(jià)、最高價(jià)、最低價(jià),就可準(zhǔn)確預(yù)測出今日的收盤價(jià)。劉廣麗(2007)利用嶺回歸的方法,對我國上海股市進(jìn)行研究,建立了多元線性回歸模型,并進(jìn)行預(yù)測。本文通過編寫MATLAB程序,用2011 年242 個(gè)交易日的數(shù)據(jù),對“中國銀行”股票價(jià)格進(jìn)行嶺回歸分析。
首 先, 建 立 回 歸 方 程。Y(i,1)=b(1,1)+b(2,1)*x(i,1)+b(3,1)*x(i,2)+ b(4,1)*x(i,3) ,其中Y(i,1)代表日收盤價(jià),x(i,1)代表日最高價(jià),x(i,2)代表日最低價(jià),x(i,3)代表日最高價(jià)。經(jīng)過回歸得到線性方程Y(i,1)=0.0023-0.5253* x(i,1)+ 0.7818* x(i,2)+ 0.7433* x(i,3)?;貧w得到的R 方為0.9969,F(xiàn) 值為25349。因此,可以初步判斷上述回歸方程成立。但由于自變量間可能存在嚴(yán)重共線性,需要對其共線性進(jìn)行分析。
其次,對自變量進(jìn)行標(biāo)準(zhǔn)化處理。令z(i,j)=(x(I,j)-μj)/∑( x ( i , j )-μj)2, μj為自變量的樣本均值。得到的z 矩陣,為標(biāo)準(zhǔn)化的自變量。對z 進(jìn)行線性回歸Y(i,1)=bb(1,1)+ bb(2,1)* z(i,1)+bb(3,1)*z(i,2)+bb(4,1)*z(i,3),得到回歸方程為Y(i,1)=3.7256-2.9928* z(i,1)+ 4.506* z(i,2)+ 4.1702*z(i,3)。最后,觀察方差膨脹系數(shù)。由于方差的膨脹系數(shù)VIF 為inv(z’z)主對角線上的數(shù),可觀察到VIF1=237.8; VIF2=162.17; VIF3=153.03,本模型存在嚴(yán)重的多重共線性。
嶺回歸法是A.E.Horel 在1962 年提出的一種能診斷和處理多重共線性的方法。在多重共線性非常嚴(yán)重的情況下,兩個(gè)共線變量的系數(shù)之間的二維聯(lián)合分布是山嶺狀曲面,曲面上的每個(gè)點(diǎn)均對應(yīng)一個(gè)殘差平方和,點(diǎn)的位置越高,相應(yīng)的殘差平方和越小。構(gòu)造嶺估計(jì),估計(jì)參數(shù)bl=inv(z’z + kI)*z’Y ,其中k 為嶺回歸參數(shù)。當(dāng)k=0 時(shí),估計(jì)參數(shù)就是普通最小二乘估計(jì)。當(dāng)k增加時(shí),所有的參數(shù)估計(jì)的絕對值都不斷變小,對參數(shù)估計(jì)的偏差越大。但隨k 增加,矩陣inv(z’z + kI)主對角元素Cii(k)將不斷減少,即回歸系數(shù)的誤差平方和將下降,嶺估計(jì)的方差膨脹系數(shù)會隨k 的增加而減少。所以在k 取適當(dāng)?shù)闹禃r(shí),用嶺回歸估計(jì)出的參數(shù)比用最小二乘法估計(jì)的參數(shù)更穩(wěn)定。一般而言,k的取值范圍為(0,0.5),在這個(gè)區(qū)間內(nèi),嶺回歸的方差膨脹系數(shù)Cii(k)≤10,說明共線性很小。
本文用MATLAB 選取k 范圍為[0.01,0.02]。利用膨脹系數(shù)C=inv(z'z+k*I(3))*z'z*inv(z'z+k*I(3)),選 擇出使C ≤10 的k。當(dāng)k 取[0.013,0.02]時(shí),方差膨脹系數(shù)都小于10,特別當(dāng)k 等于0.02 時(shí),方差膨脹因子最?。ㄒ姳硪唬@L制嶺跡圖k 取0.02 時(shí),參數(shù)的估計(jì)值趨于穩(wěn)定。自變量最高價(jià)的估計(jì)參數(shù)也改變了符號,其對日收盤價(jià)的影響從負(fù)效應(yīng)變?yōu)檎?yīng),這也符合經(jīng)濟(jì)邏輯。據(jù)此,可以建立嶺回歸估計(jì)方程為Y(i,1)=3.7256+1.2812* z(i,1)+2.1984* z(i,2)+ 2.1636*z(i,3),把標(biāo)準(zhǔn)化后的自變量經(jīng)過還原后,回歸方程為Y(i,1)= -3.6616+0.2249* x(i,1)+ 0.3815* x(i,2)+ 0.3857* x(i,3),此時(shí)R 方為0.9807,F(xiàn) 值為4024.7,經(jīng)過嶺估計(jì)的回歸擬合成立,且消除共線性的影響。
表一 inv(z'z+0.02*I(3))*z'z*inv(z'z+0.02*I(3))
本文運(yùn)用嶺回歸的方法解決了多重共線性的影響,得到了中國銀行股票日收盤價(jià)與開盤價(jià)、最高價(jià)、最低價(jià)的回歸方程。bb(i,1)= 0.2249,表示每增加一個(gè)單位的開盤價(jià),會使當(dāng)日收盤價(jià)增加0.2249 個(gè)單位;bb(i,2)= 0.3815,表示每增加一個(gè)單位的最高價(jià),會使當(dāng)日收盤價(jià)增加0.3815 個(gè)單位;bb(i,3)= 0.3857,表示每增加一個(gè)單位的最低價(jià),會使當(dāng)日收盤價(jià)增加0.3857 個(gè)單位。這說明已知股票的開盤價(jià)、最高價(jià)、最低價(jià),有利于估測該股票的收盤價(jià)。
[1]劉廣麗. 嶺回歸方法在股市中的應(yīng)用[J]. 金融經(jīng)濟(jì),2007(16).
[2]楊楠. 嶺回歸分析在解決多重共線性問題中的獨(dú)特作用[J]. 統(tǒng)計(jì)與決策,2004(03).