朱家明,劉紅杉,朱運(yùn)良,程瑤瑤,于靜
(1.安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院,安徽 蚌埠233030;2.安徽財(cái)經(jīng)大學(xué)會計(jì)學(xué)院,安徽 蚌埠233030)
股票間的相關(guān)性對于風(fēng)險(xiǎn)管理、投資決策具有重要影響.對于股票相關(guān)性的研究,現(xiàn)代金融理論主要基于經(jīng)濟(jì)基本面進(jìn)行解釋,即認(rèn)為相關(guān)性來源于影響資產(chǎn)現(xiàn)金流和影響資產(chǎn)折現(xiàn)率的基本面因素.股票市場作為復(fù)雜系統(tǒng)日益受到人們的關(guān)注,近年來,經(jīng)濟(jì)、數(shù)學(xué)、社會等領(lǐng)域的學(xué)者都開始用復(fù)雜網(wǎng)絡(luò)及其相關(guān)概念來研究股票市場,進(jìn)而研究股票間相關(guān)性.
數(shù)據(jù)來源于安徽財(cái)經(jīng)大學(xué)2014暑期數(shù)學(xué)建模模擬題[1].為了便于解決問題,提出了以下假設(shè):1)股票數(shù)據(jù)可以簡單地看成時(shí)間序列數(shù)據(jù),節(jié)假日的休市也不對股票序列的順序產(chǎn)生影響;2)文中股票的變動只與自身和相關(guān)股票有關(guān);3)以收益率為股票間相關(guān)性的度量指標(biāo)能夠很好的反映出股票間的相關(guān)性;4)Netdraw作圖能夠很好的反映變量組合間的關(guān)系.
研究數(shù)據(jù)發(fā)現(xiàn),考慮現(xiàn)金紅利再投資的周個(gè)股回報(bào)率數(shù)據(jù)的缺少是由于缺少上周收盤價(jià)Pi(t-1)的數(shù)據(jù),它與本周開盤價(jià)Qi(t)數(shù)值非常接近.首先把每只股票上周的收盤價(jià)Pi(t-1)減去本周的開盤價(jià)Qi(t),將差值求和取平均,最后利用本周開盤價(jià)Qi(t)加上差值平均值來近似代替上周收盤價(jià)Pi(t-1),即:
對于每只股票,考慮現(xiàn)金紅利再投資的周個(gè)股回報(bào)率ai和不考慮現(xiàn)金紅利再投資的周個(gè)股回報(bào)率bi相等,利用公式:,便可得到缺失的數(shù)據(jù)(見表1).
表1 缺失的數(shù)據(jù)填充表
現(xiàn)代投資組合理論中,人們用股票的預(yù)期收益率來描述預(yù)期收益,用收益率方差來度量風(fēng)險(xiǎn),且線性相關(guān)系數(shù)越小,投資組合風(fēng)險(xiǎn)就越小,即收益率與股票的相關(guān)性大小關(guān)系密切,因此,選擇股票收益率作為股票間相關(guān)性度量指標(biāo).
選取股票的收益率為度量指標(biāo),利用時(shí)間序列相關(guān)性知識,得出股票的相關(guān)系數(shù)矩陣[2].
選取第16周~第25周的沒有缺失數(shù)據(jù)的所有股票來進(jìn)行研究.利用公式計(jì)算股票收益率.
其中Pi(t)是股票i在第t周的周收盤價(jià),Qi(t)是股票i在第t周的周開盤價(jià),Ri(t)是股票i在第t周的周收益率.
cov(R1,R2)表示向量R1和R2間的協(xié)方差,σ1和σ2分別表示R1和R2間的標(biāo)準(zhǔn)方差,假設(shè)各數(shù)據(jù)的概率相等且為,則:
那么,相關(guān)系數(shù)為
對上述模型,運(yùn)用Matlab軟件進(jìn)行求解[3],繼而可得到股票的相關(guān)系數(shù)矩陣:
由于股票價(jià)格的缺失對于模型求解結(jié)果存在較大的影響,故要對數(shù)據(jù)進(jìn)行預(yù)處理,選出合適的股票,根據(jù)每只股票的收益率,運(yùn)用Matlab編程可求得股票間的相關(guān)系數(shù)矩陣.其次,在給定閾值0.5的基礎(chǔ)上,選取一系列新的閾值,計(jì)算每個(gè)閾值下所構(gòu)建網(wǎng)絡(luò)的最大連通子圖節(jié)點(diǎn)個(gè)數(shù),選取其節(jié)點(diǎn)個(gè)數(shù)變化穩(wěn)定時(shí)的閾值作為最佳閾值.最后,基于相關(guān)系數(shù)和最佳閾值來構(gòu)建股票網(wǎng)絡(luò)[4].
對前面所選取的數(shù)據(jù),利用(3)式和Matlab編程,可求得解股票的相關(guān)系數(shù)矩陣:
股票代表網(wǎng)絡(luò)中的點(diǎn),如果相關(guān)系數(shù)ρ12≥θ(θ∈[-1,1]),就認(rèn)為節(jié)點(diǎn)i和j之間有連邊,這里的θ即閾值點(diǎn).閾值在一定區(qū)間變化時(shí),網(wǎng)絡(luò)是高度聚類的,具有明顯的拓?fù)湫再|(zhì).
在給定閾值0.5的基礎(chǔ)上,選取一系列新的閾值點(diǎn),可求得每個(gè)閾值所構(gòu)建的網(wǎng)絡(luò)連接的總邊數(shù),近而比較不同閾值下的總邊數(shù)變化(見表2).
表2 不同閾值下所構(gòu)建股票網(wǎng)絡(luò)節(jié)點(diǎn)連接的總邊數(shù)變化表
為直觀了解閾值與股票數(shù)的相關(guān)關(guān)系,對表2利用Excel作圖(見圖1).
圖1 不同閾值與所構(gòu)建網(wǎng)絡(luò)連接的總邊數(shù)變化折線圖
從圖1可以看出,閾值在0.6以后,所構(gòu)建的網(wǎng)絡(luò)連接的總邊數(shù)變化較平穩(wěn),并且可以看出閾值在0.657之前,最大連通子圖的節(jié)點(diǎn)個(gè)數(shù)變化較快,到0.6時(shí)變化開始變得平緩.發(fā)現(xiàn)閾值為0.6時(shí)網(wǎng)絡(luò)拓?fù)湫再|(zhì)較穩(wěn)定,因此選取0.6為最佳閾值.由此運(yùn)用軟件Netdraw可繪出基于相關(guān)系數(shù)和最佳閾值構(gòu)建的股票網(wǎng)絡(luò)(見圖2).
圖2 基于相關(guān)系數(shù)和最佳閾值構(gòu)建的股票網(wǎng)絡(luò)
當(dāng)某些股票連接較多的節(jié)點(diǎn)時(shí),這些股票的波動會直接影響著其他較多股票的走勢.這些反映整體價(jià)格走勢的點(diǎn)代表,相互連接程度高,股價(jià)的波動較容易在市場中傳播.與其他股票交往頻繁、聯(lián)系緊密的節(jié)點(diǎn),本文稱作股票網(wǎng)絡(luò)的核心節(jié)點(diǎn);當(dāng)某些股票的相鄰股票節(jié)點(diǎn)數(shù)為2~4個(gè)時(shí),它們沿分支方向調(diào)整和傳遞波動的信息,本文稱作股票網(wǎng)絡(luò)的中間節(jié)點(diǎn);當(dāng)某些股票只有一條邊與其他節(jié)點(diǎn)連接時(shí),則說明它與其他的股票交往較少,相關(guān)度不大,本文稱作邊界節(jié)點(diǎn).
系統(tǒng)聚類法[5]基本思想是:聚類開始時(shí)將n個(gè)樣品(或p個(gè)變量)各自歸為一類,并規(guī)定樣品(或變量)之間的距離和類與類之間的距離,然后將距離最近的兩類合并成一個(gè)新類,計(jì)算新類與其他類之間的距離,重復(fù)進(jìn)行兩個(gè)最近類的合并,每次減少一類,直至所有的樣品(或變量)合并為一類,最后形成一個(gè)親疏關(guān)系圖譜(見圖3).
圖3 最短距離法的聚類樹型圖
本文采用最短距離法聚類,步驟如下:
1)將初始的每個(gè)樣品各自作為一類,并規(guī)定樣品之間的距離,本文采用歐氏距離.計(jì)算n個(gè)樣品之間的距離矩陣D(0),它是一個(gè)對稱矩陣.其中,第i個(gè)樣品Xi和第j個(gè)樣品Xj之間的歐式距離定義為:
2)尋找D(0)中最小元素,設(shè)為DLK,將GK和GL聚成一個(gè)新類,記為GM,即GM= { GK,GL}.
3)計(jì)算新類GM與任一類GJ之間距離的遞推公式為
對距離矩陣D(0)進(jìn)行修改,將GK和GL所在的行和列合并成一個(gè)新行新列,對應(yīng)GM,新行和新列上的新距離由遞推公式計(jì)算,其余行列上的值不變,這樣得到的新距離矩陣記為D(1).
4)對D(1)重復(fù)上述對D(0)的兩步操作,得到距離矩陣D(2),如此下去,直至所有元素合并成一類為止.
運(yùn)行Matlab編程,可求得部分系統(tǒng)聚類分析的結(jié)果(見表3).
表3 部分聚類分析結(jié)果以及現(xiàn)實(shí)板塊對比表
從表3中可以看出,所求得的股票板塊劃分結(jié)果與現(xiàn)實(shí)的有所不同,主要是由于劃分標(biāo)準(zhǔn)不相同,上表所采取的劃分標(biāo)準(zhǔn)是按股票的收益率,但是已有的結(jié)果是通過股票背后的市場類型來進(jìn)行劃分的.通過劃分的結(jié)果與原來板塊進(jìn)行對比還可以發(fā)現(xiàn),原來在同一板塊的股票在劃分之后基本上還在同一板塊,這是由于同一板塊的股票具有相似的變化趨勢,原來板塊內(nèi)部股票的收益率也有一定相關(guān)性,這與本文的劃分標(biāo)準(zhǔn)有重合點(diǎn),這就是劃分后每個(gè)版塊的股票種類沒有很大變化的重要原因.
本文通過綜合運(yùn)用上述相關(guān)性分析、系統(tǒng)聚類分析、網(wǎng)絡(luò)構(gòu)建等方法,以收益率為指標(biāo),最終建立了基于相關(guān)系數(shù)和最佳系數(shù)的股票網(wǎng)絡(luò),為劃分中國股票市場中的板塊提供了可行性方案[6].本文所建立的股票間相關(guān)性度量指標(biāo)模型簡潔便于理解,為股票之間的相互作用提供了理論基礎(chǔ),也為股票市場中股票投資組合風(fēng)險(xiǎn)的研究提供一定的研究基礎(chǔ).
[1]2014 年安徽財(cái)經(jīng)大學(xué)數(shù)學(xué)建模模擬賽 A 題.[EB/OL].http://zhujm1973.blog.163.com/blog/static/315513552014923288768.
[2]彭宏.股票數(shù)據(jù)流的相關(guān)性計(jì)算方法[J].華南理工大學(xué)學(xué)報(bào).2006,34(1):86-89.
[3]吳禮斌,閆云俠.經(jīng)濟(jì)數(shù)學(xué)實(shí)驗(yàn)與建模[M].天津:天津教育出版社,2009.
[4]吳翎燕.基于相關(guān)系數(shù)和最佳閾值的股票網(wǎng)絡(luò)模型構(gòu)建[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2013,10(4):49-55.
[5]謝中華.MATLAB統(tǒng)計(jì)分析與應(yīng)用:40個(gè)案例分析[M].北京:北京航天航空大學(xué)出版社,2012.
[6]王婷,朱家明,韋銳,等.中國GDP影響因素及可持續(xù)發(fā)展的計(jì)量分析[J].菏澤學(xué)院學(xué)報(bào),2014,36(2):8-15.