湯胤 毛景慧
摘 要:基于拐點(diǎn)集合判別的TBUD方法主要思路是分析拐點(diǎn)集合間的關(guān)系,并在高維空間進(jìn)行劃分,從而搭建判別模型,并將分析框架應(yīng)用在特質(zhì)波動(dòng)率等若干指標(biāo)上,利用實(shí)證數(shù)據(jù)得到結(jié)論。應(yīng)用TBUD判別框架可以發(fā)現(xiàn),特質(zhì)波動(dòng)率等指標(biāo)無法對(duì)拐點(diǎn)集合進(jìn)行清晰劃分,因而并不具有預(yù)測(cè)能力。
關(guān)鍵詞: 特質(zhì)波動(dòng)率;支持向量機(jī);貝葉斯判別;趨勢(shì)預(yù)測(cè)
中圖分類號(hào):F830.9 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào):1003-7217(2016)03-0035-05
一、引言
金融工程學(xué)科采用經(jīng)典的資產(chǎn)組合方法,事實(shí)上是通過按規(guī)則不斷重新組合資產(chǎn)獲得某指標(biāo)與滯后一期的收益率關(guān)系的顯著性,方法本身受數(shù)據(jù)影響很大,從而導(dǎo)致不同的結(jié)果。而眾所周知,即使存在預(yù)測(cè)性,指標(biāo)也并不僅僅作用于滯后一期,而很可能是不定多期,這使得資產(chǎn)組合方法存在一定的限制。此外,股價(jià)時(shí)間序列的混沌性也使得采用線性回歸方法得到結(jié)論的信度不高。很典型的,近年學(xué)術(shù)界對(duì)于特質(zhì)波動(dòng)率的預(yù)測(cè)能力,得出了完全對(duì)立的研究結(jié)論,究其原因正是基于高度數(shù)據(jù)敏感的資產(chǎn)組合分析方法。
對(duì)時(shí)間序列進(jìn)行聚類/分類和預(yù)測(cè)更是眾多科學(xué)領(lǐng)域感興趣的問題。時(shí)間序列聚類的算法包括基于相似性(距離)[1]、基于特征[2]和模型[3]等聚類分析方法,而分類的算法主要包括了決策樹、神經(jīng)網(wǎng)絡(luò)、貝葉斯分類以及支持向量機(jī)等;時(shí)間序列的預(yù)測(cè)大體可分為線性和非線性兩類,其中,非線性時(shí)間序列的預(yù)測(cè)主要采用嵌入空間法或神經(jīng)網(wǎng)絡(luò)等方法,如陶小創(chuàng)等(2011)的基于神經(jīng)網(wǎng)絡(luò)的時(shí)間序列預(yù)測(cè)[4]和尹華等(2011)的混沌時(shí)間序列預(yù)測(cè)[5,6]。
本文從金融時(shí)間序列拐點(diǎn)出發(fā),直觀考察波峰與波谷以及上升(下降)與拐點(diǎn)集合間的分離特性,拐點(diǎn)集合在高維空間進(jìn)行劃分,從而搭建分析模型;提出TBUD 方法為金融時(shí)間序列的分析提供新的分析框架;同時(shí),以單因子和多因子下特質(zhì)波動(dòng)率對(duì)股價(jià)未來趨勢(shì)的預(yù)測(cè)能力進(jìn)行分析。二、特質(zhì)波動(dòng)率的預(yù)測(cè)能力分析
隨著Ang、Hodrick、Xing、Zhang(以下簡(jiǎn)稱AHXZ)發(fā)現(xiàn)“特質(zhì)波動(dòng)率之迷”的現(xiàn)象,特質(zhì)波動(dòng)率(Idiosyncratic Volatility,以下簡(jiǎn)稱IV)與橫截面收益的相關(guān)關(guān)系成為了國(guó)內(nèi)外眾多學(xué)者研究的熱點(diǎn)。在現(xiàn)實(shí)市場(chǎng)中,投資者由于信息不對(duì)稱、賣空機(jī)制的限制等原因,投資者實(shí)際上沒有能力按照經(jīng)典資產(chǎn)定價(jià)模型(CAPM)構(gòu)造出完全消除特質(zhì)風(fēng)險(xiǎn)(Idiosyncratic Risk)的投資組合。Goyal 和SantaClara(2003)發(fā)現(xiàn)平均特質(zhì)波動(dòng)率對(duì)市場(chǎng)的超額收益有顯著的影響[10];AHXZ(2006)發(fā)現(xiàn)滯后的特質(zhì)波動(dòng)率與股票未來收益呈負(fù)相關(guān)關(guān)系,這與傳統(tǒng)的資產(chǎn)定價(jià)理論相違背,并由此引出了“特質(zhì)波動(dòng)率之迷”存在與否的爭(zhēng)論[11,12];而Fu(2009)、Huang(2010)、Chuan(2010)等人對(duì)AHXZ 的研究提出了質(zhì)疑,他們各自研究發(fā)現(xiàn)特質(zhì)波動(dòng)率與收益之間是一種正相關(guān)的關(guān)系,“特質(zhì)波動(dòng)率之迷”是由于研究者錯(cuò)誤地使用了滯后的特質(zhì)波動(dòng)率或由于收益反轉(zhuǎn)所造成的;左浩苗等人(2011)發(fā)現(xiàn)兩者的負(fù)相關(guān)關(guān)系在控制了表征異質(zhì)信念的換手率后卻消失,認(rèn)為這是由于中國(guó)股票市場(chǎng)的賣空限制和投資者異質(zhì)信念共同作用的原因[17];而劉鵬、田益祥(2011)和鄧雪春、鄭振龍(2011)等人的研究發(fā)現(xiàn),中國(guó)市場(chǎng)上不存在“特質(zhì)波動(dòng)率之迷”,與Fu 等人的結(jié)論一致[18,19]。
由此可以看出,特質(zhì)波動(dòng)率與滯后一期收益率的相關(guān)關(guān)系,學(xué)術(shù)界一直存在爭(zhēng)議。上述完全對(duì)立的研究結(jié)論,究其原因正是基于高度數(shù)據(jù)敏感的資產(chǎn)組合分析方法。本文的判別框架正是在這樣的背景下提出來的。
三、研究方法
研究的思路是:對(duì)于根據(jù)定義得到的T、B、U、D集合,若能被某種方法在高維空間中清晰劃分開來,那么,對(duì)于后一期的指標(biāo)落在相應(yīng)高維空間某個(gè)區(qū)域,即可對(duì)其趨勢(shì)做出判別;若無法對(duì)這4個(gè)集合進(jìn)行恰當(dāng)?shù)膭澐?,則可以認(rèn)為該指標(biāo)并不具備預(yù)測(cè)能力。本文把構(gòu)造出上述定義得到的T、B、U、D集合的方法,稱之為TBUD集合判別劃分建模方法(簡(jiǎn)稱TBUD方法)。區(qū)別于以往研究特質(zhì)變動(dòng)率采用的回歸分析建模方法,一般采用馬氏距離判別、貝葉斯判別以及支持向量機(jī)(簡(jiǎn)稱SVM)的方法進(jìn)行綜合建模。
四、數(shù)據(jù)與變量
鑒于2005年前后中國(guó)股市制度差異很大,本文所選用的數(shù)據(jù)為中國(guó)股票市場(chǎng)2005 年5 月~2011 年12 月滬深300 指數(shù)及其成分股的日和月交易數(shù)據(jù),剔除ST 和PT 后的樣本和每月交易不足10 天的樣本。滬深300 指數(shù)及其成分股的交易數(shù)據(jù)和無風(fēng)險(xiǎn)利率來源于CSMAR中國(guó)股票市場(chǎng)交易數(shù)據(jù)庫(kù),F(xiàn)amaFrench三因子模型數(shù)據(jù)來源于銳思金融研究數(shù)據(jù)庫(kù)。
(一)特質(zhì)波動(dòng)率
本文沿用AHXZ 對(duì)股票特質(zhì)波動(dòng)率的定義,采用FamaFrench 三因子模型殘差項(xiàng)的標(biāo)準(zhǔn)差來估計(jì)股票的特質(zhì)波動(dòng)率(IV)。
(三)換手率
采用換手率TURN來衡量股票股票的流動(dòng)性,其中,換手率的數(shù)據(jù)來源于CSMAR數(shù)據(jù)庫(kù),其計(jì)算方法為:換手率=當(dāng)日成交數(shù)量/流通股數(shù)。
通過比較結(jié)果誤差的大小,若IV、MV、TURN及其組合可被相應(yīng)集合所劃分,則說明下一個(gè)拐點(diǎn)必然屬于另外一個(gè)集合,那么,只要對(duì)集合中的躍遷做聚類就可以判斷下一個(gè)拐點(diǎn)的走向(即預(yù)測(cè))。
H0:IV、MV、TURN能夠反映T、B、U、D集合的差異性,即IV、MV、TURN能預(yù)測(cè)未來的股價(jià)趨勢(shì),因子指標(biāo)具有良好的預(yù)測(cè)能力;
H1:IV、MV、TURN無法反映T、B、U、D集合的差異性,即IV、MV、TURN無法預(yù)測(cè)股價(jià)的未來來趨勢(shì),無法證明因子指標(biāo)具有預(yù)測(cè)能力。
五、實(shí)證分析
(一)分類結(jié)果誤差分析分類結(jié)果誤差如表1所示,無論是采用馬氏距離判別、貝葉斯判別還是SVM方法進(jìn)行建模分類,模型的分類結(jié)果都并不理想,采用IV作為分類因子時(shí),誤差也在66.23%以上,而使用馬氏距離進(jìn)行建模判別,誤差達(dá)到了77.36%,采用IV、MV、TURN作為分類因子時(shí),模型的誤差有所降低,但發(fā)生誤差的概率也在60.01%以上。一方面的原因可能在于選擇的指標(biāo)較少,無法對(duì)集合進(jìn)行很好的區(qū)分;另一方面,也說明了IV、MV、TURN 三個(gè)因子指標(biāo)并不能很好地體現(xiàn)出T、B、U、D集合的差異性。
(二)SVM分類結(jié)果分析從使用的分類模型中選取誤差發(fā)生概率最小的模型進(jìn)行分析。從表1中可以知道,采用多因子SVM(Cbsvc)模型的分類結(jié)果的誤差相對(duì)另外幾個(gè)模型來說較小。SVM(Cbsvc)模型的具體結(jié)果可從表2看出。從表2可以知道,樣本落在不同的集合的概率都很接近,如Top 樣本,SVM(Cbsvc)模型判斷落在T、B、U、D集合的平均概率分別為27.283%、21.403%、26.852% 以及24.461%,且判斷結(jié)果的標(biāo)準(zhǔn)差均較小,從結(jié)果來看,預(yù)測(cè)的效果并不理想,這也從另一方面說明了IV、MV、TURN并不能很好地反映出各集合之間的差異,基于IV、MV和TURN三個(gè)因子指標(biāo)的判別模型并不能準(zhǔn)確地對(duì)股價(jià)的趨勢(shì)做出判斷。
(三) IV、MV、TURN相關(guān)性分析
表3是IV、MV、TURN 各變量間Spearman和Kendall相關(guān)性檢驗(yàn)結(jié)果。表3顯示,IV和MV的相關(guān)程度很高,在Spearman檢驗(yàn)下,相關(guān)性程度達(dá)到了94.48%,而在Kendall檢驗(yàn)下,相關(guān)程度也達(dá)到了81.7%;而IV和TURN以及MV和TURN的相關(guān)程度較低,在Spearman檢驗(yàn)下分別為47.93%和49.59%,而在Kendall 檢驗(yàn)下分別只有33.38% 和34.66%。表3表明,IV、MV、TURN三個(gè)因子指標(biāo)中,由于相關(guān)性的原因,對(duì)分類模型起到真正作用的因子指標(biāo)可能只有TURN 因子和IV、MV兩因子中的一個(gè)。
從圖1(a)可以看出IV 和MV呈顯著的正相關(guān),且擬合的效果很好,大部分的點(diǎn)主要集中在一條曲線的附近;而從圖1(b)和圖1(c)可以看出,IV和TURN以及MV和TURN之間的相關(guān)性并不顯著,且曲線的擬合程度也較差,這也與IV、MV、TURN之間的相關(guān)性檢驗(yàn)的結(jié)果一致。
從圖2(a)、2(b)、2(c)可以看到,T、B、U、D四個(gè)集合的IV、MV、TURN 分布情況都很相似,如圖2(a)中四個(gè)集合IV的取值都集中于0~0.05之間,且取值在0.025附近的點(diǎn)的概率密度最大;而MV,TURN與IV的情形大體一致,各集合中MV的取值集中于0~0.075之間,而在0.0125的時(shí)候概率密度最大;TURN的取值集中在0~1之間,大體在0.25的時(shí)候概率密度最大。圖2表明,T、B、U、D四個(gè)集合的點(diǎn)在IV、MV、TURN 下的取值基本在同一區(qū)間范圍里面。
從圖3可見,在IV、MV、TURN的不同坐標(biāo)系下,T、B、U、D集合里大部分的點(diǎn)都存在著重疊的情況,且表3的數(shù)據(jù)表明IV、MV呈顯著的正相關(guān)關(guān)系,可知T、B、U、D集合的點(diǎn)的存在于一個(gè)三維的超平面附近且大部分的點(diǎn)處在重疊的情況下。
六、結(jié) 論
對(duì)于金融時(shí)間序列的指標(biāo)的預(yù)測(cè)能力,一般采用資產(chǎn)組合分析法,并使用多元線性回歸分析獲取參數(shù)。鑒于金融市場(chǎng)的混沌性質(zhì),資產(chǎn)組合分析方法高度數(shù)據(jù)敏感,線性假設(shè)也存在相當(dāng)局限性。本文基于實(shí)際拐點(diǎn)集合,在高維空間進(jìn)行劃分作為判別原則??梢姡琓BUD分析框架可以對(duì)金融時(shí)間序列指標(biāo)的預(yù)測(cè)能力進(jìn)行有效判別。
以上實(shí)證研究表明,IV、MV 和TURN 三個(gè)因子變量對(duì)趨勢(shì)的預(yù)測(cè)能力不高,誤差達(dá)到了60%以上,一方面的原因可能在于IV和MV存在這很強(qiáng)的相關(guān)性,另一方面也可能是IV和MV等因子本身不具有預(yù)測(cè)能力。因此可以認(rèn)為,無法找到足夠的證據(jù)使得H0假設(shè)成立,即IV、MV、TURN無法反映T、B、U、D集合的差異性,無法證明IV、MV、TURN因子對(duì)股價(jià)未來趨勢(shì)具有預(yù)測(cè)能力。
參考文獻(xiàn):
[1]Benabderrahmane S, Quiniou R, Guyet T. Evaluating distance measures and times series clustering for temporal patterns retrieval[C]. 2014 IEEE International Conference on Information Reuse and Integration (IRI), 2014: 434-441.
[2]Yu G, Kamarthi S V. A cluster-based wavelet feature extraction method and its application[J]. Engineering Applications of Artificial Intelligence, 2010, 23(2): 196-202.
[3]Vaithyanathan S, Dom B. ModelBased Hierarchical Clustering[C]. Proc.conf.uncertainty in Artificial Intelligence,2013:599-608.
[4]陶小創(chuàng), 樊煥貞, 呂琛, 等. 基于小波神經(jīng)網(wǎng)絡(luò)的混沌時(shí)間序列預(yù)測(cè)及應(yīng)用[J]. 南京航空航天大學(xué)學(xué)報(bào), 2011, (S1): 174-178.
[5]尹華, 吳虹. 最小二乘支持向量機(jī)在混沌時(shí)間序列中的應(yīng)用[J]. 計(jì)算機(jī)仿真, 2011, 28(2): 225-227.
[6]朱光兆, 何偉. 基于支持向量機(jī)的混沌時(shí)間序列預(yù)測(cè)分析[J]. 自動(dòng)化與儀器儀表, 2012, (1): 145-147.
[7]Luca B, Khoo SC. A comparison between MDPP and kernel regression smoothing techniques for forecasting time series data[R].National Univ of Singapore,Jan,2005.
[8]Perng CS, Wang H, Zhang S R, et al. Landmarks: a new model for similaritybased pattern querying in time series databases[C]. Proceedings of the 16th International Conference on Data Engineering IEEE Computer Society, 2000: 33-42.
[9]Fu T C. A review on time series data mining[J]. Engineering Applications of Artificial Intelligence, 2011, 24(1): 164-181.
[10]Goyal A, SantaClara P. Idiosyncratic risk matters![J], 2003,58(3):975-1008.
[11]Ang A, Hodrick R J, Xing Y, et al. High idiosyncratic volatility and low returns: International and further US evidence[J]. Journal of Financial Economics, 2009, 91(1): 1-23.
[12]Ang A, Hodrick R J, Xing Y, et al. The crosssection of volatility and expected returns[J]. The Journal of Finance, 2006, 61(1): 259-299.
[13]Fu F. Idiosyncratic risk and the crosssection of expected stock returns[J]. Journal of Financial Economics, 2009, 91(1): 24-37.
[14]Huang W, Liu Q, Rhee S G, et al. Return Reversals, Idiosyncratic Risk, and Expected Returns[J]. Review of Financial Studies, 2010, 23(1):147-168.
[15]Chua C T, Goh J, Zhang Z. Expected volatility, unexpected volatility, and the cross‐section of stock returns[J]. Journal of Financial Research, 2010, 33(2): 103-123.
[16]楊華蔚, 韓立巖. 中國(guó)股票市場(chǎng)特質(zhì)波動(dòng)率與橫截面收益研究[J]. 北京航空航天大學(xué)學(xué)報(bào): 社會(huì)科學(xué)版, 2009, 22(1): 6-10.
[17]左浩苗, 鄭鳴, 張翼. 股票特質(zhì)波動(dòng)率與橫截面收益: 對(duì)中國(guó)股市 “特質(zhì)波動(dòng)率之謎” 的解釋[J]. 世界經(jīng)濟(jì), 2011, (5): 117-135.
[18]劉鵬, 田益祥. 特質(zhì)風(fēng)險(xiǎn)與股票收益——來自中國(guó)股票市場(chǎng)的經(jīng)驗(yàn)證據(jù)[J]. 管理學(xué)家: 學(xué)術(shù)版, 2011, (10): 38-47.
[19]鄧雪春, 鄭振龍. 中國(guó)股市存在 “特質(zhì)波動(dòng)率之謎” 嗎?[J]. 商業(yè)經(jīng)濟(jì)與管理, 2011, 1(1): 60-67.
[20]Guo H, Higbee J. Market timing with aggregate and idiosyncratic stock volatilities[J]. FRB St. Louis Working Paper No, 2005.
(責(zé)任編輯:寧曉青)
財(cái)經(jīng)理論與實(shí)踐2016年3期