潘水洋,劉俊瑋,王一鳴
(北京大學(xué)經(jīng)濟(jì)學(xué)院,北京100871)
從計(jì)量經(jīng)濟(jì)學(xué)角度在對(duì)傳統(tǒng)線(xiàn)性資產(chǎn)定價(jià)模型進(jìn)行實(shí)證分析時(shí),發(fā)現(xiàn)該模型的解釋能力不足:或者回歸截距項(xiàng)顯著大于零,或者貝塔系數(shù)不顯著等。造成這些問(wèn)題的根源可能是解釋變量遺漏,也可能是貝塔系數(shù)或隨機(jī)項(xiàng)方差的時(shí)變性等。因此,針對(duì)線(xiàn)性資產(chǎn)定價(jià)模型的修正出現(xiàn)了3個(gè)不同的努力方向:將失敗歸因于解釋變量的遺漏,據(jù)此提出了多因子資產(chǎn)定價(jià)模型[1-3];將失敗歸因于貝塔系數(shù)的時(shí)變性,據(jù)此提出了變參數(shù)(貝塔)資產(chǎn)定價(jià)模型[4];將失敗歸因于隨機(jī)項(xiàng)方差的時(shí)變性,據(jù)此提出了GARCH類(lèi)資產(chǎn)定價(jià)模型等[5]。然而上述3模型并沒(méi)有從根本上解決資產(chǎn)定價(jià)模型解釋能力不足的問(wèn)題。首先,單純依靠增加解釋變量提高模型解釋能力是一個(gè)無(wú)窮盡的過(guò)程。其次,由時(shí)變貝塔參數(shù)定價(jià)模型估計(jì)出的貝塔系數(shù)和市場(chǎng)組合的超額收益之間的協(xié)方差并不大,這意味著時(shí)變貝塔參數(shù)定價(jià)模型得到的收益和用CAPM模型計(jì)算出來(lái)的收益相仿[6]。
與此同時(shí),國(guó)內(nèi)外學(xué)者發(fā)現(xiàn)金融市場(chǎng)存在非線(xiàn)性特征,大量文獻(xiàn)對(duì)此進(jìn)行了實(shí)證檢驗(yàn)和報(bào)道[7-10]。股票市場(chǎng)具有非線(xiàn)性特征意味著隨機(jī)游走與有效市場(chǎng)假設(shè)將失效,以此為理論假設(shè)基礎(chǔ)的現(xiàn)代資本市場(chǎng)理論以及其他依賴(lài)正態(tài)分布或有限方差性質(zhì)的金融計(jì)量學(xué)模型都將面臨質(zhì)疑。令人遺憾的是,在資產(chǎn)定價(jià)模型的修正過(guò)程中,股市具有非線(xiàn)性現(xiàn)象這一金融異象被選擇性地忽視了,未被納入模型框架,其挑戰(zhàn)在于現(xiàn)有模型無(wú)法刻畫(huà)因子間的非線(xiàn)性定價(jià)結(jié)構(gòu)。為解決這一問(wèn)題,筆者創(chuàng)新性地引入機(jī)器學(xué)習(xí)領(lǐng)域中的神經(jīng)網(wǎng)絡(luò)模型,以捕獲市場(chǎng)組合收益率、市值和賬面市值比三因子之間的非線(xiàn)性定價(jià)結(jié)構(gòu)。對(duì)本模型的樣本外擬合優(yōu)度、多空策略業(yè)績(jī)表現(xiàn)與經(jīng)典Fama-French三因子模型做了比較。實(shí)證結(jié)果表明:神經(jīng)網(wǎng)絡(luò)模型能精準(zhǔn)捕獲市場(chǎng)組合收益率、市值和賬面市值比3個(gè)因子之間的非線(xiàn)性關(guān)系。神經(jīng)網(wǎng)絡(luò)非線(xiàn)性模型在樣本外擬合優(yōu)度、多空策略業(yè)績(jī)上均要優(yōu)于傳統(tǒng)三因子線(xiàn)性定價(jià)模型。本文的貢獻(xiàn)主要體現(xiàn)在:(1)脫離了依靠增加解釋變量個(gè)數(shù)提高線(xiàn)性資產(chǎn)定價(jià)模型解釋力的傳統(tǒng)實(shí)證資產(chǎn)定價(jià)的研究框架。(2)將機(jī)器學(xué)習(xí)領(lǐng)域中的神經(jīng)網(wǎng)絡(luò)模型運(yùn)用于金融資產(chǎn)定價(jià)領(lǐng)域,實(shí)現(xiàn)定價(jià)因子之間的非線(xiàn)性關(guān)系捕獲,豐富了資產(chǎn)定價(jià)的研究方法。(3)采用機(jī)器學(xué)習(xí)理論的非線(xiàn)性資產(chǎn)定價(jià)模型能夠更加準(zhǔn)確地預(yù)測(cè)我國(guó)股票投資組合的收益率,對(duì)投資者構(gòu)建有效投資策略具有較強(qiáng)的借鑒意義。
與傳統(tǒng)金融計(jì)量經(jīng)濟(jì)學(xué)方法相比,機(jī)器學(xué)習(xí)理論中的神經(jīng)網(wǎng)絡(luò)模型更關(guān)注預(yù)測(cè)結(jié)果,不關(guān)注估計(jì)量的漸進(jìn)性質(zhì),因此將機(jī)器學(xué)習(xí)模型應(yīng)用于資產(chǎn)定價(jià)領(lǐng)域,須針對(duì)研究的問(wèn)題構(gòu)造合適的實(shí)證框架[11-13]。
學(xué)術(shù)界提出的隨機(jī)貼現(xiàn)因子資產(chǎn)定價(jià)模型的一般表達(dá)式為
式(1)中,Mt+1表示隨機(jī)貼現(xiàn)因子,可表示為風(fēng)險(xiǎn)因子的函數(shù)。隨機(jī)貼現(xiàn)因子與風(fēng)險(xiǎn)因子之間的函數(shù)關(guān)系可能為線(xiàn)性關(guān)系,也可能為非線(xiàn)性關(guān)系。當(dāng)隨機(jī)貼現(xiàn)因子是風(fēng)險(xiǎn)因子的線(xiàn)性組合時(shí),資產(chǎn)的收益可用線(xiàn)性因子模型(即貝塔模式)來(lái)刻畫(huà)。當(dāng)隨機(jī)貼現(xiàn)因子不是風(fēng)險(xiǎn)因子的線(xiàn)性組合時(shí),以上結(jié)果并不成立。從本文引言部分可知,大量實(shí)證文獻(xiàn)均發(fā)現(xiàn)股票市場(chǎng)存在非線(xiàn)性特征,為了更好地刻畫(huà)資產(chǎn)定價(jià)模型,實(shí)現(xiàn)理論與實(shí)踐的完美結(jié)合,隨機(jī)貼現(xiàn)因子應(yīng)當(dāng)滿(mǎn)足:Mt+1不僅能識(shí)別線(xiàn)性定價(jià)結(jié)構(gòu),而且也能識(shí)別非線(xiàn)性定價(jià)結(jié)構(gòu)。本文通過(guò)引入機(jī)器學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)模型來(lái)實(shí)現(xiàn)Mt+1的非線(xiàn)性映射。
機(jī)器學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)由輸入層、隱含層、輸出層組成。假設(shè)有N個(gè)任意樣本集(xj,yj),j=1,2…,N。其中,
通過(guò)神經(jīng)網(wǎng)絡(luò)可以自動(dòng)尋找x與y之間的非線(xiàn)性映射關(guān)系。對(duì)于圖1中具有L個(gè)隱含結(jié)點(diǎn)的單隱層神經(jīng)網(wǎng)絡(luò)的輸出tj可以表示為
式(4)中,g為激活函數(shù),一般為σ函數(shù)。wi=[wi1,wi2,…,win]T為第i個(gè)隱層單元的輸入權(quán)重,bi為第i個(gè)隱層單元的偏置,θi=[θi1,θi2,…,θim]T為第i個(gè)隱層單元的輸出權(quán)重。tj=[tj1,tj2,…,tjm]T為神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)輸出值。上式的矩陣形式為
其中,
單隱層神經(jīng)網(wǎng)絡(luò)對(duì)輸入的N個(gè)樣本集(xj,yj),j=1,2,…,N進(jìn)行自我學(xué)習(xí),通過(guò)最小化輸出值與實(shí)際值的誤差平方和估計(jì)參數(shù)得 到x與y之間的非線(xiàn)性映射關(guān)系:
式(9)等價(jià)于最小化損失函數(shù):
式(10)無(wú)解析解,采用梯度下降法可得到模型參數(shù)估計(jì)。
將神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于資產(chǎn)定價(jià)的一個(gè)重要原因是該模型能刻畫(huà)股票市場(chǎng)的非線(xiàn)性現(xiàn)象。假設(shè)市場(chǎng)存在M只股票,股票的定價(jià)因子有N個(gè),在t時(shí)刻,擁有股票因子數(shù)據(jù)集Xt及股票收益率yt:
資產(chǎn)定價(jià)的實(shí)質(zhì)就是找到因子數(shù)據(jù)集Xt與股票收益率yt之間的映射關(guān)系F:
線(xiàn)性資產(chǎn)定價(jià)模型:假設(shè)因子數(shù)據(jù)集Xt與股票收益率yt之間存在線(xiàn)性關(guān)系,此時(shí)式(10)變?yōu)?/p>
神經(jīng)網(wǎng)絡(luò)非線(xiàn)性資產(chǎn)定價(jià)模型:假設(shè)因子數(shù)據(jù)集Xt與股票收益率yt之間存在非線(xiàn)性關(guān)系:
式(13)中,W,b,θ為神經(jīng)網(wǎng)絡(luò)模型中的待估計(jì)參數(shù),F(xiàn)為式(5)所描述的神經(jīng)網(wǎng)絡(luò)非線(xiàn)性映射。對(duì)比式(12)和(13)發(fā)現(xiàn),與傳統(tǒng)線(xiàn)性資產(chǎn)定價(jià)模型相比,神經(jīng)網(wǎng)絡(luò)資產(chǎn)定價(jià)模型能捕獲到因子數(shù)據(jù)集Xt與股票收益率yt之間的非線(xiàn)性映射關(guān)系,非線(xiàn)性映射通過(guò)以下激活函數(shù)實(shí)現(xiàn):
只要因子數(shù)據(jù)集Xt與股票收益率yt之間存在非線(xiàn)性定價(jià)結(jié)構(gòu),含有多個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)從理論上就能夠辨識(shí)隱藏在數(shù)據(jù)背后的非線(xiàn)性定價(jià)結(jié)構(gòu)。下文將同時(shí)運(yùn)用Fama三因子線(xiàn)性定價(jià)模型和神經(jīng)網(wǎng)絡(luò)非線(xiàn)性資產(chǎn)定價(jià)模型對(duì)我國(guó)A股市場(chǎng)進(jìn)行實(shí)證分析,通過(guò)比較兩模型的樣本外擬合優(yōu)度和多空策略業(yè)績(jī)來(lái)檢驗(yàn)神經(jīng)網(wǎng)絡(luò)定價(jià)模型的有效性。
選取Fama-French三因子資產(chǎn)定價(jià)模型作為基準(zhǔn)模型,通過(guò)對(duì)比分析檢驗(yàn)神經(jīng)網(wǎng)絡(luò)非線(xiàn)性定價(jià)模型的有效性。該模型在國(guó)內(nèi)外股票市場(chǎng)有大量的實(shí)證檢驗(yàn)[1-3,14-15]。
Fama-French三因子資產(chǎn)定價(jià)模型中,股票收益率可由市場(chǎng)組合收益率、市值、賬面市值比進(jìn)行解釋。根據(jù)此理論,構(gòu)建三因子線(xiàn)性定價(jià)預(yù)測(cè)模型:
式(15)中,rit表示股票i在時(shí)間t時(shí)的收益率;Rm,t-1表示在時(shí)間t-1時(shí)按市值加權(quán)形成的市場(chǎng)組合收益率;Sizei,t-1表示股票i在時(shí)間t-1時(shí)的流通市值;Btopi,t-1表示股票i在時(shí)間t-1時(shí)的賬面市值比;eit表示三因子定價(jià)線(xiàn)性預(yù)測(cè)模型預(yù)測(cè)誤差;β0,β1,β2,β3為線(xiàn)性定價(jià)模型參數(shù)。對(duì)市場(chǎng)組合收益率、市值、賬面市值比等定價(jià)因子在每個(gè)橫截面上均減去均值并除以標(biāo)準(zhǔn)差,進(jìn)行歸一化處理。
為檢驗(yàn)神經(jīng)網(wǎng)絡(luò)資產(chǎn)定價(jià)模型的有效性,采用樣本外模型預(yù)測(cè)值的擬合優(yōu)度R2、Diebold-Mariano檢驗(yàn)以及構(gòu)建多空策略業(yè)績(jī)表來(lái)檢驗(yàn)?zāi)P偷挠行裕鶞?zhǔn)模型為Fama-French三因子線(xiàn)性定價(jià)模型。評(píng)判模型優(yōu)劣的標(biāo)準(zhǔn)有:
(1)樣本外擬合度R2,R2越大,模型越優(yōu)。
(2)Diebold-Mariano檢驗(yàn)。
(3)多空投資策略。
在模型輸入變量保持不變的前提下,如果以上3條均較優(yōu),就有足夠的理由認(rèn)定神經(jīng)網(wǎng)絡(luò)資產(chǎn)定價(jià)模型能夠識(shí)別隱藏在定價(jià)因子數(shù)據(jù)下的非線(xiàn)性關(guān)系,非線(xiàn)性定價(jià)模型優(yōu)于線(xiàn)性定價(jià)模型。
選取1997年1月至2017年12月滬深兩市A股股票的月度收益率、收盤(pán)價(jià)、合并財(cái)務(wù)報(bào)表中流通股、總股本、所有者權(quán)益合計(jì)數(shù)據(jù),剔除*ST、已退市、上市不足1年的股票。收盤(pán)價(jià)與流通股數(shù)量相乘得到股票流通市值;收盤(pán)價(jià)與總股本相乘得到股票總市值;所有者權(quán)益合計(jì)除以股票總市值得到賬面市值比。市場(chǎng)組合收益率采用中證全A指數(shù)收益率。所有因子在橫截面上減去均值除以標(biāo)準(zhǔn)差做歸一化處理。本文的數(shù)據(jù)來(lái)源于wind資訊數(shù)據(jù)庫(kù)。
將1997年1月至2007年12月的數(shù)據(jù)作為模型訓(xùn)練數(shù)據(jù),用于估計(jì)Fama-French三因子線(xiàn)性定價(jià)模型參數(shù)和神經(jīng)網(wǎng)絡(luò)非線(xiàn)性資產(chǎn)定價(jià)模型參數(shù)。將2008年1月至2017年12月的數(shù)據(jù)作為樣本外驗(yàn)證數(shù)據(jù),用于檢驗(yàn)?zāi)P蜆颖就獾念A(yù)測(cè)能力。估計(jì)模型參數(shù)后,從2008年1月開(kāi)始,在每月月初,將股票最新的市值因子數(shù)據(jù)、賬面市值比因子數(shù)據(jù)、中證全A指數(shù)月度收益率數(shù)據(jù)分別輸入Fama-French三因子線(xiàn)性定價(jià)預(yù)測(cè)模型、神經(jīng)網(wǎng)絡(luò)非線(xiàn)性資產(chǎn)定價(jià)預(yù)測(cè)模型,得到每個(gè)模型下個(gè)月股票收益率的預(yù)測(cè)值,再計(jì)算模型樣本外的擬合優(yōu)度R2,擬合優(yōu)度計(jì)算公式為
式(15)中,ri,t表示第i只股票在t時(shí)刻的實(shí)際收益率,表示第i只股票在t時(shí)刻的預(yù)測(cè)收益率。表1為Fama-French模型和神經(jīng)網(wǎng)絡(luò)模型股票收益率樣本的外擬合優(yōu)度,其中NN1~NN5分別表示采用1~5層隱含層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)非線(xiàn)性定價(jià)模型,輸入層均為3個(gè)節(jié)點(diǎn)(分別代表市場(chǎng)組合收益率、市值、賬面市值比3個(gè)因子),輸出層均為10個(gè)節(jié)點(diǎn)(用于股票收益率預(yù)測(cè)分組)。NN1隱含層含有32個(gè)節(jié)點(diǎn),NN2隱含層分別含有32,16個(gè)節(jié)點(diǎn),NN3隱含層分別含有32,16,8個(gè)節(jié)點(diǎn),NN4隱含層分別含有32,16,8,4個(gè)節(jié)點(diǎn),NN5隱含層分別含有 32,16,8,4,2個(gè)節(jié)點(diǎn)。采用非線(xiàn)性激活函數(shù)式(14)實(shí)現(xiàn)。由表1知,不同隱含層數(shù)神經(jīng)網(wǎng)絡(luò)模型樣本的外擬合優(yōu)度均高于Fama-French模型樣本。
表1 模型樣本外擬合優(yōu)度Table1 Goodness of fit outside sample
用2008年1月至2017年12月的數(shù)據(jù)作為樣本外驗(yàn)證數(shù)據(jù),采用預(yù)先訓(xùn)練好的模型預(yù)測(cè)股票下一期收益率,在此基礎(chǔ)上,用Diebold和Mariano對(duì)不同模型兩兩之間進(jìn)行配對(duì)檢驗(yàn),比較不同模型之間的預(yù)測(cè)能力,結(jié)果如表2所示。從表2第2行可以看出,具有不同隱含層的神經(jīng)網(wǎng)絡(luò)非線(xiàn)性資產(chǎn)定價(jià)模型樣本的外預(yù)測(cè)能力均要好于Fama-French三因子線(xiàn)性定價(jià)模型。隱含層數(shù)不同的神經(jīng)網(wǎng)絡(luò)非線(xiàn)性資產(chǎn)定價(jià)模型之間無(wú)顯著性差異。
表2 Diebold-Mariano配對(duì)檢驗(yàn)Table 2 Diebold-Mariano pairing test
為了進(jìn)一步檢驗(yàn)神經(jīng)網(wǎng)絡(luò)模型的有效性,本文基于Fama-French模型、神經(jīng)網(wǎng)絡(luò)模型構(gòu)造多空策略組合:Fama-French因子線(xiàn)性組合預(yù)測(cè)策略和神經(jīng)網(wǎng)絡(luò)因子非線(xiàn)性組合預(yù)測(cè)策略。
Fama-French因子線(xiàn)性組合預(yù)測(cè)策略構(gòu)造過(guò)程:每個(gè)月初,F(xiàn)ama-French模型基于最新因子截面數(shù)據(jù)預(yù)測(cè)股票下一期收益率,然后將股票收益率預(yù)測(cè)結(jié)果按降序排列等分為10組,做多第1組股票,做空第10組股票。
神經(jīng)網(wǎng)絡(luò)因子非線(xiàn)性組合預(yù)測(cè)策略構(gòu)造過(guò)程:每個(gè)月初,神經(jīng)網(wǎng)絡(luò)模型基于最新因子截面數(shù)據(jù)預(yù)測(cè)股票下一期收益率,然后將股票收益率預(yù)測(cè)結(jié)果按降序排列等分為10組,做多第1組股票,做空第10組股票。
表3 分組收益Table 3 Group's return
表4 分組收益Table4 Group's return
表5 分組收益Table 5 Group's return
表3~表5為各個(gè)模型策略的分組表現(xiàn)。從策略分組表現(xiàn)看,由于Fama-French分組策略未能捕獲到因子之間的非線(xiàn)性定價(jià)結(jié)構(gòu),導(dǎo)致第5組收益率高于第4組,第9組收益率高于第8組,組間收益率并未呈現(xiàn)遞減關(guān)系。與此相對(duì)應(yīng)的是,神經(jīng)網(wǎng)絡(luò)分組策略能夠捕獲到因子間的非線(xiàn)性定價(jià)結(jié)構(gòu),其預(yù)測(cè)準(zhǔn)確率要好于Fama-French分組策略:從第1組到第10組,收益率表現(xiàn)出嚴(yán)格的遞減規(guī)律,且第1組(多頭)收益率均高于Fama-French三因子模型第1組,第10組(空頭)收益率均低于Fama-French三因子模型第10組。
表6為各模型做多第1組、做空第10組的多空策略表現(xiàn)。從表6中可以看出,神經(jīng)網(wǎng)絡(luò)模型多空策略年化收益、年化波動(dòng)率、夏普比率、最大回撤均要好于Fama-French模型。進(jìn)一步表明,神經(jīng)網(wǎng)絡(luò)模型捕獲到了因子之間的非線(xiàn)性關(guān)系,策略表現(xiàn)要優(yōu)于Fama-French模型。
針對(duì)股市具有非線(xiàn)性特征,在資產(chǎn)定價(jià)模型的修正過(guò)程中易被選擇性忽視,創(chuàng)新性地將機(jī)器學(xué)習(xí)領(lǐng)域中的神經(jīng)網(wǎng)絡(luò)模型引入其中,捕獲市場(chǎng)組合收益率、市值和賬面市值比三因子間的非線(xiàn)性定價(jià)結(jié)構(gòu)。新模型與經(jīng)典Fama-French三因子模型在樣本外擬合優(yōu)度、多空策略業(yè)績(jī)表現(xiàn)上進(jìn)行了對(duì)比。實(shí)證結(jié)果表明,神經(jīng)網(wǎng)絡(luò)模型能精準(zhǔn)捕獲市場(chǎng)組合收益率、市值、賬面市值比3個(gè)因子之間的非線(xiàn)性關(guān)系。神經(jīng)網(wǎng)絡(luò)非線(xiàn)性模型在樣本外擬合優(yōu)度、多空策略業(yè)績(jī)上均要好于傳統(tǒng)三因子線(xiàn)性定價(jià)模型。
3.1 中國(guó)A股市場(chǎng)存在典型的非線(xiàn)性特征,借助機(jī)器學(xué)習(xí)理論,能夠精準(zhǔn)捕獲定價(jià)因子之間的非線(xiàn)性關(guān)系。
3.2 機(jī)器學(xué)習(xí)是以數(shù)據(jù)驅(qū)動(dòng)為核心來(lái)構(gòu)建模型的,并依靠交叉驗(yàn)證選擇最優(yōu)模型,與傳統(tǒng)計(jì)量經(jīng)濟(jì)學(xué)方法相比,機(jī)器學(xué)習(xí)更關(guān)注預(yù)測(cè)結(jié)果,不關(guān)注估計(jì)量的漸進(jìn)性質(zhì),因此,將機(jī)器學(xué)習(xí)模型與傳統(tǒng)計(jì)量模型進(jìn)行對(duì)比時(shí),須針對(duì)研究的問(wèn)題構(gòu)造合適的實(shí)證框架,本文做了初步探索。
表6 分組多空收益Table 6 Group long and short returns