国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)的基金收益預(yù)測(cè)

2023-07-11 11:12:02李仁宇葉子謙
統(tǒng)計(jì)與決策 2023年11期
關(guān)鍵詞:收益率機(jī)器收益

李仁宇,葉子謙

(1.武漢大學(xué) 經(jīng)濟(jì)與管理學(xué)院,武漢 430072;2.長(zhǎng)江證券(上海)資產(chǎn)管理有限公司,上海 200135)

0 引言

黨的二十大報(bào)告指出,全面建設(shè)社會(huì)主義現(xiàn)代化國(guó)家的首要任務(wù)是高質(zhì)量發(fā)展。理財(cái)市場(chǎng)作為多層次資本市場(chǎng)的重要組成部分,是推動(dòng)新時(shí)代中國(guó)特色金融體系高質(zhì)量發(fā)展的主要支撐。2022年以來(lái),黨中央、國(guó)務(wù)院通過(guò)一攬子經(jīng)濟(jì)政策[1],以降低實(shí)體經(jīng)濟(jì)融資成本,為理財(cái)市場(chǎng)提供了有利的市場(chǎng)環(huán)境,理財(cái)市場(chǎng)規(guī)模穩(wěn)步增長(zhǎng)[2]。隨著2022 年資管新規(guī)的全面落地,全面凈值化發(fā)展是理財(cái)產(chǎn)品的新特色,但無(wú)法避免的凈值波動(dòng)在一定程度上難以滿足我國(guó)多數(shù)投資者短期、低風(fēng)險(xiǎn)的理財(cái)需求?;甬a(chǎn)品通過(guò)分散投資的策略能夠有效地降低投資風(fēng)險(xiǎn),逐漸進(jìn)入個(gè)人投資者的視野。截至2023年2月,中國(guó)公募基金的產(chǎn)品數(shù)量已達(dá)到10537支,數(shù)量遠(yuǎn)超上市公司股票的基金產(chǎn)品無(wú)疑增加了投資者的選擇困難。2022 年頒布的《國(guó)務(wù)院辦公廳關(guān)于推動(dòng)個(gè)人養(yǎng)老金發(fā)展的意見(jiàn)》加強(qiáng)了個(gè)人養(yǎng)老金作為我國(guó)養(yǎng)老金體系第三支柱的作用。作為個(gè)人養(yǎng)老金賬戶的投資標(biāo)的之一,由基金產(chǎn)品組成的養(yǎng)老目標(biāo)FOF基金能夠滿足投資者資產(chǎn)增值的目的,同時(shí)也將成為機(jī)構(gòu)投資者重點(diǎn)布局的領(lǐng)域之一。由此可見(jiàn),無(wú)論對(duì)于個(gè)人還是機(jī)構(gòu)投資者而言,資產(chǎn)保值增值的需求都更加迫切,為了更好地滿足投資理財(cái)?shù)男枨?,基金研究的重要性日益突顯。通過(guò)選擇優(yōu)質(zhì)基金,有助于構(gòu)建更加穩(wěn)定、更具收益的投資組合,幫助居民和機(jī)構(gòu)投資者進(jìn)行資產(chǎn)保值增值,引導(dǎo)投資者樹(shù)立價(jià)值投資理念,從而更好地促進(jìn)我國(guó)資本市場(chǎng)的高質(zhì)量發(fā)展。

基金能否獲得超越市場(chǎng)基準(zhǔn)的收益始終是基金研究的核心問(wèn)題,對(duì)此學(xué)術(shù)界存在不同的觀點(diǎn)。Fama和French(2010)[3]認(rèn)為幾乎所有的基金均無(wú)法獲得顯著的超額收益,而Kosowski 等(2006)[4]的研究表明部分基金能夠獲得顯著并且持續(xù)超越市場(chǎng)基準(zhǔn)的收益?;鹗找骖A(yù)測(cè)研究同樣是基金研究的核心之一,近些年的研究成果陸續(xù)發(fā)現(xiàn)了具備基金收益預(yù)測(cè)性的指標(biāo)。早期的研究表明基金的凈值類特征,例如動(dòng)量[5]、資金流[6]以及基金近期超額收益[7]等均被驗(yàn)證具備基金收益預(yù)測(cè)性。后續(xù)的研究從基金的持倉(cāng)角度進(jìn)行分析,進(jìn)一步豐富了基金特征的分析維度。通過(guò)對(duì)比基金持股與基準(zhǔn)指數(shù)成分股的差異,Cremers 和Petajisto(2009)[8]、Doshi等(2015)[9]分別引入了主動(dòng)份額與主動(dòng)權(quán)重用來(lái)描述基金的主動(dòng)管理程度,并根據(jù)樣本外數(shù)據(jù)驗(yàn)證了主動(dòng)管理程度高的基金能夠獲得超額收益。由于中國(guó)公募基金的全持倉(cāng)信息為每半年披露一次,投資者并不能及時(shí)了解基金的最新持倉(cāng)信息,因此基金的真實(shí)收益與披露持倉(cāng)的模擬收益之間存在一個(gè)差值,而Kacperczyk 和Seru(2007)[10]的研究表明收益差高的基金更容易獲得超額收益。

隨著基金指標(biāo)的不斷擴(kuò)充,各個(gè)預(yù)測(cè)指標(biāo)均含有一定的信息和噪音,由于金融市場(chǎng)上的指標(biāo)普遍具有信噪比較低的特點(diǎn),因此如何將多維度的基金特征有效利用、剔除噪音從而提取有效的信息,進(jìn)而構(gòu)建具有超額收益的基金組合成了新興的研究熱點(diǎn)。機(jī)器學(xué)習(xí)算法作為人工智能的一個(gè)重要分支,可以對(duì)一列特征進(jìn)行降維,從大量指標(biāo)中提取有效的信息,近年來(lái),已有許多學(xué)者將其應(yīng)用于資產(chǎn)定價(jià)的研究之中[11,12]?;跈C(jī)器學(xué)習(xí)算法的預(yù)測(cè)模型可以通過(guò)海量的數(shù)據(jù)進(jìn)行迭代學(xué)習(xí),從而提供穩(wěn)健的決策建議,特別是在針對(duì)貼合實(shí)際情況的高維非線性數(shù)據(jù)研究中表現(xiàn)出優(yōu)秀的適應(yīng)性[11]。在基金收益預(yù)測(cè)研究領(lǐng)域,Li和Ross(i2020)[13]從股票的異象因子對(duì)股票未來(lái)收益具備顯著預(yù)測(cè)能力的角度出發(fā),通過(guò)基金持倉(cāng)股票信息與增強(qiáng)回歸樹(shù)算法驗(yàn)證了非線性模型對(duì)美國(guó)市場(chǎng)中基金具備顯著的收益預(yù)測(cè)能力;DeMiguel等(2021)[14]證明了梯度提升決策樹(shù)算法(Gradient Boosting Decision Tree,GBDT)可以從基金的常規(guī)特征中提取出有效信息,通過(guò)GBDT模型預(yù)測(cè)業(yè)績(jī)最好的基金所構(gòu)建的多頭組合可以獲得顯著的風(fēng)險(xiǎn)調(diào)整后收益。

雖然已有研究結(jié)果表明機(jī)器學(xué)習(xí)模型具備基金收益預(yù)測(cè)能力,但探究機(jī)器學(xué)習(xí)模型對(duì)中國(guó)市場(chǎng)基金收益預(yù)測(cè)能力的相關(guān)研究仍然不足。本文參考已有的相關(guān)文獻(xiàn),以中國(guó)市場(chǎng)基金作為樣本,系統(tǒng)地構(gòu)建了30 個(gè)基金異象因子,研究機(jī)器學(xué)習(xí)算法對(duì)預(yù)測(cè)基金未來(lái)收益的有效性。

1 研究設(shè)計(jì)

1.1 樣本數(shù)據(jù)

本文的基金研究樣本為Wind數(shù)據(jù)庫(kù)中投資類型屬于普通股票型與偏股混合型的開(kāi)放式基金,并剔除了投資港股的滬港通基金和分級(jí)基金。為了避免基金建倉(cāng)期導(dǎo)致數(shù)據(jù)缺失等問(wèn)題,本文還剔除了成立時(shí)間不滿一年的基金,同時(shí)要求在每個(gè)截面上使用的基金樣本要具備兩年以上的月度收益數(shù)據(jù)。由于2005年之前符合上述條件的基金樣本數(shù)量過(guò)少,因此,本文選取2005—2021年作為研究區(qū)間[15]。本文所使用的基金因子數(shù)據(jù)中,除了FamaFrench三因子、Carhart 四因子數(shù)據(jù)來(lái)源于CSMAR 數(shù)據(jù)庫(kù),其他所用到的基金凈值數(shù)據(jù)以及持倉(cāng)股票數(shù)據(jù)均來(lái)源于Wind數(shù)據(jù)庫(kù)。

1.2 因子檢驗(yàn)方法

1.2.1 投資組合排序分析法

投資組合排序分析法是根據(jù)待檢驗(yàn)的因子特征變量數(shù)值大小對(duì)資產(chǎn)進(jìn)行排序和分組,構(gòu)建投資組合,然后持有一段時(shí)間以計(jì)算每個(gè)投資組合的超額收益,通過(guò)比較不同投資組合的收益大小來(lái)判斷是否存在顯著差異,以測(cè)試該因子是否能夠預(yù)測(cè)資產(chǎn)的橫截面收益率。由于該方法是一種非參數(shù)分析方法,所以不需要對(duì)變量的分布以及變量之間的關(guān)系進(jìn)行嚴(yán)格的假設(shè),常用于實(shí)證資產(chǎn)定價(jià)研究[16]。

具體而言,將待檢驗(yàn)的變量從小到大進(jìn)行排序,然后根據(jù)十分位點(diǎn)將樣本基金劃分成十個(gè)組合。第一個(gè)投資組合包括所有變量值小于第一個(gè)十分位點(diǎn)的樣本,記為“Low”組,即空頭組合。變量值在第一斷點(diǎn)和第二斷點(diǎn)之間的樣本構(gòu)成第二個(gè)組合,以此類推。排序變量值高于最高斷點(diǎn)的樣本將被放在最后一個(gè)投資組合中,標(biāo)記為“High”組,即為多頭組合。設(shè)定每月月末對(duì)投資組合進(jìn)行調(diào)倉(cāng),計(jì)算每個(gè)投資組合的資產(chǎn)收益率,組合內(nèi)部單個(gè)資產(chǎn)的權(quán)重設(shè)為等權(quán)重?!癏igh”組合與“Low”組合的收益率之差,即多空對(duì)沖組合的收益率。如果多空對(duì)沖組合的收益率顯著大于0,則說(shuō)明待檢驗(yàn)的變量可以顯著預(yù)測(cè)資產(chǎn)的未來(lái)收益。除了檢驗(yàn)多空對(duì)沖組合的原始收益率以外,本文還使用FF3因子模型[17]計(jì)算了風(fēng)險(xiǎn)調(diào)整后收益。

檢驗(yàn)收益率序列是否顯著通常用t統(tǒng)計(jì)量來(lái)判斷。不過(guò)由于時(shí)間序列數(shù)據(jù)往往表現(xiàn)出自相關(guān)或異方差,這將會(huì)導(dǎo)致用于檢驗(yàn)原假設(shè)的標(biāo)準(zhǔn)誤差、P 值和t 統(tǒng)計(jì)量都可能不準(zhǔn)確,從而影響顯著性的判斷。所以本文使用了Newey和West(1987)[18]的方法對(duì)t 統(tǒng)計(jì)量進(jìn)行調(diào)整,即Newey-West t統(tǒng)計(jì)量,簡(jiǎn)稱NW-t檢驗(yàn)。

1.2.2 Fama-Macbeth回歸檢驗(yàn)

Fama-Macbeth 回歸分析法是由Fama 和Macbeth(1973)[19]提出的一種參數(shù)檢驗(yàn)方法。該方法分為兩個(gè)步驟。第一步是橫截面回歸,所使用的被解釋變量是t期的資產(chǎn)超額收益率,解釋變量是t-1期的特征變量和控制變量,如下所示:

其中,Yi,t表示資產(chǎn)i在t期的收益率,X1i,t-1是資產(chǎn)i在t-1 期的特征變量X1,β1,t-1是t-1 期特征變量X1 的系數(shù),αt表示截距項(xiàng),εi,t表示殘差項(xiàng)。在每個(gè)截面分別進(jìn)行上述回歸,從而獲得每個(gè)回歸系數(shù)的時(shí)間序列。

第二步是時(shí)間序列檢驗(yàn),即檢驗(yàn)第一步得到的回歸系數(shù)的平均值是否顯著異于0。

1.3 聚合方法

1.3.1 線性回歸

經(jīng)典的線性回歸以最小化殘差平方和為目標(biāo),對(duì)一個(gè)或多個(gè)自變量和因變量之間的關(guān)系建立一個(gè)回歸方程。其表達(dá)式為:

或簡(jiǎn)寫(xiě)成:

其中,Y 表示因變量,X 表示自變量,β為擬合系數(shù)。對(duì)于給定的樣本Xi,因變量真實(shí)值為Yi,預(yù)測(cè)值為=βT Xi,將平方損失函數(shù)定義為該函數(shù)的損失函數(shù):

其中,n 為樣本數(shù)量。通過(guò)最小化損失函數(shù),便可求得方程的最優(yōu)擬合系數(shù),該方程被稱為普通最小二乘回歸(OLS)。本文將OLS模型作為基準(zhǔn)模型,與機(jī)器學(xué)習(xí)算法進(jìn)行比較。

1.3.2 LightGBM模型

LightGBM(Light Gradient Boosting Machine,簡(jiǎn) 稱LightGBM或LGBM)是梯度提升樹(shù)的改進(jìn)方法之一。梯度提升決策樹(shù)(Gradient Boosting Decision Tree,簡(jiǎn)稱GBDT)是一種Boosting 算法,Boosting 算法的原理是通過(guò)集成弱分類器來(lái)提高模型預(yù)測(cè)的穩(wěn)定性和準(zhǔn)確性。GBDT 的主要思想是:將每個(gè)CART 樹(shù)作為一個(gè)基學(xué)習(xí)器,將每一棵樹(shù)擬合之前所有樹(shù)的殘差,構(gòu)建新的樹(shù)加到當(dāng)前模型中形成新的模型,而為了消除殘差,模型在殘差減少的梯度(Gradient)方向上建立一個(gè)新的模型,使損失函數(shù)沿著梯度方向下降。通過(guò)重復(fù)以上過(guò)程,不斷降低模型的殘差,從而獲得最終的模型。其中,每個(gè)決策樹(shù)進(jìn)行分支時(shí),以最小化平方誤差為目標(biāo),對(duì)每一個(gè)特征的每一個(gè)閾值進(jìn)行窮舉以尋求最優(yōu)的分割點(diǎn)。

作為GBDT 的改進(jìn)方法,LightGBM 同樣是Boosting 算法的代表性非線性機(jī)器學(xué)習(xí)模型之一。LightGBM使用決策樹(shù)作為基學(xué)習(xí)器,通過(guò)Boosting算法集成多個(gè)簡(jiǎn)單的基學(xué)習(xí)器,再通過(guò)多個(gè)學(xué)習(xí)器的學(xué)習(xí),不斷降低模型值和實(shí)際值的差。它的主要特點(diǎn)有:使用直方圖算法進(jìn)行優(yōu)化從而使得訓(xùn)練速度更快,降低了內(nèi)存使用率;使用GOSS減少大量只具有小梯度的樣本,在計(jì)算信息增益的時(shí)候只利用具有高梯度的數(shù)據(jù),從而減少了計(jì)算開(kāi)銷(xiāo);帶深度限制的Leaf-wise 的葉子生長(zhǎng)策略,使用帶有深度限制的按葉子生長(zhǎng)算法,不僅減少了時(shí)間和空間的開(kāi)銷(xiāo),而且有效降低了過(guò)擬合;支持并行計(jì)算從而減少計(jì)算時(shí)間等。

1.4 模型設(shè)計(jì)

本文使用LightGBM 模型,基于基金異象因子構(gòu)建基金收益預(yù)測(cè)的多因子模型。具體步驟為以t-1 期的N 個(gè)因子為解釋變量,t 期的基金收益為被解釋變量進(jìn)行擬合訓(xùn)練。設(shè)定模型形式為:

其中,f(·) 定義一個(gè)參數(shù)為θ的函數(shù),代表降維模型,Rt,i為基金i第t期的超額收益,xt-1,i為基金i第t-1 期的N個(gè)異象因子,?t,i為誤差項(xiàng)。每個(gè)異象因子在截面上進(jìn)行了標(biāo)準(zhǔn)化處理。本文采用滑動(dòng)窗口法劃分訓(xùn)練集、驗(yàn)證集與測(cè)試集,其中訓(xùn)練集為12個(gè)月,驗(yàn)證集和測(cè)試集分別為1 個(gè)月。最后根據(jù)模型的預(yù)測(cè)值對(duì)下一個(gè)月的基金進(jìn)行排序分組進(jìn)而構(gòu)建投資組合。如圖1 所示,假設(shè)當(dāng)前處于2006 年2 月,訓(xùn)練集則由2005年12個(gè)月的數(shù)據(jù)構(gòu)成并用于模型擬合訓(xùn)練。2006年1月作為驗(yàn)證集數(shù)據(jù),將用于機(jī)器學(xué)習(xí)模型的樣本外調(diào)參,本文將采用網(wǎng)格調(diào)參(Grid Search)方式篩選最優(yōu)的機(jī)器學(xué)習(xí)模型超參數(shù),最終使用篩選所得的最優(yōu)超參數(shù),通過(guò)訓(xùn)練集與驗(yàn)證集的數(shù)據(jù)進(jìn)行模型訓(xùn)練。模型完成訓(xùn)練以后將2006年2月的因子輸入模型即可預(yù)測(cè)2006年3月的收益,然后根據(jù)預(yù)測(cè)值對(duì)基金排序分組構(gòu)建多頭組合、空頭組合以及多空組合。

圖1 滑動(dòng)窗口法

1.5 因子說(shuō)明

本文的實(shí)證分析皆通過(guò)月度頻率進(jìn)行計(jì)算,而部分異象因子數(shù)據(jù)需要使用基金季頻的前十大重倉(cāng)或半年頻的全持倉(cāng)信息,對(duì)于這類因子,本文將季頻與半年頻的數(shù)據(jù)進(jìn)行月度填充。由于基金的季報(bào)與半年報(bào)存在披露延遲的情況,因此數(shù)據(jù)填充時(shí)將使用已披露的最新一期報(bào)告中的相關(guān)信息。本文參考大量文獻(xiàn),系統(tǒng)性地梳理了30 個(gè)已被證實(shí)有效的基金因子進(jìn)行研究,詳細(xì)的因子名稱及描述見(jiàn)下頁(yè)表1。

表1 基金因子匯總

2 實(shí)證分析

2.1 投資組合排序分析

本文檢驗(yàn)了機(jī)器學(xué)習(xí)模型在中國(guó)公募基金市場(chǎng)的實(shí)證績(jī)效。后文表2 展示了LightGBM 模型在滑動(dòng)窗口劃分的測(cè)試樣本中的十組基金組合的平均月度收益率、經(jīng)過(guò)Fama-French 風(fēng)險(xiǎn)因子調(diào)整后的收益率以及經(jīng)過(guò)Newey-West 方法調(diào)整的t 值。整體而言,LightGBM 模型所構(gòu)建的多空組合以及多頭組合均可獲得顯著的正收益,并且在月度收益率、風(fēng)險(xiǎn)調(diào)整后的收益率與顯著性上皆優(yōu)于OLS模型。

表2 基金投資組合表現(xiàn)

觀察表2多空組合表現(xiàn),LightGBM模型的月度收益率為0.495%(NW-t=2.89),年化收益率為5.94%;OLS 模型的月度收益率為0.400%(NW-t=2.01),年化收益率為4.8%,前者相較后者的提升幅度為23.8%。通過(guò)比較風(fēng)險(xiǎn)調(diào)整后的收益情況來(lái)看,LightGBM 模型的alpha 同樣優(yōu)于OLS模型。LightGBM模型的alpha 為0.727%(NW-t=3.07),OLS 模型的alpha 為0.580%(NW-t=2.44),前者相較后者的提升幅度為25.3%。

鑒于基金市場(chǎng)無(wú)法做空,多空組合僅能反映模型是否具備較強(qiáng)的預(yù)測(cè)能力,而多頭組合相對(duì)更具備投資指導(dǎo)意義。觀察表2多頭組合表現(xiàn),LightGBM模型的月度收益率為1.688%(NW-t=2.65),年化收益率為20.256%,風(fēng)險(xiǎn)調(diào)整后收益率為0.727%;OLS 模型的月度收益率為1.575%(NW-t=2.50),年化收益率為18.9%,風(fēng)險(xiǎn)調(diào)整后收益率為0.580%。前者相較后者在收益上提升幅度為7.17%,風(fēng)險(xiǎn)調(diào)整后收益提升幅度為25.3%。此外,LightGBM模型的收益率與alpha 均在1%的水平上顯著,而OLS 模型僅在5%的水平上顯著。

2.2 Fama-Macbeth回歸檢驗(yàn)

接下來(lái),本文通過(guò)Fama-Macbeth 回歸方法進(jìn)行檢驗(yàn)。將機(jī)器學(xué)習(xí)模型在各個(gè)滑動(dòng)窗口驗(yàn)證集的預(yù)測(cè)結(jié)果作為解釋變量,將下一期的基金收益作為被解釋變量,參考馮旭南和李心愉(2013)[20]、羅榮華和田正磊(2020)[15]以及Doshi 等(2015)[9]的研究,選取了基金年限Age、基金規(guī)模Size、資金流Flow、換手率Turnover、近12 個(gè)月累計(jì)收益率Return、收益波動(dòng)率Volatility、主動(dòng)權(quán)重Active Weight、交易差Return Gap作為控制變量,具體表達(dá)式如下:

其中,Returni,t為基金i 在t 期的收益率,為模型在t-1期對(duì)基金i的預(yù)測(cè)收益率,Xj,t-1為控制變量j在t期的數(shù)值。

后文表3 展示了基于不同控制變量的Fama-Macbeth回歸的檢驗(yàn)結(jié)果。LightGBM模型的預(yù)測(cè)值對(duì)基金未來(lái)收益的解釋性并未因受到三組控制變量的影響而減弱。觀察LightGBM 預(yù)測(cè)收益在三組控制變量下的回歸系數(shù),其N(xiāo)W-t 值分別為3.36、3.37 以及3.35,均顯著。作為對(duì)比,OLS 模型的預(yù)測(cè)值在顯著性上要明顯弱于LightGBM 模型,其回歸系數(shù)的NW-t值在三組控制變量組合中分別為1.76、1.76 以及1.78,僅在10%的水平上顯著。由此可見(jiàn),機(jī)器學(xué)習(xí)模型的預(yù)測(cè)效果并沒(méi)有受到基金年限、基金規(guī)模以及基金資金流等控制變量的影響,在統(tǒng)計(jì)學(xué)意義上仍然具備顯著的預(yù)測(cè)能力。

表3 Fama-Macbeth回歸檢驗(yàn)

2.3 穩(wěn)健性檢驗(yàn)

為了驗(yàn)證機(jī)器學(xué)習(xí)模型是否能夠獲取穩(wěn)定的超額收益并且優(yōu)于傳統(tǒng)線性回歸模型,本文還進(jìn)行了一系列穩(wěn)健性檢驗(yàn)。本文選取另一種機(jī)器學(xué)習(xí)方法——隨機(jī)森林算法(Random Forest,RF)作為穩(wěn)健性檢驗(yàn)的模型。隨機(jī)森林屬于Bagging算法的一種,它的基本單元是決策樹(shù),通過(guò)集成學(xué)習(xí)的思想將多棵樹(shù)的結(jié)果進(jìn)行集成從而得到最終結(jié)果。Leippold等(2021)[21]、Gu等(2020)[22]發(fā)現(xiàn),隨機(jī)森林模型可以有效捕捉股票特征與未來(lái)收益之間的非線性關(guān)系,從而獲得具有較強(qiáng)預(yù)測(cè)能力的模型。

觀察表4 可以發(fā)現(xiàn),通過(guò)隨機(jī)森林模型所構(gòu)建的多頭與多空基金組合同樣可獲得顯著為正的月度收益率。具體來(lái)看,隨機(jī)森林模型多空組合的月度收益率為0.421%(NW-t=2.20),年化收益率為5.05%,相較于OLS模型的提升幅度為5.2%;其多頭組合的月度收益率為1.641%(NW-t=2.62),證明了機(jī)器學(xué)習(xí)模型預(yù)測(cè)基金收益的穩(wěn)健性。

表4 隨機(jī)森林組合表現(xiàn)

此外,由于基金存在規(guī)模報(bào)酬遞減的情況,規(guī)模較大的基金相對(duì)規(guī)模較小的基金更難獲得超額收益。因此本文還檢驗(yàn)了LightGBM 模型根據(jù)基金規(guī)模加權(quán)所構(gòu)建的基金組合在收益與統(tǒng)計(jì)顯著性方面的表現(xiàn)。如下頁(yè)表5所示,相對(duì)等權(quán)構(gòu)建組合,LightGBM 與OLS 模型根據(jù)基金規(guī)模加權(quán)構(gòu)建組合的收益表現(xiàn)均有所下降,但LightGBM模型在多頭組合與多空組合的業(yè)績(jī)表現(xiàn)仍然優(yōu)于OLS模型。

表5 規(guī)模加權(quán)基金投資組合

具體來(lái)看,LightGBM 模型與OLS 模型的多空組合平均月度收益率分別為0.415%(NW-t=1.86)與0.194%(NW-t=0.71),前者相較后者的提升幅度為113.9%;Light-GBM 模型與OLS 模型的多頭組合月度收益率分別為1.570%(NW-t=2.41)與1.372%(NW-t=2.15),前者相較后者的提升幅度為14.4%。由此可見(jiàn),通過(guò)機(jī)器學(xué)習(xí)模型構(gòu)建的基金投資組合受到規(guī)模報(bào)酬遞減效應(yīng)的影響要遠(yuǎn)小于OLS模型,并且具備更加穩(wěn)定的統(tǒng)計(jì)顯著性。

本文的研究區(qū)間覆蓋了受新冠肺炎疫情影響較為嚴(yán)重的2020—2021 年,為了排除特殊事件可能對(duì)研究結(jié)論帶來(lái)的影響,本文采用2005—2019 年作為回測(cè)區(qū)間進(jìn)行機(jī)器學(xué)習(xí)模型預(yù)測(cè)基金收益效果的檢驗(yàn)。由于篇幅限制,本文未展示上述區(qū)間的排序分組檢驗(yàn)與Fama-Macbeth回歸檢驗(yàn)結(jié)果,但檢驗(yàn)結(jié)果均支持本文的主要結(jié)論。

3 結(jié)論與啟示

本文選取2005—2021 年中國(guó)公募基金數(shù)據(jù),通過(guò)30個(gè)基金異象因子證明了機(jī)器學(xué)習(xí)算法對(duì)中國(guó)公募基金的收益預(yù)測(cè)能力,完善了國(guó)內(nèi)基金資產(chǎn)定價(jià)研究。本文采用LightGBM算法作為非線性機(jī)器學(xué)習(xí)模型的代表構(gòu)建了基金收益預(yù)測(cè)模型,檢驗(yàn)了機(jī)器學(xué)習(xí)模型在預(yù)測(cè)基金未來(lái)收益方面的能力。從實(shí)證結(jié)果來(lái)看,LightGBM 模型所構(gòu)建的多頭組合具有20.256%的年化收益率,并且在風(fēng)險(xiǎn)調(diào)整后收益率以及夏普比率上要明顯優(yōu)于傳統(tǒng)的線性模型。本文通過(guò)構(gòu)建規(guī)模加權(quán)的基金組合,檢驗(yàn)了LightGBM 模型面對(duì)不同規(guī)模的基金所構(gòu)建的組合的收益情況。通過(guò)實(shí)證檢驗(yàn)發(fā)現(xiàn),LightGBM 模型在構(gòu)建基金規(guī)模加權(quán)的多頭組合時(shí)受到的負(fù)面影響要遠(yuǎn)小于線性模型,并且能夠保證穩(wěn)定的統(tǒng)計(jì)顯著性。在基于OLS 模型所構(gòu)建的Fama-Macbeth回歸檢驗(yàn)中,LightGBM模型預(yù)測(cè)值的β為正,且在1%的水平上顯著。

綜上所述,機(jī)器學(xué)習(xí)在基金市場(chǎng)的收益預(yù)測(cè)方面具備顯著的優(yōu)勢(shì),能夠充分挖掘基金持倉(cāng)股票維度以及基金自身維度的異象因子與基金收益間的非線性關(guān)系。與傳統(tǒng)線性模型相比,機(jī)器學(xué)習(xí)模型具有更好的預(yù)測(cè)精度和更有利的投資組合效果。此外,本文還證明了在根據(jù)規(guī)模加權(quán)構(gòu)建基金組合時(shí),機(jī)器學(xué)習(xí)模型相對(duì)于傳統(tǒng)線性模型的提升更加顯著。

猜你喜歡
收益率機(jī)器收益
機(jī)器狗
機(jī)器狗
螃蟹爬上“網(wǎng)” 收益落進(jìn)兜
未來(lái)機(jī)器城
電影(2018年8期)2018-09-21 08:00:06
2015年理財(cái)“6宗最”誰(shuí)能給你穩(wěn)穩(wěn)的收益
金色年華(2016年1期)2016-02-28 01:38:19
東芝驚爆會(huì)計(jì)丑聞 憑空捏造1518億日元收益
無(wú)敵機(jī)器蛛
如何解開(kāi)設(shè)計(jì)院BIM應(yīng)用的收益困惑?
秦安县| 葵青区| 泸州市| 玉溪市| 广宁县| 射阳县| 小金县| 胶州市| 岐山县| 南昌县| 浦北县| 江川县| 明星| 安庆市| 比如县| 特克斯县| 西乌珠穆沁旗| 兴业县| 渭源县| 武邑县| 平罗县| 达尔| 枞阳县| 盐山县| 富平县| 淮北市| 女性| 淮阳县| 乌恰县| 柘荣县| 四川省| 延庆县| 仙居县| 五指山市| 黔南| 克什克腾旗| 略阳县| 大方县| 平凉市| 得荣县| 宁阳县|