潘佳祥 董傲坤 鮑一丹
(天津科技大學,天津 300450)
基金投資在近些年來是一個熱門話題,越來越多的投資者將購買基金作為投資方式,截至2020年第四季度末,我國的基金數(shù)量已多達7000多只。同時我國的開放式公募基金經(jīng)過了20多年的發(fā)展,截至2020年年底,其規(guī)模已經(jīng)躍居亞太地區(qū)第一,全球第五。并且,隨著開放式公募基金的發(fā)展,出現(xiàn)了越來越多的基金經(jīng)理,其管理的基金規(guī)模也在逐步擴大。但是,由于基金經(jīng)理的水平差異較大,基金之間的業(yè)績也各不相同,基金投資領域出現(xiàn)分化的現(xiàn)象。許多投資者面對如此眾多的開放式公募基金與基金經(jīng)理,很難作出最優(yōu)選擇。
面對數(shù)量眾多的基金與投資者難以選擇的局面,開放式公募基金的業(yè)績評價和推薦模型對基金銷售機構(gòu)和廣大投資者都具有重要意義。
本文利用基于Python的開源金融數(shù)據(jù)接口庫收集2008年至2020年所有開放式公募基金從成立以來的所有歷史凈值數(shù)據(jù),包括每日凈值、累計凈值和收益率,并進行數(shù)據(jù)清洗,得到有效數(shù)據(jù)。
主成分分析與因子分析的主要思想類似,二者都是利用了“降維”思想,利用若干主成分或者公因子來代表原始變量。
主成分分析是利用線性的變換方法,把高維的問題向低維的問題轉(zhuǎn)化,把研究變量通過降維處理,轉(zhuǎn)變成新的變量,同時按照方差降序排列。主成分分析的方法可以將很多變量通過降維處理,轉(zhuǎn)化成少數(shù)互不相關的新變量。所形成的新變量能夠解釋原有數(shù)據(jù)的絕大多數(shù)變量,即原有變量的主要成分,并且能夠解釋數(shù)據(jù)的綜合指標。因子分析同樣運用了“降維”理念,結(jié)合原有變量的相關矩陣內(nèi)部關系,將關系復雜變量轉(zhuǎn)化為少數(shù)公共因子和特殊因子線性組合。相比較于主成分分析法,因子分析則側(cè)重于描述原始變量之間的相關關系。
(1)收益率指標
基金的收益水平是基金的業(yè)績的重要組成部分。本文選取日均收益率、超額收益率兩個收益評價指標來對基金收益情況進行衡量。首先建立基金業(yè)績與收益水平的關系函數(shù)。設第i只基金的收益率為ri,第i只基金的單位凈值為pi,基金份額為X,P0,P1分別為0時刻與1時刻基金單位凈值,
超額收益率:Rit=ri-rm
(2)風險衡量指標
投資中的風險問題也不容忽視,主要是基金投資收益的不確定性,基金經(jīng)理一般會結(jié)合自己獨有的投資經(jīng)驗與操作風格,通過各種方式來達到規(guī)避風險的目的,可是基金的收益波動不能被完全消除。本文選用基金收益率的標準差、最大回撤值這兩個指標衡量基金的風險情況。
(3)夏普比率
基金投資中,風險的差異往往意味著收益的差異。夏普比率同時將風險因素與收益因素綜合考慮,能夠減少因考慮單一風險或收益因素來評價投資的誤差,提高評價的準確性與客觀性。因此,本文選取夏普比率作為綜合評價指標。
由于我國國債市場流動性較弱,利率市場化較弱,不適合直接選取國債利率。因此本文綜合考慮后,決定選用中國銀行2021年度的一年期定期存款利率1.75%為投資無風險利率,即rf=1.75%。
(4)綜合評價
最后運用SPSS軟件對得到的相關數(shù)據(jù)進行主成分分析找出兩個主成分,通過因子分析得到旋轉(zhuǎn)后的方差貢獻率作為因子權(quán)重。將因子權(quán)重與對應成分構(gòu)建線性方程,得出綜合得分并排序,從中選擇前10的基金作為推薦基金。然后把這10只基金2015年每日收益率賦予相等的權(quán)重并求和,作為組合的收益率,在此基礎上對所推薦基金未來一年,即2016年的日收益進行預測。
本文對2008年至2020年中每一年已成立的基金分別進行分析,在該年尚未成立的基金不予考慮。接下來從基金的收益水平和風險程度兩方面進行綜合分析。一方面,通過計算基金的日均收益率、超額收益率和夏普比率判斷基金的收益水平;另一方面,通過計算基金的最大回撤值、標準差作為基金的風險指標。綜合從以上五個角度進行分析。本文選取2016年基金的發(fā)展狀況進行展示分析。
(1)分析一:相關性分析
對每年各只基金的日均收益率、超額收益率、夏普比率、最大回撤值、標準差這些指標進行相關性分析。使用SPSS,對所選取指標進行相關性分析,繪制相關性熱力圖表示不同指標之間的相關程度,如圖1所示。
圖1 相關系數(shù)矩陣熱力圖
從圖1可得,由于收益率和夏普比率的相關系數(shù)為1,說明這兩個指標完全正相關。超額收益率與標準差、夏普比率、收益率有著較弱的正相關性,與最大回撤值有著較低的負相關性;夏普指數(shù)和收益率與最大回撤值有著較強的負相關性。因此,收益率和夏普比率可以作為一個指標,其他指標均具有一定的可解釋性,可作為衡量基金收益或風險的指標。
(2)分析二:日均收益率
日均收益率,代表著基金成立以來的收益狀況的一般水平,以基金代碼為160918為例計算日均收益率約為0.3657。同理可得該年其他基金日均收益率。通過Python編程篩選出2015年初已成立的基金,在2015年每天的收益率數(shù)據(jù),計算各基金的日均收益率。
(3)分析三:超額收益率
超額收益率Rit=ri-rm,反映一只基金的收益情況高出整個市場平均水平的程度。超額收益率越高就說明基金的收益情況越好。運用Python編程篩選出2015年年初已成立的基金,在2015年每天的超額收益率數(shù)據(jù),進行求解。以160918的超額收益率計算為例:即Rit=ri-rm=0.3675-0.1216=0.2459,同理得出各基金2015年1整年的超額收益率
(4)分析四:標準差
基金收益率的標準差代表基金收益的波動情況,標準差越大意味著基金收益情況越不穩(wěn)定。運用Python編程篩選出2015年已成立基金在2015年1整年每天的標準差數(shù)據(jù),得出各基金2015年1整年的標準差,以編號為166016的基金收益標準差為例進行計算。結(jié)果如下:
(5)分析五:夏普比率
夏普比率表示投資者每多承擔一單位風險,能夠獲得超過無風險報酬率的報酬。在夏普比率大于零的情況下,說明在衡量期內(nèi)基金的平均凈值增長率超過了無風險利率,夏普比率越大,表示投資該基金承擔單位風險能夠獲得的收益越高。以代碼為160918的基金夏普比率為例計算。結(jié)果如下:
同理可得其他基金夏普比率。以根據(jù)Python編程所篩選出2015年初之前成立的所有基金的2015年1整年夏普比率。
(6)分析六:最大回撤值
最大回撤值是衡量在投資某一產(chǎn)品之后,可能會出現(xiàn)最大程度虧損的風險指標。最大回撤值越小說明基金的風險越低。以基金代碼為160918的基金為例計算最大回撤值:即將該基金2016年每一天的當天單位凈值與后一天的單位凈值作差,再除以當天單位凈值求出回撤值,然后求出一年中最大回撤值約為-0.0036,同理可得其他基金最大回撤值。
為保證模型準確性,需保證使用至少一整年的數(shù)據(jù)進行計算分析,以2016年推薦基金為例,那么只需考慮截至2015年1月1日已成立的223只基金,在此范圍中進行基金推薦。
考慮評價模型的客觀性、有效性,本文使用數(shù)理統(tǒng)計中主成分分析法、因子分析法結(jié)合SPSS軟件,分別對兩類(風險與收益)的五個評價指標進行了綜合的測評與排序。因為主成分1、2特征值都大于1,而且能夠解釋原數(shù)據(jù)89.42%的方差,即涵蓋了大部分信息,這表明前兩個主成分能夠代表最初的5個指標,所以本文選取前兩個主成分的方式具有一定可取性。
表1和表2分別給出了2016年基金主成分、特征值、方差貢百分比與累計獻率和經(jīng)過旋轉(zhuǎn)之后的成分矩陣。
表1 總方差解釋
表2 旋轉(zhuǎn)后的成分矩陣a
從旋轉(zhuǎn)之后的成分矩陣可以看出,收益率、夏普比率和超額收益率和主成分1具有較大相關性,將其歸納整理,作為評價基金收益情況的相關指標,主要表示開放式公募基金的收益水平和業(yè)績情況。最大回撤值和標準差與主成分2具有較大相關性,可以將其歸納總結(jié)為開放式公募基金的風險調(diào)控的相關能力指標。分別用Y1和Y2代表主成分1和主成分2。
利用SPSS軟件,將所求得的因子載荷矩陣中的數(shù)值與對其應特征根的算術(shù)平方根作商,求得主成分的線性組合系數(shù),將所得系數(shù)代入模型,求解出主成分的表達式。然后利用成分矩陣旋轉(zhuǎn)之前的方差貢獻率求得各自的權(quán)重,再將每一項的權(quán)重與所對應的主成分值相乘,計算結(jié)果作為綜合得分。即:
Score=0.61449×Y1+0.2797×Y2(Y1,Y2∈R)
最終得出2016年初推薦的十只基金依次為:大成中小盤混合A、國泰估值優(yōu)勢混合、國泰中小盤成長混合、興全輕資產(chǎn)混合、銀華內(nèi)需精選混合、申萬菱信量化小盤股票、興全合潤混合、東方紅睿豐混合、融通領先成長混合、萬家行業(yè)優(yōu)選混合A。以排名第一的基金大成中小盤混合A綜合得分為例,Y1為2.8660,Y2為0.4569,得分為1.89。
將主成分綜合評價結(jié)果與單一的收益水平和風險程度的評價結(jié)果進行Pearson相關性分析,結(jié)果顯示可以通過相關性檢驗,說明主成分綜合評價與所選取的單一指標具有較強相關性,因此能夠使用主成分綜合評價法進行基金的業(yè)績評價。
在得出2016年年初推薦的10只優(yōu)秀的基金后,還需要給出這10只基金等權(quán)重組合在2016一整年的的表現(xiàn)情況。所以將2015年中排名前10的每只基金的日收益率分別乘以10%的權(quán)重,再將其加總作為當日的組合收益率,最終得出基金等權(quán)重組合2015年整年間的每日組合收益率。
此外,由于基金市場節(jié)假日休市,所以一年中每只基金有效交易天數(shù)為244天。因此可以將2015年的有效交易日期用序號1-244表示,2016年的有效交易日期則可用245-494表示。這樣就把2015年和2016年的日期放于同一坐標軸,以2015年基金的每日組合收益為基準,運用matlab工具箱反三角函數(shù)擬合方法,得到函數(shù)f(x),對2016年的日收益進行預測。函數(shù)f(x)的系數(shù)和變量的擬合程度分別如表3和圖2所示。
表4 模型系數(shù)
圖2 模型擬合程度
通過計算結(jié)果以及擬合模型圖所示,函數(shù)f(x)具有較高的擬合程度,說明模型較為準確。因此,本文將運用該模型預測每年年初所推薦的十只開放式公募基金等權(quán)重基金組合在未來一整年的發(fā)展趨勢。
關于基金的評價,目前有很多學者從不同的角度建立模型,并進行分析求解,可是截止目前仍沒有全面準確的基金評價模型,可見這一問題十分復雜。
本文對開放式公募基金評價這一問題進行探索,建立基于主成分分析與因子分析的開放式公募基金的評價模型。首先查閱大量參考文獻,對影響基金發(fā)展的因素進行收集與分析后,選用基金的日均收益率、超額收益率和夏普比率、最大回撤值和標準差等5個重要指標。通過SPSS軟件做相關性分析得到這些指標間具有一定的相關性后,基于各個基金的單位凈值和日增長率建立5個指標的函數(shù)關系式。
以2016年為例,通過python編程分別篩選出2015年年初之前成立的所有基金2015年1整年內(nèi)5個指標的相關數(shù)據(jù)。然后進行主成分分析、因子分析,得出旋轉(zhuǎn)后的成分矩陣,將日均收益率、夏普比率和超額收益率劃入收益型指標,將標準差和最大回撤值劃入風險型指標。利用SPSS軟件得到主成分的線性組合系數(shù),由此得到主成分的表達式。再求得權(quán)重,再將每一項的權(quán)重與所對應的主成分值相乘,計算結(jié)果作為綜合得分。取前10名作為2016年年初的推薦基金。在假設無風險收益率是定值、忽略現(xiàn)金分紅的情況下,分別求解目標函數(shù),得出各基金2015年1整年的5個指標的值,并根據(jù)5個指標分別排名,作為2016年年初基金的前十名。
最后將所推薦的十只基金等權(quán)重組合,對未來一年,即2016年的日收益進行預測。同時,模型還可以進行調(diào)整與推廣,例如可以將開放式公募基金按照風險成分或收益成分的得分進行排名,根據(jù)投資者對于風險的承受能力與偏好程度,細分為保守型、激進型等多種類型投資者,為不同類型的投資者推薦合適基金。
所建立的基于主成分分析與因子分析的開放式公募基金評價模型能夠為基金投資者提供一定參考,能夠幫助基金投資者在眾多基金中綜合分析,選擇最優(yōu)基金。