李俊豪
摘要:在基于傳統(tǒng)的多因子選股模型下,進(jìn)行了對(duì)因子權(quán)重分配的改進(jìn)。在選取有效性因子后,使用衰變IC因子賦權(quán)方法得出更為符合市場(chǎng)的選股模型,并根據(jù)模型每個(gè)月進(jìn)行重新調(diào)倉(cāng)使用滬深300指數(shù)作為基準(zhǔn)進(jìn)行超額收益率的計(jì)算。結(jié)果表明該模型的回測(cè)表現(xiàn)優(yōu)于同期滬深300指數(shù)表現(xiàn),在驗(yàn)證了衰變IC加權(quán)模型的有效性后,推廣該模型,更好地為廣大投資者提供研究建議。
關(guān)鍵詞:量化投資;多因子模型;權(quán)重賦值;IC系數(shù);衰變型
中圖分類號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)11-0256-02
成功的股票投資無外乎幾大步驟:選股、擇時(shí)、倉(cāng)控。精通任何一點(diǎn)就可以說是在股市中所向披靡。量化投資亦是如此,多因子選股作為當(dāng)前量化方向重要選股手段,共有幾大步驟首先便是對(duì)于因子的選取,F(xiàn)ama和Kenneth(1993)曾研究了幾種常見對(duì)股票以及債券收益的因子,并表示市場(chǎng)風(fēng)險(xiǎn)、企業(yè)規(guī)模、賬面價(jià)值等相關(guān)性風(fēng)險(xiǎn)因素。[1]
在因子選取后便是對(duì)有限因子的選取,安信證券金融工程分析師潘安(2011)的研究報(bào)告指出在選取相應(yīng)選股因子之后,要進(jìn)行有效因子的選取以及有效冗余因子的剔除,其構(gòu)造的選股模型在2005年到2010年間有著很好的收益。
隨后是對(duì)多因子選股模型的構(gòu)建,當(dāng)前普遍的模型構(gòu)建方式大都依靠因子評(píng)分法以及回歸分析法。吳荻(2011)采用多因素綜合Z評(píng)分的選股方法,將14各項(xiàng)指標(biāo)進(jìn)行一定標(biāo)準(zhǔn)化,然后用不同的權(quán)重構(gòu)建模型,驗(yàn)證得到該模型在牛市中有著良好的選股能力。[2]
對(duì)于權(quán)重分配的研究,長(zhǎng)江證券(2016)使用了因子值對(duì)收益率進(jìn)行截面回歸分析,并在得到因子的收益率后將其作為動(dòng)態(tài)權(quán)重。董嬋(2017)對(duì)于當(dāng)前選股中因子賦權(quán)進(jìn)行突破,采用信息系數(shù)-當(dāng)前因子值與下期收益率的相關(guān)性進(jìn)行重新賦權(quán),在對(duì)2013-2015的中證500回測(cè)中有著較好的收益率。[3]
1 多因子選股模型思路
1.1 數(shù)據(jù)的來源選取
本文選取所有在2018年12月調(diào)整后的滬深300指數(shù)成分股作為研究樣本,并以2010-2018年作為樣本期,其中2010-2014年為因子篩選期,2015-2018年作為選股策略的樣本檢驗(yàn)期。其中樣本選取時(shí)間包括熊市、牛市、震蕩市。樣本空間范圍為:1.上市6個(gè)月以上、2.非ST股及ST摘帽后3個(gè)月以上。所比較的收益市場(chǎng)基準(zhǔn)也選擇滬深300指數(shù)。
數(shù)據(jù)的內(nèi)容包括上市公司的基本面數(shù)據(jù),技術(shù)面數(shù)據(jù),樣本充足對(duì)于當(dāng)某家的指標(biāo)數(shù)據(jù)多于一半的數(shù)據(jù)為空值時(shí),認(rèn)為這樣的樣本會(huì)影響正常效果并直接剔除,若是有個(gè)別的數(shù)據(jù)的缺失,本文采用前后加權(quán)平均的手段進(jìn)行補(bǔ)充,并且由于這樣的數(shù)據(jù)確實(shí)較少所以對(duì)于樣本數(shù)據(jù)不會(huì)有太大的影響。其中對(duì)于因子選取數(shù)據(jù)均采用公司季度數(shù)據(jù),對(duì)于發(fā)布時(shí)間有所不一樣的,對(duì)第二季度與第四季度進(jìn)行改變,使用半年報(bào)以及年報(bào)進(jìn)行相應(yīng)參考。
數(shù)據(jù)采集來源來自國(guó)泰安數(shù)據(jù)庫(kù),使用的數(shù)據(jù)處理軟件為聚寬的python平臺(tái)。
1.2 候選因子的選取
本文將所考慮的候選因子共分為基本面因子、技術(shù)面因子。其中基本面因子包括規(guī)模因子、估值因子、盈利能力因子、品質(zhì)因子。技術(shù)面包括換手率以及月成交量共有21個(gè)因子,如表1所示:
1.3 選股因子的有效性檢驗(yàn)
在已有的21個(gè)候選因子中挑選更為有效的、真正影響股票收益率的因子則為重中之重。本文采用將這些因子進(jìn)行單獨(dú)測(cè)試,每個(gè)選股周期重復(fù)測(cè)試,首先information coeficient(IC)信息系數(shù)是選取因子的第一道關(guān)卡,IC系數(shù)記錄了股票因子值與下期收益率的相關(guān)系數(shù)。本文采用spearman秩相關(guān)系數(shù)進(jìn)行選擇,若是秩相關(guān)系數(shù)較大,則該因子對(duì)股票價(jià)格影響較大。通常來說,一般認(rèn)為IC絕對(duì)值>=3%,則認(rèn)為該因子較為有效。其次要判斷IC的正確性,對(duì)每個(gè)交易日的IC值進(jìn)行顯著性檢驗(yàn),設(shè)置通過顯著性檢驗(yàn)的IC比例-顯著性比例,并設(shè)定閾值0.7,超過70%即可認(rèn)定為優(yōu)秀的因子。
第二步,在將滬深300個(gè)股的年化收益率與因子進(jìn)行相關(guān)性分析,若正相關(guān)則,因子越大收益率越高,反之,因子越小收益率越大,倒數(shù)處理。然后根據(jù)所得數(shù)據(jù)對(duì)股票進(jìn)行因子大小的打分,根據(jù)打分進(jìn)行降序排列后分組,本文將其分為15組,從1組到15組。然后,分別計(jì)算第一組和第15組的超額α收益,分別設(shè)為x與y,若是能夠明顯看到兩組中一組明顯跑贏滬深300指數(shù)以及一組明顯跑輸滬深300指數(shù)。最后計(jì)算分別在牛市、熊市、震蕩市中個(gè)組合的表現(xiàn),若是跑贏與跑輸?shù)母怕驶静蛔冞@說明因子選取較為準(zhǔn)確。
1.4 有效冗余因子的去除
盡管在選取的有效因子都能夠在股市中有著良好的表現(xiàn),但是通常會(huì)有這一些因子的相關(guān)性相當(dāng)高,減少相關(guān)變量的影響是多因子選股模型的重要環(huán)節(jié)。本文需要留下相關(guān)性較小的有效因子。[4]具體步驟是:計(jì)算不同因子的超額收益率,隨后進(jìn)行打分,超額收益率高的因子分值高。假設(shè)組合[A1]到組合[An]有超額收益率[Q1]到[Qn],將收益率按照大小進(jìn)行排列,若[Qn]>[Q1],那么第t個(gè)因子的得分就是t,反之得分為[n-t-1],隨后根據(jù)得分得到相關(guān)性矩陣。在設(shè)定閾值[MaxIndexCorr][MaxIndexCorr]后,若是相關(guān)系數(shù)超過閾值,則該因子作為冗余因子被去除。此處經(jīng)過檢驗(yàn)沒有因子被去除,故不列所計(jì)算數(shù)據(jù)。
1.5 動(dòng)態(tài)權(quán)重評(píng)分模型
本文采用打分法篩選出股票組合,常見的打分法分為兩類,本文采用動(dòng)態(tài)權(quán)重打分法。使用IC因子對(duì)9大因子進(jìn)行賦權(quán),在這里,本文因?yàn)榭紤]了時(shí)間對(duì)IC因子的影響,認(rèn)為因子具有一定的動(dòng)量性,所以近期因子對(duì)股票收益的影響一定是要大于遠(yuǎn)期因子的,那么不妨將近期因子賦予更多的權(quán)重,遠(yuǎn)期因子的權(quán)重賦予少些。
規(guī)定所選擇股票5日換倉(cāng),每一次換倉(cāng)日向前滾動(dòng)一期計(jì)算最新IC值,作為下一期的權(quán)重,最后使用滬深300指數(shù)作為基準(zhǔn)指數(shù),將所得收益與其比較。
2 模型回測(cè)
通過聚寬python量化平臺(tái)進(jìn)行相應(yīng)數(shù)據(jù)回測(cè),可以得到量化收益回測(cè)圖:
其中藍(lán)色線條為本文采用的衰變IC加權(quán)模型所會(huì)測(cè)出的策略收益線,三年收益高達(dá)36.20%,策略年化收益8.24%,而同期滬深300指數(shù)收益-14.80%,說明本策略實(shí)戰(zhàn)效果良好,通過檢測(cè)。
3 結(jié)論與建議
通過模型可以看出,通過IC系數(shù)選取的因子在衰變IC加權(quán)的動(dòng)態(tài)打分系統(tǒng)模型下表現(xiàn)良好,其模型收益遠(yuǎn)高于同期的滬深300指數(shù),在基本面分析與純技術(shù)分析中找到了相當(dāng)?shù)呐c股價(jià)波動(dòng)的關(guān)聯(lián),幫助當(dāng)前股民有效地規(guī)避了一定風(fēng)險(xiǎn)。同時(shí)這一結(jié)論為當(dāng)前的投資者提供了一條行之有效的量化選股的思路,使得當(dāng)前的投資行為可以更為順應(yīng)未來的市場(chǎng)行情波動(dòng)。
參考文獻(xiàn):
[1] 朱世清.多因子選股模型的構(gòu)建與應(yīng)用[D].濟(jì)南:山東財(cái)經(jīng)大學(xué),2015.
[2] 朱晨曦.我國(guó)A股市場(chǎng)多因子量化選股模型實(shí)證分析[D].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué),2017.
[3] 黃文娟.情景分析框架下的多因子模型優(yōu)化[D].北京:對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué),2017.
[4] 孫偉.股票量化交易策略的研究及MATLAB的實(shí)現(xiàn)[D].天津:天津商業(yè)大學(xué),2017.
【通聯(lián)編輯:張薇】