班子寒+張陽
摘 要:量化交易已在國外高頻金融交易領(lǐng)域的廣泛應(yīng)用,但國內(nèi)現(xiàn)有量化交易平臺存在數(shù)據(jù)模型單一、策略有限、輔助功能少等不足,為解決上述問題,本文設(shè)計了一種智能的量化策略輔助設(shè)計平臺,該平臺引入了深度學(xué)習(xí)框架,利用人工智能技術(shù)訓(xùn)練模型和設(shè)計策略,并將預(yù)測結(jié)果通過可視化技術(shù)呈現(xiàn),為投資者提供按自己的風(fēng)險偏好選擇投資組合提供輔助設(shè)計平臺。
關(guān)鍵詞:量化交易;機器學(xué)習(xí);深度學(xué)習(xí);投資組合
中圖分類號:TP391.2 文獻標(biāo)識碼:A
Abstract:Quantitative trading has been widely applied in foreign high-frequency financial transactions,but there are several deficiencies in the existing domestic quantitative trading platform,such as the single variety of data models,limited strategies and insufficient auxiliary functions.In order to solve the above problems,this paper designs an intelligent quantization strategy aided design platform.The platform introduces a deep learning framework,adopts the technology of the artificial intelligence training model and the design strategy,and presents prediction results through visualization technology,which provides an aided design platform for investors to select portfolios based on their own risk preference.
Keywords:quantitative trading;machine learning;deep learning;portfolio
1 引言(Introduction)
近年來國內(nèi)證券、期貨市場震蕩頻繁,傳統(tǒng)投資策略表現(xiàn)平平,更多的投資者將眼光轉(zhuǎn)向于以絕對收益為目標(biāo)的量化交易投資策略,以期獲得更好的收益。
量化交易是綜合利用金融、數(shù)學(xué)、物理學(xué)、計算機等知識和工具,通過建立模型進行投資決策。作為一種新生的交易方式,量化交易隨著計算機技術(shù)的不斷發(fā)展而逐漸成熟完善,并在過去十幾年的時間里,以其穩(wěn)定優(yōu)異的業(yè)績表現(xiàn)不斷擴大市場規(guī)模,越來越得到投資者們的認(rèn)可[1]。
量化交易在美國等發(fā)達的金融市場已經(jīng)較為成熟,而在中國正剛剛興起,并在快速發(fā)展。自2012年5月以來,中國的資產(chǎn)管理行業(yè)出現(xiàn)了一輪監(jiān)管放松,業(yè)務(wù)創(chuàng)新的浪潮,接著這個機遇,量化交易由于其特有的優(yōu)勢在證券市場發(fā)揮著越來越重要的作用。正是由于國內(nèi)資本市場的不斷創(chuàng)新發(fā)展、政策的積極推動、監(jiān)管的不斷完善,近年來涌現(xiàn)出了一批以聚寬、優(yōu)礦等為代表的量化交易平臺和量化投資團隊,但交易平臺存在數(shù)據(jù)模型單一、策略有限、輔助功能缺失等不足。為解決上述問題,本文設(shè)計了一種智能的量化策略輔助設(shè)計平臺,并進行了技術(shù)驗證。
2 智能量化策略輔助設(shè)計平臺的意義(The significance
of intelligent quantization strategy aided design
platform)
本平臺的預(yù)期使用者是具有一定編碼能力的金融專業(yè)從業(yè)人員,設(shè)計目的是在于為其打造一套豐富全面的量化交易工具包,輔助其進行基于機器學(xué)習(xí)和深度學(xué)習(xí)的智能量化策略的開發(fā)。
首先,對于較為激進的用戶,在傳統(tǒng)回測模擬的基礎(chǔ)上,本文為其封裝機器學(xué)習(xí)和深度學(xué)習(xí)的方法工具,以期幫助用戶從原始的金融數(shù)據(jù)中挖掘出更多,更有價值的市場信息。
其次,對于相對保守的用戶,輔助提供基于skyline detection的投資組合推薦,為不同需求的用戶提供投資組合。根據(jù)不同用戶對于風(fēng)險的不同承受能力,推薦在可承受風(fēng)險下,用戶可獲得最理想收益的股票或基金組合。
最后,對于監(jiān)管部門,提供異常檢測機制,量化監(jiān)測市場可能發(fā)生的波動和異常狀態(tài)。
3 智能量化策略輔助設(shè)計平臺設(shè)計(Design of intelligent
quantization strategy aided design platform)
3.1 平臺總體設(shè)計
量化交易是通過使用者編寫的“策略”來對歷史交易數(shù)據(jù)進行特征分析提取,通過計算機自動交易來避免的“人”的感性行為[2]。本文是依據(jù)此需求建立了一個量化交易策略設(shè)計平臺,在量化交易策略的設(shè)計中引入了SVM、HMM、深度學(xué)習(xí)等模型,依據(jù)歷史數(shù)據(jù)訓(xùn)練模型和回測模擬,根據(jù)回測結(jié)果優(yōu)化模型或引入新的模型進而得到好的量化交易策略,發(fā)現(xiàn)優(yōu)質(zhì)的智能策略,通過引入MPT模型進行投資組合,找到更合理的投資組合方式,如圖1所示。
3.2 平臺關(guān)鍵模型
3.2.1 回測模擬模型
(1)回測引擎處理邏輯
金融市場中,回測是一種評估方法,通過模擬實盤交易來判斷投資策略的優(yōu)劣,進而為策略是否投入實盤提供可靠依據(jù)。
回測引擎需要模擬交易市場和投資者兩個客體,并實現(xiàn)兩者的交互。其中交易市場由回測代碼實現(xiàn),投資者由用戶借助API編寫的代碼實現(xiàn)。endprint
模擬交易市場由回測框架實現(xiàn),盡可能真實地再現(xiàn)了實盤。需要注意的是,模擬過程中,市場行為不受用戶編寫的策略影響,這與實盤有所不同。具體實現(xiàn)時將對用戶策略進行諸多限制,以避免用戶做出的操作使模擬失真。
回測引擎的另一組成是由用戶模擬的投資者。用戶主要參與設(shè)定初始參數(shù)(如股票池、稅率、起止時間、時間片細(xì)度等)和編寫投資策略兩個過程。一方面,用戶調(diào)用設(shè)置參數(shù)的API來決定交易市場運行的初始狀態(tài),回測引擎會按需模擬部分市場而非整個大盤;另一方面,用戶調(diào)用查詢大盤和持倉的API了解市場狀態(tài),并編寫投資策略做出反饋。投資策略作為測試主體,集合了用戶在交易市場中的所有決策,將由回測引擎頻繁調(diào)用,進而改變用戶持倉與收益。
(2)回測引擎算法實現(xiàn)
a.回測環(huán)境初始化:調(diào)用用戶編寫的initialize函數(shù)。
b.模擬交易市場:
每個交易日開始時,將不可動持倉變?yōu)榭蓜映謧};
若時間片為天,則執(zhí)行用戶策略,調(diào)用用戶編寫的handle_data函數(shù);
處理用戶策略產(chǎn)生的訂單;
若時間片為分鐘,則每當(dāng)交易開盤(9∶31—11∶30和13∶01—15∶00),執(zhí)行用戶策略,調(diào)用用戶編寫的handle_data函數(shù);
處理用戶策略產(chǎn)生的訂單;
每個交易日結(jié)束時,取消所有未完成訂單,更新交易日志。
c.繪各種金融曲線:
通過股票歷史數(shù)據(jù)繪制K線;
通過回測產(chǎn)生的數(shù)據(jù)繪制收益、基準(zhǔn)收益曲線;
3.2.2 智能量化交易策略模型
(1)聚類模型-HMM
HMM模型,又稱隱馬爾科夫模型。HMM與馬爾科夫模型相比,不同的地方在于隱藏變量。在股票市場中本文無法準(zhǔn)確知道當(dāng)前時刻的市場狀態(tài),而市場狀態(tài)決定了擇時策略[3]。但本文可以通過一系列的觀察變量來進行猜測,比如通過股票收益率、成交量、主力資金流向、融資余額增長量等觀測數(shù)據(jù)對市場狀態(tài)(即隱藏狀態(tài))進行猜測,并得到第二天的市場狀態(tài)預(yù)測。這樣一個基于HMM的量化模型的雛形就出來了。
結(jié)合實際使用,本文的模型設(shè)置如下:
a.隱藏狀態(tài)數(shù):6。
b.特征向量:一日對數(shù)收益差、五日對數(shù)收益差、當(dāng)日對數(shù)高低價差、當(dāng)日成交量、對數(shù)融資余額差,總計五個。
c.假設(shè)所有的特征向量的狀態(tài)服從高斯分布(強假設(shè),便于求解)。平臺對用戶按需求選取的訓(xùn)練集樣本數(shù)據(jù)提取特征向量,對模型進行訓(xùn)練獲得初始模型的各項參數(shù):各個時刻對應(yīng)的狀態(tài)序列、混合分布的均值和方差矩陣、混合分布的權(quán)重矩陣、狀態(tài)間轉(zhuǎn)移概率矩陣。
以A股市場某只股票從2010年4月1日至2016年3月17日(包含牛熊市場)的數(shù)據(jù)用作測試集為例,得到的狀態(tài)序列如圖3所示。
可以看到,不同的市場情況確實通過HMM被學(xué)習(xí)出來。比如,深藍色的狀態(tài)0表示熊市中的下跌階段,淺藍色的狀態(tài)5表示熊市中的反彈階段等。
按照同樣的規(guī)則從測試數(shù)據(jù)集中提取特征向量,作為已訓(xùn)練完成模型的輸入,可以得到測試集時間序列對應(yīng)的隱式狀態(tài)鏈。用戶可根據(jù)某一時刻的狀態(tài)(漲跌)選擇此時執(zhí)行的策略。同時,已經(jīng)使用過的時間序列數(shù)據(jù)作為二次輸入對初始模型進行不斷回滾矯正,在使用中提高模型的準(zhǔn)確度。
本文隨機選取浦發(fā)銀行(股票代碼“SH600000”)為股票池,以2013年全年的數(shù)據(jù)作為訓(xùn)練集,提取特征向量對模型進行訓(xùn)練,然后應(yīng)用于2014/5/1至2014/10/1日進行模擬回測交易,得到的策略收益曲線(紅線)和基準(zhǔn)收益曲線(藍線)如下。本文可以清晰地看到,通過HMM模型對市場狀態(tài)的預(yù)測,投資者成功避開了2014/6/17日的大跌,清倉保值,而在2014/7/29日的大漲趨勢中,投資者持倉增值,獲得了相當(dāng)不錯的收益。如圖4所示。
(2)分類模型-SVM
Machine Learning中的支持向量機(SVM)算法常常作為分類器使用。而股票期貨等時間序列數(shù)據(jù)的變化則可以認(rèn)為是市場狀態(tài)的表現(xiàn),例如可以將市場分為震蕩狀態(tài)和趨勢狀態(tài)。因此,本文可以引入SVM算法來對市場狀態(tài)進行預(yù)測。
模型的輸入數(shù)據(jù)為某只股票、期貨價格時間序列;通過相應(yīng)的時間序列來對每一天的狀態(tài)進行標(biāo)定狀態(tài);由此得到數(shù)據(jù)集,通過這些數(shù)據(jù)集作為測試集來訓(xùn)練分類器(由前t個時間點預(yù)測t+1時間點的狀態(tài)),經(jīng)過交叉驗證、網(wǎng)格優(yōu)化之后得到市場狀態(tài)預(yù)測模型。
本文采用了滬深300指數(shù)在10年內(nèi)的價格作為時間序列進行了測試,通過標(biāo)定標(biāo)簽進行訓(xùn)練之后得到分類器之后對市場狀態(tài)進行了預(yù)測,從而得到市場狀態(tài)圖,如圖5所示。
本文隨機選取浦發(fā)銀行為股票池,以2011/1/1至2012/10/1的數(shù)據(jù)作為訓(xùn)練集,提取特征向量對模型進行訓(xùn)練,然后應(yīng)用于2013/4/1至2014/8/1進行模擬回測交易,得到的收益曲線如圖6所示。
(3)深度學(xué)習(xí)模型
深度學(xué)習(xí)通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。應(yīng)用于股票市場的預(yù)測分析,本文的deep learning模型采用三層卷積,兩層全連接,經(jīng)過訓(xùn)練調(diào)參后,以一個月(20天),每天15min為間隔的收盤價作為模型輸入,預(yù)測未來一周(5天)該股票上漲2%的可能性。輸出值為0—1的數(shù)字,數(shù)值越大代表可能性越高。
該模型適用于大規(guī)模的組合投資,應(yīng)用此模型,本文可以在股票池中放入100只股票,對于每只股票,當(dāng)模型預(yù)測可能性高于既定閾值(如0.9)才出手,這樣也許對于某只股票的買賣次數(shù)非常少,但是對于整個股票池交易還算頻繁,也能保證交易的安全。深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)示意圖,如圖7所示。
3.2.3 投資組合模型endprint
金融產(chǎn)品在獲取收益的同時,也需要承擔(dān)一定的損失風(fēng)險。為分散風(fēng)險,通常采取同時持有多支產(chǎn)品的方式。投資者在尋求高收益是希望風(fēng)險盡可能低。投資組合基于MPT模型,根據(jù)用戶希望的收益給出風(fēng)險最低的配置建議[4,5]。
現(xiàn)代資產(chǎn)配置模型(MPT模型)用收益率的標(biāo)準(zhǔn)差來衡量風(fēng)險。對于任意一個預(yù)期收益值,試圖找到一個產(chǎn)品配置權(quán)重P,使得組合收益達到預(yù)期,且P的方差是最小的。問題的解可由拉格朗日乘子法找出。限于計算復(fù)雜,故采用隨機組合的方法求解。MPT模型算法流程圖,如圖8所示。
圖9為隨機組合繪制的風(fēng)險—收益圖,其中每一個點代表一種資產(chǎn)配置方式。點陣的左邊界曲線呈拋物線形,被稱為有效前沿。有效前沿上的點,在固定收益率的情況下能配置出的最小標(biāo)準(zhǔn)差,因此對于相同收益有最小風(fēng)險。對于相同風(fēng)險,應(yīng)選擇收益較大的配置,故取拋物線的上半支作為推薦配置提供給用戶。風(fēng)險—收益曲線,如圖9所示。
3.2.4 異常檢測模型
對于股票市場,本文總能找到這樣一對或多對股票,兩兩之間的價格變動趨勢具有極強的相關(guān)性,基于股票市場的協(xié)整性原則,配對的兩只股票總是呈現(xiàn)相同或相反的價格變動趨勢,即股票的價格最終會回歸至其均衡價值。
那么本文可以這樣定義異常:首先本文通過計算股票歷史數(shù)據(jù)計算皮爾森相關(guān)系數(shù),挖掘相似度最高的兩只股票進行配對。
當(dāng)配對的兩只股票間股價遠(yuǎn)高于或遠(yuǎn)低于其均衡價值時,本文就可以根據(jù)其協(xié)整性進行套利。相關(guān)系數(shù)較高的兩只股票,如圖12所示。
基于此,本文可以建立基于異常檢測機制的套利策略:
(1)初次建倉:當(dāng)A股票股價高于其基于B股票股價的均衡價值1倍標(biāo)準(zhǔn)差以上時,買入B股票;當(dāng)A股票股價低于其基于B股票股價的均衡價值一倍標(biāo)準(zhǔn)差以上時,買入A股票。
(2)調(diào)倉操作A:當(dāng)A股票股價高于其基于B股票股價的均衡價值1倍標(biāo)準(zhǔn)差以上時,若A股票的持倉數(shù)量大于0,則賣出A股票并買入相同價值的B股票。
調(diào)倉操作B:當(dāng)A股票股價低于其基于B股票股價的均衡價值一倍標(biāo)準(zhǔn)差以上時,若B股票的持倉數(shù)量大于0,則賣出B股票并買入相同價值的A股票。
(3)平倉:交易期結(jié)束時平倉。
4 智能量化策略輔助設(shè)計平臺應(yīng)用(Application of
intelligent quantization strategy aided design
platform)
量化交易是通過使用者編寫的“策略”來對歷史交易數(shù)據(jù)進行特征分析提取,通過計算機自動交易來避免的“人”的感性行為。本系統(tǒng)在此需求基礎(chǔ)上建立了一個量化交易平臺,通過規(guī)范統(tǒng)一的接口簡化了數(shù)據(jù)獲取、數(shù)據(jù)分析、數(shù)據(jù)特征提取等一系列操作,使得使用者能夠?qū)W⒂诓呗缘拈_發(fā),其主要應(yīng)用有幾個方面。
4.1 入門指導(dǎo)
平臺為使用者提供了各類金融數(shù)據(jù),簡易策略示例,統(tǒng)一的金融指標(biāo)API接口、基礎(chǔ)的使用指導(dǎo)等一系列內(nèi)容,剛接觸量化交易的用戶可以從這些內(nèi)容中快速入門,大大降低了學(xué)習(xí)的門檻,從而在很短的時間內(nèi)對量化交易有一個粗略但全面的認(rèn)識,專注于更加重要的“策略”撰寫中。
4.2 交易評估
對于一般的使用者,平臺可以提供趨勢分析、行情預(yù)測等信息,幫助使用者了解當(dāng)前形勢,同時根據(jù)使用者的類型(保守、穩(wěn)健、激進等)提供對應(yīng)的投資組合的建議,評估其投資組合的預(yù)期收益及風(fēng)險分析。
4.3 投資組合
對于一般性用戶平臺可以根據(jù)用戶選擇類型提供投資建議,對于專業(yè)金融機構(gòu)則可以提供相應(yīng)的策略分析,通過平臺中集成的機器學(xué)習(xí)進行相應(yīng)的策略優(yōu)化,從而盡可能達到更高的投資收益比;此外還將對策略風(fēng)險進行評估,提供更加詳細(xì)的風(fēng)險應(yīng)對措施。
4.4 市場監(jiān)管
通過一系列機器學(xué)習(xí)算法,對交易記錄進行量化分析,篩選出其中存在的異常行為,從而為監(jiān)管部門提供咨詢建議,及時對異常市場交易做出處理。
5 智能量化策略輔助設(shè)計平臺后期規(guī)劃(Post planning
of intelligent quantization strategy aided design
platform)
平臺初步完成之后,還需要對已有功能進行完善,后續(xù)的一些規(guī)劃如下:
5.1 引入市場情報
金融市場十分復(fù)雜,行情走勢不僅僅受到交易信息的影響,還受到政策、各類事件等影響。因此,之后平臺將會引入市場情報(包括各類利好利空消息),通過一寫方式進行量化后為用戶提供API以供引入策略中。
5.2 引入更多機器學(xué)習(xí)模型
通過機器學(xué)習(xí)可以更加高效地挖掘出數(shù)據(jù)中的隱藏信息,找出更多無法通過人工方式發(fā)現(xiàn)的市場規(guī)律。因此,之后平臺中將引入更多的基礎(chǔ)性的機器學(xué)習(xí)模型,用戶可以很方便地將其嵌入自己編寫的策略中。同時在為相關(guān)用戶提供咨詢建議時,也會提供更加準(zhǔn)確且隱藏更深的市場規(guī)律。
6 結(jié)論(Conclusion)
得益于量化交易觀念逐漸引起人們的關(guān)注,相應(yīng)的交易平臺也在不斷涌現(xiàn)。相比于傳統(tǒng)的平臺僅僅提供給用戶編寫策略的工具和數(shù)據(jù),將機器學(xué)習(xí)等工具引入其中,并且將其封裝成子策略提供給用戶,用戶可以將平臺已有策略與自身編寫策略相結(jié)合,從而使得其達到更優(yōu)的效果;依據(jù)機器學(xué)習(xí)算法編寫的市場狀態(tài)模型,可以更加準(zhǔn)確地為用戶、監(jiān)管者提供市場狀態(tài)信息。
參考文獻(References)
[1] 謝堞江.量化交易策略綜述與新策略設(shè)計[D].浙江:浙江大學(xué),2016.
[2] Lawrence R.Rabiner.A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition[J].Proceedings of the IEEE,1989,77(2):257-286.
[3] Y.Kawahara,T.Yairi,K.Machida.Change-point detection in time-series data based on subspace identification[J].Seventh IEEE International Conference on,IEEE,2007:559-564.
[4] Hall L O.Exploring Big Data with Scalable Soft Clustering[J].Proc of the 6th International Conference on Soft Methods in Probability and Statistics.Konstanz,Germany,2012:11-15.
[5] Song M,et al.A Comparative Study of Dimensionality Reduction Techniques to Enhance Trace Clustering Performances[J].Expert Systems with Applications,2013,40(9):3722-3737.
作者簡介:
班子寒(1996-),男,本科生.研究領(lǐng)域:數(shù)據(jù)挖掘,深度學(xué)習(xí).
張 陽(1996-),男,本科生.研究領(lǐng)域:數(shù)據(jù)挖掘,深度學(xué)習(xí).endprint