賀毅岳, 劉 磊, 高 妮
(1.西北大學(xué) 經(jīng)濟(jì)管理學(xué)院,陜西 西安 710127; 2.西安外國(guó)語大學(xué) 經(jīng)濟(jì)金融學(xué)院,陜西 西安 710128)
隨著計(jì)算機(jī)和通訊技術(shù)的飛速發(fā)展,算法交易已成為一種基金、券商和投行等機(jī)構(gòu)投資者采用的主流量化交易方式。算法交易一般分為被動(dòng)型和綜合型兩類,其中被動(dòng)型的交易量加權(quán)平均價(jià)格(VWAP)策略基于日內(nèi)交易量的預(yù)期分布,將大額委托單按照區(qū)間交易量占總成交量的比例拆單交易,以期實(shí)現(xiàn)最終買入或賣出的成交價(jià)接近于市場(chǎng)均價(jià),從而減小大額交易面臨的市場(chǎng)沖擊成本[1]。VWAP策略的核心是對(duì)日內(nèi)區(qū)間成交量分布的預(yù)測(cè),預(yù)測(cè)結(jié)果的準(zhǔn)確度很大程度上決定了VWAP策略的執(zhí)行效果[2]。
目前對(duì)VWAP策略的研究聚焦于日內(nèi)區(qū)間交易量分布的預(yù)測(cè)建模問題。Berkowitz[3]首次提出了傳統(tǒng)的VWAP交易策略,利用交易價(jià)格與VWAP的差額來衡量其對(duì)市場(chǎng)的沖擊成本。YE等[4]用換手率作為成交量的代理變量,將其分為常規(guī)部分和特殊部分,利用主成分分析法結(jié)合ARFIMA和ARMA模型,對(duì)股票換手率的特殊部分進(jìn)行建模。夏暉等[2]將日內(nèi)成交量分解為市場(chǎng)共同部分和個(gè)股特殊部分,并對(duì)這兩部分分別進(jìn)行建模預(yù)測(cè),其改進(jìn)策略比傳統(tǒng)VWAP策略適應(yīng)性更廣、跟蹤誤差更小。張帥[5]運(yùn)用隨機(jī)森林和前饋神經(jīng)網(wǎng)絡(luò)方法構(gòu)建日內(nèi)成交量比例預(yù)測(cè)模型,獲得了比傳統(tǒng)滾動(dòng)平均方法更高的預(yù)測(cè)精度。
上述研究在日內(nèi)交易量分布預(yù)測(cè)問題上取得了較好的實(shí)證效果,但存在一定的理論或?qū)嵱眯匀毕?。首先,股市信息的不?duì)稱特征使得日內(nèi)成交量時(shí)序反映市場(chǎng)走勢(shì)的同時(shí)包含大量隨機(jī)噪聲,導(dǎo)致現(xiàn)有預(yù)測(cè)建模方法適用于市場(chǎng)的時(shí)效性較弱;其次,日內(nèi)交易量分布通常具有U型結(jié)構(gòu)特征,這種時(shí)變的結(jié)構(gòu)性波動(dòng)是成交量分布預(yù)測(cè)的難點(diǎn)[2],導(dǎo)致現(xiàn)有預(yù)測(cè)模型對(duì)歷史樣本依賴性較強(qiáng)、泛化能力較弱;最后,淺層機(jī)器學(xué)習(xí)算法應(yīng)用于高維數(shù)據(jù)時(shí)存在維數(shù)災(zāi)難與特征表示低效等缺陷[6],難以實(shí)現(xiàn)對(duì)日內(nèi)交易量分布的高效預(yù)測(cè)。
隨著對(duì)金融預(yù)測(cè)研究的不斷深入,學(xué)者們發(fā)現(xiàn)結(jié)合深度學(xué)習(xí)與經(jīng)驗(yàn)?zāi)B(tài)分解方法可有效提升金融時(shí)序的預(yù)測(cè)精度。Thomas等[7]發(fā)現(xiàn)利用LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)非線性金融時(shí)序的精度顯著優(yōu)于隨機(jī)森林、Logistic回歸等模型。喬若羽[8]通過建立基于注意力機(jī)制的LSTM、RNN等神經(jīng)網(wǎng)絡(luò)模型對(duì)股票進(jìn)行預(yù)測(cè),實(shí)證檢驗(yàn)了結(jié)合注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)模型在金融時(shí)序預(yù)測(cè)中的優(yōu)異表現(xiàn)。賀毅岳等[9]將CEEMDAN方法引入到股市指數(shù)預(yù)測(cè)建模中,構(gòu)建CEEMDAN-LSTM模型,實(shí)證表明該模型相較于SVR、MLP和LSTM模型預(yù)測(cè)誤差更小,驗(yàn)證了經(jīng)驗(yàn)?zāi)B(tài)分解方法可提升股票指數(shù)預(yù)測(cè)的有效性。李成等[10]提出基于MEMD方法的股市收益與宏觀經(jīng)濟(jì)活動(dòng)關(guān)系的分析方法,驗(yàn)證了MEMD在多維經(jīng)濟(jì)金融時(shí)間序列處理方面的優(yōu)勢(shì)。
綜上所述:相較于傳統(tǒng)的計(jì)量、統(tǒng)計(jì)及淺層機(jī)器學(xué)習(xí)模型,深度學(xué)習(xí)在非線性、非平穩(wěn)數(shù)據(jù)處理以及數(shù)據(jù)復(fù)雜特征提取等方面具有較大優(yōu)勢(shì)[11]。股票日內(nèi)成交量序列呈現(xiàn)非線性、非平穩(wěn)和高噪聲特性,導(dǎo)致現(xiàn)有模型難以充分提取股票日內(nèi)成交量的波動(dòng)特征。為更有效地刻畫指數(shù)日內(nèi)交易量分布的復(fù)雜變化模式、剔除市場(chǎng)噪聲,需對(duì)指數(shù)日內(nèi)交易量時(shí)序進(jìn)行分解和重組。為此,本文引入MEMD對(duì)日內(nèi)交易量多元序列進(jìn)行分解、重組,在數(shù)據(jù)去噪的同時(shí)有效保留交易量時(shí)序數(shù)據(jù)的結(jié)構(gòu)波動(dòng)特征;進(jìn)而充分考慮基于注意力機(jī)制的LSTM網(wǎng)絡(luò)能高效提取復(fù)雜多元序列中長(zhǎng)期依賴關(guān)系的優(yōu)勢(shì),運(yùn)用LSTM-Attention對(duì)重構(gòu)的日內(nèi)交易量序列進(jìn)行預(yù)測(cè)建模,提出MEMD分解下基于LSTM-Attention的股票指數(shù)日內(nèi)交易量分布預(yù)測(cè)模型M-LSTM。
MEMD對(duì)傳統(tǒng)的經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)進(jìn)行改進(jìn),將EMD的處理信號(hào)從一維拓展到多維,實(shí)現(xiàn)了多通道信號(hào)的聯(lián)合處理,有效克服了EMD、小波分解等方法在多維信號(hào)處理方面的局限性[12],并具有自適應(yīng)性和時(shí)頻局部化能力。MEMD算法原理如下[13]:
(2)計(jì)算v(t)=[v1(t),v2(t),…,vn(t)]T這個(gè)n維信號(hào)向量組在方向向量集xθk每個(gè)方向上的映射pθk(t),k∈[1,K]。
(6)計(jì)算模態(tài)函數(shù)h(t)=v(t)-m(t),判定h(t)是否滿足多元IMF的判斷標(biāo)準(zhǔn)。如果判定符合,則定義h(t)為第一階IMF分量,并將m(t)作為新的輸入信號(hào),重復(fù)進(jìn)行(2)~(6)的迭代過程;反之,若不滿足,則將h(t)作為新輸入信號(hào),重復(fù)進(jìn)行(2)~(6)的迭代過程,直至滿足最終條件。
通過上述步驟,將原始信號(hào)v(t)=[v1(t),v2(t),…,vn(t)]T分解為一系列的IMF分量和一個(gè)殘差項(xiàng)r(t),且各維度分解所得到的IMF數(shù)量相等、頻率分布相同。
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是一種處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)。RNN理論上能很好地處理序列數(shù)據(jù),但經(jīng)典RNN在參數(shù)優(yōu)化時(shí)會(huì)出現(xiàn)梯度消失和梯度爆炸問題。Hochreiter等[14]提出了圖1所示的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)模型,有效解決了RNN長(zhǎng)期依賴與時(shí)滯性問題。LSTM通過引入由輸入門、遺忘門和輸出門構(gòu)成的門控單元系統(tǒng),改進(jìn)了傳統(tǒng)RNN的隱層結(jié)構(gòu)。其中,遺忘門用于控制LSTM模型中哪些信息需要從神經(jīng)元狀態(tài)中移除,包含兩個(gè)輸入ht-1和xt,通過sigmoid函數(shù)映射后輸出值在0~1之間。輸入門用來更新單元狀態(tài),由兩部分構(gòu)成:it控制什么信息被輸入,決定LSTM需要更新什么值;Ct表示創(chuàng)建一個(gè)新的候選值向量,用這兩個(gè)信息對(duì)單元狀態(tài)進(jìn)行更新。輸出門控制輸出到下一時(shí)刻神經(jīng)元的信息。LSTM各層計(jì)算公式如下:
ft=σ(wf[ht-1,xt]+bf)
(1)
it=σ(wi*(xt,ht-1)+bi)
(2)
Ct=tanh(Wc*(xt,ht-1)+bc)
(3)
Ut=it*Ct+ft*Ct-1
(4)
Ot=σ(Wo*(xt,ht-1)+bo
(5)
ht=Ot*tanh(Ut)
(6)
其中ft、it、Ot分別表示遺忘門、輸入門和輸出門;Wf、Wi、Wo和bf、bi、bo分別表示每種門的權(quán)重矩陣和偏置量;Ut、ht和σ分別表示單元狀態(tài)、隱藏層輸出、Sigmoid函數(shù)。
圖1 LSTM單元內(nèi)部結(jié)構(gòu)
注意機(jī)制是一種自動(dòng)加權(quán)方法,能有效獲取輸入神經(jīng)網(wǎng)絡(luò)中各維度時(shí)序的貢獻(xiàn)度。為高效獲取交易量時(shí)序數(shù)據(jù)中的重要信息,本文提出一種注意力機(jī)制的LSTM模型結(jié)構(gòu)。其中,為防止在LSTM層之后加入注意力機(jī)制導(dǎo)致一部分注意力被其他特征分散的問題,本文在LSTM層之前加入Attention機(jī)制。
圖2 基于注意力機(jī)制的LSTM模型結(jié)構(gòu)
圖2為本文基于注意力機(jī)制的LSTM模型結(jié)構(gòu),建模采用的數(shù)據(jù)結(jié)構(gòu)形式為:將第t天的交易時(shí)間劃分為M個(gè)區(qū)間,xtm表示第t天的第m個(gè)區(qū)間交易量占全天總交易量的比例,m=1,2,…,M,第t天的交易量占比表示為向量(xt1,xt2,…,xtm,…,xtM),則k個(gè)連續(xù)交易日的交易量占比序列可表示為輸入矩陣:
相應(yīng)地,在圖2所示的模型結(jié)構(gòu)中,將多維時(shí)間序列X傳入全連接層,通過注意力機(jī)制計(jì)算不同時(shí)刻從全連接層中輸出特征向量的權(quán)重系數(shù)α1、α2、…、αM,生成權(quán)重矩陣α。然后,將輸入矩陣X與權(quán)重矩陣α的乘積累加求和,得到最終輸出的特征矩陣v。權(quán)重矩陣α和特征矩陣v的計(jì)算公式為:
ui=tanh(Wsxij+bs)
(7)
(8)
(9)
其中Ws、bs、us分別表示偏置量、權(quán)值矩陣、隨機(jī)初始的時(shí)間序列注意力機(jī)制矩陣。然后,將篩選后的多維時(shí)序作為L(zhǎng)STM單元節(jié)點(diǎn)的輸入,得到對(duì)應(yīng)LSTM層輸出h1、h2,…,hM。最終,時(shí)序數(shù)據(jù)經(jīng)特征提取和神經(jīng)網(wǎng)絡(luò)層映射處理后,獲得與原始輸入時(shí)序測(cè)試集對(duì)應(yīng)的模型預(yù)測(cè)輸出向量(y1,y2,…,yM)。
如圖3所示,M-LSTM模型以5分鐘日內(nèi)區(qū)間交易量占比多元時(shí)序數(shù)據(jù)為輸入,利用MEMD對(duì)多元時(shí)序進(jìn)行分解與重構(gòu),剔除高頻噪聲,提取各維度子序列的波動(dòng)特征,再運(yùn)用LSTM-Attention對(duì)各維度重構(gòu)后的序列進(jìn)行預(yù)測(cè)建模,以獲得高精度的指數(shù)日內(nèi)交易量分布預(yù)測(cè)效果,主要處理過程包括:
圖3 M-LSTM模型的主要處理過程
步驟1將原始指數(shù)5分鐘區(qū)間交易量時(shí)序進(jìn)行數(shù)據(jù)轉(zhuǎn)化為5分鐘區(qū)間交易量占全天總交易量比例的交易量占比多元時(shí)序數(shù)據(jù)。
步驟2運(yùn)用MEMD將交易量占比多元序列分別分解為n個(gè)本征模函數(shù)IMFi(i=1,2,…,n)和一個(gè)殘差項(xiàng)Rn(t)。
步驟3逐次剔除部分高頻IMF、重構(gòu)交易量占比多元序列,建立相應(yīng)的日內(nèi)交易量分布LSTM-Attention預(yù)測(cè)模型,并從預(yù)測(cè)有效性角度對(duì)高頻IMF的組合方式進(jìn)行優(yōu)化。
步驟4利用已建立的LSTM-Attention預(yù)測(cè)模型,對(duì)降噪重構(gòu)后的指數(shù)交易量占比多元時(shí)序進(jìn)行滾動(dòng)預(yù)測(cè)。
選取2013/1/1至2020/5/1期間上證綜指日內(nèi)5分鐘區(qū)間交易量時(shí)序數(shù)據(jù),剔除節(jié)假日、缺失值后剩余1779個(gè)有效交易日數(shù)據(jù),每日包含48個(gè)日內(nèi)交易量區(qū)間,共85392個(gè)區(qū)間交易量數(shù)據(jù),作為預(yù)測(cè)建模的初始數(shù)據(jù)。計(jì)算交易日內(nèi)48個(gè)區(qū)間交易量占日內(nèi)總交易量的比例,形成新的日內(nèi)區(qū)間交易量占比多元時(shí)序數(shù)據(jù),其邏輯結(jié)構(gòu)為(1779×48)的矩陣。運(yùn)用MEMD對(duì)交易量占比多元時(shí)序數(shù)據(jù)進(jìn)行分解,結(jié)果數(shù)據(jù)形式為(11×48×1779)。48維日內(nèi)區(qū)間交易量多元序列中的每一序列均被分解為10個(gè)模態(tài)分量IMF和1個(gè)殘差項(xiàng)。圖4為其中第1維序列分解結(jié)果,即1779個(gè)交易日內(nèi)首個(gè)5分鐘區(qū)間交易量序列的分解結(jié)果,展示了第1維區(qū)間交易量序列在不同時(shí)間尺度下的波動(dòng)模式,圖中橫軸表示時(shí)間序號(hào),縱軸表示IMF的振幅。
圖4 區(qū)間交易量序列的MEMD分解結(jié)果
利用python開源庫(kù)Keras構(gòu)建LSTM-Attention神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。采用滾動(dòng)預(yù)測(cè)建模的方式,以最近30個(gè)交易日的日內(nèi)區(qū)間交易量占比為輸入來預(yù)測(cè)下一交易日的區(qū)間交易量占比[15]。初始預(yù)測(cè)建模時(shí)選取2013/1/4至2018/4/12共1279個(gè)交易日的日內(nèi)區(qū)間交易量占比多元序列數(shù)據(jù)構(gòu)建模型訓(xùn)練集,利用pandas將其表示為(1279×30×48)的DataFrame數(shù)據(jù)對(duì)象。然后,以剩余的500個(gè)交易日日內(nèi)區(qū)間交易量占比數(shù)據(jù)構(gòu)建維度為(500×30×48)的測(cè)試集。模型的輸入、輸出均為48維的日內(nèi)區(qū)間交易量占比數(shù)據(jù)。
LSTM-Attention網(wǎng)絡(luò)的計(jì)算結(jié)構(gòu)依次包含輸入層、全連接層、注意力機(jī)制層、3個(gè)LSTM層以及全連接層和輸出層??紤]到金融時(shí)序非線性和復(fù)雜性特征以及模型的運(yùn)算效率,所建立的LSTM-Attention神經(jīng)網(wǎng)絡(luò)模型共設(shè)有4個(gè)超參數(shù),包括隱藏層個(gè)數(shù)、學(xué)習(xí)率、各層神經(jīng)元數(shù)量和輸出層維度。選取優(yōu)化器Adam進(jìn)行參數(shù)優(yōu)化,使模型的損失函數(shù)快速收斂至全局最小值。模型經(jīng)過多次訓(xùn)練穩(wěn)定后,獲得的最佳參數(shù)為:激活函數(shù)為linear,動(dòng)態(tài)學(xué)習(xí)率為0.005;注意力機(jī)制內(nèi)部激活函數(shù)為softmax,且含有4個(gè)隱藏層。通過實(shí)驗(yàn)確定各隱藏層神經(jīng)元數(shù)量,不同神經(jīng)元個(gè)數(shù)設(shè)置下模型的預(yù)測(cè)表現(xiàn)如表1所示。綜合考慮模型的預(yù)測(cè)精度和運(yùn)算效率,將每個(gè)LSTM層中神經(jīng)元的個(gè)數(shù)設(shè)置為26。模型訓(xùn)練過程中每次投入模型的樣例數(shù)據(jù)大小batch_size設(shè)置為32,迭代次數(shù)設(shè)置為100。
表1 不同神經(jīng)元個(gè)數(shù)下預(yù)測(cè)模型的評(píng)估結(jié)果
MEMD分解根據(jù)含噪信號(hào)的固有時(shí)頻特性,將多元時(shí)序數(shù)據(jù)按頻率高低分解為多個(gè)IMF,且隨著分解層數(shù)的增加所得到的IMF頻率逐漸降低,信號(hào)對(duì)IMF的主導(dǎo)性增強(qiáng)而噪聲對(duì)IMF的影響逐漸減弱[13]。金融市場(chǎng)數(shù)據(jù)中噪聲通常集中在高頻段,而信號(hào)集中在低頻段,故MEMD分解得到的高頻IMF通常為噪聲[16]。本文通過優(yōu)化IMF重組方式重構(gòu)日內(nèi)交易量占比數(shù)據(jù),具體過程如下。
首先,對(duì)48維交易量占比時(shí)序數(shù)據(jù)中每一維度的IMF分量分別進(jìn)行均值為0的t檢驗(yàn)。結(jié)果顯示各維度的IMF1~I(xiàn)MF7均值顯著非0,故將IMF1~I(xiàn)MF7作為原數(shù)據(jù)的高頻部分,IMF8~I(xiàn)MF10為低頻部分,IMF11為殘差項(xiàng)。其次,鑒于高頻部分波動(dòng)劇烈且含有較多噪聲,故本文試圖通過優(yōu)化各維度區(qū)間交易量占比時(shí)序中高頻IMF序列的組合方式,以實(shí)現(xiàn)去噪的同時(shí)保留其中包含的交易量短期波動(dòng)趨勢(shì)信息。從圖4可知,高頻IMF1~I(xiàn)MF7中IMF3~I(xiàn)MF7頻率相對(duì)更低,包含區(qū)間交易量分布的波動(dòng)信息相對(duì)更多,而IMF1、IMF2則含有更多的噪聲,故重構(gòu)的區(qū)間交易量占比序列至少應(yīng)包含IMF3~I(xiàn)MF11。最后,針對(duì)不同IMF組合方式構(gòu)建LSTM-Attention預(yù)測(cè)模型,進(jìn)而根據(jù)表2所示的預(yù)測(cè)評(píng)估結(jié)果確定最優(yōu)的IMF組合方式,即剔除IMF1后由IMF2~I(xiàn)MF11重構(gòu)獲得的區(qū)間交易量占比多元序列預(yù)測(cè)效果最好。
表2 不同IMF組合方式下預(yù)測(cè)模型的評(píng)估結(jié)果
以測(cè)試集500個(gè)交易日內(nèi)48個(gè)區(qū)間中各區(qū)間內(nèi)交易量占比的預(yù)測(cè)值與真實(shí)值之間的平均絕對(duì)誤差,來測(cè)度各模型的預(yù)測(cè)有效性,同時(shí)可增強(qiáng)各模型預(yù)測(cè)結(jié)果對(duì)比的可視效果。誤差計(jì)算方式見式(10)。
(10)
其中i為交易日序號(hào),i=1,2,…,N,j為日內(nèi)區(qū)間的序號(hào),j=1,2,…,48;MAEj表示第j區(qū)間的平均絕對(duì)誤差;Yij表示第i日內(nèi)第j區(qū)間交易量占比的預(yù)測(cè)值;Zij表示第i日內(nèi)第j區(qū)間交易量占比真實(shí)值;N為總交易天數(shù),N=500。
以上證指數(shù)日內(nèi)交易量占比的原始時(shí)序數(shù)據(jù)作為輸入,分別應(yīng)用已有研究中預(yù)測(cè)性能較好的指數(shù)預(yù)測(cè)方法作為M-LSTM的對(duì)比方法,包括:SVR、ARIMA、LSTM和動(dòng)態(tài)區(qū)間交易量分布預(yù)測(cè)方法,構(gòu)建相應(yīng)的交易量分布預(yù)測(cè)模型,并進(jìn)行滾動(dòng)預(yù)測(cè)。圖5所示為M-LSTM、LSTM、動(dòng)態(tài)因素分解、MEMD-LSTM、SVR以及ARIMA模型在各區(qū)間內(nèi)的平均絕對(duì)誤差對(duì)比效果。相較于LSTM、動(dòng)態(tài)因素分解、SVR和ARIMA模型,M-LSTM在各區(qū)間內(nèi)預(yù)測(cè)誤差更小,且在大多數(shù)區(qū)間內(nèi)平均絕對(duì)誤差保持在0.2%~0.3%,預(yù)測(cè)表現(xiàn)更好。M-LSTM與MEMD-LSTM、動(dòng)態(tài)因素分解方法對(duì)應(yīng)的平均絕對(duì)誤差曲線較為接近,各區(qū)間內(nèi)誤差相差較小,但在多數(shù)區(qū)間M-LSTM的預(yù)測(cè)誤差仍然最小。
圖5 各模型預(yù)測(cè)效果對(duì)比
另可看出,在市場(chǎng)剛開盤半小時(shí)區(qū)間、下午開市的前后五分鐘區(qū)間和收盤前十分鐘區(qū)間內(nèi),各模型的預(yù)測(cè)誤差都比較大,而其他區(qū)間內(nèi)誤差較小且平穩(wěn),這是由我國(guó)股市T+1交易機(jī)制所導(dǎo)致的。大部分交易者受學(xué)習(xí)和工作時(shí)間限制,只能在各交易日內(nèi)開盤、收盤及午間休市階段,依據(jù)股指成交量的多少等市場(chǎng)信息來判斷市場(chǎng)走勢(shì)、決定是否交易,而模型很難捕捉并學(xué)習(xí)到這種因投資者心理、行為特征引起的即時(shí)、大幅度的交易量突變,從而導(dǎo)致相應(yīng)時(shí)間段內(nèi)模型預(yù)測(cè)誤差較大。
表3進(jìn)一步給出了上述各模型的多指標(biāo)預(yù)測(cè)評(píng)估結(jié)果。首先,MEMD-LSTM模型的各個(gè)預(yù)測(cè)性能指標(biāo)均優(yōu)于LSTM模型,其R2值提升了20.4%,表明MEMD能有效提取多維金融時(shí)序數(shù)據(jù)的特征,進(jìn)而可提升區(qū)間交易量LSTM模型的預(yù)測(cè)性能。其次,M-LSTM模型的MAE、RMSE和R2優(yōu)于MEMD-LSTM模型的預(yù)測(cè)結(jié)果,各項(xiàng)預(yù)測(cè)性能指標(biāo)分別提升了3.8%、4.2%和3.5%,證實(shí)了注意力機(jī)制能顯著提升和改善MEMD-LSTM模型的有效性和預(yù)測(cè)精度。此外,對(duì)比M-LSTM與動(dòng)態(tài)因素分解預(yù)測(cè)、SVR和ARIMA三個(gè)對(duì)照模型的預(yù)測(cè)指標(biāo)可知:對(duì)整個(gè)樣本區(qū)間內(nèi)日內(nèi)交易量占比的預(yù)測(cè)而言,M-LSTM的預(yù)測(cè)精度優(yōu)于上述三個(gè)模型。這些結(jié)果都表明M-LSTM是更有效的日內(nèi)交易量分布預(yù)測(cè)方法。
表3 各模型預(yù)測(cè)性能比較
股票指數(shù)在不同走勢(shì)階段下其價(jià)格、成交量等指標(biāo)的波動(dòng)特征存在明顯差異,故本文進(jìn)一步分析在指數(shù)不同走勢(shì)階段下,M-LSTM是否較現(xiàn)有預(yù)測(cè)方法更有效。根據(jù)上證指數(shù)在樣本時(shí)間區(qū)間內(nèi)所呈現(xiàn)的波動(dòng)特征,將其劃分為上漲、橫盤和下跌3個(gè)階段。劃分過程中,將股市大幅度變化前后所引起股價(jià)“異?!辈▌?dòng)的盤整階段、股價(jià)上漲或下降周期過短的時(shí)間區(qū)間去除,階段劃分結(jié)果見表4。
表4 上證指數(shù)發(fā)展階段劃分
將各階段數(shù)據(jù)集的前80%作為訓(xùn)練集,后20%作為測(cè)試集。由于各階段數(shù)據(jù)量較少,為避免神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練欠擬合,對(duì)各模型的超參數(shù)進(jìn)行調(diào)整。根據(jù)不同參數(shù)組合設(shè)置下模型預(yù)測(cè)實(shí)驗(yàn)的對(duì)比結(jié)果,將LSTM預(yù)測(cè)模型的LSTM層設(shè)置為2層,上升、橫盤、下跌狀態(tài)下神經(jīng)網(wǎng)絡(luò)每層神經(jīng)元個(gè)數(shù)分別設(shè)置為(10,10)、(10,10)和(20,20),其余設(shè)置均保持不變。圖6展示了上漲、橫盤和下跌階段下,模型對(duì)日內(nèi)各區(qū)間交易量占比預(yù)測(cè)的平均絕對(duì)誤差。在指數(shù)不同走勢(shì)階段下,M-LSTM的預(yù)測(cè)誤差更小、效果更佳。表5~7中各模型對(duì)上證指數(shù)不同走勢(shì)階段下的日內(nèi)成交量占比預(yù)測(cè)結(jié)果顯示,M-LSTM的各項(xiàng)評(píng)估結(jié)果均優(yōu)于5種對(duì)比模型,充分證實(shí)了在不同走勢(shì)階段下,M-LSTM對(duì)上證指數(shù)日內(nèi)成交量分布的預(yù)測(cè)更有效。
圖6 不同走勢(shì)階段下各模型的預(yù)測(cè)效果
表5 指數(shù)上升階段各模型預(yù)測(cè)的評(píng)估結(jié)果
表6 指數(shù)橫盤階段各模型預(yù)測(cè)的評(píng)估結(jié)果
表7 指數(shù)下降階段各模型預(yù)測(cè)的評(píng)估結(jié)果
為進(jìn)一步驗(yàn)證M-LSTM對(duì)股票指數(shù)日內(nèi)交易量占比預(yù)測(cè)的一般性和有效性,從聚寬量化平臺(tái)提取2013/1/1至2020/5/1之間深證成指、中證500和滬深300三個(gè)典型指數(shù)的日內(nèi)5分鐘區(qū)間交易量多元時(shí)序數(shù)據(jù),剔除缺失數(shù)據(jù)以及節(jié)假日因素,深證成指、滬深300指數(shù)均含有(1779×48)個(gè)數(shù)據(jù),中證500指數(shù)含有(1778×48)個(gè)數(shù)據(jù)。將各指數(shù)交易量數(shù)據(jù)分別轉(zhuǎn)換為48維的日內(nèi)區(qū)間交易量占比時(shí)序數(shù)據(jù),作為預(yù)測(cè)建模的初始輸入。
表8 各模型在深證成指上的預(yù)測(cè)性能比較
表9 各模型在中證500指數(shù)上的預(yù)測(cè)性能比較
表10 各模型在滬深300指數(shù)上的預(yù)測(cè)性能比較
參照上文所述M-LSTM建模思路,依次通過MEMD分解、高頻去噪、重構(gòu)及LSTM-Attention預(yù)測(cè)建模等過程,構(gòu)建出上述3種指數(shù)對(duì)應(yīng)的M-LSTM預(yù)測(cè)模型。同樣采取滾動(dòng)預(yù)測(cè)方式,分別運(yùn)用ARIMA、SVR、LSTM、MEMD-LSTM和動(dòng)態(tài)因素分解預(yù)測(cè)建模方法,構(gòu)建各指數(shù)的預(yù)測(cè)對(duì)比模型,并采用MAE、RMSE和R2值作為預(yù)測(cè)效果的評(píng)價(jià)指標(biāo)。表8~10給出了各模型對(duì)3種指數(shù)的日內(nèi)交易量分布預(yù)測(cè)的評(píng)估結(jié)果,表明:與其余5個(gè)對(duì)比模型相比,M-LSTM的R2值最大,MAE與RMSE值最小,證實(shí)了M-LSTM模型對(duì)3種指數(shù)日內(nèi)交易量分布預(yù)測(cè)的有效性和強(qiáng)適用性,故其能更有效地幫助投資者降低VWAP等相關(guān)策略的交易成本。此外,MEMD-LSTM的預(yù)測(cè)表現(xiàn)優(yōu)于直接的LSTM預(yù)測(cè)模型,證實(shí)了對(duì)多維時(shí)序進(jìn)行MEMD分解與重構(gòu)可有效提升數(shù)據(jù)的信噪比,從而能間接提升模型預(yù)測(cè)性能。再者,M-LSTM的表現(xiàn)明顯優(yōu)于MEMD-LSTM,證實(shí)Atention機(jī)制能顯著提升機(jī)器學(xué)習(xí)模型對(duì)多維金融時(shí)序的預(yù)測(cè)精度。因此,結(jié)合MEMD自適應(yīng)分解功能、Attention有效篩選數(shù)據(jù)關(guān)鍵信息和LSTM提取長(zhǎng)期時(shí)序依賴關(guān)系的優(yōu)勢(shì),來構(gòu)建日內(nèi)交易量分布預(yù)測(cè)模型M-LSTM的思路是合理、有效的。
股票指數(shù)日內(nèi)交易量分布的高效預(yù)測(cè)對(duì)減少?zèng)_擊成本、優(yōu)化策略執(zhí)行效果,具有重要的理論意義與實(shí)踐價(jià)值。本文結(jié)合MEMD自適應(yīng)分解多維時(shí)序信號(hào)的優(yōu)點(diǎn)以及LSTM-Attention神經(jīng)網(wǎng)絡(luò)對(duì)多維金融時(shí)序數(shù)據(jù)預(yù)測(cè)準(zhǔn)確度較高的優(yōu)勢(shì),提出了一個(gè)面向日內(nèi)交易量分布的集成預(yù)測(cè)模型M-LSTM。選取上證指數(shù)、深證成指等四個(gè)代表性股市指數(shù)近7年的交易量占比時(shí)序數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),在指數(shù)整體樣本區(qū)間內(nèi)以及不同走勢(shì)階段下,對(duì)M-LSTM、ARIMA、動(dòng)態(tài)因素分解預(yù)測(cè)和SVR、LSTM等典型的交易量分布預(yù)測(cè)方法,進(jìn)行系統(tǒng)的對(duì)比預(yù)測(cè)實(shí)驗(yàn)及分析。實(shí)驗(yàn)結(jié)果表明:相較于主流的多元金融時(shí)序預(yù)測(cè)模型,M-LSTM對(duì)股票指數(shù)日內(nèi)交易量占比的預(yù)測(cè)誤差更小、精度更高,預(yù)測(cè)效果明顯提升,是一種更有效的股票指數(shù)日內(nèi)交易量分布預(yù)測(cè)方法。同時(shí)證實(shí),引入MEMD和注意力機(jī)制可提高多維金融時(shí)序預(yù)測(cè)建模的有效性。