孫夫雄 謝 翔 熊 平 梁嘉欣 彭 暢
停牌即“停止證券上市”,指的是某一種證券臨時停止交易的行為。股票停牌觸發(fā)后,市場交易將被強制中止,使交易各方有時間獲取最新信息重新評估交易價格、調整交易策略,以提升信息披露程度、降低交易信息的不對稱性,削弱上市公司風險事項的不確定性影響、維護市場秩序和保護投資者合法權益。但A股停牌的頻次高、時間長與隨意性等問題侵犯了投資者的交易權,影響了市場效率。部分上市公司利用籌劃重大事項等名義停牌,進行股價操縱與內幕交易以攫取非法利益,嚴重背離了股票停牌制度設立的初衷,降低了價格發(fā)現效率。
在2015年“6·15股災”期間,7月9日這天停牌的上市公司數量有1 438家之多,占所有上市公司數量比例逾50%。投資者的資金大面積套牢,盈利股票無法兌現浮盈,大量拋壓難以釋放,整個交易市場被悲觀恐慌情緒所籠罩。另外我國A股還存在停牌時間超長且強制復牌程序不配套的問題,例如*ST新億(600145)停牌時間從2015年到2020年長達54個月,成為中國證券歷史上的最長停牌時間記錄,而深深房A(000029) 停牌自2016年至2020年時長為51個月。長期停牌極大挫傷了投資者的投資意愿和信心,給交易市場流動性帶來嚴重損害,也為監(jiān)管層帶來了更大的工作挑戰(zhàn),不利于股票市場的長期穩(wěn)定運行。
中國股市存在的停牌濫用、超長停牌等問題已經引起了學術界、監(jiān)管層和投資者的重視。國內外學者們從多個角度入手開展了股票停牌相關研究,包括國內外停牌制度對比、停牌時長影響因素、停牌前后股價波動的分析等已發(fā)生的確定性事件,但對于股票停牌預測等不確定事件研究尚存在空白。
因此,本文采用預訓練模型和遷移學習的深度學習方法用于股票停牌的預測,主要貢獻如下: 一是首次從停牌預測的視角,提出了基于預訓練模型的股票停牌預測,首先預訓練模型用于學習A股上市公司股票停牌的共性特征,再通過遷移學習機制獲得個股停牌的特征,進而實現精確的個股停牌預測,為相關研究提供了新的研究方法與實證證據。二是研究成果在一定程度上解決了交易各方的信息不對稱問題,使我國中小投資者能有效地規(guī)避停牌風險,進而減少投資損失以及實現資產保值,或為部分投資者利用個股停牌后的股價波動,實現收益最大化等目標提供幫助。三是通過對A股市場不同行業(yè)板塊的停牌預測分析,使監(jiān)管機構能夠對市場整體停牌趨勢做出前瞻性判斷,對宏觀調控和政策調整提供了參考。
金融數據波動的分析方法主要涵蓋了統(tǒng)計學、機器學習以及深度學習,中外學者在該領域皆取得了卓越的研究成果。
在統(tǒng)計學方法研究方面,Doroudyan等(2017)[1]研究ARMA-GARCH模型對德黑蘭證券交易所價格指數的時間序列進行擬合,實現了金融過程的監(jiān)控和預警。蔡光輝等(2021)[2]提出了基于偏t分布的混頻Realized GARCH模型,進而推導其參數估計方法,并通過MCS檢驗判別擴展模型與滾動時間窗預測技術對中國黃金期貨市場波動進行預測研究,實驗結果顯示相較于GARCH模型與Realized GARCH模型,結合高頻信息的Realized GARCH模型在樣本內估計的預測精度和擬合優(yōu)度表現更好;在機器學習研究方面,Gupta等(2021)[3]利用隨機森林技術預測了投資者信心對美國股票市場波動的影響。Vara等(2022)[4]比較了卡爾曼濾波器、XGBoost和ARIMA三種主要算法對股票價格的預測,提出了卡爾曼濾波器和XGBoost的混合模型,研究結果顯示其預測精度優(yōu)于單一模型。張劍和王波(2017)[5]采用SVM(Support Vector Machine)理論搭建滬深300股指期貨量化交易模型,并根據動態(tài)預測模型設計了量化交易策略,實驗顯示量化交易模型整體可以獲得較高的投資回報;在深度學習研究方面,Chatzis等(2018)[6]比較分析了分類樹、支持向量機、隨機森林、深度神經網絡等技術對股市危機事件預測性能,指出深度神經網絡具有顯著的分類精度。Althelaya等(2021)[7]利用小波變換技術捕捉不同尺度的金融時間序列波動,結合深度學習模型提高了股票預測的精度。Sun等(2021)[8]基于時間卷積網絡(Temporal Convolutional Network,TCN)對股民的情感信息進行建模,用于對股票和期貨價格進行預測,實驗結果表明TCN在MAE、MAPE、RMSE和精度方面優(yōu)于GRU模型。
對于股票停牌的研究,國內外學者基本上側重于停牌的制度性研究,以及停牌對股價影響的實證研究。Kabir和Engelen(2006)[9]評估監(jiān)管機構是否能夠成功利用停牌機制,迫使公司向資本市場披露新的重大信息,研究結果顯示了停牌機制在傳播新信息方面的有效性。Taechapiroontong等(2012)[10]考察了亞洲新興股市停牌期間停牌的有效性以及不同類型投資者或交易員的交易表現。Rahim等(2021)[11]以印尼證券交易所為研究對象,分析投資者對停牌的反應。國內學者也對我國股市進行了卓有成效的實證研究,如在取消異常波動停牌的政策背景下分別對中小板股價波動、股市流動性與價格發(fā)現效率等方面進行了相關研究(陳舒寧等,2016[12];胡婷等,2017[13];李洋等,2018[14])。石陽等(2019)[15]以重大事項停牌數據為實驗對象,實證檢驗了隨意停牌對投資者利益的影響,指出了上市公司的部分停牌行為并不能符合投資者保護的初衷,反而有助于內部私利交易行為,對投資者利益造成了損害。李明琨等(2022)[16]從進化博弈分析的角度研究我國熔斷機制的有效性,以及政府監(jiān)管作用。He等(2019)[17]研究了強制和自愿停牌對中國股市股價、波動性和成交量的影響。
綜上所述,深度學習方法在金融時間序列預測上具有較好的運用效果。但針對股票停牌的研究多反映在制度有效性、現有缺陷和制度改進方向,對股票停牌預測研究尤為匱乏,因此本文研究了基于預訓練模型的股票停牌預測方法。
市場中如果出現對股票交易有特殊影響的重要信息,股票停牌能夠為投資者主動劃割出可以獲取充分信息反饋的時間區(qū)間,對股價再預估,進而對之前與當前股價預期存在差異的投資策略進行調整,以削弱交易各方的信息不對稱,股票停牌制度制定初衷也在于此。包括股市發(fā)生異常波動與企業(yè)并購活動在內的多種因素均可能誘發(fā)股票停牌。
從停牌原因來看,停牌發(fā)生主要是歸結于以下三類事件:(一)上市公司披露期中業(yè)績報告、年報,召集股東大會,重要收購合并,擴股增資,公布分紅計劃,投資以及股權增減變動等需公布重大信息時;(二)上市公司就關于對公司產生重大影響的事項被證券監(jiān)管機關認為應當澄清與公告時;(三)需就上市公司涉嫌違規(guī)開展調查時。
這三類事件的共同核心在于上市公司當前經營中出現了新的重要信息,為消除不同投資者獲取該信息的時間差異,保護市場交易的公平性與有效性,上市公司需要暫停其股票交易。依據有效市場假說(Efficient Markets Hypothesis,EHM)理論(Fama,1970[18]),在作為有效市場的股票交易市場中,全部有價值的信息已經準確、及時并充分地反映在股票價格波動上。因此,由上市公司經營過程引發(fā)的停牌事件雖然直接原因是新信息發(fā)生與傳播,但是這種信息與公司的歷史經營信息不是割裂的、獨立的,應當是由公司管理層或者監(jiān)管機構根據歷史信息進行決策或者在歷史信息中讀取到了隱藏信息,公司經營發(fā)生的新信息與歷史信息是存在緊密聯(lián)系的。
上市公司經營信息的直接體現是股票每日行情,其中包括了股票的交易價格、成交量以及換手率等信息,衍生出最高價、最低價、開盤價、收盤價、成交量、成交額、股價漲跌幅等交易基礎指標。根據基本交易信息,可以計算股票交易技術分析指標,這類指標通過綜合考量多個基本交易信息,對價格的波動較為敏感,在實際交易分析中被廣泛應用,其常見分類如下。
1.超買超賣型指標。
超買,是指在買入需求過旺推動下某股票或市場股價陡升,股價同實質價值發(fā)生嚴重偏離,制造大量股價泡沫。在歷經一輪急升后,一旦高位承接力較弱,股票價格出現技術性下跌是有可能的。
超賣,指受大面積沽售影響而導致某股票或市場股價發(fā)生急挫,股價顯著低于實質價值,但是經過一輪急跌變動,大幅減少了低位拋售壓力,價格技術性向上反彈可能會出現。
對市場上這種價格和實質價值不匹配的暫時性現象的度量即超買超賣指標,具體指標包括隨機指標KDJ、威廉指標WR、動態(tài)買賣氣指標ADTM、相對強弱指標RSI和布林極限BB等。
2.趨勢型指標。
市場人氣盛衰與趨勢走向是通過趨勢型指標進行反映,均線或者股價通道是判斷趨勢的方法。通常觀點是趨勢一經形成則將在特定時段內延續(xù),這就是利用對趨勢的研判推斷股價變動趨勢的基礎。趨勢型指標計算過程納入了股價、成交量以及漲跌指數等數據,指標具體包括趨向指標DMI、市場趨勢CYE、平滑異同平均線MACD、威廉變異離散量WVAD、籌碼引力PAV和量價曲線VPT等。
3.能量型指標。
人氣的熱度、價格動量的潛能能夠利用能量型指標進行測量,而且股票價格的支撐帶與壓力帶也可以被其顯示出,具有為預測分析股價后續(xù)走向趨勢,研判買賣股票的時機節(jié)點提供參考借鑒的作用。一般能量型指標包括: 成交量變異率VR、帶狀能量線CR、威廉多空力度線WAD、市場強弱CYR和心理線PSY等。
4.均線型指標。
均線指標又稱移動平均線指標,其主要作用是反映價格運行趨勢,尤其是其可以根據投資者需求對不同時間尺度的均線進行計算,能夠直觀展現長期、中期和短期的趨勢,如K線圖。常見均線指標有:MA 均線、顧比均線GMMA、多均線BBI、多布林線BBIBOLL和鱷魚線ALLIGAT等。
其他股票交易技術分析指標還包括成交量型、圖表型和五彩K線等。
本文研究基于的深度學習理論包括時間卷積神經網絡、注意力機制、遷移學習和變分自編碼器等。
1.時間卷積神經網絡。
Bai等(2018)[19]基于卷積神經網絡模型提出了時間卷積網絡(Temporal Convolutional Network,TCN)模型,針對序列問題采用因果卷積加以改進,模型記憶歷史信息過程是通過殘差模型進行堆疊卷積層實現的。
單向結構的因果卷積(causal convolution)在時間約束上十分嚴格,表現為神經元的輸出僅利用卷積運算與其有因果聯(lián)系的數據產生,以致限制了時間序列建模的長度。膨脹卷積(dilated convolution)允許卷積時的輸入存在間隔采樣,使得包含長距離依賴關系的較大范圍的信息被每個卷積的輸出所容納,網絡輸出則能提取較大范圍的時間序列特征。采樣間隔d(通常以2為底的指數形式遞增)稱為膨脹因子(dilation rate),設1維序列輸入x∈n和濾波器f:{0,…,k-1}→n,則在xt處的膨脹卷積運算F定義如下:
(1)
其中:k表示卷積核的大小。假設d=1,2,4且k=3,則膨脹因果卷積示意圖如圖1所示。
圖1 TCN示意圖
膨脹卷積和因果卷積在TCN網絡結構的卷積層中進行了融合,由卷積核大小、網絡深度以及膨脹系數共同決定了其網絡感受野??紤]到對網絡深度進一步加深以及提升對時間序列信息的學習能力,原本的卷積層由TCN殘差模塊取代且結構相同,皆包含了膨脹因果卷積層、權重歸一化層、ReLU激活函數、Dropout層。如果輸入與輸出的數據維度不一致,則通過1×1卷積進行處理。
2.注意力機制。
注意力(Attention)機制來源于對生物觀察行為的模仿(Mnih等,2014[20]),即在看到整體信息的時候,會主動發(fā)現重要信息并分配更多的注意力到目標部分,以獲取更多與之相關的信息。注意力機制能夠在稀疏數據中提取重要的信息。自注意機制(self-attention)是注意力機制的一種改進方案(劉建偉等,2021[21]),能夠對全局的不同特征分配不同的權重,用于分析數據內部的相關性。Attention計算示意圖如圖2所示(Raffel和Ellis,2015[22])。
圖2 Attention計算示意圖
圖2中Attention計算過程為:首先將隱含層的輸出向量[h1,…,hT]組成的矩陣H∈RT×d作為注意力層輸入,其中T表示時間序列長度,d代表輸出向量的維度。然后利用多層全連接層進行非線性轉換并通過Softmax函數完成歸一化,得到注意力權重矩陣A=[α1,…,αT]。最后將輸入矩陣乘以對應的注意力權重矩陣,加和獲得向量c。對應公式定義如下:
A=softmax(Vαtanh(WαHT)
(2)
c=AH
(3)
3.遷移學習。
將已經發(fā)展成熟的知識向近(相)似領域遷移的研究方法稱作遷移學習(Kumar等,2020[23];Gu和Dai,2021[24])。一般將已有知識表述為源域(Source domain,Ds),而對近(相)似領域又稱為目標域(Target domain,Dt),遷移學習的具體過程就是在相似領域應用其從一個或多個源域中提煉的關聯(lián)知識處理目標域的新問題,遷移學習基本原理如圖3所示。
圖3 遷移學習示意圖
源域Ds一般包含了特征空間x與邊緣分布概率P(X),其中X=(x1,…,xn)代表源域數據樣本,預測函數f=P(Y|X)和標簽空間Y=(y1,…,yn)共同組成任務O,倘若預測函數不知,仍可通過多組源域與目標域訓練數據學習而獲得。假定存在源域Ds、目標域Dt和有差別的學習任務Os、Ot,遷移學習目的是通過Ds與Dt提升歸屬于任務Ot的預測函數f在目標域Dt中的預測表現。
4.變分自編碼器。
變分自編碼器(Variational auto-encoder,VAE)是屬于深度生成模型的一種生成式網絡結構(Kingma和Welling,2013[25];Utyamishev和Partin-Vaisband,2019[26];Zhou等,2021[27]; Liu等,2022[28]),其基本結構如圖4所示,主要分為編碼器(Encoder)與解碼器(Decoder)兩部分。
圖4 VAE模型結構圖
圖4中數據樣本x經過輸入層到達Encoder,由Encoder生成均值μ和方差σ2,從正態(tài)分布N(0,1)中隨機采樣得到ε,由μ、σ2和ε共同確定隱變量z=μi+ε·σ2,并作為Decoder的輸入,由Decoder對隱變量Z進行重構,輸出樣本x′。定義損失函數L如下:
L=l1+l2
(4)
股票停牌預測模型的研究過程主要包括:(1)選取部分交易基本指標和技術分析指標,建立停牌預測指標體系;(2)數據預處理后,通過滑動窗口形成時序數據集;(3)訓練VAE模型,生成停牌的模擬時序數據,以平衡數據集;(4)預訓練模型訓練與測試;(5)遷移學習模型參數,訓練與測試個股停牌預測模型。模型研究框架如圖5所示。
圖5 模型研究框架圖
圖5中股票交易原始數據包括基本交易指標和技術分析指標,其中基本交易指標是股票市場交易過程中最直接和原始的記錄,而技術分析指標是利用交易價格、成交量的變動等數據計算得到的能夠反映交易規(guī)律的綜合信息(謝丁,2009[29])。在綜合性、可解釋性和客觀性原則指導下,選擇了22個指標如表1所示。
表1 模型指標體系
設數據集為X=[X1,…,XN],其中N為股票總數,Xi是第i只股票的數據集,分別對Xi進行預處理。首先選擇Min-Max進行標準化,然后采用移動滑窗法生成時序數據集S,設定滑動窗口大小為t,窗口的滑動步長為step(即滑動step個交易日)。滑窗從數據集Xi的始部向末尾滑動,同時逐個標記時序的類別。圖6顯示了當step=1時,S的形成過程。
圖6 時序數據生成示意圖
(1)設置停牌持續(xù)時間閾值為Δ天。
(2)計算時間間隔(Data(xt+1)-Data(xt))>Δ,則yi=1表示停牌,否則yi=0表示正常。
(3)如果yi=1,則設置si-1,…,si-的標簽yi-1, yi-2,…,yi-為1,這是因為在個連續(xù)的時序中包含停牌特征。
在股票市場交易中,股票停牌屬于低頻行為,客觀上形成了停牌樣本的數量大大低于非停牌樣本的局面,分類模型的判別能力會被這種不平衡性嚴重扭曲。引入VAE模型對停牌時序數據進行學習,進而生成模擬數據以平衡數據集。
1.模型訓練。
將所有標記為停牌的時序數據轉為1維向量作為VAE模型的訓練集Sstop={x1,…,xM},其中M為數據集大小。VAE的訓練如算法1所示。
算法1:訓練VAE。
輸入:Sstop;e:迭代次數。
輸出:已訓練VAE。
① 隨機初始化各層權重矩陣W與偏置向量b;
② forepoch=1∶edo
③ fori=1∶Mdo
⑤ 生成標準正態(tài)分布的隨機變量ε;
⑦ 最小化公式(4)的損失函數,更新W與b;
⑧ end for
⑨ end for
2.生成模擬數據。
利用已訓練的VAE模型生成模擬停牌數據x′。為了能夠評估x′的質量,需要度量x和x′相似度。通常向量相似度計算的方法包括曼哈頓距離、歐式距離和余弦相似度等,經過實驗測試和對比,本文選用余弦相似度,定義如下:
(5)
VAE生成模擬數據過程如算法2所示。
算法2:VAE生成模擬數據。
輸入:VAE;Sstop;e:迭代次數;λ:相似度閾值;γ:比較次數閾值;m:隨機抽取樣本次數。
輸出:停牌模擬數據集S’stop。
① 加載VAE;
② forepoch=1:edo
③ VAE的解碼器生成新樣本x′;
④cnt=0;
⑤ fori=1:Mdo
⑥ 從Sstop中隨機抽取1個樣本x;
⑦ 根據公式(5),計算相似度Sim=cos(x,x′);
⑧ ifSim>=λthen
⑨cnt++;
⑩ end if
神經網絡模型TCN、BiLSTM 、CNN和Attention等在時間序列分析中皆有良好的表現(Fan等,2021[30];Wang等,2021[31]; Yang和Wang,2022[32];Abbasimehr和Paki,2022[33])。鑒于股票停牌時間序列復雜性,單一模型在時空特征提取方面存在一定局限性,本文研究了多種深度學習組合模型包括:
1.TADM:包括輸入層、TCN層、Attention層、Dense層、輸出層。
2.TBADM:包括輸入層、TCN層、BiLSTM 層、Attention層、Dense層、輸出層。
3.CBADM:包括輸入層、1D-CNN層、BiLSTM 層、Attention層、Dense層、輸出層。
4.BADM:包括輸入層、3層BiLSTM、Attention層、Dense層、輸出層。
5.BDM:包括輸入層、3層BiLSTM、Dense層、輸出層。
根據基于模型/參數的遷移方法(Model/ Parameter Based Transfer Learning),通過預訓練-微調方式將預訓練模型的部分參數進行遷移,構建基于預訓練模型的個股停牌預測模型,如圖7所示。
圖7 模型預訓練-微調過程
神經網絡的淺層完成一般特征(general feature)的學習,而深層需完成和具體任務關聯(lián)的特殊特征(specific features)的學習。伴隨網絡層次的深入,模型的學習表征逐漸由一般特征平滑到特殊特征。由于源域數據集和目標數據集的類別一致性,參數遷移時采用all-to-all遷移策略即目標域的第m層由源域中的第n層遷移得到。以TADM為例,將輸入層到注意力層參數逐層遷移到個股停牌預測模型對應各層之中,如圖8所示。
圖8 模型預訓練-微調過程
參數遷移完成后,個股預測模型利用預訓練模型強大的股票停牌特征提取能力從目標域數據中分析潛在停牌信息,鑒于目標個股自身的波動特征,需要個股預測模型對其提取以提升預測的準確度,將模型全連接層與輸出層隨機初始化后再重新進行訓練。
算法3:VAE生成個股模擬數據。
① 加載VAE;
③cnt=0;
④x=Sstop[n];
⑤ for epoch=1:edo
⑥VAE的解碼器生成新樣本x′;
⑦ 根據公式(5),計算相似度Sim=cos(x,x′);
⑧ ifSim>=λthen
⑨cnt++;
個股的每個停牌時間序列生成m條模擬數據,由于模型VAE是由所有停牌類數據訓練而得,個股的部分停牌時間序列可能背離整體特征導致無法在特定λ下產生模擬數據。
通常的模型評估指標包括準確率(Accuracy)、精準率(Precision)、召回率(Recall)以及F1值(F1-score),四個比率值的區(qū)間為[0,1],值越趨近于0表示預測表現越差,越趨近于1表示預測表現越好。
對所有股票的停牌類樣本分類正確率反映了預訓練模型提取A盤整體停牌特征的能力,因此設置Q評分如下:
1.將停牌類別(y=1)的分類正確率TP(True Positive)劃分3個區(qū)間:L1=[0.8,1.0],L2=[0.5,0.8)和L3=[0.0,0.5),分別設置權重w1=1.0,w2=0.6,w3=0.2。
2.統(tǒng)計落在L1,L2和L3中的股票數:c1,c2和c3。
3.定義Q:
(6)
其中N是股票總數。
以我國A股市場2 539家上市公司作為研究對象,其中2家公司未發(fā)生停牌事件。從Tushare平臺采集股票交易基本數據,包括日線行情與每日指標數據,并由其計算技術分析指標。采集時間區(qū)間為2013年5月13日至2021年9月30日。統(tǒng)計各指標數據并進行數據的計算處理后,獲得了共計4 390 024條記錄的實驗數據集,每一條數據中包括12個股票交易基本數據和10個技術分析指標,合計22個屬性特征。
本文主要利用市場中長期信息研究A股的停牌問題,因此采用移動滑窗法生成股票停牌時間序列數據集,各參數設置分別為:時間滑窗寬度t=15個交易日,停牌持續(xù)時間閾值Δ=7天,窗口的滑動步長step為1,參數=7。實驗共生成了3 764 841條時間序列數據,其中正常類3 740 960條,停牌類23 881條,數據維度為[15,22]。為減少正常類的冗余和降低樣本不平衡程度,每隔10個交易日重新抽樣,生成訓練集的正常類為373 772條。
選取所有停牌時序數據作為VAE模型訓練集,并將時間序列轉換為1維向量,其維度為330=15×22。設置VAE模型參數結構為:330-128-64-32-[4,4]-32-64-128-330,即輸入層與輸出層包含330個神經元,Encoder層包含3個隱含層,神經元個數分別是128、64和32,而Decoder層也包含3個隱含層,神經元數為32、64和128。隱變層的μ和σ2分別有4個神經元,計算z=μ+ε·σ2得到隱變量輸入到Decoder層。
實驗中設置算法1中的參數M=23 881,e=100。算法2中的參數λ=0.85,m=10,γ=6,e=1 000 000。已訓練VAE模型生成模擬停牌數據71 065條,平衡前后訓練集類別樣本的分布見表2所示。
表2 平衡前后訓練集樣本分布
為了驗證VAE模型的有效性,采用BDM模型測試平衡前后的訓練集,實驗結果如表3所示。
表3 訓練集平衡前后的對比實驗結果
表3顯示采用VAE模型對樣本類別不平衡問題的處理對提升模型的分類效果十分明顯。
抽取平衡前訓練集的2%作為預訓練模型的測試集,將剩余數據進行類別平衡后,取其80%為訓練集,剩下20%為驗證集。
1.模型參數設置。
模型TADM、TBADM和CBADM中的BiLSTM 層、TCN層、1D-CNN層的主要參數設置如表4所示。
表4 主要參數
模型BADM和BDM中3層BiLSTM 層的units分別為:64,32和16,激活函數設為TanH。
2.對比實驗及結果分析。
模型訓練參數設為:epochs=100,batch size=32和dropout=0.2,采用Adam優(yōu)化器,學習率設為0.001。5個模型在測試集上的實驗結果如表5所示。
表5 模型實驗結果
表5顯示TBADM 的模型性能最佳,但TCN已經擁有了CNN和LSTM的優(yōu)點,能提取較大范圍的時間序列特征,而進一步使用BiLSTM 層學習TCN輸出的雙向特征以及注意力機制突出了其輸出特征向量,導致其過擬合嚴重。CBADM、BADM和BDM的模型性能相似,也存在過擬合問題,源于受限于BiLSTM 層對時間序列建模的長度。TADM的模型性能雖略低,但其學習A盤整體停牌特征能力是最強的,因此本文以TADM作為預訓練模型。用模型TADM分別對2 539個股的時序數據(不包含模擬停牌數據)進行分類測試,表6統(tǒng)計了落在不同TP區(qū)間中的股票數量。
表6 預測結果統(tǒng)計
表6中股票數合計2 537只,有2只股票沒有停牌記錄,結果顯示TP≥80%的股票數合計占比超過總體股數的75%以上。
3.模型性能的行業(yè)分析。
進一步分析預訓練模型TADM在各個行業(yè)中的預測性能。依據證監(jiān)會行業(yè)劃分標準,在所有79個行業(yè)中選取股票數超過100的6個行業(yè),如表7所示。
表7 行業(yè)股票分布統(tǒng)計
圖9給出了落在區(qū)間L1、L2和L3的6個行業(yè)股票數占比直方圖。
圖9 不同行業(yè)的模型性能對比直方圖
圖9顯示針對6個行業(yè)的股票預測,TADM模型皆具有良好的表現。只有一只股票的TP低于50%(46.15%),是屬于行業(yè)C27中某藥業(yè),曾一直被懷疑存在嚴重的財務舞弊,最終因其造假被證監(jiān)會處罰,模型對其預測TP結果說明虛假財務數據誤導了投資者,背離了模型從正常交易中發(fā)掘的停牌規(guī)律,所以無法進行有效預測。另外,不同行業(yè)受到的政策市場等影響不一樣,因此它們的停牌規(guī)律是有差異的,TADM模型的表現也就略有不同,如表8所示。
表8 不同行業(yè)的模型性能分析
表8顯示K70和C35的TP均值較高且方差較小,說明TADM模型在這2個行業(yè)中表現更佳。
基于TADM預訓練模型的遷移學習構建個股的停牌預測模型STFTADM(Single Transfer Learning Model base on TADM)。TADM模型的參數共計174 209個,設計重新訓練參數的數量為1 921,即只有1%的參數參與學習,如圖8所示。
1.個股選擇與平衡處理。
為了較全面評估遷移學習的效果,實驗中分別從區(qū)間L1、L2和L3中選取股票。選取表6中落在L1區(qū)間的所有6只股票。被選取股票的相關信息如表9所示。
表9 選取的股票信息
表9顯示個股的訓練集存在極度不平衡,采用算法3進行處理,設置參數λ=0.83,m=50,e=10 000。生成的個股模擬停牌數據如表10所示。
表10 個股模擬停牌數據
表10顯示個股的個別停牌類數據未能產生模擬數據,這是由于模型VAE是由A股所有停牌類數據訓練而得,個股的部分停牌時間序列可能背離整體特征,導致其在閾值0.83下無法產生對應的模擬數據。
2.模型訓練與結果分析。
將個股平衡后的數據集依照6∶2∶2的比例依次劃分為訓練集、驗證集與測試集。模型STFTADM訓練參數設為:epochs=25,batch size=1和dropout=0.2,采用Adam優(yōu)化器,學習率的設置:L1中的股票為0.005;L2為0.001;L3為0.000 5。各個模型STFTADM測試對應個股的時序數據(不包含模擬停牌數據),與對應的預訓練模型測試的對比結果如表11所示。
表11 個股模型實驗結果對比
表11的實驗結果顯示個股的STFTADM模型相對于TADM的測試效果有著較大幅度的提高,如股票002356的停牌分類正確率由64.285 7%提升到100%。表11中東方銀星(股票代碼:600753)的預測結果較差,其STFTADM模型的TP=76.470 6%,該公司曾虧損約5 002萬元,經營性現金流大幅下降,近年才由盈轉虧??得浪帢I(yè)(股票代碼:600518)的STFTADM模型的TP=75%,該公司曾存在嚴重的財務舞弊。貝肯能源(股票代碼:002828)的STFTADM模型的TP=77.78%,該公司作為民營企業(yè),其收入對中石油集團單一客戶依賴性較高,存在業(yè)績下滑的風險。
相較于預訓練模型TADM,個股的模型STFTADM表現出更強的樣本識別能力且誤報率較低。這是因為利用了預訓練模型的網絡層參數,能較好地捕獲停牌樣本的時間序列特征,同時基于預訓練模型在無形中拓展了目標個股數據集,使得模型更加魯棒,增強了模型的泛化能力。
本文基于停牌預測的視角,選取2013—2021年A股市場2 539家上市公司的數據,采用預訓練模型和遷移學習等深度學習方法對股票停牌事件進行預測研究。研究結果表明:(1)雖然現行股票停牌存在隨意性強、時間長以及誘因復雜性等問題,但仍能從中長期金融數據波動中提取其中關于停牌的特征模式,引入深度學習模型能學習到所有上市公司股票停牌的共性特征,在此基礎上通過遷移學習機制獲得個股停牌特征,進而實現精確預測。(2)在股票市場交易中,股票停牌屬于低頻行為,本文提出的基于VAE的停牌模擬數據生成算法能有效模擬停牌時序數據,極大改善了深度學習分類模型的性能。(3)預訓練模型能較好地預測A股市場各個行業(yè)板塊的停牌事件,約75%的股票停牌預測準確度在80%以上,六個行業(yè)板塊的實驗結果分析顯示房地產業(yè)和專用設備制造業(yè)的預測效果最佳。在此基礎上的個股遷移學習模型測試結果表現出更高的預測精度。(4)預測效果較差的上市公司往往存在較嚴重的財務舞弊或經營不善等問題,其中長期金融數據波動背離了模型從正常交易中發(fā)掘的停牌規(guī)律。
A股市場的隨意停牌現象不僅限制了投資者正常交易的權利,而且還存在著信息不對稱下內部人對于股東權益侵蝕的可能(石陽等,2019[15])。本文研究能夠對未來可能發(fā)生的股票停牌做出較為準確的判斷,能為資本市場提供更好的信息服務?;诖?,本文提出以下相關建議: (1)我國中小投資者在信息不對稱的情況下,一方面可以借鑒個股停牌預測結果,有效地規(guī)避停牌風險,進而減少投資損失以及實現資產保值;另一方面也可為部分投資者利用個股停牌后的股價波動,實現收益最大化等目標提供幫助。(2)個股停牌預測結果在一定程度上反映了上市公司的財務或經營狀況,投資者可以適當規(guī)避停牌預測結果較差的個股,以優(yōu)化投資方案。(3)本文的研究為證監(jiān)會與交易所預測停牌行為提供了可能,監(jiān)管部門可以動態(tài)監(jiān)控A股市場各個行業(yè)板塊的停牌事件,及時對整體停牌趨勢做出前瞻性判斷,為宏觀調控和政策調整提供了參考。