朱林
摘要:金融時(shí)間序列數(shù)據(jù)的指標(biāo)按照不同的會(huì)計(jì)準(zhǔn)則會(huì)得到不同的數(shù)值,如何取舍會(huì)受到人為因素的干預(yù)。針對(duì)金融時(shí)序數(shù)據(jù)的領(lǐng)域泛化專(zhuān)門(mén)提出一種異常檢測(cè)方法,解決特征分布的多樣性和復(fù)雜性,捕捉金融序列數(shù)據(jù)的特有表征模式。將循環(huán)神經(jīng)網(wǎng)絡(luò)之后獲得的結(jié)果僅作為學(xué)習(xí)到的知識(shí),通過(guò)標(biāo)準(zhǔn)分類(lèi)器在特征空間對(duì)其邊緣分布進(jìn)行適配,然后再通過(guò)隱變量自回歸模型進(jìn)一步進(jìn)行預(yù)測(cè),以此來(lái)提高預(yù)測(cè)的精度。然后,構(gòu)建一個(gè)隱變量自回歸模型來(lái)進(jìn)行風(fēng)險(xiǎn)預(yù)測(cè),通過(guò)捕捉金融時(shí)間序列數(shù)據(jù)之間的特征分布來(lái)識(shí)別其中的金融風(fēng)險(xiǎn),實(shí)驗(yàn)結(jié)果表明,模型具有一定的可行性。
關(guān)鍵詞:深度學(xué)習(xí);金融時(shí)間序列數(shù)據(jù);特征分布;金融風(fēng)險(xiǎn);異常檢測(cè)
一、前言
深度學(xué)習(xí)已經(jīng)被廣泛應(yīng)用于計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理領(lǐng)域。但是與圖像領(lǐng)域和自然語(yǔ)言處理領(lǐng)域有較多的經(jīng)典網(wǎng)絡(luò)結(jié)構(gòu)可選擇不同,金融時(shí)間序列數(shù)據(jù)處理吸引了大批研究者探索其未來(lái)研究的方向。嘗試使用深度學(xué)習(xí)技術(shù)增強(qiáng)金融風(fēng)險(xiǎn)防范措施,無(wú)論在基礎(chǔ)理論研究上還是對(duì)于國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展中的金融風(fēng)險(xiǎn)防范工作,都具有很高的研究和應(yīng)用價(jià)值。
二、深度學(xué)習(xí)技術(shù)在金融風(fēng)險(xiǎn)預(yù)測(cè)領(lǐng)域的作用
異常檢測(cè)是一門(mén)由來(lái)已久的技術(shù),已經(jīng)廣泛應(yīng)用于各個(gè)領(lǐng)域。隨著近些年深度學(xué)習(xí)技術(shù)的突飛猛進(jìn),兩項(xiàng)技術(shù)的集合受到了諸多研究者的關(guān)注,并且也在一些領(lǐng)域展開(kāi)了應(yīng)用,網(wǎng)絡(luò)入侵檢測(cè)[1]、智慧醫(yī)療[2]、傳感器網(wǎng)絡(luò)[3],以及視頻異常檢測(cè)[4]等。一個(gè)金融時(shí)間序列數(shù)據(jù)的指標(biāo)按照不同的會(huì)計(jì)準(zhǔn)則會(huì)得到不同的數(shù)值,如何取舍會(huì)受到人為因素的干預(yù)。當(dāng)前被判定合規(guī)的數(shù)據(jù)標(biāo)簽,在金融風(fēng)險(xiǎn)真實(shí)發(fā)生后再回溯人工智能的學(xué)習(xí)過(guò)程,相當(dāng)于非主觀有意地對(duì)模型數(shù)據(jù)進(jìn)行“投毒”。有研究者注意到,深度學(xué)習(xí)模型,無(wú)論卷積神經(jīng)網(wǎng)絡(luò)還是循環(huán)神經(jīng)網(wǎng)絡(luò)提取到的特征都具有相似性和繼承性[5],嘗試將其應(yīng)用在其他具備一定特征的金融時(shí)序數(shù)據(jù)集上進(jìn)行泛化研究,對(duì)于探索深度學(xué)習(xí)在金融風(fēng)險(xiǎn)預(yù)測(cè)工作上的有效性具有應(yīng)用意義。與其他很多異常檢測(cè)場(chǎng)景不同,在實(shí)務(wù)中,金融風(fēng)險(xiǎn)不一定意味著損失,也可能是套利的機(jī)會(huì)。在金融時(shí)間序列數(shù)據(jù)場(chǎng)景下獲得準(zhǔn)確的標(biāo)簽的代價(jià)是十分昂貴的,尤其是異常數(shù)據(jù)在一開(kāi)始往往會(huì)標(biāo)記成正常數(shù)據(jù),因?yàn)槭录?,總有各種各樣的解釋背書(shū)該操作的合理合規(guī)性。如何通過(guò)多源時(shí)序數(shù)據(jù)的時(shí)空關(guān)聯(lián)性來(lái)發(fā)現(xiàn)通用表征模式,不同的是這里誤導(dǎo)模型的將不再有噪聲數(shù)據(jù),而是并不太準(zhǔn)確,事后往往被發(fā)現(xiàn)錯(cuò)誤標(biāo)注的標(biāo)簽數(shù)據(jù)。這是金融時(shí)序數(shù)據(jù)場(chǎng)景下異常檢測(cè)面臨的另一個(gè)關(guān)鍵挑戰(zhàn)。
本文提出一種針對(duì)金融時(shí)序數(shù)據(jù)的領(lǐng)域泛化異常檢測(cè)方法,解決特征分布的多樣性和復(fù)雜性,捕捉金融序列數(shù)據(jù)的特有表征模式。該方法基于循環(huán)神經(jīng)網(wǎng)絡(luò),但在架構(gòu)上分為兩個(gè)學(xué)習(xí)模塊。在兩個(gè)學(xué)習(xí)模塊之間具有學(xué)習(xí)到的特征知識(shí)的傳遞,先在一個(gè)源領(lǐng)域上進(jìn)行pre-train,使用循環(huán)神經(jīng)網(wǎng)絡(luò)作特征提取模塊,然后在目標(biāo)領(lǐng)域上進(jìn)行隱變量的自回歸分析(latent autoregressive models)。
三、研究方案
(一)將數(shù)據(jù)的學(xué)習(xí)和使用分為兩個(gè)部分
在該模型中,金融時(shí)間序列數(shù)據(jù)領(lǐng)域所有的標(biāo)簽被認(rèn)為都只有在事后才能明確其準(zhǔn)確性。那么,該模型的設(shè)計(jì)方案中在循環(huán)神經(jīng)網(wǎng)絡(luò)之后獲得的結(jié)果僅把它當(dāng)做學(xué)習(xí)到的知識(shí),通過(guò)標(biāo)準(zhǔn)分類(lèi)器在特征空間對(duì)其邊緣分布進(jìn)行適配,然后再通過(guò)隱變量自回歸模型進(jìn)一步進(jìn)行預(yù)測(cè),通過(guò)這樣的方法來(lái)提高預(yù)測(cè)的精度。
(二)使用隱變量自回歸模型尋找金融風(fēng)險(xiǎn)的分布特征
該研究使用隱變量自回歸模型計(jì)算預(yù)測(cè)值與標(biāo)簽之間的分布距離,對(duì)于特征空間進(jìn)行分布適配。雖然大多數(shù)深度研究的前提都是滿足獨(dú)立同分布這一要求,金融時(shí)間序列數(shù)據(jù)相較于其他數(shù)據(jù)集在這一點(diǎn)上矛盾并不突出,但也不能認(rèn)為在嚴(yán)格意義上完全符合。假設(shè)在其他時(shí)間序列中的噪音,在該領(lǐng)域指不由各種機(jī)構(gòu)有意操控的數(shù)據(jù)分布下的金融時(shí)間序列數(shù)據(jù)。在更多考慮金融時(shí)間序列數(shù)據(jù)的時(shí)間依賴(lài)性、空間依賴(lài)性,以及金融“噪音”數(shù)據(jù)分布的各種影響后,通過(guò)當(dāng)前的方案使得正常數(shù)據(jù)在隱變量特征空間具有獨(dú)立同分布這一特性,在沒(méi)有添加生成數(shù)據(jù)的同時(shí)可以提高研究模型的魯棒性。
四、方案設(shè)計(jì)
(一)復(fù)合深度學(xué)習(xí)框架
本研究中對(duì)深度學(xué)習(xí)各種模型的層次架構(gòu)進(jìn)行操作,建立一個(gè)可以互相銜接使用的數(shù)據(jù)處理學(xué)習(xí)機(jī)制架構(gòu)。構(gòu)建由循環(huán)神經(jīng)網(wǎng)絡(luò)與隱變量自回歸模型組合的復(fù)合架構(gòu)如圖1所示,旨在通過(guò)隱變量的特征學(xué)習(xí),將過(guò)去時(shí)間金融數(shù)據(jù)以及其在隱變量自回歸模型中預(yù)測(cè)產(chǎn)生的誤差,再進(jìn)行統(tǒng)一的學(xué)習(xí)。
在金融時(shí)間序列數(shù)據(jù)中,每個(gè)金融機(jī)構(gòu)包含m個(gè)指標(biāo)、n個(gè)(n>1)金融機(jī)構(gòu)的數(shù)據(jù)集,定義S表示指標(biāo)集合,模型所獲得的金融時(shí)間序列數(shù)據(jù)總體有N=|S|=mn個(gè)指標(biāo),每一個(gè)指標(biāo)為xi∈S,xi∈Rti×1。其中,ti表示指標(biāo)xi的長(zhǎng)度。目標(biāo)限定在金融時(shí)間序列數(shù)據(jù)這一種時(shí)間序列上,完成對(duì)于金融風(fēng)險(xiǎn)的預(yù)測(cè)這一學(xué)習(xí)任務(wù)。利用相似性度量在大量金融數(shù)據(jù)集進(jìn)行學(xué)習(xí),通過(guò)學(xué)習(xí)找出金融數(shù)據(jù)時(shí)間序列計(jì)算風(fēng)險(xiǎn)閾值的較優(yōu)方法。
假設(shè)當(dāng)前某一機(jī)構(gòu)的時(shí)間序列數(shù)據(jù)為Xi,那么向下一個(gè)隱變量自回歸模型傳遞的特征知識(shí)由循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行計(jì)算,如公式(1)。
(1)
其中,Ht-1是上一個(gè)時(shí)間點(diǎn)的該機(jī)構(gòu)金融時(shí)間序列數(shù)據(jù)計(jì)算獲得的特征知識(shí),即X=(x1…,xN)T∈RN×T表示包含所有數(shù)據(jù)源的輸入樣本。
通過(guò)本研究的方式,尋找相鄰時(shí)間隱變量Ht和Ht-1之間的關(guān)系,并將學(xué)習(xí)到的信息保留在當(dāng)前時(shí)間的隱變量之中。這些隱變量在模型的下一個(gè)計(jì)算層,將被送入帶有激活函數(shù)的全連接層。隨后使用隱變量自回歸算法來(lái)做金融時(shí)間序列數(shù)據(jù)集異常特征的線性預(yù)測(cè),將不同機(jī)構(gòu)的特征帶入當(dāng)前學(xué)習(xí)的特征中去進(jìn)行隱變量自回歸分析。利用特征空間中的數(shù)據(jù)分布信息來(lái)探測(cè)當(dāng)前數(shù)據(jù)源的特征是否異常。按照既定的研究目標(biāo)將循環(huán)神經(jīng)網(wǎng)絡(luò)在指定金融時(shí)間序列數(shù)據(jù)集內(nèi)學(xué)習(xí)到的特征知識(shí)表示作為隱變量自回歸模型的輸入。
對(duì)于金融時(shí)間序列數(shù)據(jù)集中的標(biāo)簽與模型預(yù)測(cè)值之間的距離,當(dāng)前研究使用交叉熵來(lái)進(jìn)行計(jì)算。為了考慮一個(gè)機(jī)構(gòu)的金融時(shí)間序列數(shù)據(jù)集在前后時(shí)間線上的預(yù)測(cè)差距規(guī)模,使用時(shí)間累積影響度這個(gè)值來(lái)衡量整個(gè)序列中所有時(shí)間預(yù)測(cè)值之間的交叉熵?fù)p失,如公式(2)。
(2)
前置循環(huán)神經(jīng)網(wǎng)絡(luò)計(jì)算金融時(shí)間序列數(shù)據(jù)的訓(xùn)練數(shù)據(jù),學(xué)習(xí)獲得符合獨(dú)立同分布要求的隱變量知識(shí),再通過(guò)隱變量自回歸模型學(xué)習(xí)獲得金融時(shí)間序列數(shù)據(jù)集在相關(guān)機(jī)構(gòu)、相關(guān)時(shí)間上的預(yù)測(cè)差距規(guī)模,如公式(3)。
(3)
λ為模型目標(biāo)函數(shù)的超參數(shù),用于調(diào)整誤差之間的權(quán)重大小。LCEL 為前置循環(huán)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練誤差,該值指示了學(xué)習(xí)到的隱變量知識(shí)是否能夠很好地保留輸入樣本的特征分布,這里誤差計(jì)算使用交叉熵。LMSE表示隱變量自回歸模型的訓(xùn)練誤差,通過(guò)這個(gè)值考查正常情況與異常情況之間的距離,以探測(cè)金融風(fēng)險(xiǎn)。
最終通過(guò)深度學(xué)習(xí)獲得的是一個(gè)風(fēng)險(xiǎn)閾值,它在不同金融場(chǎng)景下意義可能不同。對(duì)于金融機(jī)構(gòu),它可以是止盈止損閾值。對(duì)于監(jiān)管機(jī)構(gòu),它可以是管控紅線。這里的訓(xùn)練集X={x1,x2,…,xD},xi∈RN×T是包含風(fēng)險(xiǎn)存在的、真實(shí)的一個(gè)時(shí)間段內(nèi)的特征集合。FRPL(xi)是對(duì)應(yīng)樣本標(biāo)簽xi在循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)合隱變量自回歸模型訓(xùn)練之后得到的距離總和,u是其均值。η是超參數(shù),通過(guò)這種模型的不斷應(yīng)用形成這個(gè)超參數(shù)的特征標(biāo)簽庫(kù)之后,η也可以通過(guò)深度模型學(xué)習(xí)獲得,如公式(4)。
(4)
在預(yù)測(cè)階段,通過(guò)判斷是否預(yù)測(cè)樣本特征xi的距離FRPL(xi)>FRthreshold,如果大于,則該樣本xi被標(biāo)定為金融風(fēng)險(xiǎn),反之為正常。
五、實(shí)驗(yàn)結(jié)果分析
(一)該模型與僅使用循環(huán)神經(jīng)網(wǎng)絡(luò)之間的比較
實(shí)驗(yàn)使用金融時(shí)間序列數(shù)據(jù)集為私有,反映了某小金融行業(yè)在某行政區(qū)域內(nèi)的綜合指數(shù)。為了驗(yàn)證模型的有效性,使用循環(huán)神經(jīng)網(wǎng)絡(luò)模型、隱變量自回歸模型,采用新提出的、兩者結(jié)合的方法對(duì)指數(shù)進(jìn)行預(yù)測(cè),并將獲得的預(yù)測(cè)標(biāo)簽與數(shù)據(jù)集中的標(biāo)簽進(jìn)行了對(duì)比,分別對(duì)應(yīng)圖中的實(shí)線段和點(diǎn)化線線段,如圖2所示。可以看出在短期內(nèi)該模型有預(yù)測(cè)能力,長(zhǎng)期預(yù)測(cè)情況下,能力會(huì)被不斷削弱,但也要強(qiáng)于全點(diǎn)線所對(duì)應(yīng)的循環(huán)神經(jīng)網(wǎng)絡(luò)。
如果將預(yù)測(cè)測(cè)試集的數(shù)據(jù)也投入訓(xùn)練,可以得到圖2中的虛線線段曲線,對(duì)于監(jiān)管場(chǎng)景下的應(yīng)用具有實(shí)踐價(jià)值。
(二)該模型使用交叉熵與平方損失之間的比較
協(xié)變量漂移將會(huì)導(dǎo)致誤差的積累,在數(shù)據(jù)脫離金融規(guī)律的循環(huán)之后,預(yù)測(cè)將不再準(zhǔn)確,甚至?xí)驗(yàn)樵谀P蛢?nèi)部達(dá)到某個(gè)奇點(diǎn)而造成自動(dòng)梯度下降的算法失靈。即使來(lái)自于同一個(gè)行業(yè),由于協(xié)方差漂移問(wèn)題的存在,在源域特征分布與目標(biāo)域特征分布之間也存在差異。該研究相較于異常檢測(cè)中常規(guī)使用的LMSE,來(lái)度量這兩個(gè)分布之間的差距,使用了交叉熵來(lái)處理這種距離損失。通過(guò)實(shí)驗(yàn)結(jié)果數(shù)據(jù)可以看出該模型取得了一個(gè)更好的效果,如圖3所示。
(三)金融市場(chǎng)常態(tài)環(huán)境下預(yù)測(cè)風(fēng)險(xiǎn)效果
如果給定的金融時(shí)間序列數(shù)據(jù)完全剔除金融市場(chǎng)中的黑天鵝事件、灰犀牛事件,該模型可以獲得比較滿意的結(jié)果,如圖4所示。在應(yīng)用于金融時(shí)間序列數(shù)據(jù)的特征分布比較穩(wěn)定的情景下,該模型可以預(yù)測(cè)出該市場(chǎng)金融風(fēng)險(xiǎn)閾值的發(fā)展趨勢(shì)。由于在金融時(shí)間序列中,正常和異常數(shù)據(jù)往往具有同一個(gè)類(lèi)別的標(biāo)簽,考慮到其數(shù)據(jù)分布的差異性,實(shí)際上在不同階段可以給這些數(shù)據(jù)集賦予新的偽標(biāo)簽。
六、結(jié)語(yǔ)
本研究具體方法是首先構(gòu)建循環(huán)神經(jīng)網(wǎng)絡(luò)新的隱知識(shí)學(xué)習(xí)體系,然后,構(gòu)建一個(gè)隱變量自回歸模型來(lái)進(jìn)行風(fēng)險(xiǎn)預(yù)測(cè)。通過(guò)捕捉金融時(shí)間序列數(shù)據(jù)之間的特征分布特征來(lái)識(shí)別其中的金融風(fēng)險(xiǎn),實(shí)驗(yàn)結(jié)果表明,模型具有一定的可行性。
參考文獻(xiàn)
[1] Chalapathy R, Chawla S. Deep learning for anomaly detection: A survey [J]. arXiv preprint arXiv:1901.03407, 2019.
[2] Litjens G, Kooi T, Bejnordi B E, et al. A survey on deep learning in medical image analysis [J]. Medical image analysis, 2017, 42: 60-88.
[3]Ball J E, Anderson D T, Chan C S. Comprehensive survey of deep learning in remote sensing: theories, tools, and challenges for the community [J]. Journal of Applied Remote Sensing, 2017, 11(04): 042609.
[4]Kiran B, Thomas D, Parakkal R. An overview of deep learning based methods for unsupervised and semi-supervised anomaly detection in videos [J]. Journal of Imaging, 2018, 4(02): 36.
[5]Zhang Y, Chen Y, Wang J, et al. Unsupervised deep anomaly detection for multi-sensor time-series signals[J]. IEEE Transactions on Knowledge and Data Engineering, 2021, 35(02): 2118-2132.
基金項(xiàng)目:1.貴州省第六批千層次人才項(xiàng)目(項(xiàng)目編號(hào):筑科合同-GCC[2022]011);2.2024年度貴州省基礎(chǔ)研究計(jì)劃(自然科學(xué)類(lèi))項(xiàng)目“基于金融數(shù)據(jù)的時(shí)間序列在線深度遷移學(xué)習(xí)研究”(項(xiàng)目編號(hào):黔科合基礎(chǔ)-ZK[2024]一般520)
作者單位:貴陽(yáng)學(xué)院電子信息工程學(xué)院
■ 責(zé)任編輯:王穎振、鄭凱津