摘 要:為解決經(jīng)典期權(quán)定價(jià)模型與實(shí)際價(jià)格數(shù)據(jù)偏差較大的問(wèn)題,選取BS期權(quán)定價(jià)模型,采用快速傅里葉變換(Fast Fourier Transform,F(xiàn)FT)結(jié)合Transformer多頭注意力機(jī)制深度學(xué)習(xí)算法,對(duì)上證300ETF期權(quán)與上海期貨交易所黃金期權(quán)數(shù)據(jù)進(jìn)行實(shí)證研究,通過(guò)改進(jìn)的Transformer算法對(duì)基于FFT算法的期權(quán)定價(jià)模型與實(shí)際金融市場(chǎng)期權(quán)價(jià)格數(shù)據(jù)之間的殘差值進(jìn)行二次訓(xùn)練。結(jié)果表明,與其他算法(BS、FFT-BS)及其他混合算法(FFT-BS+ARIMA、FFT-BS+LSTM)模型相比,基于FFT-BS+Transformer的算法在R2、MSE、NRMSE以及MAE等統(tǒng)計(jì)指標(biāo)上均有很好的表現(xiàn),且針對(duì)不同波動(dòng)、不同品種的期權(quán),該混合算法模型均取得了較好的結(jié)果。將改進(jìn)后的Transformer算法應(yīng)用到期權(quán)定價(jià)中,可彌補(bǔ)經(jīng)典期權(quán)定價(jià)模型的不足,提供了更加精確的期權(quán)定價(jià)模型。
關(guān)鍵詞:計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò);金融市場(chǎng);期權(quán)定價(jià);深度學(xué)習(xí);混合模型;多頭注意力機(jī)制
中圖分類(lèi)號(hào):F830.91
文獻(xiàn)標(biāo)識(shí)碼:A
DOI:10.7535/hbkd.2024yx05011
Research on hybrid option pricing model based on
FFT and Transformer algorithm
WEN Wei1,F(xiàn)U Zhiyuan2,ZHANG Yanhui2
(1. School of Economics,Beijing Technology and Business University,Beijing 100048,China;
2. School of Mathematics and Statistics,Beijing Technology and Business University,Beijing 100048,China)
Abstract:In order to solve the problem of the large deviation between the classical option pricing model and the actual price data, based on the BS option pricing model, the Fast Fourier Transform (FFT) combined with the Transformer's multi-head attention mechanism of deep learning algorithm was used to conductthe empirical research on the 300ETF options and Shanghai gold options data. The model was quaeMzbpPpYYZrWjqWjA+zzOGh05mYQsWit5R+XnOHTAVM=dratically trained by the improved Transformer algorithm on the residual values between the option pricing model based on the FFT algorithm and the option price data of the actual financial market. The results show that compared with other algorithms (BS model, FFT-BS model) and other hybrid algorithm models (FFT-BS+ARIMA model, FFT-BS+LSTM model), the proposed model has a good performance in the statistical indexes such as R2, MSE, NRMSE and MAE, and the hybrid algorithm model achieves a better perflcZKirmhzEy1WXtphXnY6GaS0SAfmljVQTtxYNJJQds=ormance for different volatilitiesand different varieties of options. The study innovatively applies the improved Transformer algorithm to option pricing, which compensates for the shortcomings of the classical option pricing model and provides a more accurate option pricing model.
Keywords:computer neural network; financial market; option pricing; deep learning; hybrid model; multi-head attention mechanism
中國(guó)金融產(chǎn)品發(fā)展相對(duì)較晚,金融工具創(chuàng)新不足,衍生產(chǎn)品不全,行業(yè)對(duì)外開(kāi)放程度也不高。隨著金融市場(chǎng)改革進(jìn)程的加快,在經(jīng)濟(jì)“新常態(tài)”的要求下,金融行業(yè)的發(fā)展尤其是衍生品的快速發(fā)展迫在眉睫。期權(quán)定價(jià)一直是衍生品的核心研究問(wèn)題之一。自Black-Scholes-Merton模型[1]問(wèn)世以來(lái),期權(quán)定價(jià)問(wèn)題廣受關(guān)注,相關(guān)模型得到持續(xù)改進(jìn)[2-4]。
Lévy過(guò)程的引入,準(zhǔn)確地描述了資產(chǎn)波動(dòng)情況[5],有效反映了資產(chǎn)價(jià)格服從非高斯分布及跳躍行為[6]。在期權(quán)定價(jià)數(shù)值計(jì)算方面,目前使用較多的方法有二叉樹(shù)法[7]、有限差分法[8]和快速傅里葉變換法(Fast Fourier Transform,F(xiàn)FT)[4]。CARR等[8]使用FFT提高了計(jì)算速度和逼近精度,對(duì)任何特征函數(shù),得到一個(gè)簡(jiǎn)單的解析表達(dá)式,利用FFT對(duì)期權(quán)價(jià)格或其時(shí)間價(jià)值進(jìn)行數(shù)值求解。該方法后續(xù)被廣泛應(yīng)用于各類(lèi)復(fù)雜期權(quán)定價(jià)模型計(jì)算,隨后又出現(xiàn)了分?jǐn)?shù)階傅里葉變換求解期權(quán)模型[9],效率更快。
近年來(lái)深度學(xué)習(xí)等算法的出現(xiàn)為傳統(tǒng)的期權(quán)定價(jià)模型提供了新思路[10-13]。深度學(xué)習(xí)模型框架Transformer摒棄了遞歸(RNN)和卷積(CNN),完全基于Attention多頭注意力機(jī)制,有效處理時(shí)序數(shù)據(jù),如自然語(yǔ)言、圖像、視頻等[14]?,F(xiàn)在流行的Bert模型和GPT模型均使用了Transformer的網(wǎng)絡(luò)結(jié)構(gòu),其中使用雙向Transformer編碼器預(yù)訓(xùn)練大規(guī)模的文本語(yǔ)料,被廣泛應(yīng)用于文本分類(lèi)、命名實(shí)體識(shí)別、系統(tǒng)問(wèn)答等[15];GPT使用了單向Transformer編碼器生成文本,用于文本摘要、對(duì)話(huà)生成等任務(wù)[15]。但這些算法以及深度學(xué)習(xí)模型單一使用時(shí)均出現(xiàn)局限性。例如:金融市場(chǎng)存在交易博弈,基于無(wú)風(fēng)險(xiǎn)套利原理的傳統(tǒng)期權(quán)定價(jià)模型對(duì)于實(shí)際金融市場(chǎng)期權(quán)數(shù)據(jù)的預(yù)測(cè)精度有待提高;深度學(xué)習(xí)模型往往只能描述數(shù)據(jù)之間的相關(guān)性,對(duì)于數(shù)據(jù)之外客觀事實(shí)影響因素的分析并不理想。另外,如果只通過(guò)單一的機(jī)器學(xué)習(xí)方法或深度學(xué)習(xí)方法對(duì)價(jià)格數(shù)據(jù)進(jìn)行時(shí)序預(yù)測(cè),其結(jié)果往往不具有較強(qiáng)的解釋性和穩(wěn)定性。為此,有的科研人員引入混合期權(quán)定價(jià)模型進(jìn)行實(shí)證研究,對(duì)芝加哥交易所和美國(guó)期權(quán)交易所內(nèi)多個(gè)期權(quán)品種進(jìn)行對(duì)比驗(yàn)證,結(jié)果表明混合期權(quán)定價(jià)模型能有效解釋偏差,估值比較準(zhǔn)確[16];有的使用期權(quán)定價(jià)模型與神經(jīng)網(wǎng)絡(luò)模型構(gòu)建混合模型,分別在悉尼期貨交易所和中國(guó)期權(quán)市場(chǎng)進(jìn)行實(shí)證研究[17-19];有的使用小波網(wǎng)絡(luò)和遺傳算法對(duì)中國(guó)香港期權(quán)建模[20-21];還有的通過(guò)深度學(xué)習(xí)模型優(yōu)化期權(quán)定價(jià)模型計(jì)算方法[22]。
本文假設(shè)資產(chǎn)價(jià)格過(guò)程服從幾何布朗運(yùn)動(dòng),僅討論歐式看漲期權(quán)的合約定價(jià),不考慮期權(quán)交易成本,歐式看漲期權(quán)多頭收益為max
{ST-K,0},其特征函數(shù)如式(1)所示。從算法設(shè)計(jì)入手,介紹基于FFT的期權(quán)定價(jià)模型以及改進(jìn)的Transformer網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)構(gòu)建FFT-BS-Transformer混合模型,給出相應(yīng)模型輸入與輸出過(guò)程數(shù)據(jù)的處理方案,并針對(duì)中國(guó)國(guó)內(nèi)金融和商品期權(quán)進(jìn)行實(shí)證對(duì)比分析。
ΦT(u)=eiu(ln S0+(r-σ22)T)-σ2u22T。
(1)
1 算法設(shè)計(jì)
1.1 基于FFT的期權(quán)定價(jià)模型(FFT-BS模型)
在BS模型中,假定資產(chǎn)價(jià)格St服從幾何布朗運(yùn)動(dòng),根據(jù)ROSS[23]和COX等[24]的理論,在T時(shí)刻的歐式看漲期權(quán)價(jià)格,等價(jià)于計(jì)算資產(chǎn)在風(fēng)險(xiǎn)中性測(cè)度Q下的貼現(xiàn)期望,即
V(St,K,T)=e-r(T-t)EQ[W(ST)], W(ST)=max{ST-K,0}=(ST-K)+ 。(2)
式中:V(St,K,T)為期權(quán)價(jià)格;r為無(wú)風(fēng)險(xiǎn)利率。用CT代替式(2)中的V(St,K,T),
CT(K)=e-r(T-t)EQ[W(ST)]=e-r(T-t)
∫+∞K(ST-K)+qT(x)dx 。(3)
將ST、K進(jìn)行替換:
CT(k)=e-r(T-t)
∫+∞k(ex-ek)qT(x)dx 。(4)
式(3)和式(4)中:qT(x)為資產(chǎn)分布的風(fēng)險(xiǎn)中性概率密度函數(shù),即dQ=qTdx;ST為T(mén)時(shí)刻資產(chǎn)價(jià)格;K為期權(quán)到期日?qǐng)?zhí)行價(jià)格;x=ln ST。
由于limk→-∞CT(k)=S0[9],CT(k)不滿(mǎn)足平方可積條件,無(wú)法直接使用FFT,因此引入調(diào)整變量α,記
cT(k)=eαkCT(k), α>0 。(5)
由文獻(xiàn)[9]有:
CT(k)=e-αk2π
∫+∞-∞
e-iukφT(u)du=e-αkπ∫+∞0
Re[e-iukφT(u)]du 。(6)
式中:φT(u)為cT(k)的傅里葉變換;Re為對(duì)結(jié)果取實(shí)部。
1.2 Transformer網(wǎng)絡(luò)結(jié)構(gòu)
Transformer是一種基于注意力機(jī)制的網(wǎng)絡(luò)結(jié)構(gòu),與傳統(tǒng)CNN和RNN模型相比,Transformer的多頭注意力機(jī)制以及位置編碼機(jī)制,能有效解決傳統(tǒng)深度模型以及計(jì)量模型中隨著序列數(shù)據(jù)長(zhǎng)度的增加,預(yù)測(cè)數(shù)據(jù)與較遠(yuǎn)數(shù)據(jù)相關(guān)性較低,容易受近期數(shù)據(jù)的影響導(dǎo)致預(yù)測(cè)不準(zhǔn)確的問(wèn)題[13]。同時(shí),由于編碼機(jī)制的存在,對(duì)于時(shí)序數(shù)據(jù)中周期性數(shù)據(jù)關(guān)系、季節(jié)性數(shù)據(jù)關(guān)系,Transformer模型預(yù)測(cè)效果更好。Informer模型[25]在Transformer模型基礎(chǔ)之上添加了日期編碼,同時(shí)改進(jìn)了多頭網(wǎng)絡(luò)結(jié)構(gòu),在時(shí)序數(shù)據(jù)預(yù)測(cè)方面表現(xiàn)更加優(yōu)秀。
自注意力機(jī)制作為多頭注意力機(jī)制的基礎(chǔ),對(duì)于向量[a1,a2,a3,a4],存在矩陣Wq、Wk、Wv,求解獲得新的向量qi、ki、vi,計(jì)算過(guò)程見(jiàn)式(7)—式(9)。
qi=Wqai 。(7)
ki=Wkai 。(8)
vi=Wvai 。(9)
以獲得的q1為例,分別與[k1,k2,k3,k4]相乘,可獲得[α1,1,α α1,3,α1,4]
(注意力分?jǐn)?shù))。同理,對(duì)q2、q3、q4進(jìn)行同樣操作,可以獲得注意力分?jǐn)?shù)矩陣。將注意力分?jǐn)?shù)再次進(jìn)行Softmax操作歸一化,便可以獲得最終的系數(shù)矩陣,見(jiàn)式(10)。
α1,1…α4,1
α1,4…α4,4=
[k1,k2,k3,k4]′×[q1,q2,q3,q4] 。(10)
將獲得的系數(shù)矩陣與v相乘,最終式如下。
[b1,b2,b3,b4]=[v1,v2,v3,v4]×
α1,1…α4,1
α1,4…α4,4 。(11)
相比循環(huán)神經(jīng)網(wǎng)絡(luò),自注意力機(jī)制對(duì)于長(zhǎng)序列并行度更高,且自注意力機(jī)制最大路徑長(zhǎng)度更短,因此自注意力機(jī)制優(yōu)于傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)系統(tǒng)。
多頭注意力分出多支,一般在使用過(guò)程中默認(rèn)參數(shù)為8。為簡(jiǎn)化介紹多頭注意力,在此以?xún)深^注意力為例,見(jiàn)式(12)—式(14)。
qi,1=Wq,1ai, qi,2=Wq,2ai 。(12)
ki,1=Wk,1ai, ki,2=Wk,2ai 。(13)
vi,1=Wv,1ai, vi,2=Wv,2ai 。(14)
相比單頭自注意力機(jī)制,多頭注意力需要在[qi,ki,vi]基礎(chǔ)之上分別計(jì)算出qi,1、qi,2、ki,1、ki,2、vi,1、vi,2。因此,bi,1由qi,1、ki,1、vi,1計(jì)算而得,bi,2由qi,2、ki,2、vi,2計(jì)算而得。最終bi由bi,1、bi,2合并再與權(quán)重矩陣相乘,使得最終bi維度與單頭自注意力機(jī)制所得bi維度相同,注意力計(jì)算式如下:
Attention(Q,K,V)=Softmax(QKTdk)V 。(15)
利用Transformer模型預(yù)測(cè),有2種常用方法。一是對(duì)時(shí)序數(shù)據(jù)直接進(jìn)行預(yù)測(cè),以時(shí)間T時(shí)刻為例,將T時(shí)刻之前的歷史數(shù)據(jù)作為模型輸入項(xiàng),將T時(shí)刻數(shù)據(jù)作為預(yù)測(cè)數(shù)據(jù)代入模型,進(jìn)行模型的訓(xùn)練與預(yù)測(cè);二是以截面數(shù)據(jù)作為模型的輸入輸出項(xiàng),同樣以T時(shí)刻為例,將時(shí)刻T對(duì)應(yīng)的相關(guān)性影響因子作為模型輸入項(xiàng),期權(quán)價(jià)格作為模型輸出項(xiàng),以此構(gòu)建模型進(jìn)行訓(xùn)練預(yù)測(cè)。本文采取第1種方式作為T(mén)ransformer模型的訓(xùn)練預(yù)測(cè)方法。傳統(tǒng)Transformer模型擅長(zhǎng)處理分類(lèi)數(shù)據(jù),不擅長(zhǎng)對(duì)連續(xù)型變量的預(yù)測(cè),所以需要對(duì)該模型進(jìn)行調(diào)整,來(lái)適應(yīng)當(dāng)前的場(chǎng)景。調(diào)整方向主要分3部分。
1)輸入數(shù)據(jù),網(wǎng)絡(luò)結(jié)構(gòu)調(diào)整。原始模型中輸入數(shù)據(jù)是離散型數(shù)據(jù),因此模型的輸入需要對(duì)離散型數(shù)據(jù)進(jìn)行分類(lèi)編碼。本文輸入數(shù)據(jù)為連續(xù)型數(shù)據(jù),因此原始模型中編碼方式不再適用。原始數(shù)據(jù)進(jìn)入本文模型前,需要對(duì)其進(jìn)行標(biāo)準(zhǔn)化處理,然后直接采用convld層替換原始embedding層,將原有編碼分類(lèi)結(jié)果替換為連續(xù)型變量輸出。
2)輸出數(shù)據(jù),網(wǎng)絡(luò)結(jié)構(gòu)調(diào)整。由于原始模型中輸出結(jié)果為分類(lèi)結(jié)果數(shù)據(jù),因此在經(jīng)過(guò)全連接層后還需要進(jìn)行Softmax層的處理。由于輸出結(jié)果為連續(xù)型數(shù)據(jù)變量,因此在網(wǎng)絡(luò)結(jié)構(gòu)上取消了Softmax操作,直接將全連接層輸出結(jié)果作為最終結(jié)果。但由于模型變量在輸入開(kāi)始階段進(jìn)行過(guò)標(biāo)準(zhǔn)化數(shù)據(jù)處理,因此需要對(duì)模型結(jié)果進(jìn)行反向標(biāo)準(zhǔn)化處理。本文數(shù)據(jù)標(biāo)準(zhǔn)化處理公式為z=x-μσ,其中μ為變量均值,σ為變量標(biāo)準(zhǔn)差,x為變量原始數(shù)值,z為標(biāo)準(zhǔn)化處理后的數(shù)值。
3)輸入項(xiàng)添加到期日數(shù)據(jù)。金融數(shù)據(jù)具有明顯的周期性、季節(jié)性等時(shí)間特性,期權(quán)價(jià)格數(shù)據(jù)受到期日時(shí)間長(zhǎng)短的影響。因此,對(duì)于期權(quán)價(jià)格序列預(yù)測(cè),需要在原有位置編碼的基礎(chǔ)上添加到期日數(shù)據(jù)。具體操作為對(duì)到期日期采用embedding層的處理方法,將到期日特征值進(jìn)行編碼添加至原始輸入當(dāng)中。
位置編碼公式為PE(pos,2i)=sinpos10 0002imodel,
PE(pos,2i+1)=cospos10 0002imodel。
其中pos為輸入數(shù)據(jù)位置位次數(shù)值。到期日編碼公式為e(x)=W×x。
Transformer修改前后網(wǎng)絡(luò)結(jié)構(gòu)對(duì)比圖見(jiàn)圖1。
由圖1可知,與傳統(tǒng)計(jì)量模型或者深度學(xué)習(xí)模型相比,Transformer模型在輸入項(xiàng)中多出一項(xiàng)decoder層的輸入。本文decoder層輸入?yún)⒄赵寄P洼斎?,保留encoder輸入的一部分?jǐn)?shù)據(jù),同時(shí)將預(yù)測(cè)長(zhǎng)度數(shù)據(jù)全部補(bǔ)充為0,上述2部分?jǐn)?shù)據(jù)組合作為decoder層的輸入部分。
模型損失函數(shù)定義如下:
損失函數(shù)=(xn-yn)2 。(16)
式中:xn為預(yù)測(cè)值張量;yn為真實(shí)值張量。本文將原始Transformer模型中使用到的交叉熵?fù)p失函數(shù)替換為均方誤差損失函數(shù),使模型能夠處理連續(xù)數(shù)據(jù)。
采取Adam(adaptive monent estimation)參數(shù)優(yōu)化算法[26],通過(guò)計(jì)算梯度一階矩與二階矩,自適應(yīng)調(diào)整學(xué)習(xí)率,加快參數(shù)更新,提升模型訓(xùn)練效果。該優(yōu)化算法結(jié)合RMSProp和動(dòng)量算法的優(yōu)點(diǎn),在深度學(xué)習(xí)參數(shù)優(yōu)化中得到廣泛使用。模型中學(xué)習(xí)效率參數(shù)LR=0.000 1。
2 模型構(gòu)建
以預(yù)測(cè)真實(shí)期權(quán)市場(chǎng)價(jià)格數(shù)據(jù)為目標(biāo)。將真實(shí)期權(quán)市場(chǎng)價(jià)格數(shù)值分為2部分:一部分通過(guò)使用FFT計(jì)算獲得經(jīng)典期權(quán)價(jià)格;另一部分以真實(shí)期權(quán)市場(chǎng)價(jià)格與上述模型的差值定義為殘差,該值作為改進(jìn)后的Transformer網(wǎng)絡(luò)訓(xùn)練擬合目標(biāo)。最終期權(quán)價(jià)格為上述2個(gè)子模型結(jié)果的和,表示為FFT-BS-Transformer。模型結(jié)構(gòu)圖如圖2所示。
模型預(yù)測(cè)的評(píng)價(jià)指標(biāo)如下:
R2=∑ni=1(yi-)2
∑ni=1(xi-)2,
yMSE=1n∑ni=1(yi-xi)2,
yNRMSE=yMSEmax xi-min xi,
yMAE=1n∑ni=1
|yi-xi|,
yMAPE=1n∑ni=1
yi-xixi。
式中:R2為決定系數(shù);yMSE為均方誤差;yNRMSE為歸一化均方根誤差;yMAE為平均絕對(duì)誤差;yMAPE為平均絕對(duì)百分比誤差;x、y分別代表通過(guò)交易所獲得的實(shí)際期權(quán)價(jià)格以及通過(guò)模型計(jì)算獲得的預(yù)估期權(quán)價(jià)格;為x的均值。
3 實(shí)證分析
為驗(yàn)證所選模型的普適性與準(zhǔn)確性,選擇金融與商品2種歐式期權(quán)進(jìn)行實(shí)證分析。滬深300作為唯一在上證、深證以及中國(guó)金融期貨交易所上市的指數(shù)類(lèi)期權(quán),是滬深市場(chǎng)最具代表性的指數(shù)。黃金是國(guó)家和普通投資者資產(chǎn)配置的重要品種之一,具備貨幣、金融和商品的屬性,是在大眾商品投資中認(rèn)可度最高、交易最為活躍的投資品種。
本文選取滬深300ETF期權(quán)和黃金期權(quán)作為模型實(shí)證標(biāo)的,交易周期選取2022年10月至2023年3月,數(shù)據(jù)頻率采用日線(xiàn)數(shù)據(jù),數(shù)據(jù)來(lái)自wind數(shù)據(jù)庫(kù)。采取上述2類(lèi)品種原因如下:首先,滬深300期權(quán)以現(xiàn)貨ETF為基準(zhǔn),黃金期權(quán)則以黃金期貨為基準(zhǔn),標(biāo)的物不同;其次,滬深300是金融類(lèi)期權(quán),黃金期權(quán)為實(shí)物類(lèi)期權(quán);最后,兩者波動(dòng)性不一致,相關(guān)性較弱。
此外,添加幾組不同模型進(jìn)行對(duì)比。模型1:BS模型[1];模型2:以FFT為計(jì)算方式的BS模型,記作FFT-BS模型[9];模型3:FFT-BS模型+ARIMA模型[19];模型4:FFT-BS模型+LSTM神經(jīng)網(wǎng)絡(luò)模型[19]。模型1和模型2驗(yàn)證FFT計(jì)算方式對(duì)BS模型計(jì)算精度是否有所損失;模型3通過(guò)FFT-BS模型與傳統(tǒng)計(jì)量模型ARIMA模型組合,驗(yàn)證傳統(tǒng)計(jì)量模型是否對(duì)殘差擬合有所幫助;模型4用于對(duì)比Transformer模型相對(duì)傳統(tǒng)深度學(xué)習(xí)模型是否在統(tǒng)計(jì)數(shù)值上有明顯的提升。
模型當(dāng)中資產(chǎn)波動(dòng)率數(shù)據(jù)是非常重要的,對(duì)于模型計(jì)算結(jié)果影響較大。本文所有模型波動(dòng)率數(shù)據(jù)都采用滾動(dòng)計(jì)算標(biāo)的物歷史波動(dòng)率作為輸入項(xiàng)。以T時(shí)刻為例,當(dāng)前時(shí)刻T之前20個(gè)交易日的波動(dòng)率數(shù)據(jù)的平均值作為T(mén)時(shí)刻波動(dòng)率數(shù)據(jù)。無(wú)風(fēng)險(xiǎn)收益率數(shù)據(jù)以2.1%(區(qū)間內(nèi)國(guó)債收益率平均值)為準(zhǔn)。
LSTM超參數(shù)設(shè)置如下:input_size=1(輸入變量每行輸入數(shù)據(jù)維度);hidden_size=24(隱含層的特征數(shù)量);num_layers=1(隱含層層數(shù));output_size=1(輸出向量長(zhǎng)度);seq_length=10(輸入序列長(zhǎng)度)。為保證測(cè)試條件一致性,ARIMA模型、LSTM模型和Transformer模型訓(xùn)練數(shù)據(jù)長(zhǎng)度均為10,即通過(guò)10個(gè)時(shí)序數(shù)據(jù)預(yù)測(cè)第11個(gè)點(diǎn)數(shù)據(jù)。為避免模型出現(xiàn)過(guò)擬合,實(shí)證過(guò)程中以驗(yàn)證集數(shù)據(jù)的損失函數(shù)值是否持續(xù)減少作為模型是否停止訓(xùn)練的標(biāo)準(zhǔn)。本文中采取的容忍度為7,即當(dāng)連續(xù)7次訓(xùn)練模型均在驗(yàn)證集數(shù)據(jù)表現(xiàn)不能更好的時(shí)候,模型便停止訓(xùn)練。模型實(shí)證過(guò)程中,全部數(shù)據(jù)按7∶1∶2隨機(jī)分配的方式被劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。
滬深300歐式期權(quán)實(shí)證結(jié)果:全量測(cè)試數(shù)據(jù)共計(jì)7 025條,訓(xùn)練集數(shù)據(jù)3 812條,驗(yàn)證集544條,測(cè)試集1 090條。由于訓(xùn)練期內(nèi)存在較多的期權(quán)品種,每一個(gè)品種前10條數(shù)據(jù)無(wú)法用于訓(xùn)練,因此在數(shù)據(jù)預(yù)處理后,全量數(shù)據(jù)大于訓(xùn)練數(shù)據(jù)、驗(yàn)證數(shù)據(jù)以及測(cè)試數(shù)據(jù)的總和。GDDiZvUw8tvs5IVp7OkkINYJozHcUjvHpFPowLb0Ni0=
原始期權(quán)數(shù)據(jù)的統(tǒng)計(jì)描述如表1所示。上海證券交易所滬深300ETF期權(quán)交易數(shù)據(jù)較小,中位數(shù)只有0.179,同時(shí)殘差數(shù)據(jù)中位數(shù)只有0.04。因此,單位數(shù)據(jù)差值相對(duì)于滬深300期權(quán)比例來(lái)說(shuō)更大,結(jié)果預(yù)測(cè)的微小波動(dòng)更容易造成預(yù)測(cè)結(jié)果百分比例的偏差增大。
實(shí)證結(jié)果統(tǒng)計(jì)見(jiàn)表2,統(tǒng)計(jì)對(duì)比了5種不同指標(biāo)下不同模型的表現(xiàn)情況,繪制各指標(biāo)結(jié)果見(jiàn)圖3。
將BS模型統(tǒng)計(jì)指標(biāo)設(shè)為基準(zhǔn)數(shù)值1,其他各模型相對(duì)BS模型百分比例如表3所示。
從統(tǒng)計(jì)指標(biāo)維度上分析,上述5個(gè)模型在R2、MSE、NRMSE、MAE、MAPE指標(biāo)中,均呈現(xiàn)出逐步變好的趨勢(shì)。相比BS模型,本文提出的模型R2增長(zhǎng)了8.4%,絕對(duì)值約為99.75%;MSE減少了97.2%,絕對(duì)值減小至0.000 175;NRMSE減少了82.9%,絕對(duì)值減少至0.012 525,MAE減少了82.5%,絕對(duì)值減少至0.009 845。
參考其他模型,可以發(fā)現(xiàn)隨著模型復(fù)雜度的提升,模型擬合預(yù)測(cè)效果越來(lái)越好。深度學(xué)習(xí)模型優(yōu)于普通計(jì)量模型,Transformer深度學(xué)習(xí)模型又優(yōu)于以預(yù)測(cè)時(shí)序數(shù)據(jù)見(jiàn)長(zhǎng)的LSTM類(lèi)RNN模型。這一點(diǎn)與本文模型構(gòu)建過(guò)程中提到的理論依據(jù)一一對(duì)應(yīng)。但MAPE指標(biāo)卻表現(xiàn)出相反的結(jié)果,該指標(biāo)相比BS模型增加了2倍數(shù)值,但絕對(duì)數(shù)據(jù)仍然較小(2.019 932)。這是由于預(yù)測(cè)的殘差數(shù)據(jù)較小,微小的數(shù)據(jù)預(yù)測(cè)便會(huì)帶來(lái)較為明顯的相對(duì)值的變化,且對(duì)于預(yù)測(cè)樣本而言,預(yù)測(cè)值越小,其預(yù)測(cè)得到的結(jié)果越容易引起MAPE的變大。
從實(shí)際應(yīng)用交易角度來(lái)看,期權(quán)價(jià)格越小,通常表示該期權(quán)價(jià)值越低,參與人數(shù)越少,市場(chǎng)定價(jià)不具有代表性。期權(quán)價(jià)格越小,該值為非有效數(shù)據(jù)的可能性越大。因此,本文實(shí)證過(guò)程中,當(dāng)把非有效數(shù)據(jù)剔除后,理論上MAPE指標(biāo)會(huì)有較為明顯的改善,單一指標(biāo)的變差并不影響給出模型整體預(yù)測(cè)有效性提升的判斷。從預(yù)測(cè)結(jié)果統(tǒng)計(jì)指標(biāo)來(lái)看,不難發(fā)現(xiàn)深度學(xué)習(xí)模型構(gòu)建的混合期權(quán)定價(jià)模型是對(duì)比模型中的最優(yōu)模型。因此,單獨(dú)將2類(lèi)深度學(xué)習(xí)模型訓(xùn)練過(guò)程中的損失函數(shù)數(shù)值迭代圖形進(jìn)行比較,判斷兩者之間的優(yōu)劣。
圖4為損失函數(shù)圖形,在同樣優(yōu)化參數(shù)情況下,Transformer結(jié)構(gòu)下的模型優(yōu)化效率更高,需要更少的迭代次數(shù),且模型損失函數(shù)值更小,這意味著模型擬合預(yù)測(cè)效果較好,與上述預(yù)測(cè)統(tǒng)計(jì)結(jié)果相符。
從預(yù)測(cè)結(jié)果中隨機(jī)抽取10組數(shù)據(jù),對(duì)比不同模型預(yù)測(cè)結(jié)果數(shù)據(jù)大小,結(jié)果見(jiàn)圖5。price曲線(xiàn)為實(shí)際期權(quán)價(jià)格,從圖5不難發(fā)現(xiàn):FFT-BS具有較高的計(jì)算效率以及計(jì)算準(zhǔn)確性,其計(jì)算結(jié)果與BS模型計(jì)算結(jié)果基本一致;與單一模型相比,3個(gè)混合期權(quán)模型均有較為明顯的預(yù)測(cè)提升,但對(duì)于個(gè)別時(shí)點(diǎn),如圖5中右側(cè)2個(gè)小圖,Transformer的混合模型預(yù)測(cè)結(jié)果與原始數(shù)據(jù)更為貼合。
黃金期權(quán)實(shí)證結(jié)果如下:全量測(cè)試數(shù)據(jù)共計(jì)11 758條,訓(xùn)練集數(shù)據(jù)6 556條,驗(yàn)證集936條,測(cè)試集1 874條。對(duì)比表4和表1可知,相比滬深300ETF期權(quán),黃金期權(quán)明顯波動(dòng)更大,平均值、各項(xiàng)分位數(shù)均有較為明顯的數(shù)值差異。單位數(shù)據(jù)的變動(dòng)對(duì)于黃金期權(quán)產(chǎn)生的影響弱于滬深300期權(quán),黃金期權(quán)相比滬深300ETF期權(quán)更容易被擬合預(yù)測(cè),不同模型黃金期權(quán)樣本外預(yù)測(cè)結(jié)果對(duì)比見(jiàn)表5,不同模型黃金期權(quán)樣本外預(yù)測(cè)結(jié)果對(duì)比情況見(jiàn)表6,黃金期權(quán)樣本外預(yù)測(cè)結(jié)果分類(lèi)指標(biāo)對(duì)比見(jiàn)圖6。
從預(yù)測(cè)結(jié)果統(tǒng)計(jì)指標(biāo)來(lái)看,Transformer構(gòu)建的混合期權(quán)定價(jià)模型依然是對(duì)比模型中表現(xiàn)最優(yōu)的。相比BS模型,R2提升1.6%,升至約99.82%;MSE直線(xiàn)下降92.0%,降至約1.02;NRMSE下降71.7%,降至0.01;MAE下降76.5%,降至0.59;MAPE同樣上漲94.9%,升至0.69。但是對(duì)于MAPE指標(biāo)來(lái)說(shuō),黃金期權(quán)相比滬深300ETF期權(quán)有更好的下降,MAPE指標(biāo)由3.01下降至0.69。由于黃金期權(quán)價(jià)格遠(yuǎn)大于滬深300期權(quán)價(jià)格,因此單位價(jià)格變動(dòng)引起的誤差變化更小,MAPE指標(biāo)也更小。除去MAPE指標(biāo),R2、MSE、NRMSE和MAE與滬深300ETF期權(quán)預(yù)測(cè)結(jié)果表現(xiàn)出一致性,模型復(fù)雜性越高,預(yù)測(cè)效果越好,指標(biāo)數(shù)值越優(yōu)。
深度學(xué)習(xí)模型損失函數(shù)值走勢(shì)圖見(jiàn)圖7??梢钥闯?,Transformer結(jié)構(gòu)下的模型優(yōu)化效率更高,需要迭代次數(shù)更少,且模型損失函數(shù)值更小,這意味著模型擬合預(yù)測(cè)效果較好,與上述預(yù)測(cè)統(tǒng)計(jì)結(jié)果相符。
黃金期權(quán)隨機(jī)抽點(diǎn)不同模型結(jié)果預(yù)測(cè)圖見(jiàn)圖8。圖8中隨機(jī)挑選黃金期權(quán)價(jià)格,對(duì)比不同模型預(yù)測(cè)差異。可以看出,F(xiàn)FT-BS模型與BS模型大多數(shù)情況下能夠滿(mǎn)足模型預(yù)測(cè)需求,但仍有較大偏差?;旌夏P捅憩F(xiàn)優(yōu)于單一模型,深度學(xué)習(xí)模型優(yōu)于傳統(tǒng)機(jī)器學(xué)習(xí)模型,Transformer模型是所有測(cè)試模型當(dāng)中的最優(yōu)模型。
4 結(jié) 語(yǔ)
1)基于BS模型、FFT-BS模型、FFT-BS+ARIMA模型、FFT-BS+LSTM模型和FFT-BS+Transformer模型,在歐式看漲期權(quán)定價(jià)方面對(duì)2組不同類(lèi)型的期權(quán)產(chǎn)品進(jìn)行實(shí)證,給出了5個(gè)不同的統(tǒng)計(jì)指標(biāo)對(duì)比預(yù)測(cè)效果。結(jié)果表明,上述模型均表現(xiàn)出較好的擬合效果。通過(guò)構(gòu)建混合模型,采取深度學(xué)習(xí)的混合模型有著更為出色的預(yù)測(cè)表現(xiàn),且混合模型的提出具有較強(qiáng)的適用性。
2)通過(guò)對(duì)已有算法的改進(jìn),利用2種子模型組合構(gòu)建混合模型進(jìn)行期權(quán)定價(jià),將人工智能算法中表現(xiàn)出色的多頭注意力機(jī)制引入期權(quán)定價(jià)模型中,可提升模型的預(yù)測(cè)精度。
3)由預(yù)測(cè)結(jié)果統(tǒng)計(jì)指標(biāo)可知,即使數(shù)據(jù)質(zhì)量較差的滬深300ETF期權(quán),同樣獲得了不錯(cuò)的結(jié)果表現(xiàn),模型預(yù)測(cè)精度并未受到期權(quán)數(shù)據(jù)較小、噪音干擾較大的影響。這與本文提到的模型構(gòu)建理論基礎(chǔ)一一對(duì)應(yīng)。加入Transformer網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)強(qiáng)大的注意力機(jī)制以及位置編碼機(jī)制,提高了深度學(xué)習(xí)模型的預(yù)測(cè)效果,突破了原有損失函數(shù)的數(shù)值瓶頸,預(yù)測(cè)效果得到很大改善。
本研究的不足之處主要包含以下2個(gè)方面:一是實(shí)證品種較少,并未對(duì)更多市場(chǎng)及其他期權(quán)品種進(jìn)行普適性驗(yàn)證;二是模型預(yù)測(cè)周期目前僅考慮下一交易日,并未考慮多周期時(shí)的期權(quán)定價(jià)問(wèn)題。未來(lái)需進(jìn)一步優(yōu)化模型參數(shù),提升模型預(yù)測(cè)的準(zhǔn)確性,并驗(yàn)證對(duì)比不同定價(jià)模型在不同經(jīng)濟(jì)體下的表現(xiàn),全方位比較各類(lèi)模型的實(shí)證效果。
參考文獻(xiàn)/References:
[1] BLACK F,SCHOLES M.The pricing of options and corporate liabilities[J].Journal of Political Economy,1973,81(3):637-654.
[2] HULL J,WHITE A.The pricing of options on assets with stochastic volatilities[J].The Journal of Finance,1987,42(2):281-300.
[3] BATES D S.Jumps and stochastic volatility:Exchange rate processes implicit in deutsche mark options[J].The Review of Financial Studies,1996,9(1):69-107.
[4] HESTON S L.A closed-form solution for options with stochastic volatility with applications to bond and currency options[J].The Review of Financial Studies,1993,6:327-343.
[5] CARR P,GEMAN H,MADAN D B,et al.Stochastic volatility for Lévy processes[J].Mathematical Finance,2003,13(3):345-382.
[6] COX J C,RUBINSTEIN M,HALL P. Options Markets[M].Upper Saddle River:Prentice Hall,1985.
[7] 約翰赫爾.期權(quán)、期貨和其他衍生品[M].北京:清華大學(xué)出版社,2009.
[8] CARR P,MADAN D.Option valuation using the fast Fourier transform[J].Journal of Computational Finance,1999,2(4):61-73.
[9] CHOURDAKIS K.Option pricing using the fractional FFT[J].Journal of Computational Finance,2005,8(2):1-18.
[10]FULOP A,YU Jun.Bayesian analysis of bubbles in asset prices[J].Econometrics,2017.DOI: 10.3390/econometrics5040047.
[11]HUTCHINSON J M,LO A W,POGGIO T.A nonparametric approach to pricing and hedging derivative securities via learning networks[J].The Journal of Finance,1994,49(3):851-889.
[12]QI M,MADDALA G S.Option pricing using artificial neural networks:The case of S&P 500 index call options[C]//Neural Networks in Financial Engineering:Proceedings of the Third International Conference on Neural Networks in the Capital Markets.NewYork:World Scientific,1996:78-91.
[13]VASWANI A,SHAZEER N,PARMAR N,et al.Attention is all you need[C]//Proceedings of the 31st International Conference on Neural Information Processing SystemsD.Red Hook:Curran Associates Inc,2017:6000-6010.
[14]DEVLIN J,CHANG M,LEE K,et al.Bert:Pre-training of deep bidirectional transformers for language understanding[C]//Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics:Human Language Technologies.Stroudsburg:ACL,2019:4171-4186.
[15]GULTEKIN N B,ROGALSKI R J,TINIC S M.Option pricing model estimates:Some empirical results[J].Financial Management,1982,11:58-69.
[16]RADFORD A,NARASIMHAN K,SALIMANS T,et al.Improving language understanding by generative pre-training[DB/OL].[2023-12-03].https://www.cs.ubc.ca/~amuham01/LING530/papers/radford2018improving.pdf.
[17]LAJBCYGIER P.Improving option pricing with the product constrained hybrid neural network[J].IEEE Transactions on Neural Networks,2004,15(2):465-476.
[18]LAJBCYGIER P R.Improving Option Pricing with the Product Constrained Hybrid Neural Network and Booting[D].Melbourne:Monash University,2021.
[19]張麗娟,張文勇.基于Heston模型和遺傳算法優(yōu)化的混合神經(jīng)網(wǎng)絡(luò)期權(quán)定價(jià)研究[J].管理工程學(xué)報(bào),2018,32(3):142-149.
ZHANG Lijuan,ZHANG Wenyong.Option pricing model by applying hybrid neural network based on Heston modeland genetic algorithm[J].Jonrnal of Industrial Engineering/Engineering LEtG/5P7shSXSxdHqtj/7Q==Management,2018,32(3):142-149.
[20]張鴻彥,林輝.應(yīng)用混合小波神經(jīng)網(wǎng)絡(luò)和遺傳算法在香港衍生品市場(chǎng)上的研究[J].系統(tǒng)管理學(xué)報(bào),2008,17(1):25-31.
ZHANG Hongyan,LIN Hui.Study on Hong Kong derivative market by applying hybrid wavelet neural network and genetic algorithm[J].Journal of Systems & Management,2008,17(1):25-31.
[21]張鴻彥,林輝.基于小波神經(jīng)網(wǎng)絡(luò)的期權(quán)定價(jià)模型[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2007,37(4):716-720.
uGM/ZzIt19+A9zFXrWTD7w==ZHANG Hongyan,LIN Hui.Option pricing models based on wavelet neural network[J].Journal of Southeast University(Natural Science Edition),2007,37(4):716-720.
[22]孫有發(fā),邱梓杰,姚宇航,等.基于深度學(xué)習(xí)算法的行為期權(quán)定價(jià)[J].系統(tǒng)管理學(xué)報(bào),2021,30(4):697-708.
SUN Youfa,QIU Zijie,YAO Yuhang,et al.Behavioral option pricing based on Deep-Learning algorithm[J].Journal of Systems & Management,2021,30(4):697-708.
[23]ROSS S A.Options and efficiency[J].The Quarterly Journal of Economics,1976,90(1):75-89.
[24]COX J C,ROSS S A.The valuation of options for alternative stochastic processes[J].Journal of Financial Economics,1976,3(1/2):145-166.
[25]ZHOU Haoyi,ZHANG Shanghang,PENG Jieqi,et al.Informer:Beyond efficient transformer for long sequence time-series forecasting[C]//Proceedings of the AAAI Conference on Artificial Intelligence.Menlo Park:AAAI,2021:11106-11115.
[26]KINGMA D P,BAJ.Adam:A method for stochastic optimization[DB/OL].(2017-01-30)[2023-12-03].https://arxiv.org/abs/1412.6980.