余昊 劉偉豪 黃炎 鄒劉磊 褚朝奕 周天樂(lè)
摘 ? ?要: 針對(duì)金融時(shí)間序列的預(yù)測(cè)問(wèn)題,提出了一種結(jié)合機(jī)器學(xué)習(xí)方法與統(tǒng)計(jì)學(xué)方法的綜合預(yù)測(cè)評(píng)判模型。該模型通過(guò)使用多重分形消除波動(dòng)趨勢(shì)分析法(MF-DFA),分析目標(biāo)金融時(shí)序的多重分型性與記憶性,計(jì)算目標(biāo)時(shí)序的Hurst指數(shù),并在Hurst指數(shù)的指導(dǎo)下,采用自適應(yīng)模糊推理神經(jīng)網(wǎng)絡(luò)對(duì)目標(biāo)金融時(shí)序的趨勢(shì)進(jìn)行短期預(yù)測(cè)。使用上證指數(shù)、恒生指數(shù)、銅期貨與黃金期貨這四個(gè)具有代表性的金融時(shí)序驗(yàn)證了該模型。結(jié)果證實(shí),該模型相較于單純的專家系統(tǒng)或機(jī)器學(xué)習(xí)模型,能更好地對(duì)金融時(shí)序進(jìn)行建模與短期趨勢(shì)預(yù)測(cè),并對(duì)預(yù)測(cè)結(jié)果給出合理解釋。
關(guān)鍵詞: 金融時(shí)間序列預(yù)測(cè);機(jī)器學(xué)習(xí);多重分形消除波動(dòng)趨勢(shì)分析法;Hurst指數(shù);自適應(yīng)神經(jīng)模糊推理系統(tǒng)
中圖分類號(hào):TP183? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A ? ? ? ? ? ? 文章編號(hào):2095-7394(2020)02-0039-06
有研究表明,金融市場(chǎng)像是一個(gè)混沌的、復(fù)雜的動(dòng)力學(xué)系統(tǒng),展現(xiàn)出多重分形性與混沌性等特征[1]。在針對(duì)金融市場(chǎng)的研究中,現(xiàn)階段國(guó)內(nèi)外學(xué)者普遍傾向于研究金融時(shí)序本身的變化規(guī)律[2-4],主要是改進(jìn)并使用機(jī)器學(xué)習(xí)方法對(duì)其短期趨勢(shì)進(jìn)行預(yù)測(cè),或是使用一系列專家系統(tǒng)對(duì)特定領(lǐng)域的金融時(shí)序進(jìn)行建模與預(yù)測(cè)。這些研究的確可以在現(xiàn)有數(shù)據(jù)的基礎(chǔ)上,對(duì)金融時(shí)序進(jìn)行有效的擬合,但由于缺乏對(duì)金融時(shí)序混沌性與多重分形性質(zhì)的研究,因此,難以對(duì)具體金融時(shí)序進(jìn)行可預(yù)測(cè)性解釋。
針對(duì)上述問(wèn)題,筆者嘗試提出一種能對(duì)金融時(shí)序的可預(yù)測(cè)性進(jìn)行量化分析,并在此基礎(chǔ)上預(yù)測(cè)其短期趨勢(shì)的綜合預(yù)測(cè)評(píng)判模型。該模型通過(guò)使用多重分形消除波動(dòng)趨勢(shì)分析法(MF-DFA)對(duì)目標(biāo)金融時(shí)序進(jìn)行建模分析,計(jì)算目標(biāo)金融時(shí)序的Hurst指數(shù)序列,以分析其內(nèi)在的混沌性質(zhì)。在Husrt指數(shù)的指導(dǎo)下,該模型可以判斷特定的金融時(shí)序是否可以在一定范圍內(nèi)被預(yù)測(cè),如果預(yù)測(cè)是可行的,再進(jìn)一步對(duì)其建模和預(yù)測(cè)。
在針對(duì)時(shí)間序列的預(yù)測(cè)研究中,研究者們廣泛運(yùn)用了神經(jīng)網(wǎng)絡(luò)、模糊邏輯系統(tǒng)、遺傳算法等預(yù)測(cè)模型[3-4],但是,金融時(shí)間序列相較于水流變化、音頻信號(hào)等其他自然時(shí)間序列,展現(xiàn)出更強(qiáng)的波動(dòng)性與隨機(jī)性[5],難以使用單一模型描述其運(yùn)動(dòng)規(guī)律。自適應(yīng)神經(jīng)模糊推理系統(tǒng)(ANFIS)[6]作為一種結(jié)合了神經(jīng)網(wǎng)絡(luò)與模糊邏輯的混合模型,自提出后被廣泛運(yùn)用于預(yù)測(cè)非線性混沌時(shí)間序列,相較于傳統(tǒng)的人工智能算法與專家系統(tǒng)有更好的表現(xiàn)[7-8]。本文采用誤差衡量與下降算法對(duì)ANFIS網(wǎng)絡(luò)進(jìn)行改進(jìn),并將其運(yùn)用于短期趨勢(shì)預(yù)測(cè)模塊,對(duì)具有記憶性特征的金融時(shí)序進(jìn)行短期趨勢(shì)預(yù)測(cè)。
1 ? 試驗(yàn)方法
1.1 多重分形消除波動(dòng)趨勢(shì)分析法(MF-DFA)
研究采用MF-DFA計(jì)算Hurst指數(shù)。MF-DFA是一種非平穩(wěn)時(shí)間序列的多重分形表征方法,廣義上由五個(gè)步驟組成,前三步與傳統(tǒng)的DFA方法一致。MF-DFA的后兩步通過(guò)將時(shí)間序列當(dāng)成一維帶值結(jié)構(gòu),并分析此種結(jié)構(gòu)所附帶的值延伸出的多重分形性,以達(dá)到更嚴(yán)謹(jǐn)?shù)胤治鼋鹑跁r(shí)序中存在的多重分形性的目的。
假設(shè)有一個(gè)時(shí)間序列[Xk],長(zhǎng)度為[N],不考慮[Xk=0]點(diǎn)的意義。
Step 1: 決定時(shí)間序列的輪廓[Yi],
[Yi≡k=1ixk-x, ? ? ?i=1,...,N], ? ? ?(1)
[Yi≡k=1iYk-Y, ? ? ?i=1,...,N,] ? ? ? ? ? ?(2)
[x]為時(shí)間序列[Xk]的平均數(shù)。
Step 2: 將時(shí)間序列的輪廓[Yi]切分為長(zhǎng)度均為[s]的非重疊段,
[Ns≡intNs。] ? ? ? ? ? ? ?(3)
Step 3 : 使用最小二乘法分別計(jì)算每個(gè)切分段[Ns]的局部趨勢(shì)與每段[Ns]的方差,
[F2v,s≡1si=1sYv-1s+i-yvi2v=1,...,Ns,] ? ? ?(4)
[F2v,s≡1si=1sYN-v-Nss+i-yvi2v=Ns+1,...,2Ns。] (5)
Step 4 : 計(jì)算[q]的波動(dòng)性方程
[Fqs≡12Nsv=12NsF2v,sq21q。] ? ? ?(6)
波動(dòng)性方程[Fqs]的值與時(shí)間尺度[s]和擬合多項(xiàng)式階數(shù)[m]成正比,且[s≥m+2]。
Step 5: 計(jì)算廣義Hurst指數(shù)[hq]
[Fqs?shq=shq+1。] ? ? ? ? ? ? ? ? ? ? (7)
1.2 自適應(yīng)神經(jīng)模糊推理系統(tǒng)
自適應(yīng)神經(jīng)模糊推理系統(tǒng)(Adaptive Network-based Fuzzy Inference System)簡(jiǎn)稱ANFIS,是一種采用Takagi-Sugeon模糊推理模型,并結(jié)合模糊邏輯與神經(jīng)網(wǎng)絡(luò)的模糊推理系統(tǒng)[6]。ANFIS模型由模糊邏輯if-then規(guī)則與輸入輸出對(duì)組成,并使用神經(jīng)網(wǎng)絡(luò)進(jìn)行誤差下降學(xué)習(xí)。假設(shè)使用兩個(gè)輸入變量[x1],[x2],一個(gè)輸出變量[z],三個(gè)線性輸出參數(shù)[p],[q],[r]構(gòu)建模型,則對(duì)于一階Sugeno模糊模型,廣義上基于模糊if-then規(guī)則的規(guī)則集合可以表示為:
[if x1 is A1 and x2 is B1 thenf1=p1x1+q1x2+r1]。 ? ?(8)
ANFIS的具體網(wǎng)絡(luò)結(jié)構(gòu)如下。
第一層(Layer-1):此層每個(gè)節(jié)點(diǎn)[i]代表一段關(guān)于[Ai]與[Bi]的隸屬度函數(shù)[O1,i]。其中[x1],[x2]為每個(gè)節(jié)點(diǎn)[i]的輸入值,[Ai]與[Bi]是輸入值的標(biāo)簽。
[O1,i=μAix1, for i=1,2 ?O1,i=μBi-2x2, for i=3,4。] ? ? ? (9)
使用式(10)初始化隸屬度函數(shù)[O1,i],加入初始化參數(shù)[ai],[ci]生成初始值介于[0,1]的鐘形分布。
[μAix1,μBi-2x2=exp-xi-ci/ai2]。 ? (10)
第二層(Layer-2):此層每個(gè)節(jié)點(diǎn)代表一段關(guān)于輸入值函數(shù)[μAix1]與[μBi-2x2]相乘的公式。函數(shù)如式(11)所示,意義為將接受到的信號(hào)相乘轉(zhuǎn)化為輸出信號(hào)[wi],并推送至下一個(gè)節(jié)點(diǎn)。此處輸出信號(hào)[wi]代表相應(yīng)節(jié)點(diǎn)的模糊規(guī)則觸發(fā)強(qiáng)度。
[O2,i=wi=μAix1?μBi-2x2, ?i=1,2,...,16]。 ?(11)
第三層(Layer-3):每個(gè)節(jié)點(diǎn)[i]分別計(jì)算相對(duì)應(yīng)模糊規(guī)則[i]的觸發(fā)強(qiáng)度[wi]與所有模糊規(guī)則[s]的觸發(fā)強(qiáng)度[wsum]之和的比值。
[O3,i=wi=wi/w1+w2+...+w16, ?i=1,2,...,16。](12)
第四層(Layer-4):每個(gè)節(jié)點(diǎn)代表節(jié)點(diǎn)函數(shù)(13)。其中,[wi]為第三層節(jié)點(diǎn)輸出的強(qiáng)度比值[wi],[pi,qi,ri]為線性輸出參數(shù)集。
[O4,i=wi?fi=wi?pix1+qix2+ri, ?i=1,2,...,16。](13)
第五層(Layer-5):此層節(jié)點(diǎn)代表一段求和函數(shù)(14),將所有輸入信號(hào)集求和并輸出。
[O5,i=overall ?output=iwifi=iwifiiwi]。 (14)
當(dāng)前研究階段,ANFIS模型通常采用最小二乘法衡量預(yù)測(cè)值與實(shí)際值之間的偏差,并在更新參數(shù)階段使用標(biāo)準(zhǔn)梯度下降法作為優(yōu)化算誤差算法。筆者采用更適用于混沌數(shù)據(jù)的Huber loss損失函數(shù)代替最小二乘法,并使用Adam下降法(Adaptive Moment Estimation Optimizer)[9]代替標(biāo)準(zhǔn)梯度下降法進(jìn)行誤差下降優(yōu)化。
Huber loss函數(shù)(15)證實(shí)可以在數(shù)據(jù)大幅波動(dòng)下增加平方損失誤差(MSE)對(duì)離群點(diǎn)的魯棒性。其主要思路為使用一個(gè)評(píng)判偏差[δ],當(dāng)預(yù)測(cè)偏差大于[δ]時(shí)使用平方誤差計(jì)算損失;當(dāng)預(yù)測(cè)偏差小于[δ]時(shí)使用線性誤差計(jì)算損失。
[Lδa=12a2, ? ? ? ? ? ? ?fora≤δ, ?δ?a-12δ,other wise ?。] ?(15)
Adam下降算法(16)全稱為自適應(yīng)動(dòng)量估計(jì)下降法,是一種對(duì)RMS算法改進(jìn)的動(dòng)量下降法,其利用梯度的一階與二階的矩估計(jì)在每次迭代中動(dòng)態(tài)地調(diào)整參數(shù)的學(xué)習(xí)率。因?yàn)樵谡{(diào)整的過(guò)程中限制學(xué)習(xí)率的跳動(dòng)范圍,故參數(shù)可以很平穩(wěn)地更新,以減少誤差下降過(guò)程中的震蕩。式(16)中[m],[v]分別為一階,二階矩估計(jì),[mt],[vt]函數(shù)矯正估計(jì)范圍,用以實(shí)現(xiàn)無(wú)偏估計(jì)。
[mt=β1mt-1+1-β1gtvt=β2vt-1+1-β2g2tmt=mt1-βt1, ?vt=vt1-βt2Wt+1=Wt-ηvt+εmt。] ? ? ? ? ? (16)
2 試驗(yàn)結(jié)果與分析
試驗(yàn)整體流程如圖1所示。先將收集到的樣本時(shí)序放入MF-DFA模型中計(jì)算Hurst指數(shù),根據(jù)Hurst指數(shù)的意義[10],若其滿足平均值大于0.55,且最小值下探不低于0.40,則樣本時(shí)序具有較高的記憶性。當(dāng)判斷出樣本時(shí)序具有可預(yù)測(cè)性后,再將數(shù)據(jù)標(biāo)準(zhǔn)化預(yù)處理,劃分訓(xùn)練和測(cè)試樣本,并將樣本數(shù)據(jù)輸入ANFIS模型進(jìn)行學(xué)習(xí)與預(yù)測(cè)。
2.1 試驗(yàn)數(shù)據(jù)描述
本文所使用的四個(gè)金融時(shí)間序列分別為:上證指數(shù)(SSE)、黃金期貨(GCG)、恒生指數(shù)(SHI)、銅期貨(HGH)。試驗(yàn)數(shù)據(jù)來(lái)自英為財(cái)情(investing)網(wǎng)站中開(kāi)源的價(jià)格時(shí)間序列,并采用自2000年1月1日至2020年1月1日交易月的每月收盤價(jià)格作為數(shù)據(jù)樣本。
2.2 計(jì)算廣義Hurst指數(shù)
多重分形分析法(MF)是一種分析在不同的時(shí)間尺度下時(shí)序波動(dòng)性變化的分析算法。因此,該算法只需使用原始的時(shí)間序列,即本文中使用的四種不同樣本的每月收盤價(jià)格時(shí)間序列,無(wú)須再對(duì)時(shí)間序列進(jìn)行對(duì)數(shù)坐標(biāo)變換等數(shù)據(jù)處理。
在Python環(huán)境中構(gòu)建MF-DFA濾波計(jì)算Hurst指數(shù),將四種一維金融時(shí)序數(shù)據(jù)輸入MF-DFA模型,得到的Hurst指數(shù)如圖2所示。
分析圖2中四種金融時(shí)序的Hurst指數(shù)序列可以得出,四種時(shí)間序列的Hurst指數(shù)均值均高于0.5,說(shuō)明這四種不同的混沌動(dòng)力學(xué)系統(tǒng)都具有一定程度的記憶性,即都具有可預(yù)測(cè)性。其中,黃金期貨(GCG)與銅期貨(HGH)的Hurst指數(shù)最低值下探到了0.42左右,均沒(méi)有低于0.4;恒生指數(shù)與上證指數(shù)的Hurst指數(shù)波動(dòng)均沒(méi)有低于0.5。分別分析四種金融時(shí)序的波動(dòng)最低值,可以得出相較于銅期貨與黃金期貨,恒生指數(shù)與上證指數(shù)的Hurst指數(shù)波動(dòng)值較高,即兩種指數(shù)時(shí)序的記憶性要高于兩種期貨時(shí)序。通過(guò)本階段的試驗(yàn)可以得出以下結(jié)論。
(1)選取的四種金融時(shí)序都具有不同程度上的可預(yù)測(cè)性。
(2)上證指數(shù)與恒生指數(shù)的可預(yù)測(cè)性要高于銅期貨與黃金期貨。
2.3 使用ANFIS對(duì)金融時(shí)間序列進(jìn)行預(yù)測(cè)仿真
以上四種時(shí)序在通過(guò)預(yù)測(cè)評(píng)判后,進(jìn)入預(yù)測(cè)仿真階段。在不改變?cè)械募僭O(shè)分布基礎(chǔ)上,使用離差標(biāo)準(zhǔn)化(Min-Max Normalization) (17)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。其意義為將所有初始數(shù)據(jù)進(jìn)行線性變換,映射到(0,1)區(qū)間內(nèi)。
[x?=x-minmax-min] 。 ? ? ? ? ? ? ? ? ? (17)
通過(guò)將數(shù)據(jù)標(biāo)準(zhǔn)化,在訓(xùn)練時(shí)可以消除數(shù)據(jù)波動(dòng)較大對(duì)訓(xùn)練與數(shù)據(jù)降維效果的影響,并防止神經(jīng)元過(guò)早梯度飽和。
將標(biāo)準(zhǔn)化后的時(shí)間序列數(shù)據(jù)輸入ANFIS模型中進(jìn)行預(yù)測(cè)學(xué)習(xí)。預(yù)測(cè)結(jié)果如圖3所示,訓(xùn)練誤差與測(cè)試誤差如表1所示。圖3中虛線是預(yù)測(cè)值曲線,實(shí)線是真實(shí)值曲線,前70%為訓(xùn)練樣本,后30%為預(yù)測(cè)結(jié)果??梢钥闯觯m然四條時(shí)序前后的波動(dòng)性較大,但是由于其均具有一定的記憶性,因此都在預(yù)測(cè)仿真階段中有較好的表現(xiàn)。分析誤差表可知:對(duì)于在Hurst指數(shù)中表現(xiàn)出較高記憶性的恒生指數(shù)(HSI)與上證指數(shù)(SSE),其訓(xùn)練與測(cè)試誤差在實(shí)驗(yàn)中均優(yōu)于表現(xiàn)出較低記憶性的銅期貨(HGH)與黃金期貨(GCG),進(jìn)一步證實(shí)了筆者的猜想:對(duì)于記憶性更高的時(shí)間序列,預(yù)測(cè)的成功率與精度也越高,即在金融時(shí)序的預(yù)測(cè)工作中可以通過(guò)計(jì)算并分析特定時(shí)序Hurst指數(shù)來(lái)解釋其預(yù)測(cè)結(jié)果的優(yōu)劣。
3 結(jié)論
從分形市場(chǎng)假說(shuō)的角度出發(fā),提出了一種結(jié)合MF-DFA分析法與ANFIS神經(jīng)網(wǎng)絡(luò)的綜合預(yù)測(cè)評(píng)判模型,并使用上證指數(shù)、恒生指數(shù)、黃金期貨與銅期貨這四種具有代表性的金融時(shí)序,驗(yàn)證了該模型的有效性。
在模型中首先通過(guò)計(jì)算并分析四種金融時(shí)序的廣義Hurst指數(shù),證實(shí)了這四種金融時(shí)序都具有不同程度上的記憶性特征,再分別對(duì)四種金融時(shí)序進(jìn)行預(yù)測(cè)仿真。在仿真試驗(yàn)中,預(yù)測(cè)結(jié)果顯示改進(jìn)的ANFIS表現(xiàn)突出,最好預(yù)測(cè)精度在94.6%左右,同時(shí),預(yù)測(cè)仿真的結(jié)果也體現(xiàn)出由不同時(shí)序所擁有的記憶性差異而導(dǎo)致的預(yù)測(cè)精度差異,即記憶性較高的兩種指數(shù)類金融時(shí)序(恒生指數(shù)、上證指數(shù))的預(yù)測(cè)評(píng)判指標(biāo)顯著優(yōu)于記憶性較低的兩種期貨類金融時(shí)序(銅期貨、黃金期貨)。
本研究證實(shí)了某些金融時(shí)間序列的確擁有長(zhǎng)期歷史記憶性與可預(yù)測(cè)性,Hurst指數(shù)作為衡量市場(chǎng)記憶性高低的指標(biāo)可以用于金融時(shí)序的短期趨勢(shì)預(yù)測(cè),并對(duì)預(yù)測(cè)結(jié)果給出合理的解釋。在今后的研究課題中,需要更進(jìn)一步對(duì)金融市場(chǎng)的混沌性與周期性進(jìn)行量化分析,開(kāi)展金融時(shí)序的混沌動(dòng)力學(xué)模型構(gòu)建,以及相空間重構(gòu)吸引子等工作。
參考文獻(xiàn):
[1] KANTELHARDT J W, ZSCHIEGNER S A, KOSCIELNY-BUNDE E S, et al. Multifractal detrended fluctuation analysis of nonstationary time series[J]. Physica A: Statistical Mechanics and its Applications, 2002, 316(1/2/3/4): 87.
[2] 陳亞男, 薛雷. 基于 Bagging-SVM 的股票趨勢(shì)預(yù)測(cè)技術(shù)[J]. 電子測(cè)量技術(shù), 2019 (14): 58-62.
[3] 姚小強(qiáng), 侯志森. 基于樹(shù)結(jié)構(gòu)長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)的金融時(shí)間序列預(yù)測(cè)[J]. 計(jì)算機(jī)應(yīng)用, 2018,38(11): 3336-3341.
[4] ZHOU T, GAO S, WANG J, et al. Financial time series prediction using a dendritic neuron model[J]. Knowledge-Based Systems, 2016, 105: 214-224.
[5] ZHANG W, WANG J. Nonlinear stochastic exclusion financial dynamics modeling and complexity behaviors[J].Nonlinear Dynamics, 2017, 88(2): 921-935.
[6] JANG J S R. ANFIS: adaptive-network-based fuzzy inference system[J]. IEEE transactions on systems, man and cybernetics, 1993, 23(3): 665-685.
[7] BOYACIOGLU M A, AVCI D. An adaptive network-based fuzzy inference system (ANFIS) for the prediction of stock market return: the case of the Istanbul stock exchange[J]. Expert Systems with Applications, 2010, 37(12): 7908-7912
[8] 史東輝. 改進(jìn)的 ANFIS 在房產(chǎn)評(píng)估中的應(yīng)用[J]. 計(jì)算機(jī)工程與應(yīng)用, 2014 (12): 247-251.
[9] KINGMA ?D,BA J. Adam: A method for stochastic optimization[J]. arXiv,2014:1412.6980.
[10] PENG C K, BULDYREV S V, HAVLIN S, et al. Mosaic organization of DNA nucleotides[J]. Physical review E, 1994, 49(2): 1685-1689.
責(zé)任編輯 ? ?祁秀春
Research on Financial Time Series Forecasting Technology Based on Multifractal Analysis and Fuzzy Neural Network
YU Hao1,LIU Weihao1,HUANG Yan1,ZOU Liulei1,CHU Chaoyi2,ZHOU Tianle1
(1. School of Computer Engineering,Jiangsu University of Technology,Changzhou 213001,China;2. Library,Jiangsu University of Technology,Changzhou 213001,China)
Abstract: Aiming at the prediction problem of financial time series,this paper proposes a comprehensive forecasting evaluation model combining machine learning methods and statistical methods. The model analyzes the multi-type and memory of the target financial time series by using the multi-fractal elimination volatility trend analysis method (MF-DFA),and calculates the Hurst index of the target time series. Under the guidance of the Hurst index,the adaptive fuzzy inference neural network is used to predict the trend of the target financial time series in the short term. This article uses the Shanghai Stock Index,Hang Seng Index,copper futures and gold futures to represent the correctness of the model. The experimental results confirm that the model can better model financial time series and short-term trend prediction than the expert system or machine learning model,and give a reasonable explanation of the prediction results.
Key ?words:financial time series forecasting;machine learning;multifractal wave elimination trend analysis method;Hurst index;adaptive neural fuzzy inference system
收稿日期:2020-01-09
基金項(xiàng)目:2019年江蘇省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目“基于Real-Time Path Tracing與Reinforcement Learning的在物 ? ? ? ? ? ? ? ? ? ? ? ? ? ?理仿真下的海洋探索系統(tǒng)”(201911463007Z)
作者簡(jiǎn)介:余昊,本科生,主要研究方向?yàn)槿斯ぶ悄? 劉偉豪,本科生,主要研究方向?yàn)槿斯ぶ悄堋?/p>
指導(dǎo)教師:周天樂(lè),講師,博士,主要研究方向?yàn)槿斯ぶ悄堋?/p>