陳黎明,龍靈芝,鄭千一
(湖南大學(xué) 金融與統(tǒng)計學(xué)院, 湖南 長沙 410079)
匯率作為國家間貨幣兌換的比率,是國際貿(mào)易中不可或缺的重要組成部分,也是各國調(diào)節(jié)國際收支的重要手段之一。國家間的匯率大幅波動一方面會對貿(mào)易收支、經(jīng)濟(jì)增長和國際資本流動等宏觀層面有重要影響;另一方面,對貨幣流通、物價水平和資源配置等微觀層面也有廣泛影響。自2005年人民幣匯率制度再次改革以來,中國資本賬戶進(jìn)一步開放,加速了人民幣國際化進(jìn)程,人民幣逐漸成為與中國有密切經(jīng)濟(jì)往來國家的“貨幣錨”[1]。人民幣匯率走勢將影響經(jīng)濟(jì)主體預(yù)期,進(jìn)而影響經(jīng)濟(jì)決策行為,若能對人民幣匯率未來走勢進(jìn)行更為準(zhǔn)確、合理的預(yù)測分析,將對微觀主體的經(jīng)貿(mào)活動、投融資決策和宏觀經(jīng)濟(jì)的長期運行與調(diào)控具有重要現(xiàn)實意義。而匯率序列受外生因素的影響較大,波動特征呈現(xiàn)出明顯的非線性、非平穩(wěn)性和高噪聲等特點,選取傳統(tǒng)的時間序列分析方法往往具有較大的預(yù)測誤差,難以準(zhǔn)確捕捉匯率波動特征。因此,選取合適的模型對匯率進(jìn)行準(zhǔn)確預(yù)測一直是經(jīng)濟(jì)學(xué)領(lǐng)域需要深入研究的熱點問題。
國內(nèi)外專家學(xué)者就匯率預(yù)測問題展開了廣泛討論和深入研究。早期的匯率預(yù)測主要利用單模型對匯率波動特征和波動趨勢進(jìn)行研究,其中具有代表性的有:Alex等利用雙狀態(tài)馬爾科夫隨機(jī)模型對美元匯率進(jìn)行預(yù)測分析,實證結(jié)果表明相對于隨機(jī)游走模型,該隨機(jī)模型在匯率預(yù)測方面具有更為優(yōu)良的性質(zhì)[2]。余菊以2006年至2013年的1 771個人民幣匯率日值高頻數(shù)據(jù)為樣本區(qū)間,創(chuàng)建GARCH模型對人民幣與美元、港幣、日元、歐元及英鎊之間的匯率波動規(guī)律進(jìn)行實證分析,實證結(jié)果表明人民幣兌五大外匯幣種匯率的波動具有長記憶性和明顯的杠桿效應(yīng)[3]。鄧貴川等選取5種模型對2005年匯改后的人民幣兌美元、歐元、日元和英鎊4種主要國際匯率數(shù)據(jù)進(jìn)行樣本內(nèi)模型擬合,再利用模型對匯率預(yù)期進(jìn)行外推預(yù)測,研究發(fā)現(xiàn),相較于其他匯率預(yù)測模型,匯率基本面模型的綜合分析和預(yù)測能力更佳[4]。Ince等利用泰勒修正模型和傳統(tǒng)貨幣模型對美元兌人民幣、歐元等8種外匯數(shù)據(jù)進(jìn)行了對比和綜合分析,研究結(jié)果表明,泰勒修正模型預(yù)測精度較高[5]。江春等也基于拓展泰勒模型對影響匯率的因素進(jìn)行分析,研究結(jié)果表明拓展的泰勒規(guī)則匯率模型對中國短期貨幣政策的傳導(dǎo)和實施具有較強(qiáng)的理論解釋力[6]。王全意等基于傳統(tǒng)的M—F模型,以11個國家2000—2016年的相關(guān)數(shù)據(jù)為樣本,實證分析人民幣匯率變動與國際收支的關(guān)系,研究結(jié)果表明實際有效匯率可有效調(diào)節(jié)經(jīng)常賬戶和資本與金融賬戶[7]。Cheung等將影子利率、風(fēng)險及流動性因素納入基于生產(chǎn)率的模型和“行為均衡匯率”模型中,并將這些模型的外推預(yù)測性能與隨機(jī)可變窗口游走模型進(jìn)行了比較,實證結(jié)果表明隨機(jī)游走模型預(yù)測效果稍差[8]。李欣玨等構(gòu)建了多元自適應(yīng)可變窗算法,探測了匯率樣本外推預(yù)測模型的最大化參數(shù)同質(zhì)區(qū)間,實證結(jié)果表明,在中長期(3個月至24個月)的美元、歐元、英鎊和日元兌人民幣匯率的樣本外推預(yù)測中,多元自適應(yīng)可變窗算法能顯著優(yōu)于隨機(jī)游走模型、購買力平價模型等模型[9]。
隨著匯率研究進(jìn)一步深入,部分學(xué)者開始采取分解集成策略對匯率進(jìn)行分析,此外,由于神經(jīng)網(wǎng)絡(luò)(Neural Networks,簡稱NN)、支持向量機(jī)(Support Vector Machine,簡稱SVM)等機(jī)器學(xué)習(xí)方法具有較強(qiáng)的泛化能力,能夠有效處理非線性問題,因而近幾年來在匯率分析研究中得到廣泛應(yīng)用。王軒等采取先分解再綜合泛化分析后采用綜合集成的策略對人民幣匯率進(jìn)行實證分析,實證結(jié)果表明,基于支持向量回歸的TEI@I集成預(yù)測模型不僅適用于線性問題分析而且適用于非線性問題分析,對于線性特征和非線性特征共存的人民幣實際匯率也具有優(yōu)異的綜合分析能力[10]。王曉輝等基于獨立成分分析(ICA)與BP神經(jīng)網(wǎng)絡(luò)理論相融合的多維時間序列預(yù)測模型對2008年以來的多維人民幣匯率數(shù)據(jù)進(jìn)行預(yù)測,研究表明IC—BP神經(jīng)網(wǎng)絡(luò)具有較好的預(yù)測精度[11]。黃山等基于BP神經(jīng)網(wǎng)絡(luò)的隨機(jī)信號預(yù)測方法,以3種國際主要貨幣匯率的長期歷史價格數(shù)據(jù)作為參考,對未來匯率價格走勢進(jìn)行短期預(yù)測,研究結(jié)果表明BP神經(jīng)網(wǎng)絡(luò)模型對匯率價格的預(yù)測精度較高[12]。Furao等基于改進(jìn)的匯率預(yù)測深度信念網(wǎng)絡(luò)(DBN)模型對3個匯率序列進(jìn)行預(yù)測,實證表明,該方法在外匯匯率的預(yù)測方面,效果優(yōu)于前饋神經(jīng)網(wǎng)絡(luò)(FFNN)模型[13]。Galeshchuk基于人工神經(jīng)網(wǎng)絡(luò)(ANNs)模型,對匯率(USD/EUR,JPN/USD,USD/GBP)的面板數(shù)據(jù)進(jìn)行準(zhǔn)確預(yù)測,實證表明,人工神經(jīng)網(wǎng)絡(luò)模型在匯率預(yù)測問題上表現(xiàn)優(yōu)良[14]。Plakandaras等使用集成經(jīng)驗?zāi)B(tài)分解(EEMD)方法對原始匯率序列進(jìn)行分解得到各分量序列,然后選取具有不同參數(shù)的支持向量回歸機(jī)模型進(jìn)行預(yù)測,實證分析結(jié)果表明,與其他單預(yù)測模型預(yù)測能力相比,SVR組合模型具有更強(qiáng)的樣本內(nèi)和樣本外預(yù)測能力[15]。傅魁等分別利用單模型和MEEMD組合模型對歐元兌美元匯率序列進(jìn)行實證預(yù)測和分析,研究結(jié)果表明MEEMD組合模型比其他單模型和EMD組合模型的短期預(yù)測能力和預(yù)測精度更好[16]。周曉波等對人民幣匯率進(jìn)行短期預(yù)測研究發(fā)現(xiàn),GR_BP_Adaboost強(qiáng)預(yù)測模型相較于傳統(tǒng)的ARMA、ARCH 和 GARCH 模型來說,具有更為優(yōu)良的預(yù)測能力[17]。
綜上所述,伴隨匯率波動特征日趨復(fù)雜化,匯率預(yù)測模型逐漸從單一模型向組合模型轉(zhuǎn)變,機(jī)器學(xué)習(xí)算法在匯率預(yù)測模型中的應(yīng)用也日趨廣泛,但當(dāng)前文獻(xiàn)主要集中在同類模型對比分析,將傳統(tǒng)模型與機(jī)器學(xué)習(xí)算法優(yōu)勢相結(jié)合進(jìn)行匯率預(yù)測研究的文獻(xiàn)數(shù)量較少。因此,本文基于分解—重構(gòu)—集成思想,構(gòu)造CEEMDAN組合模型對人民幣匯率進(jìn)行預(yù)測。首先,利用CEEMDAN方法,將原始匯率序列分解為有限個本征模態(tài)分量(IMF)和一個殘余分量;然后基于灰色模糊聚類法對各時頻分量進(jìn)行重構(gòu),得到高頻項、低頻項和趨勢項,并選取不同的模型對重構(gòu)項進(jìn)行分析預(yù)測;最后,將各重構(gòu)項預(yù)測結(jié)果進(jìn)行集成,得到最終預(yù)測值。本文主要貢獻(xiàn)包括以下幾個:一是將目前在工程時頻分析中廣泛應(yīng)用的改進(jìn)時頻分析方法CEEMDAN引入經(jīng)濟(jì)分析領(lǐng)域,尤其是匯率預(yù)測方面,從頻域角度對匯率序列進(jìn)行分解,揭示匯率序列在不同尺度下的波動特征;二是利用序列動態(tài)聚類方法——灰色模糊聚類,對各分量進(jìn)行分類重構(gòu),從而得到高頻項、低頻項和趨勢項;三是將傳統(tǒng)時序模型ARIMA和機(jī)器算法(SVM、BP神經(jīng)網(wǎng)絡(luò))相結(jié)合,增強(qiáng)模型的泛化能力,有效降低模型預(yù)測誤差。
自適應(yīng)噪聲的完全集成經(jīng)驗?zāi)B(tài)分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,簡稱CEEMDAN)方法由Torres等在2011年率先提出[18]。CEEMDAN方法通過在經(jīng)驗?zāi)B(tài)分解的每個階段添加有限次的自適應(yīng)白噪聲,來降低重構(gòu)誤差和提高計算效率,有效解決了EMD方法中的模態(tài)混疊現(xiàn)象,還避免了EMMD方法計算量大和偽分量較多等問題,使得IMF分量的噪聲幅值有效減小。
CEEMDAN方法中得到的模態(tài)分量必須同時滿足兩個基本條件:(1)在函數(shù)的有效區(qū)間內(nèi),局部極值點數(shù)目和過零點的個數(shù)之間的零點個數(shù)差值為一;(2)在任何時候,局部最大值和最小值的包絡(luò)線必須為零。式中Ej(·)為未添加噪聲因子前分解原始信號得到的第j個模態(tài)分量,wi為滿足N(0,1)的高斯白噪聲,x(t)為待處理的原始信號。
具體步驟如下:
1) 在原始信號x(t)中加入具有不同零均值單位方差的白噪聲n(i)(t),得到信號混合體x(i)(t):
x(i)(t)=x(t)+n(i)(t)
(1)
其中,i為迭代次數(shù)i=1,2,…,m。
(2)
4) 重復(fù)步驟1)至步驟3)m次,可得第一個EEMD模態(tài)分量:
(3)
5) 在第一階段(k=1)計算第一個殘余分量:
r1(t)=x(t)-IMF1
(4)
6) 按照步驟2)至步驟5)分解每個r1(t)+ε1E1(wi(t)),(i=1,2,…,m),得到第一個CEEMDAN模態(tài)分量,定義第二個CEEMDAN模態(tài)分量為:
(5)
7) 對于k=2,3,…,m,計算第k個殘余分量:
rk(t)=rk-1(t)-IMFk
(6)
8) 按照步驟2)至步驟5)分解每個rk(t)+εkEk(wi(t)),(i=1,2,…,m),得到第k個CEEMDAN模態(tài)分量,定義第k+1個CEEMDAN模態(tài)分量為:
(7)
9) 對于k+1,返回步驟7),并重復(fù)步驟7)至步驟(9),直到殘余分量不滿足IMF分量的要求時停止分解,最終的殘余分量滿足:
(8)
其中,m為分解得到的模態(tài)分量個數(shù)。給定的待處理信號x(t)可表示為:
(9)
大量研究表明,匯率序列本質(zhì)上由一系列波幅不一致的分量序列構(gòu)成,這些序列分量大致可劃分為高頻項、低頻項和趨勢項三類,本文采用灰色模糊聚類法將關(guān)聯(lián)度高且周期和波動頻率相近的IMF分量合理地歸為一類,重構(gòu)高頻項和低頻項。
具體步驟如下:
1) 確定IMF分量的參考序列和比較序列
設(shè)定IMF分量的參考序列為ci(t),比較序列為cj(t),i=1,2,…,m;j=1,2,…,m,對各分量序列進(jìn)行初始化處理:
(10)
2) 計算IMF分量的灰色關(guān)聯(lián)系數(shù)和灰色關(guān)聯(lián)矩陣
灰色絕對關(guān)聯(lián)系數(shù)的含義是被評價對象與參考對象進(jìn)行絕對值比值比較,如果被評價對象與參考對象越接近,其絕對關(guān)聯(lián)系數(shù)越接近1;反之,絕對關(guān)聯(lián)系數(shù)越接近0?;疑^對關(guān)聯(lián)系數(shù)表達(dá)式為:
(11)
α為分辨系數(shù),0≤α≤1,一般取α=0.5。
關(guān)聯(lián)度是衡量一個采樣子系統(tǒng)中兩個因素或兩個變量之間相似程度或接近程度的大小,一般通過計算各采樣節(jié)點的算術(shù)平均數(shù)來衡量灰色關(guān)聯(lián)度,但這樣可能直接造成關(guān)聯(lián)度信息的損失和影響局部點的關(guān)聯(lián)序列測度值,從而影響整個灰色關(guān)聯(lián)序列。本文借助灰色關(guān)聯(lián)熵定理,利用熵值法賦予不同權(quán)重,加權(quán)計算關(guān)聯(lián)度,具體表達(dá)式如下:
(12)
3) 構(gòu)建模糊等價矩陣
基于步驟2)可得灰色關(guān)聯(lián)矩陣,然后采用歐式距離法構(gòu)造模糊相似矩陣Rm,再利用傳遞閉包法求解模糊等價矩陣。
傳遞閉包法必須滿足以下3個條件:
①tc(R)是傳遞的;
②tc(R)?R;
③ 對于任何可傳遞的關(guān)系矩陣R′,存在R′?R,則tc(R′)?R。
4) 重構(gòu)序列
根據(jù)模糊等價矩陣進(jìn)行動態(tài)聚類,同時將IMF分量的波動頻率和波動周期性納入分析體系并選取合適的分類閥值,從而將IMF分量自然而然地劃分成高頻部分和低頻部分,再將兩者分別進(jìn)行重構(gòu)得到高頻項和低頻項。
鑒于高頻項、低頻項和趨勢項是由不同頻度的分量重構(gòu)得到的,所以三者的波動特征呈現(xiàn)顯著差異,因而需要采用不同的方法對序列進(jìn)行準(zhǔn)確預(yù)測。BP神經(jīng)網(wǎng)絡(luò)具有多層前饋網(wǎng)絡(luò),在訓(xùn)練過程中,以誤差為依據(jù)進(jìn)行反向傳播算法訓(xùn)練。一般利用梯度下降算法進(jìn)行樣本訓(xùn)練,這種方法跟糾錯學(xué)習(xí)規(guī)則比較接近,權(quán)值在性能函數(shù)梯度的反方向進(jìn)行迭代,能夠進(jìn)行各種非線性映射,并以任意精度接近任意非線性反方向傳播函數(shù),處理高頻數(shù)據(jù)在性能上具有顯著優(yōu)勢,因此運用BP神經(jīng)網(wǎng)絡(luò)對高頻項進(jìn)行分析預(yù)測。支持向量機(jī)(SVM)是一種基于數(shù)據(jù)結(jié)構(gòu)風(fēng)險最小化原則的非線性映射和回歸方法,本質(zhì)上是將低維空間的非線性問題投射到高維特征空間,將非線性問題轉(zhuǎn)化為線性問題,然后再利用線性方法進(jìn)行分析。大量文獻(xiàn)表明,SVM方法在低頻項的非線性預(yù)測和分析能力問題上呈現(xiàn)出較為優(yōu)良的性質(zhì),故SVM方法成為對低頻項進(jìn)行分析預(yù)測的不二選擇。趨勢項波動較為平緩,呈現(xiàn)出較為顯著的線性特征,故選取ARIMA模型進(jìn)行分析預(yù)測。下面對BP神經(jīng)網(wǎng)絡(luò)、SVM方法和ARIMA模型做進(jìn)一步闡述:
1.BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)(Back-ProPagation Network)又稱反向傳播神經(jīng)網(wǎng)絡(luò), 由Rumelhart等[19]率先研究提出,是對非線性可微函數(shù)進(jìn)行權(quán)值模擬訓(xùn)練的多層神經(jīng)網(wǎng)絡(luò)。該輸出預(yù)測算法中數(shù)據(jù)信息參量前向反饋傳輸,而數(shù)據(jù)運算誤差反向傳遞。學(xué)習(xí)過程中采用最速梯度下降法,即各層函數(shù)的權(quán)值根據(jù)誤差函數(shù)的負(fù)梯度方向迭代更新,直到誤差項足夠小,故本文選用BP神經(jīng)網(wǎng)絡(luò)模型對高頻項的復(fù)雜性進(jìn)行擬合預(yù)測?;跇颖緮?shù)據(jù)本身的波動特征和區(qū)間特點,本文選取的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為4-4-1。神經(jīng)網(wǎng)絡(luò)模型中傳遞函數(shù)為Tansig,訓(xùn)練函數(shù)為Trainlm,權(quán)重和閥值的系統(tǒng)性學(xué)習(xí)算法以及性能函數(shù)分別為Learngdm和Mse。此外,模型的目標(biāo)誤差設(shè)定為1×10-6,最大迭代次數(shù)設(shè)定為1 000次。具體訓(xùn)練過程如圖1所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)算法訓(xùn)練過程
2.SVM方法
SVM(Support Vector Machine,簡稱 SVM)方法最初由Vapnik[20]提出,算法在學(xué)習(xí)過程中以結(jié)構(gòu)化風(fēng)險最小為準(zhǔn)則。對于低維空間線性不可分情況,SVM使用內(nèi)機(jī)核函數(shù)將低維空間線性不可分的樣本投射到高維空間使其線性可分。低頻項的波動頻率雖然較低,但仍具有明顯的非線性特征,利用一般的多項式進(jìn)行擬合得到的模型誤差大且效率較低。而利用SVM對樣本進(jìn)行訓(xùn)練,可大大提升運算效率。此外,SVM能夠有效克服過擬合的問題,泛化能力強(qiáng)。
核函數(shù)作為SVM方法的核心,是決定算法性質(zhì)優(yōu)劣的關(guān)鍵部分。常用核函數(shù)有多項式核函數(shù)、徑向基核函數(shù)、線性核函數(shù)。其中,徑向基核函數(shù)屬于非線性映射的核函數(shù),且通常只有一個需要進(jìn)行合理調(diào)整的參數(shù)s(核寬度),故只需要合理地選擇錯誤代價參數(shù)便可用于任意分布的樣本。本文采用徑向基核函數(shù)對低頻項進(jìn)行處理和分析預(yù)測。
3.ARIMA模型
ARIMA(Autoregressive Integrated Moving Average Model,簡稱ARIMA)模型由美國統(tǒng)計學(xué)家Box G E P和英國統(tǒng)計學(xué)家Jenkins G M于1970年提出[21]。ARIMA模型的核心步驟是差分運算,借此實現(xiàn)非平穩(wěn)時間序列的平穩(wěn)化過程,再建立模型進(jìn)行分析預(yù)測。模型ARIMA(p,d,q)基本結(jié)構(gòu)如下:
(13)
其中,p為模型的自回歸階數(shù),d為數(shù)據(jù)的差分次數(shù),q為移動平均階數(shù),Θ(B)是移動平滑系數(shù)多項式,φ(B)是自回歸系數(shù)多項式,▽d=(1-B)d,{εt}是零均值白噪聲序列。
4.CEEMDAN組合模型創(chuàng)建
基于分解—重構(gòu)—集成策略,CEEMDAN組合模型的創(chuàng)建過程大致可以分為3步:一是利用CEEMDAN方法對匯率原始序列進(jìn)行有效分解,得到有限個IMF分量和一個殘余分量;二是基于灰色模糊聚類思想對序列分解后的分量進(jìn)行重構(gòu),得到高頻項、低頻項和趨勢項;三是根據(jù)各重構(gòu)項的波動特征分別選取合適的模型進(jìn)行外推預(yù)測,重構(gòu)得到的高頻項、低頻項和趨勢項分別利用BP神經(jīng)網(wǎng)絡(luò)、SVM方法和ARIMA模型進(jìn)行預(yù)測,最終的預(yù)測結(jié)果由各項的預(yù)測值集成得到。
CEEMDAN組合模型創(chuàng)建的過程如圖2所示。
圖2 CEEMDAN組合模型框架
本文研究樣本為2019年1月2日至2019年11月28日的人民幣兌美元匯率中間價數(shù)據(jù)(數(shù)據(jù)來源于國家外匯管理局)。剔除節(jié)假日后共222個原始數(shù)據(jù),選取不同模型對2019年12月2日至2019年12月31日(排除節(jié)假日共22天)的匯率進(jìn)行預(yù)測。首先對匯率原始序列進(jìn)行非線性、非平穩(wěn)性、尖峰厚尾性以及長記憶性檢驗,具體結(jié)果如表1所示。
由表1可知,BDS檢驗在5%的顯著性水平下,p值均為0,拒絕原假設(shè),即認(rèn)為原始序列具有非線性。ADF檢驗中,p值為0.392,不能拒絕原假設(shè);KPSS檢驗中,t統(tǒng)計量的值為3.849,大于檢驗臨界值0.463,拒絕原假設(shè),即匯率原始序列具有非平穩(wěn)性。JB檢驗中,p值為0,拒絕原假設(shè),表明匯率原始序列不滿足正態(tài)性假設(shè),即具有尖峰厚尾特征。R/S分析中,Hurst指數(shù)為0.638(大于0.5),故匯率原始序列存在長記憶性。
表1 原始序列性質(zhì)檢驗
匯率原始序列經(jīng)EMD、EEMD和CEEMDAN分解后的結(jié)果分別如圖3、圖4和圖5所示。
圖3 匯率原始序列的EMD分解結(jié)果
圖4 匯率原始序列的EEMD分解結(jié)果
圖5 匯率原始序列的CEEMDAN分解結(jié)果
通過分解,展現(xiàn)了匯率原始序列的組成結(jié)構(gòu)和多尺度特征。對比可知,CEEMDAN方法的分解效果最佳。各IMF分量和殘余分量的頻率水平和振幅具有顯著差異,表明不同的分量序列間存在較大差異,需選取不同模型進(jìn)行分析預(yù)測。
基于模糊等價矩陣,對序列分解得到的各IMF分量進(jìn)行動態(tài)聚類。考慮到每個IMF分量的波動特征和分量之間的關(guān)聯(lián)度,IMF分量可分為{IMF1、IMF2、IMF3、IMF4}和{IMF5、IMF6}兩類(如圖6所示),將第一類重構(gòu)為高頻項,第二類重構(gòu)為低頻項。繪制原始匯率序列和各重構(gòu)項(高頻項、低頻項和趨勢項)的走勢圖(圖7)。
圖6 IMF分量灰色模糊聚類
圖7 匯率原始序列和各重構(gòu)項走勢
為進(jìn)一步分析高頻項、低頻項和趨勢性的統(tǒng)計性質(zhì),選取平均周期、Pearson相關(guān)系數(shù)和方差比3個指標(biāo)進(jìn)行統(tǒng)計和分析。平均周期用來刻畫每個序列的平均波動周期,利用快速傅氏變換(Fast Fourier Transformation,簡稱FFT)計算序列的平均波動周期;Pearson系數(shù)用來刻畫各分量序列與原始序列之間的相似程度;方差比則用來刻畫各分量序列方差值與原始序列方差值之間的相對比重,體現(xiàn)了分量序列對原始序列的方差貢獻(xiàn)度。統(tǒng)計分析結(jié)果如表2所示。
表2 匯率序列與重構(gòu)序列的統(tǒng)計分析
由表2和圖7可知,高頻項、低頻項和趨勢項的波動特征呈現(xiàn)出顯著差異,這表明不同尺度下影響匯率波動的因素也不盡相同。首先,從高頻項來看,平均周期為31.71天,周期相對較短,一定程度上表明高頻項對匯率的長期走勢影響甚微;Pearson相關(guān)系數(shù)為0.026,表明高頻項和原始匯率序列的波動特征存在顯著差異,相似度較低;方差比為2.69%,說明高頻項對原始匯率序列的貢獻(xiàn)率很低??偟膩碚f,高頻項對匯率總體波動的影響非常小。從前文繪制的走勢圖來看,高頻項波動非常不穩(wěn)定,即便短周期內(nèi),波動也較為顯著,反映了匯率短期內(nèi)的非均衡特征。該現(xiàn)象主要受相對利率、外匯市場供需、政府干預(yù)、市場投機(jī)行為等一系列因素的直接影響,是匯率市場的正常周期性波動,并不會影響匯率的基本波動走勢。其次,從低頻項的周期性來看,平均波動周期為222天,相對較長,反映出低頻項對匯率的影響較大;Pearson相關(guān)系數(shù)為0.862,表明低頻項和匯率序列的相似度較高,序列波動走勢較為一致;方差比為30.34%,說明低頻項對原始匯率序列的貢獻(xiàn)率較大。最后,從趨勢項來看,無明顯周期性特征;Pearson相關(guān)系數(shù)為0.901,表明在一定條件下,可充分利用趨勢項來刻畫原始匯率序列的基本波動走勢;方差比為66.97%,進(jìn)一步表明趨勢項是原始匯率序列的主體成分,可較為準(zhǔn)確地描繪出匯率的較長時間內(nèi)的基本波動走勢。趨勢項整體走勢較為平緩,表明在中短期內(nèi),匯率即使受到一些重大事件或某些政策的影響,而產(chǎn)生一定程度的波動幅度,但這些波動對匯率的中短期整體走勢影響很小,匯率波動仍將集中于趨勢線附近的一個小區(qū)間內(nèi)。
不同的波動特征,宜選取不同的預(yù)測模型,從而進(jìn)一步提高整體預(yù)測精度。對于高頻項,選取BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行分析預(yù)測;對于低頻項,選取SVM模型進(jìn)行分析預(yù)測;對于趨勢項,可以看出明顯的線性變化特征,故選取ARIMA模型進(jìn)行分析預(yù)測。利用上述模型得到各重構(gòu)項的預(yù)測值后,再對各預(yù)測值進(jìn)行集成,便可得到最終的預(yù)測值。
為了檢驗CEEMDAN組合模型的準(zhǔn)確性和預(yù)測性能,將模型預(yù)測結(jié)果與ARIMA、SVM、LM-BP神經(jīng)網(wǎng)絡(luò)等單模型,以及ARIMA-SVM、EMD組合模型和EEMD組合模型的預(yù)測結(jié)果進(jìn)行對比分析。本文選用MAE、MSE、MAPE和MSPE四項誤差指標(biāo)來準(zhǔn)確衡量各模型的預(yù)測精度,各模型預(yù)測誤差如表3所示。
表3 不同模型的預(yù)測誤差
為進(jìn)一步對比模型對匯率序列走勢的預(yù)測效果,繪制2019年12月2日至2019年12月31日的原始匯率序列走勢和各組合模型預(yù)測匯率走勢對比圖,如圖8所示。
圖8 原始匯率序列和組合模型預(yù)測序列走勢
表3給出了各模型的預(yù)測誤差,組合模型預(yù)測誤差明顯低于單模型。從單模型來看,無論是從絕對誤差指標(biāo)(MAE和MSE)分析,還是以相對誤差指標(biāo)(MAPE和MSPE)作為衡量依據(jù),ARIMA模型的預(yù)測誤差均最大。若以MAE作為衡量指標(biāo),LM-BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測誤差為0.284 5,而SVM模型預(yù)測誤差為0.142 0,LM-BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度低于SVM模型。究其原因,MAE是絕對誤差指標(biāo),當(dāng)預(yù)測值中一旦存在異常點,則可能造成較大的偏差?;诖耍瑢⑾鄬φ`差指標(biāo)(MAPE和MSPE)納入考量體系,實證表明LM-BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測誤差低于SVM模型。結(jié)合各指標(biāo)分析結(jié)果可知,單模型中,ARIMA模型的預(yù)測誤差較大,而LM-BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測誤差較小。從組合模型來看,重構(gòu)的組合模型的預(yù)測誤差明顯低于ARIMA-SVM組合模型,尤其是EEMD組合模型和CEEMDAN組合模型,兩模型在絕對誤差指標(biāo)MSE下的預(yù)測誤差遠(yuǎn)小于ARIMA-SVM模型和EMD組合模型,甚至不在同一精度分位數(shù)。結(jié)合圖8分析可知,ARIMA-SVM模型預(yù)測序列走勢與原始匯率序列走勢雖較為貼合,但是偏離原始匯率序列較遠(yuǎn),無法準(zhǔn)確預(yù)測匯率值,使得模型整體預(yù)測誤差較高。在相對誤差指標(biāo)MAPE和MSPE下,EEMD組合模型的預(yù)測誤差分別為0.003 7和9.351 6×10-4,CEEMDAN組合模型的預(yù)測誤差分別為0.001 2和6.812 9×10-4,故CEEMDAN組合模型預(yù)測精度更高。分析圖8中CEEMDAN組合模型預(yù)測序列與原始匯率序列走勢可知,CEEMDAN組合模型能夠較為準(zhǔn)確地捕捉匯率序列預(yù)期走勢的拐點,對整體走勢刻畫較為準(zhǔn)確,從而使得模型整體預(yù)測誤差較低。 總體而言,單模型對匯率序列的分析和預(yù)測效果不及組合模型,而在組合模型中,CEEMDAN組合模型預(yù)測效果更優(yōu)。
此外,從理論上來看,由于匯率序列具有非線性、非平穩(wěn)性和長記憶性等波動特征,影響了模型的預(yù)測效果,其中,ARIMA模型的預(yù)測效果遠(yuǎn)遠(yuǎn)不如SVM模型和BP神經(jīng)網(wǎng)絡(luò)模型。組合模型中,CEEMDAN組合模型的預(yù)測和分析效果最佳,這是因為EMD組合模型和EEMD組合模型中在進(jìn)行序列分解時存在模態(tài)混疊、計算量大以及偽分量等復(fù)雜問題,降低了匯率序列的分解效率,進(jìn)而直接影響到最終的匯率序列預(yù)測和分析效果,而CEEMDAN組合模型在分解時采用CEEMDAN方法,該方法通過在經(jīng)驗?zāi)B(tài)分解的每個階段添加有限次的自適應(yīng)白噪聲對EEMD方法進(jìn)行優(yōu)化,降低了重構(gòu)誤差,提高了計算效率,使得模型整體的預(yù)測誤差最?。欢鳤RIMA-SVM模型預(yù)測誤差較大,則是因為該組合模型雖然能夠利用ARIMA模型和SVM模型分別對匯率序列中的線性特征顯著部分和非線性特征顯著部分進(jìn)行預(yù)測,但由于線性和非線性特征混疊嚴(yán)重,影響了模型的預(yù)測效果。
本文針對匯率序列的非線性、非平穩(wěn)性和長記憶性等特點,基于分解—重構(gòu)—集成策略通過構(gòu)建CEEMDAN組合模型對人民幣兌美元匯率序列的波動特征進(jìn)行準(zhǔn)確刻畫并利用模型進(jìn)行樣本外推預(yù)測,對匯率短期走勢進(jìn)行預(yù)判分析。實證研究表明相較于單模型和其他組合模型,CEEMDAN組合模型的預(yù)測效果最佳,其主要具有3項特點:第一,CEEMDAN方法克服了EMD、EEMD方法中模態(tài)混疊、運行效率不佳等缺點,能夠更加準(zhǔn)確對匯率序列進(jìn)行分解,從而清晰地展現(xiàn)匯率序列在不同尺度下的波動特征。第二,采用灰色模糊聚類法對IMF分量進(jìn)行重構(gòu),一方面能夠避免直接對各分量進(jìn)行預(yù)測的運算量大問題;另一方面,在灰色模糊聚類過程中引入灰色關(guān)聯(lián)熵賦權(quán),使得高頻項和低頻項的重構(gòu)更為準(zhǔn)確客觀。第三,高頻項、低頻項和趨勢項具有不同的波動特征,采用單一方法難以保證預(yù)測精度,而有針對性地選取不同的方法進(jìn)行組合預(yù)測,可有效提升整體預(yù)測精度。
綜上所述,本文構(gòu)建的CEEMDAN組合模型在匯率預(yù)測方面具有良好的理論分析性能,一方面有利于深入理解匯率波動的本質(zhì)特征和規(guī)律性;另一方面有助于對人民幣兌美元匯率的未來短期走勢進(jìn)行準(zhǔn)確預(yù)測。與此同時,該模型為數(shù)據(jù)驅(qū)動型算法,不僅適用于人民幣匯率的預(yù)測,而且適用于其他宏觀經(jīng)濟(jì)變量的分析和預(yù)測,適用范圍較廣。
在未來的研究過程中,如何利用CEEMDAN組合模型對包括匯率在內(nèi)的宏觀經(jīng)濟(jì)變量進(jìn)行分析仍然有許多有意義的研究方向。如匯率區(qū)間長度增大時,是否需要對匯率序列進(jìn)行結(jié)構(gòu)性判斷,然后分階段對匯率序列進(jìn)行預(yù)測,最后加權(quán)集成;對于離散型數(shù)據(jù),將其連續(xù)化后再利用CEEMDAN模型進(jìn)行預(yù)測是否妥當(dāng);如何拓展模型的應(yīng)用領(lǐng)域等等,都是需要進(jìn)一步研究的問題。