尹 晨 曦
(蘭州財經(jīng)大學(xué) 統(tǒng)計學(xué)院, 甘肅 蘭州 730020)
黃金不同于其他金屬,它是一種兼具貨幣和金融屬性的特殊貴重金屬,擁有高流動、高安全和低收益的特性。由于黃金自身的多重屬性且影響黃金價格變化的因素繁多復(fù)雜,難以準(zhǔn)確地對黃金期貨收盤價的走勢進(jìn)行預(yù)測。國內(nèi)外眾多學(xué)者對此開展了廣泛且深入的研究,從選擇變量的角度,可以將模型分2種。一種是單變量法,許貴陽[1]基于灰色預(yù)測方法對中國黃金現(xiàn)貨價格進(jìn)行短期預(yù)測。另一種是多元變量法,相較于單變量法,計算復(fù)雜,但模型預(yù)測精度高。Pierdzioch等[2]在隨機森林中引入多元變量對黃金等4種貴金屬進(jìn)行樣本外預(yù)測,引入多變量構(gòu)建預(yù)測模型的精度要高于單變量預(yù)測的精度。針對多元變量法,如何選擇合適的變量也是提升預(yù)測效果的關(guān)鍵問題。賈尚暉等[3]選用Lasso回歸方法從定性分析所選的10個變量中選取與對倫敦現(xiàn)貨黃金價格收益率有關(guān)的4個變量進(jìn)行分析。張文等[4]考慮到變量之間并非都是同期的關(guān)系,利用時差相關(guān)分析法確定影響國際原油價格多元變量的滯后期以提高模型的預(yù)測效果。喬宏圖[5]驗證黃金價格序列的混沌性并利用相空間重構(gòu)法確定神經(jīng)元中的節(jié)點個數(shù),并利用相關(guān)分析法篩選重要變量,最終選用BP神經(jīng)網(wǎng)絡(luò)與RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行比較分析。
預(yù)測方法大致分為基于傳統(tǒng)統(tǒng)計預(yù)測模型和以神經(jīng)網(wǎng)絡(luò)為主的智能預(yù)測方法2類。傳統(tǒng)統(tǒng)計預(yù)測模型有灰色預(yù)測[1]等,智能預(yù)測模型主要包括隨機森林[2]、BP神經(jīng)網(wǎng)絡(luò)[6]、支持向量機(SVM)[7]、多層感知機[8]等。單個模型無法有效捕捉到時間序列的主要特征,人們提出了組合方法來分析時間序列。Alameer等[8]考慮匯率、油價、銅價、銀價及黃金歷史價格等10個變量作為輸入變量,建立由鯨魚算法優(yōu)化的多層感知器神經(jīng)網(wǎng)絡(luò)預(yù)測黃金月度價格。
綜上所述,在構(gòu)建模型中加入外生變量能夠有效提升模型的預(yù)測性能。本文選用16個變量對中國黃金期貨收盤價進(jìn)行研究,以其所屬金融市場可分為4大類:現(xiàn)貨市場因素、期貨市場因素、能源價格因素和其他因素。本文基于Lasso對影響黃金收盤價的變量進(jìn)行篩選,考慮到變量之間的關(guān)系并非都屬同期,采用時差相關(guān)分析和相空間重構(gòu)確定不同變量的滯后期,同時引入PSO優(yōu)化BP神經(jīng)網(wǎng)絡(luò)初始權(quán)值與閾值,以達(dá)到更好的預(yù)測效果。
Lasso(Least absolute shrinkage and selection operator,Lasso)即最小絕對值壓縮選擇算法,是一種基于絕對系數(shù)降低數(shù)據(jù)維度的方法。本質(zhì)就是在傳統(tǒng)目標(biāo)函數(shù)的基礎(chǔ)上添加懲罰項來壓縮變量的系數(shù),強制類系數(shù)絕對值之和小于某個特定值,同時設(shè)定一些變量的回歸系數(shù)為零并將這些變量剔除,達(dá)到降維的目的,未被剔除的變量視為顯著變量。通過Lasso回歸分析進(jìn)行特征提取可以有效降低神經(jīng)網(wǎng)絡(luò)輸入變量的維度,解決變量之間存在多重共線性的問題,從而提高模型的有效性。假設(shè)有n組自變量為Xi(i=1,2,…,n),所選取因變量為Yi(i=1,2,…,n),Lasso回歸公式:
(1)
等價于:
(2)
1.2.1 時差相關(guān)分析法
(3)
當(dāng)l=0時,r0表示xt和yt之間的皮爾遜相關(guān)系數(shù);當(dāng)l>0時,x和y之間的關(guān)系為超前;當(dāng)l<0時,x和y之間的關(guān)系為滯后。本文將黃金期貨收盤價作為基準(zhǔn)指標(biāo),提取后的影響因素分別視為被分析指標(biāo),根據(jù)計算結(jié)果調(diào)整模型中相關(guān)變量的滯后階數(shù)。
1.2.2 相空間重構(gòu)
相空間重構(gòu)(Phase Space Reconstruction,PSR)通過對時序數(shù)據(jù)重構(gòu)吸引子把數(shù)據(jù)的時間相關(guān)性轉(zhuǎn)換成更高維的空間向量。時間序列x(i),i=1,2,…,N的相空間重構(gòu)
X(t)=(x(t),x(t+τ),…,x(t+(m-1)τ)
(4)
式中:t=1,2,…,N-(m-1)τ;m為嵌入維度;τ是延遲參數(shù);X(t)表示為延遲向量。本文選取C-C算法[9]尋找最佳嵌入維度m和延遲參數(shù)τ。
1.3.1 PSO-BP神經(jīng)網(wǎng)絡(luò)
粒子群優(yōu)化算法(Particle Swarm optimization,PSO)是由Eberhart和Kennedy提出的一種基于鳥群覓食時群體與個體之間的合作與信息共享來尋找最優(yōu)解的智能優(yōu)化算法。本文利用PSO優(yōu)化BP神經(jīng)網(wǎng)絡(luò)中的初始連接權(quán)值與閾值以提高模型的準(zhǔn)確率。主要步驟如下:
步驟1 初始化一粒子群并確定相關(guān)參數(shù)。設(shè)置本文PSO-BP模型中相關(guān)參數(shù),粒子群規(guī)模大小為20;最大迭代進(jìn)化次數(shù)為100;學(xué)習(xí)因子C1=1.5,C2=1.2。
步驟2 計算粒子相應(yīng)的適應(yīng)度值。適應(yīng)度函數(shù)選用BP神經(jīng)網(wǎng)絡(luò)所得的均方誤差,即所得適應(yīng)度函數(shù)值越小所選粒子適應(yīng)度越強。
步驟3 更新迭代過程。粒子通過計算適應(yīng)度更新個體極值與群體極值從而尋找到個體局部最佳位置與群體中的全局最佳位置,更新公式
(5)
(6)
步驟4 判斷是否為最優(yōu)解。若達(dá)到網(wǎng)絡(luò)預(yù)先設(shè)定的訓(xùn)練次數(shù)或訓(xùn)練誤差到達(dá)設(shè)定范圍內(nèi),則為最優(yōu)解停止網(wǎng)絡(luò)訓(xùn)練,輸出最終結(jié)果。
1.3.2 評判準(zhǔn)則
選取平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)和平均絕對誤差(MAE)3個統(tǒng)計指標(biāo)對模型樣本外預(yù)測性能進(jìn)行客觀的評價:
(7)
(8)
(9)
所構(gòu)建的預(yù)測流程圖如圖1所示。
圖1 Lasso-PSO-BP模型預(yù)測流程圖
預(yù)測模型的主要步驟:
步驟1 確定主要變量,利用Lasso回歸分析找到黃金期貨收盤價的主要影響因素。
步驟2 確定各變量的滯后期,利用時差相關(guān)分析法確定主要影響因素的滯后期,相空間重構(gòu)法確定收盤價自身的滯后期。
步驟3 預(yù)測,確定網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),采用PSO-BP神經(jīng)網(wǎng)絡(luò)等模型進(jìn)行預(yù)測。
步驟4 預(yù)測效果評價,選用MAPE、RMSE和MAE這3個統(tǒng)計指標(biāo)分別對模型進(jìn)行客觀評價。
2.1.1 數(shù)據(jù)選取
2015年8月11日,匯改后形成了以供求關(guān)系為基礎(chǔ),結(jié)合一籃子貨幣進(jìn)行定價的匯率機制,使匯率更加合理化、國際化與市場化。黃金期貨作為一種金融衍生品,匯改制度的變化會在一定程度上對金融產(chǎn)品產(chǎn)生影響。為了消除不同匯率制度對黃金期貨收盤價的影響,選用上海黃金交易所自2015年8月11日匯改后到2021年4月1日的黃金期貨收盤價格日度數(shù)據(jù),如圖2所示??紤]到影響黃金價格的相關(guān)因素,宏觀經(jīng)濟指標(biāo)大多數(shù)都以月度、季度或者年度為主,利用多變量預(yù)測黃金期貨收盤價日度數(shù)據(jù),如表1所示,由于時差及國內(nèi)外節(jié)假日等因素,對所有數(shù)據(jù)選取了有公共交易日的區(qū)間進(jìn)行分析,最終得到1 182條樣本數(shù)據(jù)。數(shù)據(jù)均來自于Wind數(shù)據(jù)庫。
圖2 黃金期貨收盤價趨勢圖
表1 價格影響因素
2.2.1 Lasso變量選擇
利用Python進(jìn)行編程可以實現(xiàn)特征提取,參數(shù)λ的取值范圍會影響到所選取變量的數(shù)目,當(dāng)設(shè)定λ的取值過大時,會剔除某些重要變量,不利于預(yù)測模型的構(gòu)建。最終本文選定的最優(yōu)參數(shù)λ=0.000 509 4,并得到影響黃金期貨收盤價的7個因素,即上海金交所Au9995黃金現(xiàn)貨收盤價、美元兌人民幣匯率、英國布倫特原油現(xiàn)貨價(Dtd)、中債國債到期10年收益率和黃金期貨的成交量、最高價、最低價。選取的變量以及相對應(yīng)的回歸系數(shù)如表2所示。
表2 Lasso選取的變量及回歸系數(shù)
2.2.2 滯后期確定
充分了解影響因素與收盤價之間的數(shù)據(jù)特征,能夠有效提高后續(xù)預(yù)測模型的準(zhǔn)確率,利用時差相關(guān)分析法確定被提取變量的時間序列滯后期,采用C-C相空間重構(gòu)法確定黃金期貨收盤價最佳嵌入維度m=4,延遲參數(shù)τ=2,即收盤價最佳滯后期為4期。根據(jù)公式(3)計算各變量滯后5期的時差相關(guān)系數(shù),對比5期的時差相關(guān)分析系數(shù),選取系數(shù)最大值所對應(yīng)的期數(shù),上海金交所Au9995黃金現(xiàn)貨收盤價、黃金期貨的最高價和最低價最佳滯后期均為1期;美元兌人民幣匯率、原油現(xiàn)貨價(Dtd)、中債國債收益率和成交量所選最佳滯后期均為5期。
表3 變量相關(guān)系數(shù)表
2.2.3 PSO-BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果
將滯后1期上海金交所Au9995黃金現(xiàn)貨收盤價、黃金期貨最高價與最低價;滯后4期的黃金期貨收盤價;滯后5期的美元兌人民幣匯率、原油現(xiàn)貨價(Dtd)、中債國債收益率和黃金期貨成交量共27個變量作為PSO-BP神經(jīng)網(wǎng)絡(luò)的輸入層,下一天的黃金期貨收盤價格為輸出層。訓(xùn)練集與測試集劃分比為9∶1,即1 059個訓(xùn)練樣本,118個測試樣本。本文所用對比模型參數(shù)設(shè)置如表4所示,通過神經(jīng)網(wǎng)絡(luò)進(jìn)行仿真訓(xùn)練,得到測試集上的預(yù)測結(jié)果如圖3~圖5所示。
表4 對比模型參數(shù)設(shè)置
BP神經(jīng)網(wǎng)絡(luò)與其單一神經(jīng)網(wǎng)絡(luò)的預(yù)測效果圖如圖3所示,ELM的預(yù)測效果好于BP與LSSVR神經(jīng)網(wǎng)絡(luò),這是由于ELM隨機設(shè)定神經(jīng)網(wǎng)絡(luò)輸入層與隱含層之間參數(shù)值;BP神經(jīng)網(wǎng)絡(luò)與經(jīng)PSO優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)在測試集上的預(yù)測結(jié)果如圖4所示,可以明顯看出PSO-BP神經(jīng)網(wǎng)絡(luò)的走勢更貼近真實值;PSO優(yōu)化BP、ELM與LSSVR模型的結(jié)果如圖5所示。不同模型的評判指標(biāo)數(shù)據(jù)如表5所示,利用IR公式(10)計算提出模型與基準(zhǔn)模型各指標(biāo)的提升率,相對于其他模型的提升率結(jié)果如表6所示,可見PSO-BP神經(jīng)網(wǎng)絡(luò)的預(yù)測效果要明顯優(yōu)于其他模型。
(10)
圖3 BP金價預(yù)測模型擬合結(jié)果圖 圖4 PSO-BP金價預(yù)測模型擬合結(jié)果圖
圖5 PSO-BP、PSO-ELM與PSO-LSSVR金價預(yù)測模型擬合結(jié)果圖
表5 各模型評判指標(biāo)及對比
表6 PSO-BP指標(biāo)提升率
本文選用多變量對黃金期貨收盤價建立了Lasso-PSO-BP預(yù)測模型,并針對“811”匯改后的黃金期貨價格數(shù)據(jù)進(jìn)行了實證分析與預(yù)測。通過Lasso對所選取的影響因素進(jìn)行降維,在模型中選入與收盤價更加相關(guān)的變量,從而有效減少模型的訓(xùn)練時間,提高模型的預(yù)測精度。從時間滯后的角度分析相關(guān)變量與收盤價之間的滯后關(guān)系,利用相空間重構(gòu)法最大程度地尋找收盤價本身的數(shù)據(jù)特征,最終確定模型的拓?fù)浣Y(jié)構(gòu)。利用PSO優(yōu)化傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的2個重要參數(shù),捕捉收盤價非線性的特征。Lasso-PSO-BP神經(jīng)網(wǎng)絡(luò)的預(yù)測效果要好于單一神經(jīng)網(wǎng)絡(luò)預(yù)測模型,也要好于Lasso-PSO-ELM和Lasso-PSO-LSSVR模型。