張 靜,秦 青
(河南科技大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,河南 洛陽 471000)
我國作為煤炭資源比較豐富的國家,煤炭的消耗量占我國能源產(chǎn)業(yè)的58.5%。我國的煤炭資源分布呈現(xiàn)出“北煤南運(yùn)”的格局,在山西、內(nèi)蒙古、陜西、寧夏等煤炭主要產(chǎn)地與東南沿海主要煤炭消費(fèi)地之間形成了煤炭流通的樞紐,被稱為環(huán)渤海地區(qū)[1]。由于該地區(qū)煤炭的運(yùn)銷最為集中,動(dòng)力煤交易量也較大。在經(jīng)過了長時(shí)間的煤炭市場交易后,環(huán)渤海地區(qū)港口的煤炭價(jià)格水平已經(jīng)成為我國煤炭價(jià)格的風(fēng)向標(biāo),其變動(dòng)情況直接反映了我國煤炭市場的運(yùn)行動(dòng)態(tài),可以作為研究我國煤炭市場變化的關(guān)鍵性指標(biāo)。
為了預(yù)測我國煤炭價(jià)格的具體走勢,劉玥等[2]利用ARMA方法進(jìn)行煤炭價(jià)格的預(yù)測,提出用EMD分解的方式增加ARMA模型的精準(zhǔn)度,但其模型本身只考慮了環(huán)渤海動(dòng)力煤的時(shí)間序列信息,延伸了數(shù)據(jù)本身的趨勢性和周期性,對其他外部因素帶來的影響并沒有加以考慮。劉原奇[3]構(gòu)建了環(huán)渤海動(dòng)力煤價(jià)格的多元線性回歸預(yù)測模型,雖然考慮了一些外部因素對于價(jià)格走勢的影響,但由于煤炭價(jià)格影響因素復(fù)雜,難以運(yùn)用簡單的數(shù)學(xué)模型進(jìn)行解釋和擬合,模型預(yù)測效果不佳。
隨著人工智能算法在股票市場中的大量實(shí)踐,基于神經(jīng)網(wǎng)絡(luò)的預(yù)測模型近些年來越來越多地被應(yīng)用于金融預(yù)測領(lǐng)域,劉斌[4]利用BP神經(jīng)網(wǎng)絡(luò)對煤炭價(jià)格進(jìn)行簡單預(yù)測的結(jié)果,體現(xiàn)出神經(jīng)網(wǎng)絡(luò)在金融時(shí)間序列預(yù)測方面的顯著優(yōu)勢。而長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)模型由于自身的選擇記憶性和基于時(shí)間序列內(nèi)部影響的特性,非常適用于擬合價(jià)格時(shí)間序列這種非線性、非平穩(wěn)的數(shù)據(jù),能夠?qū)崿F(xiàn)以時(shí)間序列作為載體,進(jìn)行多個(gè)輸入的同時(shí)實(shí)現(xiàn)多個(gè)輸出,在價(jià)格預(yù)測模型中表現(xiàn)出了獨(dú)特的優(yōu)勢。
筆者嘗試將深度學(xué)習(xí)LSTM方法應(yīng)用于我國環(huán)渤海動(dòng)力煤價(jià)格指數(shù)預(yù)測,并采取線性、非線性對照組的方式,進(jìn)行預(yù)測模型精度和準(zhǔn)確度的對比分析,證明了LSTM神經(jīng)網(wǎng)絡(luò)在金融時(shí)間序列預(yù)測方面具有顯著的優(yōu)越性。
傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是一類用于處理時(shí)間序列的神經(jīng)網(wǎng)絡(luò)。相比于一般的神經(jīng)網(wǎng)絡(luò),它的優(yōu)勢體現(xiàn)在能夠保存有助于當(dāng)前決策的歷史信息,它的核心思想是用循環(huán)結(jié)構(gòu)替換了前饋神經(jīng)網(wǎng)絡(luò)的隱藏層。在傳遞信息的過程中,每一次循環(huán)都會(huì)有一部分信息保留在神經(jīng)元中,作為輸入與新信息一同進(jìn)入下一個(gè)神經(jīng)元,對預(yù)測的結(jié)果產(chǎn)生影響。
LSTM網(wǎng)絡(luò)是改進(jìn)后的RNN網(wǎng)絡(luò),通過增加輸入門、輸出門、遺忘門和單元狀態(tài),改變自循環(huán)的權(quán)重參數(shù),在模型參數(shù)固定的情況下,可以有效地避免梯度“消失”或者“爆炸”的問題。其中,輸入門和輸出門控制信息流的流入和流出,遺忘門用來選擇上一時(shí)刻的單元狀態(tài)有多少保存到這一時(shí)刻。
筆者在設(shè)計(jì)LSTM神經(jīng)網(wǎng)絡(luò)時(shí)特別添加了Dropout層以優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),用以解決深層神經(jīng)網(wǎng)絡(luò)存在的兩種可能影響模型訓(xùn)練效果的問題(一是梯度消失導(dǎo)致神經(jīng)網(wǎng)絡(luò)難以收斂,二是過擬合導(dǎo)致測試集失效)。本文LSTM神經(jīng)網(wǎng)絡(luò)的主體結(jié)構(gòu)包括兩層LSTM神經(jīng)層,加入Dropout層(失活概率設(shè)為0.3)。本文所有模型擬合實(shí)驗(yàn)基于Python語言環(huán)境。
煤炭價(jià)格的相關(guān)影響因素不是單一存在的,在實(shí)際市場中,煤炭價(jià)格受到多個(gè)因素的共同影響,例如我國宏觀經(jīng)濟(jì)的整體發(fā)展態(tài)勢、世界能源市場上的相關(guān)行情、生產(chǎn)成本、煤炭產(chǎn)量以及庫存變化、煤炭相關(guān)替代能源的價(jià)格、政治經(jīng)濟(jì)因素等。
2.1.1 宏觀經(jīng)濟(jì)。中國經(jīng)濟(jì)的高速增長是煤炭需求增長的主要原因,通過對煤炭需求量與我國GDP數(shù)據(jù)進(jìn)行格蘭杰因果檢驗(yàn)可以得到,5%的顯著水平下GDP是煤炭需求變化的原因。從動(dòng)力煤價(jià)格指數(shù)時(shí)序圖中可以大致看出,宏觀經(jīng)濟(jì)的發(fā)展對動(dòng)力煤價(jià)格指數(shù)是呈現(xiàn)正向促進(jìn)作用的[5]。
2.1.2 生產(chǎn)成本。煤炭的生產(chǎn)和運(yùn)輸成本是影響煤炭價(jià)格走勢的重要因素。在其他條件不變的情況下,煤炭的生產(chǎn)成本越高,煤炭的價(jià)格就會(huì)越高,也就是說,煤炭價(jià)格的變動(dòng)與生產(chǎn)成本的變化方向是一致的。
2.1.3 煤炭產(chǎn)量以及庫存變化。價(jià)格的變動(dòng)與供求關(guān)系的變化密不可分,煤炭價(jià)格受煤炭當(dāng)期產(chǎn)量以及庫存量的影響,其作用方式就是影響了煤炭市場的供求關(guān)系,進(jìn)而影響到了煤炭的價(jià)格。
2.1.4 煤炭相關(guān)替代能源的價(jià)格。對于煤炭來說,石油就是它的替代品,石油一方面作為其替代能源直接影響煤炭價(jià)格,另一方面由于其作為我國的重要戰(zhàn)略資源也影響到了我國的宏觀經(jīng)濟(jì),進(jìn)一步對煤炭價(jià)格產(chǎn)生了間接的影響[6]。
2.1.5 政治經(jīng)濟(jì)因素。國家出臺(tái)的政策,直接或間接的影響煤炭產(chǎn)量,從而影響煤炭價(jià)格走勢。
為了能夠充分評估LSTM神經(jīng)網(wǎng)絡(luò)在預(yù)測價(jià)格指數(shù)方面的價(jià)值,本文采用2010年8月—2021年10月的環(huán)渤海動(dòng)力煤價(jià)格指數(shù)(以下簡稱為BSPI)進(jìn)行模型擬合以及預(yù)測。我國環(huán)渤海動(dòng)力煤價(jià)格指數(shù)的時(shí)間序列呈現(xiàn)出顯著非平穩(wěn)的特征,大體呈上升趨勢,但由于其影響因素復(fù)雜,數(shù)據(jù)并無明顯規(guī)律性(本文數(shù)據(jù)均來自中國金融信息網(wǎng)、前瞻數(shù)據(jù)庫)。
數(shù)據(jù)預(yù)處理主要是補(bǔ)全了數(shù)據(jù)集中的空值部分(由于節(jié)假日以及國家政策的影響),筆者選擇上下均值填補(bǔ)法,對原始數(shù)據(jù)進(jìn)行補(bǔ)全;接著對數(shù)據(jù)進(jìn)行了歸一化處理,以提高模型預(yù)測精度;最后對預(yù)測模型的輸入和輸出進(jìn)行定義。針對上面提出的多個(gè)變量與BSPI指數(shù)進(jìn)行可視化分析,剔除無效不相關(guān)因素,最終建立輸入變量組見表1。
表1 變量信息對照表
為了觀察不同預(yù)測方法對環(huán)渤海動(dòng)力煤指數(shù)的預(yù)測效果,本文分別取總樣本的前80%、60%作為訓(xùn)練集,樣本的剩余部分作為測試集進(jìn)行模型擬合,從各個(gè)對照模型中選取最優(yōu)的預(yù)測模型。
LSTM神經(jīng)網(wǎng)絡(luò)對未來BSPI價(jià)格指數(shù)預(yù)測的思路是:用歷史5個(gè)月的動(dòng)力煤價(jià)格指數(shù)信息對未來一個(gè)月的價(jià)格指數(shù)進(jìn)行預(yù)測。將表1中共10個(gè)變量的月度數(shù)據(jù)作為模型輸入部分,LSTM神經(jīng)網(wǎng)絡(luò)的輸出量即為未來一個(gè)月的BSPI指數(shù)的預(yù)測值。
本文將經(jīng)典RNN、KNN作為LSTM模型的非線性對照組,進(jìn)行模型性能的比較。RNN作為主要解決序列問題的方法,強(qiáng)調(diào)的是數(shù)據(jù)間的先后關(guān)系。RNN具有其獨(dú)特的性質(zhì),在每次訓(xùn)練時(shí)都會(huì)將前一次的輸出結(jié)果帶到下一次的隱藏層中,一起進(jìn)行訓(xùn)練。
KNN(最鄰近算法)可以用于對連續(xù)的數(shù)據(jù)標(biāo)簽進(jìn)行預(yù)測,基本方法是求出預(yù)測數(shù)據(jù)集與訓(xùn)練數(shù)據(jù)集的每個(gè)點(diǎn)之間的距離,取前k個(gè)數(shù)據(jù)集的結(jié)果集,將結(jié)果求平均作為預(yù)測的數(shù)據(jù)集。
為了使文章更為嚴(yán)謹(jǐn),本文采用簡單多元線性回歸的方式作為線性對照組,建立多元線性方程:
y=k1x1+k2x2+k3x3+…+k10x10
(1)
將已知變量輸入,利用訓(xùn)練集數(shù)據(jù)進(jìn)行模型訓(xùn)練,尋找到合適的參數(shù),最后在測試集上進(jìn)行測試。
平均絕對誤差(MAE)、均方誤差(MSE)計(jì)算公式分別為:
(2)
(3)
選擇以上兩個(gè)指標(biāo)對各組預(yù)測模型進(jìn)行比較,MAE、MSE是評估預(yù)測值與真實(shí)值的誤差的指數(shù),這兩個(gè)值越小表明誤差越小,預(yù)測的穩(wěn)定性越高。
筆者通過20組每組10次共200次的對照實(shí)驗(yàn)方法確定LSTM神經(jīng)網(wǎng)絡(luò)基礎(chǔ)模型的層數(shù)和每層的神經(jīng)元個(gè)數(shù),選取MSE和MAE兩種模型評價(jià)指標(biāo)進(jìn)行考量。
通過模型訓(xùn)練可以得出:①輸入層神經(jīng)元節(jié)點(diǎn)數(shù)為32,隱含層神經(jīng)元節(jié)點(diǎn)數(shù)為16時(shí),模型的魯棒性較好;②并不是隱含層神經(jīng)元節(jié)點(diǎn)數(shù)越多,越深層次的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)能力越強(qiáng);③不同的神經(jīng)網(wǎng)絡(luò)參數(shù),結(jié)果都會(huì)存在差異。
筆者經(jīng)多次實(shí)驗(yàn)得到第一個(gè)LSTM層的前饋網(wǎng)絡(luò)層的最佳隱藏神經(jīng)元個(gè)數(shù)為32個(gè),為避免過擬合現(xiàn)象采用L2正則化項(xiàng)和dropout機(jī)制,來提高模型的泛化能力。
由圖1可以看出LSTM模型預(yù)測數(shù)據(jù)與真實(shí)數(shù)據(jù)波動(dòng)方向幾乎一致,也較為接近,相比單層模型有了一定的進(jìn)步,但在長期來看模型擬合仍存在一定的誤差以及滯后性。其中實(shí)驗(yàn)所得預(yù)測值精度如表2所示。
圖1 多層LSTM模型
表2 多層LSTM網(wǎng)絡(luò)模型預(yù)測結(jié)果
搭建簡單線性回歸模型,并在訓(xùn)練集上進(jìn)行模型訓(xùn)練,最終可以得到其擬合模型的預(yù)測。在測試集的范疇內(nèi),簡單線性模型預(yù)測值始終低于真實(shí)值,雖然在2021年預(yù)測值與真實(shí)值有了一定的重合,但模型預(yù)測值整體波動(dòng)較大,且在2020年前后預(yù)測值與真實(shí)值有很大的誤差。
圖2 線性對照模型
圖3 非線性對照模型
非線性對照模型顯示出了較大的波動(dòng)性,模型擬合效果一般。
筆者采取多次訓(xùn)練的結(jié)果,取平均值的方法來展示算法的平均水平。利用MSE、MAE這具體兩個(gè)指標(biāo)進(jìn)行多個(gè)模型的比對分析,可以得到表3(表中顯示MSE、MAE數(shù)值均為多次實(shí)驗(yàn)平均值)。
表3 模型預(yù)測結(jié)果對比
通過多次實(shí)驗(yàn)結(jié)果可以看出,在誤差穩(wěn)定性方面,線性回歸方法、K近鄰回歸的方法均表現(xiàn)出較強(qiáng)的穩(wěn)定性,LSTM模型穩(wěn)定性緊隨其后,而RNN模型預(yù)測的穩(wěn)定性則呈現(xiàn)較大的波動(dòng),但從MSE、MAE的數(shù)值上可以看出,LSTM模型預(yù)測在穩(wěn)定性以及準(zhǔn)確性方面具有明顯的優(yōu)勢,說明該方法比較適用于環(huán)渤海動(dòng)力煤價(jià)格指數(shù)的預(yù)測,預(yù)測精度、穩(wěn)定性都較高。
通過研究發(fā)現(xiàn),環(huán)渤海動(dòng)力煤價(jià)格指數(shù)在近段時(shí)間波動(dòng)幅度較大,呈現(xiàn)快速增長的態(tài)勢,其大幅度變動(dòng)必然會(huì)對我國煤炭相關(guān)行業(yè)帶來極大的影響。本文結(jié)合目前最前沿的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)技術(shù)構(gòu)造了一個(gè)LSTM神經(jīng)網(wǎng)絡(luò),將其應(yīng)用于分析預(yù)測我國環(huán)渤海動(dòng)力煤價(jià)格指數(shù),并進(jìn)行了模型的線性、非線性對照組的訓(xùn)練。驗(yàn)證了LSTM神經(jīng)網(wǎng)絡(luò)在價(jià)格指數(shù)預(yù)測方面具有較好的穩(wěn)定性以及預(yù)測準(zhǔn)確性。
根據(jù)模型預(yù)測結(jié)果來看,短期內(nèi)煤炭價(jià)格指數(shù)受到多種因素的影響,波動(dòng)細(xì)小頻繁(1元/t左右),對整體價(jià)格變動(dòng)影響不大;從長期來看,環(huán)渤海動(dòng)力煤價(jià)格指數(shù)變動(dòng)主要受到季節(jié)因素的影響,但由于國內(nèi)外大環(huán)境,煤炭、石油等能源價(jià)格持續(xù)上漲,動(dòng)力煤價(jià)格也始終呈現(xiàn)上升態(tài)勢。
綜上所述,煤炭加工生產(chǎn)及其相關(guān)行業(yè)應(yīng)把握煤炭市場價(jià)格的走勢規(guī)律,重視降低成本,提高生產(chǎn)效率,最大化的應(yīng)對未來可能出現(xiàn)的風(fēng)險(xiǎn);而其他煤炭消耗企業(yè)應(yīng)做好煤炭價(jià)格持續(xù)上漲的準(zhǔn)備,通過追加煤炭等能源的庫存或改換其他替代品等方式來應(yīng)對價(jià)格上漲帶來的成本壓力。