趙 鑫,陳臣鵬,畢貴紅,陳仕龍,謝 旭
(昆明理工大學 電力工程學院,云南 昆明 650500)
“十四五”規(guī)劃指出,二氧化碳排放力爭2030 年前實現(xiàn)“碳達峰”,努力爭取2060 年前實現(xiàn)“碳中和”?!笆奈濉逼陂g將出臺更加強有力的碳排放交易政策,加強對煤炭消費的控制,加大對可再生能源發(fā)展的支持力度,繼續(xù)推動經(jīng)濟社會加速向低碳方向轉型,為“碳中和”奠定基礎[1]。過去20 年,我國的二氧化碳排放增速是世界其他國家和地區(qū)的6 倍,在全球二氧化碳排放增量中約占70%;2020 年以來,我國人均二氧化碳排放量已超過歐盟;引入碳交易機制、降低碳排放強度已成為當前的緊迫任務[2]。為了減少碳排放,作為應對氣候變化、降低碳排放、履行國際減排承諾的重要手段,我國于2017 年12 月啟動了7 個全國統(tǒng)一的碳排放權交易市場。
影響碳產(chǎn)品交易價格的因素主要包含政策因素、供求因素和氣候、能源價格和宏觀經(jīng)濟環(huán)境等因素。文獻[3]通過參數(shù)檢驗法得出:有效的市場試點及政策實施會減少碳交易價格的波動性和非平穩(wěn)性。碳交易價格是提高碳市場風險管理能力的基礎,也是制定碳交易市場政策的重要依據(jù);因此尋求一種能有效提取碳交易價格的波動特征并對其進行較為準確地預測的方法十分重要。
傳統(tǒng)的統(tǒng)計和計量預測模型,如GED-GARCH域[4]、改進的Grey-Markov[5]等,對非線性數(shù)據(jù)的處理能力較差。為了解決這個問題,提出了基于機器學習的預測方法,如ARIMA-SVM[6]、BP[7]等。與傳統(tǒng)方法相比,機器學習預測方法可以更好地處理非線性數(shù)據(jù),能有效地提高預測精度。為了更進一步捕獲時間序列的深度特征和波動規(guī)律,人們又將時間序列進行多尺度分解,得到代表原始序列的多尺度特征;然后選擇合適的預測模型分別預測各子序列;最后用特定的方法將各子序列預測值合并得到最終預測值。實驗證明,該方法具有更高的預測精度[8-10]。
由于歷史碳價序列具有較強的非線性和非平穩(wěn)性,若采用傳統(tǒng)數(shù)學計量與機器學習方法對其進行預測,則對碳價序列的特征提取能力較差,預測效果一般。因此為了進一步降低各模態(tài)耦合的非線性與非平穩(wěn)性對預測準確率的影響,充分提取碳價序列的多尺度特征,本文提出一種多模式分解、樣本熵重構和WOA-LSTM 組合的預測模型。首先,用奇異譜分解(singular spectrum decomposition,SSD)、變分模態(tài)分解(variational modal decomposition,VMD)以及完全集合經(jīng)驗模態(tài)分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)這3 種方法分別分解原始碳價序列,實現(xiàn)不同模式模態(tài)分量規(guī)律的互補;然后,使用樣本熵對熵值接近的模態(tài)分量進行重構,以減少分量數(shù),提高預測效率;最后,分別將各重構分量輸入到WOA-LSTM 預測模型中進行預測,得到3 個初始預測值,再由最優(yōu)加權組合法將3 個初始預測值線性組合得到最終的預測值。
1.1.1 奇異譜分解
奇異譜分解(SSD)能自適應選取嵌入維數(shù)L,克服了奇異譜分析(SSA)按經(jīng)驗手動選取L的缺陷。SSD 的實現(xiàn)步驟包括:創(chuàng)建軌跡矩陣、自適應選取嵌入維數(shù)L、從高頻分量到低頻分量依次重構得到SSC 分量、設置迭代停止條件(當殘余項和原始信號間的歸一化方差小于給定閾值時停止迭代,分解完成)。具體實現(xiàn)步驟詳見文獻[11]。
1.1.2 變分模態(tài)分解
變分模態(tài)分解(VMD)是一種自適應、完全非遞歸的模態(tài)變分和信號處理的方法。VMD 可以根據(jù)待分解的序列自適應地確定模態(tài)分解的個數(shù),從而自適應地匹配每種模態(tài)的最佳中心頻率和有限帶寬。VMD 克服了經(jīng)驗模態(tài)分解(empirical mode decomposition,EMD)存在端點效應和模態(tài)分量混疊的問題,可以更好地降低時間序列的非平穩(wěn)性和復雜度。通過VMD,可以得到多個頻率尺度不同且相對平穩(wěn)的子序列。VMD 的核心思想是構建和求解變分問題,具體實現(xiàn)步驟詳見文獻[12]。
1.1.3 完全集合經(jīng)驗模態(tài)分解
為了解決EMD 分解信號出現(xiàn)模態(tài)混疊的現(xiàn)象,提出了集合經(jīng)驗模態(tài)分解(ensemble empirical mode decomposition,EEMD)和互補集成經(jīng)驗模態(tài)分解(complementary ensemble empirical mode decomposition,CEEMD),兩者通過在待分解的序列中加入成對正負高斯白噪聲減輕EMD 存在的模態(tài)混疊現(xiàn)象。EEMD 和CEEMD 分解得到的模態(tài)分量中總會殘留一定的白噪聲,進而影響后續(xù)信號的分析和處理。為了解決這些問題,文獻[13]提出了一種基于這2 種分解方法的改進算法——完全自適應噪聲集合經(jīng)驗模態(tài)分解(CEEMDAN),又稱完全集合經(jīng)驗模態(tài)分解,具體實現(xiàn)步驟詳見文獻[13]。
1.1.4 樣本熵
樣本熵(SampEn)是一種體現(xiàn)信號復雜程度的優(yōu)化算法。相比近似熵,樣本熵的優(yōu)勢為:樣本熵的計算與序列維度無關;參數(shù)的變化對樣本熵的影響程度是一致的,即一致性較好。樣本熵值相近的信號,即復雜程度接近的信號可合并為一個分量,起到了降低計算量、簡化模型的作用[14]。
1.2.1 長短期記憶神經(jīng)網(wǎng)絡
長短期記憶神經(jīng)網(wǎng)絡(LSTM)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(RNN)。LSTM 有效消除了RNN在處理長時間序列時出現(xiàn)梯度爆炸或消失的弊端[15]。LSTM 由許多記憶塊構成,每個記憶塊由輸入門、輸出門和遺忘門組成,三者功能如下。
(1)遺忘門決定信息的更新。
式中:Wf、bf分別為遺忘門sigmoid 激活函數(shù)的權重與偏置。
(2)輸入門決定當前信息的輸入。
式中:Wi、bi分別為輸入門sigmoid 激活函數(shù)的權重與偏置;WC、bC分別為輸入門tanh 激活函數(shù)的權重與偏置;Ct為新細胞狀態(tài)信息。
(3)輸出門決定下一隱藏層的值。
式中:Wo,bo分別為輸出門sigmoid 激活函數(shù)的權重與偏置。
1.2.2 鯨魚優(yōu)化算法(WOA)
鯨魚優(yōu)化算法的主要原理是模擬座頭鯨的隨機捕食行為。鯨魚優(yōu)化算法具有全局搜索能力強、計算簡單、參數(shù)少等優(yōu)點,其主要實現(xiàn)步驟如下[16]。
步驟1:尋找獵物。鯨魚第i次搜索行為可用式(4)表示:
式中:xrand為鯨魚群中某個鯨魚的位置;i,L分別為當前迭代次數(shù)和總的迭代次數(shù);A,c為系數(shù);當|A|≤1 時,鎖定獵物,進入包圍獵物階段。
步驟2:包圍獵物。鯨魚向最佳獵物的方向更新位置,通過更新位置包圍獵物,最終確定獵物的位置。這一行為可由式(5)表示。
在式(5)中,x(i+1)由x(i)向x*(i)更新,逐步包圍獵物。
步驟3:狩獵。計算鯨魚與獵物之間的距離D2,通過式(6)模仿座頭鯨的螺旋狀移動。
式中:b為常數(shù),定義對數(shù)螺線的形狀;l?[–1,1]。鯨魚群通過隨機選擇以下2 種方式(概率均為0.5)進行狩獵,可用式(7)表示。
式中:當p<0.5 時,為收縮包圍式狩獵方式;當p≥0.5 時,氣泡網(wǎng)螺旋式狩獵方式。
1.2.3 WOA-LSTM 預測模型
為降低人工調(diào)參的隨機性,提高預測精度,采用鯨魚優(yōu)化算法對LSTM 網(wǎng)絡進行優(yōu)化。將LSTM 網(wǎng)絡的迭代次數(shù)l、學習率e、第一層隱藏節(jié)點數(shù)a1和第二層隱藏節(jié)點數(shù)a2作為WOA 的尋優(yōu)對象,以獲取最佳超參數(shù)[17-18]。WOA-LSTM 模型主要流程如下。
步驟1:將數(shù)據(jù)劃分為訓練集與測試集。初始化鯨魚優(yōu)化算法的維度、迭代次數(shù)以及種群數(shù)。設定LSTM 網(wǎng)絡各超參數(shù)的數(shù)值范圍。
步驟2:隨機生成10 個鯨魚群,并用對應的參數(shù)設置長短期記憶網(wǎng)絡。
步驟3:將模型的預測值與真實值的均方根誤差作為適應度,計算每個種群對應的適應度。把其中最小適應度對應的結果作為此次的最優(yōu)結果,并與全局最優(yōu)結果進行比較。如效果更好,則替換。
步驟4:迭代開始。用WOA 不斷更新鯨魚群對應的4 個超參數(shù);重復步驟3—4,直到所有迭代完成。
步驟5:輸出最優(yōu)結果對應的各個超參數(shù),將輸出的超參數(shù)帶入LSTM 模型中進行預測。
1.2.4 最優(yōu)加權組合法
在分別采用 SSD-LSTM、VMD-LSTM 和CEEMDAN-LSTM 模型得到初始預測值后,為確定合適的權重使3 個預測值進行線性結合,采用最優(yōu)加權法計算權重系數(shù)。具體步驟如下[19]。
步驟1:計算得到誤差矩陣E。
式中:N為預測總時間;et_ssd,et_vmd,et_ceemdan分別為3 個模型在時刻t的預測值與真實值的誤差。步驟2:由拉格朗日乘子法得到最優(yōu)權重。
式中:ω1,ω2,ω3(ω1+ω2+ω3=1)分別為3 個模型預測值的權重系數(shù);R為三維單位列向量。
步驟3:得出最終的碳價預測結果如式(10)所示:
為提高碳交易價格的預測準確率,提出一種基于多模式分解、樣本熵重構與WOA-LSTM 的組合預測方法。該方法運算步驟如圖1 所示。
圖1 組合預測模型運算流程Fig.1 Operation process of combined prediction model
(1)數(shù)據(jù)預處理:由SSD、VMD 和CEEMDAN分解歷史碳價序列各得到x個分量,其中,包括x–1 個模態(tài)分量和1 個殘余分量Ri(i=1,2,3),Ri由原始序列減去x–1 個模態(tài)分量之和得到。
(2)分量重構:多模式分解得到的模態(tài)分量數(shù)量較多,分別預測計算量較大。為了簡化模型,減小預測難度,通過計算各模態(tài)分量的樣本熵值,將熵值接近的分量重構為1 個新分量,再將各重構分量分別輸入到WOA-LSTM 網(wǎng)絡中進行預測。
(3)一次預測:將各重構分量對應的預測值直接相加,得到3 個模型對應的初始預測值。
(4)二次預測:使用最優(yōu)加權法計算出3 個初始預測值對應的最佳權重系數(shù),根據(jù)權重系數(shù)對3 個初始預測值進行線性組合得出最終的預測結果。
為了評估預測結果的有效性,使用平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)以及均方根誤差(RMSE)對實驗預測結果進行評估。3 種誤差的計算公式如式(11)所示:
式中:Zt為t時刻碳價真實值;為t時刻碳價預測值;為碳價真實值的平均值。
本文實驗數(shù)據(jù)來源于某省碳排放交易所的歷史碳交易價格數(shù)據(jù)。選用2013 年12 月19 日—2021 年10 月25 日的共1 635 個價格數(shù)據(jù)(不包括公共假日)作為實驗的原始數(shù)據(jù)集。將數(shù)據(jù)集的前95%作為訓練集,后5%作為測試集。對2021 年7 月7 日—2021 年10 月25 日(共76 天)進行碳交易價格預測。交易所的歷史碳交易價格如圖2 所示。
圖2 歷史碳交易價格Fig.2 Historical carbon trading prices
使用SSD、VMD 和CEEMDAN 算法分解原始數(shù)據(jù)。由3 種分解算法分別得到8 個分量(7 個模態(tài)分量和1 個殘余分量)。分解結果如圖3 所示。
圖3 各分解算法的分解結果Fig.3 Decomposition results of each decomposition algorithm
圖3(a)中,SSC 分量按高頻到低頻排列,R1 為殘余分量;圖3(b)中,IMF 分量按低頻到高頻排列,R2 為殘余分量;圖3(c)中,imf 分量按高頻到低頻排列,R3 為殘余分量。
使用樣本熵法重構分量,以減少分量數(shù)。圖4示出各分解方法模態(tài)分量的樣本熵值。對各分解方法得到的模態(tài)分量分別進行重構,重構結果如表1。
圖4 各分量算法對應的熵值Fig.4 Entropy value corresponding to each component algorithm
表1 重構結果Tab.1 Reconstruction results
對于重構得到的3 組分量(A1—A4,B1—B4,C1—C4),分別使用WOA-LSTM 網(wǎng)絡進行預測,然后分別疊加各組分量的預測值,得到3 組初始預測值;根據(jù)最佳加權組合法計算各預測值對應的權重系數(shù),再由權重系數(shù)將3 組預測值線性組合為最終的碳交易價格預測值。實驗構建的預測網(wǎng)絡共4 層,包括輸入層、2 層LSTM 和輸出層;其中,輸入層輸入前5 天的數(shù)據(jù),輸出層輸出第6天的預測值,損失函數(shù)采用均方根誤差RMSE;鯨魚優(yōu)化算法迭代次數(shù)設為10,種群數(shù)設為10。表2 為各初始預測值對應的權值系數(shù)。
表2 各初始預測值的權值系數(shù)Tab.2 The weight coefficient of each initial prediction value
為了驗證本文多模式分解集成的組合模型對多尺度碳交易價格預測的有效性,采用相同的WOA-LSTM 預測網(wǎng)絡,同時構建了單模式(SSD/VMD/CEEMDAN)分解集成的組合模型。各模型預測值與真實值的對比結果如圖5 所示。對各模型的預測值與真實值之間的誤差進行比較,比較結果如表3。
圖5 不同模型預測值與真實值比較Fig.5 Comparison between predicted values with real values of different models
表3 不同模型的誤差對比Tab.3 Error comparison of different models
由圖5 和表3 可看出,相比其他單模式分解模型,本文提出的多模式分解模型的預測值與真實值的擬合性能最優(yōu),3 個誤差評價指標相比單模式分解模型明顯降低。
與同樣以該所碳交易價格為研究對象的文獻[20-21]結果做比較,比較結果如表4。由表4 可看出,本文提出的預測模型比文獻[20-21]中的各誤差評價指標均?。夯诙嗄J椒纸釽OA-LSTM 的組合預測模型可以得到更高的預測準確率,在碳交易價格預測領域更具優(yōu)勢。
表4 與其他文獻對比Tab.4 Comparison with other documents
本文提出基于多模式分解WOA-LSTM 的碳交易價格預測模型,以某省碳交易價格為研究對象,通過實驗計算得到以下結論。
(1)使用SSD+VMD+CEEMDAN 的多模式方法分解原始碳交易價格序列,可以得到更能反映碳交易價格序列的深層次變化特征的多層模態(tài)分量,能充分發(fā)揮各種分解方法的優(yōu)勢,降低碳交易價格序列非線性和非平穩(wěn)性對預測準確率的影響。
(2)使用樣本熵法將分解得到的分量重構為新分量后進行預測,減少了預測分量數(shù),提高了運算效率;再引入WOA-LSTM 的組合預測網(wǎng)絡,利用LSTM 時序依賴的特性對輸入向量進行擬合并輸出碳交易價格的預測值。相比其他文獻的方法,WOA-LSTM 預測模型的準確率明顯提升。
碳交易價格預測的準確率是提高碳市場風險管理能力的基礎,也是制定碳金融市場政策的重要依據(jù)。本文對某一個省的碳交易價格進行了實驗預測;該模型也可為其他7 個碳排放交易市場的碳交易價格預測提供一定的參考。