唐濱鈞,鄺先驗(yàn),吳 丹
(江西理工大學(xué)電氣工程與自動(dòng)化學(xué)院,江西 贛州 341000)
隨著社會(huì)經(jīng)濟(jì)的發(fā)展,能源能否被有效利用已成為社會(huì)生產(chǎn)方式重大變革的標(biāo)志。我國電力市場(chǎng)正處于新一輪的改革階段。國家發(fā)展改革委建議通過使用大數(shù)據(jù)技術(shù)加強(qiáng)對(duì)電力負(fù)荷的預(yù)測(cè),并通過分析供需關(guān)系提高資源整合的利用率。
根據(jù)檢測(cè)手段的差異,復(fù)雜電力負(fù)荷預(yù)測(cè)又可以分為以下三類方式。第一類是采用時(shí)間序列的大數(shù)據(jù)分析方法,如回歸分析法[1]、卡爾曼濾波法[2]、差分自回歸移動(dòng)平均模型[3]等。這類方法由于利用了數(shù)據(jù)的時(shí)間相關(guān)性,在對(duì)于復(fù)雜多維的用電負(fù)荷檢測(cè)時(shí)無法確保得到很好的預(yù)測(cè)精度。第二類是基于計(jì)算機(jī)智能的預(yù)測(cè)方法,如隨機(jī)森林(random forest,RF)算法[4]、支持向量機(jī)(support vector machine,SVM)[5]、卷積神經(jīng)網(wǎng)絡(luò)[6]、長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)[7]等。這類方法對(duì)隨機(jī)波動(dòng)性較大的負(fù)荷數(shù)據(jù)預(yù)測(cè)具有良好的精確度,但計(jì)算速度需要進(jìn)一步提升。第三類是組合預(yù)測(cè)方法。組合預(yù)測(cè)是通過挖掘各類預(yù)測(cè)方法的有效信息,避免單一方法受隨機(jī)性因素的負(fù)面作用,以達(dá)到有效預(yù)測(cè)的目的。陳振宇[8]提出了通過誤差倒數(shù)法將LSTM網(wǎng)絡(luò)和極端梯度提升(eXtreme gradient boosting,XGBoost)算法組合的預(yù)測(cè)模型。組合預(yù)測(cè)模型在預(yù)測(cè)精度方面優(yōu)于前兩種方法。但這些方法在參變量的取值和優(yōu)化,以及對(duì)短期電力負(fù)荷數(shù)據(jù)的時(shí)序特征的挖掘等方面還需要加以改進(jìn)。
本文提出1種改進(jìn)的雙向LSTM-隨機(jī)森林(improved bi-directional long short-term memory-random forest,+BiLSTM-RF)組合預(yù)測(cè)方法。該方法利用麻雀搜索算法(sparrow search algorithm,SSA)確定變分模態(tài)分解(variable mode decomposition,VMD)中的重要參變量,將原負(fù)荷數(shù)據(jù)分解成多個(gè)子序列。這不僅可以降低電力負(fù)荷的隨機(jī)性和非平穩(wěn)性,還可以避免人為設(shè)置參數(shù)影響預(yù)測(cè)精度。利用雙向LSTM(bi-directional long short-term memory,BiLSTM)網(wǎng)絡(luò)從正、反2個(gè)方向?qū)ψ有蛄羞M(jìn)行特征提取,同時(shí)添加特征注意力機(jī)制,可以進(jìn)一步提升預(yù)測(cè)精度。本文采用公開數(shù)據(jù)集對(duì)該預(yù)測(cè)方法進(jìn)行性能驗(yàn)證,并與其他預(yù)測(cè)模型進(jìn)行對(duì)比。對(duì)比結(jié)果表明,本文方法的精度更高。
電力負(fù)荷具有非周期性和非平穩(wěn)性的特點(diǎn),可以通過VMD將電力負(fù)荷數(shù)據(jù)以非周期信號(hào)進(jìn)行頻域分解,從而把復(fù)雜多變的電力負(fù)荷數(shù)據(jù)分解成多個(gè)諧波信號(hào)。 VMD對(duì)電力負(fù)荷原始數(shù)據(jù)進(jìn)行分解。其分解精度主要取決于模態(tài)分解個(gè)數(shù)k和懲罰因子α。k值設(shè)置過大,會(huì)造成過度分解;k值設(shè)置過小,會(huì)導(dǎo)致信息遺失。α影響每個(gè)模態(tài)分量的帶寬,進(jìn)而影響提取信號(hào)結(jié)果。人為設(shè)置k和α較為困難,且易導(dǎo)致分解結(jié)果的隨機(jī)性。有研究[9]表明,SSA在群智能優(yōu)化算法中的收斂速度、精度和穩(wěn)定性都有較好的表現(xiàn)。為此,本文采用SSA優(yōu)化VMD的參變量。
VMD可以通過確定每個(gè)模態(tài)的最佳中心頻率和有限帶寬對(duì)原始信號(hào)進(jìn)行有效的模態(tài)分解。每個(gè)分量的帶寬可以通過以下步驟估計(jì)。
①構(gòu)造變分問題。
將原始電力負(fù)荷數(shù)據(jù)T分化為k個(gè)模態(tài),且各模態(tài)在其中心頻率的帶寬之和最小,同時(shí)各模態(tài)之和與原數(shù)據(jù)相等。VMD約束變分模型為:
(1)
式中:?t為沖激函數(shù);uk為各模態(tài)函數(shù);ωk為各模態(tài)中心頻率。
②采用拉格朗日乘子λ和α尋找約束變分問題的最優(yōu)解。
擴(kuò)展的拉格朗日表達(dá)式為:
(2)
③各模態(tài)函數(shù)和中心頻率為:
(3)
SSA尋優(yōu)VMD參數(shù)是根據(jù)最小樣本熵[10](sample entropy,SE)原理確定k和α。其步驟如下。
①將給定的長度為N的時(shí)間負(fù)荷序列X={x(1),x(2),…,x(N)}構(gòu)造成m維矢量,即:
X(i)={x(i),x(i+1),…,x(i+m-1)}
(4)
式中:i=1,2,…,N-m+1。
②定義X(i)與X(j)間的最大距離為D,即:
(5)
③給定閾值r(r>0),統(tǒng)計(jì)D (6) ④對(duì)由式(6)得到的結(jié)果求平均,即: (7) ⑤將維數(shù)m加 1,重復(fù)步驟①~步驟④。 ⑥對(duì)于N′個(gè)樣本的時(shí)間負(fù)荷序列,其SE值為: (8) SE值越低,則信號(hào)復(fù)雜度越低、自相似度越高。本文將SE趨于穩(wěn)定的轉(zhuǎn)折點(diǎn)作為VMD的分解次數(shù),以避免過度分解。 BiLSTM由正、反2個(gè)方向的LSTM模型組成。在對(duì)時(shí)間序列預(yù)測(cè)時(shí),不同于由前到后進(jìn)行訓(xùn)練的傳統(tǒng)單向神經(jīng)網(wǎng)絡(luò),BiLSTM通過雙向網(wǎng)絡(luò)對(duì)過去和未來的隱藏層進(jìn)行遞歸反饋,充分挖掘過去和未來時(shí)刻的負(fù)荷數(shù)據(jù)與當(dāng)前數(shù)據(jù)的內(nèi)在聯(lián)系,從而更好地提取內(nèi)部特征、進(jìn)一步提高對(duì)模型精度和數(shù)據(jù)的利用率。BiLSTM模型如圖1所示。 圖1 BiLSTM模型 由圖1可知,BiLSTM相較于LSTM增加了由未來到過去的數(shù)據(jù)傳輸方向,并且與位于正、反2個(gè)方向之間的隱藏層互相獨(dú)立。其相比于LSTM模型展現(xiàn)出了更加優(yōu)越的性能。 注意力機(jī)制如圖2所示。 圖2 注意力機(jī)制 在深度學(xué)習(xí)中,注意力機(jī)制可以通過自適應(yīng)分配不同信息的權(quán)重,提高模型的特征挖掘能力。本文將注意力機(jī)制引入BiLSTM網(wǎng)絡(luò)[11],因此在提取輸入數(shù)據(jù)特征時(shí),可以只提取更為關(guān)鍵的特征,而減少甚至刪除其他次要特征。由此可以提升模型預(yù)測(cè)效率和準(zhǔn)確性,并且提高解決信息過載的能力。 RF是基于Bagging的高效、靈活的算法,是高度集成的機(jī)器學(xué)習(xí)算法。RF的基本理論是從原始樣本中隨機(jī)抽取多個(gè)樣本時(shí),需要建立某種形式的獨(dú)立訓(xùn)練集,進(jìn)而在建立回歸決策樹時(shí)使得每個(gè)決策樹都單獨(dú)產(chǎn)出1個(gè)預(yù)測(cè)值。估計(jì)結(jié)果的最終取值則為每個(gè)決策樹產(chǎn)出的預(yù)測(cè)值的平均數(shù)。 隨機(jī)森林回歸(random forest regressor,RFR)是基于1組決策樹組合的模型。本文假設(shè)從獨(dú)立同分布的隨機(jī)向量(X,Y)中抽取訓(xùn)練集,通過泛化誤差判斷模型的預(yù)測(cè)能力,則任一數(shù)值預(yù)測(cè)值h(x)的均方泛化誤差為: EX,Y=[Y-h(X)]2 (9) 本文假設(shè)t棵決策樹的對(duì)應(yīng)隨機(jī)向量為θt,則當(dāng)t趨近于無窮時(shí),有: (10) (11) 對(duì)于所有的θ,有: (12) 式中:λ為殘差Y-h(X,θ)與Y-h(X,θ′)的相關(guān)系數(shù)。 θ與θ′相互獨(dú)立。由式(12)可知,RF通過相關(guān)系數(shù)λ降低了決策樹的平均泛化誤差。 本文將模型得到的預(yù)測(cè)值與測(cè)試集的真實(shí)值進(jìn)行對(duì)比。模型預(yù)測(cè)由決定系數(shù)(R2)、均方根誤差(root mean squared error,RMSE)、平均絕對(duì)誤差(mean absolute error,MAE)、平均絕對(duì)百分誤差(mean absolute percentage error,MAPE)這4個(gè)回歸評(píng)價(jià)指標(biāo)進(jìn)行評(píng)判。 (13) 根據(jù)R2的取值可以判斷模型的優(yōu)劣。R2的取值范圍為0~1。R2越接近1,則說明模型效果越好。 (14) 式中:Rmse為RMSE值。 由式(14)可知,RMSE表示數(shù)據(jù)點(diǎn)的離散程度。模型精度越高,則Rmse的數(shù)值越小。 (15) 式中:Mae為MAE值。 由式(15)可知,Mae越小,則模型的精確度越高。 (16) 式中:Mape為MAPE值。 如式(16)可知,Mape越小,則模型的精確度越高。 基于SSA優(yōu)化VMD的+BiLSTM-RF預(yù)測(cè)模型如圖3所示。 圖3 +BiLSTM-RF預(yù)測(cè)模型 優(yōu)化的負(fù)荷預(yù)測(cè)模型主要分為4個(gè)步驟。 ①參數(shù)優(yōu)化。通過SSA算法,確定VMD的模態(tài)分解個(gè)數(shù)k值和懲罰因子α。 ②模態(tài)分解。模態(tài)分解將歷史負(fù)荷X′={x1,x2,…,xN}導(dǎo)入經(jīng)過SSA優(yōu)化的VMD,構(gòu)成預(yù)測(cè)模型輸入變量Xk={x(1),x(2)…,x(k)},以降低電力負(fù)荷的隨機(jī)性和非平穩(wěn)性。 ③特征提取。采用具有注意力機(jī)制的BiLSTM網(wǎng)絡(luò)對(duì)各分量進(jìn)行特征提取。 ④負(fù)荷預(yù)測(cè)。負(fù)荷預(yù)測(cè)將BiLSTM提取出的各模態(tài)內(nèi)部特征輸入RF模型,得到各分量模態(tài)的預(yù)測(cè)值Yk={y(1),y(2)…,y(k)};疊加重建后,得到最終的負(fù)荷預(yù)測(cè)結(jié)果。 數(shù)據(jù)集是某地區(qū)2014年11月1日至2015年1月10日每天間隔15 min采集的用電負(fù)荷數(shù)據(jù)。試驗(yàn)將2014年11月1日至12月31日的5 856個(gè)數(shù)據(jù)作為訓(xùn)練樣本、2015年1月1日至1月10日的960個(gè)數(shù)據(jù)作為測(cè)試樣本。試驗(yàn)平臺(tái)裝有NVDIA GeForce GTX 1650 Ti的服務(wù)器。編程采用Python和Matlab實(shí)現(xiàn)。BiLSTM-RF模型通過tensorflow建立。 SSA優(yōu)化算法的初始設(shè)置如下:種群數(shù)量為20個(gè);迭代次數(shù)為30次;k∈[3,8];α∈[100,5000]。 VMD經(jīng)過SSA尋優(yōu)后的參數(shù)組合[k,α]為[4,3 034];各固有模態(tài)函數(shù)(intrinsic model function,IMF)分量的SE分別為0.001 6、0.000 9、0.014 1、0.011 8。 VMD分解后的子模態(tài)曲線如圖4所示。 圖4 子模態(tài)曲線 4.3.1 滑窗寬度對(duì)模型的影響 本文采用滑動(dòng)窗口方法進(jìn)行預(yù)測(cè)。為提高模型預(yù)測(cè)精度,本文對(duì)滑動(dòng)窗口的參數(shù)進(jìn)行了對(duì)比分析。 不同滑窗寬度下的預(yù)測(cè)誤差對(duì)比如表1所示。 表1 不同滑窗寬度下的預(yù)測(cè)誤差對(duì)比 由表1可知,當(dāng)滑窗寬度為5時(shí),+BiLSTM-RF模型在各精度分析指標(biāo)都有較好的表現(xiàn)。 4.3.2 注意力機(jī)制對(duì)模型的影響 為比較注意力機(jī)制對(duì)特征提取優(yōu)化后的+BiLSTM-RF組合模型的預(yù)測(cè)能力的影響,本文在其他條件參數(shù)一致的情況下,對(duì)比注意力機(jī)制添加前后組合模型的預(yù)測(cè)性能。注意力機(jī)制對(duì)模型性能的影響如表2所示。 表2 注意力機(jī)制對(duì)模型性能的影響 由表2可知,當(dāng)滑窗寬度為5時(shí),通過添加注意力機(jī)制能提高本文所提組合模型的精度。 4.3.3 與傳統(tǒng)預(yù)測(cè)模型對(duì)比 為體現(xiàn)本文模型短期負(fù)荷預(yù)測(cè)的性能,本文將所提+BiLSTM-RF與常用的電力負(fù)荷預(yù)測(cè)中的LSTM和門控循環(huán)單元(gated recurrent unit,GRU)、SVM、未經(jīng)優(yōu)化的BiLSTM-RF等預(yù)測(cè)模型進(jìn)行對(duì)比。不同模型誤差對(duì)比如表3所示。 表3 不同模型誤差對(duì)比 不同模型預(yù)測(cè)曲線如圖5所示。 圖5 不同模型預(yù)測(cè)曲線 本文構(gòu)建了基于SSA優(yōu)化的模態(tài)分解后的+BiLSTM-RF短期負(fù)荷預(yù)測(cè)組合模型。本文首先利用最小SE原理確定模態(tài)分解的k和α,將原始電力負(fù)荷數(shù)據(jù)分解為k個(gè)模態(tài);然后利用BiLSTM網(wǎng)絡(luò)和注意力機(jī)制從正、反2個(gè)方向迭代循環(huán)提取有效特征信息;最后利用RF模型進(jìn)行預(yù)測(cè)。本文以某地區(qū)電力負(fù)荷數(shù)據(jù)作為實(shí)際算例進(jìn)行了驗(yàn)證分析。相較于傳統(tǒng)機(jī)器學(xué)習(xí)模型,本文提出的+BiLSTM-RF組合模型有以下優(yōu)點(diǎn):①考慮了負(fù)荷特征的時(shí)序特征;②降低了電力負(fù)荷數(shù)據(jù)隨機(jī)性與非平穩(wěn)性;③對(duì)模型內(nèi)部參數(shù)的取值和優(yōu)化有進(jìn)一步提高;④在短期電力負(fù)荷的預(yù)測(cè)方面與傳統(tǒng)預(yù)測(cè)方法相比有更好的表現(xiàn)。但是由于短期負(fù)荷的預(yù)測(cè)還受氣溫 、降雨、濕度等氣候因素的影響,后續(xù)可以考慮在多維參數(shù)的情況下進(jìn)一步提升短期負(fù)荷預(yù)測(cè)模型的精度。2 基于BiLSTM-RF的預(yù)測(cè)模型
2.1 BiLSTM網(wǎng)絡(luò)
2.2 注意力機(jī)制
2.3 RF網(wǎng)絡(luò)
2.4 模型精度分析
3 短期負(fù)荷預(yù)測(cè)模型
4 試驗(yàn)驗(yàn)證
4.1 試驗(yàn)數(shù)據(jù)與平臺(tái)
4.2 負(fù)荷序列分解
4.3 模型性能評(píng)估與算例分析
5 結(jié)論