王宇馳, 趙延陽(yáng), 張樹軍
(1.遼寧工程技術(shù)大學(xué)電氣與控制工程學(xué)院, 遼寧 葫蘆島 125105;2.葫蘆島八家礦業(yè)股份有限公司, 遼寧 葫蘆島 125105)
目前,太陽(yáng)能已成為發(fā)展速度最快的新型清潔能源之一,光伏功率預(yù)測(cè)顯得尤為重要,但由于光伏電站中存在多種復(fù)合場(chǎng)對(duì)其影響,并且發(fā)電過程突出的隨機(jī)性,給電力系統(tǒng)的平穩(wěn)運(yùn)行帶來隱患。更換一種貼合目前電力系統(tǒng)的新型預(yù)測(cè)模型,如使用人工魚群算法以及長(zhǎng)短期記憶(long short term memory,LSTM)神經(jīng)網(wǎng)絡(luò)模型對(duì)電力負(fù)荷預(yù)測(cè)進(jìn)行智能尋優(yōu)[1-2],能夠有效遏制存在的多種問題。有學(xué)者已經(jīng)開展了有關(guān)光伏功率預(yù)測(cè)模型的系統(tǒng)性研究,但是,基于LSTM的光伏發(fā)電功率預(yù)測(cè)領(lǐng)域的研究論文相對(duì)于其他核心算法論文較少。
因此,本文將以LSTM 算法為核心,輔以EMD、KPCA 算法進(jìn)行混合,該方法相較其他算法具有明顯的優(yōu)勢(shì),可以提高預(yù)測(cè)的準(zhǔn)度和精密度。
本文采用EMD 及KPCA 的算法來利用環(huán)境序列信息,主成分分析法在不失去具體數(shù)據(jù)的情況下既能降低特征維度,又能提升神經(jīng)網(wǎng)絡(luò)的精確程度和計(jì)算能力,采用LSTM來處理時(shí)間序列數(shù)據(jù)中的長(zhǎng)期依賴關(guān)系,以上三種算法可以更為精密地進(jìn)行光伏功率預(yù)測(cè)的實(shí)驗(yàn)。
經(jīng)驗(yàn)?zāi)B(tài)分解(EmpiricalModeDecomposition,EMD)是依據(jù)數(shù)據(jù)自身的時(shí)間尺度特征來進(jìn)行信號(hào)分解,進(jìn)而獲得數(shù)量不同的本征模函數(shù)。EMD 在處理非線性數(shù)據(jù)上具有明顯的優(yōu)勢(shì),具有較高的信噪比。
EMD 算法的基本步驟如下:
1)初始化[3]:確定一個(gè)原始數(shù)據(jù)序列y(t),找到它所有極大值點(diǎn)作為其上包絡(luò)線,所有極小值點(diǎn)作為其下包絡(luò)線。
2)計(jì)算上包絡(luò)線和下包絡(luò)線的均值s(t),將原始數(shù)據(jù)序列y(t)與上包絡(luò)線和下包絡(luò)線均值s(t)做差,得到第1 個(gè)分量h1(t)=y(t)-s(t)。
3)第二次篩選:h1(t)作為原始數(shù)據(jù)序列,s1(t)是h1(t)上下包絡(luò)線的均值,與步驟(2)類似求出第二個(gè)分量h2(t)。以此類推,得到:hk+1=hk-sk。
4)判斷是否不大于給定的門限,門限在0.2~0.3 之間取值。若n 不大于門限,則令ci=hk(t)。否則,令k=k+1 后,重復(fù)步驟(1),判斷余量是否為單調(diào)函數(shù)。若是,則終止分解。否則,繼續(xù)執(zhí)行。第一個(gè)特征的EMD 分解如圖1 所示。
圖1 第一個(gè)特征的EMD 分解
經(jīng)驗(yàn)?zāi)B(tài)分解后得到的數(shù)據(jù)往往是高維度的,本文采用主成分分析(PrincipalComponentsAnalysis,PCA)將原有的數(shù)據(jù)轉(zhuǎn)換到新的特征空間內(nèi),進(jìn)一步參與核函數(shù)運(yùn)算,從而得到具體的測(cè)試集。
PCA 算法的基本步驟如下:
1)利用線性函數(shù)歸一化來標(biāo)準(zhǔn)化連續(xù)初始變量的范圍,得到標(biāo)準(zhǔn)化矩陣樣本集X,低維空間維數(shù)為m。
3)計(jì)算樣本集中樣本的協(xié)方差矩陣,記作XXT。
4)進(jìn)行協(xié)方差矩陣XXT的特征值分解。
5)得到m個(gè)最大的單位特征向量ω1,ω2,ω3,…,ωm。
6)最后得到投影矩陣,獲得降維后的數(shù)據(jù)W=(ω1,ω2,ω3,…,ωm)。
KPCA 算法在此基礎(chǔ)上進(jìn)一步與核函數(shù)進(jìn)行擬合,設(shè)
利用矩陣K 得出相關(guān)參數(shù),如圖2 所示。
圖2 KPCA 后各特征貢獻(xiàn)率
長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)是在基于RNN 的基礎(chǔ)上,將RNN 的內(nèi)部復(fù)雜化,引入了更多的結(jié)構(gòu)單元,如:輸入門i、遺忘門f、輸出門o和內(nèi)部記憶單元c等,其結(jié)構(gòu)如圖3 所示,包含了四個(gè)交互層。
圖3 LSTM 隱藏層細(xì)胞結(jié)構(gòu)
LSTM的具體算法如下:
1)根據(jù)遺忘門f的公式,得到遺忘門的值ft=σ(Wfxt+Ufht-1+bf)。其中:Wf為權(quán)重矩陣;σ 為sigmoid 函數(shù);ht-1為上一時(shí)刻的隱藏狀態(tài);xt為當(dāng)前輸入;bf為偏置項(xiàng)。
2)通過輸入門i與雙曲正切函數(shù)tanh來決定哪些信息存儲(chǔ)到記憶細(xì)胞中。
3)通過對(duì)it和的匯總,可以得出內(nèi)部記憶單元表達(dá)式Ct=ft·Ct-1+it·。其中:ft為遺忘門輸出;為當(dāng)前輸入的單元狀態(tài);Ct為此刻單元狀態(tài)。
本文通過三種算法互惠的關(guān)系,完成準(zhǔn)確的預(yù)測(cè)。經(jīng)過EMD 分解后,得到多個(gè)IMF,利用KPCA 對(duì)其進(jìn)行降維處理,將KPCA 提取出的特征輸入進(jìn)LSTM中,進(jìn)行數(shù)據(jù)建模。
1)輸入:a為輻射度、b為氣溫、c為氣壓、d為濕度和e為光伏功率。輸出:誤差指標(biāo)RMSE、MAE、MAPE和R2。數(shù)據(jù)清理:北半球光伏功率數(shù)據(jù)e和其余環(huán)境數(shù)據(jù)a、b、c和d進(jìn)行數(shù)據(jù)清理[4]。
2)EMD 算法處理數(shù)據(jù):將收集到的環(huán)境數(shù)據(jù)序列進(jìn)行EMD 分解,得到不同頻率的本征模態(tài)函數(shù)IMF和剩余分量r,把需要的數(shù)據(jù)整理為特征波動(dòng)序列[5]。
3)得到特征波動(dòng)序列后,利用KPCA 降維得到所需要的訓(xùn)練集和測(cè)試集。
4)選取合適的LSTM 函數(shù),把訓(xùn)練集數(shù)據(jù)輸入,進(jìn)一步篩選后得到目標(biāo)準(zhǔn)確率。
5)步驟4)結(jié)束后,其結(jié)果輸入進(jìn)測(cè)試集數(shù)據(jù),得到數(shù)據(jù)結(jié)果,輸出誤差指標(biāo)。
本文以均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)、絕對(duì)百分比誤差中位數(shù)(MAPE)和擬合優(yōu)度(R2)作為評(píng)估誤差指標(biāo),得到基于EMD-KPCA-LSTM的光伏功率預(yù)測(cè)模型,如圖4 所示。
圖4 基于EMD-KPCA-LSTM 的光伏功率預(yù)測(cè)模型
式中:yi為光伏功率真實(shí)值;為光伏功率預(yù)測(cè)值;nsamples為測(cè)試樣本集的數(shù)量。
為驗(yàn)證本文構(gòu)建的EMD-KPCA-LSTM光伏輸出功率預(yù)測(cè)模型具有更穩(wěn)定且明顯的優(yōu)勢(shì),可以提高預(yù)測(cè)的準(zhǔn)度和精密度,本文分別采用EMD 算法、EMD-LSTM 算法和EMD-KPCA-LSTM 聯(lián)合算法對(duì)光伏功率進(jìn)行預(yù)測(cè)。對(duì)比三種模型的預(yù)測(cè)結(jié)果及誤差后可知,EMD-LSTM-LSTM具有較明顯的優(yōu)勢(shì),能很好地減弱環(huán)境因素的消極影響,EMD-KPCA-LSTM預(yù)測(cè)模型的RMSE、MAE 和MAPE 相對(duì)更小,R2的結(jié)果更接近于1。三種算法的訓(xùn)練集、測(cè)試集誤差指標(biāo)對(duì)比如表1 所示,三種模型預(yù)測(cè)結(jié)果、誤差對(duì)比圖如圖5 所示。
表1 三種算法的訓(xùn)練集、測(cè)試集誤差指標(biāo)對(duì)比
圖5 三種模型預(yù)測(cè)結(jié)果及誤差對(duì)比
本文提出的光伏功率預(yù)測(cè)模型與傳統(tǒng)的單一LSTM模型和EMD-LSTM算法進(jìn)行了多元對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明:基于EMD-KPCA-LSTM的光伏功率預(yù)測(cè)模型的波動(dòng)性和標(biāo)準(zhǔn)差均小于其他算法,泛化能力更強(qiáng)。EMD 與KPCA 聯(lián)合使用,可以對(duì)經(jīng)驗(yàn)?zāi)B(tài)分解后得到的難以分析的高維數(shù)據(jù)通過主成分分析法進(jìn)行降維處理,更好地消除實(shí)驗(yàn)數(shù)據(jù)的復(fù)雜性,LSTM成功讓該復(fù)合模型的RMSE、MAE 和MAPE 相對(duì)更小,R2的結(jié)果更接近于1。本文在可實(shí)現(xiàn)的范疇內(nèi),提出的新型算法可以為探究光伏功率預(yù)測(cè)提供一種全新視角,其相關(guān)研究還在進(jìn)一步開展。
現(xiàn)代工業(yè)經(jīng)濟(jì)和信息化2024年2期