朱尤成,王金榮,徐堅(jiān)
(國(guó)電電力云南新能源開(kāi)發(fā)有限公司,云南 昆明 650051)
風(fēng)電的開(kāi)發(fā)利用可減少溫室氣體排放,減輕環(huán)境污染,緩解當(dāng)前的能源危機(jī)[1-2]。由于風(fēng)電具有強(qiáng)隨機(jī)性和間歇性[3],風(fēng)速等影響風(fēng)電功率的因素隨時(shí)間呈現(xiàn)無(wú)規(guī)律的變化,導(dǎo)致風(fēng)電功率難以預(yù)測(cè)[4]。而對(duì)風(fēng)電功率的準(zhǔn)確預(yù)測(cè)不僅是解決風(fēng)電消納的重要手段,也會(huì)增強(qiáng)風(fēng)電在電力市場(chǎng)中的競(jìng)爭(zhēng)力。因此,準(zhǔn)確的風(fēng)電預(yù)測(cè)對(duì)于確定合理的調(diào)度計(jì)劃和確保電網(wǎng)安全經(jīng)濟(jì)運(yùn)行具有重要意義。
針對(duì)此類(lèi)問(wèn)題,國(guó)內(nèi)外已有大量研究。從時(shí)間尺度上,可以分為超短期預(yù)測(cè)(以小時(shí)為單位,預(yù)測(cè)接下來(lái)0~4 h的發(fā)電功率),短期預(yù)測(cè)(以日為單位,預(yù)測(cè)72 h內(nèi)的電力輸出),中長(zhǎng)期預(yù)測(cè)(以月或年為單位)。其中超短期預(yù)測(cè)主要用于風(fēng)電系統(tǒng)的實(shí)時(shí)調(diào)度,短期預(yù)測(cè)主要用于制訂電網(wǎng)的發(fā)電計(jì)劃,中長(zhǎng)期預(yù)測(cè)用于安排大型檢修,而長(zhǎng)期預(yù)測(cè)的主要作用是風(fēng)電場(chǎng)選址評(píng)估。對(duì)于超短期預(yù)測(cè)的工作,文獻(xiàn)[5]提出了一種結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)和門(mén)控循環(huán)單元(gated recurrent units,GRU)網(wǎng)絡(luò)的超短期風(fēng)電預(yù)測(cè)模型,針對(duì)時(shí)間序列進(jìn)行動(dòng)態(tài)時(shí)序建模,完成對(duì)風(fēng)電功率的超短期預(yù)測(cè);文獻(xiàn)[6]建立了一個(gè)基于離散馬爾可夫鏈的超短期風(fēng)電預(yù)測(cè)模型。對(duì)于短期預(yù)測(cè)的工作[7-9],文獻(xiàn)[9]利用宜昌市歷史氣象數(shù)據(jù)、電力負(fù)荷數(shù)據(jù)以及日期類(lèi)型數(shù)據(jù)等建立長(zhǎng)短期記憶(long short term memories,LSTM)網(wǎng)絡(luò)模型,通過(guò)逐步調(diào)優(yōu)試驗(yàn)評(píng)估,提出適用于宜昌電力負(fù)荷預(yù)測(cè)的LSTM網(wǎng)絡(luò)模型方案。目前,很少有針對(duì)中長(zhǎng)期時(shí)間尺度上的研究,一方面由于中長(zhǎng)期風(fēng)電預(yù)測(cè)應(yīng)用場(chǎng)景偏少,僅在少量研究文獻(xiàn)中有所提及[10-11],另一方面我國(guó)風(fēng)電場(chǎng)的發(fā)電量、氣象等數(shù)據(jù)通常只可追溯至前5~7年[7-9],這將導(dǎo)致中長(zhǎng)期預(yù)測(cè)缺少充足的樣本[10,12-14]。文獻(xiàn)[15]建立了基于自適應(yīng)小波神經(jīng)網(wǎng)絡(luò)的長(zhǎng)期風(fēng)力發(fā)電預(yù)測(cè)模型。
針對(duì)目前中長(zhǎng)期風(fēng)電預(yù)測(cè)中樣本稀疏、缺乏通用特征表達(dá)框架、無(wú)法解決長(zhǎng)期依賴(lài)時(shí)間序列的問(wèn)題,本文工作如下:①使用來(lái)自不同地區(qū)4個(gè)風(fēng)電場(chǎng)的特征數(shù)據(jù),在研究適用于云貴高原地區(qū)風(fēng)力發(fā)電預(yù)測(cè)模型的背景下,最大限度擴(kuò)充模型數(shù)據(jù)集,為更好的訓(xùn)練模型、增強(qiáng)模型魯棒性打下基礎(chǔ);②提出一種基于關(guān)聯(lián)結(jié)構(gòu)函數(shù)與神經(jīng)網(wǎng)絡(luò)的特征表示與融合方法,以有效表達(dá)風(fēng)電場(chǎng)氣象因素、地理位置等特征;③提出一種基于LSTM的中長(zhǎng)期發(fā)電量預(yù)測(cè)模型,以有效解決模型對(duì)風(fēng)電場(chǎng)時(shí)間序列數(shù)據(jù)反向傳播時(shí),早期月度數(shù)據(jù)信息缺失的問(wèn)題;④最后對(duì)提出的多維特征提取(feature extraction,F(xiàn)E)-關(guān)聯(lián)函數(shù)(copula,CO)-LSTM(FE-CO-LSTM)融合模型進(jìn)行驗(yàn)證。
影響風(fēng)力發(fā)電量的氣象因素眾多且復(fù)雜,影響因素也各不相同。提高風(fēng)電預(yù)測(cè)精度的關(guān)鍵之一便是有效提取氣象主要特征,風(fēng)電預(yù)測(cè)中氣象特征主要包括:風(fēng)力、氣壓、溫度、濕度。已有的氣象特征分析可以在一定程度上量化氣象因素和風(fēng)力發(fā)電之間的相關(guān)性,但這些基于線性相關(guān)系數(shù)的方法在實(shí)際情況下效果不佳,因?yàn)榇蠖鄶?shù)氣象因素以非線性方式與風(fēng)力發(fā)電相關(guān)。我們使用基于關(guān)聯(lián)結(jié)構(gòu)的方法來(lái)表示氣象變量與風(fēng)力發(fā)電之間的非線性關(guān)系,以提取關(guān)鍵的氣象因素,進(jìn)行后續(xù)的中長(zhǎng)期預(yù)測(cè)建模。
令連續(xù)隨機(jī)變量X和Y分別表示氣象數(shù)據(jù)與歷史風(fēng)電功率,其邊際分布為F(x)和G(y),并且相應(yīng)的關(guān)聯(lián)結(jié)構(gòu)函數(shù)為C(u,v),其中u代表邊際分布F(x),v代表邊際分布G(y)。Kendall等級(jí)相關(guān)系數(shù)τ的定義為
(1)
根據(jù)Spearman等級(jí)相關(guān)系數(shù)ρs的定義[16],使用Copula理論來(lái)計(jì)算ρs,
(2)
式中Ι=[0,1] 。上尾部相關(guān)系數(shù)λup與下尾部相關(guān)系數(shù)λlo的定義如下:
(3)
(4)
(5)
Kendall等級(jí)相關(guān)系數(shù)和Spearman等級(jí)相關(guān)系數(shù)反映了隨機(jī)變量X和Y的一致性程度,并且在嚴(yán)格單調(diào)變換之后保持不變。它們的大小與X和Y的邊際分布無(wú)關(guān),這表明與線性相關(guān)系數(shù)相比,非線性相關(guān)系數(shù)的應(yīng)用范圍將會(huì)更廣。尾部相關(guān)系數(shù)測(cè)量隨機(jī)變量X和Y同時(shí)增加或減少的概率。
在氣象特征分析模型中,使用核密度估計(jì)(kernel density estimation)方法評(píng)估氣象數(shù)據(jù)與歷史風(fēng)電功率的邊際分布〔對(duì)應(yīng)上文中的F(x)和G(y)〕,使用關(guān)聯(lián)結(jié)構(gòu)函數(shù)分別計(jì)算上述4種氣象數(shù)據(jù)與歷史風(fēng)電功率的相關(guān)性,將其結(jié)果作為各氣象特征在神經(jīng)網(wǎng)絡(luò)特征融合模型中的初始權(quán)重。具體步驟為:①使用關(guān)聯(lián)結(jié)構(gòu)函數(shù)建立風(fēng)速和風(fēng)電功率的聯(lián)合分布模型,并采用最大似然估計(jì)法(maximum likelihood estimation,MLE)來(lái)估計(jì)模型的參數(shù);②計(jì)算關(guān)聯(lián)結(jié)構(gòu)函數(shù)的Kendall和Spearman等級(jí)相關(guān)系數(shù);③計(jì)算風(fēng)速與風(fēng)電功率的尾部相關(guān)特征,根據(jù)4種氣象特征分別和風(fēng)電功率的尾部相關(guān)系數(shù),確定特征在神經(jīng)網(wǎng)絡(luò)模型中的初始權(quán)重。
影響風(fēng)電發(fā)電量的因素是多方向性的,機(jī)組在正常運(yùn)行狀態(tài)由于受到天氣和人為因素的影響,會(huì)使得實(shí)際發(fā)電量與理論相比存在差別,因此本文將具體分析影響機(jī)組發(fā)電量的主要因素,包括風(fēng)能潛力、氣溫、氣壓信息、空氣濕度、日期和海拔。其中使用有效風(fēng)能密度、風(fēng)能大小和空氣密度ρ表示風(fēng)能潛力特征,定義有效風(fēng)能密度
(6)
式中:N為各等級(jí)風(fēng)速出現(xiàn)的總次數(shù);vi為i等級(jí)的風(fēng)速;Ni為等級(jí)風(fēng)速vi出現(xiàn)的次數(shù)。
空氣的濕度可以用空氣中所含水蒸汽的密度,即單位體積的空氣中所含水蒸汽的質(zhì)量來(lái)表示。由于直接測(cè)量空氣中水蒸汽的密度比較困難,而水蒸汽的壓強(qiáng)隨水蒸汽密度的增大而增大,所以通常用空氣中水蒸汽的壓強(qiáng)來(lái)表示空氣的濕度。令E為水氣壓,定義相對(duì)濕度
(7)
式中Ew為純水平液面飽和水氣壓。Ew的計(jì)算公式為
(8)
式中:T為絕對(duì)溫度;T1為水的三相點(diǎn)絕對(duì)溫度。
氣溫為風(fēng)電場(chǎng)全年的氣溫統(tǒng)計(jì)數(shù)據(jù),海拔數(shù)據(jù)是風(fēng)電場(chǎng)建設(shè)處海拔高度,二者均為統(tǒng)計(jì)數(shù)據(jù)。
模型的核心思想是使用每日的風(fēng)力信息、氣溫信息、氣壓信息、空氣濕度和風(fēng)電場(chǎng)的海拔信息,預(yù)測(cè)月度和年度發(fā)電量。模型具體實(shí)現(xiàn)步驟為:
a)將采集自氣象站和風(fēng)電場(chǎng)區(qū)域的氣象信息等多維日度數(shù)據(jù)進(jìn)行嵌入表示,構(gòu)造日度特征向量。
b)通過(guò)神經(jīng)網(wǎng)絡(luò)以月為單位將日度特征向量表示為月度特征向量,融合網(wǎng)絡(luò)對(duì)日度特征集融合過(guò)程為
(9)
式中:ci,P為特征P的月度向量表示,i表示月份;wj,P為特征P的日度向量表示,j為當(dāng)月日期數(shù);D為當(dāng)月的總天數(shù);αij為神經(jīng)網(wǎng)絡(luò)中日度特征向量的權(quán)重向量,其中4種氣象特征初始權(quán)重由1.1節(jié)計(jì)算得到的相關(guān)系數(shù)表示。
c)對(duì)多維月度特征進(jìn)行向量表示,表示過(guò)程如圖1所示。其中:風(fēng)能潛力特征由有效風(fēng)能密度、風(fēng)能大小和空氣密度表示;空氣濕度特征由空氣絕對(duì)濕度表示;月度氣壓特征、氣溫與海拔特征則使用當(dāng)?shù)禺?dāng)時(shí)的統(tǒng)計(jì)信息。多種月度特征長(zhǎng)度不一、形式差異較大,因此首先將其表示為可變長(zhǎng)度的低維向量。
圖1 風(fēng)電場(chǎng)特征融合模型圖Fig.1 The framework of wind farm feature fusion model
d)初始化多層感知機(jī)(multilayer perceptron,MLP)網(wǎng)絡(luò),包含1個(gè)輸入層、1個(gè)隱藏層和1個(gè)輸出層,均為全連接網(wǎng)絡(luò)。MLP網(wǎng)絡(luò)接受低維月度特征向量,輸出結(jié)構(gòu)統(tǒng)一的高維特征向量。然后將各類(lèi)高維月度特征向量進(jìn)行拼接,構(gòu)成風(fēng)電場(chǎng)當(dāng)月融合特征向量表達(dá),為后續(xù)LSTM模型的中長(zhǎng)期發(fā)電量預(yù)測(cè)做準(zhǔn)備。
LSTM神經(jīng)網(wǎng)絡(luò)具有長(zhǎng)期記憶功能,可以有效利用有限數(shù)據(jù)樣本的長(zhǎng)期依賴(lài)性[17-18]。它還可以解決遞歸神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)訓(xùn)練過(guò)程中梯度消失導(dǎo)致失去感知遠(yuǎn)距離網(wǎng)絡(luò)單元能力的問(wèn)題。主要思想是使用特殊的神經(jīng)元長(zhǎng)時(shí)間存儲(chǔ)和傳輸信息,以獲得永久性記憶、捕獲長(zhǎng)期依賴(lài)性、減緩時(shí)間序列中信息損失的速度以及增加深度計(jì)算的優(yōu)勢(shì)。LSTM神經(jīng)網(wǎng)絡(luò)可以深入評(píng)估有限數(shù)據(jù)樣本中的長(zhǎng)期依存關(guān)系和趨勢(shì)關(guān)系,適用于數(shù)據(jù)樣本有限的中長(zhǎng)期風(fēng)力發(fā)電預(yù)測(cè)。
LSTM網(wǎng)絡(luò)結(jié)構(gòu)圖如圖2所示。
圖2 LSTM網(wǎng)絡(luò)模型Fig.2 Long and short term memory network model
圖2中:
(10)
LSTM預(yù)測(cè)模型基于風(fēng)電月度特征融合向量,進(jìn)行月度風(fēng)電發(fā)電量預(yù)測(cè)。這一過(guò)程可以表示為
[h(t+1)h(t+2) …h(huán)(t+12)]=FLSTM(h(t),
h(t-1),…,h(t-n),x(t),
x(t-1),…,x(t-n)).
(11)
式中:h(t+1)為當(dāng)前時(shí)刻的預(yù)測(cè)結(jié)果;[h(t+1)h(t+2) …h(huán)(t+12)]為當(dāng)前12個(gè)月發(fā)電量的預(yù)測(cè)向量;h(t),h(t-1),…,h(t-n)為先前時(shí)刻的月度發(fā)電量預(yù)測(cè)結(jié)果;x(t),x(t-1),…,x(t-n)為先前時(shí)刻的輸入,即月度特征融合向量;n為當(dāng)前已輸入的網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)。
本文首先對(duì)風(fēng)電場(chǎng)原始數(shù)據(jù)進(jìn)行日度特征提取,進(jìn)而對(duì)整個(gè)網(wǎng)絡(luò)模型(包括風(fēng)電場(chǎng)月度特征融合模型和發(fā)電量預(yù)測(cè)模型)進(jìn)行訓(xùn)練,最終得到訓(xùn)練好的預(yù)測(cè)模型。具體流程如圖3所示。
圖3 FE-CO-LSTM模型流程Fig.3 Flow chart of the FE-CO-LSTM model
考慮到中長(zhǎng)期風(fēng)電預(yù)測(cè)問(wèn)題缺乏大樣本集,從而導(dǎo)致模型預(yù)測(cè)精度較低,本文收集了我國(guó)云南和貴州共計(jì)4個(gè)風(fēng)電場(chǎng)5~7年的發(fā)電歷史記錄,以及相應(yīng)時(shí)間段內(nèi)該地區(qū)的風(fēng)力、氣壓、濕度、氣溫和海拔信息,數(shù)據(jù)集具體統(tǒng)計(jì)情況見(jiàn)表1。其中,將數(shù)據(jù)中的月度信息作為網(wǎng)絡(luò)中時(shí)間序列的一個(gè)節(jié)點(diǎn)輸入,由表1可見(jiàn),數(shù)據(jù)集中收集的風(fēng)電場(chǎng)數(shù)據(jù)的時(shí)間跨度不同,因此各數(shù)據(jù)集下網(wǎng)絡(luò)的長(zhǎng)度并不相同。云南風(fēng)電場(chǎng)1與貴州風(fēng)電場(chǎng)1為高原地區(qū)風(fēng)電場(chǎng),其數(shù)據(jù)集具有完整風(fēng)力、氣壓、氣溫、濕度、海拔數(shù)據(jù)。云南風(fēng)場(chǎng)2和貴州風(fēng)場(chǎng)2數(shù)據(jù)集分別有濕度數(shù)據(jù)和風(fēng)力數(shù)據(jù)的缺失,在模型特征融合時(shí)仍使用相同方法。
表1 4個(gè)風(fēng)電場(chǎng)數(shù)據(jù)集信息Tab.1 Data set information of four wind farms
為驗(yàn)證模型的有效性,本文選取了基于支持向量機(jī)(support vector machines,SVM)風(fēng)電預(yù)測(cè)方法[19]、基于CNN的風(fēng)電預(yù)測(cè)方法[20]、LSTM(CO)方法(僅使用氣象特征分析和LSTM的網(wǎng)絡(luò)模型)與LSTM(FE)方法[21](基于特征融合方法與LSTM的網(wǎng)絡(luò)模型)作為對(duì)比。
為評(píng)估中長(zhǎng)期風(fēng)電發(fā)電量預(yù)測(cè)模型的準(zhǔn)確性,使用2個(gè)指標(biāo)作為評(píng)估標(biāo)準(zhǔn):一是平均絕對(duì)百分比誤差(mean absolute percentage error,MAPE)KMAPE用于評(píng)估實(shí)時(shí)誤差,另一個(gè)是均方根百分比誤差(root mean squared percentage error,RMSPE)KRMSPE用于評(píng)估預(yù)測(cè)期間的總體誤差。2個(gè)指標(biāo)的計(jì)算式為:
(12)
(13)
式(12)、(13)中:W′i為每月發(fā)電量的預(yù)測(cè)值;Wi為每月的真實(shí)發(fā)電量;m為預(yù)測(cè)的總月份數(shù)。
在4個(gè)風(fēng)電場(chǎng)的數(shù)據(jù)集中,將最后一年的數(shù)據(jù)作為測(cè)試集,其余作為訓(xùn)練集。模型對(duì)測(cè)試集的預(yù)測(cè)結(jié)果如圖4所示,預(yù)測(cè)誤差統(tǒng)計(jì)見(jiàn)表2。
圖4 5種預(yù)測(cè)模型的實(shí)驗(yàn)對(duì)比Fig.4 Experimental comparisons of 5 prediction models
表2 FE-CO-LSTM模型與其他模型預(yù)測(cè)誤差統(tǒng)計(jì)Tab.2 Prediction error statistics of the FE-CO-LSTM model and other models
表2列出了貴州風(fēng)電場(chǎng)1、云南風(fēng)電場(chǎng)1的實(shí)驗(yàn)結(jié)果,進(jìn)一步證明了本文方法的有效性。通過(guò)觀察可知:①FE-CO-LSTM、LSTM(CO)和LSTM(FE)這3種基于LSTM的方法相比SVM、CNN方法大幅減小了誤差;②CNN模型在云南更高海拔地區(qū)的風(fēng)電場(chǎng)1數(shù)據(jù)集上表現(xiàn)出比SVM模型更小的誤差,說(shuō)明對(duì)于高原地區(qū)高海拔、低氣壓、風(fēng)密度低且風(fēng)向變化頻繁的復(fù)雜數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)模型可以學(xué)習(xí)到更好的特征表達(dá);③LSTM(CO)、LSTM(FE)方法的誤差與FE-CO-LSTM方法相比均有所上升,這說(shuō)明氣壓-發(fā)電量相關(guān)度表示與多維度特征融合在LSTM模型中起到提高模型精度的作用。
本文對(duì)云貴高原地區(qū)風(fēng)力發(fā)電量的中長(zhǎng)期預(yù)測(cè)問(wèn)題進(jìn)行了研究,提出了一種基于LSTM的結(jié)合多維特征模型與關(guān)聯(lián)結(jié)構(gòu)函數(shù)的風(fēng)電發(fā)電量預(yù)測(cè)模型,并且在4個(gè)風(fēng)電場(chǎng)數(shù)據(jù)集上進(jìn)行了驗(yàn)證,結(jié)論如下:
a)基于LSTM的方法在所有驗(yàn)證方法中表現(xiàn)最好,說(shuō)明LSTM模型更適用于中長(zhǎng)期風(fēng)電預(yù)測(cè),可以有效解決長(zhǎng)時(shí)依賴(lài),其中本文提出的FE-CO-LSTM模型體現(xiàn)出了最好的預(yù)測(cè)性能。
b)在處理高原地區(qū)高海拔、低氣壓、風(fēng)密度低且風(fēng)向變化頻繁的復(fù)雜風(fēng)電數(shù)據(jù)時(shí),基于深度學(xué)習(xí)的方法表現(xiàn)出比SVM模型更強(qiáng)的學(xué)習(xí)能力。
c)對(duì)于稀疏的風(fēng)電數(shù)據(jù),進(jìn)行氣壓-發(fā)電相關(guān)度分析與特征融合工作可以有效提升模型預(yù)測(cè)性能。
因此,后續(xù)工作可以進(jìn)一步探索云貴高原地區(qū)的氣象數(shù)據(jù)與風(fēng)力發(fā)電的相關(guān)性,挖掘更多數(shù)據(jù)特征,研究風(fēng)電特征融合表示。