陳凡,李智,丁津津,樊磊,伍駿杰
(1.國(guó)網(wǎng)安徽省電力有限公司,合肥 230601;2.國(guó)網(wǎng)安徽省電力有限公司電力科學(xué)研究院,合肥 230601;3.安徽大學(xué)電氣工程與自動(dòng)化學(xué)院,合肥 230601)
光伏的高效利用是新能源生產(chǎn)和發(fā)展的重要推動(dòng)力。但是光伏場(chǎng)站因?yàn)樘鞖庖约碍h(huán)境等因素,使得光伏功率具有波動(dòng)性與不穩(wěn)定性,對(duì)光伏場(chǎng)站高效運(yùn)行造成一定影響[1-2]。因此,光伏功率的精確預(yù)測(cè)對(duì)電網(wǎng)的穩(wěn)定運(yùn)行以及調(diào)度有著重要意義。
目前,光伏功率預(yù)測(cè)經(jīng)過(guò)不斷的發(fā)展,有相對(duì)成熟的預(yù)測(cè)方法,總體可以分成兩大類。第一種是機(jī)理驅(qū)動(dòng)方法,主要包含天氣氣象數(shù)據(jù)以及光伏廠站的參數(shù),根據(jù)光伏物理原理建立的模型[3]。另一種則是數(shù)據(jù)驅(qū)動(dòng)預(yù)測(cè)方法,主要是由歷史氣象數(shù)據(jù)之間映射關(guān)系通過(guò)算法建立的模型[4]。
機(jī)理模型的提出主要是探索光伏功率與天氣條件之間的物理關(guān)系,提出的物理模型是關(guān)于天氣條件的函數(shù)[5],并根據(jù)光伏電廠所提供的氣象數(shù)據(jù)對(duì)函數(shù)的參數(shù)進(jìn)行回歸擬合?,F(xiàn)有文獻(xiàn)主要研究的是光伏系統(tǒng)的精確建模,但是實(shí)際的光伏系統(tǒng)由于具有時(shí)變性與時(shí)變參數(shù)[6],光伏建模往往都十分復(fù)雜?;趶?fù)雜的物理模型進(jìn)行的回歸擬合不能提供令人滿意的性能,尤其是在天氣變化復(fù)雜的陰天與雨天[7]。文獻(xiàn)[8]提出了單二極管模型的修正電流-電壓關(guān)系。該模型從單個(gè)太陽(yáng)能電池開(kāi)始,擴(kuò)展到光伏模塊,然后擴(kuò)展到光伏陣列。模型參數(shù)與不同輻照度和溫度水平下的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行回歸。文獻(xiàn)[9]建立了光伏功率和天氣條件之間的經(jīng)驗(yàn)?zāi)P?包括輻照度、環(huán)境溫度和濕度。然后,使用光伏組件的實(shí)際觀測(cè)值回歸該模型的參數(shù)。但是,機(jī)理模型包含的物理耦合關(guān)系卻沒(méi)有運(yùn)用于數(shù)據(jù)驅(qū)動(dòng)引擎預(yù)測(cè)模型中。
數(shù)據(jù)驅(qū)動(dòng)的提出主要是通過(guò)歷史氣象數(shù)據(jù)之間的映射關(guān)系實(shí)現(xiàn)功率的精準(zhǔn)預(yù)測(cè)。文獻(xiàn)[10]提出了基于小波神經(jīng)網(wǎng)絡(luò)的光伏功率預(yù)測(cè),但是其的缺陷主要是歷史數(shù)據(jù)的時(shí)間相關(guān)性并沒(méi)有充分考慮。文獻(xiàn)[11]將支持向量機(jī)用于學(xué)習(xí)衛(wèi)星圖像和光伏功率之間的天氣條件映射,相對(duì)提高了預(yù)測(cè)準(zhǔn)確性。文獻(xiàn)[12]提出了卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)又進(jìn)一步提高了功率預(yù)測(cè)技術(shù)。但是RNN存在的梯度爆炸與梯度消失的缺點(diǎn)。鑒于此,文獻(xiàn)[13]提出了LSTM-RNN新型深度學(xué)習(xí)網(wǎng)絡(luò)的光伏發(fā)電預(yù)測(cè)模型,長(zhǎng)短期記憶網(wǎng)絡(luò)(long short term memory networks,LSTM)是在RNN基礎(chǔ)進(jìn)行了改進(jìn),LSTM可以使用在先前時(shí)間步驟中學(xué)習(xí)到的信息來(lái)預(yù)測(cè)當(dāng)前值,有效地解決了梯度爆炸和梯度消失的缺陷。現(xiàn)有文獻(xiàn)大多側(cè)重于提高數(shù)據(jù)的學(xué)習(xí)能力從而提高預(yù)測(cè)能力。但是,數(shù)值天氣預(yù)報(bào)中的天氣條件作為數(shù)據(jù)驅(qū)動(dòng)輸入,沒(méi)有考慮天氣條件之間的耦合關(guān)系,這些耦合關(guān)系可以從第一種機(jī)理模型的物理特性中得到[14]。
光伏系統(tǒng)的物理建??梢詾楣夥β暑A(yù)測(cè)提供物理耦合關(guān)系,數(shù)據(jù)驅(qū)動(dòng)可以有效捕捉光伏系統(tǒng)的非線性和時(shí)變參數(shù)。為了充分利用這兩種方法的優(yōu)點(diǎn),提出一種新的光伏功率預(yù)測(cè)方法。提出的方法包括:①光伏系統(tǒng)的物理建模;②映射氣象數(shù)據(jù)和光伏功率的數(shù)據(jù)驅(qū)動(dòng)方法;③根據(jù)機(jī)理模型可以生成關(guān)鍵天氣特征,然后數(shù)據(jù)驅(qū)動(dòng)方法利用這些關(guān)鍵特征來(lái)提高預(yù)測(cè)精度。本文將光伏機(jī)理和數(shù)據(jù)驅(qū)動(dòng)結(jié)合,充分考慮了兩種常用模型的優(yōu)缺陷,大大提高預(yù)測(cè)精度。
所提的光伏發(fā)電量預(yù)測(cè)方法的結(jié)構(gòu)如圖1所示。其主要思想是利用所分析的物理建模中獲取關(guān)鍵天氣特征,重新構(gòu)造數(shù)據(jù)驅(qū)動(dòng)方法的輸入。通過(guò)這種方式,物理建模中的物理特征可以幫助提高機(jī)數(shù)據(jù)驅(qū)動(dòng)的性能。
f為光伏機(jī)理模型圖1 光伏功率預(yù)測(cè)方法的結(jié)構(gòu)Fig.1 The structure of the proposed solar power forecasting approach
在分析以及構(gòu)建物理模型中,從理論中推導(dǎo)出與光伏發(fā)電相關(guān)的關(guān)鍵天氣因素。同時(shí)根據(jù)天氣預(yù)報(bào),可以計(jì)算輻照度和光伏電池溫度的不同分量。然后,可以從輻照度和電池溫度中得出關(guān)鍵的天氣特征。由于這些關(guān)鍵天氣特征與太陽(yáng)能具有很強(qiáng)的相關(guān)性,因此將這些關(guān)鍵特征和其他可用天氣預(yù)測(cè)結(jié)合起來(lái),作為數(shù)據(jù)驅(qū)動(dòng)的輸入。
采用國(guó)家可再生能源實(shí)驗(yàn)室提供的光伏系統(tǒng)物理模型,該模型被廣泛用于在線光伏性能應(yīng)用[15],可表示為
Pmp=CSTDEPOA[1+CT(TC-T0)]
(1)
式(1)中:CSTD=P0CSF/E0,其中,E0為參考輻照度,取1 000 W/m2;P0為標(biāo)準(zhǔn)天氣條件下的參考功率;CSF∈[0,1]為光伏系統(tǒng)的臟污系數(shù),光伏系統(tǒng)表面越干凈,CSF越大;Pmp為光伏功率輸出;CT為溫度系數(shù);T0為基準(zhǔn)溫度(25°C);陣列輻照度平面EPOA和光伏電池溫度TC是兩個(gè)主要的天氣特征。
EPOA由3個(gè)部分組成:波束部分Eb、地面反射部分Eg和晴空漫反射部分Ed,可表示為
EPOA=Eb+Eg+Ed
(2)
Eb是太陽(yáng)對(duì)光伏陣列的直接輻照度,與直接法向輻照度EDNI和入射角θAOI有關(guān),可表示為
Eb=EDNIcosθAOI
(3)
式(3)中:θAOI所在位置是太陽(yáng)光線與光伏陣列之間的角度,由小時(shí)角、偏角和天頂角確定。
Eg是光伏陣列上從地面反射的輻照度,與全球水平輻照度EGHI相關(guān),可表示為
Eg=CGREGHl
(4)
式(4)中:CGR為常數(shù)因子,由地面反射率和地面傾斜確定。
Ed是來(lái)自天空?qǐng)A頂?shù)穆瓷漭椪斩鹊囊徊糠?與漫反射水平輻照度EDHI相關(guān),各向同性天空模型可表示為
Ed=CSKYEDHI
(5)
式(5)中:CSKY=0.5(1+cosθT,array),其中θT,array為光伏板的傾斜角。
實(shí)際上,全球衛(wèi)星圖像可以觀測(cè)和預(yù)測(cè)EGHI。然后,給定EGHI,可以根據(jù)現(xiàn)有研究估算EDNI和EDHI的值。采用經(jīng)驗(yàn)?zāi)P?從EGHI估算EDNI和EDHI,可簡(jiǎn)化為
(6)
式(6)中:EDNI為直射輻照度;EGHI為水平總輻照度;fDNI(·)為EDNI的估計(jì)函數(shù)。
因此,EPOA可以從3個(gè)輻照度分量中得
EPOA=Eb+Eg+Ed=Eb+CGREGHI+CSKYEDHI
(7)
光伏電池的溫度可以根據(jù)與周圍環(huán)境的熱傳遞推導(dǎo)出來(lái),可表示為
(8)
式(8)中:TA為環(huán)境溫度;CTE為與光伏系統(tǒng)吸附效率相關(guān)的常數(shù)因子;VW為風(fēng)速;CW0和CW1分別為常數(shù)傳熱因子和對(duì)流熱因子,分別取25、6.84 W/m3·s·K。
在實(shí)踐中,一些參數(shù)很難在沒(méi)有現(xiàn)場(chǎng)試驗(yàn)的情況下精確獲取,如CGR和CTE。因此,根據(jù)式(7)、式(8),Eb、EGHI、EDHI、TA和VW作為變量來(lái)代替EPOA和TC。然后式(1)可重新表示為
Pmp=CSTDEPOA[1+CT(TC-T0)]
=(k1+k2TA)(Eb+k3EGHI+k4EDHl)+
(9)
式(9)中:ki為回歸的常數(shù)系數(shù),i=1,2,…,5。
給定T個(gè)歷史觀測(cè)值,Eb、EGHI、EDHI和TA的矩陣形式可寫成Eb、EGHI、EDHI、TA∈RT×1,給予E=(Eb,EGHI,EDHI)∈RT×3。為簡(jiǎn)化,Vw2可表示為
(10)
因此,物理建模生成的關(guān)鍵天氣特征矩陣XC為
XC=[E,diag(TA)E,diag(Vw2)E2]∈RT×12
(11)
E2=[Eb(t)2,EGHI(t)2,EDHI(t)2,
Eb(t)EGHI(t)EGHI(t)EDHI(t),
EDHI(t)Eb(t)],t=1,2,…,T
(12)
從上述提出的物理模型可以生成與太陽(yáng)高度相關(guān)的關(guān)鍵天氣特征,事實(shí)上從天氣預(yù)報(bào)中獲得其他天氣預(yù)測(cè)受很多因素影響,這些極大影響了精確性,因此將獲得關(guān)鍵天氣特征與其他天氣預(yù)測(cè)一起作為數(shù)據(jù)驅(qū)動(dòng)的輸入。與現(xiàn)有的預(yù)測(cè)方法相比,物理建模中的關(guān)鍵天氣因素用于重新表述數(shù)據(jù)驅(qū)動(dòng)的輸入,而不是直接輸入天氣預(yù)測(cè)。
在算法理論中,主成分分析(principal component analysis,PCA)用于主要的特征提取[16]。臨近算法(K-nearest neighbor,KNN)用于將預(yù)測(cè)期劃分為天氣條件最接近的歷史期。然后使用LSTM、加權(quán)KNN和GA-BP神經(jīng)網(wǎng)絡(luò)作為數(shù)據(jù)驅(qū)動(dòng)的引擎。示意圖如圖2所示。
圖2 數(shù)據(jù)驅(qū)動(dòng)原理示意圖Fig.2 Schematic of data drive princip
由圖2可知,輸入的特征矩陣XI∈RT×N由上文物理模型得到的關(guān)鍵天氣特征矩陣XC和其他天氣預(yù)報(bào)得到的可用天氣預(yù)測(cè)組成。輸入的特征矩陣XI的每一行代表每一個(gè)歷史時(shí)期,每一列代表每一個(gè)特征值。在經(jīng)過(guò)PCA主成分分析之后歷史和預(yù)測(cè)的主成分矩陣被提取出來(lái),歷史主成分矩陣為XP∈RT×L,預(yù)測(cè)主成分矩陣為XPF∈RH×L。對(duì)于從1~H的每個(gè)預(yù)測(cè)周期,從XP中獲取XPF中每行的K個(gè)最相鄰歷史數(shù)據(jù)。然后使用3個(gè)數(shù)據(jù)驅(qū)動(dòng)引擎來(lái)學(xué)習(xí)這K個(gè)最相鄰的主要特征和光伏發(fā)電功率之間的映射。得出的映射將用于預(yù)測(cè)光伏發(fā)電。
PCA是實(shí)現(xiàn)高度相關(guān)的數(shù)據(jù)降維和去噪的有力工具。由于冗余數(shù)據(jù)和噪聲影響預(yù)測(cè)精度,使用PCA提取天氣特征的主成分,同時(shí)消除冗余[17]。
PCA的第一步是以式(13)標(biāo)準(zhǔn)化XI的每一列。
(13)
然后,應(yīng)用SVD(奇異值分解)提取主成分XP和XPF。KNN的目的是將一個(gè)預(yù)測(cè)期劃分為K個(gè)具有最近天氣條件的歷史期。這一步被稱為相似日選擇[18]。
在現(xiàn)有研究中,已廣泛證實(shí)天氣條件和光伏功率之間的關(guān)系高度依賴于天氣類型,15 min間隔的光伏功率預(yù)測(cè)的歸一化均方根誤差(nRMSE)晴天為7.85%,陰天為9.12%,雨天為12.40%,霧天為12.60%[19]。因此,將預(yù)測(cè)期劃分為一組具有最近天氣條件的歷史期是很重要的一步。選擇曼哈頓距離(MD)作為預(yù)測(cè)和歷史實(shí)例之間的測(cè)量值。
MD(XPF[i,·],XP[j,·])=
(14)
對(duì)于1~H的預(yù)測(cè)期,從XP中選擇具有最小MD的K個(gè)歷史實(shí)例。但是KNN中的K值對(duì)預(yù)測(cè)精度是有影響。如果K值太小,由于樣本量小,訓(xùn)練數(shù)據(jù)集將不足;如果K值太大,則會(huì)在訓(xùn)練數(shù)據(jù)集中選擇不相關(guān)的歷史周期,從而增加預(yù)測(cè)誤差。因此,在對(duì)歷史數(shù)據(jù)集進(jìn)行交叉驗(yàn)證的過(guò)程中通過(guò)進(jìn)行敏感性分析以確定該值。
提出的3種數(shù)據(jù)驅(qū)動(dòng)引擎LSTM、加權(quán)KNN和GA-BP神經(jīng)網(wǎng)絡(luò)。
LSTM的每個(gè)細(xì)胞共有遺忘門、輸入門和輸出門[20],分別決定信息的過(guò)濾、保存和生成,完整結(jié)構(gòu)如圖3所示。
xt為當(dāng)前時(shí)刻輸入向量;yt為當(dāng)前時(shí)刻輸出向量;ht、ht-1分別為當(dāng)前時(shí)刻和上一時(shí)刻隱藏層輸出信息;Ct、Ct-1分別為當(dāng)前時(shí)刻和上一時(shí)刻的存儲(chǔ)單元信息;σ為sigmoid函數(shù);tanh為激活函數(shù);it、ot、ft分別為輸入門、輸出門和遺忘門圖3 LSTM結(jié)構(gòu)單元Fig.3 LSTM structure unit
(1)通過(guò)遺忘門確定分解后的各IMF分量中需要濾除的信息部分。將當(dāng)前輸入和上一時(shí)刻狀態(tài)通過(guò)sigmoid函數(shù)確定是否過(guò)濾。
ft=σ(Wf[ht-1,xt]+bf)
(15)
式(15)中:Wf為遺忘門對(duì)輸入向量xt的權(quán)重;bf為偏置向量。
it=σ(Wi[ht-1,xt]+bi)
(16)
(17)
(18)
式中:Wi、WC為不同門控機(jī)制對(duì)輸入向量xt的權(quán)重;bi、bC為偏置向量。
(3)首先由sigmoid函數(shù)確定單元輸出部分,再將單元狀態(tài)通過(guò)tanh和sigmoid門輸出部分相乘得到模型的預(yù)測(cè)值點(diǎn)。
ot=σ(Wo[ht-1,xt]+bo)
(19)
式(19)中:Wo為輸出門對(duì)輸入向量xt的權(quán)重;bo為偏置向量。
ht=ottanhCt
(20)
反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)是應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)之一。反向傳播遺傳算法優(yōu)化(genetic algorithms-back propagation,GA-BP)神經(jīng)網(wǎng)絡(luò)采用多層前饋拓?fù)浣Y(jié)構(gòu),其基本結(jié)構(gòu)是輸入層、隱藏層和輸出層的三層網(wǎng)絡(luò)[21]。
KNN尋找到K個(gè)最近鄰近的歷史數(shù)據(jù),然后利用加權(quán)KNN通過(guò)指數(shù)函數(shù)加權(quán)的平均值計(jì)算預(yù)測(cè)的光伏發(fā)電功率[22]。
在實(shí)踐生產(chǎn)活中,光伏系統(tǒng)的控制方案主要是在控制其逆變器以最大功率點(diǎn)跟蹤(MPPT)模式工作[23]。然而,在多雨、多霧和多云的天氣,就會(huì)很難立即跟蹤最大功率點(diǎn)。這些不穩(wěn)定的天氣條件都會(huì)極大地影響光伏系統(tǒng)中逆變器的性能。因此,在現(xiàn)實(shí)世界中,光伏發(fā)電功率預(yù)測(cè)的系統(tǒng)偏差是不可避免的。為了減少系統(tǒng)偏差造成的誤差,對(duì)歷史數(shù)據(jù)集進(jìn)行了基于交叉驗(yàn)證的偏差分析。然后生成補(bǔ)償項(xiàng)以調(diào)整預(yù)測(cè)的光伏功率Pmp。預(yù)測(cè)期t的偏差分析流程如圖4所示。
圖4 誤差修正流程Fig.4 Error correction process
為了驗(yàn)證所提方法的實(shí)際效果,采用安徽某個(gè)地區(qū)的光伏發(fā)電站的數(shù)據(jù)集進(jìn)行仿真分析。氣象數(shù)據(jù)包括相對(duì)濕度、總云量、風(fēng)速、溫度、表面熱輻射、頂凈太陽(yáng)輻射和總降水量等。
圖5為L(zhǎng)STM、加權(quán)KNN和GA-BP3種神經(jīng)網(wǎng)絡(luò)算法采用本文模型在晴天、陰天、雨天3種不同天氣條件下的對(duì)比。可以看出,運(yùn)用所提出的模型可以以相對(duì)提高光伏發(fā)電功率預(yù)測(cè)的精度。
S1為L(zhǎng)STM神經(jīng)網(wǎng)絡(luò)加入關(guān)鍵天氣特征;S2為未加入關(guān)鍵天氣特征;A1、W1分別為加權(quán)KNN和GA-BP加入關(guān)鍵天氣特征;A2、W2分別為加權(quán)KNN和GA-BP未加入關(guān)鍵天氣特征圖5 3種天氣類型下不同算法仿真圖Fig.5 Simulation diagrams of different algorithms under three weather types
主要的預(yù)測(cè)指標(biāo)為:歸一化均方根誤差(nRMSE)、歸一化平均絕對(duì)誤差(nMAE)、歸一化最大絕對(duì)誤差(nLAE),如表1所示。從預(yù)測(cè)結(jié)果指標(biāo)來(lái)看,使用所提出的方法可以相對(duì)高的精度預(yù)測(cè)光伏發(fā)電功率,通過(guò)在晴天條件下比較S1與S2、A1與A2和W1與W2,可以觀察到增加關(guān)鍵天氣特征大大減少光伏功率預(yù)測(cè)的誤差。但是,在陰天和雨天的天氣條件下,由于光伏物理建模的精度降低,關(guān)鍵天氣特征無(wú)法精確計(jì)算,預(yù)測(cè)的精度相較于未加入關(guān)鍵天氣特征提高并不顯著。因此,所提出的方法在實(shí)際功率和預(yù)測(cè)功率之間有很好的匹配,主要的原因是考慮了關(guān)鍵的天氣特征,預(yù)測(cè)性能提高。
表1 3種天氣類型的預(yù)測(cè)評(píng)價(jià)指標(biāo)Table 1 Forecast evaluation index of three weather types
(1)通過(guò)探索光伏物理模型建的關(guān)鍵天氣因素,提出了一種新的光伏發(fā)電功率預(yù)測(cè)方法。光伏系統(tǒng)的物理模型可以提供有關(guān)光伏發(fā)電的物理知識(shí),數(shù)據(jù)驅(qū)動(dòng)方法探索實(shí)際光伏系統(tǒng)的非線性和時(shí)變特性。與現(xiàn)有方法相比,數(shù)據(jù)驅(qū)動(dòng)方法的輸入是使用關(guān)鍵天氣特征和可用天氣預(yù)測(cè)重新編制的。為了進(jìn)一步減少預(yù)測(cè)誤差,對(duì)歷史數(shù)據(jù)集進(jìn)行誤差修正,以提高光伏發(fā)電功率的精度。
(2)通過(guò)安徽某地區(qū)實(shí)測(cè)數(shù)據(jù)集的案例仿真,證明了提出的新型光伏發(fā)電預(yù)測(cè)方法相較于傳統(tǒng)的數(shù)據(jù)驅(qū)動(dòng)預(yù)測(cè)方法有了相對(duì)提升。后續(xù)工作可以從不同光伏物理模型得出的關(guān)鍵天氣因素進(jìn)行對(duì)比分析。