陳輝煌,陳志聰,吳麗君,程樹英,林培杰
(福州大學物理與信息工程學院,微納器件與太陽能電池研究所,福建 福州 350108)
近年來,太陽能因其清潔、無污染、豐富和取之不盡的特性受到廣泛關注[1-2]. 根據(jù)國際能源署(IEA)發(fā)布的報告,到2019年底,全球光伏系統(tǒng)的裝機容量至少為627 GW,其中2019年為115 GW[3]. 然而,太陽能的不確定性、間歇性、波動性和不可控性不利于電網(wǎng)的安全穩(wěn)定運行,阻礙了光伏發(fā)電的大規(guī)模應用. 準確預測光伏功率是光伏系統(tǒng)大規(guī)模應用和電網(wǎng)合理規(guī)劃的前提,通過預測光伏發(fā)電量,可以提前配置電網(wǎng),減少太陽能波動對電網(wǎng)的影響[4-5].
根據(jù)使用原理可以將光伏功率預測方法分為物理方法和統(tǒng)計方法兩類. 物理方法首先根據(jù)物理公式建立電廠的物理模型,然后將通過數(shù)值天氣預報獲得的氣象數(shù)據(jù)代入模型以預測發(fā)電廠的功率,它無需歷史數(shù)據(jù),并且可以在電廠實際建設之前獲得電力預測值[6-7]. 但是,該方法在模型構建過程中需要考慮許多因素,比如: 電廠設備本身的參數(shù)、電廠設備的老化、外部環(huán)境的影響等,這使得建模工作變得困難,而且模型的抗干擾能力和魯棒性也較差[8]. 統(tǒng)計方法基于光伏電站的歷史數(shù)據(jù),通過相關分析、參數(shù)估計和曲線擬合來建立預測模型,而對光伏系統(tǒng)的復雜光電轉(zhuǎn)換過程不需要有清晰完整的理解,與物理方法相比,它具有建模簡單、通用性強的優(yōu)點[9].
傳統(tǒng)的統(tǒng)計方法常用的技術有時間序列法[10-11]、模糊邏輯法[12]、回歸分析法[13-15]和馬爾可夫鏈法[16]. 時間序列分析基于系統(tǒng)觀測獲得的時間序列數(shù)據(jù),通過曲線擬合和參數(shù)估計(例如非線性最小二乘)建立數(shù)學模型,可以從時間序列中找出變量的特征和發(fā)展規(guī)律,從而有效預測變量的未來趨勢. 缺點是隨著時間尺度和輸出維度的增加,預測結(jié)果將變差. 模糊邏輯模仿了人腦的不確定性概念判斷和推理思維方式,實現(xiàn)了模糊綜合判斷,解決了傳統(tǒng)方法難以處理的常規(guī)模糊信息問題,不需要建立研究對象的精確數(shù)學模型,從而使模型簡單,易于被接受、理解和應用. 缺點是為復雜系統(tǒng)建立模糊規(guī)則和隸屬函數(shù)非常困難且耗時. 回歸分析利用數(shù)據(jù)統(tǒng)計原理處理大量統(tǒng)計數(shù)據(jù),確定因變量與一些自變量之間的相關性,建立具有良好相關性的回歸方程,可用于預測因變量的未來變化. 但是,回歸方程的形式只是一種推測,這使回歸模型的可靠性在某些情況下降低了. 馬爾可夫鏈是一種典型的隨機過程,模型的當前狀態(tài)僅與其前一時刻的狀態(tài)有關,它使用轉(zhuǎn)移概率矩陣來預測系統(tǒng)的狀態(tài)及其發(fā)展趨勢,盡管某些情況下它可以很好地預測系統(tǒng)狀態(tài),但并不適用于中長期預測.
基于人工智能算法的新型統(tǒng)計方法可有效克服傳統(tǒng)統(tǒng)計方法的缺陷[17-20]. 人工智能模型可以提取高維復雜非線性特征并將其直接映射到輸出,與物理模型和傳統(tǒng)統(tǒng)計模型相比,它在預測準確性、穩(wěn)定性、通用性等方面都有很大的進步[21-23]. 但是,目前的大多數(shù)研究沒有充分結(jié)合不同算法的優(yōu)點,這限制了預測的準確性. 針對這一問題,本研究基于相似日小波變換和多層感知機(wavelet transform on similar days and multilayer perceptron, WTSD-MLP)建立智能光伏功率預測模型,它將小波變換的多分辨率特點和多層感知機(multilayer perceptron, MLP)的非線性擬合能力結(jié)合起來,有效地提高了預報的可靠性. 首先,選取相似日數(shù)據(jù)并歸一化,然后使用小波變換對數(shù)據(jù)進行預處理. 其次,訓練多層感知機模型學習氣象因素與光伏功率之間的映射關系,使用的訓練算法為自適應矩估計算法. 最后,基于沙漠知識澳大利亞太陽能中心(DKASC)的大型數(shù)據(jù)集[24]驗證所提模型的有效性. DKASC于2008年開始運營,位于澳大利亞中部一個擁有豐富太陽能資源的沙漠小鎮(zhèn),是一個光伏電池類型豐富的太陽能技術示范基地.
圖1 設計的總體框圖Fig.1 Overall block diagram of the design
為提高光伏功率預測的準確性,本研究將小波變換的多分辨率特點和多層感知機的非線性擬合能力結(jié)合起來,提出基于相似日小波變換和多層感知機的新型光伏功率預測模型. 實驗過程分為4個步驟:
1) 根據(jù)全局水平輻照度的歐氏距離選取相似日數(shù)據(jù)并歸一化,然后使用小波變換對數(shù)據(jù)進行預處理,將氣象因素和光伏功率數(shù)據(jù)分解成一組分量信號,即近似信號和多個細節(jié)信號.
2) 訓練多層感知機模型學習氣象因素分量信號與對應光伏功率分量信號之間的映射關系,使用這組模型在預測時可以獲得光伏功率各個分量信號的預測值,然后再進行信號重構,即對所有預測分量進行求和,其中,氣象因素為模型輸入,光伏功率為模型輸出,且使用的訓練算法為自適應矩估計算法.
3) 使用訓練好的模型來預測測試集.
4) 使用平均絕對誤差、平均偏差誤差、均方根誤差等6個指標進行模型性能評估和誤差分析,以反映模型綜合性能.
設計的總體方案如圖1所示.
DKASC位于澳大利亞北領地愛麗絲泉(Alice Springs)的沙漠知識區(qū),該技術基地的太陽能發(fā)電設備包含38個站點, 具體信息詳見文獻[24]. 以22號光伏電站(容量為16.8 kW)為研究對象,其詳細信息如表1所示. 自2010/11/8的0:00:00起,電廠數(shù)據(jù)系統(tǒng)全天連續(xù)記錄,每5 min記錄一個數(shù)據(jù)點,本研究下載的數(shù)據(jù)截至2018/11/18的3:45:00. 數(shù)據(jù)包含電氣參數(shù),如所接收的有功電能(kW·h)、電流相位平均(A)、有功功率(kW),以及相關氣象因素.
表1 22號光伏電站的詳細信息
光伏電池是利用光伏效應將太陽輻射轉(zhuǎn)化為電能的設備[25],其發(fā)電量主要受輻照度和溫度的影響,此外,還有許多其他因素會間接影響光伏發(fā)電,例如風速、風向、相對濕度和每日降雨量. 盡管這些因素將在不同程度上影響光伏電站的電力,但如果考慮所有因素,模型的復雜性將會增加,也難以確保這些數(shù)據(jù)的完整性. 本研究通過計算Spearman相關系數(shù)來選擇最佳輸入氣象因素,即計算氣象因素和光伏功率之間的Spearman相關系數(shù),選擇最為相關的4個氣象因素作為模型的輸入,其計算方式如下:
1) 將兩個N維列向量X和Y對應的元素Xi和Yi轉(zhuǎn)換為在各自列向量中的排名,記為R(Xi)和R(Yi);
2) 根據(jù)
(1)
計算兩個列向量X和Y中對應元素的R(Xi)和R(Yi)之間的絕對差異di,并相加得到d;
3) 根據(jù)
(2)
計算出兩個列向量之間的相關性Rs.
使用2018年的光伏電站數(shù)據(jù)進行計算,氣象因素和光伏功率之間的Spearman相關系數(shù)為: 風速NaN; 溫度為0.216; 相對濕度為-0.348; 全局水平輻照度為0.834; 散射水平輻照度為0.334; 風向為0.002; 日降雨量為-0.185. 其中,由于該年風速數(shù)據(jù)全部缺失,無法計算風速的Spearman相關系數(shù). 所以,與光伏功率最為相關的四種氣象因素為: 全局水平輻照度、相對濕度、散射水平輻照度和溫度.
在許多研究中[26-27],相似日法被認為是提高短期功率預測準確性的有效預處理步驟. 在此過程中,選擇相似日的依據(jù)至關重要. 根據(jù)2.2節(jié)中的演算,選擇與光伏功率最為相關的全局水平輻照度作為選擇相似日的依據(jù). 通過計算測試集與訓練集之間全局水平輻照度的歐式距離,選擇訓練集中歐式距離最小的前80%數(shù)據(jù)作為新的訓練集. 歐氏距離的計算如下式所示.
(3)
其中:d是歐氏距離;X1和X2是離散序列,即全局水平輻照度序列;N是樣本數(shù).
由于光伏功率及各種氣象因素的單位各不相同,并且取值范圍變化很大,因此需要進行歸一化以減少誤差. 歸一化公式為:
(4)
其中:y為歸一化后的變量,ymax=1,ymin=0;x為光伏功率或各種氣象因素.
小波變換繼承和發(fā)展了短時傅里葉變換局部化的思想,同時又克服了窗口大小不隨頻率變化等缺點,能夠提供一個隨頻率改變的“時間-頻率”窗口,是進行信號時頻分析和處理的理想工具. 采用Biorthogonal小波系中的bior 6.8對數(shù)據(jù)進行預處理,這個系列的小波函數(shù)具有線性相位性,主要應用在信號與圖像的重構中,利用其將氣象因素和光伏功率數(shù)據(jù)分解成一組分量信號,即近似信號和多個細節(jié)信號.
多層感知機在單層神經(jīng)網(wǎng)絡的基礎上引入了一到多個隱藏層. 隱藏層位于輸入層和輸出層之間,單隱藏層的多層感知機結(jié)構如圖2所示. 多層感知機的參數(shù)通過監(jiān)督學習進行調(diào)整,分為兩個步驟: 正向傳播和反向傳播. 正向傳播的公式如下式所示.
圖2 多層感知機的結(jié)構Fig.2 The structure of multilayer perceptron
ot=g(Vht)
(6)
其中:U和V為權重矩陣;xt是t時刻的輸入向量;ht是t時刻的隱藏層輸出向量;ot是多層感知機在t時刻的輸出向量;g(·)是輸出層的激活函數(shù),通常選擇線性函數(shù);f(·)是隱藏層的激活函數(shù),通常選擇Sigmoid函數(shù),其表達式為:
f(x)=Sigmoid(x)=1×(1+exp(-x))-1
(7)
考慮到功率不會為負,輸出層將在訓練和預測期間選擇不同的激活函數(shù),在訓練期間將選擇線性函數(shù),而預測期間將選擇正線性函數(shù),如下式所示.
(8)
自適應矩估計算法[28]是一種對隨機梯度下降法的擴展,在計算機視覺和自然語言處理的深度學習模型中得到了廣泛應用. 它與經(jīng)典的隨機梯度下降法是不同的,隨機梯度下降保持一個單一的學習速率,用于所有的權重更新,并且在訓練過程中學習速率不會改變; 而自適應矩估計算法的每一個網(wǎng)絡權重都保持一個學習速率,并隨著學習的展開而單獨地進行調(diào)整,該方法利用梯度的一階矩和二階矩計算不同參數(shù)的自適應學習速率.
為了驗證所提基于相似日小波變換和多層感知機的功率預測模型的有效性,將其與普通多層感知機(MLP)[29]、小波神經(jīng)網(wǎng)絡(wavelet neural network, WNN)[30]、長短期記憶網(wǎng)絡(long short-term memory, LSTM)[31]、小波粒子群優(yōu)化支持向量機(wavelet, particle swarm optimization and support vector machine, Wavelet-PSO-SVM)[2]及蟻群優(yōu)化Elman神經(jīng)網(wǎng)絡(ant colony optimization algorithm and Elman neural network, ACOA-Elman)[20]進行了對比. 通過對氣象因素的分析,可知模型的輸入氣象因素為4種,所以輸入層神經(jīng)元數(shù)為4,輸出層神經(jīng)元數(shù)為1. WTSD-MLP、MLP和WNN的隱層數(shù)為3,隱層神經(jīng)元數(shù)為64; ACOA-Elman的隱層數(shù)為2,隱層神經(jīng)元數(shù)為8. 損失函數(shù)為均方誤差MSE,訓練迭代次數(shù)為100. WTSD-MLP、MLP、WNN和LSTM的訓練算法為自適應矩估計算法(該算法有3個內(nèi)部參數(shù):β1和β2為指數(shù)衰減率,其值分別是0.9和0.999;ε為一個避免除以零而使用的小數(shù),通常為10-8); ACOA-Elman的訓練算法為量化共軛梯度法.
平均絕對誤差(mean absolute error, MAE)、平均偏差誤差(mean bias error, MBE)、均方根誤差(root mean square error, RMSE)、平均絕對百分比誤差(mean absolute percentage error, MAPE)、皮爾遜系數(shù)(R2)和技能得分(skill score, SS)來評估模型的性能,如下所示.
(9)
其中:Ppred是預測功率;Pmeas是實測功率;N是樣本數(shù);P0是發(fā)電廠的容量; MAE0是基準模型的平均絕對誤差; MBE0是基準模型的平均偏差誤差; RMSE0是基準模型的均方根誤差; MAE1是對比模型的平均絕對誤差; MBE1是對比模型的平均偏差誤差; RMSE1是對比模型的均方根誤差; 且基準模型為普通多層感知機,對比模型為包含本文所提模型在內(nèi)的另外五種模型.
為了驗證本模型的有效性,以DKASC的22號光伏電站為研究對象進行了對比實驗,將數(shù)據(jù)集分為兩類: 訓練集和測試集. 考慮到光伏電池將隨著時間的流逝而老化,本實驗使用2018年的數(shù)據(jù)更真實地反映光伏電站的最新狀態(tài). 隨機選擇測試集如下: 春天選擇2018/09/29; 夏天選擇2018/02/08; 秋天選擇2018/05/21; 冬天選擇2018/08/21. 并將測試集之前20 d的白天數(shù)據(jù)(6:00—19:00)選擇為訓練集. 通常,預測分辨率為15 min可以滿足市場需求,因此上述數(shù)據(jù)的時間間隔為15 min. 四個季節(jié)的光伏功率預測結(jié)果曲線圖如圖3所示,對應的誤差詳細信息如表2所示.
圖3 四個季節(jié)的光伏功率預測結(jié)果曲線Fig.3 PV power forecast results in four seasons
表2 四個季節(jié)下六種模型光伏功率預測的實驗結(jié)果
從表2中的實驗結(jié)果可知,對于典型的指標RMSE,MLP模型為0.128~1.308 kW,平均為0.783 kW; WNN模型為0.136~1.159 kW,平均為0.793 kW; LSTM模型為0.208~1.445 kW,平均為 0.847 kW; Wavelet-PSO-SVM模型為0.132~1.045 kW,平均為0.674 kW; ACOA-Elman模型為0.144~1.467 kW,平均為0.883 kW; WTSD-MLP模型為0.103~0.836 kW,平均為0.538 kW. 對于結(jié)合了MAE、MBE和RMSE三者的綜合評價指標SS,MLP模型為基準模型,所以為0; WNN模型為-0.402~0.172,平均為-0.001; LSTM模型為-0.607~0.095,平均為-0.101; Wavelet-PSO-SVM模型為0.033~0.340,平均為0.170; ACOA-Elman模型為-0.312~0.272,平均為0.045; WTSD-MLP模型為0.221~0.427,平均為0.284. 綜上所述,本模型總體預測效果要好于其他的對比模型,從SS來看,相較于MLP、WNN、LSTM、Wavelet-PSO-SVM和ACOA-Elman平均分別改善了28.4%、28.5%、38.5%、11.4%和23.9%.
基于相似日小波變換和多層感知機建立了以15 min為間隔的短期光伏功率預測模型. 首先,選取相似日數(shù)據(jù)并歸一化,然后使用小波變換對數(shù)據(jù)進行預處理. 其次,訓練多層感知機模型學習氣象因素與光伏功率之間的映射關系,使用的訓練算法為自適應矩估計算法. 最后,為了驗證所提出模型的有效性,基于沙漠知識澳大利亞太陽能中心的實際大型數(shù)據(jù)集,將所提出的模型與基于多層感知機、小波神經(jīng)網(wǎng)絡和長短期記憶網(wǎng)絡的其他預測模型進行了比較. 實驗結(jié)果中的技能得分表明,本預測模型相較于多層感知機、小波神經(jīng)網(wǎng)絡、長短期記憶網(wǎng)絡、Wavelet-PSO-SVM和ACOA-Elman平均分別改善了28.4%、28.5%、38.5%、11.4%和23.9%,在預測準確性和可靠性方面具有更好的性能.