王建銘,侯北平,邊 琛
目前隨著全球的快速發(fā)展,地球上大量不可再生能源被快速消耗,石油等化石燃料消耗的同時(shí),還有伴隨產(chǎn)生嚴(yán)重的大氣污染和工業(yè)垃圾。為符合可持續(xù)發(fā)展、健康綠色發(fā)展的目標(biāo),各種各樣新型清潔能源已經(jīng)受到各國越來越廣泛的關(guān)注。太陽能作為一種取之不盡用之不竭的清潔能源[1],已經(jīng)在許多國家被廣泛開發(fā)使用。伏發(fā)電并被大規(guī)模接入國家電網(wǎng)。截至2019年底,亞洲地區(qū)光伏裝機(jī)容量為330 131MW,占全球光伏裝機(jī)容量56.9%;其次為歐洲地區(qū),光伏裝機(jī)容量為138 266MW,占全球光伏裝機(jī)容量的23.8%。據(jù)國際能源署預(yù)測,到2050年太陽能發(fā)電將占全球發(fā)電總量的20%~25%,將成為人類的基礎(chǔ)能源之一。但光伏發(fā)電的出力功率主要受太陽輻射影響,太陽輻射由于受到天空中云與太陽之間的距離、氣溶膠、風(fēng)速、風(fēng)向等氣象要素隨機(jī)性變化影響,具有明顯的波動性和不確定性[2]。光伏發(fā)電系統(tǒng)相對于地區(qū)電網(wǎng)將是一個不可控源,其發(fā)電的波動性和隨機(jī)性會對地區(qū)電網(wǎng)造成巨大沖擊,導(dǎo)致輸出功率的不連續(xù)和不確定,從而影響電網(wǎng)穩(wěn)定、降低電力質(zhì)量。有些地方為了防止電網(wǎng)波動,就主動舍棄部分太陽能,棄光現(xiàn)象普遍存在。因此光伏功率預(yù)測變得尤為重要[3]。在并網(wǎng)過程中,光伏功率預(yù)測越準(zhǔn),給電網(wǎng)安全運(yùn)行帶來的影響就越小,有效地幫助電網(wǎng)調(diào)度部門做好各類電源的調(diào)度計(jì)劃。這樣電網(wǎng)就會減少光伏限電,由此大大提高了電網(wǎng)消納陽光的能力,從而減少了由于限電給光伏業(yè)主帶來的經(jīng)濟(jì)損失,增加了光伏電站的投資回報(bào)率,幫助光伏電站生產(chǎn)人員合理安排光伏電站的運(yùn)行方式。
由于光照度與輻照度高度相關(guān),幾乎呈線性關(guān)系,限于數(shù)據(jù)原因,本文使用光照度代替作為實(shí)驗(yàn)數(shù)據(jù)。隨著地球?qū)μ柕墓D(zhuǎn)和地球自轉(zhuǎn),地面光照度會產(chǎn)生周期性變化。太陽光照度在通過地球大氣的過程當(dāng)中會因?yàn)橥ㄟ^云層、氣溶膠、霧霾等物質(zhì)而受到削減。排除云層等干擾,一天中地球上同一地點(diǎn)受到的太陽光照度呈先增后減規(guī)律性變化。由于早上和傍晚太陽斜射入大氣層,經(jīng)過的大氣層路徑更長,故早上和傍晚光照度值將高于正午時(shí)刻。除規(guī)律性外,云層遮擋太陽時(shí)會引起光照度的劇烈下降。由于受到高空風(fēng)速和風(fēng)向影響,云層的運(yùn)動方向和運(yùn)動速度也具有不規(guī)則性。
通過上述分析可以發(fā)現(xiàn)太陽光照度受到各種天氣因素的影響。在機(jī)器學(xué)習(xí)領(lǐng)域有許多時(shí)序預(yù)測網(wǎng)絡(luò)。LSTM網(wǎng)絡(luò)作為一種優(yōu)秀的時(shí)序預(yù)測網(wǎng)絡(luò),可以利用歷史光照度數(shù)據(jù)來預(yù)測,其缺點(diǎn)是模型的可解釋性較差,而一維卷積神經(jīng)網(wǎng)絡(luò)可以高效提取歷史數(shù)據(jù)中的特征。故將兩種網(wǎng)絡(luò)進(jìn)行有機(jī)融合,來進(jìn)一步提高預(yù)測效果。在正式介紹本文模型前,先簡要介紹下LSTM網(wǎng)絡(luò)與CNN網(wǎng)絡(luò)。
LSTM(Long Short Term Memory)[4]神經(jīng)網(wǎng)絡(luò)是一種RNN神經(jīng)網(wǎng)絡(luò)的變體,其增加了一種攜帶信息跨越多個時(shí)間步的方法。在光照度預(yù)測中,當(dāng)T-n時(shí)刻的光照度數(shù)據(jù)進(jìn)入LSTM網(wǎng)絡(luò)時(shí),其信息可被傳送到更晚的時(shí)間步,網(wǎng)絡(luò)保存了信息以供后面使用,從而防止較早期的信號在處理過程中丟失。
CNN(Convolutional Neural Networks)[5]卷積神經(jīng)網(wǎng)絡(luò)可以識別光照度序列中的局部模式。其原理是通過設(shè)置卷積核對輸入數(shù)據(jù)局部區(qū)域進(jìn)行卷積計(jì)算,從中提取特征信息,并能夠?qū)⒈硎灸K化,同時(shí)可以高效的利用數(shù)據(jù)。一維卷積神經(jīng)網(wǎng)絡(luò)通過對過去某個時(shí)間段光照度序列段進(jìn)行相應(yīng)的卷積操作,在這個時(shí)間段學(xué)到的模式可以在后續(xù)時(shí)間段的位置被識別,其網(wǎng)絡(luò)在時(shí)間序列上具有平移不變性。
本文設(shè)計(jì)網(wǎng)絡(luò)模型示意圖如圖1所示。
圖1 基于CNN-LSTM模型預(yù)測過程示意圖
模型以歷史光照度和云層太陽間距離作為模型輸入。首先介紹兩個輸入的參數(shù)。本文采用光照度傳感器作為光照度采集設(shè)備,傳感器測量范圍為0~2×105 Lux。由于前文提到云層的運(yùn)動會極大影響光照度值,故本模型引入云層與太陽間的距離作為模型輸入,通過手動標(biāo)注來測量全景天空圖像上太陽中心與靠近太陽運(yùn)動方向云層的邊緣距離。將光照度數(shù)據(jù)和距離數(shù)據(jù)通過一維卷積神經(jīng)網(wǎng)絡(luò)提取后,將提取到的特征進(jìn)行融合,放入LSTM網(wǎng)絡(luò),并進(jìn)行回歸得到最終預(yù)測數(shù)值。
由于過深的網(wǎng)絡(luò)會導(dǎo)致過擬合以及梯度消失等情況,且限于實(shí)驗(yàn)數(shù)據(jù)樣本數(shù)量,本文使用較為淺層的網(wǎng)絡(luò)進(jìn)行測試。首先將數(shù)據(jù)進(jìn)行歸一化,然后在卷積層設(shè)置了10個大小為5的卷積窗口,通過全連接層,將光照度與距離兩種特征融合后放入LSTM網(wǎng)絡(luò),LSTM網(wǎng)絡(luò)中設(shè)置50個單元。將得到的輸出數(shù)據(jù)展平后經(jīng)過兩層全連接網(wǎng)絡(luò),得到最后的回歸結(jié)果。模型參數(shù)如圖2所示。
圖2 CNN-LSTM模型網(wǎng)絡(luò)結(jié)構(gòu)
模型損失函數(shù)采用均方誤差,在網(wǎng)絡(luò)參數(shù)更新上,采用了自適應(yīng)學(xué)習(xí)率Adam算法來替代傳統(tǒng)隨機(jī)梯度下降算法,其能夠基于訓(xùn)練數(shù)據(jù)迭代更新網(wǎng)絡(luò)權(quán)重。在雙輸入雙輸出模型中,通過測試發(fā)現(xiàn),當(dāng)調(diào)整預(yù)測光照度預(yù)測距離損失函數(shù)值比重為2:1時(shí),整體誤差達(dá)到最小。為了說明本模型結(jié)構(gòu)設(shè)置的合理性,在實(shí)驗(yàn)過程中設(shè)置3組對比網(wǎng)絡(luò),分別為:1):一維卷積網(wǎng)絡(luò)部分用全連接網(wǎng)絡(luò)替代。2):時(shí)序預(yù)測網(wǎng)絡(luò)部分用全連接網(wǎng)絡(luò)替代。3):一維卷積網(wǎng)絡(luò)與時(shí)序預(yù)測網(wǎng)絡(luò)部分都使用全連接網(wǎng)絡(luò)替代,以下表格用中各網(wǎng)絡(luò)名稱用CNN、LSTM、FC代替。本實(shí)驗(yàn)采用平臺為Win10操作系統(tǒng),CPU為i5-8300H,GPU為1050Ti,使用Python語言進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)數(shù)據(jù)分為訓(xùn)練集,驗(yàn)證集與測試集三個部分,其中包括訓(xùn)練集數(shù)據(jù)共2 675個,驗(yàn)證集共425個,測試集共172個,數(shù)據(jù)來源取自杭州地區(qū)中午時(shí)刻太陽光照度數(shù)據(jù)。在時(shí)間細(xì)粒度上,模型通過歷史5個數(shù)據(jù)來滾動預(yù)測未來1分鐘數(shù)據(jù)。實(shí)驗(yàn)預(yù)測結(jié)果如圖3~6所示。
圖3 光照度預(yù)測曲線
圖4 距離預(yù)測曲線
圖5 光照度預(yù)測誤差分布
圖6 距離預(yù)測誤差分布
本次實(shí)驗(yàn)誤差結(jié)果如表格1所示。通過觀察表格中的數(shù)據(jù)結(jié)合預(yù)測曲線、誤差曲線可以發(fā)現(xiàn),CNN網(wǎng)絡(luò)與LSTM網(wǎng)絡(luò)對光照度序列特征提取能力明顯高于FC網(wǎng)絡(luò),實(shí)驗(yàn)結(jié)果證明一維卷積神經(jīng)網(wǎng)絡(luò)在處理時(shí)間模式時(shí)表現(xiàn)也很好,甚至可以在某些任務(wù)下與時(shí)序網(wǎng)絡(luò)媲美。通過觀察發(fā)現(xiàn),CNN+LSTM模型預(yù)測結(jié)果的誤差更小,無論在光照度預(yù)測還是云層與太陽距離預(yù)測上來看,預(yù)測誤差函數(shù)指標(biāo)RMSE與MAE均低于其他對比模型,具有良好的預(yù)測性能。
表1 實(shí)驗(yàn)結(jié)果評估
CNN網(wǎng)絡(luò)與LSTM模型已經(jīng)在很多領(lǐng)域獲得良好的預(yù)測效果,本文將CNN模型與LSTM模型進(jìn)行有機(jī)融合,以RMSE和MAE作為誤差參考標(biāo)準(zhǔn),同時(shí)設(shè)置不同對比模型進(jìn)行數(shù)據(jù)預(yù)測效果比較,通過比較可以發(fā)現(xiàn)相對于對比模型,本文提出模型的預(yù)測精度相對更高。通過觀察可以發(fā)現(xiàn)在光照度與距離變化的突變值區(qū)域,模型并不能非常完美的預(yù)測,其原因在于雖然提供了歷史時(shí)刻的光照度與云層距離太陽之間的距離,但依舊存在云層的運(yùn)動方向變化、云層的厚度不一等多種不同因素下的干擾,這對于預(yù)測產(chǎn)生了較大的影響,針對云層方面還需要通過有機(jī)結(jié)合云圖以及其他氣象數(shù)據(jù)和大氣物理模型進(jìn)行深入分析,從而進(jìn)一步提高預(yù)測精度。