周慧 王進 顧翔
摘 要: 外界環(huán)境和光照強度的不確定性決定了光伏發(fā)電出力的非平穩(wěn)性和隨機性,有效的光伏發(fā)電量預(yù)測不僅能保護接入電網(wǎng)的穩(wěn)健運行,還有助于電網(wǎng)的調(diào)度安排和光伏電站的運維決策。文章提出以周天氣特征因子和氣象因子為特征,結(jié)合歷史發(fā)電數(shù)據(jù),建立起一個最小二乘支持向量機預(yù)測模型,進行光伏發(fā)電量的超短期預(yù)測。通過實驗對訓練好的模型進行預(yù)測精度的評估,結(jié)果表明,與未結(jié)合周天氣特征的預(yù)測模型相比,該模型的平均預(yù)測精度提高了30%左右。
關(guān)鍵詞: 光伏發(fā)電量預(yù)測; 最小二乘支持向量機; 周天氣特征; 超短期預(yù)測
中圖分類號:TP39 文獻標志碼:A 文章編號:1006-8228(2018)08-36-04
Forecast of PV power generation based on data mining
Zhou Hui, Wang Jin, Gu Xiang
(College of computer science and technology, Nantong University, Nantong, Jiangsu 226019, China)
Abstract: The uncertainty of the external environment and sunlight intensity determines the non-stationary and randomness of the photovoltaic power generation, and the effective PV generation prediction can not only protect the stable operation of the access grid, but also help the dispatching of the power grid, and the operation and maintenance of the photovoltaic power station. In this paper, a characteristic factor of the week weather is proposed, and the prediction model of least square support vector machine is established by combining the meteorological factors and historical power generation data. The ultra-short term prediction of photovoltaic power generation is carried out, and the prediction accuracy of the trained model is evaluated through experiment. The results show that the average prediction accuracy of the model is 30 percentages higher than those of without characteristic factor of the week weather.
Key words: PV power generation prediction; least squares support vector machine; week weather characteristics; ultra-short term prediction
0 引言
太陽能發(fā)電能夠有效緩解全球能源緊缺問題和傳統(tǒng)能源發(fā)電帶來的環(huán)境問題[1]。太陽能發(fā)電中涉及光伏發(fā)電量預(yù)測,尤其是短期預(yù)測,對光伏電站運維具有重要意義。高精確度的發(fā)電量預(yù)測,能夠有效避開光伏電站發(fā)電高峰期,進行電站的運維、清洗、檢修等工作,同時還能作為故障診斷的輔助手段。
本文擬建立一套光伏電站發(fā)電量預(yù)測模型,旨在預(yù)測5分鐘超短期光伏發(fā)電量。預(yù)測一個光伏電站的發(fā)電量,可以幫助光伏業(yè)主避開發(fā)電高產(chǎn)時段,選擇在發(fā)電量較低的時段進行光伏電站維護和清洗,減少發(fā)電經(jīng)濟效益的損失。
目前已經(jīng)運用到光伏發(fā)電量預(yù)測中的方法有線性回歸[2]、神經(jīng)網(wǎng)絡(luò)[3]、支持向量機[4]等。聞科偉等[5]利用氣象部門提供的預(yù)報數(shù)據(jù)和小型光伏電站的歷史數(shù)據(jù)建立氣象相似度與發(fā)電量相似度的過渡函數(shù),分別通過分析三狀態(tài)馬爾科夫鏈和五狀態(tài)馬爾科夫鏈對預(yù)測結(jié)果進行修正。利用神經(jīng)網(wǎng)絡(luò)方法進行光伏發(fā)電預(yù)測方法。仿真結(jié)果具有較高的預(yù)測精度、實用性和良好的預(yù)測跟蹤性能。盧冬冬等[6]利用光伏發(fā)電系統(tǒng)歷史發(fā)電數(shù)據(jù)、太陽輻照度數(shù)據(jù)和氣象數(shù)據(jù)建立了多元多項式回歸模型 ,對相同天氣類型下的輻照度進行算術(shù)平均并代入多元多項式回歸模型 ,從而得到各種天氣類型下的只以溫度為輸入變量的預(yù)測模型。通過平均絕對百分比誤差對模型進行評估,該預(yù)測模型的精度較高,具有一定的可靠性。李洪珠等[7]通過歷史發(fā)電量、太陽能輻射量和溫度序列按照時間序列建模方案建立了基于魯棒學習的最小二乘支持向量機模型。本文基于最小二乘支持向量機建立一套光伏發(fā)電量預(yù)測模型。通過與其他的算法結(jié)果對比,該預(yù)測模型能準確地預(yù)測出光伏發(fā)電陣列的發(fā)電功率,有效地解決光伏發(fā)電的隨機化問題。
1 最小二乘支持向量機
標準的支持向量機(LSSVM)的損失函數(shù)為二次規(guī)劃問題,且約束條件為不等式約束,對于高維大樣本訓練,計算速度慢。而SuyKens[8-9]提出的最小二乘支持向量機將標準支持向量機的不等式約束的二次規(guī)劃問題轉(zhuǎn)化為由等式約束的線性方程組求解問題,從而提高了求解的收斂速度,更適合高維度大樣本訓練。
利用LSSVM對預(yù)測函數(shù)f(x)要解決的優(yōu)化問題為:
2 最小二乘支持向量機參數(shù)優(yōu)化
針對最小二乘支持向量機模型中的和優(yōu)化組合問題,本文在標準量子粒子群(QPSO)優(yōu)化的基礎(chǔ)上,引入高斯-柯西變異數(shù)進行優(yōu)化。綜合高斯變異的局部探索能力和柯西變異的全局探索能力,將高斯分布變異數(shù)和柯西分布變異數(shù)結(jié)合,代替標準量子粒子群算法中的隨機數(shù)操作,同時,增加對全局最優(yōu)位置和平均最優(yōu)位置的高斯-柯西變異操作,來避免收斂早熟。
高斯-柯西變異算子計算公式為:
⑻
其中G為滿足高斯分布的隨機數(shù),C為滿足柯西分布的隨機數(shù)。分別表示為:
基于高斯-柯西變異算子的量子粒子群(GC-QPSO)優(yōu)化最小二乘支持向量機的具體步驟如下:
⑴ 初始化粒子群,隨機產(chǎn)生每個粒子的位置;
⑵ 計算每個粒子的適應(yīng)度值f(Xi),如果小于個體最優(yōu)位置的適應(yīng)度值f(Pi),則更新個體最優(yōu)位置為Pi=Xi;
⑶ 更新全局最優(yōu)位置,若個體最優(yōu)位置適應(yīng)度值低于全局最優(yōu)位置,則更新gBeat=pBeat;
⑷ 計算平均最優(yōu)位置mBest;
⑸ 對gBest和mBest進行高斯-柯西算子變異;
⑹ 更新每個粒子的位置;
⑺ 判斷是否滿足停止條件。
其中,適應(yīng)度函數(shù)設(shè)為均方根誤差公式:
⑼
3 實驗設(shè)計
3.1 數(shù)據(jù)集獲取及特征的選取
本實驗的數(shù)據(jù)集為電站真實數(shù)據(jù)。樣本來源于江蘇南通某光伏發(fā)電廠2016年7月1日到2017年6月20日的運維數(shù)據(jù)。每日6:00-19:00之間,以5分鐘頻度采集的發(fā)電量作為因變量。自變量包括輻射、天氣、歷史數(shù)據(jù)、時間因素,其中天氣由互聯(lián)網(wǎng)歷史天氣數(shù)據(jù)獲取。天氣分為晴、多云、陰、小雨、大雨、轉(zhuǎn)變類天氣6種類型,其中轉(zhuǎn)變類天氣代表“陰轉(zhuǎn)多云”、“陰轉(zhuǎn)小雨”、“雷陣雨”等非單一類型天氣類型;另外由于多日內(nèi)若發(fā)生過大雨,對光伏面板表面積灰有沖刷,則光伏面板的發(fā)電效益應(yīng)當?shù)玫教嵘?。反之,?日內(nèi)若大多為大風日或者小雨日,則光伏面板積灰情況會較為嚴重,光伏面板發(fā)電量會相應(yīng)回落。因此通過統(tǒng)計手段,整合出7日內(nèi)大風天數(shù)、大雨天數(shù)、小雨天數(shù)、無雨天數(shù),作為自變量。其中大風的界定,根據(jù)中國氣象局于2001年下發(fā)《臺風業(yè)務(wù)和服務(wù)規(guī)定》規(guī)定,風力4級可吹起塵土的標準,將風力≥4級定為本模型的大風日。考慮到季節(jié)因素和時間序列對發(fā)電量的影響,在自變量引入月份、時間和晝長因素。
3.2 數(shù)據(jù)清洗
原始數(shù)據(jù)中的臟數(shù)據(jù)會嚴重影響最終的擬合效果,對預(yù)測精度的影響更甚。由于本模型的數(shù)據(jù)采集粒度較小,且數(shù)據(jù)由光伏發(fā)電現(xiàn)場設(shè)備采集傳輸?shù)娇刂婆_后統(tǒng)一收集,因此不可避免會出現(xiàn)一些缺失值和錯誤值等異常值,因此必須進行數(shù)據(jù)的清洗工作。對于其中的缺失值,使用R語言的多重插補法進行缺失值的補全處理。對于其他的異常值,利用離群點測試后進行刪除處理。
數(shù)據(jù)類型的不一致也會導(dǎo)致回歸發(fā)生錯誤,因此需要將天氣、風向、時間等啞變量進行賦值。
3.3 評價指標
3.3.1 RMSE(Root-Mean-Square Error)
均方根誤差是用來衡量預(yù)測值同真實值之間的偏差,又稱標準誤差,計算公式為:
⑽
其中n為測量次數(shù);Xreal,i為真實測量值,Xpre,i為預(yù)測值。
4 光伏發(fā)電量建模及預(yù)測分析
光伏出力受影響因素較多,最直接的影響是日照輻射度,其他影響因素還有天氣特征,如溫度、濕度、風力等,光伏表面積灰程度對光伏發(fā)電也有較大影響。受以上因素的作用,光伏發(fā)電量預(yù)測是一個隨機的非平穩(wěn)的過程,因此,這也是光伏發(fā)電量準確預(yù)測的難處所在。本文在已知天氣信息、發(fā)電量、輻射度、歷史數(shù)據(jù)的條件下,建立基于高斯-柯西變異算子優(yōu)化的最小二乘支持向量機模型進行光伏發(fā)電量預(yù)測。
實驗使用的數(shù)據(jù)達到4萬多條,在訓練模型過程中,將數(shù)據(jù)的50%作為訓練集,再取余下數(shù)據(jù)的30%作為測試集,其余的數(shù)據(jù)作為驗證集。為了保證訓練模型準確性和泛化能力,對數(shù)據(jù)進行三折交叉驗證實驗。由于數(shù)據(jù)采集粒度為5分鐘頻次采集,預(yù)測也以5分鐘為時間單位,實現(xiàn)光伏電站每5分鐘的超短期發(fā)電量預(yù)測。
4.1 光伏發(fā)電量預(yù)測結(jié)果
針對一天內(nèi)某一時刻預(yù)測光伏電站的總發(fā)電量。抽取該電廠一年中的上午某一時刻的數(shù)據(jù),基于GC-QPSO優(yōu)化方法訓練LSSVM預(yù)測模型,并進行發(fā)電量預(yù)測。以預(yù)測的均方根誤差值RMSE作為評價指標。RMSE值越小,代表預(yù)測的精度越高。預(yù)測結(jié)果如圖1所示。
表1顯示了不同預(yù)測方法的均方根誤差值,LSSVM代表最小二乘支持向量機預(yù)測模型,QPSO-LSSVM代表標準量子粒子群優(yōu)化的最小二乘支持向量機模型,GCQPSO-LSSVM代表基于高斯-柯西變異算子優(yōu)化的最小二乘支持向量機模型。從表1可以看到,對于非線性預(yù)測方法LSSVM,經(jīng)過優(yōu)化的LSSVM顯然預(yù)測結(jié)果要優(yōu)于經(jīng)典LSSVM,簡單的量子粒子優(yōu)化(QPSO)的預(yù)測模型預(yù)測效果較差,高斯柯西量子粒子優(yōu)化(GCQPSO)的預(yù)測模型預(yù)測結(jié)果最優(yōu)。
4.2 周天氣特征對預(yù)測模型的影響
基于積灰對光伏發(fā)電量的影響,提出利用周天氣特征作為光伏發(fā)電量預(yù)測模型的輸入來提高光伏發(fā)電量預(yù)測效果。因此本實驗考察周天氣特征對該預(yù)測模型影響程度。該實驗中,模型A代表引入周天氣特征的預(yù)測模型,模型B代表未引入周天氣特征的預(yù)測模型。實驗結(jié)果顯示,模型A的預(yù)測精度高于模型B的預(yù)測精度。模型A的RMSE值為0.1849,模型B的RMSE值為0.3739。
如圖2所示,從預(yù)測的趨勢和數(shù)值來看,兩種模型在發(fā)電量趨勢預(yù)測方面都比較好。但是模型A在預(yù)測數(shù)值上偏差明顯小于模型B。因此,在預(yù)測模型中引入周天氣特征對光伏發(fā)電量預(yù)測有積極影響,能提高預(yù)測的精確度。
表2為兩種預(yù)測模型的誤差值指絕對誤差值,很明顯可以看出模型A的預(yù)測值更貼近實際值,絕對誤差值小于模型B。
江蘇沿海地區(qū)氣候變化不明顯,歷年氣候條件較規(guī)律,且雨水充足,經(jīng)過實驗論證,針對該地區(qū)的光伏發(fā)電量預(yù)測,考慮到光伏組件積灰對光伏發(fā)電量的影響,加入周天氣特征,以一周內(nèi)大雨天數(shù)、小雨天數(shù)、無雨天數(shù)和大風天數(shù)來判定光伏組件表面積灰情況,并以該四種情況輸入預(yù)測模型,結(jié)果表明,引入周天氣特征確實能夠提高光伏預(yù)測的精確度,具有一定的參考意義。該預(yù)測方法應(yīng)用于該地區(qū)具有較好的天時地利條件,對于配備現(xiàn)場氣象數(shù)據(jù)采集裝置的光伏電站有較高的應(yīng)用參考價值。
5 結(jié)束語
本文通過歷史發(fā)電量數(shù)據(jù)以及氣象信息數(shù)據(jù),以日??色@取的信息作為模型輸入,建立光伏電站發(fā)電量最小二乘支持向量機預(yù)測模型,該模型采用 5分鐘的采集頻次,以較小的粒度水平進行超短時的光伏陣列發(fā)電量預(yù)測,平均預(yù)測精度達到80%以上。
與已有的發(fā)電量預(yù)測模型相比,本模型的預(yù)測精度保持在較好的水平。本模型具有其他模型不具有的優(yōu)勢:所有模型輸入值都是日常可獲取的,不需要輻射量的預(yù)測,也不需要云層、氣壓、降水量等難以獲取的信息,實用性更強;缺點在于輸入變量較多。與該發(fā)電廠目前使用的平均值預(yù)測方法相比,短時預(yù)測精度得到很大的提高。對于光伏業(yè)而言,具有較高的參考價值。
參考文獻(References):
[1] 張伯泉,楊宜民.風力和太陽能光伏發(fā)電現(xiàn)狀及發(fā)展趨勢[J].
中國電力,2006.39(6):65-69
[2] 李光明,劉祖明,何京鴻等.基于多元線性回歸模型的并網(wǎng)光
伏發(fā)電系統(tǒng)發(fā)電量預(yù)測研究[J].現(xiàn)代電力, 2011.28(2):43-48
[3] 栗然,李廣敏.基于支持向量機回歸的光伏發(fā)電出力預(yù)測[J].
中國電力,2008.41(2):74-78
[4] 張立影,孟令甲,王澤忠.基于雙層BP神經(jīng)網(wǎng)絡(luò)的光伏電站輸
出功率預(yù)測[J].電測與儀表,2015.52(11):31-35
[5] 海濤,聞科偉,周玲等.基于氣象相似度與馬爾科夫鏈的光伏
發(fā)電預(yù)測方法[J].廣西大學學報(自然科學版),2015.40(6):1452-1460
[6] 盧冬冬,鄭莆燕,袁言周等.基于天氣預(yù)報的光伏發(fā)電預(yù)測研
究[J].硅谷,2014.15:43-44
[7] 李洪珠,賈威,聶苓等.基于魯棒LS-SVM在光伏發(fā)電預(yù)測中的
應(yīng)用[J].計算機測量與控制,2013.21(5):1166-1167
[8] Suykens J A K, Vandew alle J. Least Squares Support
Vector Machines Classifiers[J]. Neural Processing L etters,1999.9(3):293-300
[9] Suykens J A K, Gestel T V, Brabanter J D, et al. Least
Squares Support Vector Machines[J]. International Journal of Circuit Theory & Applications,2002.27(6):605-615
[10] 張繼祥,劉克長,魏欽平等.氣象要素(氣溫、太陽輻射、風速
和相對濕度)日變化進程的數(shù)理模擬[J].山東農(nóng)業(yè)大學學報(自然科學版),2002.33(2):179-183