李正剛, 王智方, 鐘建偉, 張欽惠, 程明亮
(1.國(guó)網(wǎng)湖北省電力有限公司巴東縣供電公司,湖北 巴東 445000;2.湖北民族大學(xué) 信息工程學(xué)院,湖北 恩施 445000)
傳統(tǒng)化石能源在枯竭,可再生能源進(jìn)入人們的視線[1]。太陽(yáng)能是較好的替代能源[2],人們?cè)絹?lái)越關(guān)注光伏發(fā)電預(yù)測(cè)[3]。光伏發(fā)電受制于太陽(yáng)輻射和天氣因素[4],影響了電網(wǎng)的運(yùn)行和調(diào)度[5]。
ELM在回歸分析、分類和預(yù)測(cè)領(lǐng)域都有極快的學(xué)習(xí)速度[6]。該算法還可以降低陷入局部最優(yōu)的可能性[7]。正則化通過(guò)約束最小化經(jīng)驗(yàn)誤差函數(shù)來(lái)解決逆問(wèn)題的不適定性,改善用于求解數(shù)據(jù)的精度[8]。
本文提出一種使用正則化方法優(yōu)化ELM數(shù)據(jù)精度的預(yù)測(cè)方法。引入正則化項(xiàng)改進(jìn)ELM的泛化能力,避免過(guò)擬合,改善用于求解的數(shù)據(jù)的精度,提高預(yù)測(cè)的精度。采用DKA太陽(yáng)能中心的實(shí)際數(shù)據(jù)以驗(yàn)證預(yù)測(cè)方法提高光伏發(fā)電預(yù)測(cè)精度的能力。
正則化理論(regularization theory)在數(shù)值分析分析領(lǐng)域應(yīng)用較多,穩(wěn)定有效是該理論的特點(diǎn)。正則化方法包括截?cái)嗥娈愔捣纸?truncated singular value decomposition,TSVD)方法和其他一些改進(jìn)的算法。
TSVD方法以奇異值展開(kāi)為基礎(chǔ),k核的平均收斂展開(kāi)式為:
(1)
式中:ui和vi為正交函數(shù)序列,且所有的μi≥0。其解為:
(2)
式中:(ui,g)為內(nèi)積。只有當(dāng)系數(shù)(ui,g)比ui更快地衰減到零時(shí),解f才能存在。
(3)
這就是著名的皮卡德條件。
極限學(xué)習(xí)機(jī)(ELM)算法的目的就是解決基于梯度算法收斂慢和存在局部極小值等相關(guān)的問(wèn)題,該算法是一種單隱層前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法。ELM的學(xué)習(xí)速度非???。在大多數(shù)情況下,ELM在泛化能力方面優(yōu)于基于梯度的學(xué)習(xí)。
圖1 經(jīng)典ELM結(jié)構(gòu)圖
(4)
式中:Wj為第j個(gè)隱含層神經(jīng)元與輸入向量Xi間的權(quán)值向量;bj為第j個(gè)隱含層神經(jīng)元的閾值;ηj為第j個(gè)隱含層神經(jīng)元與輸出層節(jié)點(diǎn)間的權(quán)值;oi為第i個(gè)樣本的輸出。
如圖2所示,首先需要整理輻照量等特征向量的時(shí)間序列,對(duì)整理出來(lái)的數(shù)據(jù)進(jìn)行歸一化處理,處理后的數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集。訓(xùn)練集決定最優(yōu)的隱含層節(jié)點(diǎn)數(shù)、確定正則化參數(shù)并進(jìn)行正則化過(guò)程。然后,解出對(duì)應(yīng)的η。最后,把得到的參數(shù)使用到測(cè)試集中進(jìn)行預(yù)測(cè)。
圖2 正則化優(yōu)化ELM算法預(yù)測(cè)流程圖
具體為:①由于天氣因素與設(shè)備因素均對(duì)預(yù)測(cè)結(jié)果產(chǎn)生影響,選定歷史發(fā)電數(shù)據(jù)量、總輻射量、直射輻射、散射輻射、環(huán)境溫度、風(fēng)向(力)、氣壓、相對(duì)濕度、組件的溫度和組件的電流電壓等參數(shù)為特征向量。整理輻照量等特征向量的時(shí)間序列,對(duì)整理出來(lái)的數(shù)據(jù)進(jìn)行歸一化處理,把處理過(guò)的數(shù)據(jù)分成訓(xùn)練集和測(cè)試集。②先通過(guò)訓(xùn)練集決定最優(yōu)的隱含層節(jié)點(diǎn)數(shù),然后確定最優(yōu)正則化參數(shù),再進(jìn)行正則化過(guò)程,最后將得到的參數(shù)使用到測(cè)試集,進(jìn)行預(yù)測(cè)。③通過(guò)相關(guān)誤差系數(shù)評(píng)價(jià)預(yù)測(cè)結(jié)果的精度。
本文在評(píng)價(jià)仿真預(yù)測(cè)結(jié)果精度時(shí)使用均方誤差MSE與決定系數(shù)R2。
(5)
決定系數(shù),也稱為判定系數(shù)或者是擬合優(yōu)度。當(dāng)R2趨近于1時(shí),說(shuō)明相關(guān)方程越值得參考;相反,趨近于0時(shí),說(shuō)明相關(guān)的方程沒(méi)有參考的意義。
在多元回歸分析中,決定系數(shù)是通徑系數(shù)的平方,其表達(dá)式為:
(6)
式中:SST為總平方和;SSR為回歸平方和;SSE為殘差平方和。SST=SSR+SSE,擬合優(yōu)度越大,自變量對(duì)因變量的解釋程度越高,觀察點(diǎn)在回歸直線附近越密集。
決定系數(shù):為0時(shí),表示模型效果跟瞎猜差不多;為1時(shí),表示模型擬合度較好;在0~1時(shí),表示模型的好壞(針對(duì)同一批數(shù)據(jù));小于0時(shí),說(shuō)明數(shù)據(jù)不存在線性關(guān)系。
本文數(shù)據(jù)使用的是澳大利亞DKA太陽(yáng)能中心提供的某地區(qū)光伏發(fā)電站2018年1月1日至2018年12月31日的歷史數(shù)據(jù)。選取的時(shí)間間隔為5 min,選取的數(shù)據(jù)共105 230組。由于光伏發(fā)電受自然因素影響較大,尤其是輻射量、溫度、風(fēng)向、風(fēng)力和相對(duì)濕度。因此,綜合考慮,每組數(shù)據(jù)選定的特征向量包括:歷史發(fā)電數(shù)據(jù)量、總輻射量、直射輻射、散射輻射、環(huán)境溫度、風(fēng)向(力)、氣壓、相對(duì)濕度、組件的溫度和組件的電流電壓等參數(shù)。訓(xùn)練集數(shù)據(jù)為105 000組,測(cè)試集數(shù)據(jù)為230組。利用MATLAB仿真軟件進(jìn)行了光伏發(fā)電功率值的仿真預(yù)測(cè)和相應(yīng)的評(píng)價(jià)值計(jì)算。
圖3為正則化優(yōu)化ELM預(yù)測(cè)波形與真實(shí)波形圖,圖4為ELM預(yù)測(cè)波形與真實(shí)波形圖。圖3、圖4中橫坐標(biāo)為測(cè)試集樣本編號(hào),縱坐標(biāo)為光伏發(fā)電功率。通過(guò)計(jì)算得到,正則化優(yōu)化ELM預(yù)測(cè)波形預(yù)測(cè)結(jié)果均方誤差為0.002 58,決定系數(shù)為0.999 97。ELM預(yù)測(cè)波形預(yù)測(cè)結(jié)果均方誤差為0.011 18,決定系數(shù)為0.999 89。
圖3 正則化優(yōu)化ELM預(yù)測(cè)波形與真實(shí)波形
圖4 ELM預(yù)測(cè)波形與真實(shí)波形
對(duì)比兩種方法預(yù)測(cè)結(jié)果的評(píng)價(jià)值可知,優(yōu)化前的預(yù)測(cè)結(jié)果中,均方誤差為0.011 18,決定系數(shù)為0.999 89,優(yōu)化后的預(yù)測(cè)結(jié)果中,均方誤差為0.002 58,決定系數(shù)為0.999 97。均方誤差降低了0.008 6,決定系數(shù)提高了0.000 05。由仿真波形圖可知,預(yù)測(cè)的精度得到改善。
極限學(xué)習(xí)機(jī)(ELM)是一種前饋神經(jīng)網(wǎng)絡(luò),克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法(如BP算法)極易陷入局部最優(yōu)、學(xué)習(xí)速度慢的缺點(diǎn)。利用正則項(xiàng)化處理數(shù)據(jù)的特點(diǎn),對(duì)ELM進(jìn)行優(yōu)化,最終解不會(huì)過(guò)擬合,可以提高預(yù)測(cè)的精度。本文使用實(shí)際的歷史發(fā)電數(shù)據(jù)以及歷史天氣數(shù)據(jù),以正則化優(yōu)化ELM算法進(jìn)行光伏發(fā)電功率預(yù)測(cè)。利用MATLAB仿真軟件進(jìn)行了光伏發(fā)電功率值的仿真預(yù)測(cè)和相應(yīng)的評(píng)價(jià)值計(jì)算。最后,通過(guò)仿真波形圖驗(yàn)證,該方法可以改善預(yù)測(cè)的精度。