董利江, 李 偉, 王 瑜, 錢白云, 沈中信,馬勤勇, 孔筱葉
(1. 新疆電力建設(shè)調(diào)試所,新疆 烏魯木齊 830011; 2. 國(guó)網(wǎng)新疆電力公司電力科學(xué)研究院,新疆 烏魯木齊 830000;3. 華北電力大學(xué)電子工程系,河北 保定 071003; 4. 四川中測(cè)輻射科技有限公司,四川 成都 610000)
風(fēng)速預(yù)測(cè)是風(fēng)力發(fā)電研究的基礎(chǔ)環(huán)節(jié)。對(duì)于風(fēng)力發(fā)電機(jī)來(lái)說(shuō),輸出功率與風(fēng)能關(guān)系密切,而風(fēng)能正比于風(fēng)速的三次方,風(fēng)速預(yù)測(cè)誤差對(duì)風(fēng)機(jī)功率預(yù)測(cè)有很大的影響,故電力系統(tǒng)對(duì)風(fēng)速模型預(yù)測(cè)誤差有著很高要求[1-2]。因此,建立一個(gè)有效的短期風(fēng)速預(yù)測(cè)模型具有一定的意義。風(fēng)速預(yù)測(cè)的方法主要有兩大類:一類是基于流場(chǎng)分析的預(yù)測(cè)模型,例如考慮尾流效應(yīng)、地形效應(yīng)等,但該類方法嚴(yán)重依賴于流場(chǎng)分析的準(zhǔn)確度;另一類是基于風(fēng)速時(shí)間序列的預(yù)測(cè)方法,即對(duì)風(fēng)速歷史數(shù)據(jù)建立預(yù)測(cè)模型,該類方法中模型參數(shù)的選取是當(dāng)前研究的重點(diǎn)。本文基于第二類方法建立短期風(fēng)速預(yù)測(cè)模型,并對(duì)預(yù)測(cè)模型參數(shù)的優(yōu)化選取進(jìn)行研究。
相關(guān)向量機(jī)[3](relevance vector machine,RVM)作為一種基于貝葉斯框架的稀疏概率模型,在短期風(fēng)速及功率預(yù)測(cè)過(guò)程中不僅誤差較低,而且計(jì)算時(shí)間短、魯棒性較強(qiáng)[4-5]。故本文選用RVM方法建立短期風(fēng)速回歸模型對(duì)風(fēng)速進(jìn)行預(yù)測(cè)。在使用RVM模型進(jìn)行預(yù)測(cè)分析時(shí),訓(xùn)練樣本質(zhì)量決定了模型的學(xué)習(xí)能力。根據(jù)Takens[6]的嵌入定理,重構(gòu)空間與原時(shí)間序列的動(dòng)力學(xué)特征相同,故本文選用相空間重構(gòu)法提取蘊(yùn)含在風(fēng)速時(shí)間序列中的特征構(gòu)建樣本。相空間重構(gòu)中嵌入維數(shù)E和時(shí)間延遲τ往往通過(guò)混沌理論[7-8]計(jì)算得到,但得到的值未必是針對(duì)模型的最優(yōu)解。本文通過(guò)實(shí)驗(yàn)驗(yàn)證了這兩個(gè)參數(shù)確實(shí)對(duì)風(fēng)速預(yù)測(cè)模型最終的誤差有著不可忽視的影響。為進(jìn)一步降低模型預(yù)測(cè)回歸誤差,應(yīng)綜合考慮影響模型預(yù)測(cè)結(jié)果的各個(gè)參數(shù)。基于此,本文首次提出一種多參數(shù)同步優(yōu)化方法,搜索(E,τ,σ)的最優(yōu)組合。隨著待優(yōu)化參數(shù)個(gè)數(shù)的增加,計(jì)算復(fù)雜度急劇增加,模型優(yōu)化的時(shí)間成本越來(lái)越高。故文中基于遺傳算法(genetic algorithm,GA)搜尋風(fēng)速預(yù)測(cè)模型超參數(shù)的全局最優(yōu)解。實(shí)驗(yàn)結(jié)果驗(yàn)證了本文方法對(duì)提高模型預(yù)測(cè)效率的有效性。
對(duì)于給定的風(fēng)速時(shí)間序列V={v1,v2,···,vN},在建立預(yù)測(cè)回歸模型之前,需事先得到模型的訓(xùn)練學(xué)習(xí)樣本,即特征向量x與目標(biāo)值t。本文采用時(shí)間延遲τ和嵌入維數(shù)E對(duì)V進(jìn)行空間重構(gòu),得到n個(gè)訓(xùn)練樣本:si={xi,ti}={[vi,vi+1×τ,···,vi+(E?1)×τ],vi+E×τ},i=1,2,···,n,n≤N-E×τ。
假定樣本目標(biāo)值ti獨(dú)立分布,樣本集中伴有均值為0、方差為σ2的高斯噪聲εi。RVM回歸模型可定義為
式中:n——樣本集總數(shù);
wi——權(quán)值;
K(x,xi)——徑向基核函數(shù)[9];
xi——第i個(gè)樣本的特征向量。
ti服從獨(dú)立分布,其似然估計(jì)為
由SVR的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則可知[10],如若直接將式(2)最大化而不考慮權(quán)值w的約束,將導(dǎo)致十分嚴(yán)重的過(guò)擬合現(xiàn)象。因此為避免過(guò)擬合現(xiàn)象,需要限定各個(gè)權(quán)值wi滿足高斯先驗(yàn)概率分布:
其中α=[α0,α1,···,αn]T為先驗(yàn)分布的超參數(shù)。
權(quán)值的后驗(yàn)概率分布由Bayes準(zhǔn)則計(jì)算:
權(quán)值的后驗(yàn)分布均值和協(xié)方差表達(dá)式為
其中A=diag(α0,α1,···,αn)。
因此由權(quán)值后驗(yàn)分布的均值μ得出權(quán)值的估計(jì)。后驗(yàn)協(xié)方差矩陣Σ表示模型預(yù)測(cè)的不確定性。若α服從gamma分布,超參數(shù)的似然分布為
其中C=σ2I+ΦA(chǔ)?1ΦT。
使用MacKay[11]的方法最大化超參數(shù)似然分布:
其中λii為Σ中第i+1個(gè)對(duì)角元素。
反復(fù)計(jì)算式(7),再利用得到的結(jié)果不斷更新式(5),當(dāng)?shù)鷿M足收斂條件時(shí),即求出模型訓(xùn)練結(jié)束。
風(fēng)電場(chǎng)所在地的氣候基本穩(wěn)定,風(fēng)速波動(dòng)具有內(nèi)在的規(guī)律性。因此在1.1節(jié)訓(xùn)練過(guò)程中,本文通過(guò)對(duì)歷史風(fēng)速時(shí)間序列進(jìn)行空間重構(gòu)來(lái)提取出蘊(yùn)含在其中的特征,進(jìn)而構(gòu)造訓(xùn)練樣本的特征。
RVM預(yù)測(cè)過(guò)程是利用已經(jīng)完成訓(xùn)練的模型對(duì)輸入待預(yù)測(cè)時(shí)刻的特征向量x*進(jìn)行計(jì)算的,得到預(yù)測(cè)值。若要預(yù)測(cè)第j時(shí)刻的風(fēng)速值vj*,按式(1)構(gòu)造相應(yīng)的特征向量:
將其代入RVM模型,預(yù)測(cè)結(jié)果表示為
τ和E的選擇對(duì)時(shí)間序列的重構(gòu)影響很大,目前,這兩個(gè)參數(shù)一般利用混沌理論求解得到。
相空間重構(gòu)方法中的重要參數(shù)E與τ,與機(jī)器學(xué)習(xí)樣本質(zhì)量有著極大的關(guān)聯(lián)。由于樣本質(zhì)量直接決定了機(jī)器學(xué)習(xí)的效果,因此E和τ對(duì)RVM模型的回歸能力應(yīng)該有著較大影響。本文通過(guò)實(shí)驗(yàn)分析驗(yàn)證了這一結(jié)論。
以時(shí)間延遲τ為例,運(yùn)用單一變量法的思想,控制核函數(shù)寬度γ和嵌入維數(shù)E不變,改變?chǔ)拥娜≈怠R?.1節(jié)實(shí)驗(yàn)為例,選取不同的τ值(σ=143,E=8),建立預(yù)測(cè)模型,并得到其誤差的變化,見表1。
表1 不同τ值的預(yù)測(cè)模型誤差
從表中可以明顯看出,模型的預(yù)測(cè)誤差隨τ的取值變化而變動(dòng),且沒有規(guī)律性。因此,E與τ在滿足時(shí)間序列動(dòng)力特性的基礎(chǔ)上,還需要對(duì)其進(jìn)行優(yōu)化進(jìn)而匹配RVM預(yù)測(cè)模型。
通過(guò)以上分析,認(rèn)為應(yīng)當(dāng)對(duì)樣本特征參數(shù)E、τ和核函數(shù)參數(shù)σ進(jìn)行并行優(yōu)化,并將(E,τ,σ)組合的優(yōu)化結(jié)果作為風(fēng)速預(yù)測(cè)模型的最終參數(shù)。考慮到這3個(gè)參數(shù)的取值范圍都比較大,若采用傳統(tǒng)的遍歷算法,耗時(shí)過(guò)長(zhǎng)。因此,應(yīng)選擇合適的優(yōu)化算法搜尋全局最優(yōu)解。GA算法由于其具備很強(qiáng)的全局搜索能力,同時(shí)精度可調(diào),故本文基于遺傳算法對(duì)風(fēng)速預(yù)測(cè)模型中的3個(gè)參數(shù)進(jìn)行多參數(shù)同步優(yōu)化。
GA算法是模擬自然界優(yōu)化選擇和遺傳的一類現(xiàn)代智能算法[12]。其核心思想是通過(guò)“適者生存”的法則篩出一批父代染色體,對(duì)其進(jìn)行交叉、變異和選擇復(fù)制,產(chǎn)生適應(yīng)能力更強(qiáng)的子代樣本,不斷逼近參數(shù)組合的最優(yōu)解。本文利用GA尋求3個(gè)參數(shù)的最優(yōu)組合,并以其作為RVM風(fēng)速預(yù)測(cè)模型超參數(shù)降低預(yù)測(cè)誤差。針對(duì)短期風(fēng)速時(shí)間序列s,具體步驟為:
1)規(guī)定遺傳算法的初始參數(shù):交叉概率、最大迭代次數(shù)以及初始種群規(guī)模等。
2)編碼待優(yōu)化參數(shù)和確定尋優(yōu)區(qū)間:本文需要編碼的參數(shù)為σ、E、τ,其中τ與E在優(yōu)化過(guò)程中必須是整數(shù)。
3)選擇適應(yīng)度函數(shù):由于適應(yīng)度函數(shù)值越大的染色體被選為父代的幾率越多,因此適應(yīng)度函數(shù)直接決定了待優(yōu)化參數(shù)的進(jìn)化方向。文中先計(jì)算預(yù)測(cè)值與真實(shí)值間的平均相對(duì)誤差,通過(guò)一些形式變化確定適應(yīng)度函數(shù),其表達(dá)式為
式中:t——測(cè)試樣本對(duì)應(yīng)的實(shí)測(cè)值;
ti′——測(cè)試樣本的預(yù)測(cè)值;
n——測(cè)試樣本的個(gè)數(shù);
C——隨著代數(shù)增加遞減的函數(shù)。
4)產(chǎn)生子代:計(jì)算父代染色體適應(yīng)度值,通過(guò)選擇、交叉、變異操作得到子代。
5)重復(fù)4),直到滿足最大迭代次數(shù)。選出最后一代中適應(yīng)值最大的個(gè)體,解碼后得到3個(gè)參數(shù)的最優(yōu)組合(σs,τs,Es)。利用τs和Es重構(gòu)風(fēng)速時(shí)間序列,構(gòu)建訓(xùn)練樣本集(xi,ti),i=1,2,···,n。
6)預(yù)測(cè)模型核函數(shù)參數(shù)設(shè)定為σs,(xi,ti)作為訓(xùn)練樣本,通過(guò)對(duì)(xi,ti)的學(xué)習(xí)訓(xùn)練使得預(yù)測(cè)模型獲得回歸能力。用相同的方式獲取待預(yù)測(cè)數(shù)據(jù)的特征xi,并將其輸入到預(yù)測(cè)模型中,計(jì)算出模型的預(yù)測(cè)目標(biāo)值ti′。
以A、B兩個(gè)風(fēng)力發(fā)電場(chǎng)歷史風(fēng)速實(shí)測(cè)數(shù)據(jù)為例,每20 min提取一個(gè)采樣點(diǎn),記錄連續(xù)8 d內(nèi)的風(fēng)速值,共計(jì)576個(gè)數(shù)據(jù)。風(fēng)速曲線分別見圖1、圖2。
圖1 風(fēng)電場(chǎng)A的8 d風(fēng)速值
圖2 風(fēng)電場(chǎng)B的8 d風(fēng)速值
利用2.2節(jié)方法預(yù)測(cè)A、B兩個(gè)風(fēng)電場(chǎng)第8d的風(fēng)速值,具體步驟如下:
1)設(shè)定GA算法初始參數(shù)及待優(yōu)化參數(shù)的尋優(yōu)區(qū)間:σ∈[50,107 3],τ∈[1,16],E∈[5,20]。
2)將前6 d的數(shù)據(jù)作為學(xué)習(xí)樣本(N=432),運(yùn)用第2節(jié)中給出的參數(shù)尋優(yōu)方法對(duì)第7 d的風(fēng)速值進(jìn)行預(yù)測(cè)。
3)在尋優(yōu)范圍內(nèi)搜出參數(shù)的最優(yōu)組合(σs,τs,Es),優(yōu)化結(jié)果見表2。
表2 3個(gè)參數(shù)的優(yōu)化結(jié)果
4)代入τs、Es值對(duì)前7 d的風(fēng)速時(shí)間序列進(jìn)行相空間重構(gòu),得到第8 d風(fēng)速的特征值。基于RVM預(yù)測(cè)模型對(duì)兩個(gè)風(fēng)場(chǎng)第8 d的風(fēng)速進(jìn)行預(yù)測(cè)(σs為RVM中核函數(shù)參數(shù))。
參照組中時(shí)間延遲τ和嵌入維數(shù)E分別采用互信息法[13]和Cao[14]方法求解。A、B風(fēng)場(chǎng)風(fēng)速時(shí)間序列對(duì)應(yīng)的E的求解見圖3、圖4。
圖3 風(fēng)速時(shí)間序列對(duì)應(yīng)嵌入維數(shù)(風(fēng)電場(chǎng)A)
E1和E2為定義的兩個(gè)參量,若二者大于E0時(shí)不再變化或趨于穩(wěn)定,則嵌入維數(shù)為E0+1。由圖3、圖4可以看出,兩個(gè)參數(shù)分別在13和10的位置趨于穩(wěn)定,那么可以確定嵌入位數(shù)為14和11。確定嵌入維數(shù)與時(shí)間延遲之后,再次用每組中的前6 d數(shù)據(jù)對(duì)第7 d的值進(jìn)行預(yù)測(cè)。另一方面,GA算法只對(duì)σ進(jìn)行尋優(yōu)。優(yōu)化結(jié)果見表3。
得到σc、Ec、τc后,仿照3.1節(jié)中的第4)步,對(duì)A、B兩個(gè)風(fēng)電場(chǎng)第8d的風(fēng)速值進(jìn)行預(yù)測(cè)。
圖4 風(fēng)速時(shí)間序列對(duì)應(yīng)嵌入維數(shù)(風(fēng)電場(chǎng)B)
表3 E與τ的計(jì)算結(jié)果及σ的優(yōu)化結(jié)果
本文方法與對(duì)照方法建立的RVM風(fēng)速預(yù)測(cè)模型預(yù)測(cè)結(jié)果的圖形比對(duì)見圖5、圖6。從圖中可以看出,本文方法的預(yù)測(cè)值與真實(shí)值間誤差較小,而對(duì)比方法的預(yù)測(cè)值在趨勢(shì)上反映了真實(shí)值的變化,但誤差相對(duì)較大。
為了較好地衡量本文風(fēng)速預(yù)測(cè)模型的擬合效果,本文利用縱向誤差、橫向誤差、模型效率和模型預(yù)測(cè)時(shí)間對(duì)擬合結(jié)果進(jìn)行綜合評(píng)價(jià)。其中縱向誤差包括平均相對(duì)誤差,均方根誤差,主要體現(xiàn)預(yù)測(cè)結(jié)果在豎直方向與真實(shí)值的差別,數(shù)值越小,表示預(yù)測(cè)值與真實(shí)值越接近;橫向誤差從時(shí)間軸上描述預(yù)測(cè)值與真實(shí)值的相關(guān)程度,用皮爾遜相關(guān)系數(shù)表示,數(shù)值越大,相關(guān)程度越高。兩種模型預(yù)測(cè)結(jié)果的縱向、橫向誤差見表4。
圖5 風(fēng)電場(chǎng)A風(fēng)速數(shù)據(jù)預(yù)測(cè)
圖6 風(fēng)電場(chǎng)B風(fēng)速數(shù)據(jù)預(yù)測(cè)
表4 縱向、橫向誤差
從縱向誤差來(lái)看,本文模型與對(duì)比模型相比,數(shù)值誤差更??;從橫向誤差來(lái)看,本文模型預(yù)測(cè)結(jié)果與真實(shí)值高度相關(guān),能更大程度上刻畫風(fēng)電場(chǎng)風(fēng)速波動(dòng)的規(guī)律。
對(duì)于短期風(fēng)速預(yù)測(cè),除了預(yù)測(cè)誤差外,模型效率(預(yù)測(cè)數(shù)據(jù)峰峰值之間有效點(diǎn)占總點(diǎn)數(shù)的百分比)和預(yù)測(cè)時(shí)間也是重要參考指標(biāo)。本文同時(shí)統(tǒng)計(jì)了兩種模型的預(yù)測(cè)時(shí)間和模型效率,見表5、表6。
表5 模型預(yù)測(cè)時(shí)間
表6 模型效率
從表中可以看出,基于GA多參數(shù)優(yōu)化的RVM預(yù)測(cè)模型預(yù)測(cè)時(shí)間更短、效率更高。因此本文模型可有利于電網(wǎng)及時(shí)調(diào)整調(diào)度計(jì)劃。
為了降低風(fēng)速預(yù)測(cè)誤差,本文提出一種基于GA的RVM風(fēng)速預(yù)測(cè)模型多參數(shù)同步優(yōu)化方法。得到以下結(jié)論:
1)基于相空間重構(gòu)方法構(gòu)建機(jī)器學(xué)習(xí)樣本時(shí),嵌入維數(shù)和時(shí)間延遲都對(duì)風(fēng)速預(yù)測(cè)誤差具有較大影響。為了得到模型的最優(yōu)解,需要對(duì)參數(shù)E、τ、σ進(jìn)行同步優(yōu)化。
2)基于GA算法對(duì)E、τ、σ進(jìn)行同步優(yōu)化,可以降低模型的預(yù)測(cè)誤差。GA算法可以較為高效地搜索參數(shù)組合的全局最優(yōu)值,同時(shí)降低時(shí)間成本,具有良好的工程實(shí)用價(jià)值。
3)對(duì)于其他預(yù)測(cè)方法,如組合預(yù)測(cè)方法[15-16],為降低其預(yù)測(cè)誤差,同樣可以利用本文方法對(duì)其模型參數(shù)進(jìn)行同步優(yōu)化選取,因此將該方法應(yīng)用到組合預(yù)測(cè)中,將是本文后續(xù)的重要研究?jī)?nèi)容。