楊 健,徐思卿,姜尚光,柳 玉,柯德平,徐 箭
(1.國家電網有限公司華北分部,北京市 100000;2.武漢大學電氣與自動化學院,湖北省武漢市 430072)
大氣動力學的復雜性增加了對短時風電功率大幅度變化(即爬坡)預測的難度,一般風電功率序列預測方法往往在爬坡段存在較大誤差。這給維持系統(tǒng)有功平衡與頻率穩(wěn)定,如常規(guī)機組的調節(jié)深度和備用容量的預留問題[1-2]帶來了挑戰(zhàn),也對系統(tǒng)的輔助服務,如需求響應參與度[3]、爬坡控制策略制定[4]和預警提示[5]提出了更高的要求。
目前風電爬坡預測(wind power ramp forecasting,WPRF)方法主要有2種:一種是基于風電功率的序列預測,即采用自回歸模型[6]、支持向量機[7]、隨機森林[8]、神經網絡[9]等預測方法進行常規(guī)風電功率序列預測,然后基于不同爬坡特征識別爬坡事件;另一種是基于爬坡事件特征量的事件預測,例如文獻[10]采用高斯混合模型擬合WPRF爬坡特征的概率分布,考慮到爬坡特征的隨機依賴性,基于Copula理論對每個爬坡特征分別進行概率預測。事件預測方法可以提供風電爬坡事件特征量的信息,首先分析爬坡特征量的特征及其影響因素,然后結合氣象特征的分析,確定爬坡事件發(fā)生的本質原因[11],從而提高爬坡預測的準確性。從準確預估系統(tǒng)供需平衡的角度看,這些方法的預測精度尚有進一步提升的必要[12]。
相比于爬坡預測方法和功率序列預測誤差的研究[13],目前對爬坡事件的預測誤差與機理研究十分稀少,且傳統(tǒng)方法大多采用均方根誤差(RMSE)或平均絕對誤差(MAE)作為誤差評價指標。然而,RMSE只能離散直觀地給出橫向誤差的差異,較低的指標并不能有效反映WPRF的準確度[12]。與此同時,系統(tǒng)決策者更關心爬坡特征,尤其是爬坡幅值和爬坡率的誤差。文獻[14-16]分析了爬坡率的預測不準確性對運營商的安全約束調度和輔助服務,如風險量度、儲能系統(tǒng)、財務懲罰的消極影響。由此可見,對WPRF誤差的研究需要構建新的評價指標。
已有研究對WPRF誤差的修正均基于相似性理論,或只考慮風電功率的相似性,或只考慮爬坡事件的相似性,而沒有充分挖掘氣象背景與爬坡事件特征量預測誤差的直接關系。例如,文獻[17]基于元組向量扭曲方法對爬坡事件進行相似性匹配;文獻[18]首先對歷史爬坡數據進行灰色關聯(lián)分析和相似性分析,然后給出風電功率的修正量,從而有效地減小誤差,提高了預測的精度。由于爬坡事件是小概率事件,基于風電功率序列相似的波動性分析方法,會降低爬坡事件匹配的準確度;而風電功率的突變是大氣復雜運動的結果,與數值天氣預報(numerical weather prediction,NWP)氣象數據的有效結合將有助于挖掘到爬坡事件的規(guī)律與本質。
針對上述現(xiàn)狀,本文提出一種基于動態(tài)時間規(guī)整(dynamic time warping,DTW)的風電爬坡滾動修正模型。首先,采用PRAA(parameter and resolution adaptive)算法對爬坡事件進行檢測,獲取爬坡特征量,并建立爬坡特征量預測誤差向量矩陣;其次,用相關系數表征線性相關關系、互信息量表征非線性相關關系,找到與誤差向量矩陣具有較高相關關系的有效氣象指標;然后,基于DTW算法[19]匹配與未來有效氣象指標相似的歷史有效氣象指標,從而獲得修正模型中相應的誤差向量矩陣,并對預測爬坡事件進行修正。本文的特色是建立爬坡特征量預測誤差集與綜合氣象指標集的直接映射關系、構建新的評價指標,來進一步提高爬坡事件預測的精度。以中國華北某風電場實際數據為例進行仿真分析,證明了該修正模型的可行性與有效性。
為了提升爬坡事件預測精度、更好地服務于電網運行,本文提出將NWP與爬坡特征量直接相結合的爬坡事件滾動修正模型。該模型主要具有以下4個特征:①充分考慮單個爬坡事件的特性,通過爬坡幅值、爬坡持續(xù)時間和爬坡率等指標,完整地表征爬坡事件;②分析已有相似性研究的不足之處與風電爬坡事件發(fā)生的自然原因,直接建立爬坡特征量預測誤差集與綜合氣象指標集的映射關系,提高修正過程的針對性與結果的準確性;③考慮NWP氣象數據的連續(xù)變化性與因果性而進行滾動預測,與建立大量的歷史匹配數據庫相比更加有效;④結合實際調度與輔助服務市場的需求,構建新的評價指標,使爬坡事件預測更具有信息價值。圖1描述了本文所提方法的基本思路。
圖1 整體思路的基本框架Fig.1 Basic framework of overall idea
DTW是一種計算2個時間序列相似度的算法,尤其適用于長度不同和信息不對齊(即不同節(jié)奏)的時間序列,在音頻信號處理領域有廣泛應用。如圖2所示,由于重要信息在時間斷面上是不對齊的(例如峰值點mA和mB),利用每個時間斷面上時間序列l(wèi)A和lB在數值上的差異(例如距離)之和將無法準確地表征2個序列的相似度。不難想象,如果能將序列l(wèi)B在水平方向上進行適當的扭曲和拉伸,即相當于圖2中用斜線把lA和lB的點進行某種配對后再進行距離計算,則可以克服上述基于時間斷面配對計算距離的缺點,從而更加準確地表征時間序列的相似性。
圖2 DTW基本原理示意圖Fig.2 Schematic diagram of DTW fundamental principle
上述配對過程要遵循一定的規(guī)則,且存在海量的配對組合方式,其中必有一種最優(yōu)組合方式使得所計算的距離之和最小,即代表了2個時間序列的相似度。目前一般采用動態(tài)規(guī)劃方法計算該最優(yōu)的配對組合方式,原理簡述如下:設時間序列l(wèi)A長度為r,序 列l(wèi)B的 長 度 為t,其 中l(wèi)A={a1,a2,…,au,…,ar},lB={b1,b2,…,bv,…,bt}。在lA和lB中,au和bv之間的歐氏距離d(u,v)可用如下公式計算:
如果從圖2中的起點(邊界)開始搜索最優(yōu)配對組合(用圖中折線表示則是最優(yōu)路徑),且遵循如下規(guī)則:①搜索下一個配對點時只能朝著時間發(fā)展的方向,即單調性要求;②下一個配對點只能和當前點相鄰,不能跨越搜索,即連續(xù)性要求。則從起點到任意(u,v)的最小累積距離φ(u,v)一定滿足如下遞歸公式:
顯然,當u=r,v=t時,式(2)的解即為序列l(wèi)A和lB的最優(yōu)配對方式,相應的最小累積距離即可反映其相似性[20]。
如果上述lA和lB分別表示歷史爬坡事件發(fā)生時和預測爬坡事件發(fā)生時的有效氣象指標,例如氣壓的時間序列,則通過上述DTW算法可以建立以有效氣象指標時間序列相似性為紐帶的預測爬坡事件和歷史爬坡事件之間的關聯(lián)關系,從而修正預測爬坡事件。
準確的風電爬坡事件檢測,一方面可以為基于預測數據庫的風電爬坡事件后處理[17-18]和優(yōu)化調度安排提供技術手段,另一方面為基于歷史數據庫的爬坡特征量及相關性統(tǒng)計[6]奠定了基礎。兩者對常規(guī)電源的安排與旋轉備用的預留均具有指導意義。
旋轉門算法(swing door algorithm,SDA)常用于對數據庫進行數據壓縮[21]。該方法通過構造多個有寬度的三角形或者平行四邊形,對符合條件的點數據進行壓縮,附錄A圖A1為三角形法則的SDA。PRAA[22]在SDA的基礎上進行改進,對選取壓縮精度參數有更強的自適應性,可提高爬坡趨勢的判斷和檢測效率。PRAA計算方法如附錄A所示。
在本文中,定義有效爬坡事件持續(xù)時間小于等于4 h,且向上爬坡事件功率變化量大于額定功率的20%,向下爬坡事件功率變化量大于額定功率的15%。通過PRAA得到歷史數據庫中實際風電序列和預測風電序列以及未來數據庫中的所有有效爬坡事件集合,作為下一階段誤差修正的輸入數據。
根據歷史氣象數據與爬坡事件數據,可以定量分析各氣象指標與爬坡特征量預測誤差的關聯(lián)程度。本文通過挖掘各特征量之間的線性與非線性相關關系[23],來建立爬坡特征量預測誤差與綜合氣象指標間的映射關系。
設2.1節(jié)中檢測到的歷史爬坡事件數據集為HWPRE=[hWPRE,1,hWPRE,2,…,hWPRE,m],其中m代表 歷史爬坡事件的總個數,將爬坡率RRR、爬坡幅值RRM和持續(xù)時間RRD作為爬坡事件的特征量,則每個爬坡事件預測誤差可由特征量誤差矩陣RFE=[ΔRRR,ΔRRM,ΔRRD]來表示。計算每個爬坡事件的特征量預測誤差,構建誤差向量矩陣A如式(3)所示。
與這些歷史爬坡事件相對應的氣象數據表示為WH=[wH,1,wH,2,…,wH,q],其中q為氣象指標(例如氣溫、氣壓和濕度等)的總數,則列向量wH,j包含了第j個氣象指標在各個爬坡事件發(fā)生期間的平均變化率。因此,基于矩陣A和WH可以計算表征第i(i=1,2,3)個爬坡特征量預測誤差與第j個氣象指標之間的線性相關性系數ρij[24],如式(4)所示。
式中:aj為第i個爬坡特征量預測誤差向量(即A陣的第i列);cov(·)為向量之間的協(xié)方差函數;D(·)為向量的方差函數。ρij的絕對值范圍是[0,1],絕對值越大,說明第j個氣象指標與第i個爬坡特征量預測誤差的線性相關性越強。
互信息量是信息論中一種量度2個隨機變量間非線性關系的指標[25]。因此,除上述線性相關性系數以外,本文還擬采用互信息量來量度爬坡特征量預測誤差中所包含的氣象指標信息,計算方法如下:
式中:x和y分別為第i個爬坡特征量預測誤差和第j個氣象指標的隨機向量;p(x)和p(y)分別為x、y的邊緣概率密度;pC(x,y)為x和y的聯(lián)合概率密度。Iij愈大,則第j個氣象指標對第i個爬坡特征量預測誤差的影響愈大。值得說明的是,式(5)所包括的聯(lián)合概率密度和邊緣分布,均可基于爬坡事件和氣象歷史數據通過數值計算得到。
在二維坐標平面上可逐個描點繪出所有氣象指標與某個爬坡特征量預測誤差的線性相關系數和互信息量,繪點愈遠離原點,說明所對應氣象指標與該爬坡特征量預測誤差的關聯(lián)程度愈大。在爬坡率、爬坡幅值和持續(xù)時間3幅繪圖中均遠離原點的氣象指標將構成與爬坡事件特征量預測誤差強相關的有效氣象指標集。
在利用各氣象指標在爬坡事件發(fā)生期間的變化率識別出有效氣象指標集合后,可以建立歷史爬坡事件特征量預測誤差與各有效氣象指標在爬坡期間的時間序列之間的映射關系,如附錄B圖B1所示,其中Whs,ij(t)表示第j個有效氣象指標在第i個爬坡事件發(fā)生期間的時間序列,q表示有效氣象指標的總數。因此,建立了上述基于歷史數據的映射關系庫后,可以通過前述基于DTW的氣象指標時間序列相似性計算來匹配并矯正預測的爬坡事件。
假設利用2.1節(jié)的檢測方法從未來風電功率預測時間序列上檢測到的預測爬坡事件集為FWPRE=[fWPRE,1,fWPRE,2,…,fWPRE,t],其中t代表預測爬坡事件的總個數。對應這些爬坡事件發(fā)生期間的有效氣象指標時間序列預測結果可以表示如下:
式中:wF,ij(t)表示第j個有效氣象指標在第i個預測爬坡事件發(fā)生期間的時間序列預測值。因此,本文所提的基于DTW進行爬坡滾動修正的主要步驟如下。
步驟1:取WF(t)中對應于第i個預測爬坡事件和第j個有效氣象指標的分塊wF,ij(t),利用DTW算法計算其與附錄B圖B1中WHS(t)第j列中各個序列的最小累積距離,并以此為依據對各歷史爬坡事件(特征量預測誤差)進行相似度由高到低的排序。
步驟2:事實上當wF,ij(t)中下標j從1取到q時,重復步驟1的計算過程,可以得到q種歷史爬坡事件與第i個預測爬坡事件相似度的排序。
步驟3:在q種以有效氣象指標時間序列為依據的排序中,本文取相似度排序均靠前的N個歷史爬坡事件作為與第i個預測爬坡事件強相關的事件,并用它們特征量預測誤差的平均值來修正預測爬坡事件對應的特征量:
管理員可以查看和修改個人信息,包括工號、姓名、性別、出生日期、工作部門、電話、住址等。 可以修改個人登錄密碼。可以退出系統(tǒng)功能。
式 中:ΔRRRF,i、ΔRRDF,i、ΔRRMF,i分 別 為 對 第i個 預 測爬坡事件的爬坡率、爬坡持續(xù)時間和爬坡幅值的修正值,很顯然它們均是上述N個強相關歷史爬坡事件的特征量預測誤差的平均值;RRRF,i、RRDF,i、RRMF,i分別為修正后的第i個預測爬坡事件的爬坡率、爬坡持續(xù)時間和爬坡幅值;上標“-”表示對應變量修正前的值。
步 驟4:取i=1,2,…,t,并重 復 上述 步 驟1至3,可以實現(xiàn)對所有預測爬坡事件特征量的修正。
從理論上講,修正后的爬坡率、爬坡持續(xù)時間和爬坡幅值三者應相互關聯(lián)(即爬坡幅值等于爬坡率乘以爬坡持續(xù)時間)。如果出現(xiàn)修正后三者嚴重沖突而不滿足關聯(lián)關系的現(xiàn)象,則可初步判斷修正失效。在實際應用時,如果三者基本能滿足關聯(lián)關系,可以僅取其二(例如本文取爬坡率和爬坡幅值)進行修正??紤]到本文研究所關心的是爬坡事件的特征量,因此修正后的爬坡事件簡化為傾斜直線表示,直線斜率等于爬坡率,直線首尾幅值差則等于爬坡幅值,直線的中心時刻與原始預測爬坡事件的中心時刻重合。值得注意的是,這樣簡化處理修正后爬坡事件并不能保證爬坡事件首尾與原始時間序列銜接。
如前所述,爬坡率、爬坡持續(xù)時間和爬坡幅值三者中,只需對其中二者進行修正。此外,調度人員關心爬坡幅值對系統(tǒng)平衡與備用容量的影響且運營商關心爬坡率對爬坡預警等輔助服務的決策價值。因此,本文選取對爬坡幅值和爬坡率進行修正,并利用如下指標評價修正效果:
式中:RRMC和RRMR分別為修正后和實際爬坡幅值;ΔR1為修正前爬坡幅值預測誤差;ΔR2為修正后爬坡幅值預測誤差;RRRF、RRRC、RRRR分別為預測、修正后、實際爬坡率;ΔR3為修正前爬坡率預測誤差;ΔR4為修正后爬坡率預測誤差。若ΔERM>0和ΔERR>0同時滿足,說明修正后的爬坡幅值預測誤差和爬坡率預測誤差相比于修正前均有降低,此次修正有效。因此,為評價修正模型的有效性,采用如下有效率指標I進行統(tǒng)計分析:
式中:ND為有效修正次數;NND為無效修正次數。
本文采用PRAA算法對全年的歷史風電功率序列進行檢測,獲取每一個爬坡事件的特征量,同時統(tǒng)計分析爬坡特征量的預測誤差。由于篇幅限制,附錄B表B1僅展示其中具有典型代表意義的10個上爬坡事件和10個下爬坡事件的特征量及其預測結果。
根據統(tǒng)計結果并結合附錄B表B1可以看出,誤差主要有3種情況:①預測結果為爬坡事件,然而實際功率并未表現(xiàn)出爬坡現(xiàn)象;②預測爬坡率為正(或負),但實際爬坡率為負(或正);③預測與實際的爬坡方向相同,但爬坡率誤差較大或功率幅值相差較大。
本文所使用NWP數據庫中包含的氣象指標有風速、風向、氣壓、氣溫和濕度(這幾個指標均為15 min內均值),還有瞬時風向和瞬時風速。利用3.1節(jié)介紹的方法分別計算爬坡率、爬坡持續(xù)時間和爬坡幅值的預測誤差與各個氣象指標的線性相關系數以及互信息量,并將計算結果集中繪制于圖3。從圖3中可以看出,越靠近原點的點說明該氣象指標對爬坡特征量預測誤差的影響越??;越遠離原點說明特征量預測誤差越有可能是由于該氣象指標的突然變化或極端情況造成的。因此,根據圖3中各點的實際分布情況,本文選擇風速、風向、氣壓和氣溫作為與爬坡特征量預測誤差有強相關性的有效氣象指標。
圖3 爬坡事件特征量預測誤差與NWP氣象指標的互信息量-相關系數Fig.3 Mutual information-correlation coefficient of forecasting error of ramp event characteristic quantity and NWP meteorological indices
以本算例的數據為基礎,選取過去10天的歷史風電功率(實際和預測)數據和NWP數據來建立歷史爬坡特征量預測誤差與有效氣象指標在各歷史爬坡事件發(fā)生期間的時間序列之間的關聯(lián)關系庫(圖3),并基于未來1天的風電功率時間序列預測和NWP預測結果、利用2.3節(jié)所述方法對該日內的預測爬坡事件的特征量進行修正。很顯然,這種“10+1”的修正方式是滾動進行的,可以利用本算例中風電場的全年數據進行修正效果測試。圖4展示了某日的修正效果,具體的修正數值結果見附錄B表B2。
圖4 風電功率曲線與修正功率曲線Fig.4 Curves of wind power and correction power
由圖4和附錄B表B2可見,無論是上爬坡還是下爬坡,修正模型都可以有效改善爬坡幅值預測誤差和爬坡率預測誤差。修正后,上爬坡的幅值誤差降低13%,下爬坡2的幅值誤差降低37.5%;上爬坡的爬坡率誤差降低12%,下爬坡1的爬坡率誤差降低53.7%。從圖4中的風電功率曲線整體發(fā)展變化過程可以發(fā)現(xiàn),下爬坡1的幅值誤差和下爬坡2的爬坡率誤差雖然沒有明顯降低,但是整體走勢在時間誤差允許內更加貼和實際曲線。由此表明,通過與相近NWP氣象數據結合進行滾動修正一方面可以減小幅值和爬坡率預測誤差,另一方面有利于判斷風電功率發(fā)展方向的變化。
根據上述方法,去除2018年中限電等異常數據后,對全年預測爬坡事件進行滾動修正。由于爬坡持續(xù)時間的修正量在絕大多數情況下較小,均在1 h以內,這導致爬坡率的預測誤差修正效果與爬坡幅值非常接近(如果爬坡幅值修正有效,則爬坡率修正一般也是有效的,反之亦然)。限于文章篇幅,以下結果均只針對爬坡幅值誤差進行分析,爬坡率情況類似。圖5給出了上爬坡事件和下爬坡事件修正前、后的幅值誤差分布概率柱狀圖。
圖5 上爬坡事件和下爬坡事件預測誤差分布概率柱狀圖Fig.5 Histograms of probability distribution of predicted error for uphill and downhill events
通過觀察上、下爬坡事件幅值預測誤差在修正前后的分布情況可以看出:①上、下爬坡事件中較高幅值誤差在修正后均大幅向幅值誤差較小的方向移動;②修正后幅值誤差比修正前的幅值誤差分布更加集中于0附近;③修正模型對上爬坡事件比較敏感。這些均說明修正后的幅值預測誤差一方面減小了系統(tǒng)對快速可調發(fā)電容量的需求,另一方面提高了預測作為輔助決策信息的有效性和實用性。
最后,通過概率統(tǒng)計的方法再次驗證修正模型的有效性。本文統(tǒng)計了全年中具有典型大氣條件月份的修正效果統(tǒng)計。其中春季和冬季是風力充足時期,氣候變化程度也比較大;夏季和秋季相對來說風力變化比較穩(wěn)定。因此,選擇1月份、7月份和10月份進行誤差修正分析,統(tǒng)計結果如附錄B表B3所示。
統(tǒng)計結果顯示:修正模型在氣候變化較小時的誤差修正效果更佳;修正模型對上爬坡比較敏感,下爬坡的修正效果要比上爬坡好,說明結合氣候特征確實有助于挖掘爬坡事件的本質。因此,修正模型在統(tǒng)計概率上是具有優(yōu)勢的,在大部分情況下能夠有效降低幅值誤差。附錄B圖B2對比了幅值預測誤差在修正前后的核概率密度分布圖形??梢园l(fā)現(xiàn):修正后的爬坡幅值預測誤差出現(xiàn)在較小值(例如20 MW)以內的概率要明顯大于修正前的結果。綜上所述,誤差修正模型基于爬坡特征量與NWP氣象指標數據的直接結合,有助于挖掘爬坡事件的本質特征,提高爬坡事件預測精度。
為了滿足決策者對爬坡事件特征量預測精度的要求,本文提出了將NWP氣象數據與WPRE特征量相結合的滾動爬坡修正模型,完成了以下幾方面的工作。
1)建立了爬坡事件特征量預測誤差的向量矩陣,計算了其與各氣象指標之間的線性相關性系數和互信息量,從而確定了有效氣象指標集。
2)建立了歷史爬坡事件特征量預測誤差與歷史有效氣象指標時間序列間的映射關系庫,作為特征量預測誤差修正模型的基礎。
3)提出了基于DTW的有效氣象指標時間序列相似性計算的預測與歷史爬坡事件匹配方法,并據此完成了預測爬坡事件特征量的修正。
以中國華北某風電場的實際數據為例驗證了修正模型的可行性與有效性。如前所述,本文目前的研究工作仍不能保證修正后爬坡事件在首尾上與原始時間序列相連續(xù),而這對基于連續(xù)時間序列的經濟調度計算而言是非常重要的。因此,這一點也將是本文研究工作在未來的延拓和探索方向。