劉永前,周家慷,閻 潔,韓 爽,李 莉,Bekhbat Galsan
(1.華北電力大學 新能源電力系統(tǒng)國家重點實驗室,北京102206;2.華北電力大學 新能源學院,北京102206;3.蒙古科技大學 電力工程學院,蒙古 烏蘭巴托999097-15141)
到2019年底,國內(nèi)風電累計裝機容量突破2.1億kW,風電已經(jīng)從補充能源進入到替代能源的發(fā)展階段。然而,風能的間歇性、隨機性和波動性,使高比例的風電并網(wǎng)會對電力系統(tǒng)的安全穩(wěn)定運行帶來嚴重威脅[1]。對風電場進行高精度的風速實時預測,一方面有助于電網(wǎng)做出最優(yōu)調(diào)度決策[2],另一方面有助于提高風電機組的運行狀況和控制品質(zhì),使其在保證安全可靠運行的條件下充分利用風資源,促進風電場管理智能化。
目前,國內(nèi)外對于風電場風速實時預測的研究越來越深入。風速的實時預測是一種超短期的多步預測,風速預測方法可大致分為物理方法、統(tǒng)計方法和組合方法。
物理方法依賴龐大復雜的氣象數(shù)據(jù)和物理數(shù)據(jù),計算量大,在超短期預測尺度上精度不夠理想,且時間分辨率較大(小時級),一般不用于超短期預測。統(tǒng)計方法利用人工智能算法來建立歷史輸入數(shù)據(jù)與未來輸出數(shù)據(jù)之間的關系,如時間序列算法[3]、支持向量機[4]、隨機森林算法[5]和深度學習算法等。統(tǒng)計方法具備強大非線性擬合能力,適用于超短期風速預測,而單一預測模型可能受自身模型能力極限的限制而對潛藏信息挖掘不深入,進而捕獲不到復雜的風速內(nèi)在演變規(guī)律,致使模型泛化能力不強。組合方法是特征參數(shù)提取技術、數(shù)據(jù)相關度量化法、多種人工智能算法以及權(quán)值分配方法等各種方法及算法的排列組合[6]。與單個模型預測相比,組合方法可發(fā)揮各自模型的優(yōu)勢,在一定程度上提高模型對風速突變點的跟蹤效果。
目前,許多組合方法以信號分析為基礎,首先將風速分解為多個子序列,充分利用時序數(shù)據(jù)不同頻率上的規(guī)律性,減小了預測誤差。Yagang Z[7]采用變分模態(tài)將風速分解為非線性部分、線性部分和噪聲部分,對非線性部分建立基于主成分分析的徑向基核函數(shù)模型,對線性部分建立自回歸滑動平均模型,對噪聲部分進行概率分布擬合,進行確定性預測和不確定性預測。但是,這些以信號分析為基礎的風速預測方法,在分解風速序列后,不同子序列各為獨立的預測任務,忽略了各任務之間的相關性。
多任務學習,即假設現(xiàn)有若干個相關但不完全相同的任務,利用這些任務所包含的信息,輔助提升各個任務的性能?,F(xiàn)有研究主要致力于多任務學習參數(shù)共享機制[8]和建立任務間的相關性[9]。在樣本比較少的情況下,多任務學習能挖掘任務之間的關系,得到額外的有用信息且具有更好的模型泛化能力,使學習的效果更好。因此,將多任務學習方法應用于風速分解子序列預測,通過深度挖掘分享子序列預測任務間的信息,提升風速預測的效果。
在現(xiàn)有的相關研究中,超短期風速預測的時間分辨率大多為分鐘級,難以滿足高比例風電并網(wǎng)場景下風電場運行控制對預測精度和預測時間分辨率的要求。本文提出的風速實時預測方法屬于秒級時間分辨率下的“極短期”預測,主要應用于風電機組控制。通過提前獲知風速狀況調(diào)整風電機組的控制策略,可提升風電機組發(fā)電量、減小機組疲勞載荷,同時也可進一步為電網(wǎng)在線優(yōu)化調(diào)度提供更豐富的輔助信息。首先,進行風速序列分解,采用變分模態(tài)分解(VMD)將風速序列分解為一系列具有不同中心頻率和有限帶寬的信號;其次,建立多任務學習的共享層,使用長短期記憶神經(jīng)網(wǎng)絡(LSTM)提取風速子序列中的共享參數(shù);然后,建立多任務學習的特定任務層,將共享參數(shù)與分解后的平穩(wěn)信號作為輸入,借助多個LSTM并行預測分解后的風速子序列;不同于一般的以信號分析為基礎組合預測算法,本文所提方法采用多任務學習算法,考慮了各子序列預測任務之間的相關性,輔助提升各個預測任務的性能;最后,將多個預測結(jié)果疊加組合得到對原始序列的預測結(jié)果。
VMD原理包含構(gòu)造變分問題和求解兩部分。構(gòu)造變分問題即將風速序列分解為k個具有中心頻率和有限帶寬的模態(tài)分量,根據(jù)L2范數(shù)約束,變分問題為各模態(tài)的估計帶寬之和最小,滿足各模態(tài)之和與原始信號相等,則相應約束變分表達式為
式中:k為模態(tài)數(shù);{μk}為第k個模態(tài)分量;{ωk}為第k個模態(tài)分量對應的中心頻率;δ(t)為狄拉克函數(shù);*為卷積運算符;f為原始信號;t為時間;j為虛數(shù)單位。
求解式(1),引入拉格朗日乘法算子λ和乘法因子α,得到增廣拉格朗日表達式。
分解模態(tài)個數(shù)k的選取對分解結(jié)果影響較大。為簡化流程,減少模型運行時間及提高風速分解效率,本文通過計算末尾兩個子模態(tài)分量與首端兩個子模態(tài)分量的相對歐式距離百分比以判斷其相似度,防止原始序列未被充分分解或被過度分解,從而合理確定k值。兩子序列間的歐氏距離表示為
式中:ν1,ν2為兩個序列;ν11,ν21的右下標第一個數(shù)為第i個序列,第二個下標為第i個序列的第j個數(shù)(i=1,2;j=1,2,3,…,n)。
首末兩對序列的相對歐氏距離百分比為
式中:ν-1,ν-2分別為倒數(shù)第一和倒數(shù)第二個序列;ν1,ν2分別為第一和第二個序列。
relative_d的閾值取5%±0.5%,大于該值時認為序列未被充分分解,小于該值時認為序列過度分解。文中風速時間序列數(shù)據(jù)取自中國某風電場,采樣間隔為5 s,通過計算,當k=3時,relative_d=6.8%,不符合閾值條件;當k=4時,relative_d=4.9%,閾值符合條件。變分模態(tài)分解前后風速序列如圖1所示。
圖1 變分模態(tài)分解前后風速序列Fig.1 Wind speed series before and after variational modal decomposition
前文通過變分模態(tài)分解技術,將風速時間序列分解為k個子序列。本節(jié)將子序列的預測視為多個不同的任務,建立多任務學習模型,并通過長短期記憶網(wǎng)絡對分解后的子序列進行預測。
傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡存在長期依賴問題,長短期記憶網(wǎng)絡巧妙地利用“門”理論來改造循環(huán)神經(jīng)網(wǎng)絡,結(jié)構(gòu)中包含遺忘門、輸入門和輸出門。LSTM單元在t時刻有3個輸入:當前時刻網(wǎng)絡的輸入值xt,上一時刻LSTM的輸出值ht-1,上一時刻的單元狀態(tài)ct-1。LSTM單元在t時刻有兩個輸出:當前時刻的輸出值ht,當前時刻單元狀態(tài)ct。下標t為當前時刻,t-1為上一時刻。LSTM網(wǎng)絡對輸入xt處理最后生成輸出ht的前向傳播過程可分為如下6步,分別計算遺忘門ft、輸入門it、寫入單元的新信息c?t、輸出門ot和單元短時輸出向量ht。
式中:Wif,Wii,Wic,Wio分別為當前輸入與遺忘門、輸入門、c?t、輸出門相乘的權(quán)重矩陣;Wfh,Wih,Wch,Woh分別為上一時刻輸出與遺忘門、輸入門c?t、輸出門相乘的權(quán)重矩陣;bf,bi,bc,bo分別為對應的偏置項;σ為sigmoid函數(shù)。
多任務是相對于單任務而言,單任務學習(STL)是一次學習一個任務,并且各個任務間相互獨立。對于非平穩(wěn)、非線性的時間序列的預測則將其劃分為一個個簡單子序列,獨立地對子序列進行預測,通過適當?shù)丶訖?quán)組合得到原非線性序列的預測結(jié)果。然而,STL獨立地對子序列進行預測往往忽視了子序列間的相互聯(lián)系,不能充分利用序列之間有用信息輔助各子序列的預測。多任務學習(MTL)通過共享相關任務之間的表征以提高模型在目標任務的預測性能。
本文采用硬參數(shù)共享機制實現(xiàn)MTL模型,即靠近模型的輸入部分為任務共享層,多個任務之間共享模型的若干層隱藏層,靠近模型的輸出部分為任務特定層。硬共享的原理是不同的任務共享一個網(wǎng)絡結(jié)構(gòu),不同任務之間的訓練相輔相成,效果共同提升。
本文以LSTM為基本單元,構(gòu)建基于參數(shù)共享的MTL模型。假設對所有子分量的預測視為是不同且相關的子任務,并把這些任務放在一起同時學習。MTL模型包括兩個模塊,用于提取共享參數(shù)的共享層和用于預測各子序列的特定任務層,其內(nèi)部結(jié)構(gòu)如圖2所示。
圖2 MTL模型內(nèi)部結(jié)構(gòu)Fig.2 Internal structure of MTL model
由圖2(a)可知,共享層的構(gòu)建使用多個堆疊的LSTM將輸入序列的特征提取到固定維度的張量中,完成共享參數(shù)的提取任務。結(jié)合上節(jié)內(nèi)容可知,共享LSTMcell的輸入是上一時刻的隱含狀態(tài)ht-1以及當前時刻的輸入,直到最后一個xt輸入共享LSTMcell時,將最后的隱含層狀態(tài)和單元狀態(tài)作為整個原序列的表征張量。由于共享層與特定任務層要求數(shù)據(jù)形狀一致,故通過復制拼接張量,完成共享參數(shù)表征從共享層到特定任務層數(shù)據(jù)傳遞。
由圖2(b)可知:特定任務預測層的構(gòu)建是利用從共享層傳遞過來的共享參數(shù)分別為每個子序列建立一個LSTM網(wǎng)絡進行預測;最后將硬參數(shù)共享的多任務學習模型得到的各子序列的預測值進行疊加,得到最終預測結(jié)果。
選取中國某風電場的風速時間序列數(shù)據(jù),采樣間隔為5 s,數(shù)據(jù)量為34 560,按6∶4劃分訓練集和測試集。模型的輸入及輸出數(shù)據(jù)如圖3所示。
圖3 數(shù)據(jù)窗口劃分Fig.3 Data window division
圖中input為輸入的歷史數(shù)據(jù),output為要預測的目標序列,考慮到模型預測需要一定時間且時間分辨率小,預測輸入的下一個點的意義不大,故在input和output間設置間隔interval,interval設置為5(即本文提出的模型及其對比模型均為提前25 s的多步風速實時預測)。在預測時,若變分模態(tài)將測試集的輸入和輸出一起進行分解,則會導致數(shù)據(jù)泄露,致使模型無法應用于實際。為此,我們將其分開分解,并采用0-1規(guī)范化對數(shù)據(jù)進行規(guī)范化處理。
為了驗證所提模型的有效性及實用性,一方面設置經(jīng)過變分模態(tài)分解和未經(jīng)過變分模態(tài)分解的單任務模型預測進行結(jié)果對比(下文中分別簡稱為單任務模型和直接預測模型);另一方面設置經(jīng)過變分模態(tài)分解的單任務模型與所提多任務模型預測進行精度對比。每個模型都分別設置對風速提前25 s的10步預測模型及對風速提前25 s的5步預測模型。
采用兩種誤差指標,即平均絕對誤差(MAE)和均方根誤差(RMSE),來綜合反映模型的預測精度。
本文提出的模型及其對比模型均為提前25 s的多步風速實時預測,所提模型均無須進行在線訓練。在實際工程應用中,其預測模式為離線訓練、在線預測、定期更新。在線預測是將實時數(shù)據(jù)輸入訓練好的模型進行預測。在上述系統(tǒng)配置下,該預測過程平均耗時為3 s,因此模型的時效性可以滿足提前25 s的在線預測需求。
圖4所示為MTL,STL和直接預測模型的對比實驗結(jié)果。由圖4可知,相比于STL和直接預測模型,MTL都能更好地追蹤風速信號的變化趨勢,特別是在風速劇烈波動時(圖中段部分),而STL預測值偏小,直接預測模型預測值偏大。
圖4 各模型預測結(jié)果趨勢對比Fig.4 Comparison of prediction results of models
各模型在10步、5步預測中各預測誤差指標變化趨勢如圖5,6所示。由圖5,6可知:STL在10步預測中的前7步和5步預測中的前4步RMSE和MAE均小于直接預測模型,結(jié)果表明了變分模態(tài)分解對風速實時預測精度提升的有效性;MTL在多步預測中各步RMSE和MAE均小于STL和直接預測模型,結(jié)果表明了MTL的應用可挖掘和分享子序列預測任務間的信息,提高了風速實時預測的精度。
圖5 各模型10步預測RMSE及MAE變化趨勢對比Fig.5 Comparison of 10-step forecast RMSE and MAE change trends of each model
圖6 各模型5步預測RMSE及MAE變化趨勢對比Fig.6 Comparison of 5-step forecast RMSE and MAE change trends of each model
MTL,STL和直接預測模型的多步預測誤差總體均值如表1所示。
表1 模型多步預測誤差總體均值Table 1 Multi-step forecast error overall mean of models
由表1可知:與經(jīng)過變分模態(tài)分解和未經(jīng)過變分模態(tài)分解的STL預測相比,MTL的RMSE總體均值在10步預測中分別降低了35.5%和39.8%,在5步預測中分別降低了24.5%和45.8%;MTL的MAE總體均值在10步預測中分別降低了31.8%和38.9%,在5步預測中分別降低了25.4%和38.4%。
針對不同風速進行算法的敏感性分析,各模型10步預測平均誤差隨風速變化趨勢對比如圖7所示。由圖7可知:不同風速下,MTL優(yōu)于STL,STL優(yōu)于直接預測模型;從變化趨勢來看,各模型的預測誤差均隨著風速的增大而增大,直接預測模型和STL在風速大于10 m/s時預測誤差增大幅度遠大于MTL,進一步證明了MTL在大風速多步預測中的優(yōu)越性。
圖7 各模型10步預測平均誤差隨風速變化趨勢Fig.7 Comparison of the 10-step forecast average error of each model with the change trend of wind speed
本文以時間分辨率為5 s的風速序列為研究對象,建立了基于多任務學習的風速預測模型。在風速預處理階段,采用變分模態(tài)分解方法得到風速子序列。在風速預測階段,結(jié)合LSTM建立基于參數(shù)共享的MTL,實現(xiàn)秒級風速實時多步預測。利用某風電場的實際風速數(shù)據(jù)進行算例分析,與經(jīng)過變分模態(tài)分解的STL和未經(jīng)過變分模態(tài)分解的直接預測模型相比,得到如下結(jié)論。
①STL在多步預測中的RMSE和MAE總體小于直接預測模型,表明了變分模態(tài)分解對風速實時預測精度提升的有效性。
②與STL和直接預測模型相比:MTL的RMSE總體均值在10步預測中分別降低了35.5%和39.8%,在5步預測中分別降低了24.5%和45.8%;MTL的MAE總體均值在10步預測中分別降低了31.8%和38.9%,在5步預測中分別降低了25.4%和38.4%。由此表明,將多任務學習方法應用于風速分解子序列預測,通過深度挖掘分享子序列預測任務間的信息,可大幅提高秒級風速實時預測精度。