付文杰,李 化,楊伯青,宋 杰
(1.國(guó)網(wǎng)河北省電力有限公司 保定市供電分公司,河北 保定 071000;2.國(guó)電南瑞南京控制系統(tǒng)有限公司,南京 211100)
電力負(fù)荷預(yù)測(cè)對(duì)電網(wǎng)調(diào)度的自動(dòng)控制十分重要,隨著能源互聯(lián)網(wǎng)的發(fā)展及電力改革的推進(jìn),負(fù)荷預(yù)測(cè)的應(yīng)用也逐步擴(kuò)展到售電側(cè)和用戶(hù)側(cè)[1—2]。準(zhǔn)確的負(fù)荷預(yù)測(cè)不僅能夠增加售電商的收益,而且可以改善用戶(hù)側(cè)需求響應(yīng)的實(shí)施效果,對(duì)電網(wǎng)運(yùn)行的穩(wěn)定性和經(jīng)濟(jì)性都大有裨益[3]。
受到多重非線(xiàn)性因素的影響,電力負(fù)荷時(shí)間序列具有混沌性質(zhì),這使得利用混沌理論對(duì)其進(jìn)行處理具有天然的適合性[4—5]?;煦珙A(yù)測(cè)是建立在重構(gòu)電力負(fù)荷時(shí)間序列相空間基礎(chǔ)上的,延遲坐標(biāo)嵌入作為廣泛應(yīng)用的相空間重構(gòu)方法,在使用時(shí)需要選取延遲時(shí)間和嵌入維數(shù)[6]。對(duì)于延遲時(shí)間的選取,通常用自相關(guān)系數(shù)法和互信息法,后者由于考慮了系統(tǒng)的非線(xiàn)性因素,因而性能更佳。嵌入維數(shù)的確定,常用幾何不變量法、虛假最鄰近點(diǎn)法和改進(jìn)虛假最鄰近點(diǎn)法。其中虛假最鄰近點(diǎn)法對(duì)噪聲比較敏感,且閾值的選取具有主觀(guān)性。而改進(jìn)虛假最鄰近點(diǎn)法則不存在這些問(wèn)題,只需要用到延遲時(shí)間和較小的數(shù)據(jù)量就可以確定嵌入維數(shù)[7—8]。本文所采用的實(shí)測(cè)數(shù)據(jù)來(lái)自智能電力終端采集的海量電力負(fù)荷數(shù)據(jù),這些數(shù)據(jù)中往往包含許多采樣噪聲,這些噪聲無(wú)疑會(huì)侵蝕負(fù)荷預(yù)測(cè)的精度。將隨機(jī)濾波與相空間重構(gòu)相結(jié)合,以便將噪聲對(duì)時(shí)間序列預(yù)測(cè)結(jié)果的影響最小化,提升預(yù)測(cè)精度。常用的非線(xiàn)性隨機(jī)濾波有擴(kuò)展卡爾曼濾波、無(wú)跡卡爾曼濾波、集合卡爾曼濾波(ensembleKalman filter,EnKF)等[9]。其中,EnKF用一系列狀態(tài)的采樣值來(lái)近似系統(tǒng)的非線(xiàn)性,無(wú)需求解雅可比矩陣。當(dāng)集合中采樣點(diǎn)的數(shù)量遠(yuǎn)小于狀態(tài)維數(shù)時(shí),其時(shí)間復(fù)雜度小于擴(kuò)展卡爾曼濾波。同時(shí),EnKF對(duì)系統(tǒng)模型的要求較低,對(duì)模型偏差和不完整性的容忍度較高[10—11]。
本文使用數(shù)據(jù)驅(qū)動(dòng)的方法對(duì)家庭分項(xiàng)電器負(fù)荷與總負(fù)荷進(jìn)行短期預(yù)測(cè)。首先,由非侵入式量測(cè)終端獲得的海量歷史負(fù)荷數(shù)據(jù)組成一維時(shí)間序列。依據(jù)提出的基于集合卡爾曼濾波和相空間重構(gòu)(reconstructing phase space,PSR)的組合模型(EnKF?PSR),應(yīng)用延遲坐標(biāo)嵌入法對(duì)該一維時(shí)間序列進(jìn)行相空間重構(gòu)。采用互信息法和改進(jìn)虛假最鄰近點(diǎn)法分別選取延遲時(shí)間和嵌入維數(shù),并且采用局部平均法預(yù)測(cè)下一時(shí)刻的負(fù)荷。根據(jù)無(wú)跡變換理論,對(duì)負(fù)荷預(yù)測(cè)值選取合適數(shù)量的Sigma點(diǎn)組成預(yù)測(cè)值集合,并使用EnKF算法進(jìn)行數(shù)據(jù)同化,最終得到經(jīng)過(guò)隨機(jī)濾波的分項(xiàng)電器負(fù)荷預(yù)測(cè)值和家庭總負(fù)荷預(yù)測(cè)值。本文的方法旨在優(yōu)化負(fù)荷預(yù)測(cè)結(jié)果,減小數(shù)據(jù)采樣噪聲對(duì)預(yù)測(cè)結(jié)果的影響,具有較高的預(yù)測(cè)精度。
對(duì)于具有混沌性質(zhì)的電力負(fù)荷時(shí)間序列,根據(jù)Takens嵌入定理,可以從該序列中重構(gòu)一個(gè)與原動(dòng)力系統(tǒng)在拓?fù)湟饬x下一樣的相空間[12]。由于對(duì)初始條件極其敏感,因此相空間重構(gòu)方法往往用來(lái)進(jìn)行短期預(yù)測(cè)。利用延遲坐標(biāo)的方法重構(gòu)相空間,關(guān)鍵在于延遲時(shí)間和嵌入維數(shù)兩個(gè)參數(shù)的選取。
1.1.1 延遲時(shí)間
定義兩個(gè)電力負(fù)荷的時(shí)間序列S、Q如式(1)所示,其中Q為S經(jīng)過(guò)延時(shí)τ后所得
兩個(gè)時(shí)間序列之間的互信息為延遲時(shí)間τ的函數(shù),互信息I(τ)的大小代表在已知時(shí)間序列S的情況下,時(shí)間序列Q的確定性大小。可表示如下
式中:I(τ)的第一個(gè)極小值表示兩個(gè)時(shí)間序列之間不相關(guān)的最大可能性,因此使用I(τ)的第一個(gè)極小值作為最終的延遲時(shí)間τ;H(S)、H(Q)和H(S,Q)分別為各自時(shí)間序列的信息熵及聯(lián)合信息熵,如式(3)—式(5)所示
式中:P為相應(yīng)的概率。
1.1.2 嵌入維數(shù)
基于電力負(fù)荷的時(shí)間序列S和延遲時(shí)間τ,可以構(gòu)造相空間yi(d)如式(6)所示
式中:d為嵌入維數(shù)。
所謂虛假臨近點(diǎn),是指高維相空間并不相鄰的兩個(gè)點(diǎn)投影到一維空間上,有的時(shí)候會(huì)成為相鄰的兩點(diǎn)。在d維相空間中,每個(gè)向量yi(d)都有一個(gè)最臨近點(diǎn)。衡量?jī)牲c(diǎn)之間距離的尺度可以是歐幾里德距離|·||2或最大模范數(shù)||·||∞,本文使用后者。定義變量a(i,d)、E(d)、E1(d)如下所示
式中:a(i,d)為使得對(duì)應(yīng)向量在最大模范數(shù)下離向量yi(d)最近;E(d)為在d維的范圍內(nèi),對(duì)a(i,d)求取平均值;E1(d)為當(dāng)維數(shù)從d變?yōu)閐+1時(shí),變量E(d)的變化程度。通過(guò)迭代計(jì)算,當(dāng)維數(shù)d大于一定值dc,而E1(d)不再變化時(shí),選取dc+1為時(shí)間序列的嵌入維數(shù)。
1.1.3 局部平均預(yù)測(cè)
依據(jù)選取的延遲時(shí)間和嵌入維數(shù)完成相空間重構(gòu),形成第i個(gè)向量yi如式(6)所示。因此,可以在d維歐式空間建立系統(tǒng)模型如下所示
式中:F為一個(gè)連續(xù)函數(shù)。令N=n-(d-1)τ,根據(jù)連續(xù)函數(shù)的性質(zhì),如果yN與yh很接近,則可用x(h+1)作為x(N+1)的近似。以最大模范數(shù)||·||∞為衡量標(biāo)準(zhǔn),從相空間中選取k個(gè)與yN最接近的向量,根據(jù)局部平均預(yù)測(cè)思想可以得到電力負(fù)荷時(shí)間序列下一時(shí)刻的預(yù)測(cè)值x(n+1)如下所示
式中:th為第h個(gè)最接近的向量。
基于傳統(tǒng)PSR模型得到的負(fù)荷預(yù)測(cè)值中依然包含采樣噪聲和隨機(jī)噪聲。本節(jié)通過(guò)EnKF算法對(duì)負(fù)荷預(yù)測(cè)值進(jìn)行分析與校正,EnKF算法將噪聲納入迭代計(jì)算中,容忍其存在的同時(shí)能夠給出最優(yōu)的負(fù)荷狀態(tài)預(yù)測(cè)。
1.2.1 模型系統(tǒng)結(jié)構(gòu)
EnKF-PSR組合模型的系統(tǒng)結(jié)構(gòu)如圖1虛線(xiàn)框中所示。模型對(duì)輸入數(shù)據(jù)的處理過(guò)程主要分為以下3個(gè)階段:
圖1 模型系統(tǒng)結(jié)構(gòu)圖Fig.1 Structure diagram of model system
(1)PSR參數(shù)選取?;陔娏ω?fù)荷時(shí)間序列S,根據(jù)互信息I(τ)極小值法選取延遲時(shí)間τ;根據(jù)虛假臨近點(diǎn)法選取嵌入維數(shù)d。參數(shù)選取完成后,相空間重構(gòu)即可完成。
(2)無(wú)跡變換及PSR預(yù)測(cè)值集合形成。通過(guò)無(wú)跡變換方法得到相空間中各個(gè)變量的Sigma點(diǎn)集,再依據(jù)局部平均預(yù)測(cè)法得到PSR預(yù)測(cè)值集合。
(3)EnKF分析及校正。使用EnKF算法對(duì)PSR預(yù)測(cè)值集合進(jìn)行分析和校正處理,最終得到負(fù)荷預(yù)測(cè)結(jié)果。
1.2.2 無(wú)跡變換與EnKF
電力負(fù)荷背后隱藏的動(dòng)力系統(tǒng)是一個(gè)受多重因素影響的強(qiáng)非線(xiàn)性系統(tǒng),可用式(12)所示的方程描述其動(dòng)態(tài)規(guī)律和觀(guān)測(cè)行為。龐大的電力負(fù)荷通常很難用準(zhǔn)確的數(shù)學(xué)模型進(jìn)行預(yù)測(cè),因此本文采用數(shù)據(jù)驅(qū)動(dòng)的方法。對(duì)應(yīng)到式(12)中,主要考慮vk代表的量測(cè)噪聲,即采樣噪聲。
式中:xk為狀態(tài)變量;yk為觀(guān)測(cè)值;wk、vk分別為代表模型噪聲、量測(cè)噪聲的白噪聲過(guò)程。
在EnKF理論中,通過(guò)對(duì)系統(tǒng)在k時(shí)刻的狀態(tài)進(jìn)行有限次采樣,組成一個(gè)狀態(tài)集合,然后使用此集合來(lái)近似系統(tǒng)的非線(xiàn)性。鑒于電力負(fù)荷預(yù)測(cè)中,精確的非線(xiàn)性函數(shù)f和g未可知,因此考慮使用無(wú)跡變換的方法來(lái)創(chuàng)建描述狀態(tài)xk的點(diǎn)集。假設(shè)隨機(jī)變量xk的均值和協(xié)方差分別為xˉ和Pk,采取對(duì)稱(chēng)采樣的策略選取2n+1(n為狀態(tài)變量的維數(shù))個(gè)Sigma點(diǎn)及其相關(guān)權(quán)重來(lái)表征xk,如式(13)所示。Sigma點(diǎn)和相關(guān)權(quán)重的選取原則如式(14)所示,其中上標(biāo)為a的量代表預(yù)測(cè)值相關(guān),上標(biāo)為0的量代表均值相關(guān),即Sigma點(diǎn)集的中心,其他所有點(diǎn)關(guān)于均值對(duì)稱(chēng)分布,且所有權(quán)重之和為1。
由于相空間中的向量反映系統(tǒng)狀態(tài),因此考慮如式(15)所示的k時(shí)刻d維觀(guān)測(cè)延遲向量xk。
根據(jù)式(11)所示的局部平均預(yù)測(cè)法,可對(duì)點(diǎn)集中的每一個(gè)Sigma點(diǎn)進(jìn)行處理,得到相應(yīng)下一時(shí)刻的預(yù)測(cè)值。當(dāng)預(yù)測(cè)部分完成后,結(jié)合k+1時(shí)刻的量測(cè)值yk+1。再根據(jù)式(16),即可對(duì)預(yù)測(cè)值進(jìn)行校正,從而得到最優(yōu)的預(yù)測(cè)結(jié)果。
式中:Kk為卡爾曼增益;為狀態(tài)與觀(guān)測(cè)的交叉協(xié)方差;為量測(cè)協(xié)方差;Pk為狀態(tài)的協(xié)方差;為狀態(tài)預(yù)測(cè)值;為觀(guān)測(cè)預(yù)估值;Q、R分別為模型噪聲的協(xié)方差和量測(cè)噪聲的協(xié)方差,本文假定它們?yōu)榱憔蛋自肼暋?/p>
1.2.3 數(shù)據(jù)處理與算法流程
模型的輸入數(shù)據(jù)源自非侵入式量測(cè)終端。非侵入式負(fù)荷辨識(shí)技術(shù)是一種新型高級(jí)量測(cè)技術(shù),通過(guò)在用戶(hù)關(guān)口安裝終端、表等采集電力負(fù)荷輸入總線(xiàn)的總電流、電壓等實(shí)時(shí)信息,利用總電流、電壓等包含的負(fù)荷特征信息和高級(jí)算法來(lái)實(shí)現(xiàn)負(fù)荷辨識(shí)。目前預(yù)測(cè)精度平均85%以上,其中300 W以上大功率電器識(shí)別率95%以上[13]。當(dāng)前的非侵入式負(fù)荷辨識(shí)數(shù)據(jù)辨識(shí)精度可支撐電力供需互動(dòng)的負(fù)荷預(yù)測(cè),特別是家庭主要大功率電器。非侵入式負(fù)荷辨識(shí)細(xì)化了家庭電器負(fù)荷類(lèi)型感知,能提升負(fù)荷預(yù)測(cè)精度。
由于人為因素或某些特殊原因,采樣得到的負(fù)荷數(shù)據(jù)有時(shí)包含一些壞點(diǎn)。本文對(duì)采樣數(shù)據(jù)進(jìn)行預(yù)處理,基于最大熵算法[14]建立了壞點(diǎn)分類(lèi)模型,如圖2所示。
圖2 基于最大熵的壞點(diǎn)分類(lèi)模型Fig.2 Abnormal data classification model based on maximum entropy
基于EnKF?PSR組合模型的電力負(fù)荷預(yù)測(cè)算法流程如圖3所示。在利用局部平均法預(yù)測(cè)下一時(shí)刻的狀態(tài)時(shí),對(duì)最臨近向量的個(gè)數(shù)采取迭代的方式選取,從2個(gè)最鄰近向量個(gè)數(shù)開(kāi)始進(jìn)行計(jì)算直至狀態(tài)預(yù)測(cè)值收斂為止。這樣處理可以根據(jù)不同的電力負(fù)荷數(shù)據(jù)訓(xùn)練集實(shí)時(shí)選取合適的最臨近向量數(shù)目,具有自適應(yīng)性,從而最優(yōu)化算法執(zhí)行時(shí)間。
圖3 負(fù)荷預(yù)測(cè)算法流程Fig.3 Load forecasting algorithm flow
在電力負(fù)荷的預(yù)測(cè)過(guò)程中,由于數(shù)學(xué)模型的簡(jiǎn)化、各種影響因子的忽略、不當(dāng)?shù)膮?shù)選取、訓(xùn)練樣本不完整等因素,導(dǎo)致預(yù)測(cè)值與真實(shí)值之間一般總有誤差。一種簡(jiǎn)單的評(píng)價(jià)指標(biāo)是絕對(duì)誤差,即負(fù)荷預(yù)測(cè)值與真實(shí)值之間的差值。但是,這種評(píng)價(jià)指標(biāo)對(duì)誤差大小的表達(dá)不夠直觀(guān)。本文使用相對(duì)誤差來(lái)作為評(píng)價(jià)指標(biāo),更加直觀(guān)。假設(shè)y(i)和y?(i)分別是i時(shí)刻的負(fù)荷真實(shí)值和預(yù)測(cè)值,則它們之間的相對(duì)誤差如式(17)所示
樣本數(shù)據(jù)來(lái)自基于圖2所示的非侵入式終端量測(cè)得到的河北省保定市50個(gè)家庭用戶(hù)的2019年7月10日到7月15日的用電數(shù)據(jù),包括電熱水器、空調(diào)的負(fù)荷以及家庭總負(fù)荷,采樣間隔為15 min。表1給出了所采集的樣本數(shù)據(jù),為50個(gè)家庭的負(fù)荷數(shù)據(jù)總和。
表1 樣本數(shù)據(jù)Table 1 Sample data
對(duì)于一維電力負(fù)荷時(shí)間序列,對(duì)每一個(gè)狀態(tài)選取3個(gè)Sigma點(diǎn)組成點(diǎn)集。中心點(diǎn)的權(quán)重W0取0.5,另外兩點(diǎn)的權(quán)重W1、W2均取0.25。表1中電熱水器SWH、空調(diào)SAC和總負(fù)荷STOTAL的時(shí)間序列可分別表示如下:
根據(jù)式(1)—式(5)求出相關(guān)概率后再利用互信息I(τ)極小值法求出延遲時(shí)間。根據(jù)式(7)—式(9)求取嵌入維數(shù)。算法中的主要參數(shù)如表2所示。
表2 算法主要參數(shù)Table 2 Main parameters for algorithm
由于本文的主要工作是初步驗(yàn)證所提算法對(duì)電力負(fù)荷預(yù)測(cè)的可行性和有效性,因此,延遲時(shí)間與嵌入維數(shù)的選取并不是最優(yōu)的。在下一步開(kāi)展的工作中,需要對(duì)比多組延遲時(shí)間和嵌入維數(shù)對(duì)符合預(yù)測(cè)效果的影響,以?xún)?yōu)化參數(shù)選取。
基于EnKF?PSR組合模型算法分別得到熱水器、空調(diào)和家庭總負(fù)荷的預(yù)測(cè)值。圖4給出了一天中電熱水器負(fù)荷的預(yù)測(cè)值、實(shí)際值和相對(duì)誤差。
圖4 電熱水器負(fù)荷預(yù)測(cè)效果Fig.4 Forecasting effect of electrical water heater load
由圖4可以看出,誤差范圍主要集中在+7~-10之間,預(yù)測(cè)效果令人滿(mǎn)意。通過(guò)電熱水器的負(fù)荷預(yù)測(cè)結(jié)果可以得知,用戶(hù)對(duì)電器的主要使用時(shí)段集中在21:00—23:00,這也符合多數(shù)用戶(hù)工作和休息時(shí)段的實(shí)際情況,再次說(shuō)明預(yù)測(cè)結(jié)果能夠較為準(zhǔn)確的反應(yīng)真實(shí)的用戶(hù)行為。
圖5給出了一天中空調(diào)負(fù)荷的預(yù)測(cè)值、實(shí)際值和相對(duì)誤差。誤差范圍主要集中在-15%~+15%之間,預(yù)測(cè)效果比較令人滿(mǎn)意。根據(jù)式(17)所示的相對(duì)誤差計(jì)算方法,由圖2、圖3可以看出,相對(duì)誤差的大小不僅取決于絕對(duì)誤差,還同時(shí)受到公式中的分母即負(fù)荷實(shí)際值大小的影響。由于空調(diào)的使用受個(gè)人習(xí)慣、家庭經(jīng)濟(jì)狀況等眾多因素影響,因此隨機(jī)性較大,故預(yù)測(cè)誤差相對(duì)較大。通過(guò)空調(diào)的負(fù)荷預(yù)測(cè)結(jié)果可以得知,用戶(hù)對(duì)電器的主要使用時(shí)段集中在12:00—15:00以及21:00—23:00。由于本文采集的數(shù)據(jù)歸屬于夏季,因此預(yù)測(cè)結(jié)果符合多數(shù)用戶(hù)工作和休息時(shí)段的實(shí)際情況,再次說(shuō)明預(yù)測(cè)結(jié)果能夠較為準(zhǔn)確的反應(yīng)真實(shí)的用戶(hù)行為。
圖5 空調(diào)負(fù)荷預(yù)測(cè)效果Fig.5 Forecasting effect of air?conditioner load
圖6為基于EnKF?PSR模型的總負(fù)荷預(yù)測(cè)值與實(shí)際值的比較以及相對(duì)誤差。誤差范圍為-10%~+10%,取得了較好的預(yù)測(cè)效果??傌?fù)荷的變化趨勢(shì)符合夏季用戶(hù)側(cè)負(fù)荷的實(shí)際變化規(guī)律。同時(shí),將單純基于PSR模型的預(yù)測(cè)結(jié)果與實(shí)際值作比較,相對(duì)誤差如圖7所示,誤差范圍為-11%~+22%。由于采樣噪聲的存在,使得負(fù)荷預(yù)測(cè)結(jié)果與實(shí)際值之間存在較大的偏差。對(duì)比圖6和圖7可以看出,EnKF?PSR組合模型預(yù)測(cè)方法能夠在存在采樣噪聲的情況下給出更為優(yōu)化的負(fù)荷預(yù)測(cè)結(jié)果,因此具有更好的預(yù)測(cè)效果。
圖6 基于EnKF?PSR模型時(shí)總負(fù)荷預(yù)測(cè)效果Fig.6 Forecasting effect of total power load based on EnKF?PSR model
圖7 基于傳統(tǒng)PSR模型時(shí)總負(fù)荷預(yù)測(cè)效果Fig.7 Forecasting effect of total power load based on traditional PSR model
本文基于提出的EnKF?PSR組合模型對(duì)家用分項(xiàng)電器和家庭總負(fù)荷進(jìn)行短期預(yù)測(cè)。在存在采樣噪聲的情況下,使用EnKF算法對(duì)負(fù)荷預(yù)測(cè)值進(jìn)行分析和校正,給出最優(yōu)負(fù)荷估計(jì)。通過(guò)非侵入式終端獲取河北保定50個(gè)家庭用戶(hù)的歷史用電數(shù)據(jù)進(jìn)行樣本訓(xùn)練,從而得出算法所需的延遲時(shí)間、嵌入維數(shù)等主要參數(shù)。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)PSR方法相比,本文提出的EnKF?PSR組合模型方法具有更好的負(fù)荷預(yù)測(cè)效果。下一步的工作重點(diǎn)在于對(duì)比不同延遲時(shí)間和嵌入維數(shù)對(duì)負(fù)荷預(yù)測(cè)效果的影響,以期得到優(yōu)化的延遲實(shí)際和嵌入維數(shù)以及更佳的負(fù)荷預(yù)測(cè)效果。