劉 升
(國網(wǎng)福建省電力有限公司,福州 350000)
隨著我國社會經(jīng)濟(jì)發(fā)展和人口增長,各地區(qū)用電量不斷增長,屢創(chuàng)新高,這給基礎(chǔ)臺區(qū)配變供電帶來巨大壓力,超載及嚴(yán)重超載現(xiàn)象時有發(fā)生,嚴(yán)重影響臺區(qū)正常的生產(chǎn)生活。為了滿足不斷增長的用電需求,各省相繼提出臺區(qū)配變擴(kuò)容的規(guī)劃,而臺區(qū)配電負(fù)荷的預(yù)測是擴(kuò)容規(guī)劃的重要前期工作,準(zhǔn)確的臺區(qū)負(fù)荷預(yù)測尤其是對負(fù)荷日峰值的預(yù)測能為擴(kuò)容規(guī)劃的安全性與穩(wěn)定性提供有力保障[1~3]。
與區(qū)域電網(wǎng)(省網(wǎng),市縣網(wǎng))相比,影響具體臺區(qū)配電負(fù)荷的因素更難以分類和量化,可獲得的統(tǒng)計數(shù)據(jù)種類少、質(zhì)量差,這些因素使得臺區(qū)配變負(fù)荷的預(yù)測成為一大難題。關(guān)于配電負(fù)荷預(yù)測國內(nèi)外許多學(xué)者對配電負(fù)荷預(yù)測進(jìn)行了大量的研究,取得了豐富的研究成果?;貧w分析模型[4]、時間序列模型[5]、灰色預(yù)測模型[6]、神經(jīng)網(wǎng)絡(luò)模型[7]等在配電負(fù)荷的預(yù)測上都有著廣泛應(yīng)用。
根據(jù)所研究的時間周期長度的不同,配電負(fù)荷的預(yù)測可以劃分為:以年為周期的長周期;以月或季為周期的中周期;以日為周期的短周期;以小時為周期的超短周期等不同類型。文獻(xiàn)[8]對不同周期的配電負(fù)荷預(yù)測方法進(jìn)行了比較與研究,認(rèn)為長周期的年度負(fù)荷預(yù)測適合使用回歸類模型,中周期的月度負(fù)荷預(yù)測適合使用各類基于相關(guān)性的預(yù)測模型,而在以日為周期的短期負(fù)荷預(yù)測中適合使用時間序列預(yù)測模型。文獻(xiàn)[9]基于聚類算法與支持向量機(SVM)對電力系統(tǒng)短期負(fù)荷的預(yù)測進(jìn)行了研究,研究結(jié)果顯示,以日為單位的電力負(fù)荷數(shù)據(jù)一般呈現(xiàn)出周期性特征。在中長期電力負(fù)荷的預(yù)測,文獻(xiàn)[10]將不同的預(yù)測模型進(jìn)行組合,通過二次規(guī)劃求解的方法得到最優(yōu)的預(yù)測模型。文獻(xiàn)[11] 基于時間分析模型對某居民小區(qū)的用電負(fù)荷小時數(shù)據(jù)進(jìn)行了建模與預(yù)測,并驗證了模型的有效性,因此,使用時間序列法分析低頻負(fù)荷序列具有很高的實用性和可靠性。
然而,現(xiàn)階段負(fù)荷的對象大多集中在區(qū)域電網(wǎng)(省網(wǎng),市縣網(wǎng))領(lǐng)域,細(xì)化到具體臺區(qū)的相關(guān)研究較少。相較于區(qū)域電網(wǎng)(省網(wǎng),市縣網(wǎng)),具體臺區(qū)配電負(fù)荷的相關(guān)數(shù)據(jù)呈現(xiàn)出區(qū)域性明顯、數(shù)據(jù)種類單一、數(shù)據(jù)非結(jié)構(gòu)化、影響因素難以量化等特點。分區(qū)域電網(wǎng)的研究方法無法完全適用于臺區(qū)配電負(fù)荷的研究,同時過于復(fù)雜的模型也限制了其在現(xiàn)實應(yīng)用中的推廣。本文選擇以日為周期的負(fù)荷峰值作為研究對象,研究日負(fù)荷峰值時間序列的短期波動特征。在模型的選擇上,因為日負(fù)荷峰值數(shù)據(jù)存在明顯的周期性特征,不適用于傳統(tǒng)的回歸分析,故本文選擇使用時間序列模型進(jìn)行研究。相比其它預(yù)測方法,時間序列方法基于臺區(qū)負(fù)荷的歷史數(shù)據(jù),能夠反映不同時期負(fù)荷數(shù)據(jù)之間的相關(guān)關(guān)系,模型簡潔,無需引入其他變量,克服了臺區(qū)負(fù)荷影響因素繁雜,差異性大的困難,在實際推廣應(yīng)用中有較大的優(yōu)勢。
本文主要做了以下工作(1)對原始數(shù)據(jù)甄別與修復(fù)(2)建立時間序列模型(3)使用模型進(jìn)行了實證分析,并做出了預(yù)測。
本文通過電力系統(tǒng)的采集終端獲得臺區(qū)配電負(fù)荷的日數(shù)據(jù),提取每日配電負(fù)荷數(shù)據(jù)的最大值,構(gòu)成負(fù)荷日峰值時間序列。在實際采樣過程中,由于外界環(huán)境變化、突發(fā)情況干擾和采集終端不穩(wěn)定,會導(dǎo)致時間序列中的部分?jǐn)?shù)據(jù)出現(xiàn)缺失或失真等異常。異常數(shù)據(jù)會直接影響模型穩(wěn)定性和預(yù)測精度,因此在建立模型之前,需要對失真的數(shù)據(jù)進(jìn)行甄別并剔除失真數(shù)據(jù)值,在此之后使用插值法對缺失數(shù)據(jù)進(jìn)行合理的修復(fù)。
設(shè)負(fù)荷日峰值數(shù)據(jù)的時間序列為:
Yt=(Y1,Y2,…,Yn)
(1)
(2)
(2)定義數(shù)據(jù)點偏離率ρi為t期數(shù)據(jù)偏離t期基準(zhǔn)數(shù)據(jù)絕對值的比率:
(3)
(3)失真數(shù)據(jù)的甄別與剔除。
根據(jù)經(jīng)驗數(shù)據(jù)取閥值e=0.5,當(dāng)ρt 使用線性插值法對缺失數(shù)據(jù)進(jìn)行修復(fù)。首先選取數(shù)據(jù)不為空的點作為樣本的起始點,解決起始點缺失數(shù)據(jù)從而導(dǎo)致無法修復(fù)的問題。對于位于時間序列中間的缺失數(shù)據(jù),根據(jù)缺失數(shù)據(jù)是否相鄰分為單一缺失與多個缺失兩種情況: (1)單一缺失:如第i點為缺失數(shù)據(jù)點,將其相鄰一期數(shù)據(jù)點值的平均值作為修復(fù)值: (4) (2)多個缺失:設(shè)相鄰缺失點數(shù)量為k個,起始點為i,則缺失時間序列如式(5)所示: Yi,Yi+1,…,Yi+k-1 (5) Yi+j(0≤j≤k-1)為其中任一缺失點,取 r=max(j,k-j) (6) 將缺失值修復(fù)為: (7) 臺區(qū)配電負(fù)荷日峰值屬于典型的時間序列數(shù)據(jù)。通過構(gòu)建時間序列模型能夠以量化的方式刻畫出負(fù)荷日峰值時間序列之間的相關(guān)關(guān)系、外部沖擊的傳播方式、時間序列均值等特征,并且能夠根據(jù)模型對下一期負(fù)荷日峰值數(shù)據(jù)作出預(yù)測。 為了量化負(fù)荷日峰值數(shù)據(jù)的時間序列特征,本文建立了時間序列模型,其一般表達(dá)式如式(8)所示。模型由自回歸與移動平均兩個部分構(gòu)成。在自回歸部分,本期的隨機變量將受到之前期數(shù)隨機變量的影響,體現(xiàn)出不同期數(shù)隨機變量之間的關(guān)聯(lián)性,是時間序列內(nèi)在規(guī)律性的體現(xiàn)。在移動平均部分,本期的誤差項將受到之前期數(shù)誤差項的影響,體現(xiàn)出偶然因素對隨機變量的影響以及該影響的持續(xù)性與衰減速度。 時間序列模型的一般表達(dá)式為: φp(B)(1-B)d(Yt-u)=φq(B)εt (8) 式中:B為向后位移算子,BYt=Yt-1;p為自回歸參數(shù)個數(shù);d為差分階數(shù);q為移動平均參數(shù)個數(shù);u為Yt的期望。 φp(B)=1-φ1B-,…,-φpBp φq(B)=1-φ1B-,…,-φqBq 使用最小二乘法對時間序列模型進(jìn)行參數(shù)估計。該方法通過使誤差平方和 (9) 達(dá)到最小,估計p個自回歸參數(shù)φ1,φ2,…,φp和q個移動平均參數(shù)φ1,φ2,…,φq。 與標(biāo)準(zhǔn)的時間序列模型——自回歸移動平均模型(ARMA)相比,通過時間序列模型的一般表達(dá)式來構(gòu)建模型的靈活性更高,模型的解釋能力更強。使用時間序列模型的一般表達(dá)式能夠準(zhǔn)確地刻畫負(fù)荷日峰值數(shù)據(jù)的周期性特征。傳統(tǒng)的自回歸移動平均模型在處理高階自回歸與移動平均時,模型的復(fù)雜度會大幅上升,這將大大增加模型的計算量并降低模型的可靠性,模型結(jié)果也難以解釋,而采用時間序列模型的一般表達(dá)式構(gòu)建模型能夠針對數(shù)據(jù)的周期性選擇合適的滯后階數(shù),以剔除無關(guān)變量,簡化模型,提高模型穩(wěn)定性與預(yù)測精度。 大量研究顯示,負(fù)荷日峰值數(shù)據(jù)存在明顯的周期性特征。故在構(gòu)建模型的自回歸部分時,可以根據(jù)對先驗知識與自相關(guān)分析的結(jié)果進(jìn)行綜合考量來確定納入模型的自回歸階數(shù),這有助于更完整地提取樣本特征并簡化模型,具體步驟如下: 針對日峰值數(shù)據(jù)Yt=(Y1,Y2,…,Yn)進(jìn)行自相關(guān)分析,得到自相關(guān)函數(shù)圖像,根據(jù)圖像確定自相關(guān)函數(shù)峰值間的階數(shù),設(shè)為a,表明Yt與Yt-a具有相關(guān)性,將Yt-a納入模型的自回歸部分。其后,考慮到典型的電力數(shù)據(jù)呈現(xiàn)出周、月、年3個不同時距的周期性特征,本文將向后位移算子為7、30、365的隨機變量納入模型的自回歸部分,最后建立了如式(10)所示的自回歸方程: φiBi)(Yt-u)=ωt (10) 在(10)式中,模型的移動平均部分由ωt表示,可以被理解為剔除周期性影響后的數(shù)據(jù)。為了確定移動平均部分的滯后階數(shù),本文通過自相關(guān)分析得到ωt的自相關(guān)函數(shù),并根據(jù)經(jīng)驗數(shù)據(jù)將相關(guān)系數(shù)的臨界值設(shè)定0.1,取顯著大于0.1的作為滯后階數(shù),設(shè)為b,并建立時間序列模型的移動平均部分,如式(11)所示: ωt=φb(B)εt (11) 該方程體現(xiàn)了日負(fù)荷峰值的漸變性特征。 綜上,將式(11)代入式(10)即能構(gòu)建時間序列模型的一般表達(dá)式: φiBi)(Yt-u)=φb(B)εt (12) 根據(jù)最小二乘法,使誤差 (13) 最小,得到參數(shù)φa,φ7,φ30,φ365,φ1,φ2,…,φb的估計值,建立時間序列預(yù)測模型。 選擇某省某臺區(qū)(額定容量為250 kVA)2010年9月29日至2012年7月31日的配電負(fù)荷作為實驗數(shù)據(jù),首先提取日負(fù)荷數(shù)據(jù)的峰值構(gòu)成時間序列,然后甄別失真的數(shù)據(jù)并剔除,再修復(fù)序列中的缺失值,最后對缺失值進(jìn)行修復(fù),修復(fù)后的負(fù)荷日峰值曲線如圖1所示。圖1清晰地展現(xiàn)出負(fù)荷日峰值時間序列存在明顯的周期性特征。 圖1 甄別修復(fù)后負(fù)荷日峰值曲線 對修復(fù)后負(fù)荷日峰值的數(shù)據(jù)進(jìn)行自相關(guān)分析可知:相鄰年的同一日及相鄰星期的同一日表現(xiàn)出顯著正相關(guān),相鄰月的同一日無明顯相關(guān)性。故本文將滯后階數(shù)為7與365的隨機變量納入模型的自相關(guān)部分。對剔除周期性因素影響的數(shù)據(jù)進(jìn)行自相關(guān)分析可知,當(dāng)滯后階數(shù)小于等于4時,其相關(guān)系數(shù)顯著大于0.1,故本文將漸變性因素確定為4階。結(jié)合隨機變量的自相關(guān)部分與移動平均部分即能得到最終的時間序列模型,如式(14)所示: (1-φ7B7-φ365B365)(Yt-u)=φ4(B)εt (14) 根據(jù)最小二乘法對模型進(jìn)行參數(shù)估計,得到參數(shù)的估計值為: φ7=0.574 8, φ365=0.408, φ1=1.576 4, φ2=1.614 6, φ3=1.140 1, φ4=0.735 5, u=81.132 35。 其中φ7=0.574 8、φ365=0.408分別表示臺區(qū)日負(fù)荷峰值會受到自身滯后7期與滯后365期的影響,方向為正,存在明顯的周期性特征。φ7>φ365表示當(dāng)期日負(fù)荷峰值受到相鄰星期同一日的影響大于相鄰年同一日的影響。φ1=1.576、φ2=1.614 6、φ3=1.140 1、φ4=0.735 5分別表示了滯后階數(shù)為1~4階的誤差項對當(dāng)期誤差項的影響,可見隨著滯后階數(shù)的增加,與當(dāng)期誤差項的相關(guān)關(guān)系大致呈現(xiàn)出衰減的趨勢。 根據(jù)預(yù)測結(jié)果,可以計算出反映模型預(yù)測準(zhǔn)確性的誤差率ηt: (15) 表1為誤差率的誤差率分布。 表1 誤差率分布 圖2 預(yù)測效果與原始數(shù)據(jù)對比 圖2可以看出預(yù)測曲線準(zhǔn)確地刻畫了原始曲線長期上升趨勢,在長期預(yù)測中體現(xiàn)出較好的穩(wěn)定性。整體上看,預(yù)測曲線貼近原始曲線,模型的擬合度較高。圖3為頻數(shù)直方圖,由表1和圖3可知87.6%的誤差率分布在0.2以下,僅有1.6%的誤差率落在0.4以上,模型預(yù)測精度高。圖4為誤差率散點圖,由樣本誤差率構(gòu)成的時間序列。在大部分時間內(nèi),樣本的誤差率小于0.2的臨界值,誤差率超過臨界值的樣本點呈現(xiàn)出聚集性特征,對照圖2可知,當(dāng)原始曲線出現(xiàn)連續(xù)地大幅度異常波動時,預(yù)測的準(zhǔn)確率將會下降。 圖3 誤差率頻數(shù)直方圖 圖4 誤差率散點圖 綜上所述,本文所建立的時間序列負(fù)荷預(yù)測模型的預(yù)測精度高,模型整體預(yù)測效果良好。 本文對臺區(qū)配電負(fù)荷的預(yù)測問題進(jìn)行了初步探索。針對臺區(qū)配電負(fù)荷自身特性,選擇時間序列方法建立模型對臺區(qū)負(fù)荷日峰值時間序列進(jìn)行預(yù)測,模型由自相關(guān)部分與移動平均部分構(gòu)成,通過綜合先驗知識和自相關(guān)的分析結(jié)果,設(shè)定了負(fù)荷峰值的滯后項來描述數(shù)據(jù)的周期性特征。實例結(jié)果顯示:臺區(qū)日負(fù)荷峰值存在明顯的周期性特征,周期長度分為7日的短周期與365日的長周期,這與實際的臺區(qū)用戶用電習(xí)慣和季節(jié)變化的周期性特征相符。僅使用配電負(fù)荷數(shù)據(jù)是該模型的一大優(yōu)點,配電負(fù)荷數(shù)據(jù)的可獲得性好,數(shù)據(jù)質(zhì)量高,大幅降低了實際推廣的難度,有利于進(jìn)一步推廣,提高了模型的可比性。1.2 數(shù)據(jù)修復(fù)
2 時間序列方法建立預(yù)測模型
2.1 周期性因素的確定
2.2 漸變性因素的確定
3 實驗分析
4 結(jié)論