蔡穎凱,張 冶,曹世龍,康乃荻,宋曉文
(國網(wǎng)遼寧省電力有限公司,沈陽 110000)
電力負(fù)荷預(yù)測的主要目的是對負(fù)荷的發(fā)展趨勢實(shí)行估計(jì),其需以電網(wǎng)系統(tǒng)自身的波動變化和負(fù)荷的影響因素為依據(jù)[1],并結(jié)合電力系統(tǒng)的歷史負(fù)荷數(shù)據(jù)、電網(wǎng)的運(yùn)行特性、負(fù)荷自身的變化規(guī)律以及自然條件等,構(gòu)建數(shù)學(xué)預(yù)測模型完成。電力負(fù)荷的預(yù)測通常包含長期、中期以及短期和超短期四種,其中,短期預(yù)測指的是日度預(yù)測[2],通常情況下,直接關(guān)聯(lián)電力系統(tǒng)的運(yùn)行狀態(tài)和調(diào)度規(guī)劃;其預(yù)測精度越高,則可提升電力系統(tǒng)設(shè)備的利用和調(diào)度性能。短期電力負(fù)荷的波動會受到多種因素的影響,兩者之間呈現(xiàn)非線性,同時具有顯著的復(fù)雜性和滯后性,其導(dǎo)致負(fù)荷的時間序列發(fā)生隨機(jī)性;對于負(fù)荷預(yù)測的結(jié)果存在極大影響;除此之外,海量、混雜、且沒有規(guī)則的數(shù)據(jù),也影響負(fù)荷預(yù)測的效率和實(shí)時性。決策樹也稱為判定樹,是常見的數(shù)據(jù)挖掘方法,能夠自動完成目標(biāo)分類和預(yù)測[3],該方法是通過構(gòu)建決策模型的方式完成[4],其在構(gòu)建過程中,僅需要訓(xùn)練數(shù)據(jù)即可;并且可靠完成混雜、無規(guī)則數(shù)據(jù)的分類。
趙洋等人基于時間卷積網(wǎng)絡(luò)為核心,提出相關(guān)預(yù)測方法[5];祝學(xué)昌的基于IFOA-GRNN研究相關(guān)的方法[6];但是上述方法在預(yù)測過程中,沒有對數(shù)據(jù)實(shí)行填補(bǔ)處理,因此,預(yù)測結(jié)果仍舊存在一定不精準(zhǔn)性。因此,本文針對短期電力負(fù)荷的特性實(shí)行深入分析后,以負(fù)荷大數(shù)據(jù)為依據(jù),采用改進(jìn)的決策樹方法完成短期電力負(fù)荷預(yù)測。
本文為實(shí)現(xiàn)短期電力負(fù)荷預(yù)測,以決策樹為基礎(chǔ),將梯度直升機(jī)與其結(jié)合實(shí)現(xiàn)優(yōu)化改進(jìn),形成梯度提升決策樹算法,用于完成短期電力負(fù)荷預(yù)測,基于改進(jìn)的基于改進(jìn)決策樹的短期電力負(fù)荷預(yù)測模型如圖1所示。
圖1 基于改進(jìn)決策樹的短期電力負(fù)荷預(yù)測模型
該模型整體分為兩個部分,分別為負(fù)荷大數(shù)據(jù)處理模塊、短期負(fù)荷預(yù)測模塊,前者是對電力負(fù)荷大數(shù)據(jù)實(shí)行預(yù)處理[7],包括數(shù)據(jù)聚類、選取、變換、填補(bǔ)等,完成負(fù)荷大數(shù)據(jù)的處理,獲取原始數(shù)據(jù)中的所需數(shù)據(jù)的選擇;文中選擇的為氣象和負(fù)荷兩種數(shù)據(jù),并通過其他處理完成數(shù)據(jù)維度的下降、數(shù)據(jù)類型轉(zhuǎn)換以及缺失數(shù)據(jù)填補(bǔ),為短期電力負(fù)荷預(yù)測提供更加有效、可靠、真實(shí)的數(shù)據(jù)。后者則是依據(jù)獲取的大數(shù)據(jù)[8],完成負(fù)荷預(yù)測,并實(shí)行負(fù)荷預(yù)測結(jié)果的修正。
1.2.1 短期電力負(fù)荷數(shù)據(jù)聚類
獲取原始數(shù)據(jù)中所需的氣象和負(fù)荷兩種數(shù)據(jù),是實(shí)現(xiàn)短期電力負(fù)荷預(yù)測的基礎(chǔ),其中氣象數(shù)據(jù)包括氣溫、相對濕度、云量、雨量水氣壓和陣風(fēng)的最大風(fēng)速[9],這些因素均是影響負(fù)荷變化的主要因素。因此,需先對上述所需的數(shù)據(jù)實(shí)行獲取,文中采用C均值模糊聚類算法完成所需數(shù)據(jù)的聚類。
設(shè)給定的原始數(shù)據(jù)集用X{x1,x2,…,xn}表示,對其實(shí)行聚類處理,獲取的類別數(shù)量用c表示,聚類中心用mj(j=1,2,…,c)表示。xk表示X中的任意樣本,以Xi為參照,第k個樣本對其的隸屬程度用μik=μXi(xk)表示,其也表示xk對應(yīng)的隸屬函數(shù)。聚類損失指標(biāo)函數(shù)計(jì)算公式為:
式(1)中:b表示平滑因子,μj(xi)表示第i個樣本的隸屬函數(shù)。
以mj、μj(xi)為參照,J對兩者的偏導(dǎo)均為0,依據(jù)式(2)、式(3)的約束條件,獲取J的最小值為:
式(2)、式(3)中:mj表示各個聚類中心,對其實(shí)行初始化處理后,按照上述兩個公式,實(shí)行循環(huán)處理后獲取聚類中心ms,滿足所需的精度標(biāo)準(zhǔn)后,確定聚類中心和隸屬函數(shù),完成所需數(shù)據(jù)聚類。
1.2.2 短期電力負(fù)荷預(yù)測所需數(shù)據(jù)填補(bǔ)
短期電力負(fù)荷預(yù)測原始數(shù)據(jù),由于存在偏差、統(tǒng)計(jì)不完整或者獲取方式等差異[10],會導(dǎo)致原始數(shù)據(jù)存在缺失等現(xiàn)象。因此,完成所需數(shù)據(jù)的聚類后,為保證聚類獲取數(shù)據(jù)的完整性,采用低秩矩陣填充理論和奇異值閾值算辦法完成。
構(gòu)建聚類獲取的存在缺失數(shù)據(jù)的矩陣,用M∈Rm×n表示,其中m×n表示階數(shù),因此,該矩陣也為不完整矩陣,確定矩陣中的缺失元素[11],并完成矩陣補(bǔ)全,即可恢復(fù)完整數(shù)據(jù)。
由于M∈Rm×n存在近似低秩特點(diǎn),因此采用低秩矩陣填充理論完整矩陣補(bǔ)全,基于該理論矩陣的補(bǔ)全公式為:
式(4)中:S表示完成數(shù)據(jù)填補(bǔ)之后的矩陣,rank(S)表示S的秩;Ω表示位置集合,屬于M∈Rm×n中被觀測獲取的元素,如果矩陣Mi,j不為空,則(i,j)∈Ω;核范數(shù)用‖S‖*表示,用于約束目標(biāo)矩陣的低秩特點(diǎn),且其可描述矩陣S中全部的奇異值總和,其式為:
式(5)中:σk表示奇異值。
在進(jìn)行海量大模數(shù)據(jù)填補(bǔ),則用需完成大規(guī)模矩陣的填充,為保證填充效果[12],采用奇異值算法完成矩陣M∈Rm×n求解。其詳細(xì)步驟如下:
設(shè)Dτ表示奇異值收縮算子,屬于S,其式為:
式(6)中:U、V均表示階酉矩陣;∑表示對角矩陣,為非負(fù)實(shí)數(shù);τ表示收縮步長,屬于奇異值收縮因子;T表示待填補(bǔ)數(shù)據(jù)解釋。
Dτ(∑)表示正數(shù),且為奇異值減去τ后得出,其式為:
式(7)中:{·}+=max(0,t),表示大于零的數(shù)。
通過上述步驟即可獲取新的矩陣,在此基礎(chǔ)上,獲取求解低秩矩陣補(bǔ)齊問題的迭代序列,其式為:
式(8)中:k和k-1表示迭代次數(shù),中間矩陣用Y表示,其估計(jì)值用Y k-1和Y k表示;權(quán)重系數(shù)用δk表示;PΩ表示數(shù)據(jù)集合,且該集合沒有數(shù)據(jù)缺失情況?;谏鲜鋈坎襟E,完成矩陣填補(bǔ),即完成短期電力負(fù)荷預(yù)測所需數(shù)據(jù)填補(bǔ),獲取填補(bǔ)后的數(shù)據(jù)T~。
完成數(shù)據(jù)填補(bǔ)處理后,即可獲取完整的負(fù)荷預(yù)測所需的大數(shù)據(jù),以該數(shù)據(jù)為依據(jù),完成短期電力負(fù)荷預(yù)測。本文為保證預(yù)測結(jié)果的可靠性[13],采用基于梯度提升決策樹模型完成短期電力負(fù)荷預(yù)測。該模型是的核心是生成數(shù)量為m弱回歸樹,且需位于損失函數(shù)負(fù)梯度的方向上;并且,為獲取強(qiáng)回歸樹[14],采用組合方式對m個弱回歸樹,實(shí)行處理完成,基于此,即可實(shí)現(xiàn)短期電力負(fù)荷預(yù)測模型構(gòu)建。
設(shè)模型中日屬性向量用A表示,模型的初始值為f0,以屬性向量為依據(jù),各個弱回歸樹的預(yù)測輸出值用fi(A)表示,其中i=1,2,…,m,所有的預(yù)測輸出值累加值為F(A),其計(jì)算公式為:
設(shè)M和L(y,g(a))分別表示迭代次數(shù)和損失函數(shù),則基于梯度提升決策樹模型的負(fù)荷預(yù)測詳情如下所示:
步驟1:模型初始化:獲取L(y,g(a))最小化常數(shù)值c,計(jì)算公式為:
文中采用平方誤差損失函數(shù)作為回歸樹的損失函數(shù),其計(jì)算公式為:
式(10)中:模型對于負(fù)荷的預(yù)測值用g(a)表示。
步驟2:模型迭代:確定搜索方向,其以負(fù)梯度方向?yàn)橹?在此基礎(chǔ)上,通過最速下降法,逐步完成迭代,接近目標(biāo)結(jié)果;計(jì)算L(y,g(a))的負(fù)梯度和梯度,其計(jì)算公式分別如式(11)、式(12)所示:
式(12)、式(13)中:?表示梯度參數(shù)。
構(gòu)建1棵弱回歸樹,以(Ai,rmi)為基礎(chǔ)完成,以此獲取數(shù)量為m棵的弱回歸樹葉節(jié)點(diǎn)區(qū)域用Rmj表示,j=1,2,…,Q,Q表示葉節(jié)點(diǎn)數(shù)量。
采用線性搜索方法獲取Rmj中的最小c值,其計(jì)算公式為:
更新回歸模型,并且為了避免更新過程中發(fā)生過擬合現(xiàn)象[15],引入學(xué)習(xí)速率v,0<v≤1,將其和模型的正則化結(jié)合,則更新公式為:
式(15)中:I()表示指示函數(shù);如果Ai位于Rmj范圍內(nèi),則I()取值為1,反之為0。
通過上述步驟循環(huán)后,即可獲取預(yù)測模型F(A)=fM(A),將日屬性向量X熱愛如模型中,即可獲取短期電力負(fù)荷預(yù)測結(jié)果。
由于短期電力負(fù)荷中存在一定的隨機(jī)分量,因此,為進(jìn)一步提升負(fù)荷預(yù)測精度,對預(yù)測結(jié)果實(shí)行修正,文中采用專家系統(tǒng)完成。利用專家經(jīng)驗(yàn)修正基于改進(jìn)決策樹的短期電力負(fù)荷預(yù)測結(jié)果,實(shí)現(xiàn)預(yù)測結(jié)果和實(shí)際結(jié)果最大程度吻合。
為測試本文方法對于短期電力負(fù)荷預(yù)測的應(yīng)用效果,將本文方法用于某地區(qū)的電力公司,獲取該地區(qū)2020年7月~12月的歷史負(fù)荷數(shù)據(jù)作為實(shí)驗(yàn)使用數(shù)據(jù),該數(shù)據(jù)的獲取間隔時間為60s;除此之外,獲取該地區(qū)在同一時間內(nèi)的氣象歷史數(shù)據(jù),該數(shù)據(jù)的獲取間隔時間為1h。文中對日負(fù)荷實(shí)行預(yù)測,將一天劃分成72個時間點(diǎn),對各個時間的負(fù)荷變化情況實(shí)行預(yù)測,獲取各個時間點(diǎn)的負(fù)荷預(yù)測結(jié)果。該公司目前面臨多個運(yùn)行情況下,風(fēng)險(xiǎn)值較高現(xiàn)象,期望能夠有效控制短期電力負(fù)荷,使整體運(yùn)行風(fēng)險(xiǎn)值均低于0.0005。
為測試本文方法對于短期電力負(fù)荷大數(shù)據(jù)聚類中的應(yīng)用效果,從相同類的相似度和不同類的差異度為基礎(chǔ),確定類內(nèi)和類間兩種相似度評價(jià)指標(biāo),結(jié)合兩個指標(biāo)得出綜合相似度評價(jià)指標(biāo),取值范圍在0~0.1之間,其值越小,表示聚類效果越佳,其計(jì)算公式為:
式(15)中:Iai、Irij分別表示第i個樣本數(shù)據(jù)的類內(nèi)相似度和類間相似度兩個指標(biāo);ni表示類內(nèi)的數(shù)據(jù)數(shù)量;x表示數(shù)據(jù)樣本;Xi和Xj類的聚類中心分別用ci和cj表示。
依據(jù)式(15)獲取本文方法的聚類結(jié)果,獲取本文方法在不同的分類數(shù)量下,對于氣象大數(shù)據(jù)和負(fù)荷歷史大數(shù)據(jù)的聚類結(jié)果,如圖2所示。
圖2 聚類效果測試結(jié)果
依據(jù)圖2測試結(jié)果得出:本文方法能夠良好地完成短期電力負(fù)荷大數(shù)據(jù)的聚類,氣象大數(shù)據(jù)在不同的聚類數(shù)量下,ψI的取值均在0.065以下,但是分類數(shù)量為8時,ψI的取值最小,為0.014左右;歷史負(fù)荷大數(shù)據(jù)在不同的聚類數(shù)量下,ψI的結(jié)果均在0.055以下,其分類數(shù)量為5時,ψI的取值最小,為0.011左右。因此,本文方法聚類效果良好,并且,所需的兩種數(shù)據(jù)分別在分類數(shù)量為5個5時,聚類效果最佳。
本文方法在進(jìn)行數(shù)據(jù)填補(bǔ)時,為避免模型更新時發(fā)生過擬合現(xiàn)象,引入學(xué)習(xí)速率完成模型更新,本文采用指示函數(shù)作為本文方法數(shù)據(jù)填補(bǔ)效果的衡量標(biāo)準(zhǔn),獲取該值結(jié)果以及變量矩陣的所在范圍,結(jié)果如圖3所示。
圖3 數(shù)據(jù)填補(bǔ)性能測試結(jié)果
依據(jù)圖3測試結(jié)果得出:本文方法在進(jìn)行數(shù)據(jù)填補(bǔ)過程中,指示函數(shù)結(jié)果為1,且變量矩陣的所在范圍均是弱回歸樹葉節(jié)點(diǎn)區(qū)域,因此,本文方法能夠保證模型的更新,保證良好的數(shù)據(jù)填補(bǔ)性能。
為測試本文方法是否預(yù)備預(yù)測能力,采用本文方法對休息日和工作日兩種場景下的負(fù)荷實(shí)行預(yù)測,并獲取預(yù)測結(jié)果,如圖4所示。
圖4 短期電力負(fù)荷預(yù)測可行性測試結(jié)果
依據(jù)圖4測試結(jié)果得出:采用本文方法對工作日和休息日中的72個時間點(diǎn)進(jìn)行負(fù)荷預(yù)測后,均可獲取負(fù)荷預(yù)測結(jié)果,并且,預(yù)測結(jié)果清晰呈現(xiàn)出兩種場景下,負(fù)荷的差異結(jié)果,兩者的負(fù)荷最大值分別為1920kW和886kW左右。因此,本文方法具備短期電力負(fù)荷預(yù)測能力,能夠完成不同場景下的短期電力負(fù)荷預(yù)測,并且呈現(xiàn)負(fù)荷的波動變化情況。
為衡量本文方法對于短期電力負(fù)荷的預(yù)測效果,獲取在晴天、持續(xù)降雨、寒潮以及高溫干燥4種氣象條件下,本文方法對于短期電力負(fù)荷的預(yù)測結(jié)果,由于篇幅有限,結(jié)果僅隨機(jī)呈現(xiàn)兩種氣象天氣的負(fù)荷預(yù)測結(jié)果,如圖5、圖6所示。
圖5 寒潮氣象條件下負(fù)荷預(yù)測結(jié)果
圖6 高溫干燥氣象條件下負(fù)荷預(yù)測結(jié)果
依據(jù)圖5、圖6測試結(jié)果得出:本文方法的短期電力負(fù)荷預(yù)測效果良好,能夠獲取不同氣象條件下負(fù)荷的變化結(jié)果,并且預(yù)測得出的負(fù)荷波動變化情況隨著時間的變化發(fā)生改變,因此,本文方法的短期電力負(fù)荷預(yù)測效果可靠、實(shí)時,為電力系統(tǒng)的運(yùn)行提供可靠依據(jù)。
短期電力負(fù)荷的可靠預(yù)測,對于電力系統(tǒng)的規(guī)劃和運(yùn)行狀態(tài)掌握具有重要意義,為分析本文方法的應(yīng)用性,測試在不同的陣風(fēng)最大風(fēng)速下,本文方法應(yīng)用后,電力系統(tǒng)在運(yùn)行管控中,切負(fù)荷、儲能調(diào)度、風(fēng)電分散接入三種運(yùn)行情況下,電網(wǎng)的風(fēng)險(xiǎn)值結(jié)果,如表1所示。
表1 電網(wǎng)運(yùn)行風(fēng)險(xiǎn)值結(jié)果
依據(jù)圖表1測試結(jié)果得出:本文方法應(yīng)用后,電網(wǎng)在三種運(yùn)行情況下,陣風(fēng)最大風(fēng)速的逐漸變化,電網(wǎng)的風(fēng)險(xiǎn)值結(jié)果也發(fā)生相應(yīng)的變化,但是所有風(fēng)險(xiǎn)值均低于0.00042。表示本文方法應(yīng)用后,能夠可靠預(yù)測短期電力負(fù)荷預(yù)測,并依據(jù)預(yù)測結(jié)果,對負(fù)荷實(shí)行有效處理,以此可保證電網(wǎng)在不同運(yùn)行狀態(tài)下的安全運(yùn)行。
電力系統(tǒng)的調(diào)度、規(guī)劃和運(yùn)營均需結(jié)合短期電力負(fù)荷預(yù)測結(jié)果完成,因此,負(fù)荷預(yù)測的可靠性、實(shí)時性尤為重要,其直接影響電力系統(tǒng)的安全運(yùn)行。因此,本文研究基于決策樹算法的短期電力負(fù)荷大數(shù)據(jù)預(yù)測模型。對該模型測試后得出:本文方法的大數(shù)據(jù)聚類效果良好,可有效完成數(shù)據(jù)填補(bǔ),并具有短期電力負(fù)荷預(yù)測能力,可靠獲取不同氣象條件下的負(fù)荷值,為電力系統(tǒng)的運(yùn)行提供可靠依據(jù)。