尹宇晨,劉宇杭,馬愿謙*,雷一
(1.浙江理工大學(xué) 信息科學(xué)與工程學(xué)院,杭州 310018; 2.清華四川能源互聯(lián)網(wǎng)研究院,成都 610200)
隨著全球經(jīng)濟(jì)的快速發(fā)展,人們對(duì)多元能源的需求持續(xù)增加,如冷熱負(fù)荷需求。因此各國(guó)電力消費(fèi)和需求呈現(xiàn)不同程度的快速增長(zhǎng)[1]。但由于電能的存儲(chǔ)特性,目前仍無(wú)法長(zhǎng)時(shí)間儲(chǔ)存電力資源,所以既要滿足生產(chǎn)生活所需的電能,又要避免產(chǎn)生不必要的浪費(fèi)。提高電力企業(yè)供電保持動(dòng)態(tài)平衡的能力,否則居民日常生活、工業(yè)生產(chǎn)將受到嚴(yán)重影響。所以綜合能源需求預(yù)測(cè)[2]在現(xiàn)代電力系統(tǒng)安全穩(wěn)定經(jīng)濟(jì)運(yùn)行中發(fā)揮愈來(lái)愈重要的作用。有效的綜合能源需求預(yù)測(cè)可為一個(gè)地區(qū)電力系統(tǒng)發(fā)展規(guī)劃做出指導(dǎo),實(shí)現(xiàn)綜合能源的高效生產(chǎn)及利用[3-4],同時(shí)保證電網(wǎng)的可靠運(yùn)行和安全穩(wěn)定。
伴隨著園區(qū)多種能源形式耦合互補(bǔ)方式的不斷成熟,關(guān)于綜合能源需求預(yù)測(cè)的研究逐漸得到關(guān)注。短期負(fù)荷預(yù)測(cè)中,受氣象變化、社會(huì)活動(dòng)和節(jié)日類型等各種隨機(jī)因素[5-6]的影響,在時(shí)間序列上,實(shí)際負(fù)荷的波動(dòng)表現(xiàn)出較強(qiáng)的隨機(jī)性,對(duì)預(yù)測(cè)精度的影響很大。
綜合能源需求預(yù)測(cè)主要包括冷熱電負(fù)荷預(yù)測(cè)。目前,電負(fù)荷預(yù)測(cè)的研究比較深入且已有大量的研究成果,主要集中于物理方法[7]及統(tǒng)計(jì)方法[8]。
物理方法根據(jù)用電負(fù)荷的區(qū)域范圍、實(shí)時(shí)運(yùn)行情況及四季變化等外界因素構(gòu)建預(yù)測(cè)模型,模型復(fù)雜程度較高,實(shí)現(xiàn)難度大。
統(tǒng)計(jì)方法通過(guò)深入挖掘輸入與輸出間的內(nèi)在聯(lián)系,利用關(guān)聯(lián)函數(shù)建立預(yù)測(cè)模型,對(duì)外界因素依賴程度明顯降低,模型數(shù)學(xué)化程度更高,易于實(shí)現(xiàn)。例如,通過(guò)構(gòu)建與時(shí)間相關(guān)的模型,即自回歸(AR)模型[9]、滑動(dòng)-平均模型(MA)、自回歸積分滑動(dòng)平均(ARIMA)模型[10]預(yù)測(cè)電負(fù)荷需求,上述模型對(duì)樣本數(shù)據(jù)的需求較少,要求數(shù)據(jù)序列平穩(wěn);利用最小二乘法構(gòu)建模型,搭配K-mean聚類算法改進(jìn)的蝙蝠算法去優(yōu)化最小二乘法支持向量機(jī),提高預(yù)測(cè)精度[11],以及一些現(xiàn)代預(yù)測(cè)方法,如反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)[12]、隨機(jī)森林算法[13]、基于專家預(yù)測(cè)和模糊貝葉斯[14-15]的預(yù)測(cè)方法等。其中,BP 神經(jīng)網(wǎng)絡(luò)通過(guò)將誤差從輸出層BP 到隱藏層和輸入層,根據(jù)誤差來(lái)更新網(wǎng)絡(luò)參數(shù),以逐步提高網(wǎng)絡(luò)的性能。在深度學(xué)習(xí)領(lǐng)域具有廣泛的應(yīng)用,能夠處理復(fù)雜的非線性關(guān)系,但容易陷入局部最優(yōu)解并且對(duì)初始參數(shù)較為敏感。又如隨機(jī)森林算法,雖然具有魯棒性、高準(zhǔn)確性、可解釋性和對(duì)高維數(shù)據(jù)的處理能力等優(yōu)點(diǎn),但隨機(jī)森林算法的缺點(diǎn)也包括訓(xùn)練時(shí)間較長(zhǎng)、占用較大的內(nèi)存空間和難以解釋單個(gè)決策樹(shù)的預(yù)測(cè)結(jié)果等。由于冷熱負(fù)荷受到季節(jié)變化和氣象變化的影響程度更大,與用戶用能數(shù)據(jù)更為密切相關(guān),以上的電負(fù)荷預(yù)測(cè)方法不能直接應(yīng)用于冷熱負(fù)荷預(yù)測(cè),因此,一般通過(guò)構(gòu)建時(shí)間序列模型或構(gòu)建回歸預(yù)測(cè)模型,采用自適應(yīng)卡爾曼濾波等方法實(shí)現(xiàn)預(yù)測(cè),缺少外界因素對(duì)負(fù)荷間影響的考慮[16-18]。
綜上所述,本文提出一種基于Transformer 算法的綜合能源需求預(yù)測(cè)方法,對(duì)冷熱電負(fù)荷進(jìn)行預(yù)測(cè)??紤]到冷熱負(fù)荷受諸多因素共同影響,采取Pearson 相關(guān)性分析、最小誤差理論篩選影響因素進(jìn)行篩選。其次,建立基于歐式距離的相似日選取方法作為相似度的度量標(biāo)準(zhǔn)。然后,將相似日負(fù)荷、歷史負(fù)荷、已篩選3 維影響因素相關(guān)數(shù)據(jù)作為輸入數(shù)據(jù),采用Transformer 模型進(jìn)行負(fù)荷預(yù)測(cè)。最后,以中國(guó)東部某園區(qū)為例進(jìn)行實(shí)證分析,驗(yàn)證了基于Transformer算法的園區(qū)綜合能源需求預(yù)測(cè)方法的正確性、合理性和可行性。
短期冷熱電負(fù)荷預(yù)測(cè)中,受氣象變化、社會(huì)活動(dòng)和節(jié)日類型等各種隨機(jī)因素的影響,在時(shí)間序列上實(shí)際負(fù)荷波動(dòng)的隨機(jī)性較強(qiáng)。適當(dāng)?shù)妮斎胱兞恐苯优c模型的預(yù)測(cè)性能相關(guān),影響因素的合理選取有利于提高預(yù)測(cè)模型的有效性和可靠性。
氣象因素對(duì)冷熱電負(fù)荷影響很大,為降低模型的復(fù)雜程度。本文擬選取溫度、濕度、風(fēng)速3個(gè)氣象因素,以及各氣象因素的最大值、平均值、最小值,共計(jì)9 維影響因素,作為預(yù)測(cè)模型的影響因素來(lái)考慮,表示為
式中:H為影響因素集合;hi為第i個(gè)影響因素向量;n為影響因素個(gè)數(shù),文中n= 9。影響因素選取如圖1所示。
圖1 影響因素的選取Fig.1 Selection of influencing factors
由于各種隨機(jī)因素的影響,使采集到的冷熱電負(fù)荷需求的影響因素?cái)?shù)據(jù)出現(xiàn)缺失或異常值(例如0 或空值)。若使用帶有缺失或異常值的數(shù)據(jù),將一定程度上使得預(yù)測(cè)結(jié)果出現(xiàn)誤差,準(zhǔn)確性較低。因此,進(jìn)行負(fù)荷預(yù)測(cè)前,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理和修正,采用平均插值法對(duì)缺失或異常數(shù)據(jù)進(jìn)行修復(fù)和補(bǔ)齊,平均插值法計(jì)算式為
式中:xi為經(jīng)過(guò)修復(fù)或補(bǔ)齊后的數(shù)據(jù);xi-1和xi+1為缺失或異常數(shù)據(jù)前后的數(shù)據(jù)。
對(duì)數(shù)據(jù)進(jìn)行規(guī)范化處理是負(fù)荷預(yù)測(cè)流程中的前提,考慮到不同影響因子的量綱不同。利用最值法對(duì)影響因素進(jìn)行歸一化處理,以除去量綱差異對(duì)預(yù)測(cè)結(jié)果所帶來(lái)的影響,歸一化計(jì)算方法為
基于上述的負(fù)荷影響因素的分析,短期冷熱電負(fù)荷預(yù)測(cè)中,易受氣象變化、社會(huì)活動(dòng)和節(jié)日類型等各種隨機(jī)影響因素的影響。為了簡(jiǎn)化建模難度和模型復(fù)雜程度,本文基于Pearson相關(guān)性分析[18]對(duì)初步選取的9 維影響因素進(jìn)行相關(guān)性篩選,利用誤差最小原則選擇冷熱電負(fù)荷對(duì)應(yīng)的3維影響因素用以相似日的選取。
基于Pearson 系數(shù)的冷熱電負(fù)荷影響因素的相關(guān)性,定義影響因素和負(fù)荷之間的Pearson 系數(shù),如式
式中:cov(Xi,Xj)為變量Xi,Xj的協(xié)方差;σXi,σXj分別為Xi,Xj的標(biāo)準(zhǔn)差;ρ(Xi,Xj)為2 個(gè)變量Xi,Xj之間的相關(guān)系數(shù),其取值范圍為[-1,1]。Pearson 相關(guān)系數(shù)ρ描述相關(guān)性強(qiáng)弱如下:
(1)當(dāng)Xi,Xj2個(gè)變量無(wú)關(guān)時(shí),ρ= 0。
(2)當(dāng)Xi,Xj2個(gè)變量正相關(guān)時(shí),0 <ρ≤1。
(3)當(dāng)Xi,Xj2個(gè)變量負(fù)相關(guān)時(shí),-1 <ρ≤0。
復(fù)雜的氣象狀況使得負(fù)荷預(yù)測(cè)的難度極大提升,因此合理地選取預(yù)測(cè)相似日是提高負(fù)荷預(yù)測(cè)模型預(yù)測(cè)效果的有效途徑。相似日的選取在負(fù)荷預(yù)測(cè)算法中起到了特征提取和負(fù)荷波動(dòng)分析的重要作用,能夠顯著提高負(fù)荷預(yù)測(cè)的準(zhǔn)確性和可靠性。
通過(guò)分析相似日的負(fù)荷模式和特征,可以幫助提取與負(fù)荷相關(guān)的特征。通過(guò)設(shè)定閾值并選取相似度最大的某日作為相似日,將相似日的負(fù)荷數(shù)據(jù)作為影響因素的相關(guān)輸入數(shù)據(jù),可以有效地提高負(fù)荷預(yù)測(cè)模型的準(zhǔn)確性和性能。
此外,選取相似日還可以用于負(fù)荷波動(dòng)的分析和預(yù)測(cè)。相似日的負(fù)荷數(shù)據(jù)提供了有用的參考,能夠幫助我們理解負(fù)荷的季節(jié)性、周期性以及特殊事件對(duì)負(fù)荷的影響,從而更好地進(jìn)行負(fù)荷預(yù)測(cè)。
歐氏距離是最常用的距離計(jì)算公式,衡量的是多維空間中各個(gè)點(diǎn)之間的絕對(duì)距離,當(dāng)數(shù)據(jù)很稠密且連續(xù)時(shí),這是一種很好的計(jì)算方式。
設(shè)待預(yù)測(cè)日的影響因素為W={W(k)|k=1,2,3,…,z},其他日期的影響因素為E={Ek(j)|j=1,2,3,…,m;k= 1,2,3,…,z}。
計(jì)算不同影響因素與對(duì)應(yīng)待預(yù)測(cè)日的氣象因素之間的歐氏距離為
式中:dk(z)為待預(yù)測(cè)日的第k個(gè)影響因素與日期z對(duì)應(yīng)的影響因素之間的歐氏距離。
同時(shí),考慮到不同的影響因素對(duì)冷熱電負(fù)荷影響程度不同,故結(jié)合Pearson相關(guān)系數(shù)綜合計(jì)算。將計(jì)算出的歐氏距離分別與得到的各影響因素的Pearson 相關(guān)系數(shù)對(duì)應(yīng)相乘,并將同一天的結(jié)果進(jìn)行累加,得到一個(gè)每天的綜合分?jǐn)?shù)
式中:rk為Pearson相關(guān)系數(shù)。
綜合分?jǐn)?shù)表示某日與待測(cè)日之間的相似程度。將綜合分?jǐn)?shù)從低到高排序,分?jǐn)?shù)越低的日期與待預(yù)測(cè)日的相似度高。本文選取待預(yù)測(cè)日之前5個(gè)分?jǐn)?shù)最低的日期作為相似日。
通過(guò)上述Pearson 相關(guān)性分析篩選的3 維影響因素及待預(yù)測(cè)日與各樣本日對(duì)應(yīng)影響因素的綜合相似度,設(shè)定閾值ε選取相似日,其中相似度最高的某日即為相似日。閾值設(shè)定方法為
綜合能源需求預(yù)測(cè)需對(duì)冷熱電負(fù)荷進(jìn)行并行預(yù)測(cè)。Transformer算法是一種基于全連接層和自注意力機(jī)制的結(jié)合體,是一種避免無(wú)意義循環(huán)的模型結(jié)構(gòu),完全依賴于其注意力機(jī)制對(duì)輸入輸出的全局依賴關(guān)系進(jìn)行建模。主要通過(guò)編碼器-解碼器的形式進(jìn)行時(shí)間序列預(yù)測(cè),并行性好,可有效得到最優(yōu)結(jié)果??紤]到Transformer 算法在時(shí)間序列預(yù)測(cè)中也有很好的結(jié)果。利用Transformer 進(jìn)行綜合能源需求的預(yù)測(cè)優(yōu)勢(shì)在于突破了RNN 等預(yù)測(cè)算法模型不能并行計(jì)算的限制[19]。相比其他算法,計(jì)算2 個(gè)位置之間的關(guān)聯(lián)所需的操作次數(shù)不隨距離增長(zhǎng)[20-24]。Transformer網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
自注意力機(jī)制是Transformer 算法的核心。自注意力可以產(chǎn)生更具可解釋性的模型??蓮哪P椭袡z查注意力分布。即給輸入的數(shù)據(jù)編入位置向量后通過(guò)3 個(gè)權(quán)值矩陣WQ,WK,WV轉(zhuǎn)換成自注意力機(jī)制所需要的Q,K,V向量,并計(jì)算自注意力機(jī)制值。
圖2 Transformer網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Transformer network structure
Transformer僅通過(guò)自注意力機(jī)制算法得到綜合能源的預(yù)測(cè)結(jié)果之一,同時(shí)Transformer 的多頭注意力機(jī)制可將算法重復(fù)多次,得到一個(gè)更均衡、更貼合目標(biāo)的結(jié)果。在訓(xùn)練預(yù)測(cè)過(guò)程中,Transformer 內(nèi)部可以通過(guò)對(duì)給出的數(shù)據(jù)進(jìn)行學(xué)習(xí)與訓(xùn)練,有效地提取數(shù)據(jù)內(nèi)在信息,并在進(jìn)行預(yù)測(cè)訓(xùn)練時(shí)對(duì)原有的數(shù)據(jù)進(jìn)行遮掩,以讓算法的預(yù)測(cè)更具有說(shuō)服力。通過(guò)Transformer 的注意力機(jī)制和編碼器-解碼器的形式,可以有效提升算法在長(zhǎng)時(shí)間序列預(yù)測(cè)的速度,同時(shí)避免陷入循環(huán),有利于快速準(zhǔn)確得到預(yù)測(cè)結(jié)果。
Transformer 算法是一種強(qiáng)大的序列建模方法,在自然語(yǔ)言處理領(lǐng)域取得了重大突破。此算法同樣適用于其他序列預(yù)測(cè)任務(wù),如能源需求預(yù)測(cè)。
本文中運(yùn)用Transformer 算法來(lái)捕捉能源需求與各種相關(guān)因素之間的復(fù)雜關(guān)系。具體而言,通過(guò)將歷史能源需求數(shù)據(jù)作為輸入序列,并結(jié)合其他相關(guān)數(shù)據(jù)以及時(shí)間信息(如季節(jié)性、節(jié)假日等)構(gòu)建一個(gè)綜合的輸入表示。
接下來(lái),將詳細(xì)描述Transformer 算法在能源需求預(yù)測(cè)中的應(yīng)用過(guò)程。使用Transformer 的編碼器-解碼器結(jié)構(gòu),其中編碼器將輸入序列映射到1 組高維向量表示,解碼器根據(jù)編碼器的輸出生成目標(biāo)序列的預(yù)測(cè)結(jié)果。采用自注意力機(jī)制,使模型能夠同時(shí)關(guān)注輸入序列中的不同位置,并捕捉序列中的長(zhǎng)期依賴關(guān)系。
為了將Transformer 算法與能源需求預(yù)測(cè)相結(jié)合,本文將預(yù)測(cè)任務(wù)定義為回歸問(wèn)題,并使用均方誤差(MSE)作為損失函數(shù),然后通過(guò)對(duì)模型進(jìn)行訓(xùn)練和優(yōu)化,調(diào)整模型參數(shù)以最小化預(yù)測(cè)結(jié)果與真實(shí)能源需求之間的差異。
Transformer 算法在能源預(yù)測(cè)中的具體作用如下。
(1)輸入表示:Transformer結(jié)構(gòu)的輸入由歷史能源需求數(shù)據(jù)及其他相關(guān)數(shù)據(jù)(如天氣數(shù)據(jù)、人口統(tǒng)計(jì)數(shù)據(jù)等)組成。這些數(shù)據(jù)構(gòu)成了模型的輸入序列,用于捕捉能源需求與各種相關(guān)因素之間的關(guān)系。
(2)編碼器:Transformer結(jié)構(gòu)中的編碼器負(fù)責(zé)將輸入序列映射到一組高維向量表示。編碼器通過(guò)自注意力機(jī)制,使模型能夠同時(shí)關(guān)注輸入序列中的不同位置,并捕捉序列中的長(zhǎng)期依賴關(guān)系。編碼器的輸出被傳遞給解碼器進(jìn)行下一步處理。
(3)解碼器:解碼器接收編碼器的輸出,并根據(jù)其生成能源需求的預(yù)測(cè)結(jié)果。解碼器通過(guò)自注意力機(jī)制和對(duì)編碼器輸出的注意力機(jī)制,對(duì)輸入序列進(jìn)行動(dòng)態(tài)加權(quán),并生成與預(yù)測(cè)相關(guān)的上下文表示。最終,解碼器利用這些上下文表示生成能源需求的預(yù)測(cè)結(jié)果。
(4)損失函數(shù)與優(yōu)化:能源需求預(yù)測(cè)模塊使用預(yù)測(cè)結(jié)果與真實(shí)能源需求之間的差異作為損失函數(shù)。常用的損失函數(shù)是MSE,用于衡量預(yù)測(cè)結(jié)果與真實(shí)值之間的平均平方誤差。通過(guò)BP 和優(yōu)化算法(如隨機(jī)梯度下降),模型調(diào)整參數(shù)以最小化損失函數(shù),從而提高預(yù)測(cè)準(zhǔn)確性。
Transformer 結(jié)構(gòu)通過(guò)編碼器和解碼器的組合,將輸入序列映射到能源需求的預(yù)測(cè)結(jié)果。編碼器捕捉輸入序列的特征表示,解碼器根據(jù)這些表示生成預(yù)測(cè)結(jié)果。能源需求預(yù)測(cè)模塊通過(guò)優(yōu)化過(guò)程,使預(yù)測(cè)結(jié)果盡可能接近真實(shí)值,從而實(shí)現(xiàn)對(duì)能源需求的準(zhǔn)確預(yù)測(cè)。
綜上所述,基于Transformer 算法的園區(qū)綜合能源需求預(yù)測(cè)步驟如下。
(1)將數(shù)據(jù)按照時(shí)間序列排序并導(dǎo)入編碼器中,并添加位置編碼。
(2)編碼器中的多頭注意力機(jī)制和全連接神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)進(jìn)行處理,通過(guò)自注意力機(jī)制算法得到編碼器輸出值。
(3)重復(fù)(2)操作n次(n為編碼器數(shù)量),將得到的數(shù)據(jù)導(dǎo)入解碼器。
(4)在解碼器中訓(xùn)練并預(yù)測(cè)結(jié)果,達(dá)到設(shè)定的終止條件,否則繼續(xù)訓(xùn)練預(yù)測(cè)。
(5)經(jīng)過(guò)一次線性變換,然后歸一化得到輸出的概率分布。
考慮到園區(qū)用戶內(nèi)不同時(shí)間對(duì)綜合能源的需求,選取考慮因素和相似日,利用Transformer,對(duì)綜合能源的需求進(jìn)行預(yù)測(cè),預(yù)測(cè)流程如圖3所示。
具體步驟如下。
(1)收集關(guān)于綜合能源負(fù)荷數(shù)據(jù)及影響因素歷史數(shù)據(jù)等,選取具有代表性的數(shù)據(jù),進(jìn)行歸一化、插值預(yù)處理。
圖3 基于Transformer的綜合能源預(yù)測(cè)方法流程Fig.3 Flowchart of an integrated energy forecasting method based on Transformer
(2)通過(guò)Pearson 相關(guān)性分析對(duì)初步選取的9 維影響因素進(jìn)行初步分析,同時(shí)利用誤差最小原則篩選出冷熱電負(fù)荷對(duì)應(yīng)的3維影響因素用以相似日的選取。
(3)相似度計(jì)算,利用歐式距離公式計(jì)算冷熱電負(fù)荷序列相似度,通過(guò)預(yù)先設(shè)定的閾值選取相似日。
(4)選取相似日負(fù)荷、歷史負(fù)荷、已篩選3 維影響因素相關(guān)數(shù)據(jù)作為輸入,輸入到Transformer 模型中,添加PE位置編碼,在編碼器中進(jìn)行編碼,并計(jì)算出K,Q,V的值,從而算出Z矩陣并拼接,繼續(xù)進(jìn)行下一層編碼。將最后的結(jié)果輸入解碼器。
1)輸入相似日負(fù)荷、歷史負(fù)荷、已篩選3維影響因素相關(guān)數(shù)據(jù)之間的相關(guān)性得分,計(jì)算相關(guān)性得分使用點(diǎn)積法,就是用Q中每一個(gè)向量與K中每一個(gè)向量計(jì)算點(diǎn)積。具體公式如下
2)對(duì)于輸入序列中各特征之間的相關(guān)性得分進(jìn)行歸一化,目的是訓(xùn)練時(shí)梯度能夠穩(wěn)定。具體公式如下
式中:dK是K的維度。
3)利用歸一化函數(shù),將每個(gè)輸入值之間的得分向量轉(zhuǎn)換成[0,1]之間的概率分布,同時(shí)更加凸顯各輸入值之間的關(guān)系。經(jīng)過(guò)歸一化后,得分轉(zhuǎn)換成1個(gè)值分布在[0,1]之間的矩陣,記作P。
4)根據(jù)冷熱電負(fù)荷輸入之間的概率分布,然后乘對(duì)應(yīng)的V值,P與V進(jìn)行點(diǎn)積。
整體計(jì)算公式為
(5)調(diào)整合適參數(shù),根據(jù)得到的數(shù)據(jù)對(duì)要求數(shù)據(jù)進(jìn)行訓(xùn)練預(yù)測(cè),并檢驗(yàn)預(yù)測(cè)結(jié)果。
(6)設(shè)定成功率閾值,當(dāng)達(dá)到閾值R或已經(jīng)達(dá)到訓(xùn)練最大次數(shù)時(shí)停止,輸出預(yù)測(cè)結(jié)果。
(7)對(duì)預(yù)測(cè)結(jié)果進(jìn)行誤差分析,選用平均絕對(duì)百分比誤差MAPE來(lái)評(píng)價(jià)
式中:xi為綜合能源需求的實(shí)際值;yi為綜合能源需求的預(yù)測(cè)值。
為驗(yàn)證所提預(yù)測(cè)方法的有效性以及預(yù)測(cè)精度等指標(biāo),本文采用我國(guó)東部某園區(qū)的冷熱電負(fù)荷及其相關(guān)影響因素進(jìn)行實(shí)例分析。該園區(qū)冷熱電負(fù)荷序列如圖4所示。
圖4 園區(qū)冷熱電負(fù)荷序列Fig.4 Heating, cooling and electricity load series
采用該園區(qū)12 月份的冷熱電負(fù)荷及其相關(guān)影響因素的數(shù)據(jù)作為初始樣本,樣本數(shù)據(jù)的間隔時(shí)間是1 h,每天24 組數(shù)據(jù),共計(jì)720 組數(shù)據(jù),選取前600組數(shù)據(jù)作為輸入訓(xùn)練數(shù)據(jù),后120 組數(shù)據(jù)作為測(cè)試數(shù)據(jù)驗(yàn)證算法的預(yù)測(cè)準(zhǔn)確度。
上文提到選取9 維冷熱電負(fù)荷影響因素采用Pearson相關(guān)性分析選取,如圖5所示。
圖5 電負(fù)荷Pearson相關(guān)性分析Fig.5 Pearson correlation analysis of electricity load
為避免誤差,由Pearson 相關(guān)性分析,選取相關(guān)性最大的3 個(gè)影響因素作為電負(fù)荷模型輸入。電、冷和熱負(fù)荷影響因素見(jiàn)表1。
表1 負(fù)荷影響因素Table 1 Selection of factors affecting electricity load
表1表明,電、冷、熱負(fù)荷的影響因素不盡相同,很有必要進(jìn)行因素的再次選取。
利用歐式距離公式計(jì)算冷熱電負(fù)荷序列相似度,通過(guò)預(yù)先設(shè)定的閾值選取相似日,設(shè)定閾值為ε= 10。
本文以2016 年12 月1 日至12 月30 日共計(jì)30 d數(shù)據(jù)為訓(xùn)練數(shù)據(jù),以12 月31 日為待預(yù)測(cè)日。由于Transformer 算法在預(yù)測(cè)時(shí)會(huì)對(duì)待預(yù)測(cè)數(shù)據(jù)進(jìn)行隱藏,不存在數(shù)據(jù)泄露的可能,可以認(rèn)為預(yù)測(cè)出的數(shù)據(jù)具有真實(shí)、可靠性。電、冷、熱負(fù)荷歐氏距離如圖6—8所示。
從圖6—8中可以得到,冷熱負(fù)荷數(shù)據(jù)達(dá)到指定閾值的比例遠(yuǎn)高于電負(fù)荷數(shù)據(jù)達(dá)到閾值的比例,即電負(fù)荷相比前兩者,更具有隨機(jī)性。
根據(jù)上述結(jié)果,將數(shù)據(jù)導(dǎo)入模型進(jìn)行預(yù)測(cè)分析,并獨(dú)立進(jìn)行10個(gè)試驗(yàn)以取結(jié)果的平均值。冷熱電負(fù)荷預(yù)測(cè)結(jié)果如圖9—11所示。
圖6 電負(fù)荷歐氏距離Fig.6 Electricity load Euclidean distance
圖7 冷負(fù)荷歐氏距離Fig.7 Cooling load Euclidean distance
圖8 熱負(fù)荷歐氏距離Fig.8 Heating load Euclidean distance
3 種負(fù)荷總體預(yù)測(cè)結(jié)果上來(lái)看,隨機(jī)森林算法、BP 算法和Transformer 算法預(yù)測(cè)結(jié)果和真實(shí)值進(jìn)行對(duì)比,顯然Transformer 顯示的數(shù)據(jù)總體上更接近真實(shí)值,相似性更強(qiáng)。
圖9 冷負(fù)荷預(yù)測(cè)結(jié)果Fig.9 Cooling load forecasting results
圖10 熱負(fù)荷預(yù)測(cè)結(jié)果Fig.10 Heating load forecasting results
圖11 電負(fù)荷預(yù)測(cè)結(jié)果Fig.11 Electricity load forecasting results
根據(jù)冷負(fù)荷預(yù)測(cè)結(jié)果顯示,冷負(fù)荷需求在一天24 h 內(nèi)整體呈現(xiàn)出波動(dòng)振蕩的趨勢(shì),峰谷現(xiàn)象較為明顯。預(yù)測(cè)結(jié)果的負(fù)荷曲線在很大程度上反映了這一趨勢(shì),并且在大部分時(shí)間段與實(shí)際負(fù)荷需求曲線相符合。這在一定程度上得益于之前提取的相似日數(shù)據(jù),這些數(shù)據(jù)有助于Transformer 算法進(jìn)一步準(zhǔn)確地進(jìn)行預(yù)測(cè)。從冷負(fù)荷的設(shè)備用能特性來(lái)看,其功率需求指的是設(shè)備在運(yùn)行過(guò)程中所需要的電功率。不同冷負(fù)荷設(shè)備在不同的運(yùn)行狀態(tài)下,其功率需求會(huì)有所變化。例如,空調(diào)系統(tǒng)在制冷啟動(dòng)階段通常需要較高的功率,而在保持溫度穩(wěn)定的運(yùn)行階段功率需求較低。因此,在冷負(fù)荷需求曲線上體現(xiàn)為峰谷振蕩的現(xiàn)象。當(dāng)設(shè)備啟動(dòng)運(yùn)行時(shí),冷負(fù)荷需求量較大,呈現(xiàn)為峰值;而在維持穩(wěn)定運(yùn)行時(shí),冷負(fù)荷需求量較低,呈現(xiàn)為谷值。
根據(jù)熱負(fù)荷預(yù)測(cè)結(jié)果顯示,熱負(fù)荷需求在一天的24 h 內(nèi)整體呈現(xiàn)出小范圍波動(dòng)振蕩的趨勢(shì),與冷負(fù)荷相比,峰谷值差異較大。通過(guò)與真實(shí)值的對(duì)比可以看出,由于選取了冬季負(fù)荷數(shù)據(jù),3 種預(yù)測(cè)方法的熱負(fù)荷曲線相對(duì)于冷負(fù)荷更加符合真實(shí)負(fù)荷曲線,而不僅僅是Transformer 算法單獨(dú)趨近于真實(shí)值。然而,就精確性而言,Transformer算法仍略勝于其他2 種方法。從熱負(fù)荷的設(shè)備用能特性來(lái)看,熱負(fù)荷的設(shè)備主要與供熱系統(tǒng)和熱能轉(zhuǎn)換設(shè)備相關(guān)。例如,供熱管道和散熱器的工作方式取決于具體的供熱系統(tǒng)設(shè)計(jì)和需求。選取冬季數(shù)據(jù)的原因是冬季負(fù)荷具有較高的整體需求量。不同的供熱系統(tǒng)可能采用間斷性工作或持續(xù)工作方式,以滿足不同的供熱需求。整體而言,熱負(fù)荷需求曲線的峰谷值差異相對(duì)于平均負(fù)荷水平的波動(dòng)量沒(méi)有冷負(fù)荷那么明顯。
而電負(fù)荷預(yù)測(cè)結(jié)果顯示,整體上負(fù)荷需求呈現(xiàn)出時(shí)段性變化。在00:00 — 07:00,負(fù)荷需求相對(duì)較低,隨后逐漸上升。通過(guò)與真實(shí)值的對(duì)比可以看出,相對(duì)于其他2 種算法,Transformer 算法在電負(fù)荷預(yù)測(cè)方面具有更高的準(zhǔn)確性,更接近真實(shí)值。從電負(fù)荷的設(shè)備用能特性來(lái)看,常用的用電設(shè)備種類繁多,涵蓋了不同領(lǐng)域和行業(yè)的需求,例如辦公設(shè)備、生產(chǎn)設(shè)備、照明設(shè)備等。在00:00 — 07:00時(shí)段,電負(fù)荷總體較為低迷,相較于白天活躍期明顯較少。此外,負(fù)荷變化的波動(dòng)也很大程度上與人們的社會(huì)生產(chǎn)和活動(dòng)密切相關(guān)。
最后,對(duì)預(yù)測(cè)結(jié)果進(jìn)行誤差分析,選取平均絕對(duì)誤差百分比MAPE進(jìn)行評(píng)估,結(jié)果見(jiàn)表4。在多個(gè)預(yù)測(cè)算法中,本文選取的Transformer 算法更符合,其起伏趨勢(shì)更接近實(shí)際數(shù)據(jù)。特別是在冷負(fù)荷預(yù)測(cè)中,Transformer 算法預(yù)測(cè)結(jié)果的平均絕對(duì)百分比誤差明顯優(yōu)于其他2種算法。鑒于本文選擇的是冬季負(fù)荷數(shù)據(jù),考慮到氣候因素的影響,整體而言,3種預(yù)測(cè)方法中冷負(fù)荷預(yù)測(cè)的誤差明顯更大,而熱負(fù)荷預(yù)測(cè)的誤差明顯較小。此外,與其他2 種預(yù)測(cè)方法相比,本文所采用的Transformer 算法在熱負(fù)荷預(yù)測(cè)曲線的穩(wěn)定性和擬合性方面稍顯優(yōu)勢(shì)。
由表4可以看出,在冷熱電負(fù)荷方面,該預(yù)測(cè)模型展現(xiàn)出良好的預(yù)測(cè)能力。相較于中長(zhǎng)期序列模型,該模型具有獨(dú)特的優(yōu)勢(shì),并且與待預(yù)測(cè)日的負(fù)荷具有極高的相關(guān)性,因此適合作為預(yù)測(cè)模型的輸入。然而需要指出的是,本文僅選擇了12月份的數(shù)據(jù)進(jìn)行預(yù)測(cè),這在一定程度上是基于冬季冷熱負(fù)荷的特殊性。
表4 綜合能量預(yù)測(cè)結(jié)果評(píng)估Table 4 Electricity load forecasting results %
針對(duì)目前綜合能源相關(guān)預(yù)測(cè)方向的不足,本文構(gòu)建出一種基于Transformer 的時(shí)間序列預(yù)測(cè)模型,通過(guò)模型構(gòu)建與預(yù)測(cè),與實(shí)例對(duì)比分析后得出以下結(jié)論。
(1)針對(duì)冷熱負(fù)荷受部分外界因素影響較大,對(duì)影響綜合能源的影響因素進(jìn)行分析,根據(jù)Pearson相關(guān)性分析進(jìn)一步確定影響因素。
(2)提出了基于Transformer 算法的時(shí)間序列預(yù)測(cè)模型,通過(guò)算法對(duì)綜合能源需求進(jìn)行預(yù)測(cè)并分析。
(3)采用在時(shí)間序列預(yù)測(cè)上有明顯優(yōu)勢(shì)的Transformer 算法,并采用相似度負(fù)荷特征作為輸入對(duì)預(yù)測(cè)模型進(jìn)行優(yōu)化,提高預(yù)測(cè)精度與可靠性。
結(jié)果達(dá)到預(yù)期,但不具有普適性,后續(xù)可對(duì)其余季節(jié)月份進(jìn)行預(yù)測(cè)訓(xùn)練,使模型更完善,結(jié)果更具有通用性。