李德璐,趙金脈,李大華,田 禾
(1.天津理工大學(xué) 電氣工程與自動(dòng)化學(xué)院,天津 300384;2.中海油能源發(fā)展裝備技術(shù)有限公司 設(shè)計(jì)研發(fā)中心,天津 300384)
在電力系統(tǒng)中,發(fā)電、運(yùn)輸和配電須同步進(jìn)行。因此,發(fā)電量應(yīng)始終與實(shí)際電力負(fù)荷相一致,這不僅有利于電力系統(tǒng)穩(wěn)定,而且可以減少能源浪費(fèi)。為將更多的可再生資源整合到電力系統(tǒng)和智能電網(wǎng)的發(fā)展中,需要在短時(shí)間內(nèi)對(duì)電力采購(gòu)和傳輸進(jìn)行精確的調(diào)度。因此需要更為準(zhǔn)確地預(yù)測(cè)未來(lái)短期電力負(fù)荷。[1-4]作為未來(lái)的電力系統(tǒng),智能電網(wǎng)給出了一個(gè)可行的解決方案,即記錄實(shí)時(shí)電力數(shù)據(jù)并利用它們來(lái)預(yù)測(cè)未來(lái)的負(fù)荷值。然而,由于影響因素眾多,要進(jìn)行準(zhǔn)確的負(fù)荷預(yù)測(cè)是非常困難的。為了解決這個(gè)問(wèn)題,本文提出了一種有效的短期電力負(fù)荷預(yù)測(cè)方法。
短期負(fù)荷預(yù)測(cè)對(duì)電力系統(tǒng)的動(dòng)態(tài)平衡具有重要意義。預(yù)測(cè)方法主要分為兩類(lèi),即傳統(tǒng)方法和智能方法[5]。傳統(tǒng)方法包括回歸分析法、時(shí)間分析法和指數(shù)平滑法。回歸分析方法[6]根據(jù)歷史數(shù)據(jù)的變化規(guī)律和負(fù)荷變化的影響因素,尋求自變量和因變量之間的關(guān)系。由于易受到離群數(shù)據(jù)的干擾,導(dǎo)致預(yù)測(cè)精度低。時(shí)間分析方法[7]將負(fù)荷數(shù)據(jù)視為周期性變化的時(shí)間序列,并將實(shí)際負(fù)荷和估計(jì)負(fù)荷之間的差異作為平滑的隨機(jī)過(guò)程進(jìn)行分析。然而,這些方法很難完全消除環(huán)境因素的影響,因此,預(yù)測(cè)誤差隨著時(shí)間的推移而增加。指數(shù)平滑法[8]通過(guò)加權(quán)平均,反映了歷史數(shù)據(jù)對(duì)未來(lái)電力負(fù)荷的影響。平滑化效應(yīng)被用來(lái)消除預(yù)測(cè)過(guò)程中的隨機(jī)波動(dòng)。
隨著人工智能技術(shù)的進(jìn)步和發(fā)展,智能預(yù)測(cè)方法也應(yīng)運(yùn)而生。近年來(lái),采用專(zhuān)家系統(tǒng)、小波變換[9]、模糊集理論、人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANN)和支持向量機(jī)(support vector machines,SVM)[10]等智能方法的負(fù)荷預(yù)測(cè)方法比傳統(tǒng)方法更受關(guān)注。專(zhuān)家系統(tǒng)是一個(gè)基于知識(shí)和規(guī)則的計(jì)算機(jī)系統(tǒng),但沒(méi)有自主學(xué)習(xí)能力。小波變換是一種時(shí)-頻域分析方法。通過(guò)將負(fù)荷數(shù)據(jù)轉(zhuǎn)換為時(shí)域信號(hào),該方法可以獲得多個(gè)信號(hào),這些信號(hào)來(lái)自于不同頻段的負(fù)荷序列。但不能分析影響因素。模糊集理論[11]可以用來(lái)描述與負(fù)荷預(yù)測(cè)有關(guān)的模糊因素,如天氣和日期等,它能夠處理負(fù)荷變化的不確定性。SVM是建立在統(tǒng)計(jì)學(xué)習(xí)理論之上的,并利用了優(yōu)化理論的算法。SVM可以提高遺傳算法的收斂性,并以較高的速度獲得最優(yōu)解。但是,對(duì)于大樣本量和高維度的特征數(shù)據(jù),SVM的效果并不理想。盡管上述智能方法在負(fù)荷預(yù)測(cè)領(lǐng)域取得了一定的進(jìn)展,但仍然需要人為設(shè)定規(guī)則和特征,對(duì)最終的預(yù)測(cè)結(jié)果有直接影響。
隨著深度學(xué)習(xí)方法的發(fā)展,特別是用于圖像處理領(lǐng)域的卷積神經(jīng)網(wǎng)絡(luò)(CNN),屬于深度學(xué)習(xí)方法系列[12],它接受圖像形式的輸入。CNN已經(jīng)被稱(chēng)為非常強(qiáng)大的網(wǎng)絡(luò),用于處理和分類(lèi)不同領(lǐng)域的圖像,如人臉識(shí)別、高光譜圖像分類(lèi)、通過(guò)醫(yī)療圖像進(jìn)行診斷等。本文將序列預(yù)測(cè)問(wèn)題轉(zhuǎn)換為圖像處理任務(wù),通過(guò)CNN模型進(jìn)行電力負(fù)荷預(yù)測(cè),以提高預(yù)測(cè)精度。
在本文中提出的電力負(fù)荷預(yù)測(cè)方法,使用了CNN的本質(zhì)形式,即它不是單維結(jié)構(gòu)。為此,在CNN之前實(shí)施了序列到圖像(STI)的轉(zhuǎn)換,同時(shí)本文使用雙分支深度網(wǎng)絡(luò)模型,通過(guò)模型來(lái)計(jì)算負(fù)荷序列曲線的相似度,從而對(duì)輸入數(shù)據(jù)進(jìn)行精確聚類(lèi),以便于進(jìn)行負(fù)荷預(yù)測(cè)。并將其定義為STI-CNN模型,利用位于二維圖像中的滯后負(fù)荷變量的鄰近信息,提供卓越的預(yù)測(cè)結(jié)果。在真實(shí)用電數(shù)據(jù)上的實(shí)驗(yàn)表明,與其他單一預(yù)測(cè)模型及SVM方法相比,STI-CNN的性能更好。
由于負(fù)荷序列受各種外部因素影響,如濕度、溫度、風(fēng)速等,因此需要對(duì)輸入數(shù)據(jù)進(jìn)行精確聚類(lèi)。本文使用雙分支深度網(wǎng)絡(luò)模型,通過(guò)模型計(jì)算負(fù)荷序列曲線的相似度,從而對(duì)輸入數(shù)據(jù)進(jìn)行精確聚類(lèi),以便于進(jìn)行負(fù)荷預(yù)測(cè)。
為了計(jì)算負(fù)荷序列曲線的相似度,本文采用基于形狀比較的方法,通過(guò)對(duì)數(shù)據(jù)特征的分析(見(jiàn)圖1),并提出了一個(gè)雙分支深度網(wǎng)絡(luò)來(lái)判斷兩條曲線是否匹配。提出利用深度神經(jīng)網(wǎng)絡(luò)來(lái)提取特征向量,并最終計(jì)算出相似度。
圖1 數(shù)據(jù)特征分析圖
雙分支網(wǎng)絡(luò)的輸入必須是成對(duì)的訓(xùn)練數(shù)據(jù)。輸入圖像1和圖像2,分別由兩個(gè)分支處理以獲得它們的特征,這些特征將在全連接層中得到矢量化。特征提取過(guò)程相當(dāng)于一個(gè)映射函數(shù)f(θ),它將輸入的I1和I2映射到fθ(I1),fθ(I2)。然后采用損失函數(shù),即公式(1)和(2)來(lái)訓(xùn)練網(wǎng)絡(luò)。
式中:I1、I2為輸入圖片的信息數(shù)據(jù),f(θ)為卷積網(wǎng)絡(luò),d()為兩個(gè)向量的距離函數(shù),α和β為距離調(diào)整參數(shù),δ()檢查圖片是否屬于同一類(lèi)別:如果是,δ()等于1,否則等于-1。比較分析中的損失函數(shù)如公式(2)所示。
式中:an和bn是輸入圖片的向量,y表示這兩張圖片是否有明顯的差異。如果它們是相同的,y為1,否則為-1。
由于雙分支結(jié)構(gòu),輸入的必須是成對(duì)的圖像。而輸入的數(shù)據(jù)如果是同一類(lèi)型,將被標(biāo)記為1,否則為-1。此外,兩分支擁有相同的共享權(quán)重。從輸入數(shù)據(jù)I1和I2中提取的特征將被輸入到全連接層,其功能是將卷積層中獲得的特征映射到向量。因此,類(lèi)似的輸入數(shù)據(jù)將導(dǎo)致類(lèi)似的輸入向量,這代表一個(gè)訓(xùn)練有素的網(wǎng)絡(luò)可以將類(lèi)似的輸入數(shù)據(jù)映射到相鄰的向量。訓(xùn)練結(jié)束后,只需要一個(gè)分支就可以進(jìn)行聚類(lèi)。
聚類(lèi)效果可以用Davies-Bouidin指數(shù)(DBI)來(lái)評(píng)估,如公式(3)所示。DBI越小,代表聚類(lèi)性能好。
式中:C代 表 聚 類(lèi) 類(lèi) 別,u是 聚 類(lèi) 中 心。函 數(shù)dcen(ui,uj)表示兩個(gè)聚類(lèi)中心之間的距離,如公式(4)所示。
計(jì)算過(guò)程中,以下情況中位于邊緣的特征屬性被視為誤報(bào):自然物體(如森林等)、邊界長(zhǎng)度小于2像素的物體(如線條)、圓形物體以及由這些物體引起的陰影;噪音引起的干擾特征。當(dāng)邊界的長(zhǎng)度在3到4像素之間的部分,可忽略檢測(cè)。
聚類(lèi)中心可以通過(guò)公式(5)計(jì)算。
函數(shù)avg(Ci)表示聚類(lèi)Ci中樣本之間的平均距離,用公式(6)計(jì)算。
其中通過(guò)普通的聚類(lèi)方法,其DBI為16.21%。通過(guò)雙分支深度網(wǎng)絡(luò)使用CNN模型提取特征,DBI為14.68%,降低1.53%。此外,雙分支深度網(wǎng)絡(luò)可以識(shí)別并去除異常數(shù)據(jù),去噪后的DBI可以下降到8.57%,聚類(lèi)性能較好。
由于負(fù)荷值與過(guò)去負(fù)荷值相關(guān),所以滯后的負(fù)荷變量被認(rèn)為是每個(gè)時(shí)間實(shí)例中負(fù)荷的特征。考慮以下負(fù)荷值:與當(dāng)天最后2小時(shí)有關(guān)的負(fù)荷變量;前一天的同一小時(shí)和最后2小時(shí);前一周的同一小時(shí)和最后2小時(shí)。根據(jù)數(shù)據(jù)分配,負(fù)荷序列每個(gè)樣本都有一個(gè)特征向量,其中滯后負(fù)荷值被認(rèn)為與每個(gè)樣本有關(guān)。
所提基于CNN進(jìn)行電力負(fù)荷時(shí)間序列的預(yù)測(cè)。CNN的固有結(jié)構(gòu)是基于圖像(或矩陣形式)的輸入,因此,將一維的負(fù)荷序列轉(zhuǎn)換為二維的負(fù)荷矩陣輸入到CNN,以圖像形式向CNN饋送負(fù)荷,相對(duì)于序列形式來(lái)說(shuō)具有優(yōu)勢(shì)。
通過(guò)將負(fù)荷數(shù)據(jù)視為序列,將序列逐個(gè)樣本輸送至CNN,每個(gè)樣本都有一個(gè)特征向量。在這種情況下(沒(méi)有轉(zhuǎn)換為負(fù)荷圖像),CNN的訓(xùn)練時(shí)間將非常長(zhǎng),計(jì)算時(shí)間將大大減少。
通過(guò)將負(fù)荷值作為一個(gè)序列,每個(gè)負(fù)荷樣本只被兩個(gè)樣本包圍:前一個(gè)和后一個(gè)。相反,通過(guò)將負(fù)荷序列轉(zhuǎn)換為圖像,相鄰的負(fù)荷值將成為鄰居(每個(gè)負(fù)荷值將有8個(gè)鄰居),CNN可以從負(fù)荷數(shù)據(jù)中提取更多的特征,以提高預(yù)測(cè)精度。
圖2 CNN模型結(jié)構(gòu)圖
本文所提預(yù)測(cè)模型通過(guò)MATLAB R2021b進(jìn)行仿真實(shí)驗(yàn),并與其他方法進(jìn)行比較,實(shí)驗(yàn)使用了國(guó)內(nèi)某大城市的電力負(fù)荷用電數(shù)據(jù)集(從2015年1月到2017年6月),為了評(píng)估預(yù)測(cè)的性能,采用平均絕對(duì)誤差、平均絕對(duì)百分比誤差及均方誤差進(jìn)行準(zhǔn)確性評(píng)估。
平均絕對(duì)百分比誤差(MAPE)
平均絕對(duì)誤差(MAE)
均方誤差(MSE)
式中:ya和yf,分別為時(shí)間i的實(shí)際值和預(yù)測(cè)值;N為要預(yù)測(cè)的測(cè)試樣本數(shù)。數(shù)據(jù)集在送入預(yù)測(cè)模型之前進(jìn)行歸一化。歸一化不僅穩(wěn)定了網(wǎng)絡(luò)訓(xùn)練,而且加快了訓(xùn)練速度。
圖3顯示模型訓(xùn)練過(guò)程,包括RMSE和損失與迭代次數(shù)的關(guān)系。圖4顯示了使用SVM和STI-CNN預(yù)測(cè)的負(fù)荷,以及實(shí)際負(fù)荷,橫坐標(biāo)100個(gè)時(shí)間點(diǎn),時(shí)間間隔是30分鐘??v坐標(biāo)的單位k W是指電力負(fù)荷值單位(千瓦)。相應(yīng)的絕對(duì)誤差和相對(duì)誤差如圖5所示。
圖3 CNN的訓(xùn)練過(guò)程
圖4 使用SVM和STI-CNN的預(yù)測(cè)負(fù)荷 與實(shí)際負(fù)荷相比
圖5 SVM和STI-CNN的絕對(duì)誤差和相對(duì)誤差
根據(jù)實(shí)驗(yàn)結(jié)果得出,所提出的STI-CNN方法在所有的衡量標(biāo)準(zhǔn),即MAPE、MAE和MSE方面取得了比SVM更好的結(jié)果。同時(shí)STI-CNN方法可以獲得比SVM更準(zhǔn)確的負(fù)荷預(yù)測(cè)結(jié)果。在STI-CNN方法中,滯后的負(fù)荷值以矩陣形式存在,CNN可以從負(fù)荷圖像的二維網(wǎng)格中提取信息特征。相反,負(fù)荷樣本以序列的形式被送入網(wǎng)絡(luò),負(fù)荷曲線的每個(gè)點(diǎn)僅以?xún)蓚€(gè)負(fù)荷數(shù)據(jù)為界(前一時(shí)間點(diǎn)與后一時(shí)間點(diǎn))。如果CNN被應(yīng)用于負(fù)荷序列,沒(méi)有轉(zhuǎn)換為負(fù)荷圖像,則須應(yīng)用一維卷積。在這種情況下,相鄰的滯后載荷變量所包含的信息特征被遺漏,此外,CNN的運(yùn)行時(shí)間也大大增加。
提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的短期負(fù)荷預(yù)測(cè)方法。將負(fù)荷預(yù)測(cè)任務(wù)轉(zhuǎn)化為一個(gè)圖像處理問(wèn)題,由于CNN本質(zhì)上是一個(gè)適合圖像輸入的網(wǎng)絡(luò),因此以原始形式將其用于負(fù)荷序列不能進(jìn)行有效預(yù)測(cè)。為了解決這個(gè)問(wèn)題,提出一種STICNN的預(yù)測(cè)方法,首先將負(fù)荷序列轉(zhuǎn)換為若干負(fù)荷圖像數(shù)據(jù),然后將負(fù)荷圖像輸送至CNN網(wǎng)絡(luò),同時(shí)考慮到各種外部影響因素,如濕度、溫度、風(fēng)速等,使用雙分支深度網(wǎng)絡(luò)模型對(duì)輸入數(shù)據(jù)進(jìn)行精確聚類(lèi),最終使用STI-CNN方法用來(lái)進(jìn)行負(fù)荷預(yù)測(cè)。通過(guò)在某城市的電力負(fù)荷用電數(shù)據(jù)集上的實(shí)驗(yàn)表明,與其他簡(jiǎn)單的預(yù)測(cè)模型和SVM方法相比,STI-CNN在MAPE、MAE、MSE、絕對(duì)誤差和相對(duì)誤差方面具有更高的預(yù)測(cè)精度。