陳浩敏 梁錦照 馬贅 李晉偉
摘要:針對現(xiàn)有大多數(shù)方法難以充分挖掘出電網(wǎng)數(shù)據(jù)潛在價(jià)值的問題,提出了一種云邊協(xié)同背景下基于隨機(jī)森林算法結(jié)合BP神經(jīng)網(wǎng)絡(luò)的電網(wǎng)數(shù)據(jù)資產(chǎn)綜合處理技術(shù)。該技術(shù)在靠近電網(wǎng)數(shù)據(jù)源一側(cè)部署邊緣計(jì)算節(jié)點(diǎn),以構(gòu)建云邊協(xié)同環(huán)境下的電網(wǎng)數(shù)字化資產(chǎn)管理系統(tǒng)。利用隨機(jī)森林算法設(shè)計(jì)分類器完成電網(wǎng)數(shù)據(jù)類型的劃分,并將各類型數(shù)據(jù)輸入至BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí),通過不斷地迭代優(yōu)化輸出相應(yīng)的綜合處理結(jié)果?;赑ython平臺(tái)進(jìn)行的實(shí)驗(yàn)分析結(jié)果表明,所提技術(shù)的分類準(zhǔn)確率均超過了90%,能夠有效提升電網(wǎng)數(shù)據(jù)資產(chǎn)的處理效率。
關(guān)鍵詞:云邊協(xié)同;隨機(jī)森林算法;BP神經(jīng)網(wǎng)絡(luò);電網(wǎng)數(shù)據(jù)資產(chǎn);電網(wǎng)數(shù)字化;分類器;數(shù)據(jù)處理;負(fù)荷預(yù)測
中圖分類號:TM743 文獻(xiàn)標(biāo)志碼:A 文章編號:1000-1646(2024)01-0054-06
隨著電力信息智能化調(diào)度和電網(wǎng)設(shè)備管理的精細(xì)化要求日益提高,國內(nèi)外對于電網(wǎng)實(shí)際資產(chǎn)規(guī)模管理、投資成本優(yōu)化等問題提出了更高的要求。對于包含電網(wǎng)輸出參數(shù)、用戶信息以及設(shè)施設(shè)備信息的電網(wǎng)數(shù)據(jù)資產(chǎn),由于其隨著電網(wǎng)運(yùn)行時(shí)間的增加和規(guī)模的擴(kuò)展而呈指數(shù)級增長,因此亟需進(jìn)一步優(yōu)化管理流程,以提高電網(wǎng)數(shù)據(jù)資產(chǎn)的管理水平。在大數(shù)據(jù)背景下,結(jié)合大數(shù)據(jù)信息處理方法對電網(wǎng)資產(chǎn)進(jìn)行合理評估與調(diào)度是當(dāng)前國內(nèi)外研究的重點(diǎn)。
電網(wǎng)資產(chǎn)信息的綜合處理包含對相關(guān)數(shù)據(jù)的評估、調(diào)度,其本質(zhì)是對基于大數(shù)據(jù)挖掘的電網(wǎng)資產(chǎn)信息時(shí)間序列分布進(jìn)行分析,并結(jié)合優(yōu)化調(diào)度及控制方法實(shí)現(xiàn)對電網(wǎng)資產(chǎn)信息的評估與處理。傳統(tǒng)分析方法大多基于大數(shù)據(jù)預(yù)測和調(diào)度方法,結(jié)合相關(guān)性與自適應(yīng)評估方法對電網(wǎng)資產(chǎn)信息進(jìn)行處理。張偉昌等提出了一種基于大數(shù)據(jù)挖掘的電網(wǎng)資產(chǎn)分析模型,該模型將模糊C均值聚類(fuzzy C-means,F(xiàn)CM)算法與關(guān)聯(lián)特征分解法相結(jié)合,進(jìn)而對數(shù)據(jù)信息進(jìn)行自適應(yīng)重組,同時(shí)采用Lyapunov指數(shù)法完成對電網(wǎng)數(shù)據(jù)信息的預(yù)測。CHEN等基于電網(wǎng)資產(chǎn)管理技術(shù)的研究現(xiàn)狀,分析了狀態(tài)評估、可靠性和風(fēng)險(xiǎn)評估關(guān)鍵技術(shù)的重要性,指出數(shù)字化及信息化是資產(chǎn)管理中的重要支撐與關(guān)鍵技術(shù)。陳俊剛通過分析小波變化與Perona-Malik方程間的關(guān)系得到梯度擴(kuò)散系數(shù),并利用該系數(shù)改進(jìn)電氣設(shè)備行波檢測模型,從而實(shí)現(xiàn)對故障的檢測及預(yù)警。但由于信息規(guī)模的不斷擴(kuò)大,傳統(tǒng)云計(jì)算的大數(shù)據(jù)處理方法在時(shí)效性和可靠性方面均暴露出了一定的問題。隨著SG網(wǎng)絡(luò)的發(fā)展,云邊協(xié)同方法的優(yōu)勢逐步凸顯。
針對傳統(tǒng)方法無法滿足電網(wǎng)數(shù)據(jù)資產(chǎn)信息處理體量大、可靠性及時(shí)效性要求較高的問題,在云邊協(xié)同技術(shù)背景下,本文提出了一種基于隨機(jī)森林(random forest,RF)算法結(jié)合BP(back propagation)神經(jīng)網(wǎng)絡(luò)的電網(wǎng)數(shù)據(jù)資產(chǎn)綜合處理方法。該方法兼顧了數(shù)據(jù)處理的可靠性與時(shí)效性,提高了數(shù)據(jù)處理效率。
1 電網(wǎng)數(shù)字化資產(chǎn)管理系統(tǒng)設(shè)計(jì)
由于傳統(tǒng)數(shù)據(jù)處理方式已無法滿足云計(jì)算中數(shù)據(jù)實(shí)時(shí)處理的需求,因此需要對數(shù)據(jù)進(jìn)行簡化,這就導(dǎo)致某些關(guān)乎用戶體驗(yàn)細(xì)粒度的數(shù)據(jù)被舍棄,從而無法深入挖掘電網(wǎng)數(shù)據(jù)的潛在價(jià)值。而邊緣計(jì)算技術(shù)的興起恰好解決了這一問題。不同于云計(jì)算的處理方式,邊緣計(jì)算將數(shù)據(jù)處理下放到網(wǎng)絡(luò)邊緣側(cè)的數(shù)據(jù)源附近,以實(shí)現(xiàn)數(shù)據(jù)及相關(guān)需求的就近處理與快速響應(yīng)。這種計(jì)算方式不僅提升了用戶側(cè)快速調(diào)度的響應(yīng)速度,減小了計(jì)算延時(shí),還有效緩解了云計(jì)算中心存儲(chǔ)和鏈路通信的壓力。因此,本文在云計(jì)算的基礎(chǔ)上,結(jié)合邊緣計(jì)算技術(shù)設(shè)計(jì)了電網(wǎng)數(shù)字化資產(chǎn)管理系統(tǒng),其整體架構(gòu)如圖1所示。
在該云邊協(xié)同架構(gòu)中,云中心和邊緣計(jì)算節(jié)點(diǎn)各有分工:復(fù)雜度較高的非實(shí)時(shí)性與非全局性數(shù)據(jù)業(yè)務(wù)由云計(jì)算中心完成;而邊緣計(jì)算節(jié)點(diǎn)主要完成小型實(shí)時(shí)本地?cái)?shù)據(jù)處理業(yè)務(wù)。由于本地處理數(shù)據(jù)對通信及內(nèi)存的要求較低,因此整體處理成本低,具有較高的經(jīng)濟(jì)性。用戶端則為數(shù)據(jù)源頭,可以提供精細(xì)化的多源信息,有助于支撐上層決策,并實(shí)現(xiàn)智能、便捷及個(gè)性的客戶服務(wù)。系統(tǒng)的主要組成部分如下:
1)終端。用戶端上傳智能電表、變電站運(yùn)行設(shè)備以及地理氣象等數(shù)據(jù)至附近的邊緣計(jì)算節(jié)點(diǎn)。
2)邊緣端。邊緣計(jì)算節(jié)點(diǎn)在數(shù)據(jù)庫存儲(chǔ)的歷史數(shù)據(jù)基礎(chǔ)上,結(jié)合處理后的實(shí)時(shí)數(shù)據(jù)作為分類器輸入,利用隨機(jī)森林算法對電網(wǎng)數(shù)據(jù)類型進(jìn)行分類,并將分類后的數(shù)據(jù)類型傳輸至云端。相較于傳統(tǒng)電網(wǎng)數(shù)據(jù)云端處理的統(tǒng)一管理,邊緣節(jié)點(diǎn)可看作云中心在各區(qū)域分派了多個(gè)“管理員”來承擔(dān)細(xì)粒度的區(qū)域管理任務(wù)。
3)云端。云中心利用BP神經(jīng)網(wǎng)絡(luò)對各區(qū)域的各種數(shù)據(jù)類型進(jìn)行深入分析,以完成相應(yīng)的處理任務(wù),如負(fù)荷預(yù)測、設(shè)備故障診斷等。同時(shí)云中心將分析得到的結(jié)果與管控措施發(fā)送至各邊緣節(jié)點(diǎn),從而實(shí)現(xiàn)全系統(tǒng)數(shù)據(jù)的高效處理。
2 數(shù)據(jù)資產(chǎn)綜合處理技術(shù)
對于單一的處理技術(shù)難以合理、高效地利用電網(wǎng)海量數(shù)據(jù)資產(chǎn)的問題,本文提出了融合處理技術(shù)。所設(shè)計(jì)的技術(shù)方案首先通過隨機(jī)森林算法處理邊緣節(jié)點(diǎn)所獲取的各類電網(wǎng)數(shù)據(jù),以區(qū)分其資產(chǎn)類型;然后再將各類型電網(wǎng)數(shù)據(jù)分別輸入至BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行迭代學(xué)習(xí),從而獲得相應(yīng)的處理結(jié)果,如負(fù)荷預(yù)測、故障診斷等。
2.1 數(shù)據(jù)預(yù)處理
電網(wǎng)數(shù)據(jù)的覆蓋面廣、類型龐雜,在取值范圍、數(shù)量級甚至數(shù)據(jù)源種類方面均存在著較大差異。若未對電網(wǎng)數(shù)據(jù)進(jìn)行預(yù)處理,可能會(huì)出現(xiàn)大量級數(shù)據(jù)覆蓋小量級數(shù)據(jù)信息的情況,從而導(dǎo)致網(wǎng)絡(luò)訓(xùn)練時(shí)間過長且分類結(jié)果不準(zhǔn)確。因此需要對電網(wǎng)數(shù)據(jù)進(jìn)行預(yù)處理,采用歸一化數(shù)據(jù)處理方式,其數(shù)學(xué)表達(dá)式為
綜上可知,BP神經(jīng)網(wǎng)絡(luò)在輸入數(shù)據(jù)方面無嚴(yán)格要求,且通過不斷地反向傳播,誤差將逐漸減小,并能處理輸入與輸出之間的非線性關(guān)系,從而實(shí)現(xiàn)應(yīng)用服務(wù)預(yù)期值。因此,可以利用BP神經(jīng)網(wǎng)絡(luò)對電網(wǎng)數(shù)據(jù)進(jìn)行綜合處理,以充分挖掘數(shù)據(jù)資產(chǎn)的價(jià)值。例如在進(jìn)行負(fù)荷預(yù)測時(shí),通過智能電表等終端來采集各類負(fù)荷數(shù)據(jù),并將其上傳至邊緣計(jì)算中心進(jìn)行分類;在云平臺(tái)處將分類結(jié)果、天氣和用電習(xí)慣等數(shù)據(jù)輸入BP神經(jīng)網(wǎng)絡(luò),再經(jīng)過學(xué)習(xí)分析,即可輸出下一時(shí)刻的負(fù)荷值;根據(jù)負(fù)荷的預(yù)測結(jié)果生成相應(yīng)的調(diào)度方案,從而保證電網(wǎng)的可靠運(yùn)行。
3 實(shí)驗(yàn)結(jié)果與分析
實(shí)驗(yàn)所使用的硬件設(shè)備為Intel⑩CoreTM i7-7500 CPU@2.7GHz,RAM32 GB的Windows 10操作系統(tǒng),利用PyTorch平臺(tái)中深度學(xué)習(xí)框架與Scikit-Learn模塊分別完成BP神經(jīng)網(wǎng)絡(luò)模型和隨機(jī)森林算法分類器的訓(xùn)練。BP神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置如表1所示。
實(shí)驗(yàn)采用System Reg交叉編譯工具以及Matlab仿真平臺(tái),設(shè)置電網(wǎng)數(shù)據(jù)資產(chǎn)信息的規(guī)模數(shù)為50000條,數(shù)據(jù)采樣頻率為1024kHz。
3.1 云邊協(xié)同的數(shù)據(jù)處理效率分析
本文設(shè)計(jì)的技術(shù)方案基于云邊協(xié)同的電網(wǎng)數(shù)據(jù)化資產(chǎn)管理系統(tǒng)而展開,在靠近數(shù)據(jù)源側(cè)部署邊緣計(jì)算節(jié)點(diǎn)能夠更快地響應(yīng)服務(wù)需求,提高數(shù)據(jù)處理效率。為了對此進(jìn)行驗(yàn)證,將數(shù)據(jù)集分別在云計(jì)算測試組、云邊協(xié)同計(jì)算測試組中運(yùn)行,所得計(jì)算時(shí)間如圖3所示。
從圖3中可以看出,當(dāng)數(shù)據(jù)規(guī)模小于25000條時(shí),云計(jì)算的耗時(shí)始終低于云邊協(xié)同。這是因?yàn)樵谠七厖f(xié)同的數(shù)據(jù)處理模式下,邊緣計(jì)算節(jié)點(diǎn)會(huì)對數(shù)據(jù)進(jìn)行預(yù)處理,然而其計(jì)算能力有限,因此比直接在云計(jì)算中心進(jìn)行處理的耗時(shí)要長。但隨著數(shù)據(jù)量的增加,云計(jì)算中心的處理能力逐漸趨于飽和,并出現(xiàn)網(wǎng)絡(luò)擁塞等情況,所以耗時(shí)呈直線快速上升的趨勢,且最終接近100s。在云邊協(xié)同模式下,由于數(shù)據(jù)經(jīng)過邊緣計(jì)算節(jié)點(diǎn)預(yù)處理,上傳至云中心的數(shù)據(jù)量大幅減少,因此當(dāng)數(shù)據(jù)規(guī)模為50000條時(shí),其耗時(shí)也僅為70s,明顯少于云計(jì)算的耗時(shí),由此證明了云邊協(xié)同管理模式的有效性。
3.2 電網(wǎng)數(shù)據(jù)資產(chǎn)分類結(jié)果
利用隨機(jī)森林算法劃分電網(wǎng)數(shù)據(jù)資產(chǎn)的類型,不同數(shù)據(jù)類型的分類準(zhǔn)確率如表2所示。其中,準(zhǔn)確率Pr、召回率Re及F1值的計(jì)算公式為
式中:TP表示算法輸出為正,實(shí)際也為正的樣本數(shù);FN表示算法輸出為負(fù),實(shí)際為正的樣本數(shù);FP表示算法輸出為正,但實(shí)際為負(fù)的樣本數(shù)。
從表2中可以看出,所提技術(shù)方案能夠準(zhǔn)確地劃分電網(wǎng)的數(shù)據(jù)類型,尤其是用戶信息具有顯著的數(shù)據(jù)特征,其準(zhǔn)確率可高達(dá)99.01%。而電網(wǎng)設(shè)備由于其設(shè)施眾多且規(guī)格繁雜,例如電流互感器與電壓互感器等易產(chǎn)生混淆。因此,其F1值僅為91.33%。但整體而言,所提技術(shù)能夠準(zhǔn)確識別電網(wǎng)數(shù)據(jù)類型,并為數(shù)據(jù)資產(chǎn)的合理利用奠定基礎(chǔ)。
3.3 不同技術(shù)的處理結(jié)果
運(yùn)用所提技術(shù)綜合處理電網(wǎng)數(shù)據(jù)資產(chǎn),可以發(fā)掘其潛在價(jià)值,進(jìn)而實(shí)現(xiàn)多種應(yīng)用需求,本文以負(fù)荷預(yù)測為例進(jìn)行實(shí)驗(yàn)論證。為了驗(yàn)證所提技術(shù)對電網(wǎng)負(fù)荷數(shù)據(jù)的處理性能,將其與文獻(xiàn)[6]方法進(jìn)行對比,結(jié)果如圖4所示。
由圖4可知,所提技術(shù)得到的負(fù)荷預(yù)測值和真實(shí)值較為接近,而文獻(xiàn)[6]方法的波動(dòng)明顯。例如當(dāng)時(shí)間為65s時(shí),負(fù)荷真實(shí)值約為120kW,而文獻(xiàn)[6]方法的預(yù)測值達(dá)到了140kW。這是由于所提技術(shù)結(jié)合了隨機(jī)森林分類器與BP神經(jīng)網(wǎng)絡(luò),能夠更好地處理繁雜的數(shù)據(jù),因此預(yù)測效果更優(yōu)。文獻(xiàn)[6]方法基于模糊C均值聚類法和關(guān)聯(lián)特征分解法來實(shí)現(xiàn)負(fù)荷預(yù)測,此種方法較為傳統(tǒng),在處理數(shù)字化電網(wǎng)時(shí)的難度偏大,因此對于天氣驟變等一系列突發(fā)狀況,其預(yù)測效果并不理想。
4 結(jié)束語
在電網(wǎng)智能化發(fā)展的趨勢下,科學(xué)、合理地發(fā)掘電網(wǎng)數(shù)據(jù)價(jià)值將在電網(wǎng)資產(chǎn)管理中發(fā)揮重要作用。本文提出了一種云邊協(xié)同背景下基于隨機(jī)森林算法結(jié)合BP神經(jīng)網(wǎng)絡(luò)的電網(wǎng)數(shù)據(jù)資產(chǎn)綜合處理技術(shù)。該技術(shù)在構(gòu)建云邊協(xié)同環(huán)境下電網(wǎng)數(shù)字化資產(chǎn)管理系統(tǒng)的基礎(chǔ)上,利用隨機(jī)森林算法分類器劃分電網(wǎng)的數(shù)據(jù)類型,并將其輸入至BP神經(jīng)網(wǎng)絡(luò)中進(jìn)行分析學(xué)習(xí),從而得到相應(yīng)的系統(tǒng)服務(wù)需求結(jié)果。基于Python平臺(tái)的實(shí)驗(yàn)結(jié)果表明,云邊協(xié)同的數(shù)據(jù)處理耗時(shí)明顯少于云計(jì)算,且所提技術(shù)的分類準(zhǔn)確率均超過了90%,同時(shí)負(fù)荷預(yù)測結(jié)果誤差較小,由此論證了該技術(shù)的有效性與可靠性。
所提技術(shù)方案雖然取得了顯著的成效,但其在實(shí)驗(yàn)中也存在一些不足。例如僅驗(yàn)證了負(fù)荷預(yù)測效果,而未對用戶用電行為、電網(wǎng)設(shè)備運(yùn)行情況等分析結(jié)果進(jìn)行討論。因此,將在后續(xù)的研究中對該技術(shù)進(jìn)行不斷地改進(jìn)及完善,以提高其普適性。
(責(zé)任編輯:鐘媛 英文審校:尹淑英)