樓啟航 郭依婷 戴渝杰 馬宇凡
(廈門大學嘉庚學院,福建 漳州 363105)
科技的快速發(fā)展和新技術的出現(xiàn)使人們對電力有著持續(xù)性增長的需求,能源短缺問題也日益凸顯。中國電力企業(yè)聯(lián)合會于2021年底發(fā)布的《電力行業(yè)碳達峰碳中和發(fā)展路徑研究》顯示,電力行業(yè)正迎來重大機遇與挑戰(zhàn),對于電力數(shù)據(jù)的價值挖掘研究與應用已經(jīng)成為未來發(fā)展的必然趨勢,充分發(fā)揮電網(wǎng)基礎設施的作用,提高資源配置能力是應對該現(xiàn)狀的有效方式之一[1]。
當前,發(fā)電方式存在不穩(wěn)定性,用電高峰期無法保證有效持續(xù)供電。部分地區(qū)電網(wǎng)網(wǎng)架結(jié)構(gòu)薄弱、送電通道容量上限不高,供電量受限,未來一段時期我國部分地區(qū)電力供需緊張態(tài)勢仍將持續(xù)[2]。在高校中,供電需求量大,用電高峰期的電量峰值較其他區(qū)域高,供電壓力大,對電力資源進行合理配置顯得尤為重要[3]。本文通過采集學生用電數(shù)據(jù),對學生宿舍用電情況進行分析,建立模型對校園宿舍用電量進行學習和預測。預測未來幾天內(nèi)的用電需求,不僅能夠給學生作為參考,也可對電力供需提供預警功能,保障宿舍電力供需平衡,加強高校的節(jié)電管理,從源頭上減少能耗[4]。
時間序列預測是根據(jù)歷史時間序列數(shù)據(jù)建立模型的方法,被廣泛應用于經(jīng)濟學、管理學、氣象學等領域。對某一個或者一組變量x(t)進行觀察測量,將在一系列時刻t1,t2,…,tn所得的離散數(shù)字組成的序列集合,稱之為時間序列[5]。時間序列預測方法首先考慮的是事物的趨勢性,通過歷史數(shù)據(jù)來預測事物的發(fā)展趨勢;其次考慮的是事物的季節(jié)性,如氣候條件、節(jié)假日等各種周期性因素,根據(jù)事物發(fā)展的季節(jié)性變化預測事物的周期變化;最后考慮隨機因素的影響,不規(guī)則波動通常夾雜在時間序列之中,以致時間序列產(chǎn)生波浪式或振蕩式變動。基于電量序列的特性以及數(shù)據(jù)量,本文基于自回歸滑動平均模型(Auto-Regressive and Moving Average Model,ARMA)建立模型。ARMA模型是研究時間序列的常用方法,用于研究平穩(wěn)隨機過程有理譜,適用性很強。
神經(jīng)網(wǎng)絡作為機器學習方法之一,起源于人類對大腦的研究,是一種仿生的網(wǎng)絡結(jié)構(gòu)。通過大量簡單的生物神經(jīng)元之間的相互連接,來構(gòu)造復雜的網(wǎng)絡結(jié)構(gòu),以模擬生物神經(jīng)網(wǎng)絡的智能行為,從而克服傳統(tǒng)算法處理智能信息的困難?;陂L短期記憶人工神經(jīng)網(wǎng)絡(Long-Short Term Memory,LSTM)獨特的設計結(jié)構(gòu),LSTM作為一種特殊的遞歸神經(jīng)網(wǎng)絡,不僅可以利用時間序列對輸入進行分析,還不會像普通的遞歸神經(jīng)網(wǎng)絡忽略長時間前的有用信息,因此,本文根據(jù)電量序列的特性選擇基于LSTM建立模型。
本文以廈門大學漳州校區(qū)的學生作為調(diào)查對象,廈門大學漳州校區(qū)宿舍用電情況作為主要調(diào)查內(nèi)容,采用問卷調(diào)查法和實地觀察法兩種數(shù)據(jù)采集方法。
2.1.1 問卷調(diào)查法
本項目組前期通過查詢相關資料制訂了本次調(diào)查問卷,調(diào)查問卷設計分為三大部分:第一部分為被調(diào)查者基本情況,第二部分為被調(diào)查者對宿舍用電器的使用情況,第三部分為被調(diào)查者夏冬兩季用電量及電費支出情況,總計包含12個問題。在本次調(diào)查中,共發(fā)出問卷168份,收回問卷168份,有效問卷154份,有效回收率為91.7%。對調(diào)查問卷的數(shù)據(jù)進行分析,總結(jié)了影響本校大學生宿舍用電量情況的因素,并對校園節(jié)電管理及大學生節(jié)電意識培養(yǎng)提出了相關意見和建議。
2.1.2 實地觀察法
本文以廈門大學漳州校區(qū)為例,對校園內(nèi)各個園區(qū)共58幢宿舍樓采取隨機抽樣調(diào)查的方法,通過學校的電費網(wǎng)站采集了每個園區(qū)各一個宿舍從9月7日至12月7日的每日用電量。數(shù)據(jù)可視化如圖1所示。
為了探究用電情況是否受性別影響,抽樣統(tǒng)計不同宿舍樓同宿舍號的9、10、11和12月的用電量情況,結(jié)果如表1所示。
為了更直觀地進行對比,基于表1數(shù)據(jù)繪制圖2。
統(tǒng)計北區(qū)不同宿舍樓同宿舍號的9、10、11和12月的用電量,發(fā)現(xiàn)用電量情況是受性別影響的,從圖2中可以看出,女生宿舍在9月—11月的平均用電量都明顯高于男生宿舍。將該結(jié)論與168份調(diào)查問卷的結(jié)果對比來看,在耗電最多的電器中有14.29%的男生選擇了日常電器這一選項,而選擇這一選項的女生有29.39%。經(jīng)過實地走訪調(diào)查發(fā)現(xiàn),女生宿舍備有電器的數(shù)量比男生來得多,并且功率也相對更大,可以推斷出這是造成男女生宿舍用電量差異較為關鍵的部分。
ARMA的基本思想是把AR和MA模型結(jié)合起來,使得所用參數(shù)個數(shù)保持很少。模型形式為:
式中:{?i}為自回歸系數(shù);{θi}為移動平均系數(shù);{γt}為時間序列;{at}為白噪聲序列;p和q為非負整數(shù)[6]。
本文通過觀察PACF、ACF截尾以及AIC、BIC準則來分別判斷p和q的值,以進行模型定階。
從預測日期開始,利用ARMA模型對不同園區(qū)宿舍電量進行預測,預測值作為新的樣本加入預測模型,逐日增加樣本量,計算預測值y?與實際值y的累計差異率s,公式為:
通過觀察差異率變動趨勢,對預測數(shù)據(jù)進行有效修正,最終確定選擇ARMA(9,1)作為預測模型。
LSTM是一種特殊的RNN,可以學習到長期記憶信息,解決長時依賴問題,并且在反向傳播求導時梯度幾乎保持為常量,避免了梯度消失或爆炸,模型收斂速度更快。LSTM神經(jīng)網(wǎng)絡模型的循環(huán)單元內(nèi)部包括三個結(jié)構(gòu):遺忘門、輸入門和輸出門。遺忘門決定了上一時刻的工作狀態(tài)需要保留多少到當前時刻,可由tanh函數(shù)實現(xiàn);輸入門決定當前時刻網(wǎng)絡輸入哪些信息來更新長期記憶狀態(tài),該閥門篩選出有用信息喂入網(wǎng)絡,可由Sigmoid函數(shù)實現(xiàn);最后一個是輸出閥門,它置于網(wǎng)絡的輸出之后,用于控制單元狀態(tài),可以自動提取輸出信息中的重要部分,它也由Sigmoid函數(shù)實現(xiàn)。
LSTM網(wǎng)絡的基本單元如圖3所示,ft,it,ot分別為遺忘門、輸入門、輸出門;xt,gt,ht,Ct分別為t時刻的輸入、輸入節(jié)點、中間輸出和細胞單元的狀態(tài);σ、tanh分別為Sigmoid和tanh函數(shù)變化。
本文先將數(shù)據(jù)轉(zhuǎn)換為平穩(wěn)數(shù)據(jù),再將序列構(gòu)造為一個有監(jiān)督的學習問題,并把數(shù)據(jù)集以2∶1的比例分成訓練數(shù)據(jù)集和測試數(shù)據(jù)集。為了達到較好的訓練效果,本文將batch size設置為1 000輪,以進行模型訓練。
本文以YX園區(qū)宿舍的數(shù)據(jù)為例分別進行模型訓練,將實際值與兩種預測模型得到的預測值進行可視化,結(jié)果如圖4所示。由圖4可知兩種模型預測效果都較為不錯,走向與實際值大致相同。
為了更好地評價并對比模型效果,本文分別計算了LSTM的平均絕對值誤差MAE與平均絕對值百分比誤差MAPE,這兩個指標都經(jīng)常被用于時間序列分析中來評價衡量預測誤差和準確性。
MAE公式為:
MAPE公式為:
結(jié)果如表2所示。
表2 模型綜合評價表
從結(jié)果可以看出,LSTM模型的MAE與MAPE均小于ARMA模型,所以LSTM模型略優(yōu)于ARMA模型。
(1)本文通過不同的時間序列模型預測對照,得出LSTM模型的預測效果優(yōu)于ARMA模型,機器學習相較傳統(tǒng)的時間序列模型更加精準。
(2)本文通過對廈門大學漳州校區(qū)宿舍用電量進行調(diào)查,得出性別是影響宿舍用電量的重要因素之一,原因是女生總體使用電器更多。此外,電量可能也與氣溫有關。
(3)根據(jù)用電量情況的預測既可以合理規(guī)劃各地區(qū)配電網(wǎng),也能為宿舍用電預警提供實踐依據(jù),避免因忘繳電費引起停電,造成生活不便。
(4)時間序列模型還可用于動植物種群數(shù)量逐月或逐年的消長進程、某證券交易所每日收盤指數(shù)等等,還能夠用在國民經(jīng)濟宏觀操縱、區(qū)域綜合進展計劃、企業(yè)經(jīng)營治理、市場潛量預測、氣象預報、水文預報、地震預兆預報、農(nóng)作物病蟲災害預報、環(huán)境污染操縱、生態(tài)平穩(wěn)、天文學和海洋學等方面。
(5)神經(jīng)網(wǎng)絡模型預測具有一定的可行性及可靠性,電網(wǎng)公司可以根據(jù)研究資料與成果,基于事故在范圍、時間等方面的信息,快速預估停電造成的影響,還可以結(jié)合已經(jīng)掌握的信息快速制訂解決方案。