周游 徐丹 趙燦 譚宇渲
文章編號:2096-1472(2022)-02-39-03
DOI:10.19644/j.cnki.issn2096-1472.2022.002.009
摘? 要:家庭用電是能源市場的一個重要組成部分,預(yù)測家庭用電需求能夠?qū)崿F(xiàn)智能供電,可以有效地提高供給率,但目前預(yù)測方法大多效果不佳。針對此,提出了一種基于LSTM的面向家庭智能用電預(yù)測算法,建立了端到端的智能家庭用電預(yù)測模型。其在Boruta特征篩選的基礎(chǔ)上設(shè)計了特征選擇方法,對多個特征進(jìn)行重要性計算,選取其中重要性高的部分進(jìn)行建模,然后利用LSTM網(wǎng)絡(luò)與全連接層對時間序列數(shù)據(jù)進(jìn)行訓(xùn)練,得到預(yù)測模型。實(shí)驗結(jié)果表明,所提方法的預(yù)測效果明顯優(yōu)于其他三種模型,能與真實(shí)數(shù)據(jù)較好地擬合。
關(guān)鍵詞:智慧能源;用電預(yù)測;特征選擇;時間序列;LSTM網(wǎng)絡(luò)
中圖分類號:TP399? ? ?文獻(xiàn)標(biāo)識碼:A
Research on Smart Power Consumption Prediction?Model of Smart Home based on LSTM
ZHOU You, XU Dan, ZHAO Can, TAN Yuxuan
(Suzhou Power Supply Branch, State Grid Jiangsu Electric Power Limited Company, Suzhou 215004, China)
542790714@qq.com; xudan19870725@126.com; 342677492@qq.com; 852901313@qq.com
Abstract: Household power consumption is an important part of the energy market. Predicting household power demand can effectively improve energy supply efficiency, but most of the current prediction methods are not effective. To address the problem, this paper proposes an LSTM (Long Short-term Memory)-based power consumption prediction algorithm for smart home, where an end-to-end smart home power prediction model is established based on LSTM. A feature selection method that utilizes Boruta feature screening is also designed. The importance of multiple features is calculated, the most important part of those features is selected for modeling, and then LSTM network and the full connection layer are used to train the time series data to obtain the prediction model. The experimental results show that the prediction effect of the proposed method is significantly better than the other three models, and it can fit the real data well.
Keywords: smart energy; power consumption prediction; feature selection; time series; LSTM network
1? ?引言(Introduction)
近年來,能源產(chǎn)業(yè)正迎來一個新的發(fā)展,智慧能源與能源互聯(lián)網(wǎng)等概念越來越得到重視。智慧能源就是結(jié)合信息技術(shù)、人工智能技術(shù)、大數(shù)據(jù)技術(shù)的新能源模型形態(tài),是能源互聯(lián)網(wǎng)的基礎(chǔ)架構(gòu)。作為能源市場的主要組成部分,家庭用電的穩(wěn)定關(guān)系著民生問題。對用電量進(jìn)行全面的理解有助于減少家庭的電費(fèi)支出,也有利于進(jìn)行能源合理分配。
物聯(lián)網(wǎng)與人工智能等技術(shù)的興起,以及家庭傳感器的廣泛采用,積累了大量的時間序列特征數(shù)據(jù),可以用來對家庭用電模式進(jìn)行分析。長短時記憶網(wǎng)絡(luò)(Long Short Term Memory, LSTM)在處理時間序列預(yù)測問題上有明顯的優(yōu)勢,可以獲得較佳的預(yù)測效果。
2? ?相關(guān)工作(Related work)
進(jìn)行家庭用電預(yù)測常用的預(yù)測方法主要包括隨機(jī)森林(Random Forest, RF)、極限樹(ExtraTrees, ET)、差分自回歸移動平均模型(Auto Regressive Integrated Moving Average Model, ARIMA)等。
2.1? ?常用預(yù)測方法
隨機(jī)森林算法先使用T 個弱分類器分別對T 個由隨機(jī)采樣而來的訓(xùn)練集進(jìn)行訓(xùn)練,然后對多個弱分類器進(jìn)行組合,最后由投票或取均值得出最終結(jié)果。大量實(shí)驗表明,隨機(jī)森林算法通過這種方式使得模型整體的泛化能力及準(zhǔn)確度明顯優(yōu)于其他Bagging算法。
極限樹算法也稱為極限森林,意為極其隨機(jī)的森林。在隨機(jī)森林算法中,為了對需要劃分的節(jié)點(diǎn)進(jìn)行選擇,需要在特征子集上隨機(jī)進(jìn)行尋找,以找出最優(yōu)劃分特征。極限樹算法直接使用隨機(jī)的特征和閾值來進(jìn)行劃分,這樣可以得到形狀更隨機(jī)、差異更大的決策樹,可見極限樹算法比隨機(jī)森林更激進(jìn)。
ARIMA是一種基于平穩(wěn)時間序列來進(jìn)行預(yù)測的算法,用于電力序列模型預(yù)測,可以使用三元組(p,d,q)來建模。在模型構(gòu)建過程中,主要根據(jù)PACF圖和ACF圖來分別確定p和q的取值,其中的d代表使序列數(shù)據(jù)成為平穩(wěn)時間序列所做的差分次數(shù)。
2.2? ?長短時記憶網(wǎng)絡(luò)
LSTM是一種特殊的循環(huán)神經(jīng)網(wǎng)(Recurrent Neural Network, RNN)結(jié)構(gòu),用來處理RNN面臨的一個無法解決的長期依賴問題。在標(biāo)準(zhǔn)RNN中,內(nèi)部是一種重復(fù)神經(jīng)網(wǎng)絡(luò)模塊的簡單鏈?zhǔn)浇Y(jié)構(gòu)。由于這種結(jié)構(gòu)過于簡單,因此在經(jīng)過t 個時刻之后會導(dǎo)致0時刻的信息幾乎被遺忘。
整體上看,LSTM與其結(jié)構(gòu)相同,但LSTM中重復(fù)的模塊結(jié)構(gòu)與RNN不同。對比可發(fā)現(xiàn),RNN中的神經(jīng)網(wǎng)絡(luò)層只有單一的一個,而LSTM中有四個,并且以一種非常特殊的方式進(jìn)行交互。通過這種復(fù)雜的結(jié)構(gòu),可以使以前時刻的重要信息得以保存,避免發(fā)生遺忘。
3? ?數(shù)據(jù)處理(Data processing)
3.1? ?數(shù)據(jù)描述
本文實(shí)驗采用美國某家庭從2016 年1 月11 日17 時到2016 年5 月27 日18 時之間,每隔10 分鐘所記錄下的共19,736 條數(shù)據(jù)作為訓(xùn)練樣本。每個樣本由時間(date)、氣溫(T)、濕度(RH)、天氣(weather)、光線(lights)、隨機(jī)變量(rv1、rv2)等共28 組特征數(shù)據(jù)所組成。其中,氣溫和濕度由該家庭所安裝的9 個溫度傳感器所獲取;天氣由室外溫度(T_out)、露點(diǎn)(Tdewpoint)、室外濕度(RH_out)、大氣壓(Press_mm_hg)、風(fēng)速(Windspeed)、可見度(Visibility)組成。本文希望通過這28 組數(shù)據(jù)組成的特征來實(shí)現(xiàn)對某家庭用電量的準(zhǔn)確預(yù)測。某家庭各時刻用電量詳情如圖1所示。
3.2? ?特征篩選
除日期和需要預(yù)測的用電量之外,采集到的數(shù)據(jù)共包括27 個特征數(shù)據(jù)。對于實(shí)際的模型構(gòu)建來說,數(shù)據(jù)集中的變量太多,而大多數(shù)變量與目標(biāo)問題無關(guān)。當(dāng)數(shù)據(jù)集的特征過多時會有缺點(diǎn):首先,特征過多會占用過多資源,導(dǎo)致算法速度慢,使用起來很不方便;其次,當(dāng)變量的數(shù)量顯著高于最優(yōu)時,會導(dǎo)致很多機(jī)器學(xué)習(xí)算法的準(zhǔn)確率下降,降低模型的性能。
針對上述問題,本文采用Boruta算法來對特征進(jìn)行篩選,通過對各個無偏的弱分類器—決策樹的投票來進(jìn)行分類,對各個特征的重要性給出數(shù)值估計,并使用Z-Score來計算特征重要度,從而選擇出對因變量影響較為重要的特征。
式中,avg_loss為平均損失,為標(biāo)準(zhǔn)差。
經(jīng)過100 輪迭代,Boruta特征篩選模型成功地從28 個特征中篩選出21 個重要特征,分別為T1、T2、T3、T4、T5、T7、T8、RH_1、RH_2、RH_3、RH_4、RH_5、RH_6、RH_7、RH_8、RH_9、T_out、Tdewpoint、RH_out、Press_mm_hg、Windspeed。所選取的21 個特征重要度排名如圖2所示。
4? ?預(yù)測算法(Prediction algorithm)
4.1? ?處理流程
為了建立面向智能家庭用電預(yù)測模型,在篩選完特征后,還需將樣本數(shù)據(jù)序列化,以滿足LSTM模型的訓(xùn)練要求。預(yù)測模型建立的主要步驟包括采集數(shù)據(jù)、選取特征、特征篩選、樣本數(shù)據(jù)序列化、特征數(shù)據(jù)歸一化、LSTM數(shù)據(jù)輸入、模型參數(shù)調(diào)優(yōu)、用電預(yù)測建模、訓(xùn)練并保存模型等,具體流程如圖3所示。
4.2? ?算法
基于LSTM的面向家庭智能用電預(yù)測算法如下。
算法1 基于LSTM的面向家庭智能用電預(yù)測算法
輸入:數(shù)據(jù)集I,特征矩陣X
輸出:預(yù)測模型
1: Boruta_selector(X):
2: Repeat:
3:? ?shadow_features=shuffle(X)
4: new_features=shadow_features+real_features
5: Z_Score_real=score(real_features)
6:? ?Z_Score_shadow=score(shadow_features)
7:? ?Zmax=max( Z_Score_shadow)
8:? ?if Z_Score_real > Zmax then
選擇該特征
9: series_to_supervised()
10: StandardScaler()
11: for k=1 to 70 do
12:? ?訓(xùn)練得到LSTM模型
13: Return 預(yù)測模型
5? ?實(shí)驗及分析(Experiment and analysis)
5.1? ?模型訓(xùn)練
訓(xùn)練前,將樣本數(shù)據(jù)集按7∶3的比例劃分為訓(xùn)練集和測試集。模型訓(xùn)練過程中訓(xùn)練集損失值和測試集損失值的變化過程如圖4所示。從圖4可以看出在訓(xùn)練過程中,訓(xùn)練集損失值和測試集損失值不斷下降,最終收斂于一個較低值,表明本文實(shí)驗?zāi)P陀?xùn)練效果良好。
5.2? ?模型訓(xùn)練結(jié)果分析
訓(xùn)練結(jié)束后,在樣本數(shù)據(jù)集中進(jìn)行隨機(jī)采樣,獲取6,000 個樣本數(shù)據(jù)。將隨機(jī)選取的數(shù)據(jù)傳入最終預(yù)測模型,觀察其預(yù)測結(jié)果的準(zhǔn)確度。本文所提出模型的預(yù)測結(jié)果與實(shí)際數(shù)據(jù)擬合情況如圖5所示。從圖5可發(fā)現(xiàn),本文所提出的預(yù)測模型可對真實(shí)值進(jìn)行較好地擬合。
5.3? ?對比試驗分析
為進(jìn)一步對本文所提出的預(yù)測模型進(jìn)行評估,另外選取了當(dāng)前常用的隨機(jī)森林算法、極限樹算法、ARIMA算法對同一樣本數(shù)據(jù)進(jìn)行實(shí)驗,并以R2_SCORE(R方值:取值范圍為[0,1],越接近1表示預(yù)測效果越好)和RMSE(均方根誤差)的值(越小表示效果越好)作為算法的評估指標(biāo)。四種方法的評估結(jié)果如表1所示。
通過對實(shí)驗數(shù)據(jù)對比發(fā)現(xiàn),本文所提出的基于LSTM預(yù)測模型與隨機(jī)森林、極限樹、ARIMA算法預(yù)測結(jié)果相比,R2_Score最大并且RMSE值最小,表明該模型在面對本文所提供的數(shù)據(jù)進(jìn)行預(yù)測時效果明顯優(yōu)于其他三種模型,可對真實(shí)數(shù)據(jù)進(jìn)行較好的擬合,預(yù)測結(jié)果與真實(shí)值非常接近。
6? ?結(jié)論(Conclusion)
本文主要研究了單一家庭的用電模式與數(shù)據(jù),并提出了一種基于LSTM的面向家庭智能用電預(yù)測算法。該算法希望通過由家庭傳感器所采集的溫度、濕度、天氣、光線等數(shù)據(jù)來對該時刻家庭所需消耗的電量進(jìn)行預(yù)測,并通過與其他三種常用的預(yù)測方法進(jìn)行對比,展現(xiàn)出本文所提出算法的預(yù)測性能。本文所提出的算法可以與能源管理系統(tǒng)相結(jié)合,通過大數(shù)據(jù)來對每一時刻家庭所需電量進(jìn)行預(yù)測,不僅可以降低各家庭電力成本,還有利于能源的合理分配,避免因能源分配不均而可能出現(xiàn)的問題。
參考文獻(xiàn)(References)
[1] 曲朝陽,張率,劉洪濤.基于用電影響因素回歸的小區(qū)用電預(yù)測模型[J].東北電力大學(xué)學(xué)報,2015,35(1):73-77.
[2] 王永偉,李新龍,田斐,等.基于人群搜索算法的電網(wǎng)短期用電負(fù)荷預(yù)測研究[J].電網(wǎng)與清潔能源,2020,36(12):35-40.
[3] 谷云東,馬冬芬,程紅超.基于相似數(shù)據(jù)選取和改進(jìn)梯度提升決策樹的電力負(fù)荷預(yù)測[J].電力系統(tǒng)及其自動化學(xué)報,2019,31(5):64-69.
[4] 范繼鋒,王瀚霆,薄宏斌,等.大數(shù)據(jù)技術(shù)在電力行業(yè)中的應(yīng)用研究[J].電力設(shè)備管理,2020(12):55-59.
[5] 唐靜,李瑞軒,黃宇航,等.基于多維特征分析的月用電量精準(zhǔn)預(yù)測研究[J].電力系統(tǒng)保護(hù)與控制,2017,45(16):145-150.
[6] 鄧婷,范潤宇.遠(yuǎn)程電力抄表系統(tǒng)的網(wǎng)關(guān)通信設(shè)計與實(shí)現(xiàn)[J].軟件工程,2020,23(3):60-62.
[7] 朱家貽,劉思蕊,潘楠,等.一種基于LSTM神經(jīng)網(wǎng)絡(luò)的短期用電負(fù)荷預(yù)測方法[J].中國新通信,2021,23(1):167-168.
[8] 李婉華,陳宏,郭昆,等.基于隨機(jī)森林算法的用電負(fù)荷預(yù)測研究[J].計算機(jī)工程與應(yīng)用,2016,52(23):236-243.
[9] 杜曉明,湯立,蔡李花,等.基于極限學(xué)習(xí)機(jī)與旋轉(zhuǎn)森林相結(jié)合的棧式深度學(xué)習(xí)分類方法[J].江蘇科技大學(xué)學(xué)報(自然科學(xué)版),2019,33(6):82-87.
[10] 王斌.基于時間序列ARIMA模型的電力負(fù)荷短期預(yù)測分析[J].石河子科技,2019(3):43-47.
[11] 郭冰楠,吳廣潮.改進(jìn)的隨機(jī)平衡采樣Bagging算法的網(wǎng)絡(luò)貸款研究[J].計算機(jī)與現(xiàn)代化,2019,284(04):15-20.
[12] 楊永嬌,肖建毅,趙創(chuàng)業(yè),等.基于Isolation Forest和Random Forest相結(jié)合的智能電網(wǎng)時間序列數(shù)據(jù)異常檢測算法[J].計算機(jī)與現(xiàn)代化,2020,295(03):103-106,130.
[13] 豐瑞,羅思煩,李前洋.基于特征選擇的極限隨機(jī)森林算法研究[J].計算機(jī)應(yīng)用研究,2020,37(9):2625-2628,2633.
[14] SZUL T, TABOR S, PANCERZ K. Application of the BORUTA algorithm to input data selection for a model based on rough set theory (RST) to prediction energy consumption for building heating[J]. Energies, 2021,14(10):1-13.
[15] 陸冰鑒,周鵬,王興,等.基于EEMD和LSTM的短期風(fēng)速預(yù)測模型研究[J].軟件工程,2020,23(3):43-48.
作者簡介:
周? 游(1987-),男,本科,高級工程師.研究領(lǐng)域:軟件開發(fā),能源互聯(lián)網(wǎng),工業(yè)互聯(lián)網(wǎng).
徐? 丹(1987-),女,本科,工程師.研究領(lǐng)域:智能電力,信息研究.
趙? 燦(1993-),女,碩士,工程師.研究領(lǐng)域:智能配電網(wǎng)運(yùn)行.
譚宇渲(1995-),男,本科,助理工程師.研究領(lǐng)域:電力自動化.
2597500520254