袁 培,雷正霖,曾慶輝,武宜霄,呂彥力,胡朝龍
(1.鄭州輕工業(yè)大學(xué),鄭州 450000;2.山東小鴨冷鏈有限公司,濟(jì)南 250000)
目前食品冷藏陳列柜的電能消耗約占超市總電能消耗的50%~60%[1-2],特別是敞開(kāi)式冷藏陳列柜,由于其直接與環(huán)境接觸,產(chǎn)生高耗能和柜內(nèi)溫度波動(dòng)等現(xiàn)象。所以,在保證食品品質(zhì)的前提下,如何降低食品冷藏陳列柜的能耗是一個(gè)研究熱點(diǎn)。食品冷藏陳列柜的能耗與負(fù)荷有關(guān),如何對(duì)食品冷藏陳列柜負(fù)荷進(jìn)行準(zhǔn)確預(yù)測(cè),是實(shí)現(xiàn)科學(xué)運(yùn)行的前提,是節(jié)能降耗的基礎(chǔ)工作。
陸繼翔等[3]采用CNN-LSTM混合神經(jīng)網(wǎng)絡(luò)模型對(duì)電力系統(tǒng)的短期負(fù)荷進(jìn)行預(yù)測(cè),并與ARIMA、隨機(jī)森林、LSTM模型進(jìn)行比較。結(jié)果表明:相同條件下,CNN-LSTM混合神經(jīng)網(wǎng)絡(luò)模型的LSTM模型層數(shù)為4、訓(xùn)練次數(shù)為500,模型的絕對(duì)百分比誤差在0.35%至2.81%,預(yù)測(cè)準(zhǔn)確度最高。李晨亮[4]采用EEMD-LSTM模型對(duì)滬深300指數(shù)進(jìn)行預(yù)測(cè)研究。結(jié)果表明:對(duì)比BP、EEMD-BP、LSTM模型,EEMD-LSTM預(yù)測(cè)性能最優(yōu),模型的絕對(duì)百分比誤差為0.294%,指數(shù)方向的預(yù)測(cè)準(zhǔn)確性達(dá)到63.93%。WANG等[5]采用LSTM模型對(duì)搭建的制冷系統(tǒng)平臺(tái)進(jìn)行能耗預(yù)測(cè)。結(jié)果表明:相比傳統(tǒng)預(yù)測(cè)方法,LSTM模型具備更好的預(yù)測(cè)精度,LSTM的根均方誤差比BPNN低19.7%,比ARMA低54.85%,比ARFIMA低64.59%,LSTM模型能很好的預(yù)測(cè)能耗。
食品冷藏陳列柜的負(fù)荷與環(huán)境溫度、濕度、人流量、結(jié)霜融霜、壓縮機(jī)功耗、制冷劑等多種獨(dú)立因素相關(guān),準(zhǔn)確計(jì)算較為困難。這些獨(dú)立因素具備時(shí)間序列性和非線性的特點(diǎn),數(shù)據(jù)挖掘在處理這類(lèi)數(shù)據(jù)具備獨(dú)特優(yōu)勢(shì)。本研究引入LSTM神經(jīng)網(wǎng)絡(luò)模型,將制冷劑質(zhì)量流速、膨脹閥功率、制冷劑氣液壓力、蒸發(fā)器進(jìn)出口溫度、制冷劑氣液焓值、測(cè)試時(shí)間作為輸入數(shù)據(jù),通過(guò)對(duì)數(shù)據(jù)預(yù)處理、訓(xùn)練數(shù)據(jù)確定LSTM模型層數(shù)和訓(xùn)練次數(shù)、導(dǎo)入模型中進(jìn)行預(yù)測(cè),最終與實(shí)際負(fù)荷進(jìn)行對(duì)比,實(shí)現(xiàn)對(duì)冷藏陳列柜負(fù)荷的預(yù)測(cè)目的。
本研究采集的樣本點(diǎn)來(lái)自某公司提供的立式冷藏陳列柜測(cè)試數(shù)據(jù),所采集的樣本點(diǎn)包括(制冷劑質(zhì)量流速、膨脹閥功率、制冷劑氣液壓力、蒸發(fā)器進(jìn)出口溫度、制冷劑氣液焓值、測(cè)試時(shí)間),測(cè)試時(shí)間為2019年11月18日8:00:03~2019年11 月 19 日 8:00:03,時(shí)間步長(zhǎng)為 10 s,共計(jì) 8 641組樣本點(diǎn),80%的樣本點(diǎn)數(shù)據(jù)劃分為訓(xùn)練集,20%的樣本點(diǎn)數(shù)據(jù)劃分為測(cè)試集。
1.2.1 異常值處理
由于采集數(shù)據(jù)過(guò)程中可能出現(xiàn)問(wèn)題,采集的數(shù)據(jù)難免會(huì)出現(xiàn)缺失、異常等情況,影響模型預(yù)測(cè)精度,首先要用python中pandas和numpy模塊采用過(guò)濾缺失值、補(bǔ)全缺失值、數(shù)據(jù)轉(zhuǎn)換等操作。
1.2.2 數(shù)據(jù)歸一化
本研究采用的模型對(duì)輸入數(shù)據(jù)有一定的要求,需要將輸入數(shù)據(jù)進(jìn)行歸一化處理,將不同范圍的數(shù)據(jù)特征統(tǒng)一規(guī)范,統(tǒng)一到[0,1]。
式中 xmormalization——?dú)w一化后的輸入數(shù)據(jù);
x ——輸入數(shù)據(jù);
xMin——輸入數(shù)據(jù)的最小值;
xMax——輸入數(shù)據(jù)的最大值。
相較于傳統(tǒng)的預(yù)測(cè)方法,LSTM網(wǎng)絡(luò)模型對(duì)非線性和時(shí)間序列的數(shù)據(jù)具備較好的逼近能力,負(fù)荷這類(lèi)數(shù)據(jù)具備非線性和時(shí)間相關(guān)性的特點(diǎn),因此針對(duì)負(fù)荷這類(lèi)時(shí)間序列數(shù)據(jù)LSTM模型具備較好的預(yù)測(cè)適應(yīng)性。LSTM由Hochreiter &Schmidhuber(1997)提出[6],是一種特殊的遞歸神經(jīng)網(wǎng)絡(luò)(RNN)。LSTM網(wǎng)絡(luò)包含三個(gè)門(mén)(遺忘門(mén)、輸入門(mén)、輸出門(mén)),其網(wǎng)絡(luò)基本單元如圖1所示[7]。三個(gè)門(mén)的功能如下:輸入門(mén)控制流入存儲(chǔ)單元的當(dāng)前信息量;輸出門(mén)控制流入網(wǎng)絡(luò)其余部分的當(dāng)前信息量;遺忘門(mén)選擇前一時(shí)刻的單元狀態(tài),并自適應(yīng)地將部分信息保留到當(dāng)前時(shí)刻。
圖1 LSTM基本單元結(jié)構(gòu)Fig.1 LSTM basic unit structure
遺忘門(mén)通過(guò)sigmoid層決定什么信息通過(guò)記憶單元,會(huì)根據(jù)上一時(shí)刻輸出值ht-1和當(dāng)前輸入值xt產(chǎn)生一個(gè)0-1的ft值,來(lái)決定上一時(shí)刻學(xué)到的信息Ct-1通過(guò)或部分通過(guò),數(shù)字1保留信息,數(shù)字0舍棄信息;輸入門(mén)中的xt通過(guò)sigmoid和tanh函數(shù)產(chǎn)生候選值、it,二者作用產(chǎn)生中間值 Ct;輸出門(mén)通過(guò)sigmoid層來(lái)得到一個(gè)初始輸出ot,tanh函數(shù)將 Ct縮放,并與 ot相乘得到輸出 ht[8-10]。
本研究在深度學(xué)習(xí)工具TensorFlow基礎(chǔ)上[11],利用 python 中 pandas、Keras、Numpy、matplotlib 等模塊來(lái)構(gòu)建LSTM模型,并通過(guò)讀取數(shù)據(jù)、數(shù)據(jù)預(yù)處理、訓(xùn)練數(shù)據(jù)、測(cè)試數(shù)據(jù)和數(shù)據(jù)可視化等操作完成負(fù)荷的預(yù)測(cè)。LSTM神經(jīng)網(wǎng)絡(luò)模型將時(shí)間序列數(shù)據(jù)作為輸入數(shù)據(jù),其中蒸發(fā)器進(jìn)出口溫度、壓力、焓值、流量、膨脹閥功率都是相互獨(dú)立的時(shí)間序列數(shù)據(jù),為了耦合影響冷藏陳列柜負(fù)荷的影響因素,需要將所有的因素聚合到一起并轉(zhuǎn)換成數(shù)組類(lèi)型的數(shù)據(jù),并將數(shù)據(jù)設(shè)置成以時(shí)間序列索引,以此形成了一個(gè)以時(shí)間序列為索引的新的時(shí)間序列數(shù)據(jù),每個(gè)影響因素和負(fù)荷組成特征值,方便模型導(dǎo)入數(shù)據(jù)和快速計(jì)算。
為了驗(yàn)證LSTM神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果,采用三大評(píng)價(jià)指標(biāo)均方誤差(MSE)、平均絕對(duì)誤差(MAE)、平均絕對(duì)百分比誤差(MAPE)[12]。
式中 n ——數(shù)據(jù)樣本點(diǎn)數(shù)量;
actual(t)——t時(shí)刻的真實(shí)負(fù)荷值;
forecast(t)——t時(shí)刻的預(yù)測(cè)負(fù)荷值;
MAE ——平均絕對(duì)誤差;
MSE ——均方根誤差;
MAPE ——平均絕對(duì)百分比誤差。
平均絕對(duì)誤差MAE范圍[0,∞],當(dāng)預(yù)測(cè)值與真實(shí)值完全吻合時(shí)為0,即完美模型,誤差越大,該值越大;MSE均方根誤差,又稱(chēng)為平均損失,本研究采用MAE評(píng)價(jià)損失函數(shù)和MAPE作為模型性能評(píng)價(jià)指標(biāo),MAE在數(shù)據(jù)上比較直觀;MAPE平均絕對(duì)百分比誤差,表明模型的誤差百分比。
本研究將樣本點(diǎn)80%數(shù)據(jù)8用于訓(xùn)練集,20%用于測(cè)試集,并將數(shù)據(jù)設(shè)置成按時(shí)間索引。本研究通過(guò)采用控制變量法來(lái)逐步調(diào)整模型的精度。通過(guò)控制設(shè)定LSTM模型的層數(shù),通過(guò)改變訓(xùn)練次數(shù)來(lái)逐漸提高模型預(yù)測(cè)精準(zhǔn)度,達(dá)到不斷優(yōu)化模型的效果。本研究采用平均絕對(duì)誤差MAE作為損失函數(shù)來(lái)衡量模型的精確度,損失函數(shù)是可以很好得反映模型與實(shí)際數(shù)據(jù)差距的工具。首先固定LSTM模型的層數(shù),逐步增加訓(xùn)練次數(shù),接著固定訓(xùn)練次數(shù),逐步增加LSTM模型的層數(shù),來(lái)驗(yàn)證LSTM模型的層數(shù)和訓(xùn)練次數(shù)對(duì)預(yù)測(cè)精度的影響。表1給出了不同LSTM層數(shù)和訓(xùn)練次數(shù)對(duì)應(yīng)的訓(xùn)練集和測(cè)試集的損失函數(shù)和平均絕對(duì)百分比誤差。由圖2(a)~(f)可以看出,損失函數(shù)隨著訓(xùn)練次數(shù)的升高呈下降趨勢(shì),所以訓(xùn)練集和測(cè)試集的損失函數(shù)最大差距在開(kāi)始處,訓(xùn)練集和損失集最開(kāi)始的損失函數(shù)差值從圖2(a)~(d)是減小,從圖2(e)~(f)是增大。由表1可以看出,6組對(duì)照實(shí)驗(yàn)訓(xùn)練集的最終的平均絕對(duì)誤差MAE分別為 0.207 9,0.190 1,0.176 7,0.181 1,0.193 2,0.204 6,MAE隨著訓(xùn)練次數(shù)的增加逐漸減小,從訓(xùn)練次數(shù)為250時(shí)開(kāi)始逐漸增加,測(cè)試集MAE變化趨勢(shì)和訓(xùn)練集一致。網(wǎng)絡(luò)層數(shù)一定時(shí),增加訓(xùn)練次數(shù)可以降低損失函數(shù),當(dāng)訓(xùn)練次數(shù)超過(guò)200時(shí),出現(xiàn)測(cè)試集損失函數(shù)的誤差增大的現(xiàn)象;再結(jié)合表1可以看出在保持LSTM模型的訓(xùn)練次數(shù)不變,增加模型層數(shù)能有效提高模型預(yù)測(cè)精度,但層數(shù)過(guò)高會(huì)出現(xiàn)過(guò)擬合的現(xiàn)象,如表中層數(shù)為5是MAE和VAL_MAE反而出現(xiàn)提高的現(xiàn)象。
表1 模型結(jié)構(gòu)優(yōu)化試驗(yàn)結(jié)果Tab.1 Model structure optimization test results
圖2 訓(xùn)練次數(shù)100~350的損失函數(shù)Fig.2 Loss function with training times 100~350
經(jīng)過(guò)上述試驗(yàn),可以確定LSTM模型的層數(shù)為4及200訓(xùn)練次數(shù),將訓(xùn)練好的訓(xùn)練集和測(cè)試集導(dǎo)入模型,輸出預(yù)測(cè)結(jié)果并與實(shí)際結(jié)果對(duì)比來(lái)具體顯現(xiàn)模型預(yù)測(cè)的精度,圖3所示為實(shí)際數(shù)據(jù)和預(yù)測(cè)數(shù)據(jù)的折線圖,圖4是2019年11月18日20:00:03前后的預(yù)測(cè)數(shù)據(jù)放大圖。圖3,4中豎直黑線是區(qū)分訓(xùn)練集和測(cè)試集的分割線。
圖3 制冷負(fù)荷預(yù)測(cè)曲線和實(shí)際曲線的對(duì)比Fig.3 Comparison of cooling load forecast curve and actual curve
圖4 2019/11/19 04:00:03前后的預(yù)測(cè)數(shù)據(jù)放大圖Fig.4 An enlarged view of the forecast data before and after 2019/11/19 04:00:03
可以看出絕大部分的預(yù)測(cè)數(shù)據(jù)基本上與實(shí)際數(shù)據(jù)一致,但是在融霜階段和融霜后負(fù)荷大幅上升階段預(yù)測(cè)值和實(shí)際值出現(xiàn)較大的偏差,預(yù)測(cè)值和實(shí)際值的最大差值為4.447 7 kW·h,占比為10.27%,最小差值為5.4×10-5;雖然個(gè)別的數(shù)據(jù)點(diǎn)上出現(xiàn)較大但是總體上預(yù)測(cè)效果還是不錯(cuò)的,預(yù)測(cè)的數(shù)據(jù)變化趨勢(shì)是與實(shí)際數(shù)據(jù)是一致的,模型在訓(xùn)練集的絕對(duì)百分比誤差為1.836 2%,測(cè)試集的絕對(duì)百分比誤差為1.982 7%,測(cè)試集的絕對(duì)百分比誤差略微提高,是因?yàn)闇y(cè)試集在訓(xùn)練集基礎(chǔ)上預(yù)測(cè)負(fù)荷,誤差積累導(dǎo)致測(cè)試集的絕對(duì)百分比誤差提高。
(1)LSTM模型層數(shù)為2,訓(xùn)練次數(shù)分別為100,150,200,250,300,350的平均絕對(duì)誤差分別為0.207 9,0.190 1,0.176 7,0.181 1,0.193 2,0.204 6,經(jīng)過(guò)對(duì)比測(cè)試,最終確定LSTM模型層數(shù)為4,訓(xùn)練次數(shù)為200,MAE為0.162 7,VAL_MAE為0.182 3,整個(gè)模型平均的MAPE為1.909 4%,為最優(yōu)模型。
(2)將數(shù)據(jù)導(dǎo)入訓(xùn)練好的模型,得到模型在訓(xùn)練集的平均絕對(duì)百分比誤差達(dá)到1.836 2%,測(cè)試集的平均絕對(duì)百分比誤差達(dá)到1.982 7%,預(yù)測(cè)值在融霜階段和融霜后的短期內(nèi)出現(xiàn)較大的誤差,預(yù)測(cè)值和實(shí)際值的最大差值為4.447 7 kW·h,占比為10.27%,最小差值為5.4×10-5kW·h。
下一步本研究準(zhǔn)備采集超市等場(chǎng)所的實(shí)際狀況,引入人流量、商品數(shù)量等影響因素,結(jié)合調(diào)整的LSTM模型更加貼近實(shí)際生活的預(yù)測(cè)負(fù)荷,為下一步為冷藏陳列柜的科學(xué)運(yùn)行和節(jié)能打好基礎(chǔ)。