侯博文,吳俊峰,陳煥新*,徐成良
(1-華中科技大學(xué)能源與動(dòng)力工程學(xué)院,湖北武漢 430074;2-壓縮機(jī)技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室(壓縮機(jī)技術(shù)安徽省實(shí)驗(yàn)室),安徽合肥 230031)
近年來(lái),隨著我國(guó)經(jīng)濟(jì)的快速發(fā)展,人民生活水平的進(jìn)一步提高,全球能源消耗量逐年提升,能源短缺,資源供需不匹配等問題引起社會(huì)各界的關(guān)注,從2008—2018年,中國(guó)能源消耗總量一直呈現(xiàn)出上升趨勢(shì),且10年間能源消耗總量增長(zhǎng)了44.7%。作為中國(guó)三大“耗能大戶”的建筑能耗[1],占中國(guó)社會(huì)總能源消耗量的30%~35%,能源與發(fā)展的矛盾日益突出,智慧樓宇的節(jié)能需求迫切。從能耗預(yù)測(cè)技術(shù)[2-4]在行業(yè)內(nèi)的發(fā)展情況來(lái)看,基于數(shù)據(jù)驅(qū)動(dòng)的能耗預(yù)測(cè)模型也是當(dāng)前的主流選擇。
近年來(lái),基于數(shù)據(jù)驅(qū)動(dòng)的建筑能耗預(yù)測(cè)研究越來(lái)越廣泛。ZHAO等[5]從模型的復(fù)雜性、易用性和運(yùn)行速度,所需投入和準(zhǔn)確性等方面進(jìn)行了比較分析。周峰等[6]采用支持向量機(jī)算法對(duì)建筑進(jìn)行能耗預(yù)測(cè)和故障診斷,為建筑節(jié)能提供參考。FAN等[7]提出了一種基于數(shù)據(jù)驅(qū)動(dòng)方法的通用的數(shù)據(jù)挖掘框架,闡述了數(shù)據(jù)挖掘技術(shù)在海量建筑數(shù)據(jù)中的應(yīng)用前景。代德宇等[8-9]針對(duì)銅管生產(chǎn)過程中存在能源浪費(fèi)的現(xiàn)象,提出了一種基于遺傳算法-反向傳播神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。曾宇柯等[10]提出了一種基于局部異常因子結(jié)合神經(jīng)網(wǎng)絡(luò)的多聯(lián)機(jī)故障診斷方案,有效提高故障檢測(cè)能力。19世紀(jì)40年代,多層神經(jīng)網(wǎng)絡(luò)就因其具有良好的學(xué)習(xí)特征被人們研究,但由于多層神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)會(huì)出現(xiàn)局部最優(yōu)或者不能收斂的問題,導(dǎo)致多層神經(jīng)網(wǎng)絡(luò)沒能得到廣泛應(yīng)用。直到多層神經(jīng)網(wǎng)絡(luò)的逐層訓(xùn)練模式的出現(xiàn),使得深度學(xué)習(xí)自此開始應(yīng)用于各個(gè)領(lǐng)域。
LI等[11]利用深度信念網(wǎng)絡(luò)算法消除溫室變量之間的相關(guān)性,提取溫室中氣象參數(shù)的特征,提取的特征向量被用于訓(xùn)練和優(yōu)化LSSVM模型。GUO等[12]提出了一種基于深度學(xué)習(xí)網(wǎng)絡(luò)的深度診斷網(wǎng)絡(luò)建筑節(jié)能故障診斷方法,優(yōu)化后的模型故障診斷正確率為97.7%,與初始模型相比,正確率提高了5.05%。鄭毅等[13]基于深度信念網(wǎng)絡(luò)算法提出了一種區(qū)域PM2.5的預(yù)測(cè)方法,對(duì)訓(xùn)練數(shù)據(jù)的選擇和模型參數(shù)的設(shè)置進(jìn)行了優(yōu)化。張籍等[14]采用灰色關(guān)聯(lián)度分析法建立預(yù)測(cè)模型,定量分析各因素對(duì)不同行業(yè)的影響程度,對(duì)每一種預(yù)測(cè)類型建立基于深度信念網(wǎng)絡(luò)的中長(zhǎng)期負(fù)荷預(yù)測(cè)模型。
本文的研究對(duì)象為河南省新鄉(xiāng)市某一辦公建筑中的空調(diào)系統(tǒng),該建筑為政府辦公建筑,水源熱泵系統(tǒng)是該辦公建筑用來(lái)制冷和供暖的主要設(shè)施,可以給室內(nèi)提供良好舒適的工作環(huán)境。夏季制冷時(shí),水源熱泵機(jī)組工作原理就是將建筑物中的熱量轉(zhuǎn)移到水源中。
本文采用夏季居民建筑的能耗數(shù)據(jù)進(jìn)行分析,獲得的數(shù)據(jù)包括室內(nèi)運(yùn)行數(shù)據(jù)和室外氣象數(shù)據(jù),采集時(shí)間從2016-07-01的00:00至2016-08-22的13:50,由于數(shù)據(jù)的采集樣本間隔均為5 min,所獲得的原始數(shù)據(jù)共計(jì)15 144個(gè)數(shù)據(jù)樣本,參與建模的變量分布特征見表1所示,Pt為總功率,Tsup為回水溫度,qv為瞬時(shí)流量,hins為瞬時(shí)熱量,Tout為室外溫度,φ為相對(duì)濕度,Vw為室外風(fēng)速,Il為光照強(qiáng)度。
表1 參與建模變量的數(shù)據(jù)分布特征
深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)由Geoffrey Hinton提出,作為深度學(xué)習(xí)的主要算法之一,目前被廣泛應(yīng)用于回歸預(yù)測(cè)與圖像識(shí)別等領(lǐng)域。深度信念網(wǎng)絡(luò)由多層受限玻爾茲曼機(jī)(Restricted Boltzmann Machines,RBM)組成,受限玻爾茲曼機(jī)采用無(wú)監(jiān)督方法對(duì)模型參數(shù)進(jìn)行訓(xùn)練,應(yīng)用貪婪算法逐層優(yōu)化每個(gè)隱藏層,最后結(jié)合反向微調(diào)算法對(duì)模型各層間的權(quán)值及模型閾值進(jìn)行調(diào)節(jié),使模型誤差達(dá)到網(wǎng)絡(luò)設(shè)置要求。RBM僅由兩層神經(jīng)元組成,一層為可視層,用于輸入訓(xùn)練數(shù)據(jù),另一層為隱藏層,用作特征檢測(cè)器。
深度信念網(wǎng)絡(luò)是建立在受限玻爾茲曼機(jī)的基礎(chǔ)之上,由于單層的RBM結(jié)構(gòu)只能學(xué)習(xí)到輸入數(shù)據(jù)的淺層特征,將多層RBM結(jié)構(gòu)疊加起來(lái)構(gòu)成多層網(wǎng)絡(luò)結(jié)構(gòu)來(lái)學(xué)習(xí)數(shù)據(jù)的深層特征。深度信念網(wǎng)絡(luò)的結(jié)構(gòu)圖如圖1所示,由多個(gè)RBM和一個(gè)具有預(yù)測(cè)功能的頂層算法組成,頂層算法一般根據(jù)算法的實(shí)際用途來(lái)進(jìn)行選擇,本文選擇支持向量回歸(Support Vector Regression,SVR)作為預(yù)測(cè)器參與模型的構(gòu)建。整個(gè)DBN的網(wǎng)絡(luò)結(jié)構(gòu)由多個(gè)RBM疊加,上一個(gè)RBM的輸出作為下一個(gè)RBM的輸入,相鄰層與層之間采用全連接方式,層內(nèi)神經(jīng)單元各自獨(dú)立,DBN的輸入神經(jīng)元個(gè)數(shù)由輸入數(shù)據(jù)的變量個(gè)數(shù)決定。受限玻爾茲曼機(jī)的訓(xùn)練過程常采用對(duì)比散度(Contrastive Divergence,CD)算法[15]來(lái)節(jié)約模型的訓(xùn)練時(shí)間,其基本思想是在數(shù)據(jù)固定輸入的條件下,通過調(diào)節(jié)網(wǎng)絡(luò)參數(shù)來(lái)降低網(wǎng)絡(luò)模型的能量值。對(duì)比散度算法采用無(wú)監(jiān)督學(xué)習(xí)方法,能很好解決神經(jīng)網(wǎng)絡(luò)在模型訓(xùn)練陷入局部最優(yōu)值的問題,有效縮短了模型的訓(xùn)練時(shí)間。
圖1 DBN結(jié)構(gòu)圖
傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型在層數(shù)增加過程中,存在梯度爆炸,陷入局部最優(yōu)值以及訓(xùn)練時(shí)間過長(zhǎng)等問題,DBN能較好解決這些問題,訓(xùn)練過程分為兩個(gè)階段:1)無(wú)監(jiān)督的逐層預(yù)訓(xùn)練;2)有監(jiān)督的反向微調(diào)。
布谷鳥搜索算法(Cuckoo Search,CS)也稱杜鵑算法,是由劍橋大學(xué)的著名學(xué)者GANDOMI等[16]根據(jù)布谷鳥種群自身的寄生繁衍策略而提出的一種新型啟發(fā)式算法,相比于其他優(yōu)化算法,布谷鳥搜索算法具有收斂速度快、全局搜索能力強(qiáng)及通用性和魯棒性好等優(yōu)點(diǎn)。布谷鳥與其它鳥類的繁衍行為不同,布谷鳥從不哺育幼鳥,它們會(huì)特選擇與自己卵形相似,產(chǎn)蛋和育雛的時(shí)間大致相同的鳥類作為寄主,靠巢寄生行為來(lái)繁衍后代。布谷鳥算法在模擬布谷鳥尋窩的過程中,規(guī)定以下三個(gè)理想假設(shè):1)布谷鳥每次只下一個(gè)蛋,且根據(jù)自己的意愿選擇鳥窩孵化;2)隨機(jī)選擇過程中,屬于最優(yōu)鳥窩且存有布谷鳥蛋的鳥窩會(huì)被保存;3)鳥窩總體數(shù)量不會(huì)變,布谷鳥被鳥窩主人發(fā)現(xiàn)的概率為Pa。
STL(Seasonal and Trend Decomposition Using Loess)是一種經(jīng)典的時(shí)間序列分解方法,由Cleveland提出,常用的數(shù)據(jù)分解模型有兩種,分別是加法模型與乘法模型,如果對(duì)序列進(jìn)行加法分解,其分解式[17]可以寫成:
式中,Tt為趨勢(shì)分量;St為周期分量;Rt為余項(xiàng)。
如果對(duì)序列進(jìn)行乘法分解,其分解式為:
箱線圖又稱盒須圖,它既能顯示數(shù)據(jù)實(shí)際分布情況,又能直觀識(shí)別數(shù)據(jù)中的異常值,還可以將多組數(shù)據(jù)的分布特征顯示在同一張箱線圖上。箱線圖中判斷異常值是通過異常值截?cái)帱c(diǎn)來(lái)判斷,異常值截?cái)帱c(diǎn)之外的數(shù)據(jù)視為異常值數(shù)據(jù),最小值M1和最大值M2為兩個(gè)截?cái)帱c(diǎn),計(jì)算方法見式(3)和式(4):
上四分位數(shù)和下四分位數(shù)的差值定義為四分位距(Inter Quartile Range,IQR),計(jì)算公式為:
在水庫(kù)上游設(shè)立水文站,及時(shí)提供準(zhǔn)確、可靠的水文情報(bào)預(yù)報(bào),為水庫(kù)防洪提供切實(shí)可靠的水雨情即時(shí)資料,便于水庫(kù)采取有效防洪措施。有供水任務(wù)時(shí),可以隨時(shí)了解水庫(kù)水質(zhì)情況。此外,還可以掌握泥沙淤積等情況。
建立基于深度信念網(wǎng)絡(luò)的建筑空調(diào)能耗預(yù)測(cè)模型的本質(zhì)是利用深度學(xué)習(xí)算法對(duì)檢測(cè)到的原始數(shù)據(jù)進(jìn)行分析處理,通過深度信念網(wǎng)絡(luò)算法對(duì)輸入模型的變量進(jìn)行特征提取,采用支持向量回歸算法作為模型的預(yù)測(cè)器,通過系統(tǒng)檢測(cè)到的實(shí)時(shí)數(shù)據(jù)對(duì)預(yù)測(cè)模型進(jìn)行訓(xùn)練,使得模型能通過輸入檢測(cè)到的數(shù)據(jù)來(lái)進(jìn)行下一時(shí)刻的能耗預(yù)測(cè)。能耗預(yù)測(cè)模型的建立流程如圖2所示,整個(gè)過程包括數(shù)據(jù)預(yù)處理、模型訓(xùn)練、模型測(cè)試以及模型評(píng)價(jià)4個(gè)部分。
圖2 能耗模型建立流程
模型評(píng)價(jià)指標(biāo)有助于發(fā)現(xiàn)所選模型在應(yīng)用過程中的實(shí)際效果,模型建立過程中,訓(xùn)練集中的數(shù)據(jù)用來(lái)建立模型,訓(xùn)練過程中未采用的測(cè)試集數(shù)據(jù)則用來(lái)判斷模型的泛化性能,本文選擇平均絕對(duì)誤差MAE(Mean Absolute Error,MAE)、均方誤差MSE(Mean Squared Error,MSE)和決定系數(shù)(R2)三個(gè)指標(biāo)作為能耗預(yù)測(cè)模型的評(píng)價(jià)指標(biāo):
式中,n為樣本數(shù)量;Yi為第i個(gè)樣本的實(shí)際值;Yi1為第i個(gè)樣本的預(yù)測(cè)值;Yavg為樣本的平均值。
對(duì)原始數(shù)據(jù)通過STL方法進(jìn)行異常值檢測(cè),得到供水溫度、回水溫度、瞬時(shí)熱量、室外溫度、相對(duì)濕度、室外風(fēng)速和光照強(qiáng)度均存在異常值,對(duì)應(yīng)的異常值數(shù)量分別為409、325、155、382、259、235、317、19和1 016,由于STL分解是基于時(shí)間序列的單變量分析,所以異常值中可能存在一行數(shù)據(jù)在多個(gè)變量中均被檢測(cè)為異常值。最終,通過對(duì)各個(gè)變量異常值的比較,基于STL的異常值檢測(cè)共篩選出2 435個(gè)異常樣本,占總體樣本個(gè)數(shù)的16.1%。
同時(shí)使用箱線圖方法對(duì)原始數(shù)據(jù)進(jìn)行異常值檢測(cè),通過式(3)和式(4)計(jì)算可知,供水溫度、回水溫度、瞬時(shí)熱量、室外溫度、相對(duì)濕度、室外風(fēng)速和光照強(qiáng)度均存在異常值,按照式(3)和式(4)可計(jì)算出對(duì)應(yīng)異常值數(shù)量分別為682、730、48、2、386、376和149,考慮異常值中可能存在一行數(shù)據(jù)在多個(gè)變量中均被檢測(cè)為異常值,通過對(duì)各樣本異常值的比較,最終基于箱線圖的異常值檢測(cè)方法共檢測(cè)出1 666個(gè)異常樣本,占總樣本個(gè)數(shù)的11%。
基于STL和基于箱線圖的異常值檢測(cè)方法分別檢測(cè)出了2 435和1 666個(gè)變量,鑒于所采用的兩種異常值檢測(cè)方法均屬于無(wú)監(jiān)督學(xué)習(xí)算法,分別被STL方法和箱線圖方法檢測(cè)為異常值的樣本也可能是正常樣本[18],因此,被STL和箱線圖兩種異常值檢測(cè)方法同時(shí)檢測(cè)為異常值的樣本認(rèn)定為異常樣本,兩種方法均認(rèn)定為異常值的樣本取交集,得到同時(shí)被STL和箱線圖兩種方法認(rèn)定為異常值的樣本個(gè)數(shù)為488個(gè),占總體樣本數(shù)量的3.3%。
為了不影響數(shù)據(jù)自身的統(tǒng)計(jì)特性,本節(jié)直接剔除數(shù)據(jù)的異常樣本,共計(jì)488個(gè)異常樣本被剔除,占總樣本數(shù)量的3.3%。通過基于STL和箱線圖兩種異常值處理后,共獲得14 656組數(shù)據(jù)。
圖3 基于DBN-A模型的能耗預(yù)測(cè)結(jié)果
為了確定隱藏層層數(shù)對(duì)模型預(yù)測(cè)結(jié)果的影響,本文設(shè)置不同的隱藏層層數(shù)來(lái)建立模型,除隱藏層層數(shù)外,隱藏層節(jié)點(diǎn)數(shù)均設(shè)為15個(gè),迭代次數(shù)設(shè)置為200次,學(xué)習(xí)率設(shè)為0.01,其它網(wǎng)絡(luò)參數(shù)均按照初始化設(shè)置,當(dāng)隱藏層層數(shù)為1至5時(shí)分別計(jì)算了模型的評(píng)價(jià)指標(biāo)MAE和MSE以及和初始化模型的變化情況,取5次計(jì)算結(jié)果的平均值作為最終輸出,如表2所示,表中第一行為初始化隱藏層層數(shù)為2時(shí)的預(yù)測(cè)結(jié)果。
表2 基于不同隱藏層的DBN模型的誤差對(duì)比
由表2可知,相對(duì)于初始化模型(隱藏層層數(shù)為2),當(dāng)隱藏層層數(shù)取其它值時(shí),ΔMAE和ΔMSE均為正值,表明此時(shí)模型誤差增大,預(yù)測(cè)性能不佳,同時(shí)可以發(fā)現(xiàn)模型運(yùn)行時(shí)間與隱藏層層數(shù)正比例相關(guān),同時(shí)隨著隱藏層層數(shù)的增加,模型訓(xùn)練所消耗的時(shí)間也隨之增加,每增加一個(gè)隱藏層,模型訓(xùn)練的時(shí)間增加25 s左右。
隱藏層節(jié)點(diǎn)數(shù)的確定影響深度信念網(wǎng)絡(luò)模型的預(yù)測(cè)性能,節(jié)點(diǎn)數(shù)選取過大或過小會(huì)導(dǎo)致過擬合或者欠擬合情況的發(fā)生,本文按照多種經(jīng)驗(yàn)公式[19-21]計(jì)算隱藏層的節(jié)點(diǎn)數(shù),求得各層隱藏層節(jié)點(diǎn)數(shù)的范圍為[6, 20],本文將隱藏層節(jié)點(diǎn)數(shù)設(shè)置成不同的組合來(lái)驗(yàn)證模型的預(yù)測(cè)性能,分別采用恒值型組合、升值型組合和降值型組合來(lái)進(jìn)行隱藏層的組合,模型的迭代次數(shù)設(shè)置為200次,學(xué)習(xí)率設(shè)為0.01,分別計(jì)算模型評(píng)價(jià)指標(biāo)以及模型運(yùn)行時(shí)間,取5次計(jì)算結(jié)果的平均值作為最終輸出,如表3所示。
表3 不同隱藏層組合的預(yù)測(cè)結(jié)果
由表3可知,當(dāng)模型隱藏層兩層節(jié)點(diǎn)數(shù)為9和15時(shí),獲得具有最佳預(yù)測(cè)結(jié)果的建筑空調(diào)能耗預(yù)測(cè)模型,將此時(shí)模型記為DBN-B模型。
本文選用支持向量回歸算法作為模型的預(yù)測(cè)器,核參數(shù)g和懲罰因子C對(duì)模型預(yù)測(cè)精度的影響起關(guān)鍵作用。本節(jié)選用布谷鳥搜索算法對(duì)模型參數(shù)進(jìn)行優(yōu)化。參數(shù)尋優(yōu)在經(jīng)過大約15次迭代后就取到了最優(yōu)適應(yīng)度函數(shù)值,在之后的迭代過程中,適應(yīng)度函數(shù)值逐步穩(wěn)定在1.059,此時(shí)深度信念網(wǎng)絡(luò)模型的參數(shù)已得到了優(yōu)化,模型中核參數(shù)g=4.59,懲罰因子C=6.61,將此時(shí)的能耗預(yù)測(cè)模型命名為CS-DBN模型。
圖4所示為基于CS-DBN模型的能耗預(yù)測(cè)結(jié)果。由圖4可知,預(yù)測(cè)能耗曲線較好反映了真實(shí)能耗的變化趨勢(shì),且預(yù)測(cè)值與真實(shí)值之間的誤差程度減小,CS-DBN模型的MAE、MSE和R2分別為1.05,1.84和0.98,優(yōu)化后的模型預(yù)測(cè)評(píng)價(jià)指標(biāo)相對(duì)于未優(yōu)化的DBN-B模型有較大程度提升,預(yù)測(cè)精度得到進(jìn)一步的提高。
圖4 基于CS-DBN模型的能耗預(yù)測(cè)結(jié)果
本文為了獲得一個(gè)最優(yōu)的能耗預(yù)測(cè)模型,最大程度貼合建筑實(shí)際能耗,為建筑節(jié)能提供指導(dǎo)性意見。采用多種算法建立建筑空調(diào)能耗預(yù)測(cè)模型,分別建立了基于支持向量回歸、極限學(xué)習(xí)機(jī)和未優(yōu)化的深度信念網(wǎng)絡(luò)建立建筑空調(diào)能耗預(yù)測(cè)模型,表4所示為各模型預(yù)測(cè)的預(yù)測(cè)結(jié)果。
表4 各模型預(yù)測(cè)的預(yù)測(cè)結(jié)果
通過對(duì)5個(gè)模型預(yù)測(cè)性能評(píng)價(jià)指標(biāo)的對(duì)比分析,在文中建立的所有能耗預(yù)測(cè)模型中,經(jīng)過網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)選擇和布谷鳥搜索算法優(yōu)化后的CS-DBN模型的MAE和MSE最小,R2最大,模型預(yù)測(cè)性能最好,相比于未進(jìn)行優(yōu)化的DBN-A模型,MAE由1.72減小為1.05,MSE由11.94減小為1.36,R2由0.88變?yōu)?.98,誤差指標(biāo)大幅度減小,擬合指標(biāo)大幅度增加,能耗預(yù)測(cè)模型得到進(jìn)一步的優(yōu)化,可以認(rèn)為經(jīng)過網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)選擇和布谷鳥搜索算法優(yōu)化后的CS-DBN模型是最佳建筑空調(diào)預(yù)測(cè)模型。
本文通過構(gòu)建基于深度信念網(wǎng)絡(luò)算法對(duì)建筑進(jìn)行能耗預(yù)測(cè),對(duì)比了實(shí)際測(cè)量值與模型預(yù)測(cè)值,并對(duì)能耗模型進(jìn)行了優(yōu)化,計(jì)算了相應(yīng)的模型評(píng)價(jià)指標(biāo),得到如下結(jié)論:
1)經(jīng)過優(yōu)化后的支模型預(yù)測(cè)性能得到改善,平均絕對(duì)誤差由1.72降至1.05,均方誤差由11.94降至1.36,決定系數(shù)由0.88增至0.98;
2)將預(yù)測(cè)結(jié)果與測(cè)量值進(jìn)行了對(duì)比,發(fā)現(xiàn)用電量低于5 kW·h的數(shù)據(jù)預(yù)測(cè)能力不是很理想,分析認(rèn)為是沒有對(duì)開停機(jī)時(shí)的數(shù)據(jù)給予足夠重視。