魏東, 楊潔婷, 韓少然, 朱準(zhǔn)
(1.北京建筑大學(xué)電氣與信息工程學(xué)院, 北京 100044; 2.建筑大數(shù)據(jù)智能處理方法研究北京市重點(diǎn)實(shí)驗(yàn)室, 北京 100044;3.北京京誠(chéng)瑞達(dá)電氣工程技術(shù)有限公司, 北京 100176; 4.北京城建設(shè)計(jì)發(fā)展集團(tuán)股份有限公司, 北京 100034)
公共建筑集中式空調(diào)系統(tǒng)能耗約占建筑總能耗的40%[1],而準(zhǔn)確的負(fù)荷預(yù)測(cè)能夠?yàn)橄到y(tǒng)優(yōu)化控制策略提供理論依據(jù),是實(shí)現(xiàn)空調(diào)系統(tǒng)按需供冷、節(jié)能運(yùn)行的前提條件。
目前常用的預(yù)測(cè)方法有時(shí)間序列、集成學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)等。集中式空調(diào)系統(tǒng)體積龐大、組成復(fù)雜,且含有冷水機(jī)組、水泵、風(fēng)機(jī)等非線性設(shè)備,因此具有較強(qiáng)的非線性、大滯后、強(qiáng)耦合特性。時(shí)間序列法根據(jù)統(tǒng)計(jì)學(xué)原理進(jìn)行建模,適用于線性關(guān)系和較簡(jiǎn)單的非線性映射[2];集成學(xué)習(xí)模型中子學(xué)習(xí)器的多樣性與求得解的準(zhǔn)確性或魯棒性之間往往存在沖突,需頻繁地調(diào)整子學(xué)習(xí)器的結(jié)構(gòu)參數(shù),或需引入進(jìn)化算法[3],不易移植;由于人工神經(jīng)網(wǎng)絡(luò)具有良好的移植性,且已證實(shí)3層前饋神經(jīng)網(wǎng)絡(luò)可以擬合任意非線性函數(shù),并對(duì)非線性系統(tǒng)有較強(qiáng)的魯棒性[4],因此采用3層前饋神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)建筑負(fù)荷預(yù)測(cè)。
負(fù)荷預(yù)測(cè)需要利用現(xiàn)場(chǎng)溫度、濕度、流量等多種傳感器采集的數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練實(shí)現(xiàn),現(xiàn)場(chǎng)運(yùn)行數(shù)據(jù)存儲(chǔ)量大、維度高,且易受到現(xiàn)場(chǎng)復(fù)雜環(huán)境干擾。大規(guī)模高維數(shù)據(jù)存在多重共線性問題,易導(dǎo)致解空間不穩(wěn)定,同時(shí)高維空間樣本具有稀疏性[5],會(huì)造成模型難以找到數(shù)據(jù)特征,從而降低模型泛化能力,利用特征工程可以解決該問題。特征降維屬于特征工程的一種[6],包括特征提取和特征選擇兩種方式。有效的特征降維方法可以確保特征屬性之間的相互獨(dú)立性,能夠解決模型過擬合問題,從而提升其泛化能力。閆秀英等[7]利用主成分分析法進(jìn)行空調(diào)系統(tǒng)的特征提取,采用優(yōu)化極限學(xué)習(xí)機(jī)建立負(fù)荷預(yù)測(cè)模型。主成分分析法屬于特征提取方法,該方法主成分的累計(jì)貢獻(xiàn)率確定具有主觀性,而且被提取的主成分很難給出符合實(shí)際背景和意義的解釋[8],使工程人員難以理解現(xiàn)有特征的價(jià)值。胡瑞等[9]利用隨機(jī)森林模型進(jìn)行特征選擇,然后構(gòu)建了決策樹算法、隨機(jī)森林、線性回歸和貝葉斯嶺回歸4種模型,分別預(yù)測(cè)高熵合金相穩(wěn)定性,實(shí)驗(yàn)證明隨機(jī)森林的預(yù)測(cè)精度最高,且進(jìn)行特征選擇可對(duì)網(wǎng)絡(luò)輸入進(jìn)行修剪,消除冗余計(jì)算,從而提高模型的泛化能力。特征選擇方法在實(shí)現(xiàn)特征降維的同時(shí),可以保留所選擇特征的完整物理含義,更便于研究人員充分理解負(fù)荷與其影響因素之間的關(guān)系。但是,對(duì)于隨機(jī)森林算法來(lái)說,單棵決策樹對(duì)數(shù)據(jù)的變化非常敏感,對(duì)某些存在噪聲的數(shù)據(jù)建模時(shí)很容易出現(xiàn)過擬合,進(jìn)而影響特征選擇的效果,逐漸添加決策樹數(shù)目時(shí)可減少出現(xiàn)過擬合的情況發(fā)生,但計(jì)算量會(huì)隨之增加。Chen等[10]提出的極限梯度提升(extreme gradient boosting, XGBoost)對(duì)隨機(jī)森林算法[11]進(jìn)行了改進(jìn),該方法若發(fā)現(xiàn)某節(jié)點(diǎn)的增益最小,將停止將樹構(gòu)建到更大的深度,從而能夠有效避免過擬合發(fā)生;此外,相對(duì)于隨機(jī)森林算法,XGBoost能進(jìn)行特征的并行化處理,可減少計(jì)算量。因此采用XGBoost特征選擇方法實(shí)現(xiàn)特征降維。
另一方面,由于訓(xùn)練樣本不可避免地包含誤差,若神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)冗余,在網(wǎng)絡(luò)訓(xùn)練后期,這些誤差會(huì)影響神經(jīng)網(wǎng)絡(luò)的訓(xùn)練收斂方向,從而易造成全局最優(yōu)點(diǎn)偏離,降低模型泛化能力。邵恩澤等[12]對(duì)于輸入節(jié)點(diǎn)和隱層節(jié)點(diǎn)分別采用基于靈敏度和基于相關(guān)度的剪枝方法,以降低網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜度。實(shí)驗(yàn)結(jié)果證明了剪枝后的神經(jīng)網(wǎng)絡(luò)泛化能力更強(qiáng)。如果在神經(jīng)網(wǎng)絡(luò)訓(xùn)練目標(biāo)函數(shù)中引入表示網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜性的懲罰項(xiàng),通過貝葉斯正規(guī)化方法[13]進(jìn)行模型訓(xùn)練,則既可使網(wǎng)絡(luò)盡可能地?cái)M合訓(xùn)練樣本數(shù)據(jù),又能通過在訓(xùn)練優(yōu)化過程中降低網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性,達(dá)到避免模型過擬合的目的。魏東等[14]利用神經(jīng)網(wǎng)絡(luò)建立空調(diào)負(fù)荷預(yù)測(cè)模型,采用貝葉斯正則化算法對(duì)模型進(jìn)行訓(xùn)練,提升了其泛化能力。但是,該研究基于主觀經(jīng)驗(yàn)確定模型的輸入變量,有可能造成重要特征信息丟失。
為解決上述問題,現(xiàn)利用XGBoost對(duì)原始數(shù)據(jù)集進(jìn)行特征選擇,再采用貝葉斯正則化方法訓(xùn)練神經(jīng)網(wǎng)絡(luò),構(gòu)建負(fù)荷預(yù)測(cè)模型。針對(duì)某商業(yè)建筑空調(diào)系統(tǒng)負(fù)荷預(yù)測(cè)實(shí)驗(yàn)結(jié)果驗(yàn)證所提方法的有效性。
以商業(yè)建筑空調(diào)系統(tǒng)為研究對(duì)象,該建筑位于中國(guó)西南地區(qū),面積為41 000 m2,建筑高度為31.4 m,共有7層,包括地上五層和地下二層。地下二層為車庫(kù),地下一層為超市,地上一~四層為商業(yè)區(qū)域,五層和夾層為餐飲區(qū)及電影院。冷凍站、配電房、熱水機(jī)房、超市部分空調(diào)通風(fēng)設(shè)備設(shè)置在地下室內(nèi)。
為了實(shí)現(xiàn)負(fù)荷預(yù)測(cè),配置了相關(guān)室內(nèi)和室外傳感器設(shè)備以采集數(shù)據(jù)。數(shù)據(jù)采集系統(tǒng)采用MODBUS通信協(xié)議,通過標(biāo)準(zhǔn)RS485接口與控制中心計(jì)算機(jī)連接,實(shí)現(xiàn)信息交互。所配置的室內(nèi)傳感器設(shè)備包括溫濕度傳感器、電磁式流量傳感器、水溫傳感器、壓力傳感器等,用于監(jiān)測(cè)冷卻水供/回水流量、壓力,以及各制冷機(jī)供/回水冷凍水流量等變量;建筑頂樓設(shè)有小型自動(dòng)氣象站,配置了相關(guān)室外傳感器設(shè)備,包括單翼風(fēng)向傳感器、風(fēng)杯風(fēng)速傳感器、熱電堆式輻射傳感器、鉑電阻溫度傳感器、濕敏電容濕度傳感器,現(xiàn)場(chǎng)檢測(cè)室外溫/濕度、風(fēng)向、風(fēng)速、太陽(yáng)輻射等氣象參數(shù)。部分傳感器設(shè)備如圖1所示,部分傳感器設(shè)備信息如表1所示。
表1 傳感器設(shè)備信息Table 1 Sensor equipment information
圖1 部分傳感器設(shè)備Fig.1 Some sensor equipment
數(shù)據(jù)采集時(shí)間為7月19日—9月12日,采樣周期為30 s,共采集到50個(gè)維度的特征樣本數(shù)據(jù),包括:①地下一層至地上五層室內(nèi)溫度及濕度;②冷水機(jī)組、冷卻水泵、冷凍水泵、冷卻塔耗電量;③冷卻水供回/水流量、壓力,冷凍水供回/水流量等系統(tǒng)運(yùn)行數(shù)據(jù);④室外溫度、濕度、風(fēng)速、風(fēng)向、太陽(yáng)輻射照度等氣象數(shù)據(jù)。部分?jǐn)?shù)據(jù)如表2所示。
表2 部分樣本數(shù)據(jù)Table 2 Partial sample data
如前所述,采用XGBoost算法進(jìn)行特征選擇。XGBoost是由若干以決策樹為基學(xué)習(xí)器組成的強(qiáng)學(xué)習(xí)器,其可表示為
(1)
模型訓(xùn)練的性能指標(biāo)為
(2)
(3)
(4)
模型訓(xùn)練時(shí),每次迭代即添加一棵新樹,第t次迭代的目標(biāo)函數(shù)為
(5)
(6)
(7)
(8)
式中:j為葉子節(jié)點(diǎn);Ij為當(dāng)前節(jié)點(diǎn)的實(shí)例集。
XGBoost算法的迭代過程中,權(quán)重和增益兩個(gè)參數(shù)反映了某個(gè)特征與預(yù)測(cè)目標(biāo)的相關(guān)性[15]。權(quán)重表示某特征出現(xiàn)的次數(shù),該特征信息增益總和除以出現(xiàn)的次數(shù)即為增益。增益的計(jì)算公式為
(9)
式(9)中:下角標(biāo)L、R分別為左子樹和右子樹。
采用3層前饋神經(jīng)網(wǎng)絡(luò)構(gòu)建負(fù)荷預(yù)測(cè)模型。為提升神經(jīng)網(wǎng)絡(luò)泛化能力,需要優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜性,即尋找最優(yōu)的網(wǎng)絡(luò)參數(shù)。利用貝葉斯理論框架[16]將模型參數(shù)視為不確定參數(shù),使用顯式的概率分布假設(shè)對(duì)模型進(jìn)行分析和推斷,然后,根據(jù)融入先驗(yàn)分布的假設(shè)和依據(jù),基于后驗(yàn)分布的貝葉斯推理得出最優(yōu)化參數(shù)。
傳統(tǒng)神經(jīng)網(wǎng)絡(luò)將均方誤差(mean squared error,MSE)作為誤差性能函數(shù),即
(10)
通過貝葉斯正則化方法修正性能函數(shù),即在性能函數(shù)上加上正則化項(xiàng)為
(11)
式(11)中:M為網(wǎng)絡(luò)的權(quán)值數(shù)量;wj為網(wǎng)絡(luò)的第j個(gè)權(quán)值。
修正后的誤差性能函數(shù)為
J=αJW+βJD
(12)
式(12)中:α、β為正則化參數(shù),可控制JW與JD在網(wǎng)絡(luò)中的占比。求取超參數(shù)α、β,需要求出后驗(yàn)分布,公式為
(13)
式(13)中:H為網(wǎng)絡(luò)結(jié)構(gòu);D={x(N),d(N)}為數(shù)據(jù)集;p(D|w,β,H)為似然函數(shù);p(D|α,β,H)為歸一化因子;p(α,β|H)為先驗(yàn)分布。
因?yàn)閜(D|H)與α、β無(wú)關(guān),因此問題就轉(zhuǎn)化為對(duì)最大似然函數(shù)p(D|α,β,H)的求解。
通過貝葉斯推理,有
(14)
式(14)中:ZJ(α,β)、zD(β)[17]和zW(α)均為歸一化因子,求解公式為
(15)
(16)
??J(wMP)(w-wMP)]dw
=(2π)M/2{det[??J(wMP)]}-1/2×
exp[-J(wMP)]
(17)
將式(15)~式(17)代入式(14),并取對(duì)數(shù),可得
lnp(D|α,β,H)=-αJW(wMP)-βJD(wMP)-
(18)
將式(18)分別對(duì)α、β求偏導(dǎo),并令其等于0,可得
(19)
=N-γ
(20)
由式(19)和式(20),可求得
(21)
式(21)中:下標(biāo)MP代表后驗(yàn)概率最大時(shí)的狀態(tài);γ為有效參數(shù)的數(shù)量,γ=m-2αtr(H-1),H為J的Hessian矩陣,H=α?2JW+β?2JD。
以貝葉斯正則化方法作為神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法時(shí),需要判斷α、β的收斂性,若收斂,則訓(xùn)練完成;若不收斂,需重新計(jì)算γ,從而更新α、β?;谪惾~斯正則化方法的神經(jīng)網(wǎng)絡(luò)訓(xùn)練步驟如下。
步驟1初始化超參數(shù)α、β和神經(jīng)網(wǎng)絡(luò)權(quán)值Wj,此處取α=0,β=1。
步驟2基于Levenberg-Marquardt(L-M)算法最小化修正后的誤差性能函數(shù)J。
步驟3求解J的Hessian矩陣,計(jì)算γ的值。
步驟4由式(21)計(jì)算超參數(shù)α、β的新估計(jì)值。
步驟5重復(fù)執(zhí)行步驟2~步驟4,直至α、β收斂。
在完成數(shù)據(jù)采集后,通過對(duì)數(shù)據(jù)進(jìn)行可視化分析,發(fā)現(xiàn)數(shù)據(jù)中明顯存在較多尖峰脈沖和隨機(jī)擾動(dòng),這是因?yàn)闇囟?、濕度、流量等變量的檢測(cè)裝置易受到靜電、電磁輻射、磁場(chǎng)耦合、直接傳輸?shù)雀蓴_影響;此外,空調(diào)系統(tǒng)現(xiàn)場(chǎng)安裝有多臺(tái)制冷機(jī)、水泵、風(fēng)機(jī)等大功率設(shè)備,大功率感性負(fù)載的啟停會(huì)使電網(wǎng)產(chǎn)生尖峰脈沖干擾。因此應(yīng)用中位值滑動(dòng)平均濾波法對(duì)特征樣本數(shù)據(jù)進(jìn)行濾波處理,該算法中采樣數(shù)據(jù)的數(shù)目N取值范圍一般為[3,14],這里取N=10。
以部分室外空氣濕度數(shù)據(jù)濾波為例展示濾波效果,如圖2所示。
圖2 濾波前后數(shù)據(jù)對(duì)比Fig.2 Comparison of data before and after filtering
由圖2可見,經(jīng)中位值平均濾波后,一些偶然出現(xiàn)的脈沖干擾和異常信號(hào)被濾除。
利用XGBoost對(duì)所采集的50維特征數(shù)據(jù)與負(fù)荷之間的相關(guān)性進(jìn)行排序,排序結(jié)果如圖3所示。
f0~f49表示特征變量編號(hào)
采用平均絕對(duì)百分比誤差(mean absolute percentage error,MAPE)對(duì)樣本數(shù)據(jù)特征維數(shù)與模型預(yù)測(cè)性能之間的關(guān)系進(jìn)行檢驗(yàn)。MAPE計(jì)算方法為
(22)
得到特征變量數(shù)量與MAPE的關(guān)系如圖4所示。
圖4 不同特征維度下的程序運(yùn)行時(shí)間和MAPE Fig.4 Program runtime and MAPE in different feature dimensions
由圖4可知,當(dāng)選擇特征個(gè)數(shù)為30時(shí),MAPE最低,為10.25%,模型運(yùn)行時(shí)間為0.76 s,在可接受范圍內(nèi),因此選擇此30個(gè)特征變量作為篩選后特征數(shù)據(jù),如表3所示,其中溫度號(hào)碼代表安裝在不同位置的溫度傳感器所采集數(shù)據(jù)。
表3 篩選后的特征變量Table 3 Feature variables after selection
以篩選后的30維特征數(shù)據(jù)為輸入搭建前饋神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,通過經(jīng)驗(yàn)公式[式(23)]獲取隱層的節(jié)點(diǎn)數(shù)取值范圍為[8,17]。
(23)
式(23)中:h為輸入層節(jié)點(diǎn)數(shù);l為輸出層節(jié)點(diǎn)數(shù);ε為隱含層節(jié)點(diǎn)數(shù);θ為范圍1~10的調(diào)節(jié)常數(shù),其余變量同上。
神經(jīng)網(wǎng)絡(luò)的泛化能力對(duì)初始權(quán)值(閾值)也很敏感,采用Nguyen-Widrow算法生成初始權(quán)值和閾值[18],然后以MSE最低為目標(biāo)進(jìn)行實(shí)驗(yàn),最終確定隱含層節(jié)點(diǎn)數(shù)為9,結(jié)果如表4所示。
表4 特征篩選后隱層神經(jīng)元數(shù)目實(shí)驗(yàn)結(jié)果Table 4 Experimental results on the number of hidden layer neurons after feature selection
學(xué)習(xí)率是神經(jīng)網(wǎng)絡(luò)重要的超參數(shù)。默認(rèn)的學(xué)習(xí)率取值策略是使用較小的學(xué)習(xí)率,因此確定學(xué)習(xí)率取值范圍為[0.001,1]。在確定隱層神經(jīng)元數(shù)目為9的條件下,以MSE最低為目標(biāo)進(jìn)行一系列實(shí)驗(yàn),確定神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)率為0.1,結(jié)果如表5所示。
表5 特征篩選后學(xué)習(xí)率實(shí)驗(yàn)結(jié)果Table 5 Experimental results of learning rate after feature selection
為進(jìn)行對(duì)比,同時(shí)以篩選前的50維特征數(shù)據(jù)為模型輸入,采取上述方法確定隱層神經(jīng)元數(shù)目為12,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)率為0.2。
特征篩選前后神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)效果對(duì)比如圖5所示,為直觀體現(xiàn)特征篩選對(duì)預(yù)測(cè)精度的影響,截圖第70~75組測(cè)試數(shù)據(jù)如圖6所示,特征篩選前后神經(jīng)網(wǎng)絡(luò)模型的MSE下降曲線如圖7所示。由圖5和圖6可知,特征篩選后神經(jīng)網(wǎng)絡(luò)模型較篩選前具有更好的擬合效果;分析圖7可知,未經(jīng)過特征
圖5 特征篩選前后神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)效果Fig.5 The prediction effect of the neural network model before and after feature selection
圖6 第70~75組測(cè)試數(shù)據(jù)預(yù)測(cè)效果Fig.6 The prediction effect of the 70th to 75th group of test data
圖7 神經(jīng)網(wǎng)絡(luò)模型MSE下降曲線Fig.7 MSE decline curve of neural network model
篩選的神經(jīng)網(wǎng)絡(luò)模型MSE分別在第30次迭代和第813次迭代時(shí)發(fā)生兩次大幅度下降,最終MSE為4.25×10-13;經(jīng)過特征篩選的神經(jīng)網(wǎng)絡(luò)模型MSE在第30次迭代時(shí)發(fā)生大幅度下降,隨后緩慢下降,最終MSE為2.41×10-13;對(duì)比可知,神經(jīng)網(wǎng)絡(luò)模型經(jīng)過特征篩選后,較特征篩選前MSE降低了43.29%。
為了驗(yàn)證神經(jīng)網(wǎng)絡(luò)負(fù)荷預(yù)測(cè)模型性能,首先對(duì)所采集的710組特征數(shù)據(jù)進(jìn)行數(shù)字濾波,并利用XGBoost特征篩選層進(jìn)行特征選擇,然后隨機(jī)選取497(70%)組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),其余213(30%)組數(shù)據(jù)作為驗(yàn)證數(shù)據(jù)。對(duì)于訓(xùn)練數(shù)據(jù),分別利用貝葉斯正則化方法和L-M算法對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,在相同條件下用213組驗(yàn)證數(shù)據(jù)對(duì)這兩個(gè)網(wǎng)絡(luò)模型分別進(jìn)行5次測(cè)試,將均方根誤差(root mean squared error,RMSE)和MAPE作為性能指標(biāo)。RMSE計(jì)算公式為
(24)
采用貝葉斯正則化和L-M算法訓(xùn)練的神經(jīng)網(wǎng)絡(luò)5次實(shí)驗(yàn)結(jié)果和統(tǒng)計(jì)結(jié)果分別如表6、表7所示。
表6 泛化能力對(duì)比實(shí)驗(yàn)結(jié)果Table 6 Comparison experimental results of generalization ability
表7 泛化能力實(shí)驗(yàn)統(tǒng)計(jì)結(jié)果Table 7 Experimental statistical results of generalization ability
從表6中可以看出,5次實(shí)驗(yàn)下,采用貝葉斯正則化算法訓(xùn)練的神經(jīng)網(wǎng)絡(luò)RMSE在2.682×10-4~1.100×10-3變化,采用L-M算法訓(xùn)練的神經(jīng)網(wǎng)絡(luò)RMSE在1.800×10-3~8.000×10-3變化,對(duì)兩者的MAPE分析同上。從表7可以看出,對(duì)比采用貝葉斯正則化和L-M算法訓(xùn)練的神經(jīng)網(wǎng)絡(luò),前者的RMSE和MAPE的最大值、最小值以及平均值均低于后者。5次試驗(yàn)下前者RMSE的最大值為1.100×10-3,與后者RMSE的最小值1.800×10-3相比降低了7.000×10-4,MAPE亦然。與后者相比,前者的RMSE和MAPE平均值分別減少了87.08%、85.33%,這充分證明了采用貝葉斯正則化方法訓(xùn)練的神經(jīng)網(wǎng)絡(luò)泛化能力更強(qiáng),預(yù)測(cè)精度更好。
提出了一種基于XGBoost-神經(jīng)網(wǎng)絡(luò)的公共建筑負(fù)荷特征篩選及預(yù)測(cè)方法。特征篩選層利用XGBoost方法對(duì)濾波后的數(shù)據(jù)進(jìn)行訓(xùn)練確定最優(yōu)特征子集,以提升模型泛化能力,避免大規(guī)模高維數(shù)據(jù)輸入導(dǎo)致模型訓(xùn)練時(shí)間過長(zhǎng)、易陷入局部最優(yōu),并可能導(dǎo)致振蕩的情況發(fā)生。負(fù)荷預(yù)測(cè)層采用3層前饋神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),在網(wǎng)絡(luò)目標(biāo)函數(shù)中引入表示網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜性的懲罰項(xiàng),以使網(wǎng)絡(luò)在盡可能擬合訓(xùn)練樣本數(shù)據(jù)的同時(shí),降低網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜性,達(dá)到提升模型泛化能力的目的。利用某商業(yè)建筑傳感器所采集的數(shù)據(jù)構(gòu)建負(fù)荷預(yù)測(cè)模型,通過實(shí)驗(yàn)結(jié)果可得到以下結(jié)論。
(1)經(jīng)過特征選擇后的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型較特征選擇前MSE降低了43.29%,有效減少了高維特征數(shù)據(jù)對(duì)模型預(yù)測(cè)精度的影響。
(2)對(duì)采用貝葉斯正則化方法和L-M算法訓(xùn)練的神經(jīng)網(wǎng)絡(luò)負(fù)荷預(yù)測(cè)模型進(jìn)行泛化能力實(shí)驗(yàn)對(duì)比,5次試驗(yàn)下前者的RMSE和MAPE平均值分別降低87.08%、85.33%,說明前者的泛化能力優(yōu)于后者。