国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)驅(qū)動的地下車站能耗預測模型對比研究

2022-06-28 08:03蘇子怡李曉鋒
都市快軌交通 2022年3期
關鍵詞:預測值能耗通風

王 巖,蘇子怡,李曉鋒,王 斌

(1. 無錫地鐵集團有限公司,江蘇無錫 214000;2. 清華大學建筑學院,北京 100084)

1 研究背景

“十三五”期間,城市軌道交通累計新增運營線路4 351.7 km,年均增長率17.1%,創(chuàng)歷史新高。截至2020 年底,中國大陸地區(qū)共有45 座城市開通城市軌道交通線路244 條,運營總長達7 969.7 km,其中地鐵占比78.8%。2020 年,城軌交通總用電量172.4 億kW·h,其中車站能耗88.4 億kW·h,隨著新建線路的增加,能耗持續(xù)增長[1]。

當前地鐵車站的運行存在巨大的節(jié)能潛力。常用的反饋控制軟件自適應力不強,無法及時應對地鐵環(huán)境的復雜變化,主要存在的問題包括車站公共區(qū)溫度控制振蕩嚴重、無法及時應對活塞風效應導致的環(huán)境變化等,導致能源浪費[2]。因此,有必要研究地鐵車站能耗預測模型,準確預測用能負荷,這對于指導車站設備選型和節(jié)能運行具有至關重要的意義。

數(shù)據(jù)驅(qū)動算法是建筑能耗預測的常用方法,多種大數(shù)據(jù)技術被廣泛應用于各類型建筑不同時間尺度的能耗預測中[3-5]。趙海湉等探究了室內(nèi)環(huán)境、室外環(huán)境、在室人員數(shù)量等使用需求參數(shù)對建筑大數(shù)據(jù)能耗預測的影響[6];Kim 等對比了線性回歸、隨機森林、決策樹回歸、卷積神經(jīng)網(wǎng)絡等算法在住宅用電量預測中的表現(xiàn)[7];何明秀以上海市多棟公共建筑為例,對比了支持向量機、隨機森林等多種方法的能耗預測效果[8];孫劭波研究了政府辦公建筑能耗的大數(shù)據(jù)預測算法[9];韓連華基于逐步回歸和決策樹方法,建立了建筑能耗預測和基準評價集成模型[10]。上述研究表明,數(shù)據(jù)驅(qū)動算法在建筑能耗預測領域應用廣泛,但缺乏針對地鐵車站建筑能耗預測的數(shù)據(jù)驅(qū)動算法研究。

本研究以地下2 層標準車站為例,建立了基于數(shù)據(jù)驅(qū)動的通風空調(diào)、垂直交通和照明系統(tǒng)能耗的預測模型,對比了多種常用的大數(shù)據(jù)技術,包括最小二乘多元線性回歸(LR)、嶺回歸(Ridge)、Lasso 回歸、隨機森林(RF)、XGBoost,從預測精度、計算成本的角度分析了各算法的優(yōu)缺點,為地下車站能耗的預測提供了數(shù)據(jù)驅(qū)動算法參考。

2 能耗預測模型

2.1 車站用能系統(tǒng)

本研究的對象為地下2 層的非換乘、屏蔽門系統(tǒng)車站,冷源為變頻螺桿冷水機組。

地鐵車站的主要用能系統(tǒng)包括通風空調(diào)系統(tǒng)(約占55%)、垂直交通系統(tǒng)(約占15%)和照明系統(tǒng)(約占22%)[11]。其中,照明系統(tǒng)形式相對簡單、能耗易算,本研究推薦采用基于運行原理的模型進行計算。該模型采用車站照明功率密度、照明面積、照明時長進行計算,預測模型的均方根誤差的變異系數(shù)CV-RMSE為2.9%[12]。而車站通風空調(diào)、垂直交通系統(tǒng)能耗的影響因素復雜,所以筆者對其進行重點研究,對比常用的數(shù)據(jù)驅(qū)動模型,對其能耗進行預測研究。

2.2 輸入?yún)?shù)選擇

已有研究通過敏感性分析指出,地下車站通風空調(diào)系統(tǒng)能耗的關鍵影響因素包括室內(nèi)外環(huán)境、機械新風量、設備能效、無組織滲風量、客流量等相關的14個參數(shù),垂直交通系統(tǒng)能耗的關鍵影響因素包括發(fā)車對數(shù)、客流量、設備功率、設備數(shù)量等相關的13 個輸入?yún)?shù),如表1 所示[13]。本研究建立的數(shù)據(jù)驅(qū)動模型,以各系統(tǒng)能耗的關鍵影響因素作為輸入?yún)?shù)。

表1 車站能耗模型關鍵影響因素 Table 1 Key inputs of energy models for underground stations

2.3 數(shù)據(jù)驅(qū)動模型

筆者選擇了最小二乘回歸、嶺回歸、Lasso 回歸、隨機森林、XGBoost 模型,對比各模型在地下車站能耗預測上的效果。采用的數(shù)據(jù)庫為車站分項能耗原理模型模擬得到的10 000 條數(shù)據(jù),預測步長為1 h。

2.3.1 多元線性回歸

多元線性回歸模型Y 考慮了輸入?yún)?shù)的交互作用項,即Xi包括N 個關鍵影響因素及其兩兩乘積,有

2.3.2 嶺回歸

嶺回歸是一種替代最小二乘的壓縮估計擬合方法,通過正則化減少方差,能夠?qū)⑾禂?shù)往零的方向進行壓縮,在多元回歸模型中實現(xiàn)變量重要性的篩選。嶺回歸的系數(shù)估計值通過最小化式(3)得到

式中,λ≥0 是調(diào)節(jié)參數(shù),選擇合適的λ 對模型十分重要,可用交叉驗證進行參數(shù)尋優(yōu)。

2.3.3 Lasso 回歸

Lasso 回歸也是通過正則化減少方差,與嶺回歸的差異在于Lasso 可以將系數(shù)壓縮至零,能夠?qū)崿F(xiàn)變量的篩選,得到輸入?yún)?shù)較少的稀疏模型。Lasso 回歸的系數(shù)估計值通過最小化式(4)得到

式中,λ≥0 是調(diào)節(jié)參數(shù),選擇合適的λ 對模型十分重要,可用交叉驗證進行參數(shù)尋優(yōu)。

2.3.4 隨機森林

隨機森林是一種常用的以決策樹為基礎的分析方法,隨機采樣有放回的抽取k 個樣本并進行N次采樣生成的N 個訓練集,用訓練集擬合模型并求得預測值。每考慮樹上的一個分裂點,都要從全部預測變量中選出一個包含部分預測變量的隨機樣本作為候選變量,這個分裂點所用的預測變量只能從候選變量中選擇,在每個分裂點處都重新抽樣。最后,對所有預測值求平均,得到模型。隨機森林方法由于在訓練過程中引入了隨機性,所以能夠避免過擬合,且能夠處理高維數(shù)據(jù),訓練速度快。

對隨機森林模型預測效果影響顯著的參數(shù)需要進行調(diào)優(yōu),利用Python 的RandomForestRegressor 和GridSearchCV 函數(shù)進行模型參數(shù)的調(diào)優(yōu),包含的參數(shù)如表2 所示。

表2 各算法的最優(yōu)的參數(shù)估計 Table 2 Results of k-fold cross-validation

2.3.5 XGBoost

XGBoost 是一種改進的決策樹方法:每訓練一個決策樹模型,都會按照偏差來調(diào)整樣本的權重,通過不斷學習前一個決策樹的偏差,最終得到預測模型。利用Python 的XGBRegressor 和GridSearchCV 函數(shù)進行參數(shù)調(diào)優(yōu),包含的參數(shù)如表2 所示。

2.4 模型訓練及評價

將原始數(shù)據(jù)集拆分為訓練集、驗證集和測試集。

在訓練集和驗證集上,采用網(wǎng)格搜尋算法和k 折交叉驗證對模型進行訓練,得到模型最優(yōu)的參數(shù)估計。網(wǎng)格搜尋算法通過遍歷給定的參數(shù)組合來搜尋模型最優(yōu)的參數(shù)取值。對于每種參數(shù)取值,采用k 折交叉驗證對模型的效果進行評分:將樣本數(shù)據(jù)分為k 個子集,每次令一個子集作為驗證集,其余k-1 個子集作為訓練集;對于每種參數(shù)取值,執(zhí)行k 次模型訓練和驗證評分,以平均評分作為該參數(shù)取值下模型的最終評分(見圖1)。通過網(wǎng)格搜尋算法和k 折交叉驗證得到模型的最優(yōu)參數(shù)估計,進而在訓練集和驗證集的全部數(shù)據(jù)上進行訓練,從而得到最優(yōu)模型。

在測試集上評價模型表現(xiàn)。采用均方根誤差(RMSE)和均方根誤差的變異系數(shù)(CV-RMSE),作為模型預測效果的評價指標。RMSE 能夠綜合衡量預測值與實際值之間的偏差[14],CV-RMSE 可將預測誤差歸一化,是便于多個模型比較的無單位度量[15]。

圖1 數(shù)據(jù)集劃分及k 折交叉驗證示意 Figure 1 Data set and k fold cross-validation

3 模型調(diào)節(jié)參數(shù)

在訓練集和驗證集上采用網(wǎng)格搜尋法和k 折交叉驗證進行參數(shù)的優(yōu)化,得到每種算法的最優(yōu)的參數(shù)估計,如表2 所示。

4 模型對比分析

4.1 預測精度

4.1.1 車站通風空調(diào)系統(tǒng)

分別采用最小二乘回歸、嶺回歸、Lasso 回歸、隨機森林、XGBoost 算法,建立地下車站通風空調(diào)系統(tǒng)能耗模型,將其預測值與測試集的實際值進行對比,如圖2 所示??梢园l(fā)現(xiàn),在全部模型中,XGBoost 模型在測試集上的能耗預測值更接近實際值,預測效果最好。

圖2 通風空調(diào)模型預測效果對比 Figure 2 Comparison on the prediction performance of VAC models

統(tǒng)計各算法在通風空調(diào)能耗數(shù)據(jù)測試集上的預測值與實際值,給出了各算法能耗預測效果的評價指標(見表3 和圖3)??梢钥闯觯魉惴ǖ木礁`差變異系數(shù)在5.1%~8.5%之間,均可達到工程應用的精度要求。其中,XGBoost 算法在預測精度上優(yōu)于其他算法,預測值的均方根誤差為20.5 kW·h,其他算法預測值的均方根誤差在30.3~33.8 kW·h 之間。

表3 各算法通風空調(diào)能耗預測效果的評價指標統(tǒng)計 Table 3 Evaluation indices of the VAC energy models

圖3 通風空調(diào)模型評價指標CV-RMSE Figure 3 CV-RMSE of VAC models

4.1.2 車站垂直交通系統(tǒng)

圖4 所示為各算法在垂直交通能耗數(shù)據(jù)上的預測值與實際值的對比。與通風空調(diào)模型類似,XGBoost算法在測試集上的能耗預測值更接近實際值,預測效果最好。

統(tǒng)計各算法在垂直交通能耗數(shù)據(jù)測試集上的預測值與實際值,模型評價指標如表4 和圖5 所示。可以看出,各算法的均方根誤差變異系數(shù)在5.4%~9.4%之間,均可達到工程應用要求的精度。其中,XGBoost算法在預測精度上明顯優(yōu)于其他算法,預測值的均方根誤差僅為1.9 kW·h;其次為隨機森林算法,預測值的均方根誤差為2.5 kW·h。

4.2 計算成本

圖4 垂直交通模型預測效果的對比 Figure 4 Comparison on the prediction performance of TRANS models

表4 各算法垂直交通能耗預測效果的評價指標統(tǒng)計 Table 4 Evaluation indices of the TRANS energy models

圖5 垂直交通模型評價指標CV-RMSE Figure 5 CV-RMSE of TRANS models

對比各算法的模型訓練所需的計算時間,結果如圖6 所示。最小二乘回歸、嶺回歸、Lasso 回歸的模型 調(diào)參簡單,計算成本較低。隨機森林和XGBoost 模型需要調(diào)整的參數(shù)較多,交叉驗證和網(wǎng)格搜尋需要的計算成本遠高于其他幾種方法,隨機森林算法訓練模型所需的計算時間約為415 s,而XGBoost 算法訓練模型所需的計算時間超過1 000 s。

圖6 各算法模型訓練的計算成本 Figure 6 Calculation costs of the data-driven methods

5 結語

筆者研究了最小二乘多元線性回歸、嶺回歸、Lasso 回歸、隨機森林、XGBoost 算法在地下車站通風空調(diào)和垂直交通能耗預測中的表現(xiàn),對比了各算法的預測精度和計算成本。結果顯示,對于地下車站通風空調(diào)和垂直交通的能耗預測,各算法的CV-RMSE都在10%以下,均可達到工程應用要求的精度。其中,XGBoost 算法在通風空調(diào)能耗預測中的CV-RMSE 僅為5.1%,在垂直交通能耗預測中的CV-RMSE 僅為5.4%,預測效果明顯優(yōu)于其他算法。從計算成本來看,最小二乘回歸、嶺回歸、Lasso 回歸的計算成本較低,隨機森林和XGBoost 模型這兩個基于樹的非線性模型需要調(diào)整的參數(shù)較多,交叉驗證和網(wǎng)格搜尋需要的計算成本遠高于其他幾種方法。綜合考慮計算成本和預測精度,在工程應用中推薦采用最小二乘多元線性回歸(精度可接受,計算成本最低),如對精度有較高要求,推薦采用XGBoost 算法(精度高,計算成本可接受)。

本研究介紹了能耗預測領域常用數(shù)據(jù)驅(qū)動算法的原理及各算法需要尋優(yōu)的參數(shù)。以地下2 層的標準車站為例,對比了多種基于數(shù)據(jù)驅(qū)動算法在通風空調(diào)和垂直交通系統(tǒng)能耗預測中的表現(xiàn),為工程應用中地下車站能耗預測模型的搭建和算法調(diào)參提供了方法參考。

猜你喜歡
預測值能耗通風
EnMS在航空發(fā)動機試驗能耗控制中的應用實踐
大直徑筒倉橫向通風設計的探討
煤礦通風不良的危害以及通風安全檢查項目
船舶機艙通風相關要求及常見關閉裝置分析
探討如何設計零能耗住宅
糧食入庫后不同通風方式探索
AI講座:ML的分類方法
自體熒光內(nèi)鏡對消化道腫瘤診斷臨床應用分析
水下飛起滑翔機
日本先進的“零能耗住宅”