呂歡歡,張玉召
基于機(jī)器學(xué)習(xí)的地鐵列車(chē)牽引能耗預(yù)測(cè)研究
呂歡歡,張玉召
(蘭州交通大學(xué) 交通運(yùn)輸學(xué)院,甘肅 蘭州 730070)
針對(duì)城市軌道交通運(yùn)營(yíng)管理過(guò)程中,準(zhǔn)確預(yù)測(cè)列車(chē)牽引能耗有利于合理編制運(yùn)營(yíng)組織模式和評(píng)價(jià)用能效率。針對(duì)影響列車(chē)牽引能耗的因素繁多,傳統(tǒng)的數(shù)學(xué)回歸方法難以保證預(yù)測(cè)效果的問(wèn)題,提出基于機(jī)器學(xué)習(xí)的牽引能耗預(yù)測(cè)方法,運(yùn)用支持向量回歸(SVR)和隨機(jī)森林回歸(RFR)2種機(jī)器學(xué)習(xí)方法建立列車(chē)牽引能耗預(yù)測(cè)模型。選取影響能耗的6種可變因素,分別從單個(gè)可變因素和多個(gè)可變因素對(duì)地鐵能耗的影響進(jìn)行分析;遍歷尋求最優(yōu)參數(shù)組合;利用RFR模型對(duì)地鐵牽引能耗的影響因素進(jìn)行重要度的排序,使影響因素的重要度得以量化描述;以北京地鐵昌平線(xiàn)真實(shí)運(yùn)行能耗數(shù)據(jù)為例進(jìn)行驗(yàn)證,研究結(jié)果表明:SVR與RFR都表現(xiàn)穩(wěn)定并能達(dá)到較高的預(yù)測(cè)精度。
城市軌道交通;牽引能耗預(yù)測(cè);支持向量回歸;隨機(jī)森林回歸;能耗影響因素
地鐵作為城市的重要公共交通之一,由于其速度快、運(yùn)量大、占地少等優(yōu)點(diǎn)在各大城市得到快速發(fā)展?,F(xiàn)階段城市地鐵網(wǎng)絡(luò)加速擴(kuò)展,其能耗也隨之攀升。地鐵能耗的主要構(gòu)成有車(chē)站設(shè)施設(shè)備運(yùn)營(yíng)能耗和列車(chē)運(yùn)行能耗,其中列車(chē)運(yùn)行過(guò)程中的牽引能耗占地鐵總能耗的一半以上。據(jù)統(tǒng)計(jì),北京市地鐵用電量從2010年至2017年一直呈上升趨勢(shì),其中列車(chē)牽引能耗電量占總能耗電量一半以上[1],如圖1所示。因此,地鐵牽引能耗預(yù)測(cè)這一研究備受關(guān)注。精準(zhǔn)、快速的預(yù)測(cè)地鐵牽引能耗有利于合理設(shè)置線(xiàn)路條件、編制運(yùn)輸組織模式,提高設(shè)備利用率,降低運(yùn)營(yíng)成本[2]。
圖1 北京地鐵2010~2017年?duì)恳碾娏口厔?shì)
地鐵牽引能耗量大,涉及影響因素眾多,國(guó)內(nèi)外眾多學(xué)者從不同角度、利用不同方法對(duì)能耗預(yù)測(cè)或節(jié)能運(yùn)行方面做了廣泛深入的研究,以提出更好的節(jié)能策略。Scheepmaker等[3?7]結(jié)合時(shí)刻表研究列車(chē)節(jié)能控制方法或建立節(jié)能優(yōu)化模型,提出優(yōu)化能源使用的決策或地鐵運(yùn)營(yíng)管理的節(jié)能方案。陳垚等[8]從列車(chē)屬性角度出發(fā),通過(guò)分析不同列車(chē)屬性對(duì)牽引能耗的影響程度,得出不同列車(chē)在不同線(xiàn)路節(jié)能的適用性。宋文婷等[9?11]通過(guò)分析列車(chē)牽引特性、線(xiàn)路運(yùn)行條件建立節(jié)能模型,綜合考慮了再生制動(dòng)儲(chǔ)能及線(xiàn)路運(yùn)行等條件,提出優(yōu)化速度曲線(xiàn)、機(jī)車(chē)操縱或新的調(diào)度方法,并得到了預(yù)期的節(jié)能效果。楊臻明等[12?13]通過(guò)分析歷史數(shù)據(jù)構(gòu)建多元線(xiàn)性回歸模型進(jìn)行能耗預(yù)測(cè)從而提出優(yōu)化運(yùn)營(yíng)調(diào)度、評(píng)價(jià)用能的依據(jù)。上述文獻(xiàn)對(duì)地鐵能耗預(yù)測(cè)研究和地鐵節(jié)能方面的研究,主要通過(guò)建立能耗解析模型、運(yùn)用仿真驗(yàn)證或分析歷史數(shù)據(jù)建立回歸模型等一些方法展開(kāi)研究。然而,地鐵牽引能耗過(guò)程復(fù)雜、實(shí)際運(yùn)行線(xiàn)路情況多變,影響牽引能耗的因素繁多且能耗與各因素之間呈非線(xiàn)性關(guān)系,采用以上方法可能會(huì)出現(xiàn)預(yù)測(cè)結(jié)果不夠精確或預(yù)測(cè)角度過(guò)于局限等問(wèn)題。為充分考慮列車(chē)牽引能耗的影響因素,更精準(zhǔn)地預(yù)測(cè)地鐵牽引能耗量,本文采用支持向量回歸(SVR)和隨機(jī)森林回歸(RFR)2種機(jī)器學(xué)習(xí)方法對(duì)地鐵能耗展開(kāi)預(yù)測(cè)。這2種方法可以有效解決高維度、非線(xiàn)性條件下的數(shù)據(jù)問(wèn)題,對(duì)數(shù)據(jù)集的適用范圍廣泛,數(shù)據(jù)集表現(xiàn)良好,不易出現(xiàn)過(guò)擬合現(xiàn)象,具有良好的準(zhǔn)確率。并且,利用RFR可以對(duì)所選地鐵牽引能耗的影響因素進(jìn)行重要度的排序,使影響因素的重要度得以量化,為運(yùn)營(yíng)組織工作的安排提供有力依據(jù)。
支持向量回歸(SVR)是以統(tǒng)計(jì)學(xué)為理論框架下的機(jī)器學(xué)習(xí)方法[14]。SVR的本質(zhì)是求解凸二次規(guī)劃問(wèn)題,其核心思想可以總結(jié)為以下幾點(diǎn):
1) SVR是專(zhuān)門(mén)針對(duì)有限樣本情況的,其目標(biāo)是得到現(xiàn)有數(shù)據(jù)下的最優(yōu)解而不僅僅是樣本數(shù)趨于無(wú)窮大時(shí)的最優(yōu)解;
2) SVR解決的是凸二次規(guī)劃問(wèn)題,本質(zhì)上來(lái)講得到的是全局最優(yōu)解;
3) SVR將實(shí)際非線(xiàn)性問(wèn)題轉(zhuǎn)化成高維度的特征空間,維數(shù)問(wèn)題得以解決,具有較廣的適用范圍。
支持向量回歸機(jī)的算法步驟歸納為:
1) 給定訓(xùn)練集
2) 選取適當(dāng)?shù)暮撕瘮?shù)(,′)以及適當(dāng)?shù)木?0和懲罰參數(shù)>0;
3) 構(gòu)造并求解凸二次規(guī)劃問(wèn)題
得解:
5) 構(gòu)造決策函數(shù)
隨機(jī)森林回歸(RFR)也是一種統(tǒng)計(jì)學(xué)理論機(jī)器學(xué)習(xí)方法。其最大優(yōu)勢(shì)在于它既可用于回歸又可用于分類(lèi),易得每個(gè)特征對(duì)預(yù)測(cè)的相對(duì)重要性[15]。隨機(jī)森林的本質(zhì)是通過(guò)創(chuàng)建隨機(jī)的決策樹(shù),并使用這些決策樹(shù)構(gòu)建較小的樹(shù),隨后組成多決策樹(shù)模型,本方法可以防止多數(shù)情況下的過(guò)擬合。RFR算法步驟歸納如下。
1) 設(shè)隨機(jī)參數(shù)向量為,采用bootstrap方法重采樣,產(chǎn)生個(gè)隨機(jī)訓(xùn)練集1,2,…,θ;從而生成對(duì)應(yīng)的個(gè)決策樹(shù){(,1),(,2)},…,{(, θ)};
2) 從維特征中選取個(gè)特征做當(dāng)前節(jié)點(diǎn)的分裂特征集,并以最好的分列方式對(duì)節(jié)點(diǎn)分裂;
3) 使每個(gè)決策樹(shù)最大限度生長(zhǎng),不進(jìn)行剪枝;
4) 假使一個(gè)新數(shù)據(jù)=,令權(quán)重向量為:ω(,);
5) 由給定的自變量=,得出單棵決策樹(shù)的預(yù)測(cè)值;
6) 由決策樹(shù)權(quán)重ω(,)取平均,得到每個(gè)觀(guān)測(cè)值的權(quán)重ω(),對(duì)所有單棵決策樹(shù)的觀(guān)測(cè)值得到隨機(jī)森林預(yù)測(cè)。
地鐵牽引能耗即地鐵列車(chē)在運(yùn)行過(guò)程中所消耗的電能。地鐵牽引能耗影響因素的分類(lèi)及其可變因素如表1所示[16]。
表1 地鐵牽引能耗影響因素的分類(lèi)及其可變因素
本文研究將提取影響牽引能耗的6種主要可變因素展開(kāi)預(yù)測(cè),提取的影響因素分別是:運(yùn)行時(shí)間,最大速度(與列車(chē)速度控制點(diǎn)有關(guān)),平均接觸網(wǎng)壓,運(yùn)行里程,變化坡度值(與坡度轉(zhuǎn)換點(diǎn)有關(guān)),列車(chē)重量(影響勢(shì)能變化)。
所用到的數(shù)據(jù)來(lái)源于實(shí)際的北京地鐵昌平線(xiàn)真實(shí)實(shí)驗(yàn)測(cè)試數(shù)據(jù),具體為包括精確到0.2 s的地鐵的實(shí)時(shí)速度,實(shí)時(shí)運(yùn)行距離,實(shí)時(shí)接觸網(wǎng)電壓,區(qū)間的限速,區(qū)間的坡度變化,采用的車(chē)輛類(lèi)型,車(chē)輛的重量等,最后是具體到每個(gè)區(qū)間運(yùn)行消耗的實(shí)際牽引能耗。
北京地鐵昌平線(xiàn)共包含12個(gè)站點(diǎn),11個(gè)區(qū)間,測(cè)試數(shù)據(jù)包含3個(gè)月內(nèi)接近1 000次區(qū)間的記錄數(shù)據(jù),如圖2所示為其中西二旗至生命科學(xué)園區(qū)間列車(chē)運(yùn)行情況。每個(gè)區(qū)間的記錄數(shù)在500~1 500左右,區(qū)間測(cè)試數(shù)據(jù)包含的部分信息如表2所示,每個(gè)區(qū)間的能耗匯總統(tǒng)計(jì)以下行方向?yàn)槔绫?所示。
提取列車(chē)在每個(gè)區(qū)間的運(yùn)行時(shí)間、運(yùn)行距離、最大速度和坡度變化值,對(duì)列車(chē)重量、區(qū)間供電網(wǎng)壓提取平均值,并對(duì)應(yīng)每個(gè)區(qū)間的能耗如表4所示。其中,坡度變化值的計(jì)算方法:
則整個(gè)區(qū)間的坡度變化值為:
式(7)中:SC代表區(qū)間的坡度改變值;i代表區(qū)間的運(yùn)行時(shí)間。
圖2 區(qū)間測(cè)試數(shù)據(jù)包含的部分信息
表2 原始數(shù)據(jù)中某一區(qū)間的數(shù)據(jù)信息(部分)
表3 昌平線(xiàn)某日測(cè)試的運(yùn)行時(shí)間與能耗數(shù)據(jù)
表4 提取變量的數(shù)據(jù)信息(部分)
為了挖掘各種影響因素與牽引能耗的關(guān)系,本文從單個(gè)因素,多個(gè)因素與牽引能耗關(guān)系的角度出發(fā),分別進(jìn)行分析。
首先,對(duì)單個(gè)影響因素與牽引能耗關(guān)系趨勢(shì)進(jìn)行分析,各分析結(jié)果如圖3~5所示。
1) 列車(chē)運(yùn)行時(shí)間與牽引能耗的變化趨勢(shì)散點(diǎn)圖如圖3所示。
圖3 運(yùn)行時(shí)間-能耗關(guān)系變化圖
牽引能耗隨著列車(chē)運(yùn)行時(shí)間呈周期性變化,在周期范圍內(nèi)隨著時(shí)間的增加能耗隨之下降。
2) 運(yùn)行距離與牽引能耗的變化趨勢(shì)圖如圖4所示。
牽引能耗隨著運(yùn)行距離呈周期性變化,在周期范圍內(nèi)隨著運(yùn)行距離的增加能耗隨之增加。
3) 坡度變化值與能耗的折線(xiàn)圖如圖5所示。
圖4 運(yùn)行距離-能耗關(guān)系變化圖
圖5 坡度變化值-能耗關(guān)系變化圖
牽引能耗隨著坡度值變化呈周期性變化,在周期范圍內(nèi)隨著坡度變換值的增加,能耗隨之增加。另外,列車(chē)運(yùn)行最大速度、列車(chē)質(zhì)量、平均網(wǎng)壓與能耗的關(guān)系變化趨勢(shì)在周期范圍內(nèi)隨著自身量的增加能耗也隨之增加。
其次,對(duì)多個(gè)影響因素與牽引能耗關(guān)系趨勢(shì)進(jìn)行分析,各分析圖示如圖6和7所示。得出地鐵牽引能耗與任意2個(gè)影響因素之間的關(guān)系復(fù)雜程度,由此可知能耗與眾多因素之間關(guān)系的復(fù)雜性,因此,本文充分考慮影響地鐵牽引能耗的主要可變因素,將其作為SVR和RFR的輸入,對(duì)列車(chē)牽引能耗進(jìn)行預(yù)測(cè)。
圖6 運(yùn)行時(shí)間-最大速度-能耗關(guān)系圖
圖7 最大速度-運(yùn)行距離-能耗關(guān)系圖
將現(xiàn)有數(shù)據(jù)隨機(jī)采樣,數(shù)據(jù)總量的80%作為訓(xùn)練,20%作為測(cè)試,并將訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,以便消除不同因素之間的數(shù)量級(jí)的影響,接著利用交叉檢驗(yàn)測(cè)試標(biāo)定模型參數(shù)。
利用支持向量回歸預(yù)測(cè)時(shí)需要標(biāo)定2個(gè)參數(shù),即核函數(shù),以及懲罰參數(shù)。核函數(shù)選擇綜合表現(xiàn)穩(wěn)定的徑向基(RBF)核函數(shù)用于測(cè)試集進(jìn)行測(cè)試,利用決策系數(shù)2進(jìn)行評(píng)價(jià)模型的泛化精度,訓(xùn)練過(guò)程如圖8所示。由圖中可以看出,當(dāng)懲罰參數(shù)增大到20左右時(shí),決策系數(shù)2增大到最大值,并保持穩(wěn)定,所以懲罰參數(shù)取20,核函數(shù)參數(shù)取徑向基函數(shù)(=1)。最后,用于測(cè)試的樣本實(shí)際值與預(yù)測(cè)值的比較如圖9所示,部分預(yù)測(cè)值與實(shí)際值對(duì)比數(shù)據(jù)如表5所示,由圖9和表5所示預(yù)測(cè)結(jié)果表明,在最優(yōu)參數(shù)條件下,能耗預(yù)測(cè)的平均誤差在2.1 kW?h左右收斂,SVR的預(yù)測(cè)精度達(dá)到96%(平均能耗46 kW?h,1-2.1/46*100%=96%)。
圖8 決策系數(shù)R2與懲罰參數(shù)C的變化過(guò)程
圖9 SVR的預(yù)測(cè)值與實(shí)際值比較圖
首先將提取的數(shù)據(jù)總量的80%作為訓(xùn)練集,數(shù)據(jù)總量的20%作為測(cè)試集,并進(jìn)行交叉檢驗(yàn)測(cè)試標(biāo)定參數(shù),提高生成模型的泛化精度。其中參數(shù)標(biāo)定過(guò)程:在隨機(jī)森林回歸算法中,需要標(biāo)定3個(gè)重要的參數(shù):決策樹(shù)數(shù)目(ntree),分裂屬性個(gè)數(shù)(mtry),葉節(jié)點(diǎn)最小樣本數(shù)(min sample leaf)。
表5 RFR實(shí)際值與預(yù)測(cè)值的對(duì)比(部分)
為驗(yàn)證隨機(jī)森林回歸算法的收斂性,將決策樹(shù)數(shù)目設(shè)置為0~1 000,其收斂過(guò)程如圖10所示,可知所測(cè)試的平均誤差是逐漸收斂的。同樣,從0~10遍歷分裂屬性個(gè)數(shù),如圖11所示,所測(cè)試的平均誤差也是收斂的。由于0~1 000棵數(shù)的遍歷時(shí)間較長(zhǎng),并且當(dāng)決策樹(shù)數(shù)目為100左右時(shí)誤差已經(jīng)收斂,進(jìn)如圖12所示測(cè)試100 組樣本,發(fā)現(xiàn)平均誤差收斂在2.3 kW?h附近。
圖10 決策樹(shù)數(shù)目的收斂過(guò)程
為使預(yù)測(cè)精度達(dá)到最優(yōu),需要標(biāo)定最優(yōu)的參數(shù)組合,采取的方法是枚舉遍歷的方法。通過(guò)枚舉,mtry:1-10的收斂情況,發(fā)現(xiàn)不同分裂屬性個(gè)數(shù)mtry參數(shù),誤差都能收斂。為使圖示看得清晰,選取收斂情況較好的參數(shù),如圖13所示為選取當(dāng)mtry=1,2和7時(shí)的收斂過(guò)程,可得最優(yōu)的mtry=2。同樣,遍歷不同的葉節(jié)點(diǎn)最小樣本數(shù),不同的葉節(jié)點(diǎn)參數(shù),誤差同樣能收斂如圖14所示為選取當(dāng)葉節(jié)點(diǎn)最小樣本數(shù)min leaf node=1,2,5和10時(shí)的收斂過(guò)程,可得最優(yōu)的min leaf node=2。
圖11 不同分裂屬性個(gè)數(shù)組別下的收斂過(guò)程
圖12 多組測(cè)試下平均的收斂過(guò)程
圖13 不同mtry下的收斂過(guò)程
圖14 不同葉節(jié)點(diǎn)下的收斂過(guò)程
用于測(cè)試的100個(gè)樣本的實(shí)際與預(yù)測(cè)值的比較如圖15所示,其中部分預(yù)測(cè)與實(shí)際對(duì)比數(shù)據(jù)如表6所示。
圖15 RFR的預(yù)測(cè)值與實(shí)際值比較圖
表6 RFR實(shí)際值與預(yù)測(cè)值的對(duì)比(部分)
由圖15和表6所示預(yù)測(cè)結(jié)果表明,遍歷得到的在最優(yōu)參數(shù)條件下,能耗預(yù)測(cè)的平均誤差在2.3 kW?h左右收斂,RFR預(yù)測(cè)精度達(dá)到95%(1-2.3/46* 100%=95%)。
利用選取最優(yōu)參數(shù)下的RFR訓(xùn)練算法對(duì)提取的6種因素進(jìn)行重要度排序,如圖16所示,得出影響區(qū)間牽引能耗的因素重要度依次為站間距離、站間最大速度、站間運(yùn)行時(shí)間、站間坡度變化值、平均供電網(wǎng)壓和車(chē)輛質(zhì)量。
圖16 各影響因素的重要度排序
最后,通過(guò)實(shí)際值與預(yù)測(cè)值的對(duì)比可以發(fā)現(xiàn),大部分預(yù)測(cè)結(jié)果與實(shí)際值相差較小,加之實(shí)驗(yàn)數(shù)據(jù)本身存在一些異常值,以及讀取的能耗的精度只在整數(shù)范圍,所以,預(yù)測(cè)結(jié)果已具備較高的預(yù)測(cè)精度。
1) 準(zhǔn)確預(yù)測(cè)城市軌道交通列車(chē)牽引能耗,對(duì)列車(chē)運(yùn)營(yíng)能耗評(píng)估與節(jié)能等有重要意義。影響地鐵牽引能耗的因素眾多,采用SVR和RFR的2種機(jī)器學(xué)習(xí)方法對(duì)地鐵能耗進(jìn)行預(yù)測(cè),可以有效處理多因素條件下的非線(xiàn)性關(guān)系問(wèn)題,避免過(guò)擬合現(xiàn)象。
2) 利用SVR和RFR 兩者都可以有效解決高維度和非線(xiàn)性難題,并較好的預(yù)測(cè)列車(chē)牽引能耗量。通過(guò)北京地鐵真實(shí)運(yùn)行能耗數(shù)據(jù)的實(shí)例驗(yàn)證,2種預(yù)測(cè)方法都表現(xiàn)良好,平均誤差收斂在2.3 kW?h左右。當(dāng)然,2種方法在預(yù)測(cè)精度和預(yù)測(cè)高效性具有各自的優(yōu)勢(shì)。從預(yù)測(cè)精度分析,SVR較RFR的預(yù)測(cè)精度略高,但是,利用RFR可以得出影響牽引能耗因素的重要度排序,這是RFR的一個(gè)突出優(yōu)勢(shì)。因?yàn)榱炕煌蛩氐闹匾潭?,有助于運(yùn)營(yíng)組織工作過(guò)程中,對(duì)牽引能耗的節(jié)能策略有較好的側(cè)重。
[1] 劉小玲, 薛亮. 城市軌道交通節(jié)能問(wèn)題研究[J]. 資源節(jié)約與環(huán)保, 2017, 23(1): 45?46. LIU Xiaoling, XUE Liang. Research on energy saving of urban rail transit[J]. Resource Conservation and Environmental Protection, 2017, 23(1): 45?46.
[2] González-Gil A, Palacin R, Batty P. Optimal energy management of urban rail systems: Key performance indicators[J]. Energy Conversion and Management, 2015, 90(1): 282?291.
[3] Scheepmaker Gerben M, Goverde Rob M P, Kroon Leo G. Review of energy-efficient train control and timetabling [J]. European Journal of Operational Research, 2017, 257(2): 355?376.
[4] YANG Songpo, WU Jianjun, YANG Xin, et al. Energy-efficient timetable and speed profile optimization with multi-phase speed limits: Theoretical analysis and application[J]. Applied Mathematical Modelling, 2018, 56(4): 32?50.
[5] 李佳杰, 柏赟, 邱宇, 等. 現(xiàn)代有軌電車(chē)時(shí)刻表與操縱節(jié)能協(xié)同優(yōu)化[J]. 鐵道科學(xué)與工程學(xué)報(bào), 2017, 14(7): 1552?1558. LI Jiajie, BAI Yun, QIU Yu, et al. Coordinated optimization of modern tram control and timetable for energy saving[J]. Journal of Railway Science and Engineering, 2017, 14(7): 1552?1558.
[6] YANG Xin, LI Xiang, NING Bin, et al. A survey on energy-efficient train operation for urban rail transit[J]. IEEE Transactions on Intelligent Transportation Systems, 2016, 17(1): 2?13.
[7] YANG Xin, LI Xiang, GAO Ziyou, et al. A cooperative scheduling model for timetable optimization in subway systems[J]. IEEE Transactions on Intelligent Transporta- tion Systems, 2013, 14(1): 438?447.
[8] 陳垚, 毛保華, 柏赟, 等. 列車(chē)屬性對(duì)城市軌道交通牽引能耗的影響及列車(chē)用能效率評(píng)價(jià)[J]. 中國(guó)鐵道科學(xué), 2016, 37(2): 99?105. CHEN Yao, MAO Baohua, BAI Yun, et al. Impact of train characteristics on traction energy consumption of urban rail transit and evaluation on train energy efficiency[J]. China Railway Science, 2016, 37(2): 99? 105.
[9] 宋文婷, 譚覓, 蔡文川, 等. 高速列車(chē)的節(jié)能操縱策略研究[J]. 鐵道科學(xué)與工程學(xué)報(bào), 2016, 13(3): 423?429. SONG Wenting, TAN Mi, CAI Wenchuan, et al. Research on energy-saving operation strategy for high-speed train[J]. Journal of Railway Science and Engineering, 2016, 13(3): 423?429.
[10] 曹佳峰, 劉斌. 基于2階段優(yōu)化的高速列車(chē)節(jié)能運(yùn)行仿真研究[J]. 鐵道科學(xué)與工程學(xué)報(bào), 2018, 15(4): 821?828. CAO Jiafeng, LIU Bin. Research on simulation for energy-saving operation of high-speed trains based on two-stage optimization[J]. Journal of Railway Science and Engineering, 2018, 15(4): 821?828.
[11] YANG Xin, CHEN Anthony, LI Xing, et al. An energy-efficient scheduling approach to improve the utilization of regenerative energy for metro systems[J]. Transportation Research Part C, 2015, 57(8): 13?29.
[12] 楊臻明, 岳繼光, 王曉保, 等. 基于回歸模型的城市軌道交通能耗預(yù)測(cè)[J]. 城市軌道交通研究, 2010, 13(12): 22?25. YANG Zhenming, YUE Jiguang, WANG Xiaobao, et al. Prediction of urban rail transit power consumption based on regression model[J]. Urban Mass Transit, 2010, 13(12): 22?25.
[13] 劉鵬, 田瓊. 城市軌道交通列車(chē)牽引能耗分析[J]. 山東科學(xué), 2012, 25(3): 7?11. LIU Peng, TIAN Qiong. Analysis of traction energy consumption of urban rail transit[J]. Shandong Science, 2012, 25(3): 7?11.
[14] 陳垚, 毛保華, 柏赟, 等. 基于支持向量回歸的地鐵牽引能耗預(yù)測(cè)[J]. 系統(tǒng)工程理論與實(shí)踐, 2016, 36(8): 2101?2107. CHEN Yao, MAO Baohua, BAI Yun, et al. Forecasting traction energy consumption of metro based on support vector regression[J]. Systems Engineering-Theory & Practice, 2016, 36(8): 2101?2107.
[15] 方匡南, 吳見(jiàn)彬, 朱建平, 等. 隨機(jī)森林方法研究綜述[J]. 統(tǒng)計(jì)與信息論壇, 2011, 26(3): 32?38. FANG Kuangnan, WU Jianbin, ZHU Jianping, et al. Review of research on random forest methods[J]. Statistics and Information Forum, 2011, 26(3): 32?37.
[16] González-Gil A, Palacin R, Batty P. A systems approach to reduce urban rail energy consumption[J]. Energy Conversion and Management, 2014, 80(4): 509?524.
Research on the prediction of traction energy-consumption of subway train based on machine learning
Lü Huanhuan, ZHANG Yuzhao
(School of Traffic and Transportation, Lanzhou Jiaotong University, Lanzhou 730070, China)
In the process of urban rail transit operation and management, a precise prediction of train traction energy-consumption is beneficial to the rational establishment of operation organization mode and evaluation of energy efficiency. However, the factors affecting the traction energy-consumption of trains are complex, and the traditional mathematical regression method is difficult to ensure the prediction effect. In this paper, a method for predicting traction energy-consumption based on machine learning was proposed. Two machine learning methods, Support Vector Regression (SVR) and Random Forest Regression (RFR), were utilized to establish the forecasting model of train traction energy-consumption. Firstly, six typical factors were selected. And, influences from both single and multiple factors were analyzed. Then, the optimal parameter combinations were searched with an enumerative method. In addition, the RFR model was utilized to rank the importance of factors influencing traction energy-consumption, so that the importance of the influencing factors can be quantified. Finally, the proposed method was verified by taking the real operation energy-consumption data of Beijing Metro Changping Line as an example. The results show that both SVR and RFR are stable and can achieve high prediction precision.
urban rail transit; traction energy-consumption prediction; support vector regression (SVR); random forest regression (RFR); energy-consumption influencing factor
U29-3
A
1672 ? 7029(2019)07? 1833 ? 09
10.19713/j.cnki.43?1423/u.2019.07.030
2018?10?10
國(guó)家自然科學(xué)基金資助項(xiàng)目(71761025);甘肅省高等學(xué)??蒲匈Y助項(xiàng)目(2018A-023)
張玉召(1981?),男,安徽碭山人,副教授,博士,從事軌道交通運(yùn)輸組織與優(yōu)化、客貨運(yùn)技術(shù)與管理研究;E?mail:yuzhaozhang@126.com
(編輯 蔣學(xué)東)