文 超,李 津,李忠燦,智利軍,田 銳,宋邵杰
(1.西南交通大學(xué),交通運(yùn)輸與物流學(xué)院,成都 611756;2.中土集團(tuán)福州勘察設(shè)計(jì)研究院有限公司,福州 350013;3.中國國家鐵路集團(tuán)有限公司調(diào)度指揮中心,北京 100844;4.中國鐵路廣州局集團(tuán)有限公司調(diào)度所,廣州 510088)
鐵路調(diào)度指揮是鐵路運(yùn)營管理和列車運(yùn)行控制的中樞,擔(dān)負(fù)著組織指揮鐵路列車運(yùn)行和日常生產(chǎn)活動(dòng)的重要任務(wù)。列車調(diào)度員需要根據(jù)各種實(shí)時(shí)信息和預(yù)定的規(guī)則來實(shí)現(xiàn)相應(yīng)的調(diào)整目標(biāo),而基于調(diào)度員經(jīng)驗(yàn)的傳統(tǒng)人工為主的調(diào)度方法已經(jīng)難以適應(yīng)當(dāng)前復(fù)雜的運(yùn)輸組織需求。智能鐵路已成為世界鐵路發(fā)展的重點(diǎn)方向,智能行車調(diào)度是我國鐵路當(dāng)前及未來一定時(shí)期內(nèi)發(fā)展的關(guān)鍵技術(shù)。中國工程院“智能高鐵戰(zhàn)略研究(2035)”重大咨詢項(xiàng)目認(rèn)為:智能行車調(diào)度是我國智能高鐵中期(2021—2025)要實(shí)現(xiàn)的目標(biāo)[1]。為了保障鐵路運(yùn)輸服務(wù)的安全性、連續(xù)性、高效性與準(zhǔn)時(shí)性,亟需高效準(zhǔn)確的決策支持方法來提升調(diào)度員決策水平和效度。
實(shí)現(xiàn)海量數(shù)據(jù)可挖掘、設(shè)備狀態(tài)可診斷、行車安全可預(yù)警、復(fù)雜路網(wǎng)運(yùn)營變化可感知、發(fā)展趨勢可推斷、輔助決策可支撐,提升鐵路的智能決策水平,提高決策效度是智能鐵路亟待解決的關(guān)鍵科學(xué)問題,是“交通強(qiáng)國、鐵路先行”戰(zhàn)略的迫切需要和必然要求。數(shù)據(jù)科學(xué)及人工智能給解決鐵路運(yùn)輸組織大規(guī)模和實(shí)時(shí)性復(fù)雜決策支持問題帶來了新的契機(jī)。機(jī)器學(xué)習(xí)方法作為人工智能的核心,無需以先驗(yàn)知識為基礎(chǔ),而是從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律并構(gòu)造模型來逼近鐵路運(yùn)輸生產(chǎn)實(shí)際情況,已經(jīng)在鐵路運(yùn)輸領(lǐng)域凸顯了優(yōu)勢[2,3]。推理與推薦系統(tǒng)、計(jì)算機(jī)視覺、知識表達(dá)與模式識別等人工智能方法和技術(shù)已經(jīng)在我國鐵路運(yùn)輸安全、客票、旅客服務(wù)等領(lǐng)域取得了初步應(yīng)用。
列車調(diào)度調(diào)整一直以來都是制約調(diào)度指揮自動(dòng)化的瓶頸問題[4]。目前普遍認(rèn)為基于機(jī)器學(xué)習(xí)方法的調(diào)度決策方案比經(jīng)驗(yàn)決策和傳統(tǒng)數(shù)學(xué)優(yōu)化模型更具實(shí)用性和科學(xué)性[5,6],但當(dāng)前世界鐵路調(diào)度指揮智能化還有很長的路要走。加速機(jī)器學(xué)習(xí)方法在鐵路列車調(diào)度指揮中的應(yīng)用進(jìn)程,提高調(diào)度決策的智能化和自動(dòng)化水平,將有效助力我國鐵路行業(yè)發(fā)展。為全面梳理以機(jī)器學(xué)習(xí)方法在鐵路列車調(diào)度指揮中的研究現(xiàn)狀,明確未來研究的重點(diǎn)和方向,本文系統(tǒng)總結(jié)了近10 年來機(jī)器學(xué)習(xí)方法在鐵路列車調(diào)度調(diào)整方面的研究成果,以期為相關(guān)研究及發(fā)展實(shí)踐提供一定參考。
在列車實(shí)際運(yùn)行過程中,鐵路系統(tǒng)內(nèi)外部的各種隨機(jī)因素干擾,會(huì)導(dǎo)致列車運(yùn)行的實(shí)際狀態(tài)偏離預(yù)定值、運(yùn)行秩序紊亂的情況時(shí)有發(fā)生。列車調(diào)度員是管轄區(qū)段行車工作的統(tǒng)一指揮者,負(fù)責(zé)及時(shí)收集并分析晚點(diǎn)列車相關(guān)的各種信息,根據(jù)列車運(yùn)行態(tài)勢分析與評估列車晚點(diǎn)原因和狀態(tài),預(yù)測和估計(jì)列車晚點(diǎn)演化態(tài)勢,并根據(jù)經(jīng)驗(yàn)和規(guī)則制定相應(yīng)的列車運(yùn)行調(diào)整策略,組織列車盡快恢復(fù)正常運(yùn)行秩序。圖1 所示為鐵路列車調(diào)度調(diào)整的一般流程。
如圖1所示,列車調(diào)度員在進(jìn)行調(diào)度調(diào)整及制定列車運(yùn)行調(diào)整決策時(shí),需要以海量的列車運(yùn)行信息為基礎(chǔ)。圖2 所示為鐵路列車調(diào)度調(diào)整的數(shù)據(jù),鐵路列車運(yùn)行控制系統(tǒng)、行車安全監(jiān)控系統(tǒng)等調(diào)度指揮邊界接口系統(tǒng)(圖中①)采集并提供基礎(chǔ)數(shù)據(jù),提取列車運(yùn)行實(shí)時(shí)狀態(tài)、固定和移動(dòng)設(shè)備運(yùn)用狀態(tài)、列車運(yùn)行環(huán)境信息等調(diào)度決策信息(圖中②),上述信息被匯總到鐵路調(diào)度指揮系統(tǒng)(圖中③)供調(diào)度員決策使用。綜合分析、語義識別等方法已經(jīng)廣泛應(yīng)用于鐵路列車調(diào)度數(shù)據(jù)的獲取、篩選、聚合、可視化等數(shù)據(jù)融合過程[7-9]。
圖1 鐵路列車調(diào)度調(diào)整的一般流程
圖2 鐵路列車調(diào)度調(diào)整的數(shù)據(jù)
機(jī)器學(xué)習(xí)方法是實(shí)現(xiàn)人工智能的重要途徑,被廣泛應(yīng)用于多個(gè)領(lǐng)域,其核心目標(biāo)是使用算法來解析數(shù)據(jù),進(jìn)而基于數(shù)據(jù)模擬人類的學(xué)習(xí)、決策和預(yù)測行為。機(jī)器學(xué)習(xí)的主要研究內(nèi)容為讓機(jī)器自動(dòng)從數(shù)據(jù)中學(xué)習(xí)規(guī)則并不斷改善自身性能。根據(jù)學(xué)習(xí)策略的不同,機(jī)器學(xué)習(xí)方法一般可以分為有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)[10]。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域中一個(gè)新的研究方向,其概念源于模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)研究。
有監(jiān)督學(xué)習(xí)的數(shù)據(jù)集包含了樣本特征與標(biāo)簽,在訓(xùn)練過程中,需要選擇合適的函數(shù)模型,通過計(jì)算模型的預(yù)測值與真實(shí)值之間的誤差來優(yōu)化模型參數(shù)。常見的有監(jiān)督學(xué)習(xí)算法有線性回歸、邏輯回歸、支持向量機(jī)、支持向量回歸、隨機(jī)森林等。無監(jiān)督學(xué)習(xí)的數(shù)據(jù)樣本集僅包含特征,算法需要自行發(fā)現(xiàn)數(shù)據(jù)的模態(tài)來優(yōu)化模型。常見的無監(jiān)督學(xué)習(xí)算法有主成分分析、K 均值算法、關(guān)聯(lián)分析算法等。強(qiáng)化學(xué)習(xí)也稱為增強(qiáng)學(xué)習(xí),其算法通過與環(huán)境的交互來學(xué)習(xí)解決問題的策略,進(jìn)而達(dá)成回報(bào)最大化或?qū)崿F(xiàn)特定目標(biāo)。常見的強(qiáng)化學(xué)習(xí)算法有Q-learning、近端策略優(yōu)化算法等。近年來,學(xué)者們提出了大量先進(jìn)的深度學(xué)習(xí)算法,并在諸多領(lǐng)域取得了遠(yuǎn)超先前機(jī)器學(xué)習(xí)技術(shù)的分析效果,常見的深度學(xué)習(xí)算法有卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)等。
本文重點(diǎn)分析機(jī)器學(xué)習(xí)方法在調(diào)度調(diào)整三個(gè)主要方面的應(yīng)用研究,具體為:
(1)列車晚點(diǎn)狀態(tài)分析與評估。旨在評估和闡釋列車歷史運(yùn)行信息,使用數(shù)據(jù)聚合和數(shù)據(jù)挖掘技術(shù),幫助調(diào)度員了解列車運(yùn)行晚點(diǎn)的一般規(guī)律。
(2)列車晚點(diǎn)傳播預(yù)測。著重于運(yùn)用機(jī)器學(xué)習(xí)方法研究鐵路列車晚點(diǎn)的傳播過程,包括列車晚點(diǎn)狀態(tài)和恢復(fù)的預(yù)測。
(3)列車運(yùn)行調(diào)整智能化決策。綜合相關(guān)行車調(diào)度業(yè)務(wù)規(guī)則、機(jī)器學(xué)習(xí)算法和計(jì)算建模程序?qū)崿F(xiàn)調(diào)度決策的自動(dòng)制定。
通過對線路晚點(diǎn)規(guī)律的掌握,列車調(diào)度員可以在晚點(diǎn)發(fā)生時(shí)正確識別晚點(diǎn)恢復(fù)的關(guān)鍵影響因素,從而制定相應(yīng)的對策,實(shí)現(xiàn)列車延誤的快速消解。晚點(diǎn)狀態(tài)分析與評估是列車晚點(diǎn)預(yù)測及列車運(yùn)行調(diào)整的理論基礎(chǔ),其主要研究內(nèi)容為:基于鐵路列車運(yùn)行實(shí)績數(shù)據(jù),提取并分類統(tǒng)計(jì)列車晚點(diǎn)、初始晚點(diǎn)、連帶晚點(diǎn),運(yùn)用描述性統(tǒng)計(jì)、繪制分布曲線、關(guān)聯(lián)、聚類等方法探索數(shù)據(jù)蘊(yùn)含的規(guī)律,從宏觀上探明高速列車晚點(diǎn)分布的基本規(guī)律,如列車的晚點(diǎn)時(shí)空、時(shí)長分布規(guī)律等,并將這些規(guī)律應(yīng)用于列車運(yùn)行過程控制及晚點(diǎn)預(yù)測中,調(diào)度員可以根據(jù)列車在區(qū)間的歷史和實(shí)時(shí)狀態(tài)以及列車在后續(xù)車站、區(qū)間的晚點(diǎn)分布規(guī)律,對列車的運(yùn)行狀態(tài)進(jìn)行預(yù)判。
現(xiàn)代統(tǒng)計(jì)模型是最簡單和基本的統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法,也是晚點(diǎn)分析最常用的方法,其目的在于對數(shù)據(jù)進(jìn)行聚合和總結(jié),幫助調(diào)度員直觀地了解特定車站、列車或區(qū)間的晚點(diǎn)總體或詳細(xì)信息。描述性統(tǒng)計(jì)方法[11,12]、分布擬合[13,14]等都被應(yīng)用于晚點(diǎn)致因、晚點(diǎn)分布、連帶晚點(diǎn)的建模?;诹熊囘\(yùn)行實(shí)績數(shù)據(jù),對數(shù)正態(tài)分布、韋伯分布、伽馬分布等統(tǒng)計(jì)模型被用于擬合高速列車的晚點(diǎn)致因及影響列車數(shù)和影響總時(shí)間[15,16]。
為了挖掘深層次的列車晚點(diǎn)規(guī)律,一些更高級的機(jī)器學(xué)習(xí)方法被應(yīng)用于晚點(diǎn)分析中。Markovi?等[17]率先使用支持向量回歸建立列車晚點(diǎn)和鐵路系統(tǒng)的各種特征(基礎(chǔ)設(shè)施、時(shí)刻表和列車)的功能關(guān)系,旨在幫助調(diào)度員評估鐵路系統(tǒng)的各種變化對列車晚點(diǎn)的影響。Murali[18]基于模擬的列車晚點(diǎn)數(shù)據(jù),提出了一種晚點(diǎn)估計(jì)方法,該方法定義了列車晚點(diǎn)與列車組合、運(yùn)行參數(shù)和網(wǎng)絡(luò)拓?fù)渲g的函數(shù)關(guān)系。Lee 等[19]提出了基于機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的監(jiān)督?jīng)Q策樹方法,用于發(fā)現(xiàn)影響連帶晚點(diǎn)的關(guān)鍵因素,該模型由數(shù)據(jù)預(yù)處理與分析、決策樹構(gòu)建、關(guān)鍵晚點(diǎn)因子的分析、延遲時(shí)空拓?fù)浞治鏊膫€(gè)階段組成。Cerreto 等[20]使用KMeans 聚類方法識別了丹麥哥本哈根以北的一條高鐵線路周期性晚點(diǎn)模式,通過分析經(jīng)常性晚點(diǎn)列車的運(yùn)行規(guī)律,查找列車重復(fù)晚點(diǎn)原因。張琦等[21]提出了一種高速鐵路列車連帶晚點(diǎn)的特征識別方法,該方法綜合考慮了連帶晚點(diǎn)的實(shí)際值、預(yù)測值和影響值等因素,將列車晚點(diǎn)分為嚴(yán)重、潛在、消散、一般四種類型,提高了列車連帶晚點(diǎn)的辨識度。
列車的運(yùn)行過程是一個(gè)時(shí)變的過程,受到大量外界因素的干擾以及行車人員決策的雙重影響。列車晚點(diǎn)的分布具有較大的隨機(jī)性,但從歷史數(shù)據(jù)能夠挖掘相關(guān)設(shè)備、天氣、作業(yè)組織造成晚點(diǎn)的相應(yīng)概率是關(guān)鍵,這樣就能推導(dǎo)并形成列車在相關(guān)影響因素下的一般規(guī)律,從而為行車指揮提供一定的指導(dǎo)。由于概率統(tǒng)計(jì)模型多是基于單變量分析,且模型形式也比較簡單,因此其描述和預(yù)測性能往往很有限。目前,主要是運(yùn)用現(xiàn)代統(tǒng)計(jì)、聚類等機(jī)器學(xué)習(xí)方法研究列車晚點(diǎn)狀態(tài)分析與評估問題,未見神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等高級機(jī)器學(xué)習(xí)方法的應(yīng)用。
2.2.1 列車晚點(diǎn)傳播過程分析
晚點(diǎn)傳播預(yù)測是研究者非常關(guān)注的問題,其主要內(nèi)容為:根據(jù)列車的歷史和當(dāng)前運(yùn)行狀態(tài),通過研究事件和時(shí)間驅(qū)動(dòng)下列車晚點(diǎn)狀態(tài)的演化過程,預(yù)測列車未來在各站的到達(dá)/出發(fā)時(shí)刻以及區(qū)間運(yùn)行時(shí)間。準(zhǔn)確的晚點(diǎn)傳播預(yù)測可以幫助調(diào)度員更好地預(yù)判和估計(jì)列車運(yùn)行態(tài)勢、相關(guān)調(diào)度決策的預(yù)期效果、列車晚點(diǎn)可恢復(fù)的程度等,進(jìn)而通過制定合理的調(diào)度決策更高效地實(shí)現(xiàn)調(diào)整目標(biāo)。當(dāng)前列車晚點(diǎn)傳播預(yù)測的研究主要集中在晚點(diǎn)致因及持續(xù)時(shí)長預(yù)測、晚點(diǎn)狀態(tài)演化預(yù)測、晚點(diǎn)恢復(fù)預(yù)測等幾個(gè)方面,也是國內(nèi)外學(xué)者研究鐵路列車調(diào)度問題時(shí)最熱衷、成果產(chǎn)出最豐富的領(lǐng)域[22-24]。
晚點(diǎn)發(fā)展與列車運(yùn)行環(huán)境的影響密切相關(guān),晚點(diǎn)傳播的過程受到當(dāng)前列車的晚點(diǎn)程度、可利用的冗余時(shí)間以及調(diào)度工作人員采取的運(yùn)行調(diào)整策略三方面的影響。當(dāng)調(diào)度工作人員采取積極的運(yùn)行調(diào)整措施時(shí),可以有效地緩解晚點(diǎn)程度以達(dá)到晚點(diǎn)時(shí)長縮短甚至回歸正點(diǎn)狀態(tài)。
列車晚點(diǎn)傳播除了上述縱向傳播過程外,還同時(shí)具有橫向影響傳播特征。列車晚點(diǎn)狀態(tài)通過列車間的相互制約關(guān)系橫向傳播,前行列車的晚點(diǎn)導(dǎo)致后行列車的連帶晚點(diǎn)[14]。要研究晚點(diǎn)的傳播過程并實(shí)現(xiàn)晚點(diǎn)的預(yù)測,需要先探明列車狀態(tài)間的時(shí)空依賴關(guān)系,從已知列車運(yùn)行實(shí)績中建立晚點(diǎn)傳播模型,預(yù)測未來的晚點(diǎn)狀態(tài)。圖3(a)為列車狀態(tài)橫縱向影響的示意圖,圖中時(shí)刻t對應(yīng)的縱軸左邊是已經(jīng)兌現(xiàn)的運(yùn)行圖,列車n-1 在車站S2的晚點(diǎn)可能引起列車n-1 在S3、S4及以后各站的晚點(diǎn)(縱向傳播),也可能引起列車n及后行列車在各站的晚點(diǎn)(橫向傳播),此時(shí)需要根據(jù)列車n-1 及其前行列車的已知狀態(tài)去預(yù)測列車n-1 及其后行列車的晚點(diǎn)狀態(tài);圖3(b)中時(shí)間軸右側(cè)的晚點(diǎn)狀態(tài)預(yù)測需同時(shí)考慮其前方多狀態(tài)的影響,圖中箭頭為列車狀態(tài)的順向推導(dǎo)和演化,分別代表了列車晚點(diǎn)的橫向傳播和縱向傳播的迭代和推演過程。近年來,機(jī)器學(xué)習(xí)方法被廣泛應(yīng)用于捕捉列車間的相互制約關(guān)系、列車運(yùn)行狀態(tài)與運(yùn)行環(huán)境之間的關(guān)系、列車運(yùn)行時(shí)間-空間作用過程等研究中。
圖3 考慮多列車的列車運(yùn)行狀態(tài)時(shí)空依賴關(guān)系及晚點(diǎn)傳播過程預(yù)測
2.2.2 列車晚點(diǎn)影響預(yù)測
實(shí)現(xiàn)鐵路行車故障的影響預(yù)測將能夠?yàn)檎{(diào)度員預(yù)測列車晚點(diǎn)提供基礎(chǔ)依據(jù),可以幫助調(diào)度人員估計(jì)線路恢復(fù)正常運(yùn)行的時(shí)間,并適當(dāng)?shù)刂匦掳才帕熊囘\(yùn)行。Huang 等[25]提取了故障影響晚點(diǎn)列車運(yùn)行序列,運(yùn)用K-Means 聚類算法,根據(jù)故障的強(qiáng)度、發(fā)生時(shí)段及行車間隔將列車晚點(diǎn)故障聚類為4 個(gè)不同的類別,可以用于列車晚點(diǎn)致因的特征分類。Oneto 等[26]以意大利鐵路網(wǎng)實(shí)際維修記錄、外部天氣數(shù)據(jù)和運(yùn)營商的經(jīng)驗(yàn)為研究基礎(chǔ),應(yīng)用決策樹方法構(gòu)建了一個(gè)基于規(guī)則的故障恢復(fù)時(shí)間預(yù)測模型,該模型具有足夠的可解釋性,有助于列車調(diào)度員合理評估局部鐵路網(wǎng)絡(luò)的可用性。Zilko 等[27]利用非參數(shù)貝葉斯網(wǎng)絡(luò)建立了一個(gè)概率模型來估計(jì)鐵路中斷持續(xù)時(shí)間,該模型在很大程度上依賴于由歷史數(shù)據(jù)生成的因變量的經(jīng)驗(yàn)分布準(zhǔn)確性。為了適應(yīng)實(shí)時(shí)更新的信息,進(jìn)一步提出了基于Copula-Bayesian 網(wǎng)絡(luò)方法的故障時(shí)間預(yù)測模型[28],該模型通過建立中斷長度與各影響因素之間的依賴關(guān)系來產(chǎn)生準(zhǔn)確預(yù)測。湯軼雄等[29]以初始晚點(diǎn)時(shí)間、影響列車數(shù)、晚點(diǎn)致因?yàn)樽宰兞?,總晚點(diǎn)時(shí)間為因變量,運(yùn)用支持向量回歸模型實(shí)現(xiàn)了故障的晚點(diǎn)時(shí)長預(yù)測,能夠?yàn)檎{(diào)度員的調(diào)度決策提供行車故障可能持續(xù)時(shí)長的信息支持。綜上,在列車晚點(diǎn)致因分析方面,既有研究仍較為缺乏,沒有對不同致因類型引起的晚點(diǎn)影響進(jìn)行細(xì)分,缺乏不同類型晚點(diǎn)情況下的晚點(diǎn)狀態(tài)描述和晚點(diǎn)程度的量化標(biāo)準(zhǔn),需要應(yīng)用機(jī)器學(xué)習(xí)方法對晚點(diǎn)致因和不同類型初始晚點(diǎn)影響建模進(jìn)行進(jìn)一步研究,以推進(jìn)列車運(yùn)行精細(xì)化管理的實(shí)施。
2.2.3 列車晚點(diǎn)狀態(tài)演化預(yù)測
列車晚點(diǎn)狀態(tài)演化的預(yù)測,通常是以預(yù)測列車在車站到發(fā)時(shí)刻為突破口,基于列車運(yùn)行數(shù)據(jù)挖掘列車運(yùn)行狀態(tài)影響要素對列車運(yùn)行過程的作用,建立相應(yīng)的機(jī)器學(xué)習(xí)模型以實(shí)現(xiàn)列車運(yùn)行狀態(tài)的推演和預(yù)測。線性回歸方法被廣泛應(yīng)用于晚點(diǎn)預(yù)測問題建模,Wang 等[30]基于列車運(yùn)行歷史數(shù)據(jù)和實(shí)時(shí)信息建立了兩種線性回歸模型,使用列車在車站的出發(fā)時(shí)間估計(jì)列車晚點(diǎn)。Li 等[31]運(yùn)用參數(shù)回歸模型和非參數(shù)回歸模型預(yù)測了列車短時(shí)停站時(shí)間。Guo 等[32]將列車運(yùn)行看作是一系列的離散事件,基于京滬高速鐵路5個(gè)車站的運(yùn)行實(shí)績建立了晚點(diǎn)預(yù)測的線性回歸模型。近年來,支持向量機(jī)、隨機(jī)森林等機(jī)器學(xué)習(xí)模型被初步嘗試用來分析和預(yù)測晚點(diǎn)[17]。Kecman 和Goverde[33]運(yùn)用統(tǒng)計(jì)學(xué)習(xí)技術(shù),構(gòu)建了三種列車過程時(shí)間預(yù)測的全局模型:穩(wěn)健回歸、回歸樹模型和隨機(jī)森林模型,并基于線性回歸的魯棒性,對特定的列車、車站或區(qū)段的局部模型進(jìn)行了校準(zhǔn)。Pongnumkul等[34]以泰國國家鐵路六個(gè)月的列車歷史旅行時(shí)間數(shù)據(jù)為研究基礎(chǔ),使用最鄰近節(jié)點(diǎn)算法實(shí)現(xiàn)了晚點(diǎn)旅客列車到站時(shí)間預(yù)測,該模型的缺點(diǎn)是難以應(yīng)用于大型數(shù)據(jù)集。馬爾科夫模型和貝葉斯網(wǎng)是列車晚點(diǎn)狀態(tài)預(yù)測研究領(lǐng)域應(yīng)用最廣泛的方法。運(yùn)用基于列車運(yùn)行數(shù)據(jù)的馬爾科夫模型預(yù)測晚點(diǎn),其重點(diǎn)是狀態(tài)轉(zhuǎn)移矩陣的構(gòu)建[35],Barta 等[36]利用大量的歷史晚點(diǎn)數(shù)據(jù),提出了馬爾可夫鏈模型用以預(yù)測貨運(yùn)列車在連續(xù)車站的晚點(diǎn)情況。Gaurav 等[37]建立了一個(gè)N 階馬爾可夫晚點(diǎn)預(yù)測框架,使用隨機(jī)森林回歸和嶺回歸作為預(yù)測模型進(jìn)行了實(shí)驗(yàn)。Corman 等[38]構(gòu)建了列車晚點(diǎn)時(shí)間預(yù)測的貝葉斯網(wǎng)絡(luò)模型,實(shí)現(xiàn)了30 分鐘以內(nèi)的列車晚點(diǎn)時(shí)間預(yù)測,揭示列車運(yùn)行的動(dòng)態(tài)特性。Oneto 等[39]提出了一種基于深度極值機(jī)的列車晚點(diǎn)預(yù)測系統(tǒng)來預(yù)測晚點(diǎn),該系統(tǒng)考慮了外部天氣數(shù)據(jù)的影響。線性回歸、梯度提升回歸樹、決策樹、隨機(jī)森林等4種機(jī)器學(xué)習(xí)方法被用來預(yù)測考慮天氣影響下的列車晚點(diǎn),模型比較結(jié)果顯示隨機(jī)森林的預(yù)測精度最高[40]。在神經(jīng)網(wǎng)絡(luò)模型應(yīng)用方面,Yaghini 等[41]提出了一種高精度的人工神經(jīng)網(wǎng)絡(luò)模型來預(yù)測伊朗鐵路客運(yùn)列車的晚點(diǎn),并將3種不同的數(shù)據(jù)輸入方式及3 種體系結(jié)構(gòu)的預(yù)測結(jié)果與決策樹和多分類邏輯回歸等常用預(yù)測方法進(jìn)行了比較。Oneto等[42,43]將列車晚點(diǎn)預(yù)測映射為多元回歸問題,建立了一種基于前饋神經(jīng)網(wǎng)絡(luò)的極限學(xué)習(xí)機(jī)晚點(diǎn)預(yù)測模型,并進(jìn)一步通過引入外部天氣數(shù)據(jù)的影響以及閾值調(diào)整技術(shù)對模型進(jìn)行了改進(jìn)。張琦等[21]構(gòu)建了基于小波神經(jīng)網(wǎng)絡(luò)的列車連帶晚點(diǎn)預(yù)測模型,利用列車晚點(diǎn)波動(dòng)的線性組合方程及其結(jié)構(gòu)向量進(jìn)行列車連帶晚點(diǎn)影響值的量化。孫略添等[44]應(yīng)用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)對技術(shù)站列車晚點(diǎn)時(shí)間進(jìn)行精確預(yù)測,同時(shí)指出該方法適用于晚點(diǎn)歷史數(shù)據(jù)較多、大規(guī)模、對運(yùn)到期限要求較高的技術(shù)站。
近年來,深度學(xué)習(xí)方法被逐步應(yīng)用于列車晚點(diǎn)預(yù)測建模。Oneto 等[45]提出了基于機(jī)器學(xué)習(xí)方法的晚點(diǎn)預(yù)測系統(tǒng)Train Delay Prediction Systems(TDPS),該系統(tǒng)運(yùn)用大數(shù)據(jù)技術(shù)和深度極限學(xué)習(xí)機(jī)算法,集成了異構(gòu)數(shù)據(jù)源。通過從大量歷史列車運(yùn)行數(shù)據(jù)中提取信息,訓(xùn)練列車晚點(diǎn)預(yù)測模型,建立了基于數(shù)據(jù)驅(qū)動(dòng)的動(dòng)態(tài)列車晚點(diǎn)預(yù)測系統(tǒng)。根據(jù)列車運(yùn)行狀態(tài)更新訓(xùn)練數(shù)據(jù)集,TDPS 實(shí)現(xiàn)了列車運(yùn)行狀態(tài)的實(shí)時(shí)預(yù)測。Wen 等[46]基于列車運(yùn)行實(shí)績,長短記憶深度學(xué)習(xí)模型被用于預(yù)測列車晚點(diǎn)時(shí)間,挖掘列車運(yùn)行各要素對列車運(yùn)行的作用規(guī)律,開啟了深度學(xué)習(xí)用于列車晚點(diǎn)預(yù)測的研究。Huang 等[47]提出了一種結(jié)合三維卷積神經(jīng)網(wǎng)絡(luò)、長短期記憶神經(jīng)網(wǎng)絡(luò)和全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的深度學(xué)習(xí)方法,針對4條具有不同運(yùn)行特征的線路進(jìn)行了預(yù)測分析,結(jié)果表明該方法具有較高的精度和較強(qiáng)的魯棒性。
另外,列車晚點(diǎn)影響是晚點(diǎn)嚴(yán)重程度的重要度量指標(biāo)。建立晚點(diǎn)影響模型能夠有效地預(yù)測晚點(diǎn)的發(fā)生概率以及影響程度,可以協(xié)助列車調(diào)度員進(jìn)行晚點(diǎn)預(yù)測和判斷晚點(diǎn)傳播的影響范圍,從而制定合理的列車運(yùn)行調(diào)整方案。典型機(jī)器學(xué)習(xí)方法,如極端梯度提升被用來預(yù)測晚點(diǎn)影響列車數(shù)、支持向量回歸模型被用來預(yù)測晚點(diǎn)總影響時(shí)間,對武廣高鐵列車晚點(diǎn)影響的測試和驗(yàn)證表明模型能夠?yàn)檎{(diào)度員估計(jì)晚點(diǎn)影響,度量晚點(diǎn)嚴(yán)重程度提供依據(jù)[48]。
綜上,列車運(yùn)行晚點(diǎn)狀態(tài)的變化受到外界運(yùn)行環(huán)境和鐵路系統(tǒng)內(nèi)部各要素的綜合影響,是一個(gè)非常復(fù)雜的過程,列車運(yùn)行晚點(diǎn)預(yù)測所要考慮的要素眾多。一系列的統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法和以卷積神經(jīng)網(wǎng)絡(luò)、長短期記憶神經(jīng)網(wǎng)絡(luò)等為代表的高級機(jī)器學(xué)習(xí)方法已經(jīng)廣泛應(yīng)用于列車晚點(diǎn)時(shí)間的預(yù)測。已有研究建立了一套用于列車晚點(diǎn)預(yù)測的高級機(jī)器學(xué)習(xí)模型體系,經(jīng)過對不同線路、不同數(shù)據(jù)量情況下的模型驗(yàn)證發(fā)現(xiàn),高級機(jī)器學(xué)習(xí)方法取得了較好的晚點(diǎn)預(yù)測效果,但各類機(jī)器學(xué)習(xí)方法的適用條件和應(yīng)用情景、所考慮的列車運(yùn)行不同特征量、推廣可行性等還是值得深入研究的問題,還沒有得到通用性較好的模型和算法。更為重要的是,現(xiàn)有的研究主要是基于靜態(tài)數(shù)據(jù)的,沒有基于實(shí)時(shí)數(shù)據(jù)進(jìn)行列車晚點(diǎn)狀態(tài)動(dòng)態(tài)推演的高效算法。
2.2.4 列車晚點(diǎn)恢復(fù)預(yù)測
列車晚點(diǎn)恢復(fù)建模能夠幫助調(diào)度員掌握相關(guān)調(diào)度策略的晚點(diǎn)恢復(fù)效果、冗余時(shí)間利用情況等,實(shí)現(xiàn)對列車晚點(diǎn)恢復(fù)的預(yù)測,提高調(diào)度調(diào)整效果。列車晚點(diǎn)恢復(fù)建模的重點(diǎn)是建立冗余時(shí)間利用模型,難點(diǎn)是提取冗余時(shí)間的分布規(guī)律及冗余時(shí)間的利用效率,最大限度地利用冗余時(shí)間消解晚點(diǎn)。
Khadilkar[49]研究了晚點(diǎn)分布概率,通過分析歷史數(shù)據(jù)知印度鐵路平均晚點(diǎn)恢復(fù)率為0.13 min/km,并在晚點(diǎn)恢復(fù)模型中以此值表示晚點(diǎn)恢復(fù)的能力,但是這個(gè)平均值很難反映列車在每個(gè)區(qū)間、車站的晚點(diǎn)恢復(fù)能力,這將影響模型的預(yù)測能力。Yang 等[50]運(yùn)用統(tǒng)計(jì)方法建立了列車晚點(diǎn)期望模型,并提出了鐵路冗余時(shí)間沖突分配的方法。Steven 等[23]用統(tǒng)計(jì)模型分析了晚點(diǎn)列車的冗余時(shí)間利用情況,但在分析列車晚點(diǎn)恢復(fù)時(shí),假定了冗余時(shí)間利用率最大的理想情況。Jiang 等[51]基于武廣高鐵的列車運(yùn)行實(shí)績,比較了多類機(jī)器學(xué)習(xí)模型用于初始晚點(diǎn)恢復(fù)預(yù)測的效果,建立了有最佳效果的初始晚點(diǎn)恢復(fù)預(yù)測的隨機(jī)森林模型。?ahin等[52]使用從土耳其國家鐵路收集到的歷史數(shù)據(jù),建立了一個(gè)馬爾可夫鏈模型估計(jì)列車晚點(diǎn)傳播和恢復(fù)。Huang 等[53]基于武廣高鐵列車運(yùn)行數(shù)據(jù)建立了緩沖時(shí)間分配的數(shù)據(jù)驅(qū)動(dòng)模型;嶺回歸機(jī)器學(xué)習(xí)模型被用來解析考慮車站緩沖時(shí)間方案、區(qū)間緩沖時(shí)間方案、晚點(diǎn)嚴(yán)重程度等要素的列車晚點(diǎn)恢復(fù)規(guī)律;根據(jù)緩沖時(shí)間的利用率,該模型重新分配緩沖時(shí)間,為緩沖時(shí)間的優(yōu)化配置提供了新的解決思路。所提出的機(jī)器學(xué)習(xí)模型綜合考慮了運(yùn)行圖的執(zhí)行效果指標(biāo),如緩沖時(shí)間利用率和晚點(diǎn)概率等。Martin[54]提出了運(yùn)用預(yù)測推理和機(jī)器學(xué)習(xí)方法來提高鐵路系統(tǒng)可靠性,認(rèn)為運(yùn)用貝葉斯推理進(jìn)行晚點(diǎn)預(yù)測時(shí)可以考慮冗余時(shí)間的布局,但該研究并沒有闡釋具體方法應(yīng)用。胡雨欣等[55]以高速列車初始晚點(diǎn)時(shí)間、站停冗余時(shí)間和區(qū)間冗余時(shí)間等為變量,使用多層感知器和循環(huán)神經(jīng)網(wǎng)絡(luò)建立了高速列車晚點(diǎn)恢復(fù)時(shí)間預(yù)測機(jī)器學(xué)習(xí)模型,預(yù)測精度對比發(fā)現(xiàn)循環(huán)神經(jīng)網(wǎng)絡(luò)的效果要優(yōu)于多層感知器模型。
在采用機(jī)器學(xué)習(xí)方法研究冗余時(shí)間利用問題時(shí),需要使用大量的晚點(diǎn)恢復(fù)數(shù)據(jù)和冗余時(shí)間運(yùn)用數(shù)據(jù),而這些數(shù)據(jù)的獲得又有一定難度,因此,基于機(jī)器學(xué)習(xí)的列車晚點(diǎn)恢復(fù)預(yù)測研究仍較缺乏。挖掘不同晚點(diǎn)情景下的冗余時(shí)間恢復(fù)效率、基于冗余時(shí)間利用數(shù)據(jù)建立冗余時(shí)間利用與重布局的數(shù)據(jù)驅(qū)動(dòng)模型將是研究的重點(diǎn)方向。運(yùn)用機(jī)器學(xué)習(xí)方法建立車站及區(qū)間晚點(diǎn)時(shí)間恢復(fù)模型,探明車站、區(qū)間的冗余時(shí)間布局方案對于一定晚點(diǎn)的恢復(fù)能力具有重要的實(shí)際意義,有助于發(fā)現(xiàn)不同調(diào)度調(diào)整策略作用下列車運(yùn)行晚點(diǎn)恢復(fù)及效果,能夠?yàn)榱熊囘\(yùn)行調(diào)度決策提供決策支持。將列車運(yùn)行實(shí)績與列車調(diào)度命令數(shù)據(jù)結(jié)合、結(jié)構(gòu)化數(shù)據(jù)與半結(jié)構(gòu)化數(shù)據(jù)融合建模是提高列車晚點(diǎn)恢復(fù)決策和實(shí)現(xiàn)調(diào)度知識自動(dòng)化要解決的關(guān)鍵問題。
對于列車運(yùn)行調(diào)整決策問題的研究主要集中在列車運(yùn)行沖突消解、列車運(yùn)行計(jì)劃調(diào)整、動(dòng)態(tài)網(wǎng)絡(luò)調(diào)度等方面。國內(nèi)外既有研究主要集中于運(yùn)用數(shù)學(xué)優(yōu)化模型求解列車運(yùn)行沖突檢測及消解、運(yùn)行圖編制優(yōu)化問題[56,57],建立以最小晚點(diǎn)影響[58]、最小列車晚點(diǎn)時(shí)間[59]、最短列車運(yùn)行時(shí)間[60]等為優(yōu)化目標(biāo)的列車運(yùn)行調(diào)整模型,但這些模型必須在計(jì)算性能和解決方案質(zhì)量之間進(jìn)行權(quán)衡。同時(shí),由于列車運(yùn)行調(diào)整決策模型涉及的約束條件多、參數(shù)多、優(yōu)化目標(biāo)多,使得精準(zhǔn)建模和求解極為困難。列車運(yùn)行調(diào)整智能化決策研究的主要內(nèi)容如表1所示。
表1 列車運(yùn)行調(diào)整智能化決策研究的主要內(nèi)容
列車運(yùn)行調(diào)度調(diào)整過程常被作為馬爾科夫決策過程來處理,通過推導(dǎo)列車的運(yùn)行狀態(tài)變化規(guī)律得到可能的調(diào)度決策方案[61]。Dündar[62]基于調(diào)度人員在10 個(gè)工作日內(nèi)解決的331 個(gè)沖突記錄,建立了一個(gè)人工神經(jīng)網(wǎng)絡(luò)模型來模擬列車調(diào)度員進(jìn)行沖突消解。Oneto 等[63]以列車晚點(diǎn)和相關(guān)代價(jià)最小化為目標(biāo),研究了列車越行預(yù)測的問題,并基于隨機(jī)森林方法開發(fā)了一個(gè)混合預(yù)測模型。上述研究基于調(diào)度員歷史決策合理的假設(shè),著重于調(diào)度員歷史決策方案的再現(xiàn),沒有考慮到調(diào)度決策制定過程中眾多的動(dòng)態(tài)變化因素的影響,因此,其決策方案的優(yōu)化性能有限。強(qiáng)化學(xué)習(xí)結(jié)合了動(dòng)態(tài)規(guī)劃和監(jiān)督學(xué)習(xí)的原理,尤其適用于解決列車運(yùn)行調(diào)整問題。?emrov 等[64]提出了一種基于Qlearning 算法的單線鐵路列車運(yùn)行調(diào)整方法,其基本原理為:通過算法與環(huán)境交互,獲得并解釋其從環(huán)境中獲得增強(qiáng)信號,進(jìn)而選擇使所獲得的獎(jiǎng)勵(lì)之和最大化的動(dòng)作,并以此逐步生成合理的列車運(yùn)行調(diào)整方案,模型的獎(jiǎng)勵(lì)函數(shù)為使列車總晚點(diǎn)最小。Khadilkar[65]將該研究拓展到雙線鐵路上,并以印度鐵路網(wǎng)的兩條線路為例,驗(yàn)證了該算法在實(shí)際中的適用性,結(jié)果表明:這種方法可以在與啟發(fā)式方法相當(dāng)?shù)挠?jì)算時(shí)間內(nèi)處理大型調(diào)度問題實(shí)例,同時(shí)具有更好的實(shí)用性與決策質(zhì)量。模糊神經(jīng)網(wǎng)絡(luò)作為模糊理論和神經(jīng)網(wǎng)絡(luò)的融合,吸取了模糊邏輯和神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn),部分避免了兩者的缺點(diǎn)。Sun 等[66]通過對高速鐵路列車運(yùn)行控制程序的詳細(xì)分析,提出了一種基于模糊神經(jīng)網(wǎng)絡(luò)的列車運(yùn)行調(diào)整模型,并通過引入變步長的改進(jìn)BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)算法,完成了自適應(yīng)神經(jīng)網(wǎng)絡(luò)模糊推理系統(tǒng)的訓(xùn)練工作。Agent 方法作為一種解決動(dòng)態(tài)環(huán)境中不確定性問題的有力技術(shù),在交通系統(tǒng)領(lǐng)域的應(yīng)用正在迅速興起。Narayanaswami 等[67]提出了一種結(jié)合Agent 和無監(jiān)督學(xué)習(xí)方法的動(dòng)態(tài)調(diào)度模型,通過引入一個(gè)基于實(shí)時(shí)系統(tǒng)參數(shù)的動(dòng)態(tài)調(diào)度計(jì)算框架對模型進(jìn)行改進(jìn),并將其與混合整數(shù)線性規(guī)劃方法進(jìn)行比較。實(shí)驗(yàn)結(jié)果表明:Agent 算法在求解復(fù)雜鐵路網(wǎng)絡(luò)調(diào)度問題時(shí),其計(jì)算時(shí)間較精確的模型有很大的減少,體現(xiàn)出其在解決大規(guī)模復(fù)雜的調(diào)度問題方面的潛力。D-Agent 方法被用來研究沖突消解并支持調(diào)度員基于多源信息及異構(gòu)數(shù)據(jù)進(jìn)行列車沖突檢測,支持列車運(yùn)行調(diào)度決策[68,69]。
瑞士鐵路運(yùn)營公司在既有調(diào)度指揮系統(tǒng)的基礎(chǔ)上,自主研發(fā)了瑞士鐵路調(diào)度指揮控制系統(tǒng)(Railway Control System,RCS),與既有調(diào)度指揮系統(tǒng)形成功能上的兼容互補(bǔ),是目前最先進(jìn)的列車運(yùn)行與調(diào)度管理系統(tǒng)[70]。RCS 系統(tǒng)根據(jù)歷史運(yùn)行數(shù)據(jù)、當(dāng)前列車運(yùn)行狀態(tài)、列車運(yùn)行可能的運(yùn)行情景等對列車運(yùn)行進(jìn)行精確預(yù)測,并生成無運(yùn)行沖突的調(diào)度決策,該系統(tǒng)為瑞士提高路網(wǎng)利用效率和運(yùn)輸服務(wù)質(zhì)量做出了重要貢獻(xiàn)。這也讓世界看到了基于鐵路實(shí)時(shí)和歷史數(shù)據(jù),運(yùn)用機(jī)器學(xué)習(xí)實(shí)現(xiàn)調(diào)度決策知識自動(dòng)化、支持調(diào)度決策及列車運(yùn)行的應(yīng)用前景。
從上述研究分析可以看出,機(jī)器學(xué)習(xí)方法為鐵路列車運(yùn)行調(diào)整智能化決策提供了有效的解決渠道,已經(jīng)成為鐵路智能化調(diào)度決策研究的主要方法,將先進(jìn)的機(jī)器學(xué)習(xí)方法應(yīng)用于調(diào)度策略效果評估、調(diào)度決策知識自動(dòng)化仍然是研究的主要難點(diǎn)和關(guān)鍵,但目前利用機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)調(diào)度策略的優(yōu)選、智能化調(diào)度策略生成等的研究仍比較缺乏,構(gòu)建列車調(diào)度調(diào)整的自動(dòng)化知識庫,建立列車調(diào)度調(diào)整策略的推薦系統(tǒng),為調(diào)度員實(shí)時(shí)列車調(diào)度提供決策支持是亟待解決的問題。
綜上所述,機(jī)器學(xué)習(xí)方法已經(jīng)廣泛應(yīng)用于鐵路調(diào)度指揮領(lǐng)域,在晚點(diǎn)分析、預(yù)測分析、智能調(diào)度模型構(gòu)建等方面取得了較為豐碩的研究成果(見表2)。
表2 近十年機(jī)器學(xué)習(xí)方法在鐵路列車運(yùn)行調(diào)整領(lǐng)域研究文獻(xiàn)匯總
續(xù)表2
研究側(cè)重點(diǎn)和相關(guān)文獻(xiàn)的發(fā)表趨勢如圖4、圖5所示。
圖4 相關(guān)研究關(guān)鍵詞云
圖5 既有研究特征分析
通過對上述研究的回顧,可知機(jī)器學(xué)習(xí)應(yīng)用于鐵路列車調(diào)度調(diào)整問題的既有研究呈現(xiàn)以下特征及存在的問題:
(1)機(jī)器學(xué)習(xí)方法應(yīng)用于鐵路調(diào)度調(diào)整問題基于的數(shù)據(jù)以列車運(yùn)行計(jì)劃運(yùn)行圖、實(shí)際運(yùn)行圖為主,氣象數(shù)據(jù)、到發(fā)線運(yùn)用數(shù)據(jù)、設(shè)備故障數(shù)據(jù)等作為補(bǔ)充數(shù)據(jù)在部分研究中得以應(yīng)用并有效提高了模型精度。在既有研究中,相關(guān)數(shù)據(jù)不全面是主要的因素之一,比如有列車運(yùn)行數(shù)據(jù)而沒有設(shè)備運(yùn)用數(shù)據(jù)、有客流數(shù)據(jù)而沒有氣象數(shù)據(jù)等,所建立的模型存在較大的缺陷。
(2)從圖5(a)可以看出,機(jī)器學(xué)習(xí)方法在鐵路列車調(diào)度調(diào)整問題的研究呈現(xiàn)較為明顯的增長趨勢,尤其伴隨大數(shù)據(jù)技術(shù)和深度學(xué)習(xí)方法的快速發(fā)展,深度學(xué)習(xí)應(yīng)用于列車運(yùn)行晚點(diǎn)智能預(yù)測與列車運(yùn)行調(diào)整決策方面的成果已經(jīng)逐步顯現(xiàn),可以預(yù)期將有較為豐富的研究成果產(chǎn)出。
(3)從圖4 和圖5(b)可以看出,高速鐵路調(diào)度指揮是研究的重點(diǎn)領(lǐng)域、晚點(diǎn)預(yù)測是當(dāng)前的研究熱點(diǎn)問題,傳統(tǒng)機(jī)器學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)、大數(shù)據(jù)分析以及統(tǒng)計(jì)分析等方法已經(jīng)在既有研究中得到了廣泛的應(yīng)用。
(4)在列車晚點(diǎn)分析方面,機(jī)器學(xué)習(xí)方法(如關(guān)聯(lián)、聚類等)表現(xiàn)出較大的潛力[71],可以用于挖掘大數(shù)據(jù)中隱含的列車晚點(diǎn)機(jī)理,但當(dāng)前該領(lǐng)域的研究仍是以傳統(tǒng)統(tǒng)計(jì)分析為主導(dǎo),處理的數(shù)據(jù)也較為有限,運(yùn)用深度學(xué)習(xí)方法挖掘更大規(guī)模和高維度列車運(yùn)行相關(guān)復(fù)合數(shù)據(jù)的工作還有待加強(qiáng)。
(5)列車晚點(diǎn)致因及持續(xù)時(shí)長預(yù)測受到鐵路系統(tǒng)內(nèi)外部諸多因素的影響,需要針對不同的故障類型收集故障報(bào)告、天氣情況、相關(guān)調(diào)度命令等信息。受限于數(shù)據(jù)獲取及處理的難度,且目前設(shè)備故障數(shù)據(jù)、天氣數(shù)據(jù)等與列車運(yùn)行數(shù)據(jù)的粒度和采集間隔相差較大,增加了建模的難度,降低了模型的精度。
(6)現(xiàn)有運(yùn)用數(shù)學(xué)優(yōu)化方法和一般機(jī)器學(xué)習(xí)方法研究列車晚點(diǎn)狀態(tài)演化及時(shí)間的預(yù)測問題已經(jīng)很充分,運(yùn)用深度學(xué)習(xí)分析列車之間的相互作用關(guān)系并建立列車晚點(diǎn)精確預(yù)測模型,是列車晚點(diǎn)智能化預(yù)測領(lǐng)域新的研究趨勢。相關(guān)模型與算法在晚點(diǎn)預(yù)測方面雖然已經(jīng)體現(xiàn)了較好的性能,但列車分類型晚點(diǎn)傳播預(yù)測的研究還明顯偏少,相應(yīng)的標(biāo)志性成果還有待深化,預(yù)測不同程度晚點(diǎn)情況下的發(fā)展態(tài)勢從而輔助調(diào)度員的調(diào)度策略制定研究是當(dāng)前研究的短板。
(7)在列車運(yùn)行調(diào)整智能化決策方面,國內(nèi)外學(xué)者已經(jīng)提出了多種結(jié)合機(jī)器學(xué)習(xí)方法的模型解決調(diào)度優(yōu)化問題,但相關(guān)研究仍較為缺乏,將更多既有的高性能預(yù)測模型應(yīng)用于輔助決策系統(tǒng)構(gòu)建是下一步需要重點(diǎn)研究的內(nèi)容。既有研究的重點(diǎn)多是放在模型構(gòu)建和模擬驗(yàn)證上,還未有研究成果在實(shí)際應(yīng)用中部署和實(shí)施,如何將機(jī)器學(xué)習(xí)模型應(yīng)用于智能化調(diào)度指揮是亟待解決的難題。
“數(shù)據(jù)+算力+算法”引領(lǐng)的智能制造,帶來了工具革命,也帶來了以智能化提高決策科學(xué)性、精準(zhǔn)化為標(biāo)志的決策革命。通過人工智能等手段優(yōu)化決策的準(zhǔn)確性、及時(shí)性、科學(xué)性已成為重要?jiǎng)?chuàng)新途徑[72]。通過鐵路智能化提高鐵路運(yùn)輸組織效率、保障鐵路運(yùn)輸安全已成為各國鐵路發(fā)展的必由之路[73]。法國、德國、美國、加拿大、日本、韓國等國家鐵路相繼提出了數(shù)字化與智能化發(fā)展的戰(zhàn)略規(guī)劃。實(shí)現(xiàn)列車運(yùn)行態(tài)勢智能感知和沖突自動(dòng)消解,支撐調(diào)度智能化是世界智能鐵路發(fā)展的迫切需求。阿里研究院發(fā)布的《2020 年十大科技趨勢》中第一個(gè)趨勢是“人工智能從感知智能向認(rèn)知智能演進(jìn)”[74]。鐵路運(yùn)輸系統(tǒng)“智能+”決策革命是鐵路智能化發(fā)展的必然趨勢,結(jié)合鐵路行車組織理論、經(jīng)驗(yàn)和既有技術(shù),基于鐵路多源數(shù)據(jù),以數(shù)據(jù)科學(xué)、人工智能為主要手段的智能調(diào)度集中系統(tǒng),是實(shí)現(xiàn)鐵路行車組織理論和技術(shù)革新的有效途徑。
鐵路運(yùn)輸系統(tǒng)尤其是列車運(yùn)行過程是一個(gè)隨機(jī)+可控的系統(tǒng),從列車運(yùn)行實(shí)績及相關(guān)數(shù)據(jù)中探索并發(fā)現(xiàn)隨機(jī)干擾事件的發(fā)生概率、相關(guān)調(diào)度調(diào)整策略可能的效果是鐵路調(diào)度調(diào)整決策的關(guān)鍵問題。而機(jī)器學(xué)習(xí)方法尤其是以深度學(xué)習(xí)為代表的高級機(jī)器學(xué)術(shù)方法在挖掘大規(guī)模數(shù)據(jù)并發(fā)現(xiàn)其規(guī)律方面具有顯著優(yōu)勢,其在鐵路列車運(yùn)行調(diào)整領(lǐng)域還有大量工作要開展,如:
(1)引入多源異構(gòu)數(shù)據(jù)構(gòu)建機(jī)器學(xué)習(xí)模型。當(dāng)前大部分既有機(jī)器學(xué)習(xí)模型都是基于列車運(yùn)行所產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù)(如車站的到達(dá)和出發(fā)時(shí)間)構(gòu)建的。近年來隨著鐵路信息化建設(shè)的不斷發(fā)展,與列車運(yùn)行相關(guān)的大量數(shù)據(jù)也得到了有效的記錄和保存,其中包含了諸多不同來源的結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)。利用先進(jìn)的數(shù)據(jù)分析方法,完成各種類型數(shù)據(jù)的清洗與加工,基于多源異構(gòu)數(shù)據(jù)構(gòu)建不同預(yù)測目標(biāo)的機(jī)器學(xué)習(xí)模型是未來研究的重點(diǎn)。以列車運(yùn)行圖數(shù)據(jù)為基本數(shù)據(jù),考慮列車運(yùn)行所涉及的氣象、信聯(lián)閉設(shè)備、到發(fā)線運(yùn)用、車底運(yùn)用等數(shù)據(jù),將能夠挖掘更豐富的列車運(yùn)行規(guī)律,建立的列車運(yùn)行調(diào)度調(diào)整模型將更能貼近列車運(yùn)行實(shí)際,更好地指導(dǎo)調(diào)度指揮決策。
(2)列車晚點(diǎn)程度量化和分級能夠?yàn)檎{(diào)度員掌握全局運(yùn)輸態(tài)勢提供依據(jù)。研究列車晚點(diǎn)分級模型,確定列車晚點(diǎn)程度并實(shí)現(xiàn)不同程度晚點(diǎn)的預(yù)測將能夠提升鐵路調(diào)度調(diào)整的精細(xì)化水平。
(3)列車運(yùn)行晚點(diǎn)預(yù)測依然是研究的熱點(diǎn)和難點(diǎn)。高效準(zhǔn)確的預(yù)測是機(jī)器學(xué)習(xí)模型應(yīng)用于調(diào)度生產(chǎn)實(shí)際的關(guān)鍵所在,雖然當(dāng)前Boosting、Bagging 和Stacking 等典型集成學(xué)習(xí)技術(shù)已經(jīng)得到了較為廣泛的應(yīng)用,但不斷改進(jìn)算法、提升模型的計(jì)算能力和精度仍是一個(gè)重要的研究方向。列車運(yùn)行晚點(diǎn)分類預(yù)測對于提升調(diào)度決策水平具有重要意義,分別建立初始晚點(diǎn)、連帶晚點(diǎn)的預(yù)測模型,能夠輔助調(diào)度員根據(jù)一定的初始晚點(diǎn)制定合理的調(diào)度策略以盡可能控制連帶晚點(diǎn)及其影響程度和影響范圍。列車運(yùn)行晚點(diǎn)的實(shí)時(shí)預(yù)測是一個(gè)對模型抽象能力和求解速度要求很高的問題,需要不斷尋求能夠盡可能貼近運(yùn)輸生產(chǎn)實(shí)際的高效模型和算法。
(4)列車運(yùn)行調(diào)度調(diào)整自動(dòng)化是重要的發(fā)展趨勢。基于列車運(yùn)行數(shù)據(jù),建立列車運(yùn)行調(diào)度調(diào)整的數(shù)據(jù)驅(qū)動(dòng)模型,挖掘列車運(yùn)行調(diào)度調(diào)整的模式及自動(dòng)化知識,根據(jù)歷史、當(dāng)前及未來可能的運(yùn)輸態(tài)勢實(shí)現(xiàn)列車運(yùn)行調(diào)度策略的自動(dòng)優(yōu)選,將能夠輔助調(diào)度員的調(diào)度調(diào)整決策,提高列車運(yùn)行調(diào)度調(diào)整的決策質(zhì)量并逐步實(shí)現(xiàn)調(diào)度調(diào)整的自動(dòng)化。
(5)建立基于機(jī)器學(xué)習(xí)的鐵路調(diào)度調(diào)整智能化系統(tǒng)。以列車運(yùn)行相關(guān)歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)為基礎(chǔ),以基于機(jī)器學(xué)習(xí)的列車調(diào)度調(diào)整系列模型為底層模型,實(shí)現(xiàn)鐵路列車晚點(diǎn)可視化、晚點(diǎn)預(yù)測、晚點(diǎn)恢復(fù)、調(diào)度策略智能化優(yōu)選等?;跈C(jī)器學(xué)習(xí)的鐵路調(diào)度調(diào)整智能化系統(tǒng)將是我國鐵路智能調(diào)度的重要保障。
(6)探索高級機(jī)器學(xué)習(xí)方法的更多應(yīng)用。當(dāng)前機(jī)器學(xué)習(xí)方法在列車運(yùn)行調(diào)整智能化決策方面的應(yīng)用還較為有限,并且還有很多先進(jìn)的機(jī)器學(xué)習(xí)算法尚未使用或應(yīng)用不足,需要針對調(diào)度指揮工作實(shí)際需要,基于不同機(jī)器學(xué)習(xí)算法特性開發(fā)更多的模型與方法,并嘗試將其與既有鐵路調(diào)度系統(tǒng)相結(jié)合,盡可能貼近列車運(yùn)行實(shí)際過程,考慮盡可能多的因素,以提升鐵路調(diào)度指揮決策與控制自動(dòng)化水平,降低相關(guān)作業(yè)人員負(fù)荷,提高鐵路運(yùn)輸效率和服務(wù)質(zhì)量。
從大規(guī)模復(fù)雜路網(wǎng)建設(shè)過渡到精細(xì)化管理的網(wǎng)絡(luò)化運(yùn)營已是我國鐵路運(yùn)營的重要特征,實(shí)現(xiàn)海量數(shù)據(jù)可挖掘、設(shè)備狀態(tài)可診斷、行車安全可預(yù)警、復(fù)雜路網(wǎng)運(yùn)營變化可感知、發(fā)展趨勢可推斷、輔助決策可支撐,提升鐵路的智能決策水平,提高決策效度是智能鐵路亟待解決的關(guān)鍵科學(xué)問題。鐵路運(yùn)輸系統(tǒng)海量數(shù)據(jù)信源多樣,列車運(yùn)行過程中產(chǎn)生的大量列車運(yùn)行實(shí)際數(shù)據(jù)尚未被充分挖掘和運(yùn)用,鐵路列車運(yùn)行調(diào)整仍然是以個(gè)人經(jīng)驗(yàn)為基礎(chǔ)的人工決策為主。如何基于海量多源數(shù)據(jù),運(yùn)用數(shù)據(jù)科學(xué)和人工智能提升鐵路調(diào)度指揮決策的效度,提升決策水平、降低作業(yè)人員工作負(fù)荷是鐵路智能調(diào)度決策面臨的巨大挑戰(zhàn)。
本文全面回顧了近10年機(jī)器學(xué)習(xí)方法在鐵路列車運(yùn)行調(diào)整領(lǐng)域應(yīng)用的主要研究成果,將列車運(yùn)行調(diào)整問題分為列車晚點(diǎn)狀態(tài)分析與評估、列車晚點(diǎn)傳播預(yù)測和列車運(yùn)行調(diào)整智能化決策三個(gè)方面,分別總結(jié)和分析了機(jī)器學(xué)習(xí)方法在上述三方面問題的應(yīng)用情況??偨Y(jié)了既有研究的特征,并在此基礎(chǔ)上展望了機(jī)器學(xué)習(xí)方法在鐵路列車運(yùn)行調(diào)整研究方面的最新動(dòng)向。
機(jī)器學(xué)習(xí)方法能夠克服傳統(tǒng)數(shù)學(xué)模型難以應(yīng)用于生產(chǎn)實(shí)踐的問題,在當(dāng)前國家大數(shù)據(jù)戰(zhàn)略的驅(qū)動(dòng)下,基于機(jī)器學(xué)習(xí)的調(diào)度指揮自動(dòng)化系統(tǒng)必將為鐵路行車指揮決策提供有效支撐。近10年來機(jī)器學(xué)習(xí)方法在鐵路列車運(yùn)行調(diào)整方面的研究呈現(xiàn)較為明顯的增長趨勢,深度學(xué)習(xí)應(yīng)用于列車運(yùn)行晚點(diǎn)智能預(yù)測與列車運(yùn)行調(diào)整決策方面的成果已經(jīng)逐步顯現(xiàn)。高級機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的列車運(yùn)行調(diào)整智能決策理論以及列車運(yùn)行調(diào)整知識自動(dòng)化等智能化理論將是未來的發(fā)展重點(diǎn)。