張 巖
(中國鐵道科學(xué)研究院集團(tuán)有限公司 運(yùn)輸及經(jīng)濟(jì)研究所,北京 100081)
階段計(jì)劃是鐵路編組站作業(yè)指揮的核心環(huán)節(jié),其編制質(zhì)量直接關(guān)系到車輛在編組站的停留時(shí)間[1-2],進(jìn)而對列車運(yùn)行時(shí)間和鐵路總體運(yùn)輸能力產(chǎn)生影響[3-4]。鐵路編組站實(shí)際作業(yè)過程中存在著多種不確定性[5],已有學(xué)者以提高階段計(jì)劃的魯棒性為目標(biāo),研究不確定條件下編組站階段計(jì)劃的自動(dòng)生成方法,使階段計(jì)劃在不確定性事件的隨機(jī)擾動(dòng)下仍然保持最優(yōu)[6-7]。然而,列車晚點(diǎn)等異常突發(fā)事件使得階段計(jì)劃無法保持最優(yōu)性和持續(xù)可實(shí)施性,需要人工變更階段計(jì)劃后才能繼續(xù)執(zhí)行。鐵路編組站階段計(jì)劃調(diào)整研究方面,宋宇[8]從硬件結(jié)構(gòu)、軟件結(jié)構(gòu)、系統(tǒng)功能、系統(tǒng)流程4 個(gè)方面對編組站運(yùn)輸調(diào)度自動(dòng)化系統(tǒng)進(jìn)行設(shè)計(jì);牛惠民[9]給出了到發(fā)列車作業(yè)地點(diǎn)動(dòng)態(tài)調(diào)整方法;張明[10]設(shè)計(jì)了一種協(xié)調(diào)優(yōu)化編組站調(diào)機(jī)運(yùn)用和配流問題的模型;馬亮等[11]將計(jì)劃間沖突作為計(jì)劃變更的觸發(fā)條件之一,設(shè)計(jì)了計(jì)劃間沖突的檢測算法。在此,以作業(yè)數(shù)據(jù)實(shí)時(shí)反饋為基礎(chǔ),面向編組站整體階段計(jì)劃動(dòng)態(tài)最優(yōu)的目標(biāo),研究提出編組站階段計(jì)劃動(dòng)態(tài)調(diào)整方法。
鐵路編組站階段計(jì)劃動(dòng)態(tài)調(diào)整總體流程如圖1所示。編組站內(nèi)信息系統(tǒng)約每1 h 可以接收鐵路局集團(tuán)公司調(diào)度所更新的列車預(yù)計(jì)到達(dá)時(shí)間,基于歷史數(shù)據(jù)學(xué)習(xí)可預(yù)測專用線、貨場、車輛段取回待分解車列的到達(dá)時(shí)間,到達(dá)列車取下本務(wù)機(jī)后為到達(dá)車列,將到達(dá)車列和取回車列統(tǒng)稱為廣義到達(dá)車列。根據(jù)對歷史數(shù)據(jù)的機(jī)器學(xué)習(xí),結(jié)合實(shí)時(shí)作業(yè)信息預(yù)測到達(dá)技術(shù)作業(yè)、解體、編組和出發(fā)技術(shù)作業(yè)過程的所用時(shí)間,利用人工智能算法結(jié)合列車和車輛相關(guān)信息進(jìn)行車流動(dòng)態(tài)推算,獲得最優(yōu)的解體、編組順序和出發(fā)列車車流來源,為階段計(jì)劃調(diào)整提供依據(jù)。實(shí)時(shí)監(jiān)測站內(nèi)階段計(jì)劃的實(shí)施情況,基于作業(yè)過程用時(shí)預(yù)測和動(dòng)態(tài)車流推算獲得的解編順序,動(dòng)態(tài)計(jì)算各項(xiàng)作業(yè)的預(yù)計(jì)完成時(shí)間,每當(dāng)鐵路局集團(tuán)公司調(diào)度所給出的列車預(yù)計(jì)到達(dá)時(shí)間和本站預(yù)測的取回車列、技術(shù)作業(yè)、本務(wù)機(jī)作業(yè)和調(diào)機(jī)作業(yè)等預(yù)計(jì)完成時(shí)間變化時(shí),需要調(diào)用1 次動(dòng)態(tài)車流推算模塊計(jì)算1 次,獲得當(dāng)前最優(yōu)的配流方案,車站調(diào)度人員根據(jù)現(xiàn)場車輛、股道、調(diào)機(jī)和作業(yè)人員的實(shí)時(shí)作業(yè)信息,決策并實(shí)施階段計(jì)劃調(diào)整。階段計(jì)劃采用循環(huán)滾動(dòng)式調(diào)整規(guī)則,對時(shí)域數(shù)據(jù)進(jìn)行連續(xù)不斷的循環(huán)反復(fù)優(yōu)化,以此來達(dá)到整個(gè)時(shí)間段內(nèi)目標(biāo)的最優(yōu)化。
圖1 鐵路編組站階段計(jì)劃動(dòng)態(tài)調(diào)整總體流程Fig.1 Overall dynamic adjustment process of phase plan for railway marshalling station
1.2.1 數(shù)據(jù)預(yù)處理
為了確保動(dòng)態(tài)車流推算結(jié)果的準(zhǔn)確性,需要對到達(dá)技術(shù)作業(yè)、解體、編組和出發(fā)技術(shù)作業(yè)的作業(yè)過程用時(shí)進(jìn)行精準(zhǔn)預(yù)測。班組人員充足的編組站技術(shù)作業(yè)基本可以在30 min 以內(nèi)完成,但是具體作業(yè)過程用時(shí)無法實(shí)時(shí)掌握,需要通過歷史數(shù)據(jù)學(xué)習(xí)與實(shí)時(shí)數(shù)據(jù)采集,預(yù)測到達(dá)、出發(fā)作業(yè)過程用時(shí)。對排風(fēng)摘管、列檢、貨檢、試風(fēng)等各項(xiàng)到達(dá)、出發(fā)技術(shù)作業(yè)過程用時(shí)單獨(dú)進(jìn)行預(yù)測,總的到達(dá)、出發(fā)作業(yè)過程用時(shí)為各專業(yè)技術(shù)作業(yè)過程用時(shí)的最大值。解體作業(yè)的基本作業(yè)過程分為調(diào)機(jī)至到達(dá)場、連掛車列、推送車列至駝峰信號機(jī)、溜放分解。編組作業(yè)的基本過程分為調(diào)機(jī)至峰尾、平面調(diào)車連掛各車組、牽出車列至出發(fā)場。應(yīng)對每一個(gè)過程的作業(yè)過程用時(shí)進(jìn)行預(yù)測,疊加出最后總的解體、編組作業(yè)過程用時(shí)。
各項(xiàng)作業(yè)過程用時(shí)可利用機(jī)器學(xué)習(xí)方法進(jìn)行預(yù)測,預(yù)測模型建立前需要對數(shù)據(jù)進(jìn)行清洗,將各維屬性的數(shù)據(jù)類型處理為連續(xù)值或0-1 離散值。數(shù)據(jù)屬性預(yù)處理結(jié)果如表1 所示。對一個(gè)有d個(gè)可能取值的離散屬性,當(dāng)d>2 時(shí)離散值的差值沒有實(shí)際意義,需轉(zhuǎn)為d個(gè)取值為0 或1 的二值屬性。
表1 數(shù)據(jù)屬性預(yù)處理結(jié)果Tab.1 Preprocessing results of data attribute
1.2.2 數(shù)據(jù)降維
數(shù)據(jù)降維主要是通過保存相關(guān)性REL較大的屬性特征,降低數(shù)據(jù)屬性的維度。針對到達(dá)、出發(fā)技術(shù)作業(yè),分別計(jì)算排風(fēng)摘管、列檢、貨檢、試風(fēng)等基本作業(yè)過程的實(shí)際用時(shí)與各數(shù)據(jù)屬性之間的相關(guān)性。針對解體作業(yè),分別計(jì)算調(diào)機(jī)至到達(dá)場、連掛車列、推送車列至駝峰信號機(jī)、溜放分解等基本作業(yè)過程的實(shí)際用時(shí)與各數(shù)據(jù)屬性之間的相關(guān)性。針對編組作業(yè),分別計(jì)算調(diào)機(jī)至峰尾、平面調(diào)車連掛各車組、牽出車列至出發(fā)場等基本過程的實(shí)際用時(shí)與各數(shù)據(jù)屬性之間的相關(guān)性。最后保留相關(guān)性系數(shù)較大的數(shù)據(jù)屬性,用于作業(yè)過程用時(shí)的預(yù)測模型訓(xùn)練,從而實(shí)現(xiàn)數(shù)據(jù)降維。
1.2.3 預(yù)測模型訓(xùn)練
針對編組站的各項(xiàng)基本作業(yè)過程進(jìn)行數(shù)據(jù)屬性降維后,需要分別訓(xùn)練各項(xiàng)基本作業(yè)過程用時(shí)的預(yù)測模型。首先進(jìn)行訓(xùn)練集和測試集的劃分,將80%的數(shù)據(jù)劃分到訓(xùn)練集,用作基于機(jī)器學(xué)習(xí)的預(yù)測模型訓(xùn)練,將20%的數(shù)據(jù)劃分到測試集。通過比較測試集合內(nèi)真實(shí)作業(yè)過程用時(shí)與預(yù)測作業(yè)過程用時(shí)的方差,來驗(yàn)證預(yù)測模型的效果。對于效果較差的模型,需要繼續(xù)采集增加訓(xùn)練數(shù)據(jù)來完善模型參數(shù)。
模型訓(xùn)練之前需要進(jìn)行數(shù)據(jù)歸一化,將數(shù)據(jù)取值范圍線性變換為[0,1]。具體歸一化方法如公式⑵ 所示。
作業(yè)過程用時(shí)預(yù)測神經(jīng)網(wǎng)絡(luò)模型如圖2 所示。排風(fēng)摘管、列檢、溜放分解等作業(yè)過程用時(shí)預(yù)測的神經(jīng)網(wǎng)絡(luò)模型包括輸入層、隱層和輸出層[13],隱層又可包括多層,選擇隱層數(shù)為1 的神經(jīng)網(wǎng)絡(luò)。設(shè)有m個(gè)輸入屬性,則輸入層節(jié)點(diǎn)數(shù)為m,隱層有n個(gè)節(jié)點(diǎn),輸出為1 個(gè)作業(yè)過程用時(shí)的預(yù)測值。
圖2 作業(yè)過程用時(shí)預(yù)測神經(jīng)網(wǎng)絡(luò)模型Fig.2 Neural network model for operation process time prediction
以包括m個(gè)元素的列向量X= [x1,x2,…,xm]T為特征向量樣本,即為數(shù)據(jù)降維后包括列車長度、車輛數(shù)、禁溜車數(shù)量和空車數(shù)量等數(shù)據(jù)屬性的輸入列向量。n行m列的矩陣W為輸入層到隱層的權(quán)重系數(shù)矩陣,n個(gè)元素的列向量B= [b1,b2,…,bn]T為輸入層到隱層的偏置向量,包含n個(gè)元素的行向量P= [p1,p2,…,pn]為隱層到輸出層的權(quán)重系數(shù)向量,數(shù)值c為隱層到輸出層的偏置值,f為ReLU,sigmoid,tansig,purelin 等激活函數(shù)。各單項(xiàng)作業(yè)過程用時(shí)預(yù)測輸出結(jié)果y的計(jì)算值如公式⑶ 所示。
[4][18] 費(fèi)昭珣:《東南亞國家的城市化進(jìn)程及其特征》,《東南亞研究》1999年第4期,第49-54頁。
激活函數(shù)選用ReLU 函數(shù),優(yōu)化器選用Adam算法[14],面向不同的作業(yè)過程用時(shí)分別對模型進(jìn)行多輪訓(xùn)練,并通過對隱層節(jié)點(diǎn)數(shù)量的調(diào)整后可獲得有效的模型。
1.3.1 動(dòng)態(tài)車流推算過程描述
基于作業(yè)過程用時(shí)的精準(zhǔn)預(yù)測可獲得精確的動(dòng)態(tài)車流推算模型,設(shè)廣義到達(dá)車列集合A= {a1,a2,…,ak}代表階段內(nèi)到達(dá)的車列和取回車列集合[6],按到達(dá)順序排列為a1,a2,…,ak,tai代表第i個(gè)到達(dá)車列ai的到達(dá)時(shí)刻,k代表階段內(nèi)到達(dá)車列總數(shù),T i到 和T i解 分別代表ai的到達(dá)作業(yè)過程總體用時(shí)和解體作業(yè)過程總體用時(shí);出發(fā)列車集合D= {d1,d2,…,dl}代表階段內(nèi)出發(fā)的列車集合,按出發(fā)順序排列為d1,d2,…,dl,tdj為本階段內(nèi)第j列出發(fā)列車dj的出發(fā)時(shí)刻,l代表階段內(nèi)出發(fā)列車總數(shù),T j編 和T j發(fā) 分別代表dj的編組作業(yè)過程總體用時(shí)和出發(fā)作業(yè)過程總體用時(shí)。
1.3.2 動(dòng)態(tài)車流推算模型約束條件
1.3.3 動(dòng)態(tài)車流推算模型目標(biāo)函數(shù)
首先應(yīng)明確編組站動(dòng)態(tài)車流推算模型求解的最優(yōu)化目標(biāo),可以為階段計(jì)劃兌現(xiàn)率最高或車輛在編組站的停留時(shí)間最短等。階段計(jì)劃兌現(xiàn)率高體現(xiàn)在所有列車都可以按時(shí)發(fā)車,在站停留時(shí)間短可以轉(zhuǎn)化為階段時(shí)間內(nèi)向區(qū)間發(fā)出列車包含的車輛最多[4]。設(shè)vij代表ai向dj配入的車數(shù),則模型的目標(biāo)函數(shù)可用公式 ⒁ 表示,以階段時(shí)間內(nèi)向區(qū)間發(fā)出的車數(shù)最多作為優(yōu)化目標(biāo)。
1.3.4 動(dòng)態(tài)車流推算模型求解算法
蟻群算法是解決旅行商問題的一種有效的人工智能算法,可以在規(guī)定時(shí)間內(nèi)尋找到NP 問題的滿意解[15-16]。傳統(tǒng)旅行商問題可描述為旅行商從一個(gè)城市出發(fā)經(jīng)過所有城市一次,如何選擇路徑使總行程最短,實(shí)質(zhì)是在一個(gè)帶權(quán)無向圖中找一個(gè)權(quán)值最小的哈密爾頓回路[17-18]??梢詫㈣F路編組站動(dòng)態(tài)車流推算模型求解問題抽象成帶權(quán)有向圖的最小權(quán)重路徑求解問題,將到達(dá)車列集合A= {a1,a2,…,ak}視為k個(gè)城市,螞蟻從當(dāng)前時(shí)刻可行的任意到達(dá)車列出發(fā),隨機(jī)選擇下一個(gè)時(shí)刻可行的城市,即到達(dá)車列,直至所有到達(dá)車列被選擇完畢,目標(biāo)是向區(qū)間發(fā)出的車數(shù)最多,即NUM最大。
編組站動(dòng)態(tài)車流推算模型求解算法流程如圖3所示。算法開始后需要初始化信息素矩陣,為每個(gè)到達(dá)車列之間弧上的信息素賦初始值,然后進(jìn)行循環(huán)迭代,迭代次數(shù)超過預(yù)定值或獲得收斂解時(shí)達(dá)到迭代停止條件,迭代結(jié)束,輸出包括解體順序的收斂解。進(jìn)入一個(gè)迭代過程后需要將全部螞蟻隨機(jī)放到當(dāng)前時(shí)刻可行的到達(dá)車列對應(yīng)的城市上,循環(huán)逐個(gè)為每個(gè)螞蟻根據(jù)隨機(jī)遷移規(guī)則尋找一個(gè)路徑,找出一個(gè)NUM值最大的最優(yōu)路徑后為所有城市間的路徑更新信息素,循環(huán)進(jìn)行下一次迭代。
圖3 編組站動(dòng)態(tài)車流推算模型求解算法流程Fig.3 Solution algorithm process for calculation model of dynamic vehicle flow distribution in marshalling station
模型求解算法流程中螞蟻應(yīng)用遷移規(guī)則隨機(jī)選擇下一個(gè)車列所用的隨機(jī)遷移規(guī)則如公式 ⒂所示。
模型求解算法中的倒數(shù)第2 步,更新所有路徑上的信息素時(shí)所用的信息素更新規(guī)則如公式 ⒃所示。
以利用高精度北斗定位人員作業(yè)手持終端、車號識別等技術(shù)對某編組站SAM 系統(tǒng)作業(yè)項(xiàng)目、作業(yè)股道、調(diào)機(jī)號、車次、車輛總數(shù)、開始時(shí)間、結(jié)束時(shí)間等數(shù)據(jù)進(jìn)行補(bǔ)強(qiáng)獲得的數(shù)據(jù)為例,利用公式 ⑴ 給出的殘差相關(guān)系數(shù)計(jì)算公式計(jì)算數(shù)據(jù)屬性與預(yù)測作業(yè)過程用時(shí)之間的相關(guān)性,進(jìn)行數(shù)據(jù)屬性降維分析,可以得到各項(xiàng)作業(yè)過程用時(shí)的主要影響因素。將解體作業(yè)中的溜放分解作業(yè)過程用時(shí)與數(shù)據(jù)屬性之間的殘差相關(guān)系數(shù)由大到小排列,根據(jù)公式 ⑴,溜放分解用時(shí)與各數(shù)據(jù)屬性間的殘差相關(guān)系數(shù)REL如圖4 所示。從圖4 可以看出,列車長度、車輛數(shù)、禁溜車數(shù)量、空車數(shù)量、解體鉤數(shù)與溜放分解作業(yè)過程用時(shí)存在較大的相關(guān)性。通過相關(guān)性計(jì)算還可得出編組作業(yè)中的平面調(diào)車連掛各車組的作業(yè)過程用時(shí)的主要影響因素包括車輛占用的股道數(shù)量、停放位置、車輛數(shù)量、車輛長度等。到達(dá)技術(shù)作業(yè)中的排風(fēng)摘管作業(yè)過程用時(shí)的主要影響因素包括作業(yè)班組、作業(yè)時(shí)刻、停放股道、列車長度、車輛數(shù)量、摘管數(shù)量等。出發(fā)技術(shù)作業(yè)中的貨檢作業(yè)過程用時(shí)的主要影響因素有作業(yè)班組、作業(yè)時(shí)刻、停放股道、列車長度、車輛數(shù)量等。
圖4 溜放分解用時(shí)與各數(shù)據(jù)屬性間的殘差相關(guān)系數(shù)RELFig.4 Residual correlation coefficients between humping decoupling time and data attributes
分別選取500 個(gè)到達(dá)、解體、編組和出發(fā)作業(yè)過程用時(shí)的樣本數(shù)據(jù)作為測試集,單組數(shù)據(jù)的預(yù)測誤差為預(yù)測值與真實(shí)值的絕對值除以真實(shí)值,測試集平均誤差為單組數(shù)據(jù)誤差的均值。選取樣本數(shù)量不同的訓(xùn)練集分別進(jìn)行訓(xùn)練,獲得各作業(yè)過程用時(shí)預(yù)測模型,預(yù)測模型的隱層節(jié)點(diǎn)數(shù)量如表2所示。
表2 預(yù)測模型的隱層節(jié)點(diǎn)數(shù)量 個(gè)Tab.2 Hidden layer node number of prediction model
不同樣本數(shù)量下測試集平均誤差變化趨勢如圖5 所示。隨著樣本數(shù)量的增加,各類作業(yè)過程用時(shí)的預(yù)測結(jié)果誤差均逐漸減小,當(dāng)樣本數(shù)量達(dá)到10 000 時(shí),到達(dá)、解體和出發(fā)作業(yè)過程用時(shí)的平均誤差小于21%,編組作業(yè)過程用時(shí)的平均誤差小于27%。
圖5 測試集平均誤差變化趨勢Fig.5 Average error variation tendency of test set
以3 級6 場布局的編組站為例,只針對上行出發(fā)列車計(jì)算階段計(jì)劃,設(shè)上行出發(fā)列車有15 組去向。上行出發(fā)場列車出發(fā)階段計(jì)劃根據(jù)階段到達(dá)車列情況編制,可消化全部到達(dá)車列。上行到達(dá)場階段內(nèi)到達(dá)的廣義到達(dá)車列數(shù)量為6 ~ 13 時(shí),利用蟻群算法對動(dòng)態(tài)車流推算模型進(jìn)行計(jì)算求解,蟻群算法信息素的重要度α= 0.7,啟發(fā)因子的重要度β= 0.7,信息素的蒸發(fā)系數(shù)ρ= 0.9。用i7 2.4GHz處理器和8G 內(nèi)存配置的計(jì)算機(jī)進(jìn)行求解,動(dòng)態(tài)車流推算算法計(jì)算時(shí)間變化趨勢如圖6 所示。在確保階段內(nèi)全部列車滿軸出發(fā)情況下,統(tǒng)計(jì)不同廣義到達(dá)列車數(shù)量的收斂解計(jì)算時(shí)間。在階段廣義到達(dá)車列數(shù)量小于13 時(shí),計(jì)算時(shí)間與到達(dá)車列數(shù)量之間存在線性的關(guān)系,算法可在3 s 以內(nèi)獲得最優(yōu)解,滿足階段計(jì)劃動(dòng)態(tài)調(diào)整的實(shí)時(shí)性需要。
圖6 動(dòng)態(tài)車流推算算法計(jì)算時(shí)間變化趨勢Fig.6 Calculation time variation tendency of dynamic vehicle flow distribution calculation algorithm
研究提出編組站階段計(jì)劃動(dòng)態(tài)調(diào)整系列方法,利用提出的數(shù)據(jù)預(yù)處理和相關(guān)性分析方法,獲得編組站到達(dá)、解體、編組和出發(fā)作業(yè)過程用時(shí)的主要影響因素,利用歷史數(shù)據(jù)機(jī)器學(xué)習(xí)訓(xùn)練獲得的神經(jīng)網(wǎng)絡(luò)模型可以較為精準(zhǔn)地預(yù)測作業(yè)過程用時(shí),提出的動(dòng)態(tài)車流推算求解算法可以在編組站調(diào)度指揮實(shí)際業(yè)務(wù)要求的時(shí)間內(nèi)獲得最優(yōu)的動(dòng)態(tài)車流推算方案,對于實(shí)現(xiàn)我國編組站階段計(jì)劃編制和調(diào)整的智能化、提高編組站整體作業(yè)效率具有現(xiàn)實(shí)意義。