王 峰,黃友能,何占元,徐田華, 唐 濤
(1.北京交通大學(xué) 電子信息學(xué)院,北京 100044;2. 朔黃鐵路發(fā)展有限責(zé)任公司,河北 滄州 062350;3. 北京交通大學(xué) 軌道交通控制與安全國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100044)
為滿足城市軌道交通運(yùn)營(yíng)效率不斷提升的需求,越來(lái)越多的城市軌道交通采用列車自動(dòng)運(yùn)行的方式。列車自動(dòng)運(yùn)行不僅能夠提高運(yùn)輸效率、降低司機(jī)勞動(dòng)強(qiáng)度,還可以減少由于人工誤操作對(duì)運(yùn)營(yíng)帶來(lái)的影響。列車自動(dòng)進(jìn)站停車是列車自動(dòng)運(yùn)行中的一個(gè)重要功能,而停車精度是列車在不影響運(yùn)營(yíng)安全的氣象條件下運(yùn)行時(shí),衡量列車自動(dòng)進(jìn)站過(guò)程中,是否滿足執(zhí)行列車車門和屏蔽門正常聯(lián)動(dòng)功能的最重要的觸發(fā)條件。
目前,學(xué)者對(duì)城軌列車自動(dòng)停車精度(Train Parking Error, TPE)的研究可總結(jié)為以下兩個(gè)方面:一是列車自動(dòng)進(jìn)站停車算法,主要采用的控制算法有經(jīng)典控制算法、參數(shù)自適應(yīng)控制算法、智能控制算法、集成智能控制算法[1-3],這些算法研究通常是從保證站間運(yùn)行時(shí)間、列車節(jié)能等角度開(kāi)展,但當(dāng)一條線路投入運(yùn)營(yíng)后,就不再調(diào)整算法。二是列車制動(dòng)閘瓦特性,城軌列車進(jìn)站停車過(guò)程中所需的制動(dòng)力,主要由電制動(dòng)提供,僅在速度低于3 km/h時(shí)才施加空氣制動(dòng)使列車停穩(wěn)。文獻(xiàn)[4-6]分析總結(jié)了國(guó)內(nèi)外閘瓦磨損規(guī)律和使用壽命,列車閘瓦的理論使用年限較長(zhǎng),可達(dá)7~9年。
可以看出,在城軌線路投入運(yùn)營(yíng)后,列車自動(dòng)進(jìn)站停車算法通常不再調(diào)整。同時(shí),從列車閘瓦理論使用年限來(lái)看,較長(zhǎng)時(shí)期內(nèi)不會(huì)更換閘瓦,但隨著列車運(yùn)行里程的增加,閘瓦的磨耗會(huì)導(dǎo)致列車制動(dòng)性能變化,影響到列車進(jìn)站停車算法中所依賴的參數(shù),從而導(dǎo)致進(jìn)站停不準(zhǔn)的情況發(fā)生。目前,針對(duì)此類問(wèn)題,維護(hù)人員每日對(duì)車載設(shè)備記錄的自動(dòng)進(jìn)站停車數(shù)據(jù)進(jìn)行分析,根據(jù)停車精度的偏移程度決定是否進(jìn)行維修調(diào)整,顯然這種方式效率較低、勞動(dòng)強(qiáng)度大。如果能夠預(yù)測(cè)列車自動(dòng)進(jìn)站停車精度的偏移情況,可指導(dǎo)維護(hù)人員依據(jù)其變化趨勢(shì)及時(shí)調(diào)整進(jìn)站停車算法中的參數(shù)配置,從而可以大大減少列車上線運(yùn)營(yíng)后由于停不準(zhǔn)引起的車門屏蔽門無(wú)法聯(lián)動(dòng)的問(wèn)題,對(duì)運(yùn)營(yíng)水平和維護(hù)效率的提高具有重要意義。
因此,本文提出一種停車精度預(yù)測(cè)方法,首先通過(guò)Weibull分布擬合各期停車精度的分布,進(jìn)而采用支持向量回歸(Support Vector Regression, SVR)模型對(duì)停車精度分布進(jìn)行預(yù)測(cè),最后以北京地鐵某條線一列車的停車精度數(shù)據(jù)對(duì)提出的模型進(jìn)行仿真驗(yàn)證。
圖1為停車精度預(yù)測(cè)的主要流程,主要包括以下幾個(gè)步驟:
Step1停車精度數(shù)據(jù)預(yù)處理。首先,給定歷史進(jìn)站停車精度數(shù)據(jù)庫(kù)后,依據(jù)現(xiàn)場(chǎng)維修需求,以單位時(shí)間均勻分割歷史數(shù)據(jù)為T期,每一期將作為一個(gè)分布樣本。
Step2擬合各期數(shù)據(jù)的分布。Weibull能夠表達(dá)多種分布,例如指數(shù)分布和正態(tài)分布等,具有很強(qiáng)的適應(yīng)性[7],在工程領(lǐng)域有著廣泛的應(yīng)用。因此,采用Weibull分布對(duì)每一期數(shù)據(jù)進(jìn)行擬合,每一期將得到兩個(gè)分布參數(shù)的估計(jì)值,即尺度參數(shù)和形狀參數(shù)。對(duì)各期數(shù)據(jù)進(jìn)行擬合后,得到兩個(gè)分布參數(shù)的時(shí)間序列,即有待構(gòu)建預(yù)測(cè)模型的兩個(gè)時(shí)間序列。
Step3預(yù)測(cè)模型的構(gòu)建與預(yù)測(cè)。在兩個(gè)時(shí)間序列基礎(chǔ)上,采用支持向量回歸算法分別構(gòu)建兩個(gè)時(shí)間序列預(yù)測(cè)模型,通過(guò)構(gòu)造的模型對(duì)下一期的分布情況進(jìn)行預(yù)測(cè)。
Step4分布的分析與應(yīng)用。通過(guò)分析下一期分布的參數(shù)和數(shù)字特征,如期望和方差等,可對(duì)下一期停車精度的情況作出評(píng)估,從而確定維修的必要性。
圖1 停車精度預(yù)測(cè)算法框架
Weibull 分布函數(shù)具有較好的適用性,在工程領(lǐng)域有著廣泛應(yīng)用[8]。因此,本文采用Weibull分布對(duì)停車精度數(shù)據(jù)進(jìn)行分布擬合。數(shù)據(jù)分期后,對(duì)各期停車精度分布數(shù)據(jù)進(jìn)行Weibull分布擬合,得到分布參數(shù)。
假設(shè)隨機(jī)變量X服從Weibull分布(隨機(jī)變量的觀察值是每期數(shù)據(jù)),則X的概率密度函數(shù)為
( 1 )
分布函數(shù)為
( 2 )
式中:α>0 為尺度參數(shù);β>0為形狀指數(shù)。其中,Weibull分布中兩個(gè)參數(shù)都與停車精度分布特征因子有關(guān)。α>0代表停車精度的分布的離散程度;β>0決定停車精度的偏度,是分析停車精度分布動(dòng)態(tài)的依據(jù)之一。
Weibull分布參數(shù)估計(jì)方法主要包括:最大似然估計(jì)法、矩估計(jì)法、線性回歸估計(jì)[9-10]。由于最大似然估計(jì)是一種簡(jiǎn)單有效的參數(shù)估計(jì)方法,本文采用最大似然法對(duì)Weibull分布的參數(shù)估計(jì)。
根據(jù)最大似然估計(jì)法,Weibull分布的最大似然函數(shù)可以表示為
L(x1,x2,…,xn;α,β)=
( 3 )
對(duì)上式兩邊取對(duì)數(shù)可得
lnL(x1,x2,…,xn;α,β)=
( 4 )
為求解上式的極大值,令?lnL/?α=0 和?lnL/?β=0,求解得到。即對(duì)以下二元一次方程組求解:
( 5 )
上述方程組可由數(shù)值解法求得參數(shù)α和β。
支持向量回歸在很多領(lǐng)域已有廣泛的應(yīng)用,取得了良好的效果。為了對(duì)下一期停車精度分布進(jìn)行預(yù)測(cè),以參數(shù)時(shí)間序列為基礎(chǔ),采用支持向量回歸構(gòu)建其預(yù)測(cè)模型。
文獻(xiàn)[11]提出一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化的統(tǒng)計(jì)學(xué)習(xí)算法,稱為支持向量機(jī)(Support Vector Machine, SVM)。目前SVM已在很多領(lǐng)域得到了廣泛應(yīng)用,除模式識(shí)別領(lǐng)域之外,有學(xué)者通過(guò)改變SVM的損失函數(shù),將其構(gòu)造為一種可用于回歸分析的算法,稱為支持向量回歸[12-13]。
支持向量回歸的核心思想可表述為:給定數(shù)據(jù)樣本集(x1,y1),…,(xm,ym)。為實(shí)現(xiàn)線性可分,通過(guò)構(gòu)造一個(gè)非線性映射φ(·)將樣本特征空間x映射到高維特征空間F。新特征空間F線性回歸表示如下
f(x)=w·φ(x)+bφ:Rn→Fw∈F
( 6 )
式中:b為偏置;w為回歸系數(shù)向量。與傳統(tǒng)的統(tǒng)計(jì)學(xué)習(xí)不同,SVR通過(guò)結(jié)構(gòu)風(fēng)險(xiǎn)最小化,來(lái)尋找一個(gè)合適的函數(shù)f。它能夠有效克服過(guò)擬合問(wèn)題,有良好的泛化能力。由于引入了ε-敏感損失函數(shù),結(jié)構(gòu)風(fēng)險(xiǎn)最小化可以表述如下
( 7 )
式中:C為懲罰因子;m為樣本數(shù)目;Θε(f(xi),yi)為ε-敏感損失函數(shù),數(shù)學(xué)描述如下
( 8 )
線性不可分時(shí),上述優(yōu)化問(wèn)題將得不到最優(yōu)解。因此,引入松弛因子ξ和ξ*,來(lái)保證解的存在性。SVR的原問(wèn)題可看作一個(gè)二次規(guī)劃問(wèn)題,形式如下
s.t. (w·φ(xi)+b)-yi≤ε+ξi
( 9 )
依據(jù)拉格朗日乘子法和對(duì)偶理論,可求得上述優(yōu)化問(wèn)題的對(duì)偶問(wèn)題,表述如下
(10)
式中:K(xi,xj)為核函數(shù),對(duì)偶問(wèn)題的結(jié)果依賴于核函數(shù)K(xi,xj)(i=1,2,…,l)和常數(shù)C。
核函數(shù)的不同決定了不同形式的SVR回歸模型。其中,常用的核函數(shù)有Sigmoid核函數(shù)、徑向基核函數(shù)(RBF)、線性核函數(shù)等。本文采用RBF構(gòu)建SVR模型為
K(x,xi)=exp(-γ‖x-xi‖2)
(11)
(12)
算法1給出了預(yù)測(cè)模型構(gòu)造及預(yù)測(cè)的詳細(xì)步驟,以下進(jìn)行闡述:
首先,以時(shí)間間隔τ(根據(jù)現(xiàn)場(chǎng)維修需求調(diào)研得到)對(duì)停車精度數(shù)據(jù)集D進(jìn)行劃分,得到T期原始數(shù)據(jù)分組。然后,分別對(duì)T期數(shù)據(jù)的每一期進(jìn)行處理:構(gòu)造精度數(shù)據(jù)Dt的原始分布Xt;歸一化原始分布Xt后,得到分布Yt;對(duì)Yt進(jìn)行Weibull分布擬合,估計(jì)出t期分布的參數(shù)αt,βt,即尺度和形狀參數(shù)。重復(fù)以上步驟,得到了各期Weibull分布的參數(shù)時(shí)間序列αt,βt,t=1,2,…,T。
在此基礎(chǔ)上,分割參數(shù)時(shí)間序列為訓(xùn)練序列αtrain,βtrain和測(cè)試序列αtest,βtest,并對(duì)SVR模型進(jìn)行訓(xùn)練得到預(yù)測(cè)模型Mα,Mβ。在預(yù)測(cè)階段,基于前幾期的參數(shù)序列,對(duì)下一期的分布參數(shù)進(jìn)行預(yù)測(cè),得到下一期的分布參數(shù)αp,βp;最后,可構(gòu)造出下一時(shí)期的停車精度分布,在反歸一化后計(jì)算得到下一時(shí)期精度分布的分布特征,期望和方差;以此對(duì)列車的停車狀況進(jìn)行分析。
圖2 停車精度預(yù)測(cè)算法步驟
算法1: 基于Weibull分布和SVR的停車精度預(yù)測(cè)
輸入變量:停車精度數(shù)據(jù)D,數(shù)據(jù)劃分時(shí)間間隔τ。
中間變量:各期精度數(shù)據(jù)Dt;原始分布Xt;歸一化后的分布Yt;參數(shù)時(shí)間序列αt,βt,t=1,2,…,T;訓(xùn)練序列αtrain,βtrain和測(cè)試序列αtest,βtest。
輸出結(jié)果:參數(shù)時(shí)間序列的預(yù)測(cè)模型Mα,Mβ。
(1)Dt←各期精度數(shù)據(jù):按照時(shí)間間隔τ對(duì)停車精度數(shù)據(jù)D進(jìn)行劃分。
(2)fort=1,2,…,Tdo
(3)Xt← 原始分布:通過(guò)經(jīng)驗(yàn)分布函數(shù)構(gòu)造方法對(duì)各期精度數(shù)據(jù)Dt進(jìn)行分布構(gòu)造。
(4)Yt← 歸一化分布:對(duì)原始分布Xt進(jìn)行歸一化操作,將分布值映射到[0,1]之間。
(5)αt,βt← Weibull分布參數(shù):通過(guò)對(duì)Yt進(jìn)行Weibull分布擬合,估計(jì)出各期分布的分布參數(shù)。
(6)end for
(7)αt,βt← 參數(shù)時(shí)間序列:由兩個(gè)參數(shù)按各期時(shí)間順序排列構(gòu)成。
(8)αtrain,βtrain和αtest,βtest←訓(xùn)練序列和測(cè)試序列:由兩個(gè)參數(shù)時(shí)間序列分割成得到。
(9)Mα,Mβ← 預(yù)測(cè)模型:由訓(xùn)練序列αtrain,βtrain作為SVR模型輸入,通過(guò)訓(xùn)練得到。
(10)αp,βp← 預(yù)測(cè)結(jié)果:通過(guò)將待測(cè)時(shí)間序列分別輸入對(duì)應(yīng)預(yù)測(cè)模型預(yù)測(cè)得到。
(11)Ynext← 通過(guò)預(yù)測(cè)得到的分布參數(shù)構(gòu)造出下一時(shí)期的分布。
(12)最后,對(duì)預(yù)測(cè)得到的分布進(jìn)行反歸一化并分析,如分布的期望和方差分析,進(jìn)而給出列車停車狀況的評(píng)估。
3.3.1 統(tǒng)計(jì)指標(biāo)
常用的預(yù)測(cè)模型的評(píng)價(jià)指標(biāo)有:平均相對(duì)誤差A(yù)RE和均方根誤差RMSE等[14]。因此,本文采用這兩種指標(biāo)對(duì)預(yù)測(cè)模型效果進(jìn)行評(píng)價(jià)
(13)
(14)
3.3.2 分布相似性度量指標(biāo)
為度量預(yù)測(cè)分布和真實(shí)分布的相似性,引入分布距離指標(biāo),然后基于分布距離構(gòu)造相似性指標(biāo)。這里采用常用的Hellinger距離(以下簡(jiǎn)稱H-距離)。H-距離是一種度量分布差異性的距離指標(biāo)[15-16]。它的定義可表述為,給定兩個(gè)離散概率分布P=[p1p2…pn]和Q=[q1q2…qn],這兩個(gè)分布的H-距離為
(15)
為了將分布差異性轉(zhuǎn)化為分布相似性,定義基于H-距離的分布相似性為
DS(P,Q)=1-H(P,Q)
(16)
若H(P,Q)越大,則分布P和Q的差異性越大。假設(shè)分布P和Q分別代表預(yù)測(cè)分布和真實(shí)分布,則DS(P,Q)值越大,表示預(yù)測(cè)分布越接近真實(shí)分布。
本文采用北京地鐵某條線一列車三年來(lái)的自動(dòng)進(jìn)站停車精度數(shù)據(jù),以間隔大于一年的兩期分布數(shù)據(jù)為例說(shuō)明停車精度變化情況。由圖3可以看出,t+10期后的停車精度分布有向左偏移的趨勢(shì);無(wú)論是停車精度分布的峰值(位置參數(shù)相關(guān))還是分布跨度(尺度因子相關(guān)),都有一定量的變化。
圖3 停車精度經(jīng)驗(yàn)分布的變化趨勢(shì)
針對(duì)北京地鐵某條線一列車自動(dòng)停車精度統(tǒng)計(jì)值進(jìn)行Weibull分布參數(shù)估計(jì),得到的結(jié)果見(jiàn)表1(依據(jù)經(jīng)驗(yàn),時(shí)間間隔τ取30 d)。
表1 停車精度Weibull分布參數(shù)
通過(guò)Weibull分布對(duì)8期停車精度數(shù)據(jù)進(jìn)行擬合得到圖4(橫坐標(biāo)和縱坐標(biāo)分別為精度值和其概率密度值(pdf))??梢钥闯?,從第t期到第t+7期的停車精度分布整體逐漸左移,且離散性變大。
圖5 尺度參數(shù)的實(shí)際值和預(yù)測(cè)值比較
圖5和圖6分別是尺度參數(shù)時(shí)間序列α和形狀參數(shù)時(shí)間序列β的預(yù)測(cè)結(jié)果??梢钥闯?,提出的預(yù)測(cè)模型能夠捕捉尺度參數(shù)和形狀參數(shù)的變化趨勢(shì),準(zhǔn)確地預(yù)測(cè)未來(lái)時(shí)期參數(shù)值。圖7通過(guò)對(duì)比預(yù)測(cè)參數(shù)下的精度分布和真實(shí)分布,定性地展示了預(yù)測(cè)的效果??梢钥闯?,停車精度分布的預(yù)測(cè)效果(歸一化后)能夠和原始各期分布基本吻合。
圖6 形狀參數(shù)的實(shí)際值和預(yù)測(cè)值比較
圖7 停車精度預(yù)測(cè)分布和真實(shí)分布對(duì)比
表2從統(tǒng)計(jì)角度,通過(guò)RMSE和ARE指標(biāo)評(píng)估了預(yù)測(cè)模型的表現(xiàn)效果,RMSE<0.09,兩個(gè)參數(shù)時(shí)間序列的預(yù)測(cè)效果較好,從而驗(yàn)證了預(yù)測(cè)模型的有效性。
表2 預(yù)測(cè)結(jié)果的統(tǒng)計(jì)指標(biāo)評(píng)價(jià)
圖8從分布相似性的角度(反歸一化后的預(yù)測(cè)結(jié)果與真實(shí)分布)給出了定量度量,預(yù)測(cè)分布和真實(shí)分布相似性的均值為0.953 3,驗(yàn)證了提出算法的有效性。
圖8 預(yù)測(cè)分布和真實(shí)分布的相似性度量
本文通過(guò)對(duì)各期列車自動(dòng)進(jìn)站停車精度數(shù)據(jù)進(jìn)行Weibull分布擬合,來(lái)描述各期列車自動(dòng)停車的狀態(tài)。進(jìn)而,取各期Weibull分布的特征參數(shù),即尺度參數(shù)和形狀參數(shù),來(lái)構(gòu)造兩個(gè)特征時(shí)間序列。在此基礎(chǔ)上進(jìn)行SVR模型訓(xùn)練,得到兩個(gè)預(yù)測(cè)模型。采用預(yù)測(cè)模型對(duì)新一期的停車精度的兩個(gè)特征參數(shù)進(jìn)行估計(jì),從而得到新一期的列車自動(dòng)停車精度的分布情況。通過(guò)北京地鐵某條線一列車自動(dòng)進(jìn)站停車精度數(shù)據(jù)的驗(yàn)證分析,說(shuō)明了本文提出的停車精度預(yù)測(cè)方法的有效性和準(zhǔn)確性。