李 超,趙林海
(北京交通大學(xué) 電子信息工程學(xué)院, 北京 100044)
道岔作為鐵路線路的重要組成部分,通過轉(zhuǎn)轍機(jī)對道岔尖軌的推拉,實現(xiàn)道岔定位和反位的轉(zhuǎn)換、鎖閉與表示,以達(dá)到對列車運(yùn)行進(jìn)路的控制[1-2]。因此,道岔的工作狀態(tài)直接關(guān)系通過列車的運(yùn)行安全。目前,轉(zhuǎn)轍機(jī)表示缺口卡阻是道岔常見的故障模式之一,其會導(dǎo)致道岔失去位置表示,并使道岔轉(zhuǎn)轍機(jī)電機(jī)發(fā)生空轉(zhuǎn),從而危及行車安全[3-4]。
根據(jù)現(xiàn)場調(diào)研,見圖1,不同月份發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的數(shù)量并不相同,存在較大波動。這說明,不同月份發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的風(fēng)險并不一致。然而,現(xiàn)場目前“計劃修”模式下,各電務(wù)段實際分配到的維護(hù)資源,如維護(hù)人員、設(shè)備和維護(hù)天窗等卻是有限的[5-7]。如果不能合理分配這些維護(hù)資源,很容易導(dǎo)致兩種結(jié)果,即維護(hù)資源無法滿足當(dāng)月的維護(hù)需求,造成轉(zhuǎn)轍機(jī)表示缺口的“維護(hù)不足”和“維護(hù)滯后”;或維護(hù)資源冗余,造成人員、設(shè)備和維護(hù)天窗等維護(hù)資源的浪費(fèi),甚至引發(fā)設(shè)備的“過度維護(hù)”。
圖1 某電務(wù)段2016年各月發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障數(shù)
對此,若能預(yù)測未來各月轉(zhuǎn)轍機(jī)表示缺口卡阻故障發(fā)生風(fēng)險的高低,鐵路現(xiàn)場就可根據(jù)各月故障風(fēng)險的高低提前協(xié)調(diào)設(shè)備、人員、維護(hù)天窗等資源,并調(diào)整轉(zhuǎn)轍機(jī)表示缺口相關(guān)維護(hù)活動的月度維護(hù)計劃,從而避免轉(zhuǎn)轍機(jī)表示缺口的“過度維護(hù)”和“維護(hù)不足”問題。因此,研究轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險的預(yù)測方法具有十分重要的意義。
目前,對于轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險的預(yù)測,國內(nèi)外還沒有相關(guān)的研究報導(dǎo)。對于道岔事故風(fēng)險以及其他部件故障概率和風(fēng)險的相關(guān)預(yù)測研究也尚處于起步階段。其中,Wang等[8]針對由極端天氣,如雷暴、冰雹等造成的道岔外部部件故障,提出一種基于貝葉斯網(wǎng)絡(luò)的道岔設(shè)備故障頻次預(yù)測方法。Dindar等[9]針對由人為因素引發(fā)的道岔脫軌事故,提出一種基于貝葉斯網(wǎng)絡(luò)的道岔脫軌事故概率評估方法。Zhao等[10]則針對由鋼軌斷軌引發(fā)的脫軌事故,提出了一種基于LS故障風(fēng)險評價法[11]和故障分布建模的道岔脫軌事故風(fēng)險預(yù)測方法。
為此,本文首先基于鐵路現(xiàn)場的道岔維護(hù)記錄,對每月發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的風(fēng)險進(jìn)行量化和分級。而后,分析了影響每月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級的外部因素,構(gòu)建每月故障風(fēng)險預(yù)測特征向量。最后,基于CACC離散化方法[12]和隨機(jī)森林(Random Forest,RF)[13]構(gòu)建轉(zhuǎn)轍機(jī)表示缺口卡阻的故障風(fēng)險預(yù)測模型,實現(xiàn)對未來各月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級的預(yù)測。實驗表明,本文方法可較為準(zhǔn)確地預(yù)測轉(zhuǎn)轍機(jī)表示缺口卡阻的故障風(fēng)險等級,可為現(xiàn)場維護(hù)人員提前協(xié)調(diào)設(shè)備、人員、維護(hù)天窗等維護(hù)資源,調(diào)整相關(guān)維護(hù)活動的強(qiáng)度提供可靠參考。
當(dāng)?shù)啦磙D(zhuǎn)轍機(jī)一側(cè)尖軌與對應(yīng)基本軌密貼并完成鎖閉后,與該密貼尖軌對應(yīng)表示機(jī)構(gòu)中的表示塊將落入表示桿上的表示槽中,而落下的表示塊和表示槽間的空隙即為轉(zhuǎn)轍機(jī)表示缺口,見圖2。
圖2 轉(zhuǎn)轍機(jī)表示缺口的位置與轉(zhuǎn)轍機(jī)結(jié)構(gòu)
通常,轉(zhuǎn)轍機(jī)表示缺口的尺寸應(yīng)處于一個正常范圍內(nèi)[14],如(2±0.5) mm[3],以保證每次道岔動作結(jié)束后,相應(yīng)轉(zhuǎn)轍機(jī)表示機(jī)構(gòu)中的表示塊均能正常落入表示槽中,從而使相應(yīng)的表示接點組接通,給出道岔的位置表示。但是,若轉(zhuǎn)轍機(jī)表示缺口尺寸的變化超過上述正常范圍,或相關(guān)部件缺少潤滑發(fā)生卡阻,則道岔動作結(jié)束后,表示塊將無法正常落入表示槽中,導(dǎo)致表示電路無法正常接通,從而無法給出道岔位置表示,并引發(fā)轉(zhuǎn)轍機(jī)電機(jī)的空轉(zhuǎn),造成轉(zhuǎn)轍機(jī)表示缺口卡阻故障。
要實現(xiàn)轉(zhuǎn)轍機(jī)表示缺口卡阻故障的風(fēng)險等級預(yù)測,就必需首先量化不同月份轉(zhuǎn)轍機(jī)表示缺口發(fā)生卡阻故障的風(fēng)險高低,并對各月的故障風(fēng)險等級進(jìn)行劃分。為此,本文引入LS風(fēng)險評價法和k均值聚類方法[15]。
其中,LS風(fēng)險評價法是工業(yè)生產(chǎn)領(lǐng)域最常用的故障風(fēng)險評價方法之一[10],其核心思想是將故障風(fēng)險量化為故障情形出現(xiàn)的頻率與故障情形造成后果的乘積。故障情形出現(xiàn)的頻率越高且造成的后果越嚴(yán)重,故障情形對應(yīng)的風(fēng)險量化指標(biāo)便越高。k均值聚類則是一種無監(jiān)督的數(shù)據(jù)自動劃分方法,其具有實現(xiàn)簡單、速度快、解釋性強(qiáng)的特點,是當(dāng)前最流行、應(yīng)用最廣泛的聚類方法[16]。
因此,利用LS風(fēng)險評價法提供的風(fēng)險量化思路和k均值聚類可以簡單明了地量化各月發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的風(fēng)險,并在風(fēng)險量化結(jié)束后實現(xiàn)對各月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級的自動無監(jiān)督劃分。具體的流程如下:
首先,基于選定目標(biāo)電務(wù)段前4年的逐月道岔故障維護(hù)記錄,統(tǒng)計該段各月發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的數(shù)量,結(jié)果顯示該段共存在如表1所示的5種月故障情形。
表1 轉(zhuǎn)轍機(jī)表示缺口卡阻的月故障情形
而后,根據(jù)式(1)計算上述5種月故障情形在該段出現(xiàn)的頻率,并根據(jù)式(2)計算上述5種月故障情形造成的平均月線路延誤時長,結(jié)果見圖3。
圖3 目標(biāo)電務(wù)段4年內(nèi)月故障情形i的出現(xiàn)頻率及其造成的平均月線路延誤時長
Li=ni/48i∈[1,5]
( 1 )
Si=hi/nii∈[1,5]
( 2 )
式中:Li為4年內(nèi)發(fā)生月故障情形i的頻率;Si為月故障情形i導(dǎo)致的后果,也即月故障情形i造成的平均月線路延誤時長;ni為該段4年內(nèi)月故障情形i出現(xiàn)的次數(shù);hi為該段4年內(nèi)月故障情形為情形i的月份內(nèi),由轉(zhuǎn)轍機(jī)表示缺口卡阻故障引發(fā)線路延誤時長的總和。
其次,基于LS風(fēng)險評價法提供的風(fēng)險量化思路,將以上5種月故障情形的風(fēng)險量化為其出現(xiàn)頻率和其造成的平均月線路延誤時長的乘積,即有
Ii=Li×Sii∈[1,5]
( 3 )
式中:Ii為故障情形i的風(fēng)險量化指標(biāo)。
最后,基于式(3)計算的風(fēng)險量化指標(biāo)Ii,采用k均值聚類算法,將表1所列的5種月故障情形,按工業(yè)領(lǐng)域相關(guān)標(biāo)準(zhǔn)[17-18]劃分為4個風(fēng)險等級:
( 4 )
式中:|·|為求歐式距離。
( 5 )
Step4重復(fù)Step2、Step3,直到各類的聚類中心不再發(fā)生變化。
最終,基于以上4步聚類過程,對于選定的目標(biāo)電務(wù)段,本文將每月發(fā)生1到2起轉(zhuǎn)轍機(jī)表示缺口卡阻故障的情形合并為1類,制定出如表2所示的月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級劃分規(guī)則。
表2 月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級的劃分規(guī)則
根據(jù)現(xiàn)場調(diào)研和以往的研究報告[6,14,19],影響每月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級高低的外部因素可被總結(jié)為3類,即溫度、濕度和前期維護(hù)力度。
其中,溫度的影響主要體現(xiàn)在道岔金屬部件的熱脹冷縮上。月內(nèi)白天溫度越高,日間溫差越大,轉(zhuǎn)轍機(jī)表示缺口的相關(guān)部件,如表示桿,發(fā)生熱脹冷縮的概率就越大,從而轉(zhuǎn)轍機(jī)表示缺口尺寸就越容易超過標(biāo)準(zhǔn)導(dǎo)致轉(zhuǎn)轍機(jī)表示缺口卡阻故障。
濕度的影響則體現(xiàn)在轉(zhuǎn)轍機(jī)表示缺口相關(guān)部件的潤滑上??諝鉂穸鹊母叩蜁绊戅D(zhuǎn)轍機(jī)表示缺口相關(guān)部件上潤滑劑的濃稠程度。過高或過低的濕度都會降低轉(zhuǎn)轍機(jī)內(nèi)潤滑劑的潤滑性能,從而使得轉(zhuǎn)轍機(jī)表示缺口更容易發(fā)生卡阻。
前期維護(hù)力度是指上月現(xiàn)場維護(hù)人員維護(hù)轉(zhuǎn)轍機(jī)表示缺口的次數(shù)。若維護(hù)人員在上月進(jìn)行了充分且系統(tǒng)的維護(hù),則本月發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的風(fēng)險會相對降低。
根據(jù)2.1節(jié)分析,構(gòu)建第k月的故障風(fēng)險預(yù)測特征向量Fk,即
( 6 )
( 7 )
將目標(biāo)電務(wù)段前4年各月的轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級與當(dāng)月的風(fēng)險預(yù)測特征向量Fk串聯(lián)即可構(gòu)成本文的訓(xùn)練集DT,即
DT={[Fkgk]|k∈[1,nT]}
( 8 )
式中:nT為訓(xùn)練樣本數(shù);T為train的縮寫;gk為第k月轉(zhuǎn)轍機(jī)表示缺口卡阻故障的實際風(fēng)險等級,同時也是訓(xùn)練和驗證模型的類別標(biāo)簽;Fk為標(biāo)簽gk對應(yīng)的用于輸入模型的特征向量;向量[Fkgk]為一條完整的訓(xùn)練數(shù)據(jù)。
基于2.2節(jié)構(gòu)建的故障風(fēng)險預(yù)測特征向量,為實現(xiàn)對轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級的預(yù)測,本文進(jìn)一步引入了RF模型和CACC離散化方法。
其中,RF模型是一種由多個CART決策樹模型共同構(gòu)成的集成機(jī)器學(xué)習(xí)模型[13]。RF不但繼承了經(jīng)典的樣本自助采樣法[20],還引入隨機(jī)特征采樣。這使其在計算開銷小的同時,還擁有良好的泛化性能,可為如不平衡樣本的分類、超大維度樣本的分類和小樣本分類問題構(gòu)建較為準(zhǔn)確的分類器[21]。然而,已有的研究證明,當(dāng)樣本中同時混合有連續(xù)特征和離散特征時,RF模型通常傾向于挖掘連續(xù)特征包含的信息而無法良好地學(xué)習(xí)離散特征的內(nèi)在規(guī)律[22]。CACC離散化方法則是一種自適應(yīng)的數(shù)據(jù)離散化方法,主要用于在分類問題中實現(xiàn)對連續(xù)數(shù)據(jù)的分箱操作[23],以實現(xiàn)對數(shù)據(jù)離散化信息的濃縮,從而增強(qiáng)分類器的分類精度和分類速度,提高分類器對異常值的魯棒性。
因此,本文通過將CACC離散化方法引入RF模型來彌補(bǔ)RF模型在處理同時混合有連續(xù)特征和離散特征數(shù)據(jù)集時的不足,提高RF模型的魯棒性和分類精度,并最終構(gòu)建一套基于CACC-RF預(yù)測模型的轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級預(yù)測算法,其總體流程見圖4。
圖4 算法總體流程
由圖4可知,算法可被分為算法訓(xùn)練和算法預(yù)測2個部分。在算法訓(xùn)練部分,首先基于訓(xùn)練集生成CACC離散化斷點集,而后離散化訓(xùn)練集中的特征向量,最后基于離散化后的訓(xùn)練集,循環(huán)訓(xùn)練CART決策樹以構(gòu)建RF模型。在算法預(yù)測部分,首先基于算法訓(xùn)練部分生成的CACC離散化斷點集離散化預(yù)測數(shù)據(jù),而后利用訓(xùn)練好的RF模型,預(yù)測各月的轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級。
( 9 )
Step2生成離散化斷點候選集β,即
(10)
Step3設(shè)初始斷點數(shù)ql=1,全局CACC統(tǒng)計量Cg=0。構(gòu)建初始CACC離散化斷點集γ0
(11)
Step4對集合β中的每個βp,如果βp?γ0,則構(gòu)建集合γp
γp=γ0∪βp
(12)
Step5計算各集合γp的CACC統(tǒng)計量取值Cp,即
(13)
(14)
(15)
(16)
式中:max(·)表示求括號內(nèi)的最大取值;argmax(·)表示求使括號內(nèi)值取最大值的條件。
(17)
3.2.2 RF模型的生成
訓(xùn)練RF模型的過程包括以下8步:
Step1初始化決策樹數(shù)量r=0。初始化一個空集合T=?用于存儲RF模型。設(shè)置隨機(jī)森林要求的規(guī)模為R,隨機(jī)特征采樣數(shù)為W,葉結(jié)點最小樣本數(shù)為E。
(18)
(19)
(20)
(21)
(22)
(23)
式中:argmin(·)表示求使括號內(nèi)值取最小值的條件。
Step8令T=T∪Tr。判斷當(dāng)前決策樹數(shù)量r是否小于R。若r 基于算法訓(xùn)練完成的隨機(jī)森林模型T和CACC離散化斷點集γl,即可實現(xiàn)對訓(xùn)練集外任意第t個月份轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險的預(yù)測。 (24) (25) 進(jìn)一步,對T中每棵決策樹的推斷結(jié)果取平均作為隨機(jī)森林T的推斷結(jié)果,即有 (26) (27) 為驗證本文算法訓(xùn)練部分功能的有效性,首先基于目標(biāo)電務(wù)段2016年至2019年的道岔維護(hù)記錄和歷史氣象數(shù)據(jù),根據(jù)公式(6)~式(8)構(gòu)建訓(xùn)練集DT。 而后,根據(jù)3.2.1小節(jié)中的步驟,基于訓(xùn)練集DT為各月風(fēng)險特征向量Fk中的連續(xù)特征生成CACC離散化斷點集,結(jié)果如表3所示。 表3 Fk中各連續(xù)特征的CACC離散化斷點集 最后,隨機(jī)森林模型3個初始化參數(shù)的取值由基于10折交叉驗證的貝葉斯超參數(shù)搜索算法[24]確定。最終選定隨機(jī)森林規(guī)模R=91,隨機(jī)特征采樣數(shù)W=3,葉結(jié)點最小樣本數(shù)E=4。圖5顯示了訓(xùn)練完成的隨機(jī)森林模型T對訓(xùn)練集內(nèi)各月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級的預(yù)測結(jié)果。 圖5 訓(xùn)練集預(yù)測結(jié)果 由圖5可知,訓(xùn)練完成的隨機(jī)森林模型T僅錯誤預(yù)測了訓(xùn)練集中一個月的轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級。這說明隨機(jī)森林模型T從訓(xùn)練集中較好地學(xué)習(xí)了轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級與各影響因素間的內(nèi)在規(guī)律。 4.1.2 算法預(yù)測部分功能驗證 為進(jìn)一步驗證本文算法預(yù)測功能的有效性,本部分利用訓(xùn)練完成的隨機(jī)森林模型T,對2020年1月的轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級進(jìn)行了預(yù)測。 (28) 表4 目標(biāo)電務(wù)段2020年1月的風(fēng)險預(yù)測特征向量及其離散化結(jié)果 表5 目標(biāo)電務(wù)段2020年1月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級為u的概率 最后,根據(jù)式(27),輸出2020年1月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級預(yù)測值。通過參考表5可知,本文算法預(yù)測2020年1月發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的風(fēng)險等級為2(如表5陰影標(biāo)注),與真實情況一致。這說明當(dāng)氣象臺提供的氣象預(yù)報結(jié)果準(zhǔn)確時,本文方法能夠良好地實現(xiàn)轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級預(yù)測的功能。 圖6 目標(biāo)電務(wù)段2020年1月至12月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級的預(yù)測結(jié)果 由圖6可知,本文算法僅錯誤預(yù)測了目標(biāo)電務(wù)段2020年11月發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的風(fēng)險等級。通過對比目標(biāo)電務(wù)段所在地區(qū)2020年10月和11月的月度氣象數(shù)據(jù)發(fā)現(xiàn),這兩個月的月度氣象特征表現(xiàn)十分接近,因此RF模型認(rèn)為目標(biāo)電務(wù)段11月的故障風(fēng)險等級與10月相同,高估了該月的故障風(fēng)險等級。 為量化本文方法的預(yù)測效果,計算隨機(jī)森林模型T的預(yù)測準(zhǔn)確率Acc,最大預(yù)測誤差EM和總預(yù)測誤差ET,即 (29) (30) (31) 經(jīng)計算,本文模型的預(yù)測準(zhǔn)確率Acc為91.7%,最大預(yù)測誤差EM為1,總預(yù)測誤差ET等于1。這說明當(dāng)氣象臺提供的氣象預(yù)報結(jié)果準(zhǔn)確時,本文提出的轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級預(yù)測算法具有良好的預(yù)測性能。 (32) (33) 圖7 2020年和前8維氣象特征取值 圖8 目標(biāo)電務(wù)段2020年1月至12月轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級的預(yù)測結(jié)果 最后,引入糾錯輸出碼(Error Correcting Output Codes, ECOC)模型[25]和樸素貝葉斯(Naive Bayesian,NB)模型[26],并將本文算法的性能與這2種模型進(jìn)行了對比。其中,ECOC模型是一種基于糾錯輸出編碼的多分類模型,該模型通常會將一個多分類問題通過編碼方式分解為多個二分類問題,從而利用多個基二分類模型共同解決多分類問題。已有的研究已經(jīng)證明,相較于其他多分類模型,ECOC模型在多數(shù)問題中有更優(yōu)的表現(xiàn)[27]。NB模型則是一種基于貝葉斯決策論的多分類器。該模型在各種類型的樣本集上均能夠獲得十分穩(wěn)定的分類效率和性能表現(xiàn)[28],且對缺失數(shù)據(jù)和異常數(shù)據(jù)不敏感,被廣泛應(yīng)用于文本分類、網(wǎng)絡(luò)信息安全等領(lǐng)域。此處,本小節(jié)以在小樣本上表現(xiàn)良好且泛化性能優(yōu)秀的支持向量機(jī)模型[29]作為基學(xué)習(xí)器并使用3元碼[30]編碼方式構(gòu)建ECOC模型。表6顯示了原始的RF模型、ECOC模型和NB模型增加CACC離散化步驟前后,在本文數(shù)據(jù)集上的表現(xiàn)。 表6 不同模型的性能比較結(jié)果 針對鐵路現(xiàn)場當(dāng)前“計劃修”模式下轉(zhuǎn)轍機(jī)表示缺口存在的“維護(hù)不足”和“過度維護(hù)”問題,本文提出了一種基于CACC-RF模型的轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級預(yù)測方法。基于現(xiàn)場5年維護(hù)記錄數(shù)據(jù)的實驗表明,本文提出的方法可以較為準(zhǔn)確預(yù)測各月發(fā)生轉(zhuǎn)轍機(jī)表示缺口卡阻故障的風(fēng)險等級,從而指導(dǎo)現(xiàn)場維護(hù)人員根據(jù)各月不同的故障風(fēng)險等級提前協(xié)調(diào)設(shè)備、人員和維護(hù)天窗等維護(hù)資源,調(diào)整轉(zhuǎn)轍機(jī)表示缺口相關(guān)維護(hù)活動的強(qiáng)度,最終實現(xiàn)在減少人力物力浪費(fèi)的同時,提高道岔的維護(hù)水平。 下一步,更多的監(jiān)測數(shù)據(jù)和特征將被考慮以進(jìn)一步提升本文模型的精度。同時,將嘗試把本文提出的方法移植到軌道電路等其他電務(wù)的關(guān)鍵設(shè)備上,從而為電務(wù)維護(hù)人員制定月度維修計劃提供更加豐富的參考。3.3 轉(zhuǎn)轍機(jī)表示缺口卡阻故障風(fēng)險等級預(yù)測
4 實驗驗證
4.1 功能驗證4.1.1 算法訓(xùn)練部分功能驗證
4.2 性能驗證
5 結(jié)論