王君臣,徐田華,陳 聰
(北京交通大學(xué) 軌道交通控制與安全國家重點(diǎn)實驗室,北京 100044)
隨著中國鐵路的飛速發(fā)展,給人們的出行帶來便利的同時,也給鐵路各相關(guān)部門帶來巨大的維護(hù)壓力。轉(zhuǎn)轍機(jī)是保障行車安全,改善勞動強(qiáng)度,提高行車效率的鐵路信號系統(tǒng)的關(guān)鍵設(shè)備。一旦轉(zhuǎn)轍機(jī)發(fā)生故障,輕則導(dǎo)致列車晚點(diǎn),影響行車效率,重則導(dǎo)致列車擠岔或脫軌,危及行車安全,造成財產(chǎn)損失和人員傷亡[1]。
液壓道岔轉(zhuǎn)轍機(jī)[2-3]在實際運(yùn)行過程中會受到滑床板異常、道岔尖軌爬行、鎖閉框不夠方正、油缸滲油、節(jié)點(diǎn)老化等異常事件影響,這些異常事件可能當(dāng)時對道岔運(yùn)行影響不大,道岔能轉(zhuǎn)換到位,缺口、表示都正常。但是此時轉(zhuǎn)轍機(jī)處于亞健康狀態(tài),運(yùn)行時間一長就會導(dǎo)致道岔故障的發(fā)生,因此對道岔設(shè)備的運(yùn)行狀態(tài)進(jìn)行異常檢測具有很強(qiáng)的必要性。
傳統(tǒng)的異常檢測工作主要由現(xiàn)場維護(hù)人員定期瀏覽微機(jī)監(jiān)測采集到的道岔轉(zhuǎn)轍機(jī)運(yùn)行數(shù)據(jù),并在現(xiàn)場對運(yùn)行中的道岔進(jìn)行檢測與維護(hù),從而確定道岔的運(yùn)行狀態(tài)。這種方法給現(xiàn)場維護(hù)人員造成極大負(fù)擔(dān),并常常導(dǎo)致漏判和錯判,為列車安全運(yùn)行帶來巨大隱患。
目前,國內(nèi)外許多學(xué)者對道岔轉(zhuǎn)轍機(jī)進(jìn)行研究。例如趙林海等人[4-5]對道岔轉(zhuǎn)轍機(jī)典型故障下的功率曲線進(jìn)行分析,提出了一種基于灰關(guān)聯(lián)的道岔故障診斷方法。文獻(xiàn) [6-8]用專家系統(tǒng)的方法構(gòu)建道岔轉(zhuǎn)轍機(jī)的故障診斷模型。H Kim等人[9-10]用動態(tài)時間規(guī)整的方法來對道岔轉(zhuǎn)轍機(jī)進(jìn)行故障診斷。鐘志旺等人[11]提出了基于支持向量數(shù)據(jù)描述(SVDD)的道岔轉(zhuǎn)換故障檢測和健康指標(biāo)評估方法。但是他們的研究重點(diǎn)在于檢測出故障模式,忽略了道岔轉(zhuǎn)轍機(jī)的異常狀態(tài)。
針對道岔轉(zhuǎn)轍機(jī)運(yùn)行過程中產(chǎn)生的數(shù)據(jù)大都是正常數(shù)據(jù),異常數(shù)據(jù)缺乏的情況,提出采用改進(jìn)的支持向量域描述的方法進(jìn)行異常檢測。SVDD算法[12]是找到一個超球面,包含盡量多的正常點(diǎn),而其半徑盡量小,落在這個超球面以外的都是不正常的點(diǎn)。但是,該算法從支持向量機(jī)理論的基礎(chǔ)上來說是有損失的,它的目標(biāo)函數(shù)中缺少了使分類間隔盡量大這個條件,而這個條件恰恰是統(tǒng)計學(xué)習(xí)理論結(jié)構(gòu)風(fēng)險最小化的體現(xiàn),因此該算法的推廣能力一般。文獻(xiàn)[13]提出一種新型的支持向量描述算法,通過引入變量ρ很好地提高了算法的推廣能力。本文將該方法應(yīng)用到道岔轉(zhuǎn)轍機(jī)運(yùn)行狀態(tài)的異常檢測中,實驗表明,具有較高的異常識別率,滿足電務(wù)部門的應(yīng)用需求。
轉(zhuǎn)轍機(jī)的功率數(shù)據(jù)不僅體現(xiàn)三相電流電壓值的大小,同時也包含它們的相位角大小,因此相對于電流曲線而言,功率曲線反映的信息更多,也更接近于道岔轉(zhuǎn)轍機(jī)運(yùn)行過程中實際克服的阻力變化。
轉(zhuǎn)轍機(jī)功率數(shù)據(jù)是由三相交流轉(zhuǎn)轍機(jī)功率采集單元采集而來的。采集單元在1QDJ吸起時開始工作,每隔40 ms采樣一次三相電流電壓數(shù)據(jù),經(jīng)過計算得出瞬時功率數(shù)據(jù),在1QDJ落下時結(jié)束工作。正常的道岔運(yùn)行一次的功率曲線,如圖1所示。
圖1 ZYJ7轉(zhuǎn)轍機(jī)正常時功率曲線
轉(zhuǎn)轍機(jī)設(shè)備在長期運(yùn)營過程中,會產(chǎn)生一批“臟”數(shù)據(jù)。例如:(1)因系統(tǒng)斷電重啟采集系統(tǒng)異常而產(chǎn)生的非數(shù)字?jǐn)?shù)據(jù);(2)在維修過程中維護(hù)人員做卡缺口試驗而產(chǎn)生的數(shù)據(jù);(3)因道岔轉(zhuǎn)換不到位出現(xiàn)回操現(xiàn)象的數(shù)據(jù);(4)控制電路故障而產(chǎn)生的數(shù)據(jù)。這些數(shù)據(jù)要么是人為產(chǎn)生的故障數(shù)據(jù),要么不能反映道岔的運(yùn)動狀態(tài)。因此在建立模型之前需要對對這些數(shù)據(jù)進(jìn)行清洗。
以廣州鐵路集團(tuán)長沙站15#道岔2014年9月~2015年1月的1 000組轉(zhuǎn)轍機(jī)功率數(shù)據(jù)為例,提取每組數(shù)據(jù)道岔鎖閉、1QDJ即將落下的時間點(diǎn)T。統(tǒng)計參數(shù)T,其分布如表1所示。
表1 15#道岔轉(zhuǎn)轍機(jī)時間T的分布
對T>8.08 s的數(shù)據(jù)分析發(fā)現(xiàn),這些數(shù)據(jù)可分為兩類:(1)道岔轉(zhuǎn)換不到位回到原位的;(2)道岔卡缺口曲線。因此,數(shù)據(jù)清洗中可以把這兩類數(shù)據(jù)清洗出來,存入到故障數(shù)據(jù)庫。還需把重復(fù)數(shù)據(jù)和全為零的數(shù)據(jù)清除,數(shù)據(jù)清洗流程,如圖2所示。
當(dāng)轉(zhuǎn)轍機(jī)帶動道岔尖軌從定位移動到反位時,其可以分解為3個過程:定位解鎖、轉(zhuǎn)換、反位鎖閉。
解鎖:三相異步電機(jī)啟動后,鎖閉桿內(nèi)鎖閉解鎖切斷原表示,鎖閉桿移動帶動鎖閉桿凸臺滑入鎖鉤缺口,完成外鎖閉解鎖,如圖3中的a~b。
轉(zhuǎn)換:動作桿繼續(xù)移動,通過尖軌連接鐵和鎖鉤帶動原斥離軌和密貼軌同時在滑床板上移動,直到原斥離軌和基本軌密貼,如圖3中的c~d。
鎖閉:原斥離軌與基本軌密貼后,鎖閉桿繼續(xù)移動,鎖閉桿凸臺頂起鎖鉤,道岔外鎖閉裝置完成鎖閉,切斷三相動作電路,接通表示電路,如圖3中的e~f。
圖2 數(shù)據(jù)清洗流程
圖3 道岔解鎖、轉(zhuǎn)換、鎖閉的開始和結(jié)束時動作桿的狀態(tài)
由上面分析可以知道,解鎖和鎖閉這兩個過程大致互為對稱關(guān)系,所以這兩個過程所消耗的時間也基本相等。
道岔功率數(shù)據(jù)可以表示為確定的一維時間序列Xt,Xt={xt, t=1, 2,…, n}。
圖4 正常曲線和卡缺口曲線對比
圖5 功率曲線分段
圖4中,紅色為正常曲線,藍(lán)色曲線為道岔卡缺口曲線,即卡4 mm異物道岔不能鎖閉。圖中藍(lán)色曲線在t=[12 s, 14 s]的第1個下降沿為4 mm異物消失引起功率的變化,第2個下降沿為道岔鎖閉完成引起的。由此可以得出,道岔的鎖閉時間約為0.8 s,解鎖時間也約為0.8 s。
電機(jī)的啟動時間在0.6 s左右,因此可以將序列Xt按時間提取其解鎖、轉(zhuǎn)換、鎖閉3段X1、X2、X3,Xi={xi1, xi2, …, xin},i=1, 2, 3, 功率曲線分段,如圖5所示。
道岔功率數(shù)據(jù)是具有維數(shù)高、變長度、結(jié)構(gòu)復(fù)雜等特點(diǎn)。如果直接對原始的功率數(shù)據(jù)進(jìn)行異常檢測,需要面臨巨大的計算量,且檢測效率低,因此需要對原始數(shù)據(jù)進(jìn)行特征提取和降維。
目前,信號的時域統(tǒng)計特征由于計算簡單而常用于設(shè)備的狀態(tài)監(jiān)測中,有量綱的統(tǒng)計指標(biāo)有均值、幅值、峰峰值以及均方根值;無量綱的統(tǒng)計指標(biāo)有偏斜度峭度、峰值因數(shù)、波形因數(shù)、脈沖因數(shù)等,其中,偏斜度可以表示信號偏離正態(tài)分布的程度,而峭度、峰值因數(shù)、波形因數(shù)和脈沖因數(shù)在一定程度上反映出振動信號是否含有沖擊成份,并且脈沖因數(shù)對于沖擊類故障比較敏感。因此,分別對序列X1, X2,X3提取均值、幅值、峰峰值、均方值、偏斜度、峭度、峰值因數(shù)、波形因數(shù)和脈沖因數(shù)這9個指標(biāo)為特征。
機(jī)器學(xué)習(xí)的降維方法主要有主成分分析、奇異值分解法、因子分析法等。主成分分析也稱主分量分析,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個綜合指標(biāo)(即主成分),其中,每個主成分都能夠反映原始變量的大部分信息,且所含信息互不重復(fù)。
假設(shè) l個 n 維數(shù)據(jù) Xi=(x1, x2,…, xn),i=1, 2, …, l已經(jīng)進(jìn)行了中心化,即原坐標(biāo)系經(jīng)過坐標(biāo)變換后得到的新坐標(biāo)系為(w1, w2,…, wn),其中,wi是標(biāo)準(zhǔn)正交基,即
如果將數(shù)據(jù)從n維降到m維,即丟棄新坐標(biāo)系中的部分坐標(biāo),則新的坐標(biāo)系為(w1, w2,…, wm),數(shù)據(jù)Xi在m維坐標(biāo)系中的投影為Zi:Zi=(z1, z2,…,zm),其中,zj是xj在低維坐標(biāo)系里第j維的坐標(biāo),
對于任意一個樣本Xi,在新的坐標(biāo)系中的投影為WTXt,在新坐標(biāo)系中的投影方差為WTXiXTiW,要使所有的樣本的投影方差和最大,也就是最大化即:
利用拉格朗日函數(shù)求解式(1)可以得到式(2)。
則主成分分析的計算流程如下:
(1)對所有樣本進(jìn)行中心化處理;
(2)計算樣本的協(xié)方差矩陣XXT;
(3)求解協(xié)方差矩陣的特征值λ和特征向量v;
(5)將原始樣本投影到新坐標(biāo)系下,得到新樣本為 Yk=(y1k, y2k, …,ymk)T。
表2顯示了對序列X1,X2, X3經(jīng)特征提取后得到的特征集分別采用PCA算法進(jìn)行降維分析所得出的前6個λ值的分布情況,設(shè)定累積貢獻(xiàn)率為80%,則只需要取前2個主元λ1和λ2,前2個主元的累積貢獻(xiàn)率分別達(dá)到了87%,89%,87%。
表2 經(jīng)PCA計算得到的前6個λ值
設(shè)訓(xùn)練樣本集X={xi|i=1, 2,…,n},支持向量域描述方法是在高維特征空間中尋找一個以R為半徑,a為圓心的超球體Ω。為增強(qiáng)算法的魯棒性,引入松弛因子ξi≥0,i=1, 2,…,n,滿足mercer條件的核函數(shù)K(x,y)=〉φ(x), φ(y)〉,這樣,算法可以描述成優(yōu)化問題,如式(3)。
其中,C為控制參數(shù),用于調(diào)整最小超球體和數(shù)據(jù)誤差之間的平衡。該問題的對偶形式為式(4)。
目前,支持向量域描述算法從支持向量機(jī)理論的基礎(chǔ)來說是有損失的。由于它們在目標(biāo)函數(shù)中缺少了使分類間隔盡量大這個條件,而這個條件恰恰是統(tǒng)計學(xué)習(xí)理論中結(jié)構(gòu)風(fēng)險最小化的體現(xiàn),因此目前超球面支持向量機(jī)算法的推廣能力有限。
為了解決SVDD算法的推廣能力,引入變量ρ,則新分類超球面,如圖6所示。
圖6 最優(yōu)超球面
該算法的優(yōu)化問題描述如式(5):
其中, y1=±1,采用拉格朗日算子法求解該問題,即:
其中,α1, β1和 σ都是拉格朗日因子, 并且α1≥0, β1≥0和σ≥0。求解式(6)的偏導(dǎo)數(shù),得:
將式(7)帶入到式(6)中,引入核函數(shù),得到其對偶表達(dá)式,即:
以長沙站15#道岔2015年3~5月的道岔功率數(shù)據(jù)為例,經(jīng)過數(shù)據(jù)清洗后得到300組樣本數(shù)據(jù),其中,運(yùn)行正常數(shù)據(jù)200組,解鎖異常40組,轉(zhuǎn)換異常30組,鎖閉異常30組。樣本數(shù)據(jù),如表3所示;異常曲線,如圖7所示。
表3 訓(xùn)練和測試過程中各算法的樣本選擇數(shù)
在表3中,算法A表示最近鄰算法,算法B表示支持向量域描述算法,算法C表示改進(jìn)后的支持向量域描述算法。
圖7 道岔運(yùn)行曲線
在實驗過程中,將樣本分為兩部分:(1)用作訓(xùn)練;(2)用于測試。樣本具體選擇數(shù)量,如表3所示。算法B和算法C中的核函數(shù)均選擇徑向基函數(shù),即 :
其中,在二分類問題上,將樣本的真實類別與機(jī)器學(xué)習(xí)得到的類別的組合分為真陽例(TP),假陽例(FP),真陰例(TN),假陰例(FN)4種情形,令TP,F(xiàn)P,TN,F(xiàn)N分別表示其對應(yīng)的樣本數(shù),因此可以得到準(zhǔn)確率真陽率假陽率實驗結(jié)果,如表4~6所示。
表4 解鎖階段3類算法的比較
表5 轉(zhuǎn)換階段3類算法的比較
表6 鎖閉階段3類算法的比較
以測試樣本到分類界面的距離d(d≥0)為變量,畫SVDD算法模型和改進(jìn)SVDD算法模型的ROC對比曲線,如圖8~10所示。
圖8 解鎖階段兩算法的ROC曲線對比
圖9 轉(zhuǎn)換階段兩算法的ROC曲線對比
從實驗結(jié)果可以看出,KNN算法對正樣本能準(zhǔn)確識別,但容易將異常樣本判斷為正常樣本,這對于鐵路設(shè)備安全是不能容忍的。SVDD算法能夠完全識別出異常樣本,但是由于本身算法的局限性,容易對正常樣本判斷為異常,虛警率較高。從ROC曲線看改進(jìn)算法的性能明顯好于原算法,且能完全識別異常樣本,而且需要的訓(xùn)練樣本數(shù)也少于SVDD算法,虛警率分別只有8.3%,6.2%和4.4%,能滿足鐵路維護(hù)的需求。
圖10 鎖閉階段兩算法的ROC曲線對比
本文在研究道岔運(yùn)行原理的基礎(chǔ)上,對功率數(shù)據(jù)按照解鎖、轉(zhuǎn)換、鎖閉進(jìn)行分段處理,分別選取均值、幅值、峭度、波形因數(shù)等時域特征,并用主成分分析法對特征進(jìn)行降維處理,分別對解鎖、轉(zhuǎn)換、鎖閉建立異常檢測模型。通過實際采集的數(shù)據(jù)對算法進(jìn)行了實驗驗證,結(jié)果表明,改進(jìn)的支持向量域描述的算法完全能滿足現(xiàn)場維護(hù)人員的需要。