孫 哲
(中鐵工程設(shè)計(jì)咨詢集團(tuán)有限公司,北京 100055)
目前,我國(guó)鐵路列車運(yùn)行控制系統(tǒng)普遍采用ZPW-2000型無絕緣軌道電路[1]。作為JTC的關(guān)鍵組成部分之一,補(bǔ)償電容對(duì)防止JTC“紅光帶”和機(jī)車信號(hào)“掉碼”等故障起著至關(guān)重要的作用。經(jīng)現(xiàn)場(chǎng)調(diào)研可知,補(bǔ)償電容常見故障形式為引接線銹蝕后斷線和電容容值下降兩種,且故障具有突發(fā)性。針對(duì)這些故障模式,國(guó)內(nèi)外相關(guān)學(xué)者對(duì)基于列車運(yùn)行數(shù)據(jù)的補(bǔ)償電容故障診斷方法進(jìn)行了研究。
國(guó)外方面,DEBIOLLES、OUKHELLOU等人采用偏最小二乘與神經(jīng)網(wǎng)絡(luò)、傳遞置信模型等算法,提出了一系列補(bǔ)償電容故障檢測(cè)方法[2-4]。
國(guó)內(nèi)方面,趙林海等人利用機(jī)車信號(hào)遠(yuǎn)程監(jiān)測(cè)平臺(tái)的記錄數(shù)據(jù),對(duì)補(bǔ)償電容故障診斷方法進(jìn)行了一系列的研究[5-9],其中,文獻(xiàn)[5-7]采用時(shí)頻分析的故障診斷方法,雖然檢測(cè)速度快,但僅能實(shí)現(xiàn)補(bǔ)償電容單故障的診斷,文獻(xiàn)[8-9]采用啟發(fā)式算法,通過將仿真模型與實(shí)際數(shù)據(jù)進(jìn)行趨勢(shì)擬合,能夠?qū)崿F(xiàn)補(bǔ)償電容的多故障診斷,但參數(shù)尋優(yōu)速度慢,算法及時(shí)性不高。在此基礎(chǔ)上,張友鵬等基于SA算法,通過對(duì)分路態(tài)模型進(jìn)行分段尋優(yōu),提出了軌道電路故障綜合監(jiān)測(cè)方法[10],但該方法仍屬于啟發(fā)式算法,及時(shí)性不高,且依賴于模型,對(duì)數(shù)據(jù)質(zhì)量的要求高。同時(shí),以上算法均是對(duì)單條感應(yīng)電壓幅值數(shù)據(jù)進(jìn)行分析,沒有充分挖掘歷史數(shù)據(jù)之間的關(guān)聯(lián)信息。
近年來,大數(shù)據(jù)技術(shù)在鐵路安全領(lǐng)域得到了越來越多的應(yīng)用,而基于聚類的故障診斷技術(shù)能夠充分利用數(shù)據(jù)之間的相關(guān)性,且具有較高的診斷速度和精確度[11]。為此,利用機(jī)車信號(hào)遠(yuǎn)程監(jiān)測(cè)系統(tǒng)的歷史數(shù)據(jù),提出一種基于自適應(yīng)層次聚類的補(bǔ)償電容多故障診斷方法。
聚類是通過無監(jiān)督的方式,將數(shù)據(jù)對(duì)象以類或簇為單位進(jìn)行劃分,將具有較高相似度的數(shù)據(jù)劃分為同一個(gè)類,不同類之間的相似度差別較大[12-13]。聚類分析的輸入可以用(X,d)或(X,1/s)表示,其中,X表示待聚類的樣本,s和d表示樣本相似度和相異度的度量。若分類結(jié)果C={C1,C2,…,Ck},則滿足式
(1)
其中,Ci(i=1,2,…,k)是X的子集C中的成員,C1,C2,…,Ck叫做類,樣本集中每個(gè)數(shù)據(jù)只屬于一個(gè)類。
一般地,聚類樣本間的相異度(距離)采用樣本數(shù)據(jù)中的空間距離來度量,記為:d(x,y),其中x,y是相應(yīng)的特征。常用的空間距離有歐式距離、切比雪夫距離、二次型距離、余弦距離,本文采用歐式距離,表示為
(2)
對(duì)于具有sa和sb個(gè)元素的兩個(gè)類Ca和Cb,令x∈Ca,y∈Cb,則x與y間的距離記為d(x,y),類間距離為D(Ca,Cb)。常用的類間距離計(jì)算方法有最短距離法、最長(zhǎng)距離法、中心法、類平均法。本文采用類平均法,采用兩類中任意兩個(gè)元素間距離的平均值作為類間距離,表示為
(3)
按層次聚類的方向不同,層次聚類可以分為凝聚和分裂兩種方法[14-15]。凝聚的方法是指:首先以樣本中每個(gè)元素作為一個(gè)子類,然后根據(jù)設(shè)置的相似度量標(biāo)準(zhǔn)合并這些子類,直到所有的元素都在一個(gè)類中,或者達(dá)到某一終止條件;分裂的方法是指:首先將所有元素歸于一類中,然后逐層分解,直到每個(gè)元素各自劃分為一類,或者達(dá)到了某個(gè)終止條件。該終止條件一般為期望的類數(shù)目,或者類間距離超過了相應(yīng)門限。其處理過程如圖1所示。
圖1 凝聚和分裂層次聚類
層次聚類算法屬于無監(jiān)督的分類算法,聚類的結(jié)果要求類別之間具有良好的可分性,即:類間距離盡量大,類內(nèi)距離盡量小[16]。由于聚類之前需要人為指定聚類個(gè)數(shù)或設(shè)定相應(yīng)門限,為此,提出一種自適應(yīng)層次聚類算法,使其能夠根據(jù)自定義判別函數(shù)的取值來自適應(yīng)確定聚類的個(gè)數(shù)。
對(duì)于具有n個(gè)特征的輸入樣本x,綜合考慮類內(nèi)類間距離對(duì)樣本的可分性,定義類內(nèi)類間距離判據(jù)J(x)為
(4)
自適應(yīng)層次聚類的原則為獲取某一聚類結(jié)果C,使類間距離盡量大,類內(nèi)距離盡量小,即:獲得樣本各聚類結(jié)果中J(x)的最大值,并以該J(x)最大值對(duì)應(yīng)的聚類個(gè)數(shù)為最優(yōu)結(jié)果。因此,對(duì)于輸入樣本x,自適應(yīng)層次聚類算法流程如圖2所示。
圖2 自適應(yīng)層次聚類算法流程
其中,J_max為自定義判別函數(shù)的最大值,初始值為0,取值范圍為[0,+∞];NcIndex為得到的聚類個(gè)數(shù);M為聚類個(gè)數(shù)上限,令M=10即可;C為聚類結(jié)果,表示樣本x中每組數(shù)據(jù)分屬哪一類。
如圖3所示,JTC主要由發(fā)送器、匹配調(diào)諧區(qū)、鋼軌、補(bǔ)償電容、傳輸電纜以及接收器等構(gòu)成[17]。機(jī)車信號(hào)遠(yuǎn)程監(jiān)測(cè)系統(tǒng)主要由機(jī)車信號(hào)主機(jī)(包含天線、電纜)、車載傳輸模塊、GPRS網(wǎng)絡(luò)、地面數(shù)據(jù)服務(wù)器以及維護(hù)終端構(gòu)成[18]。
從JTC發(fā)送端發(fā)送的信號(hào)經(jīng)輪軌分路后,信號(hào)被短路并形成短路電流。通過電磁感應(yīng),TCR天線中形成相應(yīng)的感應(yīng)電壓信號(hào),機(jī)車信號(hào)主機(jī)對(duì)該感應(yīng)電壓進(jìn)行接收,并將其所包含的控車信息發(fā)送給車載計(jì)算機(jī)。之后,機(jī)車信號(hào)遠(yuǎn)程監(jiān)測(cè)系統(tǒng)的車載傳輸模塊將該感應(yīng)電壓的幅值包絡(luò)、載頻,以及列車當(dāng)前所在JTC區(qū)段的里程及信號(hào)機(jī)編號(hào)、列車速度等信息,經(jīng)GPRS網(wǎng)絡(luò)傳送到地面數(shù)據(jù)服務(wù)器。地面數(shù)據(jù)服務(wù)器按信號(hào)機(jī)標(biāo)號(hào)對(duì)幅值包絡(luò)進(jìn)行劃分,形成感應(yīng)電壓包絡(luò)歷史數(shù)據(jù)庫,使得地面維護(hù)人員可以通過維護(hù)終端對(duì)進(jìn)入該JTC區(qū)段的所有列車所采集的感應(yīng)電壓幅值歷史信息進(jìn)行查看。
圖3 JTC與機(jī)車信號(hào)遠(yuǎn)程監(jiān)測(cè)系統(tǒng)示意
圖4 補(bǔ)償電容正常與依次斷線時(shí)的幅度包絡(luò)仿真結(jié)果
文獻(xiàn)[8]利用四端網(wǎng)絡(luò)模型對(duì)機(jī)車信號(hào)感應(yīng)電壓幅值進(jìn)行了建模,參考該建模方法,對(duì)補(bǔ)償電容依次斷線下的感應(yīng)電壓幅值變化情況進(jìn)行仿真,如圖4所示。仿真條件為:軌道電路長(zhǎng)度l=901 m;道床漏泄電阻Rd=3 Ω·km;信號(hào)載頻fz=2 600 Hz;發(fā)送器功出電壓Afs=74 V;分路電阻Rf=0.15 Ω;補(bǔ)償電容個(gè)數(shù)為12,容值均為25 μF。
由圖4可知,由于輪對(duì)的分路作用,補(bǔ)償電容斷線主要會(huì)對(duì)其后接收端方向的幅值波動(dòng)情況產(chǎn)生影響,而對(duì)其前方發(fā)送端方向的幅值波動(dòng)幾乎沒有影響。基于此影響規(guī)律,可以對(duì)機(jī)車信號(hào)遠(yuǎn)程監(jiān)測(cè)系統(tǒng)獲取的歷史感應(yīng)電壓幅值數(shù)據(jù)進(jìn)行聚類。
本算法的總體思路為:首先,對(duì)從機(jī)車信號(hào)遠(yuǎn)程監(jiān)測(cè)系統(tǒng)獲取的歷史感應(yīng)電壓幅值數(shù)據(jù)的波動(dòng)特征進(jìn)行提取,用于構(gòu)造特征矩陣;之后,對(duì)特征矩陣進(jìn)行重構(gòu),得到樣本矩陣,并采用自適應(yīng)層次聚類對(duì)樣本矩陣進(jìn)行聚類,得到類別矩陣。最后,結(jié)合相應(yīng)的補(bǔ)償電容故障判別策略,實(shí)現(xiàn)最近一組感應(yīng)電壓幅值數(shù)據(jù)中補(bǔ)充電容故障位置的識(shí)別。
對(duì)于某一待診斷JTC,若其長(zhǎng)度為l,補(bǔ)償電容個(gè)數(shù)為m,且當(dāng)前機(jī)車信號(hào)遠(yuǎn)程監(jiān)測(cè)系統(tǒng)歷史數(shù)據(jù)庫中存儲(chǔ)有k組該區(qū)段的感應(yīng)電壓幅值包絡(luò)數(shù)據(jù),則該k組數(shù)據(jù)經(jīng)歸一化后按時(shí)間的先后順序可以構(gòu)成數(shù)據(jù)矩陣Acv,且表示為
(5)
標(biāo)準(zhǔn)差能夠反映數(shù)據(jù)整體的波動(dòng)情況,故取某一點(diǎn)至其前方發(fā)送端所有分路點(diǎn)位置處的感應(yīng)電壓幅值數(shù)據(jù)的標(biāo)準(zhǔn)差作為特征,構(gòu)成k×(m+1)維的特征矩陣Φ,表示為
(6)
對(duì)特征矩陣Φ進(jìn)行重構(gòu),可以進(jìn)一步構(gòu)造出m個(gè)k×(m-j+2)維樣本矩陣Xj(j=1,2,…,m),且表示為
(7)
由于補(bǔ)償電容可靠性較高,且故障組合種類比較多[19],Acv的k組數(shù)據(jù)可能無法包含所有的補(bǔ)償電容故障組合情況。若Acv的k組歷史數(shù)據(jù)中,第h~m(h=1,2,…,m)個(gè)連續(xù)的補(bǔ)償電容從未發(fā)生過故障,即Xj(j=h,…,m)的類別數(shù)為1,由于自適應(yīng)層次聚類要求輸入數(shù)據(jù)類別數(shù)大于1,則無法對(duì)其進(jìn)行自適應(yīng)層次聚類。因此,根據(jù)補(bǔ)償電容故障的影響規(guī)律,在對(duì)樣本矩陣進(jìn)行聚類之前,需要對(duì)Acv中曾經(jīng)發(fā)生過故障且離發(fā)送端最遠(yuǎn)的第一個(gè)補(bǔ)償電容的位置進(jìn)行確定。
為此,以Φ的任一列作為輸入,采用萊因達(dá)準(zhǔn)則對(duì)數(shù)據(jù)中是否具有離群點(diǎn)進(jìn)行判斷。若經(jīng)判斷Φ中的第h~m(h=1,2,…,m)列數(shù)據(jù)沒有離群點(diǎn),則根據(jù)圖2所示流程,分別對(duì)樣本矩陣Xj(j=1,…,h-1)進(jìn)行自適應(yīng)層次聚類,可以得到類別矩陣C,表示為
(8)
其中,c·j(j=1,…,h-1)表示為對(duì)應(yīng)樣本矩陣Xj的聚類結(jié)果,cij(i=1,2,…,k)表示Xj中第i行對(duì)應(yīng)的類別號(hào)。
由于補(bǔ)償電容為高可靠器件,則Acv的各組數(shù)據(jù)中,補(bǔ)償電容均正常的感應(yīng)電壓幅值包絡(luò)個(gè)數(shù)為最多。因此,若對(duì)應(yīng)類別矩陣C中某一行的類別在所有k行中出現(xiàn)次數(shù)最多,則該行每一個(gè)元素均為補(bǔ)償電容全正常下的類別,并將此類別和每一列中等于該類別的行號(hào)最大值分別記為
(9)
基于此規(guī)律,并結(jié)合補(bǔ)償電容故障的累加性,可以建立補(bǔ)償電容多故障判決策略,見圖5。
本算法首先判斷最后一組數(shù)據(jù)中離發(fā)送端最近的第一個(gè)故障補(bǔ)償電容的位置,之后,通過判斷后續(xù)類別矩陣中類別種類個(gè)數(shù),實(shí)現(xiàn)補(bǔ)償電容多故障的診斷。
為檢驗(yàn)算法的正確性,選取某局管內(nèi)某一ZPW-2000A型JTC的感應(yīng)電壓幅值包絡(luò)數(shù)據(jù)對(duì)算法進(jìn)行驗(yàn)證。該JTC區(qū)段長(zhǎng)度l=1 200 m,補(bǔ)償電容個(gè)數(shù)nCC=13,其某一時(shí)間段內(nèi)的感應(yīng)電壓幅值采樣歸一化數(shù)據(jù)如圖6所示。
圖5 補(bǔ)償電容多故障判別策略
圖6(a)為機(jī)車信號(hào)采集的該JTC區(qū)段于2018年3月4日及其之前77個(gè)時(shí)間點(diǎn)的感應(yīng)電壓采樣幅值歸一化數(shù)據(jù),由現(xiàn)場(chǎng)反饋可知,該JTC于2018年3月4日發(fā)生補(bǔ)償電容CC7斷線故障。采用本文算法對(duì)圖6(a)所示數(shù)據(jù)進(jìn)行特征提取、特征聚類后,得到類別矩陣C(a),表示為
C(a)=
由補(bǔ)償電容故障判別策略可知,最后一組數(shù)據(jù)中補(bǔ)償電容CC7發(fā)生斷線故障,與實(shí)際情況一致,本算法能夠?qū)ρa(bǔ)償電容單故障情況進(jìn)行診斷。
圖6(b)為機(jī)車信號(hào)采集的該JTC區(qū)段于2018年4月25日及其之前99個(gè)時(shí)間點(diǎn)的感應(yīng)電壓采樣幅值歸一化數(shù)據(jù),由現(xiàn)場(chǎng)反饋可知,該JTC于2018年3月4日發(fā)生補(bǔ)償電容CC7斷線故障后,又于2018年3月25日發(fā)生補(bǔ)償電容CC5斷線故障。采用本文算法對(duì)圖6(c)所示數(shù)據(jù)進(jìn)行特征提取、特征聚類后,得到類別矩陣C(c),表示為
圖6 某區(qū)段歷史感應(yīng)電壓幅值歸一化數(shù)據(jù)
C(c)=
由補(bǔ)償電容故障判別策略可知,最后一組數(shù)據(jù)中補(bǔ)償電容和CC5、CC7發(fā)生斷線故障,與實(shí)際情況一致,本算法能夠?qū)ρa(bǔ)償電容多故障情況進(jìn)行診斷。
此后,該JTC區(qū)段于2018年4月26日故障修復(fù),采用本文算法對(duì)圖6(b)所示數(shù)據(jù)進(jìn)行特征提取、特征聚類后,得到類別矩陣C(b),表示為
C(b)=
由補(bǔ)償電容故障判別策略可知,最后一組數(shù)據(jù)中補(bǔ)償電容均正常,本算法能夠?qū)ρa(bǔ)償電容均正常的情況進(jìn)行識(shí)別。
本文首先通過定義相應(yīng)的類內(nèi)類間距離判據(jù),提出了自適應(yīng)層次聚類法。之后,利用機(jī)車信號(hào)遠(yuǎn)程監(jiān)測(cè)系統(tǒng)獲取的歷史感應(yīng)電壓幅值包絡(luò)數(shù)據(jù),根據(jù)補(bǔ)償電容故障對(duì)整體感應(yīng)電壓幅值包絡(luò)的波動(dòng)性的影響,建立了相應(yīng)的特征矩陣與樣本矩陣,并結(jié)合自適應(yīng)層次聚類算法,提出了基于機(jī)車信號(hào)歷史監(jiān)測(cè)數(shù)據(jù)和自適應(yīng)層次聚類的機(jī)車信號(hào)補(bǔ)償電容多故障診斷策略。經(jīng)過實(shí)驗(yàn)驗(yàn)證,本算法能夠準(zhǔn)確對(duì)補(bǔ)償電容多故障情況進(jìn)行診斷,為數(shù)據(jù)挖掘技術(shù)在鐵路領(lǐng)域的應(yīng)用提供了一個(gè)新的思路。