王斌,楊志鵬,張文軒,王婧,汪海瑛
(中國鐵道科學(xué)研究院集團(tuán)有限公司 基礎(chǔ)設(shè)施檢測研究所,北京 100081)
接觸網(wǎng)作為高速鐵路牽引供電系統(tǒng)的主要組成部分,是列車高速、平穩(wěn)運(yùn)行的重要保障[1]。接觸網(wǎng)系統(tǒng)無備用、零部件眾多、機(jī)械結(jié)構(gòu)復(fù)雜,在自然條件的影響和列車荷載作用下,其狀態(tài)會(huì)不斷發(fā)生變化[2]。為確保動(dòng)車組運(yùn)營秩序,提升系統(tǒng)安全性和可靠性,需借助檢測監(jiān)測設(shè)備對接觸網(wǎng)設(shè)備狀態(tài)進(jìn)行監(jiān)控,通過缺陷診斷及分析,及時(shí)挖掘有用信息,為運(yùn)營維護(hù)、設(shè)備管理和設(shè)計(jì)施工提供數(shù)據(jù)支持。
車載接觸網(wǎng)運(yùn)行狀態(tài)檢測裝置(3C)安裝在運(yùn)營動(dòng)車組車頂。依據(jù)TG/GD 124—2015《高速鐵路接觸網(wǎng)運(yùn)行維修規(guī)則》規(guī)定,3C裝置實(shí)現(xiàn)對接觸網(wǎng)溫度、動(dòng)態(tài)幾何參數(shù)和弓網(wǎng)受流狀態(tài)的全天候等速檢測。動(dòng)車組3C裝置自2016年投入使用以來,在全路范圍內(nèi)積累了海量檢測數(shù)據(jù),但由于缺乏系統(tǒng)、有效的分析策略,數(shù)據(jù)挖掘不充分,忽略了大量有益于設(shè)備運(yùn)維的科學(xué)信息。根據(jù)目前修程修制改革的目標(biāo),需強(qiáng)化數(shù)據(jù)分析過程,提高分析精準(zhǔn)性,最終實(shí)現(xiàn)預(yù)防性狀態(tài)維修[3-5]。因此,有必要研究基于動(dòng)車組3C裝置的接觸網(wǎng)缺陷診斷及分析方法,充分發(fā)揮檢測分析價(jià)值,為全面、準(zhǔn)確、及時(shí)、高效地管理接觸網(wǎng)設(shè)備狀態(tài)提供支持。
3C裝置通過紅外熱成像技術(shù)對接觸網(wǎng)、受電弓及弓網(wǎng)運(yùn)行狀態(tài)進(jìn)行監(jiān)測,對核心區(qū)域進(jìn)行重點(diǎn)監(jiān)控,實(shí)時(shí)分析溫度變化,結(jié)合可見光成像數(shù)據(jù),基于圖像識別算法實(shí)現(xiàn)設(shè)備狀態(tài)辨識和動(dòng)態(tài)參數(shù)測量,結(jié)合GPS、慣性導(dǎo)航技術(shù)及線路臺賬數(shù)據(jù),實(shí)現(xiàn)車載系統(tǒng)的走行定位和線路區(qū)站、公里標(biāo)等輔助定位,最終通過無線通信技術(shù)將檢測數(shù)據(jù)傳輸?shù)降孛娣?wù)器[6]。
3C裝置檢測項(xiàng)目多、缺陷類型繁雜,為便于統(tǒng)計(jì)分析,依據(jù)缺陷發(fā)生位置將缺陷劃分為弓網(wǎng)受流缺陷、接觸網(wǎng)幾何參數(shù)缺陷、接觸網(wǎng)零部件缺陷和受電弓零部件缺陷4類(見表1)。
表1 3C裝置檢出缺陷分類
對動(dòng)車組3C裝置獲得的燃弧、溫度、幾何參數(shù)等檢測數(shù)據(jù),依據(jù)TG/GD 124—2015《高速鐵路接觸網(wǎng)運(yùn)行維修規(guī)則》規(guī)定的設(shè)備運(yùn)行狀態(tài)標(biāo)準(zhǔn)值、警示值和限界值進(jìn)行界定,形成缺陷數(shù)據(jù)。接觸網(wǎng)缺陷診斷及分析以缺陷數(shù)據(jù)為基礎(chǔ),根據(jù)研究對象和應(yīng)用場景差異,采用診斷、統(tǒng)計(jì)、回歸、聚類等大數(shù)據(jù)方法,對接觸網(wǎng)設(shè)備局部缺陷和當(dāng)前狀態(tài)進(jìn)行診斷,對接觸網(wǎng)缺陷分布特征和演變規(guī)律進(jìn)行分析,并從受電弓型號差異、接觸網(wǎng)結(jié)構(gòu)差異和列車運(yùn)行速度等方面對弓網(wǎng)匹配關(guān)系進(jìn)行研究。接觸網(wǎng)缺陷診斷及分析總體技術(shù)路線見圖1。
圖1 接觸網(wǎng)缺陷診斷及分析總體技術(shù)路線
列車高速運(yùn)行中,檢測設(shè)備受陽光、雨雪、強(qiáng)光源等因素干擾,導(dǎo)致檢測數(shù)據(jù)在局部位置可能出現(xiàn)異常值,診斷方法通過對檢測數(shù)據(jù)進(jìn)行分析,剔除異常值引起的缺陷誤報(bào)。診斷方法是數(shù)據(jù)挖掘領(lǐng)域的一項(xiàng)重要技術(shù),其目標(biāo)是發(fā)現(xiàn)數(shù)據(jù)集中行為異常的少量數(shù)據(jù)對象。
接觸網(wǎng)檢測數(shù)據(jù)中的異常值確認(rèn)需融合離群點(diǎn)診斷算法和接觸網(wǎng)專業(yè)知識。以接觸線動(dòng)態(tài)高度檢測數(shù)據(jù)為例,依據(jù)《車載接觸網(wǎng)運(yùn)行狀態(tài)檢測裝置(3C)暫行技術(shù)條件》,接觸網(wǎng)幾何參數(shù)采樣間隔不高于1 m,依據(jù)TG/GD 124—2015《高速鐵路接觸網(wǎng)運(yùn)行維修規(guī)則》,兩相鄰吊弦點(diǎn)接觸線高差限界值為15 mm,吊弦間距一般為7~9 m[7],考慮動(dòng)態(tài)接觸線抬升量最大取150 mm,為便于估算,取裕度為35 mm,則相鄰采樣點(diǎn)間的接觸線高度變化不高于20 mm。設(shè)接觸線高度在某采樣鄰域內(nèi)的檢測數(shù)據(jù)為H={hi|i=1,2,…,n},若hx∈H屬于異常值,則基于k-最近鄰算法的接觸線高度檢測數(shù)據(jù)離群點(diǎn)診斷規(guī)則如下:
式中:N(hx,k)為不包含hx的k-最近鄰;d(hx,hi)為hx和hi之間的距離;|N(hx,k)|為N(hx,k)的集合大?。沪臑榕袆e閾值,取20 mm。
弓網(wǎng)匹配關(guān)系復(fù)雜,影響受流質(zhì)量因素眾多,除接觸網(wǎng)設(shè)備和參數(shù)狀態(tài)等主要因素外,還與列車運(yùn)行速度、氣候環(huán)境和地形條件等多種外部因素有關(guān),僅通過單次檢出的弓網(wǎng)缺陷(如燃?。o法準(zhǔn)確判斷接觸網(wǎng)參數(shù)或設(shè)備狀態(tài)。因此,在有限維修資源下,應(yīng)基于歷史檢測數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,并根據(jù)分析結(jié)果確定是否有必要實(shí)施現(xiàn)場復(fù)核和維修。
此外,評價(jià)特殊處所或整條線路的接觸網(wǎng)設(shè)備狀態(tài)時(shí),應(yīng)基于歷史檢測數(shù)據(jù),通過統(tǒng)計(jì)分析方法充分了解接觸網(wǎng)缺陷的位置和類型分布特征,確定動(dòng)態(tài)運(yùn)行質(zhì)量薄弱設(shè)備、區(qū)段和主要缺陷類型,為集中整治提供數(shù)據(jù)支持和維修建議。
統(tǒng)計(jì)方法以歷史檢測缺陷數(shù)據(jù)為樣本,對描述設(shè)備狀態(tài)和接觸網(wǎng)動(dòng)態(tài)性能的檢測參數(shù)和缺陷信息進(jìn)行統(tǒng)計(jì)分析,主要包括檢出頻次分析、集中趨勢分析、離散程度分析和經(jīng)驗(yàn)分布擬合等。
檢出頻次分析通過對一段時(shí)期內(nèi)同一區(qū)段中檢出缺陷的頻次進(jìn)行統(tǒng)計(jì),用于識別線路中接觸網(wǎng)缺陷頻發(fā)區(qū)段,并判斷單次檢出的缺陷是否值得耗費(fèi)維修資源。設(shè)p1,p2,…,pm為線路檢出的m個(gè)缺陷處的里程,將線路等分為n個(gè)統(tǒng)計(jì)區(qū)間l1,l2,…,ln,則第i個(gè)統(tǒng)計(jì)區(qū)間中的缺陷個(gè)數(shù)如下:
式中:card為集合的元素個(gè)數(shù)。
針對特定接觸網(wǎng)缺陷類型,集中趨勢和離散程度分析分別基于大量歷史檢測數(shù)據(jù)反映超限參數(shù)的整體水平和差異程度,經(jīng)驗(yàn)分布擬合則通過核估計(jì)方法給出超限參數(shù)的分布函數(shù)。集中趨勢分析的常用統(tǒng)計(jì)量包括平均值、中位數(shù)、眾數(shù),離散趨勢分析的常用統(tǒng)計(jì)量包括方差和標(biāo)準(zhǔn)差,經(jīng)驗(yàn)分布擬合通常采用核密度法對概率密度函數(shù)進(jìn)行估計(jì)。設(shè)X1,X2,…,Xn為超限參數(shù)的多次檢測數(shù)據(jù),在任意點(diǎn)x處的密度函數(shù)f(x)的核密度估計(jì)為:
式中:K為核密度函數(shù);h為窗寬。
為了確保f?(x)的合理性,要求核密度函數(shù)K滿足如下條件,即要求核密度函數(shù)K(x)是某個(gè)分布的密度函數(shù):
接觸網(wǎng)設(shè)備多種類型的故障和事故均由微小病害逐漸演變而成,如吊弦斷裂、線夾脫落、線索斷線等,針對該類病害,有必要通過回歸方法研究其劣化發(fā)展規(guī)律。3C裝置安裝在運(yùn)營動(dòng)車組上實(shí)現(xiàn)等速實(shí)時(shí)檢測,列車運(yùn)行速度數(shù)據(jù)豐富,包括從動(dòng)車組出站提速到高速運(yùn)行,再到進(jìn)站減速等各種速度條件,因此,可通過回歸算法研究速度與接觸網(wǎng)缺陷的關(guān)系,探索缺陷的發(fā)生機(jī)理,完善標(biāo)準(zhǔn)體系建設(shè)。另外,針對特殊處所或線路特定缺陷類型,可通過回歸方法預(yù)測在當(dāng)前維修條件下接觸網(wǎng)設(shè)備質(zhì)量發(fā)展趨勢,為優(yōu)化接觸網(wǎng)大修時(shí)間節(jié)點(diǎn)提供參考。
回歸方法是數(shù)據(jù)挖掘中應(yīng)用領(lǐng)域和應(yīng)用場景最多的方法之一,最常用的回歸方法為一元回歸方法,包括線性和非線性回歸。以估計(jì)速度v和缺陷值f的函數(shù)關(guān)系為例,設(shè)v和f的檢測數(shù)據(jù)為(vi,fi),設(shè)隨機(jī)誤差為εi,i=1,2,…,n,則一元線性回歸模型為:
式中:β0和β1分別為未知參數(shù),通常采用最小二乘法由數(shù)據(jù)(vi,fi)獲得β0和β1的估計(jì)β?0、β?1。
則速度v和缺陷值f的經(jīng)驗(yàn)回歸函數(shù)如下:
對于一元非線性回歸,通過描出數(shù)據(jù)的散點(diǎn)圖,判斷2個(gè)變量之間可能存在的函數(shù)關(guān)系,然后采用數(shù)學(xué)變化將其“線性化”或借助一些基本非線性函數(shù)進(jìn)行擬合,常用的非線性函數(shù)有冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)等[8]。
不同氣候環(huán)境下的弓網(wǎng)關(guān)系研究是對弓網(wǎng)關(guān)系理論的拓展,從京哈高鐵的高寒到蘭新高鐵的大風(fēng),再到海南環(huán)島高鐵的沿海等各種氣候環(huán)境,各種場景下均有3C檢測數(shù)據(jù),以此為基礎(chǔ),通過聚類方法進(jìn)行不同氣候環(huán)境下的弓網(wǎng)關(guān)系差異研究完全具備可行性。
我國動(dòng)車組裝配的受電弓型號多樣,不同型號受電弓因其機(jī)械結(jié)構(gòu)、控制策略等存在差異,導(dǎo)致在相同線路條件下運(yùn)行的弓網(wǎng)受流性能也不完全一致,動(dòng)車組3C裝置能采集到大量等速檢測數(shù)據(jù),可借助聚類方法將其用于研究不同型號受電弓的動(dòng)態(tài)性能差異。
為滿足山區(qū)、沿海、高原、大風(fēng)、高寒等各種復(fù)雜地質(zhì)條件和氣候環(huán)境下的不同運(yùn)營需求,我國接觸網(wǎng)進(jìn)行了適應(yīng)性選型,接觸網(wǎng)結(jié)構(gòu)繁雜[9],在相同受電弓運(yùn)行條件下,不同速度等級、設(shè)計(jì)高度、懸掛類型接觸網(wǎng)的弓網(wǎng)受流性能差異顯著,通過聚類方法可對此進(jìn)行研究。
聚類是將數(shù)據(jù)集合分成由類似對象組成的多個(gè)類或簇,k-均值聚類是應(yīng)用最廣泛的聚類方法之一。k-均值聚類的工作原理為隨機(jī)選取數(shù)據(jù)集合中的k個(gè)點(diǎn)作為初始聚類中心,然后計(jì)算剩余各樣本到聚類中心的距離,將它賦給最近的類,并重新計(jì)算每一類的平均值,整個(gè)過程不斷重復(fù),如果相鄰2次賦值沒有明顯變化,則說明劃分的類已收斂。k-均值聚類采用距離作為相似性的評價(jià)指標(biāo),即認(rèn)為2個(gè)對象的距離越近,其相似度就越大,常用的距離有絕對值距離、歐氏距離、切比雪夫距離等[10]。
動(dòng)車組3C裝置的接觸網(wǎng)動(dòng)態(tài)幾何參數(shù)檢測基于圖像識別技術(shù),在強(qiáng)光、雨雪等外部環(huán)境欠佳時(shí)可能會(huì)出現(xiàn)異常檢測數(shù)據(jù)。
采用k-最近鄰算法對某高速鐵路2021年1—5月間動(dòng)車組3C裝置檢測的接觸線高度和拉出值檢測數(shù)據(jù)進(jìn)行離群點(diǎn)診斷。由于動(dòng)態(tài)幾何參數(shù)與列車運(yùn)行速度有關(guān),因此,需對速度、拉出值、接觸線高度組成的三維數(shù)據(jù)進(jìn)行離群點(diǎn)診斷。
對速度、拉出值和接觸線高度檢測數(shù)據(jù)采用z-score算法進(jìn)行歸一化,采用歐式距離作為度量計(jì)算離群因子,k分別取值為2、3、4、5時(shí),離群因子計(jì)算結(jié)果(前100位)見圖2。
圖2 離群因子計(jì)算結(jié)果(前100位)
由圖2可知,k值取3、4、5時(shí),離群因子的衰減速度基本一致,且衰減速度的拐點(diǎn)均為7,因此,取k值為5,并將離群因子排序前7個(gè)點(diǎn)選為離群點(diǎn),離群點(diǎn)診斷結(jié)果見圖3。
圖3 離群點(diǎn)診斷結(jié)果
離群因子最大值處的檢測速度為123 km/h,接觸線高度檢測為5 479 mm,遠(yuǎn)高于該高速鐵路接觸網(wǎng)的高度設(shè)計(jì)值5 300 mm,屬于異常值,該處3C裝置拍攝的可見光圖像見圖4,可以看出,圖像上存在的黑色斑點(diǎn)(雨水)可能對圖像識別算法造成了影響,導(dǎo)致檢測數(shù)據(jù)出現(xiàn)異常。
圖4 接觸線高度異常值處的可見光圖像
3.2.1 局部缺陷頻次統(tǒng)計(jì)
2021年4月,3C裝置在某高速鐵路上行K499.805處檢出接觸線硬彎局部缺陷。為了確認(rèn)是否有必要對檢出缺陷實(shí)施現(xiàn)場復(fù)核調(diào)整,將線路長度按50 m進(jìn)行等長區(qū)間劃分,統(tǒng)計(jì)各區(qū)間2019年1月—2021年4月間檢出的接觸線硬彎缺陷頻數(shù)(見圖5)??梢姡琄499.805所屬區(qū)間K499.785—K499.835中檢出頻數(shù)最多,達(dá)到36次。
圖5 某高速鐵路上行接觸線硬彎缺陷頻數(shù)統(tǒng)計(jì)
查看該高速鐵路近期的高速弓網(wǎng)綜合檢測裝置(1C)檢測數(shù)據(jù)(見圖6),該位置檢出的硬點(diǎn)顯著大于附近其他位置,且存在持續(xù)時(shí)間較長的燃弧缺陷。
圖6 某高速鐵路的1C檢測數(shù)據(jù)
綜上分析可知,該高速鐵路上行K499.805處的接觸線硬彎缺陷存在,且在較長周期內(nèi)頻繁檢出,可安排現(xiàn)場復(fù)核調(diào)整。
3.2.2 檢測參數(shù)分布統(tǒng)計(jì)
TG/GD 124—2015《高速鐵路接觸網(wǎng)運(yùn)行維修規(guī)則》中規(guī)定分段絕緣器應(yīng)位于受電弓中心,一般情況下偏差不超過100 mm。2020年全路3C裝置檢出的分段絕緣器拉出值分布見圖7,可見,分段絕緣器位置的拉出值主要分布在100 mm以內(nèi),占77.75%,但仍有22.25%分布在100 mm以外,屬于分段絕緣器偏移,應(yīng)引起運(yùn)營維護(hù)單位的重視。
圖7 2020年檢出的分段絕緣器拉出值分布圖
對某高速鐵路2019年12月—2020年7月同一位置檢出的接觸線高度局部缺陷進(jìn)行分析,對檢測日期與接觸線高度數(shù)據(jù)進(jìn)行一元線性回歸,回歸函數(shù)為y=5.42x-5359.54,基于該函數(shù)預(yù)測未來3期接觸線高度檢測數(shù)據(jù)(見圖8),可見,該位置的接觸線高度檢測數(shù)據(jù)持續(xù)增加,2020年8—9月的檢測數(shù)據(jù)與預(yù)測結(jié)果基本一致。
圖8 某高速鐵路接觸線高度缺陷值回歸及預(yù)測
該位置2020年9月9日接觸線高度檢測數(shù)據(jù)見圖9,可見,該位置處于兩相鄰等高點(diǎn)中間,位于中心錨結(jié)附近。中心錨結(jié)是影響接觸網(wǎng)穩(wěn)定性的重要因素,中心錨結(jié)兩側(cè)受力,當(dāng)接觸網(wǎng)張力補(bǔ)償裝置出現(xiàn)異常時(shí),中心錨結(jié)位置的受力狀態(tài)通常會(huì)發(fā)生改變,導(dǎo)致動(dòng)態(tài)檢測數(shù)據(jù)異常。
圖9 某高速鐵路2020年9月9日接觸線高度檢測數(shù)據(jù)
按車型對某高速鐵路2019年1月—2021年4月檢出的燃弧數(shù)量進(jìn)行統(tǒng)計(jì),由于不同車型的檢測頻率存在差異,統(tǒng)計(jì)燃弧數(shù)量時(shí)以百公里缺陷數(shù)(平均每百公里檢測出的缺陷個(gè)數(shù))為準(zhǔn)。各月不同車型檢出的燃弧缺陷數(shù)量見圖10,可見,不同車型的檢測設(shè)備檢出的燃弧數(shù)量存在顯著差異。
圖10 某高速鐵路各月不同車型檢出的燃弧缺陷數(shù)量
為了解導(dǎo)致不同車型檢出燃弧數(shù)量存在差異的原因,采用k-均值法對車型聚類。燃弧缺陷屬于弓網(wǎng)匹配狀態(tài)異常,發(fā)生頻次與列車運(yùn)行速度密切相關(guān),聚類時(shí)需增加速度維度,計(jì)算各月檢出燃弧的列車運(yùn)行速度和百公里缺陷數(shù)均值(結(jié)果見表2)。
表2 各月檢測數(shù)據(jù)均值
以歐式距離作為度量,取聚類個(gè)數(shù)為3,隨機(jī)獲取初始聚類中心,采用k-均值法對表2中數(shù)據(jù)進(jìn)行聚類,各樣本與聚類中心的歐式距離及聚類結(jié)果見圖11。
圖11 各樣本與聚類中心的歐式距離及聚類結(jié)果
由圖11可知,第1類中各車型裝配的受電弓型號主要為CX,檢出燃弧時(shí)列車運(yùn)行速度高,燃弧百公里缺陷數(shù)量多;第2類中CRH2A、CRH5A裝備的受電弓型號為DSA250,CRH380D裝備的受電弓型號為CX,檢出燃弧時(shí)列車運(yùn)行速度低,燃弧百公里缺陷數(shù)量少;第3類CRH380BG裝配的受電弓型號為CX,檢出燃弧時(shí)列車運(yùn)行速度較高,燃弧百公里缺陷數(shù)量較多。
總體而言,該高速鐵路上各車型裝配CX型受電弓更易發(fā)生燃弧,裝配DSA250型受電弓發(fā)生燃弧的數(shù)量相對較少,且列車在高速運(yùn)行狀態(tài)下的燃弧發(fā)生更為頻繁。
基于動(dòng)車組3C檢測數(shù)據(jù),提出對接觸網(wǎng)設(shè)備局部缺陷和當(dāng)前狀態(tài)進(jìn)行診斷、對接觸網(wǎng)缺陷分布特征和演變規(guī)律進(jìn)行分析、對弓網(wǎng)匹配關(guān)系進(jìn)行探索的檢測數(shù)據(jù)挖掘方法,并結(jié)合案例在不同應(yīng)用場景下對方法的可行性和有效性進(jìn)行了驗(yàn)證。提出的檢測數(shù)據(jù)挖掘方法能夠有效提升3C檢測數(shù)據(jù)的分析效率和質(zhì)量,拓展3C檢測數(shù)據(jù)的分析深度和廣度,使得3C檢測系統(tǒng)能夠更好地服務(wù)于現(xiàn)場維修、設(shè)備管理和弓網(wǎng)關(guān)系研究。