孔令坤 中國鐵路上海局集團(tuán)有限公司海高鐵基礎(chǔ)設(shè)施段
上海高鐵基礎(chǔ)設(shè)施段地處長三角地區(qū),管內(nèi)供電管轄接觸網(wǎng)延展里程2 000.32條公里,是全路第一批踐行綜合養(yǎng)修模式的設(shè)備管理單位。隨著管內(nèi)滬寧、滬杭高鐵先后邁過首個(gè)“十年周期”,接觸網(wǎng)設(shè)備老化問題日趨凸顯、動(dòng)態(tài)監(jiān)測缺陷日益增多。為了不斷發(fā)掘檢測數(shù)據(jù)潛力,提高設(shè)備質(zhì)量,我們立足自身養(yǎng)修經(jīng)驗(yàn),引進(jìn)大數(shù)據(jù)分析算法,在實(shí)踐中摸索出一套動(dòng)檢數(shù)據(jù)的分析方法,幫助我們從龐大的檢測數(shù)據(jù)中找到薄弱設(shè)備,提高接觸網(wǎng)的運(yùn)行質(zhì)量和可靠性。
接觸網(wǎng)動(dòng)態(tài)監(jiān)測裝備包括高鐵綜合檢測車(簡稱1C)和運(yùn)營動(dòng)車組車載檢測裝置(簡稱3C),用于測量升弓條件下的接觸線幾何參數(shù)、接觸壓力、燃弧量等參數(shù)。1C和3C裝置的測量原理不同,因此其測量值和下發(fā)缺陷也有很大不同,數(shù)據(jù)分析時(shí)要綜合考慮。
(1)1C裝置和3C裝置的幾何參數(shù)測量模塊不同,前者采用雙線陣相機(jī)和視覺三角測量法,后者采用圖像深度學(xué)習(xí)技術(shù)進(jìn)行識別,但都滿足±10 mm以內(nèi)的測量精度。但由于不同車型在同一曲線軌道下的的橫滾、橫擺幅度不同,拉出值參數(shù)測量值存在較大差別。
(2)1C裝置和3C裝置的檢測受電弓型號不同,前者采用DSA380或SS400型雙滑板受電弓,后者普遍采用CX-PG型單滑板受電弓,其接觸力和燃弧特性都有很大區(qū)別。
(3)1C裝置和3C裝置的燃弧量測量原理不同,前者采用紫外相機(jī),對一跨內(nèi)燃弧像素出現(xiàn)時(shí)間進(jìn)行累加,后者采用對銅金屬燃燒光線波段敏感的紅外熱成像相機(jī)對接觸網(wǎng)進(jìn)行測溫并計(jì)算單次燃弧的持續(xù)時(shí)間。
由于不同檢測車受電弓的型號、開閉口、初始壓力不同,檢測車通過時(shí)的車速、環(huán)境溫度、濕度、電磁干擾因素也不相同,所以每次檢測的接觸力、燃弧值存在顯著差異。此外檢測系統(tǒng)采用的機(jī)車GYK里程,與實(shí)際里程存在隨機(jī)誤差,因此我們在大數(shù)據(jù)分析前要對單次檢車情況進(jìn)行評估,剔除無效數(shù)據(jù)。
我們通過pyqt5界面開發(fā)庫和pandas數(shù)據(jù)處理庫開發(fā)數(shù)據(jù)批量導(dǎo)入分析工具,對每次檢測下發(fā)的數(shù)據(jù)進(jìn)行篩選與統(tǒng)計(jì)分析,分別計(jì)算每次檢測的缺陷數(shù)量占比、達(dá)速率(包括統(tǒng)計(jì)得分長度、不得分長度、不評價(jià)長度、未檢測長度等)、得分與非得分區(qū)段的CDI分量分析(統(tǒng)計(jì)CDI各分量的平均值、中位值、標(biāo)準(zhǔn)差等)、錨段CDI分量的得分分布情況,并進(jìn)行可視化,分析各測量傳感器的工作狀態(tài)是否良好。單次檢測數(shù)據(jù)分析結(jié)果如圖1所示。
圖1 單次動(dòng)檢數(shù)據(jù)分析界面
如圖1所示,本次檢測CDI管理評分僅為64.5%,且CDI不得分錨段較多。從CDIA的平均分和頻數(shù)分布可以看出,絕大多數(shù)錨段的燃弧得分接近滿分,說明燃弧傳感器工作狀態(tài)異常。缺陷中占比最大的是接觸力缺陷,共有17個(gè),但從接觸力均值和頻數(shù)分布看,全線的接觸力得分主要集中在較小的范圍,接觸力傳感器工作正常。
動(dòng)檢數(shù)據(jù)具有以下幾個(gè)特點(diǎn):數(shù)據(jù)量龐大、多次檢測一致性不強(qiáng)、里程上存在隨機(jī)誤差。因此我們需要根據(jù)動(dòng)檢數(shù)據(jù)的特點(diǎn),運(yùn)用大數(shù)據(jù)分析方法,篩選經(jīng)常存在檢測大值的薄弱區(qū)段,并分析其發(fā)生發(fā)展過程。
圖2是某高鐵1-5月整條線路各單元CDI得分隨里程變化情況,雖然單個(gè)錨段的CDI曲線在不同月份略有不同,但其整體變化趨勢呈現(xiàn)出明顯的規(guī)律,在K81、K148處存在明顯高于附近的大值。
圖2 某高鐵1-5月錨段CDI曲線
通過pygraph庫生成多次CDI數(shù)據(jù)曲線對比圖,通過同步平移里程坐標(biāo),對比同一錨段不同日期的CDI得分變化。圖3是某高鐵線路K60-K80范圍內(nèi)四次檢測的CDI曲線,為排除車型不同的干擾,均采用CRH2C-2150的檢測數(shù)據(jù)??梢钥闯鰴z測速度對CDI得分影響較大,相同速度下得分變化趨勢一致性較強(qiáng)。通過對比多次檢測曲線的CDI大值的一致性,可以進(jìn)一步確認(rèn)CDI超標(biāo)錨段。
圖3 同一線路多次CDI檢測曲線對比界面
CDI原始數(shù)據(jù)是按錨段逐行排列的,分析某個(gè)錨段的歷史變化情況,首先需要將同一錨段的不同次檢測的數(shù)據(jù)劃分到一組。因此我們引入了聚類算法,按照起止公里標(biāo)相近的原則將錨段數(shù)據(jù)進(jìn)行分組。
常用的聚類算法有K-Means、均值偏移、DBSCAN和層次聚類等。由于在聚類前不確定簇的個(gè)數(shù),原始數(shù)據(jù)包含離群點(diǎn)(例如某一次檢測的里程誤差過大),且需同時(shí)考慮錨段公里標(biāo)和錨段長度兩個(gè)量的相近程度,擬選用基于密度空間的無監(jiān)督學(xué)習(xí)算法DBSCAN進(jìn)行聚類。
對我段兩年來共計(jì)85 242條CDI錨段數(shù)據(jù)進(jìn)行聚類試驗(yàn),密度函數(shù)選用起、止公里標(biāo)差值的歐式距離,最小鄰近距離設(shè)為100 m,最小簇大小設(shè)置為3,本次聚類成功的數(shù)據(jù)條數(shù)為83 817,占比98.3%,滿足要求。
通過聚類計(jì)算,每組聚類成功的CDI錨段數(shù)據(jù)都獲得了一個(gè)簇編號,簇編號相同的錨段即為同一錨段。然后按照FRM算法依次對每一簇?cái)?shù)據(jù)進(jìn)行統(tǒng)計(jì),即計(jì)算F(近度:最近一次不達(dá)標(biāo)時(shí)間)、R(頻度:不達(dá)標(biāo)次數(shù)÷達(dá)速次數(shù))、M(額度:CDI超標(biāo)最大值)、不達(dá)標(biāo)時(shí)間分布(每季度不達(dá)標(biāo)次數(shù))。最后編寫用戶界面,對分類結(jié)果分線別、行別進(jìn)行展示,如圖4所示:點(diǎn)擊左表中某一錨段,右側(cè)顯示每次檢測結(jié)果并繪制柱形圖,分析該錨段CDI各分量的歷史變化情況。
圖4 不得分CDI錨段歷史分析
接觸網(wǎng)的動(dòng)檢缺陷數(shù)據(jù)是指1C或3C裝置下發(fā)的缺陷及報(bào)警數(shù)據(jù),其特點(diǎn)是一級缺陷數(shù)量較少,二級缺陷數(shù)量龐大且偶發(fā)性強(qiáng)。缺陷分析中我們最關(guān)注的缺陷有兩種:固定處所頻繁檢出的、首次檢出的。前者表示某處接觸網(wǎng)經(jīng)常處于一種不良的運(yùn)行工況中,后著則表示設(shè)備狀態(tài)可能發(fā)生了突變。因此我們首先需要分析缺陷發(fā)生的頻繁程度。
動(dòng)檢缺陷數(shù)據(jù)的聚類同樣根據(jù)缺陷里程參數(shù)的分布密度,缺陷里程數(shù)據(jù)跟CDI數(shù)據(jù)中的里程數(shù)據(jù)類似,同樣存在50 m左右的誤差,但使用DBSCAN進(jìn)行聚類的效果并不好。因?yàn)槿毕輸?shù)據(jù)的里程只有1維,且沒有明顯間隔,導(dǎo)致DBSCAN聚類后的簇寬度會(huì)達(dá)到2 km或更長。為了縮小簇寬度,我們選用里程窗滑動(dòng)求頻次的方法進(jìn)行聚類,具體方法是:選用固定公里標(biāo)窗口按10 m步進(jìn)平移,依次求窗口范圍內(nèi)的缺陷數(shù)量,得到全線的頻數(shù)曲線,然后利用finkpeak算法找到頻率峰值所在的位置。圖5是某線K50-K75內(nèi)接觸線接觸力缺陷頻數(shù)曲線(100 m窗),叉號表示用finkpeak算法找到的頻數(shù)曲線波峰。
圖5 某線K50-K75范圍內(nèi)接觸力缺陷頻數(shù)分布情況
把計(jì)算得到的某個(gè)峰值里程數(shù)據(jù)代入動(dòng)檢缺陷庫查詢,得到一個(gè)缺陷信息分組,分組內(nèi)的缺陷視為同一接觸網(wǎng)設(shè)備產(chǎn)生。對每個(gè)信息簇統(tǒng)計(jì)P(近度:最近一次產(chǎn)生缺陷時(shí)間)、F(頻度:最近兩年每季度的缺陷個(gè)數(shù))、M(幅度:缺陷最大值),得到該組缺陷的分類統(tǒng)計(jì)信息。最后利用pygraph可視化工具實(shí)時(shí)輸出每組缺陷關(guān)于日期、里程的散點(diǎn)分布圖,進(jìn)一步確認(rèn)缺陷的集中程度,具體界面如圖6。
圖6 動(dòng)檢缺陷聚類分組分析界面
前文介紹了從龐大的數(shù)據(jù)中篩選高頻缺陷和突發(fā)缺陷的方法,實(shí)現(xiàn)了對缺陷庫的動(dòng)態(tài)分組管理,大大減少了需要關(guān)注數(shù)據(jù)的個(gè)數(shù)。為了更有效地指導(dǎo)檢修,還需要對缺陷數(shù)據(jù)進(jìn)行深度分析,判斷缺陷產(chǎn)生的原因和危險(xiǎn)程度。
接觸網(wǎng)是一個(gè)系統(tǒng)性工程,因此我們要充分利用各種數(shù)據(jù),通過橫向關(guān)聯(lián)對比、縱向歷史追溯等方法,全面掌握缺陷設(shè)備的狀態(tài)變化。同樣,對同類型缺陷進(jìn)行專項(xiàng)綜合分析,找出各種可能原因中的共性因素,不僅可以幫我們找到快速識別該類型缺陷的方法,也可以指導(dǎo)現(xiàn)場對同類設(shè)備進(jìn)行補(bǔ)強(qiáng),是一種靈活、有效地提高設(shè)備可靠性的方法。
我們編制程序,自動(dòng)將缺陷信息根據(jù)里程關(guān)聯(lián)線路基礎(chǔ)數(shù)據(jù)、檢測數(shù)據(jù)、生產(chǎn)數(shù)據(jù)等,分類匯總生成樹形數(shù)據(jù)結(jié)構(gòu),以便分析人員根據(jù)需要進(jìn)行查詢。
主要包括缺陷里程附近的軌道環(huán)境信息和接觸網(wǎng)設(shè)備信息。軌道環(huán)境信息主要包括鋼軌的曲線、豎曲線、坡度、橋梁、隧道、區(qū)間、通道門等。設(shè)備特征主要包括在關(guān)節(jié)、線岔、分相內(nèi)的具體位置、附近是否有電連接、硬橫梁等。
為了便于分析人員查看,將匹配到的每個(gè)信息條進(jìn)行計(jì)算,按照固定格式生成一個(gè)新字段。例如,曲線信息可以縮寫為:“曲線半徑”-“外軌超高”-“距起點(diǎn)長度”-“距終點(diǎn)長度”-“是否屬于緩和曲線”-“緩和曲線長度”。
主要包括對缺陷地點(diǎn)檢測的1C、4C的弓網(wǎng)波形數(shù)據(jù)的查詢。受制于1C、4C數(shù)據(jù)解析方法不開放,無法直接使用,所以我們利用python-win32工具調(diào)用波形查看軟件的操作系統(tǒng)接口,自動(dòng)對缺陷位置的每次檢測曲線進(jìn)行截圖,并附上本次檢測的車型、速度、檢測弓開口、所屬錨段CDI均值等信息。針對1C波形公里標(biāo)誤差較大的問題,我們根據(jù)CDI錨段數(shù)據(jù)庫中錨段的起始里程對缺陷里程進(jìn)行重定位,取得良好的對齊效果。
主要包括1C、2C、3C缺陷庫和檢修問題庫中與弓網(wǎng)關(guān)系相關(guān)的缺陷的查詢。并對查詢到的每類缺陷信息進(jìn)行梳理統(tǒng)計(jì),合并生成一個(gè)字段,并鏈接到查詢到的各類數(shù)據(jù)表。合并字段包括缺陷頻次和缺陷類型兩個(gè)部分。缺陷頻度為當(dāng)前日期往前每三個(gè)月缺陷發(fā)生的次數(shù),缺陷類型信息為缺陷類型和發(fā)生次數(shù)。例如,某缺陷的3C查詢結(jié)果為:“0-4-6-8-6_疑似中錨線夾燃弧:3_疑似燃弧:3-疑似吊弦松_2”。
動(dòng)檢數(shù)據(jù)分析方法是一個(gè)不斷發(fā)展的過程。我們在數(shù)據(jù)獲取廣度、分析深度上還有很大提升空間。我們將以近些年來多發(fā)的接觸網(wǎng)故障為問題導(dǎo)向,分析故障設(shè)備的典型特征,不斷改進(jìn)分析方法。對現(xiàn)有檢測設(shè)備無法覆蓋的風(fēng)險(xiǎn),要加強(qiáng)技術(shù)攻關(guān),改進(jìn)檢測設(shè)備,不斷縮小接觸網(wǎng)檢測與設(shè)備安全、現(xiàn)場維修之間的鴻溝。
此外,接觸網(wǎng)檢測管理正朝著大數(shù)據(jù)管理、智能分析方向不斷發(fā)展。通過建立局級、站級別的6c數(shù)據(jù)中心,實(shí)現(xiàn)不同檢測設(shè)備、不同類型檢測數(shù)據(jù)之間的互聯(lián)互通和多用戶實(shí)時(shí)操作,旨在解決數(shù)據(jù)孤島和信息傳遞效率低下的弊病。