郭劍峰,劉金朝,陶凱,代春平,高佳佳,張川
(中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司基礎(chǔ)設(shè)施檢測(cè)研究所,北京 100081)
隨著信息技術(shù)的飛速發(fā)展與業(yè)務(wù)數(shù)據(jù)的不斷積累,國(guó)內(nèi)外各行各業(yè)在數(shù)據(jù)應(yīng)用之前都面臨著對(duì)數(shù)據(jù)進(jìn)行綜合治理的實(shí)際問(wèn)題。近年來(lái),數(shù)據(jù)成為一種無(wú)形資產(chǎn)的概念逐漸深入人心,數(shù)據(jù)綜合治理和數(shù)據(jù)資產(chǎn)管理的重要性也愈發(fā)凸顯。
國(guó)內(nèi)外諸多學(xué)者研究了數(shù)據(jù)綜合治理技術(shù),并將這種技術(shù)應(yīng)用在對(duì)鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)的綜合治理過(guò)程中。1995年,新西蘭懷卡托大學(xué)的Garner等[1]開(kāi)發(fā)了懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),研發(fā)了首個(gè)JAVA環(huán)境下的開(kāi)源數(shù)據(jù)挖掘軟件,具有簡(jiǎn)單的數(shù)據(jù)治理功能,可以實(shí)現(xiàn)數(shù)據(jù)清洗、集成、規(guī)約、變換等基本功能。1998年,美國(guó)IBM公司研發(fā)了IBM Intelligent Miner工具[2],支持對(duì)商業(yè)數(shù)據(jù)的清洗、統(tǒng)計(jì)挖掘和關(guān)聯(lián)分析等數(shù)據(jù)處理功能,利用模糊邏輯和神經(jīng)網(wǎng)絡(luò)技術(shù)處理原始數(shù)據(jù)中的不規(guī)范表達(dá)式等問(wèn)題,使用數(shù)據(jù)的前后邏輯關(guān)系進(jìn)行推理,自動(dòng)填補(bǔ)數(shù)據(jù)中的缺失值。2005—2010年,美國(guó)谷歌公司先后研發(fā)了 Google Sawzall[3]、Google Dremel[4]和Google Flume Java[5]等工具,實(shí)現(xiàn)了對(duì)PB級(jí)海量結(jié)構(gòu)化數(shù)據(jù)的快速查詢(xún)統(tǒng)計(jì)、數(shù)據(jù)格式轉(zhuǎn)化和數(shù)據(jù)清洗等治理功能,借助于Hadoop大數(shù)據(jù)分布式系統(tǒng)架構(gòu),支持簡(jiǎn)單的并行計(jì)算,形成了一系列的通用數(shù)據(jù)治理工具。利用這些交互式的通用數(shù)據(jù)治理工具,可以組建成規(guī)模上千的集群,對(duì)PB級(jí)的海量數(shù)據(jù)快速治理。
上述通用數(shù)據(jù)治理工具存在數(shù)據(jù)治理手段較為簡(jiǎn)單、對(duì)數(shù)據(jù)各個(gè)維度之間的關(guān)聯(lián)關(guān)系和每一個(gè)維度時(shí)間序列的歷史變化等關(guān)系處理不足等缺點(diǎn),導(dǎo)致了通用數(shù)據(jù)治理工具對(duì)專(zhuān)業(yè)數(shù)據(jù)治理的操作能力不足。
在鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)綜合治理技術(shù)研究方面,國(guó)內(nèi)外諸多學(xué)者將上述通用數(shù)據(jù)治理思想引入到鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)綜合治理問(wèn)題的研究中。徐鵬[6]提出軌檢車(chē)檢測(cè)數(shù)據(jù)里程偏差修正的數(shù)據(jù)治理方法,利用閾值處理、地圖匹配、相關(guān)分析和動(dòng)態(tài)規(guī)劃等技術(shù)建立了一個(gè)修正軌檢車(chē)檢測(cè)數(shù)據(jù)里程與線路設(shè)備里程之間偏差的模型,初步解決了對(duì)軌檢車(chē)軌道幾何檢測(cè)數(shù)據(jù)的里程治理問(wèn)題。許貴陽(yáng)等[7-8]基于相關(guān)系數(shù)最大化,提出對(duì)檢測(cè)數(shù)據(jù)里程自動(dòng)修正的數(shù)據(jù)治理方法,并通過(guò)對(duì)高速鐵路大量實(shí)測(cè)數(shù)據(jù)的處理驗(yàn)證了方法的有效性和實(shí)用性。王同軍[9]分析了我國(guó)鐵路在大數(shù)據(jù)時(shí)代面臨的數(shù)據(jù)治理手段缺乏等問(wèn)題,提出中國(guó)鐵路大數(shù)據(jù)應(yīng)用頂層設(shè)計(jì)。Karakose等[10]提出接觸網(wǎng)檢測(cè)數(shù)據(jù)中網(wǎng)壓和網(wǎng)流數(shù)據(jù)的治理方法,通過(guò)對(duì)網(wǎng)流數(shù)據(jù)低通濾波消除網(wǎng)流數(shù)據(jù)中的高頻噪聲,并在一定頻率范圍內(nèi)取這些數(shù)據(jù)的絕對(duì)值確定無(wú)噪聲數(shù)據(jù)的峰值,利用峰值對(duì)數(shù)據(jù)歸一化,之后使用線性插值方法將這些點(diǎn)組合得到一個(gè)新的數(shù)據(jù),利用生成的新數(shù)據(jù)對(duì)受電弓拉弧進(jìn)行準(zhǔn)確檢測(cè)。秦航遠(yuǎn)等[11]提出里程偏差二次修正的檢測(cè)數(shù)據(jù)治理方法,使用五點(diǎn)迭代法提高參考里程與待校準(zhǔn)里程相關(guān)性分析的計(jì)算效率。武威等[12]研究了高鐵運(yùn)營(yíng)安全規(guī)律分析數(shù)據(jù)的治理及應(yīng)用方法,構(gòu)建了面向高鐵運(yùn)營(yíng)安全規(guī)律分析的數(shù)據(jù)治理架構(gòu)。
雖然上述專(zhuān)業(yè)的鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)治理技術(shù)可以解決一些問(wèn)題,但我國(guó)在鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)綜合治理方面仍面臨著各專(zhuān)業(yè)單獨(dú)發(fā)展、缺少統(tǒng)一綜合治理技術(shù)規(guī)劃和標(biāo)準(zhǔn)等問(wèn)題。數(shù)據(jù)綜合治理包含很多內(nèi)容,從數(shù)據(jù)智能清洗到數(shù)據(jù)評(píng)估模型,企業(yè)數(shù)據(jù)的綜合治理越來(lái)越受到重視。因此,亟需研究一套完整的鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)綜合治理技術(shù)。
鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)綜合治理總體技術(shù)路線見(jiàn)圖1,包括數(shù)據(jù)預(yù)處理、里程修正、無(wú)效識(shí)別和質(zhì)量評(píng)估4個(gè)部分。在數(shù)據(jù)預(yù)處理部分研究了基于臺(tái)賬信息的基準(zhǔn)文件自動(dòng)生成技術(shù);在里程修正部分研究了基于最大相關(guān)系數(shù)的多次檢測(cè)數(shù)據(jù)里程自動(dòng)對(duì)準(zhǔn)技術(shù);在無(wú)效識(shí)別部分研究了基于人工智能的無(wú)效數(shù)據(jù)智能檢測(cè)技術(shù);在質(zhì)量評(píng)估部分分別研究了數(shù)據(jù)的完整性、有效性和一致性評(píng)估技術(shù)。
圖1 鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)綜合治理總體技術(shù)路線
在數(shù)據(jù)預(yù)處理過(guò)程中,首先要基于線路的臺(tái)賬信息自動(dòng)生成檢測(cè)數(shù)據(jù)的基準(zhǔn)文件。因?yàn)楝F(xiàn)有的鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)治理過(guò)程中,首先需要人工配置一個(gè)基準(zhǔn)文件,用于后續(xù)對(duì)檢測(cè)數(shù)據(jù)的里程修正。人工配置基準(zhǔn)文件的工作量較大,并且不能根據(jù)臺(tái)賬的變化自動(dòng)更新基準(zhǔn)文件。人工配置基準(zhǔn)文件的準(zhǔn)確性與操作人員的經(jīng)驗(yàn)水平等因素密切相關(guān),因此配置結(jié)果具有較大的個(gè)體化差異,無(wú)法建立統(tǒng)一的配置標(biāo)準(zhǔn)。人工配置的基準(zhǔn)文件見(jiàn)圖2。
圖2 人工配置基準(zhǔn)文件
人工配置基準(zhǔn)文件時(shí),需要逐一手動(dòng)添加索引點(diǎn),例如圖中需要根據(jù)線路的曲線臺(tái)賬信息,結(jié)合超高通道的波形變化情況,人工將檢測(cè)數(shù)據(jù)中的1 611.840檢測(cè)點(diǎn)里程修正為1 611.844。當(dāng)人工配置的基準(zhǔn)文件不夠準(zhǔn)確時(shí),后續(xù)數(shù)據(jù)治理算法可能不會(huì)得到滿意的治理結(jié)果,可見(jiàn)后續(xù)數(shù)據(jù)治理算法對(duì)基準(zhǔn)文件的依賴(lài)性較強(qiáng)。若能基于臺(tái)賬信息自動(dòng)生成檢測(cè)數(shù)據(jù)基準(zhǔn)文件,可有效解決人工配置基準(zhǔn)文件效率較低、標(biāo)準(zhǔn)不統(tǒng)一和配置差異性較大等問(wèn)題。
為解決上述問(wèn)題,研究了基于臺(tái)賬信息的基準(zhǔn)文件自動(dòng)生成技術(shù)。人工配置基準(zhǔn)文件時(shí),通?;谂_(tái)賬中的曲線信息,結(jié)合檢測(cè)數(shù)據(jù)的超高信息,手動(dòng)尋找對(duì)應(yīng)的索引點(diǎn)?;谂_(tái)賬信息的檢測(cè)數(shù)據(jù)基準(zhǔn)文件自動(dòng)生成技術(shù)通過(guò)將檢測(cè)數(shù)據(jù)的超高通道與曲線臺(tái)賬信息使用5點(diǎn)迭代法尋找最佳匹配點(diǎn)[10],再對(duì)匹配后的數(shù)據(jù)做插值處理,從而實(shí)現(xiàn)對(duì)基準(zhǔn)文件的自動(dòng)生成預(yù)處理。
某高速鐵路的曲線臺(tái)賬信息自動(dòng)生成的檢測(cè)數(shù)據(jù)基準(zhǔn)文件示意見(jiàn)圖3。
圖3 基于臺(tái)賬自動(dòng)生成的檢測(cè)數(shù)據(jù)基準(zhǔn)文件示意圖
圖中紅色實(shí)線為臺(tái)賬的原始信息,綠色虛線為自動(dòng)生成的基準(zhǔn)文件,兩線高度重合,基準(zhǔn)文件包含自動(dòng)獲得的超高通道里程信息。
基于臺(tái)賬信息的檢測(cè)數(shù)據(jù)基準(zhǔn)文件自動(dòng)生成技術(shù)可徹底解決人工配置基準(zhǔn)文件效率低和差異性大等問(wèn)題,不僅提高了配置基準(zhǔn)文件的工作效率,且具有較高的配置精度和配置結(jié)果唯一性。
由于檢測(cè)車(chē)在不同時(shí)期運(yùn)行過(guò)程中會(huì)產(chǎn)生一定范圍內(nèi)的里程偏差,因此對(duì)于同一條鐵路線路不同時(shí)期采集的多次檢測(cè)數(shù)據(jù),通常存在著一定范圍的里程偏差(見(jiàn)圖4)。
圖4 多次檢測(cè)數(shù)據(jù)里程偏差示意圖
對(duì)多次不同時(shí)期采集的檢測(cè)數(shù)據(jù)進(jìn)行里程修正是開(kāi)展數(shù)據(jù)分析工作的前提,準(zhǔn)確的里程信息可以輔助養(yǎng)護(hù)維修人員快速、準(zhǔn)確地定位病害所在位置,此外還可輔助數(shù)據(jù)分析人員利用多次檢測(cè)數(shù)據(jù)對(duì)比分析軌道幾何狀態(tài)變化趨勢(shì)、利用大數(shù)據(jù)技術(shù)深度挖掘數(shù)據(jù)價(jià)值等研究工作。
多次檢測(cè)數(shù)據(jù)里程自動(dòng)對(duì)準(zhǔn)技術(shù)的總體流程見(jiàn)圖5。主要包括自動(dòng)生成基準(zhǔn)文件、定時(shí)獲取數(shù)據(jù)、里程重構(gòu)、里程校正、斷鏈里程調(diào)整和校正效果評(píng)價(jià)6個(gè)部分。
圖5 多次檢測(cè)數(shù)據(jù)里程自動(dòng)對(duì)準(zhǔn)技術(shù)總體流程
基于相關(guān)系數(shù)最大化原理,提出一種更加穩(wěn)健的多次檢測(cè)數(shù)據(jù)里程自動(dòng)對(duì)準(zhǔn)算法。使用軌距、超高、左右高低等通道,計(jì)算多次檢測(cè)數(shù)據(jù)各通道對(duì)應(yīng)的相關(guān)系數(shù)。設(shè)基準(zhǔn)文件片段x有m個(gè)數(shù)據(jù)點(diǎn),目標(biāo)文件片段y有n個(gè)數(shù)據(jù)點(diǎn),考慮到多次檢測(cè)數(shù)據(jù)的里程誤差,通常建議m≥800,n≥4m,則相關(guān)系數(shù)r的計(jì)算方法為:
式中:r(k)為第k次比較得到的相關(guān)系數(shù);i為數(shù)據(jù)片段中的第i個(gè)數(shù)據(jù)點(diǎn);k為比較次數(shù);x(i)為基準(zhǔn)文件片段中第i個(gè)數(shù)據(jù)點(diǎn)的值;y(i)為目標(biāo)文件片段中第i個(gè)數(shù)據(jù)點(diǎn)的值;為基準(zhǔn)文件片段的平均值;為目標(biāo)文件片段的平均值。
計(jì)算得到相關(guān)系數(shù)后,尋找最大相關(guān)系數(shù)所在位置。為提升算法的穩(wěn)健性,由于數(shù)據(jù)中存在著無(wú)效數(shù)據(jù)的干擾,會(huì)導(dǎo)致在計(jì)算過(guò)程中出現(xiàn)各通道的最大相關(guān)系數(shù)位置差異較大?;诋惓z測(cè)技術(shù),將差異較大的通道進(jìn)行剔除,從而減少對(duì)里程修正結(jié)果的干擾,確保了算法的穩(wěn)健性。此外,測(cè)試結(jié)果表明該算法即使在未對(duì)檢測(cè)數(shù)據(jù)中的無(wú)效區(qū)段進(jìn)行預(yù)處理的情況下,仍可減少無(wú)效數(shù)據(jù)對(duì)里程修正算法的影響。
利用上述基于最大相關(guān)系數(shù)的檢測(cè)數(shù)據(jù)里程自動(dòng)對(duì)準(zhǔn)算法對(duì)某條高速鐵路的多次實(shí)際軌道幾何檢測(cè)數(shù)據(jù)進(jìn)行里程自動(dòng)修正,實(shí)測(cè)結(jié)果見(jiàn)圖6。
圖6 里程修正前后超高通道對(duì)應(yīng)波形
圖6中所示為算法對(duì)超高通道里程修正結(jié)果,圖6(b)上方紅色曲線為根據(jù)線路曲線臺(tái)賬自動(dòng)生成的基準(zhǔn)文件超高數(shù)據(jù),下方曲線為里程修正后的多次檢測(cè)數(shù)據(jù)目標(biāo)文件的超高數(shù)據(jù)。
基于最大相關(guān)系數(shù)的多次檢測(cè)數(shù)據(jù)里程自動(dòng)對(duì)準(zhǔn)算法與目前已有檢測(cè)數(shù)據(jù)里程自動(dòng)修正算法相比,具有如下兩方面的優(yōu)勢(shì):
(1)準(zhǔn)確性提高。通過(guò)對(duì)軌距、超高、左右高低等通道的相關(guān)匹配,可以準(zhǔn)確找到基準(zhǔn)文件中所有的里程修正點(diǎn),提高了里程修正算法的準(zhǔn)確性。使用新算法和傳統(tǒng)算法對(duì)某高速鐵路軌道幾何檢測(cè)數(shù)據(jù)進(jìn)行里程修正時(shí)的計(jì)算結(jié)果比較見(jiàn)表1。
表1 兩種算法計(jì)算結(jié)果比較 km
從表1中可見(jiàn),在預(yù)設(shè)的10個(gè)修正點(diǎn)中,傳統(tǒng)的里程修正算法未找到其中4個(gè)修正點(diǎn),會(huì)導(dǎo)致后續(xù)里程校準(zhǔn)工作在插值時(shí)整個(gè)區(qū)段的匹配精度降低。新算法能找到全部預(yù)設(shè)里程修正點(diǎn),可更加準(zhǔn)確地進(jìn)行后續(xù)里程修正工作。
(2)計(jì)算效率提高。以不同線路長(zhǎng)度的高速鐵路實(shí)測(cè)軌道幾何檢測(cè)數(shù)據(jù)為例,分別使用傳統(tǒng)算法和新算法對(duì)檢測(cè)數(shù)據(jù)進(jìn)行里程修正,計(jì)算時(shí)間對(duì)比見(jiàn)圖7。
圖7 算法計(jì)算時(shí)間對(duì)比
圖7中所示的計(jì)算結(jié)果是利用Jupyter Notebook運(yùn)行在Win10 64位操作系統(tǒng)、Intel Core i7處理器、8G RAM的實(shí)驗(yàn)環(huán)境下得到的結(jié)果。與已有算法相比,新算法在處理短線路時(shí)具有更高的計(jì)算效率。
由于在檢測(cè)過(guò)程中,陽(yáng)光、雨雪天氣和電磁環(huán)境等因素會(huì)對(duì)傳感器造成干擾,部分傳感器可能會(huì)發(fā)生故障,因此鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)中通常存在部分無(wú)效數(shù)據(jù)。目前對(duì)這些無(wú)效數(shù)據(jù)識(shí)別通常采用特征提取方式,通過(guò)匹配無(wú)效特征來(lái)識(shí)別無(wú)效數(shù)據(jù)。隨著人工智能技術(shù)的發(fā)展,深度學(xué)習(xí)為無(wú)效數(shù)據(jù)的智能檢測(cè)提供了一條新的途徑。傳統(tǒng)的特征提取方法在一些特征明顯的單通道數(shù)據(jù)無(wú)效識(shí)別上有較好的應(yīng)用效果,但在對(duì)具有復(fù)雜特征和復(fù)合特征的無(wú)效數(shù)據(jù)上識(shí)別效果有待提高。此外,基于特征提取的單通道無(wú)效識(shí)別方式較難識(shí)別出多通道數(shù)據(jù)的復(fù)合無(wú)效。深度學(xué)習(xí)作為目前人工智能領(lǐng)域中有效的特征提取和分類(lèi)手段,已被廣泛應(yīng)用到數(shù)據(jù)治理無(wú)效識(shí)別的實(shí)際工程問(wèn)題中,并取得了較好的應(yīng)用效果。
基于全卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)深度學(xué)習(xí)的無(wú)效數(shù)據(jù)智能檢測(cè)技術(shù),可根據(jù)輸入的鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)自動(dòng)識(shí)別數(shù)據(jù)中的無(wú)效區(qū)段,并輸出相應(yīng)的無(wú)效類(lèi)型、判斷為無(wú)效的概率和無(wú)效的里程范圍。該全卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)見(jiàn)圖8。
圖8 全卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)
以多通道的軌道幾何檢測(cè)數(shù)據(jù)為例,使用圖8中所示深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型,以包含有效數(shù)據(jù)和無(wú)效數(shù)據(jù)的數(shù)據(jù)集作為輸入,對(duì)這些輸入數(shù)據(jù)進(jìn)行切片處理,以256個(gè)測(cè)量點(diǎn)的多通道檢測(cè)數(shù)據(jù)為一個(gè)片段,混合這些片段得到處理后的數(shù)據(jù)集,以其中80%的片段作為訓(xùn)練集,20%的片段作為測(cè)試集訓(xùn)練深層神經(jīng)網(wǎng)絡(luò),對(duì)雨雪干擾、電磁干擾、左右高低加速度計(jì)故障、軌距攝像機(jī)故障引起的無(wú)效數(shù)據(jù)進(jìn)行識(shí)別,結(jié)果見(jiàn)圖9。
圖9 基于人工智能的無(wú)效數(shù)據(jù)智能檢測(cè)結(jié)果
數(shù)據(jù)完整性通常指歸集存儲(chǔ)的檢測(cè)數(shù)據(jù)的所有數(shù)據(jù)值均應(yīng)處于完整的狀態(tài),如果數(shù)據(jù)中缺少了某些數(shù)據(jù)值,例如檢測(cè)系統(tǒng)在死機(jī)重啟后部分?jǐn)?shù)據(jù)未正常采集,則該數(shù)據(jù)集喪失了部分完整性。由于鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)通常以一定的時(shí)間或空間采樣頻率進(jìn)行采樣,例如:軌道幾何和接觸網(wǎng)幾何檢測(cè)數(shù)據(jù)的空間采樣頻率通常為0.25 m,可結(jié)合線路的臺(tái)賬信息,估算出檢測(cè)數(shù)據(jù)文件的樣本數(shù)量,再與實(shí)際檢測(cè)數(shù)據(jù)的樣本量進(jìn)行比較,定義閾值ε,一旦比較結(jié)果超過(guò)定義的閾值,則認(rèn)為檢測(cè)數(shù)據(jù)完整性缺失,并可量化評(píng)估檢測(cè)數(shù)據(jù)的完整性。檢測(cè)數(shù)據(jù)完整性評(píng)估示例見(jiàn)圖10。
圖10 不完整檢測(cè)數(shù)據(jù)波形圖
圖中K37+400—K50+600區(qū)段,由于檢測(cè)設(shè)備處于死機(jī)狀態(tài),造成了部分檢測(cè)數(shù)據(jù)缺失。結(jié)合臺(tái)賬信息,該線路區(qū)段的實(shí)際檢測(cè)里程應(yīng)為496 km,其中缺失數(shù)據(jù)13.2 km,則可計(jì)算出該線路檢測(cè)數(shù)據(jù)的完整性為97.34%。
數(shù)據(jù)完整性是對(duì)檢測(cè)數(shù)據(jù)樣本數(shù)量的定量評(píng)估方法,而數(shù)據(jù)有效性則是對(duì)檢測(cè)數(shù)據(jù)樣本質(zhì)量的定量評(píng)估方法。利用人工智能的無(wú)效數(shù)據(jù)智能檢測(cè)技術(shù),可以自動(dòng)獲得某次檢測(cè)數(shù)據(jù)中的無(wú)效區(qū)段列表,進(jìn)而對(duì)檢測(cè)數(shù)據(jù)的有效性進(jìn)行量化評(píng)估。
例如對(duì)某條實(shí)際線路,首先利用基于人工智能的無(wú)效數(shù)據(jù)智能檢測(cè)算法得到無(wú)效數(shù)據(jù)所在區(qū)段后,分別統(tǒng)計(jì)無(wú)效和有效區(qū)段的長(zhǎng)度、檢測(cè)數(shù)據(jù)長(zhǎng)度、無(wú)效數(shù)據(jù)和有效數(shù)據(jù)占比,然后可進(jìn)行數(shù)據(jù)有效性評(píng)估,結(jié)果見(jiàn)表2。
表2 數(shù)據(jù)有效性評(píng)估結(jié)果
從表2中可以看出,對(duì)于某條線路的某次檢測(cè)數(shù)據(jù),根據(jù)人工智能的無(wú)效數(shù)據(jù)智能檢測(cè)技術(shù)識(shí)別出的無(wú)效區(qū)段結(jié)果,可以自動(dòng)統(tǒng)計(jì)計(jì)算出該次檢測(cè)數(shù)據(jù)的檢測(cè)有效率,用于對(duì)數(shù)據(jù)的有效性進(jìn)行量化評(píng)估。
經(jīng)過(guò)里程修正處理后的鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)之間具有較好的數(shù)據(jù)一致性。已有的里程修正算法,僅能夠從修正之后的圖形效果上觀察修正結(jié)果的準(zhǔn)確性,因此里程修正效果評(píng)估受個(gè)人主觀因素的影響較大,不僅不能直觀反映數(shù)據(jù)的一致性,且不能準(zhǔn)確地對(duì)修正算法做出評(píng)價(jià)。由于缺少數(shù)據(jù)一致性評(píng)估標(biāo)準(zhǔn),需要設(shè)計(jì)數(shù)據(jù)一致性評(píng)估方法,從數(shù)值上量化評(píng)估數(shù)據(jù)的一致性。
在對(duì)多次檢測(cè)數(shù)據(jù)一致性評(píng)估過(guò)程中,通過(guò)計(jì)算對(duì)比對(duì)準(zhǔn)前后檢測(cè)數(shù)據(jù)通道的平均誤差值評(píng)估數(shù)據(jù)的一致性。由于不同檢測(cè)數(shù)據(jù)樣本數(shù)量存在差異,因此在計(jì)算平均誤差值時(shí)不可逐點(diǎn)計(jì)算誤差值,應(yīng)通過(guò)兩次檢測(cè)數(shù)據(jù)曲線包圍的區(qū)域計(jì)算每公里波形面積差值作為平均的誤差值。對(duì)某高速鐵路軌道幾何檢測(cè)數(shù)據(jù)一致性評(píng)估結(jié)果見(jiàn)圖11。
圖11 里程修正前后數(shù)據(jù)一致性對(duì)比
從圖11中可以看出,與基準(zhǔn)文件相比,里程修正后偏差減少,數(shù)據(jù)一致性提高。數(shù)據(jù)一致性評(píng)估方法的計(jì)算效率遠(yuǎn)高于逐點(diǎn)計(jì)算的效率,并且不影響評(píng)估結(jié)果的準(zhǔn)確程度,因此可以量化評(píng)估數(shù)據(jù)的一致性。
圍繞鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)中的里程偏差、無(wú)效數(shù)據(jù)和質(zhì)量評(píng)估等共性數(shù)據(jù)管理問(wèn)題,研究了一套鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)綜合治理技術(shù)。在數(shù)據(jù)預(yù)處理階段,首先基于臺(tái)賬信息自動(dòng)生成基準(zhǔn)文件,之后利用自動(dòng)生成的基準(zhǔn)文件基于最大相關(guān)系數(shù)原理實(shí)現(xiàn)多次檢測(cè)數(shù)據(jù)里程自動(dòng)對(duì)準(zhǔn),并利用人工智能深度學(xué)習(xí)研究檢測(cè)數(shù)據(jù)的無(wú)效區(qū)段自動(dòng)識(shí)別方法,最終初步實(shí)現(xiàn)對(duì)鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)完整性、有效性、一致性的質(zhì)量評(píng)估目標(biāo)。
數(shù)據(jù)的自動(dòng)化和智能化處理是數(shù)據(jù)分析處理技術(shù)發(fā)展的趨勢(shì),目前鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)綜合治理的研究仍處于起步階段,自動(dòng)化和智能化程度仍有待提高。伴隨著大數(shù)據(jù)和人工智能等新技術(shù)的發(fā)展,未來(lái)鐵路基礎(chǔ)設(shè)施檢測(cè)數(shù)據(jù)綜合治理技術(shù)研究將借助大數(shù)據(jù)平臺(tái)、云計(jì)算等手段,向高效、并行、智能的方向發(fā)展。