武威, 劉慶猛, 楊濤存, 劉彥軍, 張曉棟, 徐貴紅
(中國鐵道科學(xué)研究院集團(tuán)有限公司鐵路大數(shù)據(jù)研究與應(yīng)用創(chuàng)新中心,北京 100081)
隨著我國高鐵覆蓋范圍不斷擴(kuò)大、運(yùn)營距離和跨度不斷增加,對(duì)于軌道、動(dòng)車組、接觸網(wǎng)等設(shè)備安全性和可靠性的要求也不斷提高,而自然災(zāi)害等影響也加大了風(fēng)險(xiǎn)管控的難度。高鐵運(yùn)營安全是一個(gè)龐大且復(fù)雜的系統(tǒng)工程,各業(yè)務(wù)工種間需要有條不紊地配合工作,以保證高鐵安全有序運(yùn)行。目前,在高鐵運(yùn)營中已積累了與運(yùn)營安全相關(guān)的設(shè)備狀態(tài)、檢測監(jiān)測等海量數(shù)據(jù),數(shù)據(jù)來源為鐵路車輛、軌道、接觸網(wǎng)、信號(hào)機(jī)等各類傳感器和信息系統(tǒng),其結(jié)構(gòu)復(fù)雜、類型多樣,能全面反映鐵路運(yùn)行的時(shí)空信息和安全狀態(tài)。如何有效治理高鐵運(yùn)營安全相關(guān)數(shù)據(jù),支撐安全規(guī)律分析和應(yīng)用,充分保障運(yùn)輸安全,是大數(shù)據(jù)時(shí)代充分發(fā)揮數(shù)據(jù)作用的重要因素。
近年來,中國國家鐵路集團(tuán)有限公司(簡稱國鐵集團(tuán))陸續(xù)發(fā)布《鐵路信息化總體規(guī)劃》和《鐵路大數(shù)據(jù)應(yīng)用實(shí)施方案》,構(gòu)建了鐵路大數(shù)據(jù)應(yīng)用頂層設(shè)計(jì)[1],規(guī)劃了鐵路大數(shù)據(jù)的基礎(chǔ)設(shè)施體系、匯集體系、治理體系、分析體系、應(yīng)用體系,對(duì)鐵路大數(shù)據(jù)的治理和應(yīng)用提供了指導(dǎo)。高鐵運(yùn)營安全相關(guān)數(shù)據(jù)治理以統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)、提升數(shù)據(jù)質(zhì)量、促進(jìn)數(shù)據(jù)共享、保障數(shù)據(jù)安全等為目標(biāo),通過形成規(guī)范的數(shù)據(jù)治理框架,充分有效地治理海量數(shù)據(jù),全面支撐安全規(guī)律分析應(yīng)用,對(duì)于科學(xué)發(fā)現(xiàn)、認(rèn)識(shí)和把握高鐵運(yùn)營安全規(guī)律,全面提升高鐵運(yùn)營安全管理水平具有重要意義。
根據(jù)國際數(shù)據(jù)管理協(xié)會(huì)(DAMA)的定義,數(shù)據(jù)治理是指對(duì)數(shù)據(jù)資產(chǎn)管理行使權(quán)力和控制的活動(dòng)集合(規(guī)劃、監(jiān)控和執(zhí)行)[2]。國際標(biāo)準(zhǔn)研究報(bào)告《數(shù)據(jù)治理白皮書》指出,數(shù)據(jù)治理是在數(shù)據(jù)產(chǎn)生價(jià)值的過程中,治理團(tuán)隊(duì)對(duì)其評(píng)價(jià)、指導(dǎo)、控制的過程,并提出“互聯(lián)網(wǎng)+”時(shí)代大數(shù)據(jù)的治理需求、治理模型和治理框架[3];國家標(biāo)準(zhǔn)《數(shù)據(jù)治理規(guī)范》提出了面向中國的數(shù)據(jù)治理規(guī)范,完善了國際數(shù)據(jù)治理標(biāo)準(zhǔn)的框架,提升了標(biāo)準(zhǔn)的適用性,在數(shù)據(jù)治理實(shí)施的方法論和應(yīng)用落地等方面進(jìn)行了創(chuàng)新[4]。在大數(shù)據(jù)環(huán)境下,大量半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)增加了數(shù)據(jù)治理難度,數(shù)據(jù)質(zhì)量管控和數(shù)據(jù)安全的迫切需求也日益凸顯,從而逐漸形成面向大數(shù)據(jù)的數(shù)據(jù)治理架構(gòu)[5];安小米等[6]提出更具通用性的大數(shù)據(jù)治理體系構(gòu)建方法論框架,在綜合集成大數(shù)據(jù)治理體系構(gòu)建方法論要素的基礎(chǔ)上,利用戴明環(huán)(PDCA)理論對(duì)當(dāng)前大數(shù)據(jù)治理體系構(gòu)建方法論進(jìn)行修正和補(bǔ)充。
在鐵路數(shù)據(jù)治理方面,鄒丹等[7]提出構(gòu)建鐵路大數(shù)據(jù)治理體系,并描述了體系的組成部分及各部分作用,對(duì)于各研究方向開展鐵路大數(shù)據(jù)治理具有指導(dǎo)意義。鐵路數(shù)據(jù)服務(wù)平臺(tái)的建設(shè),為海量數(shù)據(jù)的匯集、存儲(chǔ)、治理提供了通用的基礎(chǔ)環(huán)境,構(gòu)建了一站式大數(shù)據(jù)處理分析能力,為數(shù)據(jù)治理提供了技術(shù)平臺(tái)條件。
高鐵運(yùn)營安全相關(guān)數(shù)據(jù)涉及移動(dòng)裝備、工務(wù)、電務(wù)、供電、技術(shù)規(guī)章等研究方向近10年的事故、故障數(shù)據(jù)。其中,事故數(shù)據(jù)多為文本數(shù)據(jù),作為非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行存儲(chǔ)和管理。故障數(shù)據(jù)覆蓋移動(dòng)裝備、工務(wù)、電務(wù)、供電等研究方向,數(shù)據(jù)結(jié)構(gòu)復(fù)雜、類型多樣,且不同研究方向之間存在數(shù)據(jù)規(guī)范和格式不統(tǒng)一、內(nèi)容不完整、有效信息挖掘不便、數(shù)據(jù)質(zhì)量參差不齊、基礎(chǔ)臺(tái)賬信息不一致等問題,需要通過數(shù)據(jù)治理解決。因此,結(jié)合高鐵運(yùn)營數(shù)據(jù)現(xiàn)狀,梳理數(shù)據(jù)治理目標(biāo)、內(nèi)容、措施,并對(duì)其進(jìn)行治理分析,以支撐高鐵運(yùn)營安全規(guī)律分析應(yīng)用。
高鐵運(yùn)營安全相關(guān)數(shù)據(jù)治理主要包括以下內(nèi)容:
(1)制定有針對(duì)性的數(shù)據(jù)治理目標(biāo),解決實(shí)際存在的問題,促進(jìn)數(shù)據(jù)價(jià)值的發(fā)掘;
(2)確定數(shù)據(jù)治理的對(duì)象,針對(duì)元數(shù)據(jù)、主數(shù)據(jù)、數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全等開展治理;
(3)確定數(shù)據(jù)治理需要落實(shí)的各項(xiàng)措施,確定組織、制度和方法,保障數(shù)據(jù)治理工作順利開展。
統(tǒng)籌以上治理內(nèi)容,形成面向高鐵運(yùn)營安全規(guī)律分析的數(shù)據(jù)治理框架(見圖1)。
圖1 數(shù)據(jù)治理框架示意圖
高鐵運(yùn)營安全相關(guān)數(shù)據(jù)治理目標(biāo)是形成管理有序、安全可控、統(tǒng)一規(guī)范的數(shù)據(jù)資源,支撐數(shù)據(jù)共享和各研究方向安全規(guī)律分析應(yīng)用,解決跨部門、跨系統(tǒng)的高鐵運(yùn)營安全相關(guān)數(shù)據(jù)的共享和治理難題。
“管理有序”指在大數(shù)據(jù)環(huán)境下開展數(shù)據(jù)治理工作,針對(duì)治理過程中各方參與人職責(zé)劃分的需要,形成管理有序的數(shù)據(jù)治理團(tuán)隊(duì)和相應(yīng)的大數(shù)據(jù)管理制度及規(guī)范,推動(dòng)數(shù)據(jù)治理工作持續(xù)進(jìn)行;“安全可控”指全面考慮在數(shù)據(jù)治理過程中的數(shù)據(jù)風(fēng)險(xiǎn)和數(shù)據(jù)安全;“統(tǒng)一規(guī)范”指針對(duì)存在的數(shù)據(jù)質(zhì)量問題,開發(fā)或利用相關(guān)數(shù)據(jù)治理工具,構(gòu)建統(tǒng)一、規(guī)范的數(shù)據(jù)資源,為不同研究方向之間的數(shù)據(jù)共享和融合分析奠定基礎(chǔ),支撐高鐵運(yùn)營安全規(guī)律分析工作。
2.2.1 元數(shù)據(jù)
元數(shù)據(jù)是用于描述數(shù)據(jù)的數(shù)據(jù),對(duì)數(shù)據(jù)及信息資源進(jìn)行描述。元數(shù)據(jù)管理貫穿于數(shù)據(jù)治理工作的始終,表征了數(shù)據(jù)的定義、結(jié)構(gòu)、更新時(shí)間、備注等各類信息。在元數(shù)據(jù)管理過程中,需梳理元數(shù)據(jù)模型,形成概念模型、邏輯模型和物理模型,記錄數(shù)據(jù)在變化和流轉(zhuǎn)過程中的元數(shù)據(jù)信息,并通過血緣關(guān)系、影響度關(guān)系進(jìn)行管理和呈現(xiàn),同時(shí)管理元數(shù)據(jù)的變更情況,實(shí)現(xiàn)數(shù)據(jù)可追溯,清晰掌握數(shù)據(jù)間的關(guān)系。
在高鐵運(yùn)營數(shù)據(jù)的元數(shù)據(jù)管理方面,針對(duì)元數(shù)據(jù)進(jìn)行統(tǒng)一管理,如不同鐵路局集團(tuán)公司的鐵路供電遠(yuǎn)程監(jiān)控?cái)?shù)據(jù)來自不同研發(fā)單位的系統(tǒng),元數(shù)據(jù)信息不盡相同,將表征相同數(shù)據(jù)內(nèi)容的元數(shù)據(jù)進(jìn)行關(guān)聯(lián)整合,形成統(tǒng)一的元數(shù)據(jù)結(jié)構(gòu)和關(guān)聯(lián)關(guān)系。
2.2.2 主數(shù)據(jù)
主數(shù)據(jù)是用于定義企業(yè)業(yè)務(wù)實(shí)體的基礎(chǔ)數(shù)據(jù),具有變化頻率低、共享程度高等特點(diǎn)。主數(shù)據(jù)分散于各業(yè)務(wù)系統(tǒng)中,被各業(yè)務(wù)系統(tǒng)頻繁使用,對(duì)于系統(tǒng)運(yùn)行和數(shù)據(jù)挖掘具有非常重要的作用。目前,國鐵集團(tuán)鐵路主數(shù)據(jù)管理平臺(tái)已對(duì)固定設(shè)備類、移動(dòng)裝備類、運(yùn)輸產(chǎn)品類、物資設(shè)備類、人員機(jī)構(gòu)類5大類共42項(xiàng)主數(shù)據(jù)進(jìn)行管理,其中包括車站主數(shù)據(jù)、線路主數(shù)據(jù)等公用基礎(chǔ)數(shù)據(jù),并提供面向全路的統(tǒng)一主數(shù)據(jù)服務(wù)。
在高鐵運(yùn)營安全相關(guān)數(shù)據(jù)治理的過程中,要加強(qiáng)對(duì)與安全業(yè)務(wù)相關(guān)的各項(xiàng)主數(shù)據(jù)的梳理,圍繞安全管理相關(guān)業(yè)務(wù)流程涉及的數(shù)據(jù)進(jìn)行梳理和管理,針對(duì)主數(shù)據(jù)進(jìn)行篩選、確權(quán),不斷形成內(nèi)容權(quán)威、管理規(guī)范、更新及時(shí)的鐵路主數(shù)據(jù),不斷規(guī)范鐵路各業(yè)務(wù)系統(tǒng)的主數(shù)據(jù)使用,提升主數(shù)據(jù)管理和利用水平。
2.2.3 數(shù)據(jù)質(zhì)量
數(shù)據(jù)質(zhì)量是表征數(shù)據(jù)對(duì)于數(shù)據(jù)應(yīng)用需求的滿足程度。數(shù)據(jù)質(zhì)量管理是指對(duì)數(shù)據(jù)從計(jì)劃、獲取、存儲(chǔ)、共享、維護(hù)、應(yīng)用、消亡的全生命周期各階段可能引發(fā)的各類數(shù)據(jù)質(zhì)量問題,進(jìn)行識(shí)別、度量、監(jiān)控、預(yù)警等一系列管理活動(dòng),并通過改善和提高組織的管理水平,進(jìn)一步提高數(shù)據(jù)質(zhì)量[8]。數(shù)據(jù)質(zhì)量提升是數(shù)據(jù)治理工作的重要目標(biāo)之一,在大數(shù)據(jù)時(shí)代,要充分發(fā)揮數(shù)據(jù)價(jià)值,就必須不斷提升數(shù)據(jù)質(zhì)量,提高數(shù)據(jù)利用率。
在高鐵運(yùn)營安全相關(guān)的事故、故障數(shù)據(jù)方面,存在數(shù)據(jù)缺失、異常、不一致、不完整等問題,通過識(shí)別數(shù)據(jù)問題并進(jìn)行有效的數(shù)據(jù)清洗和治理,可保證數(shù)據(jù)的完整性、有效性、準(zhǔn)確性、一致性和時(shí)效性。
2.2.4 數(shù)據(jù)標(biāo)準(zhǔn)
數(shù)據(jù)標(biāo)準(zhǔn)涉及數(shù)據(jù)標(biāo)準(zhǔn)化和形成數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范的過程。在數(shù)據(jù)治理過程中,通過理解數(shù)據(jù)標(biāo)準(zhǔn)化的需求,利用既有數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行數(shù)據(jù)規(guī)范;同時(shí),利用既有業(yè)務(wù)數(shù)據(jù)形成新的數(shù)據(jù)標(biāo)準(zhǔn),去約束其他數(shù)據(jù),提升數(shù)據(jù)規(guī)范性和質(zhì)量。
2.2.5 數(shù)據(jù)安全
數(shù)據(jù)安全指數(shù)據(jù)的完整性、可用性和保密性不受到信息泄漏、非法篡改等安全威脅的影響。在高鐵運(yùn)營中,動(dòng)車組、軌道、接觸網(wǎng)等設(shè)備的檢測監(jiān)測數(shù)據(jù)具有極強(qiáng)的安全性和保密性需求,因此在數(shù)據(jù)治理過程中,需確定數(shù)據(jù)的分類分級(jí),針對(duì)相應(yīng)數(shù)據(jù)進(jìn)行加密、脫敏[9],根據(jù)數(shù)據(jù)典型特征,給予安全的數(shù)據(jù)存儲(chǔ)方式、計(jì)算環(huán)境和數(shù)據(jù)安全策略[10],評(píng)估數(shù)據(jù)的安全風(fēng)險(xiǎn),確保數(shù)據(jù)治理過程中數(shù)據(jù)的安全性。
2.3.1 組織保障
統(tǒng)籌系統(tǒng)開發(fā)方、維護(hù)方、擁有方、使用方等參與協(xié)作,各方都將數(shù)據(jù)治理工作作為一項(xiàng)長久且重要的工作看待,并制定有效的組織機(jī)構(gòu),明確分工,推動(dòng)數(shù)據(jù)治理工作順利進(jìn)行。
2.3.2 制度保障
按照數(shù)據(jù)治理要求制定相應(yīng)的數(shù)據(jù)標(biāo)準(zhǔn)和管理規(guī)范,規(guī)范治理標(biāo)準(zhǔn)和安全管理制度,制定各研究方向安全數(shù)據(jù)接入規(guī)范,明確相關(guān)系統(tǒng)的數(shù)據(jù)接入內(nèi)容、接入方式、更新方式等,支撐跨系統(tǒng)間數(shù)據(jù)的融合。
2.3.3 方法保障
利用數(shù)據(jù)建模方法論,構(gòu)建數(shù)據(jù)概念模型、邏輯模型和物理模型,形成主題域和專題庫,重點(diǎn)關(guān)注元數(shù)據(jù)管理、主數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)安全管理、數(shù)據(jù)標(biāo)準(zhǔn)管理等治理內(nèi)容,逐步分研究方向進(jìn)行數(shù)據(jù)梳理,建設(shè)相應(yīng)數(shù)據(jù)目錄,實(shí)施數(shù)據(jù)分類分級(jí),同時(shí)利用數(shù)據(jù)清洗技術(shù)清除重復(fù)數(shù)據(jù)、填充缺失數(shù)據(jù)、消除噪聲數(shù)據(jù),同時(shí)針對(duì)數(shù)據(jù)治理后的效果進(jìn)行評(píng)估,對(duì)數(shù)據(jù)質(zhì)量合格率、數(shù)據(jù)共享率、數(shù)據(jù)使用情況等量化指標(biāo)進(jìn)行深入分析,不斷改進(jìn)數(shù)據(jù)治理方法,提升數(shù)據(jù)治理效果。
2.3.4 技術(shù)保障
利用技術(shù)措施支撐數(shù)據(jù)治理組織機(jī)構(gòu)的落實(shí)和治理方法的實(shí)施,形成支撐數(shù)據(jù)治理工作的技術(shù)平臺(tái),實(shí)現(xiàn)高鐵運(yùn)營安全相關(guān)數(shù)據(jù)的集中管理和有效整合,完成數(shù)據(jù)治理工作全流程的落地和管理,支撐數(shù)據(jù)共享和安全規(guī)律分析應(yīng)用。
面向高鐵運(yùn)營安全規(guī)律分析的數(shù)據(jù)治理組織架構(gòu)由決策層、管理層、執(zhí)行層構(gòu)成(見圖2)。
圖2 數(shù)據(jù)治理組織架構(gòu)示意圖
(1)決策層。由安全規(guī)律分析工作組組成,負(fù)責(zé)制定不同階段安全規(guī)律分析業(yè)務(wù)的方向和任務(wù),指導(dǎo)建立數(shù)據(jù)治理的目標(biāo)。
(2)管理層。由數(shù)據(jù)專家、業(yè)務(wù)專家和各研究方向負(fù)責(zé)人組成的數(shù)據(jù)治理工作組構(gòu)成,針對(duì)數(shù)據(jù)治理的內(nèi)容進(jìn)行標(biāo)準(zhǔn)化指導(dǎo)和管理,包括元數(shù)據(jù)管理、主數(shù)據(jù)管理、數(shù)據(jù)標(biāo)準(zhǔn)管理、數(shù)據(jù)質(zhì)量管理和數(shù)據(jù)安全管理。
(3)執(zhí)行層。由具體研究方向相關(guān)的系統(tǒng)開發(fā)、數(shù)據(jù)分析、數(shù)據(jù)管理等人員組成,負(fù)責(zé)具體研究方向數(shù)據(jù)治理工作的落實(shí)和數(shù)據(jù)治理目標(biāo)的達(dá)成。
依據(jù)形成的組織架構(gòu),確定各方組織和參與人員的工作職責(zé)和工作目標(biāo),形成數(shù)據(jù)治理工作辦法。同時(shí),針對(duì)數(shù)據(jù)治理的核心內(nèi)容,如元數(shù)據(jù)管理、主數(shù)據(jù)管理、數(shù)據(jù)標(biāo)準(zhǔn)管理、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)安全管理等,制定專業(yè)化的數(shù)據(jù)實(shí)施方案,指導(dǎo)數(shù)據(jù)治理工作的推進(jìn)。
面向高鐵運(yùn)營安全相關(guān)數(shù)據(jù)的治理和分析,利用鐵路數(shù)據(jù)服務(wù)平臺(tái)和高鐵運(yùn)營安全規(guī)律分析系統(tǒng),作為“平臺(tái)+應(yīng)用”服務(wù)模式的創(chuàng)新落地,鐵路數(shù)據(jù)服務(wù)平臺(tái)提供基礎(chǔ)的數(shù)據(jù)存儲(chǔ)、共享、計(jì)算能力,支撐了以文件和接口方式的數(shù)據(jù)匯集,高鐵運(yùn)營安全規(guī)律分析系統(tǒng)提供結(jié)構(gòu)化數(shù)據(jù)管理、非結(jié)構(gòu)化數(shù)據(jù)管理、文本分析、數(shù)據(jù)分析、可視化、用戶管理等功能,實(shí)現(xiàn)了高鐵運(yùn)營安全相關(guān)數(shù)據(jù)治理的集中統(tǒng)一管理,有效支撐高鐵運(yùn)營安全規(guī)律分析工作中對(duì)各研究方向數(shù)據(jù)的挖掘分析。
以高鐵運(yùn)營安全規(guī)律分析為例,構(gòu)建高鐵運(yùn)營安全相關(guān)數(shù)據(jù)治理流程(見圖3)。
圖3 數(shù)據(jù)治理流程示意圖
通過接入安全監(jiān)督管理系統(tǒng)、動(dòng)車組管理信息系統(tǒng)、AMIS系統(tǒng)等各類業(yè)務(wù)系統(tǒng)的數(shù)據(jù),利用鐵路數(shù)據(jù)服務(wù)平臺(tái)的存儲(chǔ)資源存儲(chǔ)各類結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),同時(shí)開展數(shù)據(jù)治理工作。
在數(shù)據(jù)貼源區(qū)對(duì)于結(jié)構(gòu)化數(shù)據(jù)梳理其元數(shù)據(jù)特征和關(guān)聯(lián)關(guān)系,構(gòu)建數(shù)據(jù)概念模型、邏輯模型和物理模型,同時(shí)對(duì)業(yè)務(wù)數(shù)據(jù)按照業(yè)務(wù)規(guī)則或數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行質(zhì)量稽核,不合格的數(shù)據(jù)向原業(yè)務(wù)系統(tǒng)進(jìn)行反饋,提升源頭數(shù)據(jù)質(zhì)量。
按照業(yè)務(wù)規(guī)則進(jìn)行數(shù)據(jù)預(yù)處理工作,針對(duì)數(shù)據(jù)集合中的重復(fù)記錄,將重復(fù)記錄篩選并刪除;針對(duì)數(shù)值型屬性,計(jì)算不同數(shù)值型屬性的平均值和方差,設(shè)置不同屬性的置信區(qū)間來識(shí)別異常屬性對(duì)應(yīng)的記錄并刪除;對(duì)于數(shù)據(jù)缺失,可結(jié)合數(shù)據(jù)具體情況進(jìn)行刪除或填充,如缺失值插補(bǔ)法,用最接近缺失值的值來替代,保證數(shù)據(jù)的可用性和質(zhì)量;針對(duì)數(shù)據(jù)集中出現(xiàn)噪聲(離群點(diǎn))的情況,采用噪聲平滑處理消除噪聲數(shù)據(jù),利用分箱法將數(shù)據(jù)分布到不同的“箱”中,通過參考數(shù)據(jù)點(diǎn)周圍的平滑噪聲數(shù)據(jù),按箱平均值或箱中位數(shù)進(jìn)行平滑(即求取箱中所有值的平均值、中位數(shù),替代箱中所有數(shù)據(jù))[11]。完成數(shù)據(jù)預(yù)處理后,合格的數(shù)據(jù)直接進(jìn)入整合數(shù)據(jù)區(qū)。
在整合數(shù)據(jù)區(qū)結(jié)合業(yè)務(wù)特征構(gòu)建數(shù)據(jù)目錄,將合格的數(shù)據(jù)按目錄進(jìn)行組織,并開展相關(guān)數(shù)據(jù)整理和分析,根據(jù)業(yè)務(wù)專題和特點(diǎn)進(jìn)行整合,在數(shù)據(jù)集市區(qū)形成相應(yīng)數(shù)據(jù)和分析結(jié)果的數(shù)據(jù)專題,同時(shí)記錄數(shù)據(jù)在分析整合過程中的血緣關(guān)系和影響度關(guān)系,便于數(shù)據(jù)的追根溯源。對(duì)于非結(jié)構(gòu)化數(shù)據(jù)(主要是文本類型的數(shù)據(jù)),通過文本標(biāo)注、特征提取、知識(shí)發(fā)現(xiàn)等數(shù)據(jù)處理流程,提取出安全規(guī)律分析相關(guān)的重點(diǎn)內(nèi)容,結(jié)合結(jié)構(gòu)化數(shù)據(jù)分析的結(jié)果,形成移動(dòng)裝備運(yùn)用安全分析、工務(wù)設(shè)施運(yùn)用安全分析、電務(wù)設(shè)施運(yùn)用安全分析、供電設(shè)施運(yùn)用安全分析等典型數(shù)據(jù)分析應(yīng)用案例。
通過分析移動(dòng)裝備、工務(wù)、電務(wù)、供電等研究方向近10年的故障數(shù)據(jù),各研究方向?qū)收下省⒐收系攸c(diǎn)、故障原因、風(fēng)險(xiǎn)源(風(fēng)、雨、雪、異物)等影響因素有了較客觀和全面的評(píng)估,為提高業(yè)務(wù)管理水平、優(yōu)化資源組織配置、節(jié)約維護(hù)成本提供了數(shù)據(jù)分析依據(jù)。
結(jié)合高鐵運(yùn)營安全相關(guān)數(shù)據(jù)的現(xiàn)狀和特點(diǎn),構(gòu)建面向高鐵運(yùn)營安全規(guī)律分析的數(shù)據(jù)治理框架,確定治理目標(biāo)、對(duì)象和措施,建立數(shù)據(jù)治理實(shí)施的組織架構(gòu)和機(jī)制,基于鐵路數(shù)據(jù)服務(wù)平臺(tái)和高鐵運(yùn)營安全規(guī)律分析系統(tǒng),對(duì)移動(dòng)裝備、工務(wù)、電務(wù)、供電等研究方向的相關(guān)數(shù)據(jù)實(shí)施數(shù)據(jù)治理,充分支撐各研究方向安全規(guī)律分析工作,對(duì)于探索高鐵運(yùn)營安全規(guī)律、提升安全管理水平具有重要意義。