李新琴,劉承亮,代明睿,李國華,史維峰
(中國鐵道科學研究院集團有限公司 電子計算技術(shù)研究所,北京 100081)
鐵路運輸設(shè)備狀態(tài)是鐵路安全運輸?shù)母?,良好的設(shè)備狀態(tài)既是運輸生產(chǎn)的物質(zhì)基礎(chǔ),又是運輸安全的重要保證[1]。隨著鐵路運營里程的積累和鐵路設(shè)備的更新迭代,積累了大量的鐵路運輸設(shè)備故障數(shù)據(jù)。這些故障數(shù)據(jù)記錄了故障發(fā)生的詳細信息,包括故障的基礎(chǔ)信息和對故障的人工分析數(shù)據(jù),蘊含了鐵路運輸設(shè)備的重要價值信息??茖W分析設(shè)備故障數(shù)據(jù)是將故障從消極轉(zhuǎn)變?yōu)榉e極的有效途徑,但由于這些故障數(shù)據(jù)存在存儲分散、數(shù)據(jù)格式不同、存儲形式各異的情況,給數(shù)據(jù)分析帶來了困難[2]。知識圖譜能夠有效地將多源異構(gòu)數(shù)據(jù)轉(zhuǎn)化為基于深層語義的知識服務(wù),基于知識圖譜技術(shù)實現(xiàn)設(shè)備故障的深度挖掘和智能應(yīng)用,是分析鐵路運輸設(shè)備故障數(shù)據(jù)的有效途徑[3-6]。
知識圖譜技術(shù)在各行業(yè)事故故障智能化服務(wù)中已得到了廣泛的研究和應(yīng)用。在電力行業(yè),李新鵬等人[7]通過構(gòu)建調(diào)度自動化系統(tǒng)的知識圖譜,實現(xiàn)系統(tǒng)故障的智能診斷和分析;郭榕等人[8]針對電網(wǎng)故障處置預案數(shù)據(jù),構(gòu)建電網(wǎng)故障處置知識圖譜,提升了電網(wǎng)故障處置能力和智能化水平;在中石油領(lǐng)域,陳傳剛等人[9]構(gòu)建基于知識圖譜的站場故障預警模型,實現(xiàn)現(xiàn)場事故預警;在鐵路領(lǐng)域,楊連報等人[10]通過構(gòu)建鐵路設(shè)備事故故障部位知識圖譜,實現(xiàn)了設(shè)備故障關(guān)聯(lián)分析和原因推薦?;诟餍袠I(yè)對知識圖譜構(gòu)建方法及應(yīng)用模式的研究,本文在研究鐵路運輸設(shè)備安全保障體系的基礎(chǔ)上,提出了鐵路運輸設(shè)備故障知識圖譜構(gòu)建與應(yīng)用架構(gòu),以及設(shè)備故障知識圖譜應(yīng)用場景。
為保障鐵路運輸安全,面向鐵路運輸系統(tǒng)構(gòu)建了健全的鐵路運輸設(shè)備安全保障體系。在該體系下,可對運輸設(shè)備的基礎(chǔ)信息、運行維護(簡稱:運維)信息及故障數(shù)據(jù)進行有效管理。鐵路運輸設(shè)備安全保障體系包含針對鐵路基礎(chǔ)設(shè)施設(shè)備構(gòu)建的鐵路運輸設(shè)備監(jiān)測檢測系統(tǒng)、鐵路運輸設(shè)備信息管理系統(tǒng)及鐵路運營集成化平臺,可實現(xiàn)鐵路運輸設(shè)備的全生命周期管理、設(shè)備故障信息管理,以及設(shè)備故障數(shù)據(jù)一體化分析。鐵路運輸安全保障體系架構(gòu)如圖1 所示。
圖1 鐵路運輸設(shè)備安全保障體系
鐵路運輸基礎(chǔ)設(shè)備設(shè)施主要指鐵路橋梁、道岔、信號機、接觸網(wǎng)、動車組等固定設(shè)備和移動設(shè)備。鐵路運輸設(shè)備故障數(shù)據(jù)管理和設(shè)備全生命周期管理主要是圍繞鐵路運輸基礎(chǔ)設(shè)備設(shè)施開展安全監(jiān)控和信息化建設(shè)。
鐵路運輸設(shè)備故障數(shù)據(jù)管理可實現(xiàn)設(shè)備基礎(chǔ)信息、維修維護、故障信息的全面管理。鐵路運輸設(shè)備信息管理系統(tǒng)中存儲了大量的設(shè)備故障數(shù)據(jù),這些數(shù)據(jù)記載了設(shè)備故障發(fā)生的詳細情況,包括故障發(fā)生的時間、線別、鐵路局集團公司、車間、故障部位、原因分析等數(shù)據(jù)。根據(jù)數(shù)據(jù)來源和價值,可將其分為客觀記實、主觀選項及主觀描述等數(shù)據(jù)。
(1)客觀記實數(shù)據(jù)
客觀記實數(shù)據(jù)主要包括故障發(fā)生的時間、線別、鐵路局集團公司、車間等數(shù)據(jù),這些數(shù)據(jù)可根據(jù)故障的具體情況直接通過鐵路運輸設(shè)備信息管理系統(tǒng)的選項進行選擇。客觀記實數(shù)據(jù)是不可更改的事實,具有真實性,通常以結(jié)構(gòu)化形式存儲。
(2)主觀選項數(shù)據(jù)
主觀選項數(shù)據(jù)主要包括故障發(fā)生的部位、故障原因分類等數(shù)據(jù)。這些數(shù)據(jù)是相關(guān)人員通過對故障的分析,根據(jù)信息系統(tǒng)的選項進行選擇,通常以結(jié)構(gòu)化形式存儲。由于人員對故障數(shù)據(jù)認知經(jīng)驗不同,通常,故障原因分類數(shù)據(jù)存在隨意性。
(3)主觀描述數(shù)據(jù)
主觀描述數(shù)據(jù)主要是指故障原因分析數(shù)據(jù)。此類數(shù)據(jù)以大段的文本形式記錄了故障發(fā)生的現(xiàn)象、原因分析、處理結(jié)果、原因定性等內(nèi)容,是人員根據(jù)自身經(jīng)驗對故障的詳細分析描述,蘊含重要價值。主觀描述數(shù)據(jù)以非結(jié)構(gòu)化文本的形式進行存儲。
鐵路運輸設(shè)備的全生命周期管理包括對設(shè)備的狀態(tài)巡檢、維護維修、計劃保養(yǎng)、檔案管理和決策分析。通過構(gòu)建工務(wù)、電務(wù)、供電等專業(yè)的檢測監(jiān)測系統(tǒng),實現(xiàn)設(shè)備狀態(tài)的實時采集和監(jiān)控,有效輔助設(shè)備信息管理,進行設(shè)備故障檢測、故障數(shù)據(jù)管理和故障數(shù)據(jù)分析。
設(shè)備故障一體化分析主要基于鐵路運營集成化平臺實現(xiàn)鐵路各專業(yè)的設(shè)備信息匯集,打破設(shè)備信息傳遞阻隔,實現(xiàn)設(shè)備的跨專業(yè)分析。通過對鐵路運輸設(shè)備故障數(shù)據(jù)的類別分析可知,設(shè)備故障數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),且蘊含價值豐富,知識圖譜能夠有效的組織和表達結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),并將其進行充分的關(guān)聯(lián),實現(xiàn)數(shù)據(jù)的分析與挖掘。因此,基于知識圖譜技術(shù)實現(xiàn)故障知識的構(gòu)建和故障數(shù)據(jù)的科學分析,是分析鐵路設(shè)備故障數(shù)據(jù)的有效方法。
鐵路運輸設(shè)備故障知識圖譜的構(gòu)建過程主要包括設(shè)備故障本體結(jié)構(gòu)定義、知識抽取及知識對齊。
本體結(jié)構(gòu)定義是構(gòu)建鐵路運輸設(shè)備故障知識圖譜的首要環(huán)節(jié),通過對鐵路運輸設(shè)備故障結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的全面分析,定義設(shè)備故障的知識單元、知識單元關(guān)系和知識層次結(jié)構(gòu),將設(shè)備故障數(shù)據(jù)有序地組織為知識圖譜結(jié)構(gòu),如圖2 所示。
圖2 鐵路運輸設(shè)備故障本體結(jié)構(gòu)
針對存儲于設(shè)備故障主觀描述數(shù)據(jù)中的設(shè)備故障非結(jié)構(gòu)化文本數(shù)據(jù),定義設(shè)備現(xiàn)象、設(shè)備現(xiàn)象采取的措施、設(shè)備故障的處理結(jié)果等為命名實體,將實體之間的引起、發(fā)生、結(jié)果等關(guān)系作為實體關(guān)系,采用命名實體識別和實體關(guān)系抽取的方法獲取文本中的知識。
由于設(shè)備故障主觀描述數(shù)據(jù)的隨意性,對同一設(shè)備、故障現(xiàn)象、處理措施等內(nèi)容的描述不同,可導致抽取的知識存在大量知識重復現(xiàn)象,例如“道岔失去表示”和“道岔無表示”實際為同一設(shè)備故障現(xiàn)象,采用知識對齊技術(shù)解決設(shè)備故障知識冗余問題,知識對齊過程能夠有效地將設(shè)備故障知識圖譜精細化。
鐵路運輸設(shè)備故障知識圖譜構(gòu)建與應(yīng)用涉及的技術(shù)眾多,需要設(shè)計完整的架構(gòu)支持。鐵路運輸設(shè)備故障知識圖譜構(gòu)建與應(yīng)用架構(gòu)如圖3 所示。
圖3 鐵路運輸設(shè)備故障知識圖譜構(gòu)建與應(yīng)用架構(gòu)
通過對鐵路運輸設(shè)備故障的本體結(jié)構(gòu)構(gòu)建,匯集鐵路各專業(yè)設(shè)備故障數(shù)據(jù),包括設(shè)備故障的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。在進行數(shù)據(jù)分析前需要對數(shù)據(jù)進行預處理,包括非結(jié)構(gòu)化數(shù)據(jù)的正文抽取和結(jié)構(gòu)化數(shù)據(jù)的ETL(Extract、Transform、Load)處理。
知識圖譜構(gòu)建技術(shù)主要包括知識獲取、知識對齊及知識存儲。知識獲取技術(shù)包括命名實體識別、關(guān)系抽取、文本分類等,通過對設(shè)備故障主觀描述文本數(shù)據(jù)的上下文語義學習,有效地從非結(jié)構(gòu)化文本數(shù)據(jù)中抽取出與故障密切的關(guān)鍵數(shù)據(jù);知識對齊技術(shù)是整合故障結(jié)構(gòu)化數(shù)據(jù)的有效方法,通過實體對齊、實體去重、實體鏈接計算等技術(shù)將相同的、有關(guān)聯(lián)關(guān)系的、有歧義的知識單元進行整合;知識存儲是將設(shè)備故障知識以“圖”的形式存儲在數(shù)據(jù)庫中,通常存儲在Neo4j、OrientDB 等圖數(shù)據(jù)庫中。
知識圖譜應(yīng)用基于鐵路運輸設(shè)備故障知識圖譜,通過對知識單元的計算和推理,實現(xiàn)設(shè)備故障知識的智能應(yīng)用。通過路徑計算、規(guī)則推理等方法實現(xiàn)設(shè)備故障的知識搜索,采用本體推理、相似圖計算等方法實現(xiàn)設(shè)備故障單元間的關(guān)聯(lián)關(guān)系推理,并將這種關(guān)聯(lián)關(guān)系連接,對設(shè)備故障知識圖譜進行擴展和豐富,實現(xiàn)設(shè)備故障知識補全。同時,通過知識圖譜不一致檢測技術(shù)發(fā)現(xiàn)設(shè)備故障知識圖譜中錯誤或冗余的數(shù)據(jù),實現(xiàn)設(shè)備故障準確的知識體系和推理。知識圖譜應(yīng)用可支持鐵路運輸設(shè)備故障應(yīng)用場景的構(gòu)建。
鐵路運輸設(shè)備故障知識圖譜具有海量的知識單元,在模型訓練過程中,需采用分布式計算實現(xiàn)模型的高效訓練。在知識圖譜應(yīng)用過程中,為保障知識圖譜的快速檢索與較高的推理性能,需要借助Spark、Hadoop 等大數(shù)據(jù)技術(shù)支持知識快速的運算與推理,所以在整個設(shè)備故障知識圖譜的構(gòu)建與應(yīng)用過程中,都需要大數(shù)據(jù)技術(shù)的支撐。
基于鐵路運輸設(shè)備故障知識圖譜,推理實現(xiàn)設(shè)備故障的智能診斷與處理、智能問答、風險管理等應(yīng)用場景,高效利用設(shè)備故障相關(guān)知識,幫助鐵路運輸設(shè)備運維人員快速查找故障致因鏈、定位故障原因、確定故障維修措施,達到減少故障處理時間、提高故障處理效率的目的。
鐵路運輸設(shè)備故障知識圖譜蘊含了設(shè)備、故障部位、故障現(xiàn)象、故障原因、維修措施等本體間的隱含關(guān)系,通過對關(guān)系的多級匹配和知識推理技術(shù),可使鐵路運維人員了解故障背后的隱含知識,實現(xiàn)故障原因推理、故障鏈條分析、故障結(jié)果推理和故障處理建議等功能,可應(yīng)用于鐵路各專業(yè)智能運維系統(tǒng)中,有效提升運維系統(tǒng)智能化程度。
鐵路運輸設(shè)備故障知識圖譜通過對設(shè)備故障數(shù)據(jù)的知識化,可從復雜的設(shè)備故障中分析出每個設(shè)備發(fā)生故障的數(shù)量、原因,以及與之關(guān)聯(lián)的設(shè)備狀況,通過知識圖譜對設(shè)備故障的分析,可有效輔助人員對相關(guān)設(shè)備進行重點關(guān)注,協(xié)助鐵路日常設(shè)備風險管理工作,可應(yīng)用于鐵路安全大數(shù)據(jù)系統(tǒng),實現(xiàn)設(shè)備的風險研判和風險管理。
鐵路運輸設(shè)備故障種類復雜,查詢設(shè)備故障數(shù)據(jù)往往需要多次查詢或展開多級查詢目錄。設(shè)備故障智能問答通過語音或手動輸入對故障的簡單描述,即可得到多級、深層次的關(guān)系,快速準確地找到所需要的設(shè)備故障知識,提高工作效率和知識共享能力,輔助鐵路工作人員對設(shè)備知識進行快速學習和實時查詢。設(shè)備故障智能問答可應(yīng)用于鐵路各專業(yè)智能運維系統(tǒng)中,實現(xiàn)設(shè)備故障知識的有效應(yīng)用。
本文針對鐵路運輸設(shè)備安全保障體系內(nèi)產(chǎn)生的設(shè)備故障數(shù)據(jù),闡述針對鐵路運輸設(shè)備故障數(shù)據(jù)的知識圖譜構(gòu)建過程,提出設(shè)備故障知識圖譜構(gòu)建和應(yīng)用架構(gòu)及設(shè)備故障知識圖譜的應(yīng)用場景,為鐵路領(lǐng)域?qū)W者基于知識圖譜技術(shù)進行設(shè)備故障數(shù)據(jù)分析提供參考。鐵路運輸安全問題風險庫、隱患庫等也存儲了非結(jié)構(gòu)化文本形式的蘊含重要價值的數(shù)據(jù),本文的研究方法也可為該類數(shù)據(jù)的分析提供參考。