劉志鵬,廖家舟,鐘曉玲
(成都理工大學(xué) 信息科學(xué)與技術(shù)學(xué)院,四川 成都 610059)
近年來大數(shù)據(jù)分析與深度學(xué)習(xí)在當(dāng)今社會的很多領(lǐng)域中發(fā)揮了巨大的作用,大量傳統(tǒng)行業(yè)也都在進(jìn)行技術(shù)升級和服務(wù)優(yōu)化,企業(yè)的信息化建設(shè)是一條必經(jīng)之路[1]。隨著我國高速鐵路的迅猛發(fā)展,鐵路各統(tǒng)計(jì)單位均積累了豐富的基礎(chǔ)數(shù)據(jù),然而在這些信息的數(shù)據(jù)分析、信息共享等方面仍然存在一定的欠缺,大量基礎(chǔ)數(shù)據(jù)的利用率很低,無法為鐵路部門提供詳細(xì)且準(zhǔn)確的輔助決策信息[2]。運(yùn)用大數(shù)據(jù)分析的技術(shù)和方法,從鐵路部門的數(shù)據(jù)中挖掘有效的信息并對其進(jìn)行綜合分析,是一種行之有效的方法[3-4]?;诖?,通過搭建一個統(tǒng)計(jì)信息分析和管理平臺,以期有效地解決鐵路各部門在管理決策、安全管理方面存在的問題[5]。
鐵路車務(wù)段主要從事運(yùn)輸組織工作,目前普速鐵路區(qū)段技防設(shè)備投入有限,需要依靠較大的人力完成安全生產(chǎn)管理工作,現(xiàn)場作業(yè)人員因業(yè)務(wù)能力、年齡結(jié)構(gòu)、家庭壓力及外界環(huán)境等多重因素影響,易產(chǎn)生不安全作業(yè)行為,給現(xiàn)場作業(yè)帶來安全隱患。鑒于安全管理工作的長期性、復(fù)雜性和突發(fā)性等特點(diǎn),車務(wù)段管理人員須時刻抓好安全生產(chǎn)各項(xiàng)工作,現(xiàn)場檢查過程中,對作業(yè)人員的違反規(guī)章行為進(jìn)行糾正、考核,對檢查發(fā)現(xiàn)的安全信息錄入系統(tǒng),利用表格或程序進(jìn)行管理;然而車務(wù)段在安全信息運(yùn)用統(tǒng)計(jì)分析方面,缺乏有效方法,不能科學(xué)精確地研判現(xiàn)場安全風(fēng)險及規(guī)章缺陷,人為主觀因素決策較為突出,在推動安全風(fēng)險分層防控和安全隱患排查治理方面作用發(fā)揮不明顯,安全預(yù)警工作精準(zhǔn)性不高。
綜合以上分析,需要研發(fā)一個統(tǒng)計(jì)分析平臺來滿足日常工作需求,結(jié)合現(xiàn)有基礎(chǔ)數(shù)據(jù)分析模塊,運(yùn)用大數(shù)據(jù)分析與深度學(xué)習(xí)模型算法,構(gòu)建安全信息分析與輔助決策平臺的邏輯框架,并能夠提供預(yù)警預(yù)測等輔助決策功能,提高工作與決策效率。
1.1.1 設(shè)計(jì)目標(biāo)
車務(wù)段安全信息分析與輔助決策系統(tǒng)的設(shè)計(jì)目標(biāo)主要包括系統(tǒng)化、智能化和普適化3 個方面。
(1)系統(tǒng)化。為了提高安全信息、人員管理等模塊在整個系統(tǒng)中的統(tǒng)一性、準(zhǔn)確性,避免各方數(shù)據(jù)分散統(tǒng)計(jì)所導(dǎo)致的數(shù)據(jù)模塊割裂,以至于忽略大量數(shù)據(jù)間的潛在聯(lián)系,建立統(tǒng)一的大數(shù)據(jù)分析平臺,充分利用所有數(shù)據(jù)的價值,從而提供更可靠、更穩(wěn)定的數(shù)據(jù)分析結(jié)果與輔助決策意見。
(2)智能化。針對原有數(shù)據(jù)分析方法分散且效率低下問題,車務(wù)段安全信息分析與輔助決策系統(tǒng)需要運(yùn)用成熟的大數(shù)據(jù)分析方法,引進(jìn)深度學(xué)習(xí)模型,實(shí)現(xiàn)分析方法的先進(jìn)性與分析結(jié)果的科學(xué)性,通過利用數(shù)據(jù)智能分析的方法達(dá)到實(shí)時化、多樣化、精確化的目標(biāo)。
(3)普適化。由于車務(wù)段安全信息分析與輔助決策系統(tǒng)面向的人群較為復(fù)雜,不同類型的用戶對系統(tǒng)需求也有所不同,為保護(hù)數(shù)據(jù)安全,對用戶身份進(jìn)行分類,區(qū)分使用權(quán)限,最大程度滿足所有用戶的需求和使用體驗(yàn)。
1.1.2 設(shè)計(jì)原則
車務(wù)段安全信息分析與輔助決策系統(tǒng)設(shè)計(jì)遵照可擴(kuò)展性、可維護(hù)性和可靠性的原則。
(1)可擴(kuò)展性。系統(tǒng)設(shè)計(jì)時采用模塊化結(jié)構(gòu)設(shè)計(jì),模塊的獨(dú)立性較強(qiáng),各獨(dú)立模塊對整個系統(tǒng)的影響很小,便于對系統(tǒng)進(jìn)行改進(jìn)、擴(kuò)充,利于系統(tǒng)的完善升級。
(2)可維護(hù)性。系統(tǒng)開發(fā)時使用模型-視圖-控制器(MVC)模式,該模式不僅實(shí)現(xiàn)了功能模塊和顯示模塊的分離,同時還大大增強(qiáng)了系統(tǒng)的可移植性、可維護(hù)性和各組件的可復(fù)用性。
(3)可靠性。系統(tǒng)的可靠性包括2 個方面,一是系統(tǒng)的數(shù)據(jù)安全性,系統(tǒng)必須保證能夠長期安全可靠穩(wěn)定的運(yùn)行;二是系統(tǒng)能夠切實(shí)解決用戶所面臨的問題,并保證數(shù)據(jù)分析結(jié)果的科學(xué)性。
以下分別從功能、邏輯和技術(shù)3 個方面闡述系統(tǒng)架構(gòu)。
(1)系統(tǒng)功能架構(gòu)。根據(jù)系統(tǒng)設(shè)計(jì)目標(biāo)與原則,采用數(shù)據(jù)管理員后臺與數(shù)據(jù)分析前臺的結(jié)構(gòu)。其中數(shù)據(jù)管理員后臺主要包括用戶權(quán)限劃分、用戶管理、基礎(chǔ)數(shù)據(jù)管理、系統(tǒng)管理等功能;數(shù)據(jù)分析前臺則主要包括數(shù)據(jù)的統(tǒng)計(jì)、分析、可視化、預(yù)測預(yù)警等功能。系統(tǒng)功能結(jié)構(gòu)如圖1 所示。
圖1 系統(tǒng)功能結(jié)構(gòu)Fig.1 System functional structure
(2)系統(tǒng)邏輯架構(gòu)。系統(tǒng)邏輯架構(gòu)如圖2 所示,具有以下3 個特點(diǎn)。①在用戶個性化需求日益增加的情況下,需要系統(tǒng)具備多種方式訪問應(yīng)用的能力,即有多個視圖對應(yīng)一個模型的能力。例如,系統(tǒng)中所有不同種類、不同形式的安全信息的增加、刪除、修改、查詢操作均采用統(tǒng)一的信息模型,對應(yīng)不同的數(shù)據(jù)表。采用MVC 設(shè)計(jì)模式[6-7],利用一個信息模型對應(yīng)多個視圖即可完成這種功能。既減少了代碼的復(fù)用性,又減少了后期代碼的維護(hù)量。②將系統(tǒng)的邏輯架構(gòu)分層化后,一個應(yīng)用的業(yè)務(wù)流程或者業(yè)務(wù)規(guī)則的改變往往只需改動MVC三層模型中的某一層而不影響其他層的代碼,從而降低了代碼的耦合性。③這種架構(gòu)有利于軟件工程化管理。由于不同的層各司其職,能更好地實(shí)現(xiàn)系統(tǒng)開發(fā)中的分工,也能降低后期系統(tǒng)維護(hù)難度。
圖2 系統(tǒng)邏輯結(jié)構(gòu)Fig.2 System logical structure
(3)系統(tǒng)技術(shù)架構(gòu)。系統(tǒng)后端總體采用python-flask 框架作為開發(fā)平臺,基于MVC 模式,系統(tǒng)數(shù)據(jù)存儲使用MySQL作為存儲后端。其中在輔助決策模塊使用深度學(xué)習(xí)模型LSTM 及爬蟲技術(shù),數(shù)據(jù)分析模塊使用數(shù)據(jù)可視化及大數(shù)據(jù)分析等技術(shù)。系統(tǒng)前端基于bootstrap 框架,加入大量JavaScript 動態(tài)頁面技術(shù)。系統(tǒng)技術(shù)架構(gòu)如圖3所示。
圖3 系統(tǒng)技術(shù)架構(gòu)Fig.3 System technical architecture
車務(wù)段安全信息分析與輔助決策系統(tǒng)采用模塊化結(jié)構(gòu)設(shè)計(jì),其功能主要包括基礎(chǔ)信息管理模塊、統(tǒng)計(jì)分析與可視化模塊,以及統(tǒng)計(jì)分析與可視化模塊。
基礎(chǔ)信息管理模塊如圖4 所示?;A(chǔ)信息管理模塊主要完成對各類安全信息的實(shí)時記錄和存儲,并在日常數(shù)據(jù)的維護(hù)中對安全信息做基礎(chǔ)的增加、刪除、修改、查詢、撤回等操作。對于數(shù)據(jù)信息的管理,各基礎(chǔ)功能均采取批量化操作。另外,為了滿足不同用戶的查詢需求,設(shè)置SQL 查詢、特定查詢、自定義查詢功能模塊,支持模糊查詢和精確查詢,從而提高查詢效率。支持手動導(dǎo)入安全信息系統(tǒng)的原始數(shù)據(jù)和從鐵路局集團(tuán)公司安全信息庫中導(dǎo)出數(shù)據(jù),提高了數(shù)據(jù)轉(zhuǎn)化效率,減少了數(shù)據(jù)的跨平臺轉(zhuǎn)換。
圖4 基礎(chǔ)信息管理模塊Fig.4 Basic information management module
基礎(chǔ)信息管理模塊通過統(tǒng)一管理相關(guān)信息、減少人工操作,提高管理效率。
(1)現(xiàn)場安全信息管理?,F(xiàn)場安全信息表是通過基層工作人員在沿線車站的現(xiàn)場進(jìn)行檢查記錄,主要記錄常規(guī)檢查中的檢查記錄,以及當(dāng)發(fā)現(xiàn)違反規(guī)章時的問題及其附加描述。該信息主要用來對現(xiàn)場的實(shí)際工作情況進(jìn)行管理和監(jiān)測。
(2)基礎(chǔ)安全信息管理?;A(chǔ)安全信息表對所有已出現(xiàn)安全問題主體的詳細(xì)統(tǒng)計(jì)以及對該問題的詳細(xì)描述進(jìn)行匯總,實(shí)現(xiàn)對整個車務(wù)段涉及違反操作管理辦法、違反作業(yè)標(biāo)準(zhǔn)、運(yùn)輸調(diào)度規(guī)則等諸多日常安全信息的管理、統(tǒng)計(jì)、可視化。以某車務(wù)段安全信息為例,通過信息提取,比照海恩法則,對安全信息進(jìn)行分類:將出現(xiàn)事故苗頭的嚴(yán)重問題定為A 類安全信息,將關(guān)鍵性、突出性隱患問題定為B 類安全信息,將一般性安全問題定為C 類安全信息,將對安全生產(chǎn)不會造成直接影響的輕微性問題定為D 類安全信息。
(3)用戶信息管理。用戶信息表主要用來對整個使用車務(wù)段信息系統(tǒng)的用戶進(jìn)行管理、存儲、調(diào)取,該用戶信息統(tǒng)一由系統(tǒng)管理員進(jìn)行業(yè)務(wù)操作。
(4)員工基礎(chǔ)信息管理。員工信息來源于每年對車務(wù)段員工的信息普查,記錄車務(wù)段中每位員工的詳細(xì)信息,通過該表能夠?qū)φ麄€車務(wù)段的人員構(gòu)成、組織結(jié)構(gòu)有清晰的了解。員工信息與其他信息配合完成系統(tǒng)數(shù)據(jù)分析工作。
統(tǒng)計(jì)分析與可視化模塊如圖5 所示。該模塊主要通過對實(shí)時數(shù)據(jù)庫信息進(jìn)行挖掘,對不同類別的數(shù)據(jù)進(jìn)行篩選,形成可視化圖表,從而更直觀地反映當(dāng)前工作狀態(tài)中存在的安全問題與隱患,輔助安監(jiān)部門開展日常工作。
圖5 數(shù)據(jù)分析與可視化模塊Fig.5 Data analysis and visualization module
統(tǒng)計(jì)分析與可視化模塊從多個維度對數(shù)據(jù)進(jìn)行深度分析。①指標(biāo)類信息。對不同的安全指標(biāo)進(jìn)行獨(dú)立分析,反映不同因素和指標(biāo)對于安全問題影響程度。②時間類信息。統(tǒng)計(jì)并繪制安全信息數(shù)量的年度、季度和月度的同比與環(huán)比信息,在宏觀上反映變化趨勢。在此基礎(chǔ)之上對周、日、時數(shù)據(jù)進(jìn)行統(tǒng)計(jì),在細(xì)節(jié)上反映近期存在的問題與隱患,展示了在時間維度上對安全問題的分類分析與可視化。部分?jǐn)?shù)據(jù)可視化界面如圖6 所示。③主體類信息。統(tǒng)計(jì)分析在車間/班組/個人3 個維度的安全問題數(shù)量。在同一維度中,對各個車間/班組/個人進(jìn)行精確統(tǒng)計(jì),并進(jìn)行可視化對比,將問題準(zhǔn)確落實(shí)在相應(yīng)主體上,為后續(xù)工作指明方向。④綜合類信息。主要對整個車務(wù)段的員工進(jìn)行人員基礎(chǔ)信息統(tǒng)計(jì),如政治面貌、教育程度、人員來源、年齡結(jié)構(gòu)等基礎(chǔ)信息。綜合類信息反映了整個單位的員工結(jié)構(gòu)情況,為后續(xù)人力資源分配提供參考。⑤關(guān)鍵點(diǎn)信息。通過對人員動態(tài)、關(guān)鍵作業(yè)環(huán)節(jié)、關(guān)鍵班組、關(guān)鍵崗位、關(guān)鍵風(fēng)險點(diǎn)等進(jìn)行分析,生成一段時期安全風(fēng)險的動態(tài)變化圖,并配有針對個體的詳細(xì)安全信息,從而反映出該時期的具體問題及出現(xiàn)問題較為集中的個體,為各部門的考核提供重要依據(jù)。
圖6 部分?jǐn)?shù)據(jù)可視化界面Fig.6 Part of the data visualization interface
由于系統(tǒng)需要進(jìn)行大量的實(shí)時性繪圖,以及數(shù)據(jù)分析預(yù)測等操作,為提高系統(tǒng)的訪問速度及性能,采用Flask-cache 模塊對系統(tǒng)中的部分視圖函數(shù)、業(yè)務(wù)函數(shù)進(jìn)行緩存,并利用Redis 作為Flask緩存后端。
輔助決策模塊是建立在對實(shí)時數(shù)據(jù)監(jiān)測的基礎(chǔ)之上,利用深度學(xué)習(xí)及數(shù)理統(tǒng)計(jì)方法,對已發(fā)現(xiàn)的隱患問題進(jìn)行風(fēng)險預(yù)警及隱患預(yù)測,從而及時了解安全隱患排查情況并推動各單位開展整治隱患工作。輔助決策模塊如圖7 所示。主要包括風(fēng)險預(yù)警和隱患預(yù)測2 大模塊。在預(yù)警模塊中利用統(tǒng)計(jì)學(xué)方法對各車間、班組、個人的現(xiàn)場安全信息進(jìn)行安全預(yù)警,并根據(jù)未來一周的天氣情況作輔助決策,針對不同維度與不同等級的風(fēng)險進(jìn)行分析及預(yù)警,從而達(dá)到警示管理人員并提前做出應(yīng)急處理的目的;在預(yù)測模塊中,利用深度學(xué)習(xí)模型對未來2天(以每2 h 為間隔)進(jìn)行隱患預(yù)測,基于已發(fā)生的安全信息數(shù)據(jù),預(yù)測未來發(fā)現(xiàn)隱患的數(shù)量及隱患較為集中的時間段,并對比近期同一時段隱患數(shù)量的變化趨勢提出輔助決策建議,為后續(xù)工作重點(diǎn)確定方向。
圖7 輔助決策模塊Fig.7 Auxiliary decision-making module
2.3.1 風(fēng)險預(yù)警模塊
(1)主體預(yù)警。主體預(yù)警通過查詢數(shù)據(jù)庫,計(jì)算各類安全問題的發(fā)生頻率,對超過閾值的主體進(jìn)行郵件預(yù)警。管理人員在錄入安全信息后,系統(tǒng)對不同主體發(fā)生的不同種類安全問題進(jìn)行統(tǒng)計(jì),對于不同維度的主體所采取的預(yù)警閾值算法也不同。①對于車間主體與班組主體,由于各個車間/班組的規(guī)模不同,人員組成結(jié)構(gòu)也不同,每個車間/班組采用獨(dú)立的預(yù)警閾值算法,當(dāng)超過預(yù)警閾值系統(tǒng)會自動發(fā)送郵件至車間/班組負(fù)責(zé)人。②對于個人主體而言,統(tǒng)一使用一個預(yù)警閾值,若超過閾值,系統(tǒng)會自動給個人發(fā)送郵件作為警示,閾值的算法采用指數(shù)加權(quán)移動平均的思想,通過移動平均消除時間序列中的不規(guī)則變動,從而分析出時間序列的長期趨勢,系統(tǒng)預(yù)警體系隨著實(shí)際情況的變化而變化。
另外,系統(tǒng)引入評價體系,以選定主體的歷史閾值數(shù)據(jù)作為基礎(chǔ),將歷史閾值繪制成圖,以更好地反映該主體一段時間內(nèi)的安全趨勢,計(jì)算最近時間范圍內(nèi)閾值的斜率,并將斜率值作為該主體當(dāng)月的安全評分。評分若不大于零則說明該主體處于安全情況逐漸向好或持平的趨勢,否則說明該主體安全情況逐漸變差。若連續(xù)一段時間評分均大于零且數(shù)字呈逐漸擴(kuò)大的趨勢,則將根據(jù)該車間/班組具體情況做重點(diǎn)整改。這種評價方式能夠彌補(bǔ)指數(shù)加權(quán)移動平均算法的弊端,實(shí)際工作當(dāng)中根據(jù)不同的預(yù)警等級對不同主體進(jìn)行不同的應(yīng)急處置,并進(jìn)行相應(yīng)的日度和月度考核反饋。
(2)天氣預(yù)警。由于天氣狀況是影響安全生產(chǎn)與運(yùn)輸?shù)闹匾绊懸蛩兀蚨鴮μ鞖鉅顩r的預(yù)警必不可少。該模塊通過爬蟲訪問天氣預(yù)報網(wǎng)絡(luò)接口,實(shí)時爬取不同地區(qū)的天氣預(yù)報,之后會將預(yù)報信息經(jīng)過系統(tǒng)數(shù)據(jù)處理,最終系統(tǒng)自動根據(jù)不同的天氣變化、溫度變化等變量提前進(jìn)行郵件預(yù)警,并給出應(yīng)對建議和措施。
2.3.2 LSTM 預(yù)測模塊
LSTM 預(yù)測模塊引入長短期記憶神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型,基于已發(fā)生的安全信息數(shù)量進(jìn)行預(yù)測,通過預(yù)測數(shù)據(jù)趨勢達(dá)到輔助分配管理資源與風(fēng)險評估的作用。在實(shí)際工作中,影響安全問題發(fā)生的因素非常復(fù)雜,包括現(xiàn)場作業(yè)標(biāo)準(zhǔn)、職工不安全行為、管理缺陷等諸多因素,而采用基于歷史數(shù)據(jù)規(guī)律的預(yù)測方式簡化了預(yù)測難度,雖然這種方式降低了預(yù)測精度,但是預(yù)測隱患的數(shù)量隨時間變化的趨勢與實(shí)際趨勢高度吻合。因此,該模塊能夠結(jié)合預(yù)測趨勢的變化,對后期工作重點(diǎn)時段的監(jiān)管力度、監(jiān)管方式等因素進(jìn)行調(diào)整與輔助分析,并形成綜合風(fēng)險評價報告。
基于LSTM 的安全問題數(shù)量預(yù)測方法首先對數(shù)據(jù)進(jìn)行預(yù)處理并構(gòu)建模型,當(dāng)進(jìn)行模型訓(xùn)練和測試時,為實(shí)現(xiàn)數(shù)據(jù)的單變量多步預(yù)測[8],采用滑動窗口逐點(diǎn)迭代的預(yù)測方式,將滑動窗口定義為輸入數(shù)據(jù)的寬度[9-10],對于下一個預(yù)測點(diǎn),使用該寬度的時間窗循環(huán)向后移動一個步長,直至達(dá)到預(yù)測要求。最后將模型嵌入系統(tǒng),并將預(yù)測結(jié)果傳至前端。數(shù)據(jù)預(yù)測界面如圖8 所示。
圖8 數(shù)據(jù)預(yù)測界面Fig.8 Data prediction interface
車務(wù)段安全信息分析與輔助決策系統(tǒng)通過大數(shù)據(jù)分析、深度學(xué)習(xí)等技術(shù)手段實(shí)現(xiàn)了信息共享、數(shù)據(jù)整合、綜合分析、實(shí)時預(yù)警、動態(tài)管理、風(fēng)險研判等功能。在系統(tǒng)實(shí)際運(yùn)用中,通過及時發(fā)現(xiàn)安全問題的高發(fā)時段,并根據(jù)數(shù)據(jù)分析的結(jié)果找準(zhǔn)問題根源,將安全隱患解決在源頭;針對職工由于技能不熟練、盲目作業(yè)等導(dǎo)致安全事故頻發(fā)的現(xiàn)象,及時提出制定針對性管控措施,做到補(bǔ)齊安全管理短板。車務(wù)段安全信息分析與輔助決策系統(tǒng)的應(yīng)用使傳統(tǒng)車務(wù)段安全信息統(tǒng)計(jì)平臺得到全面升級優(yōu)化,提升了數(shù)據(jù)統(tǒng)計(jì)分析水平,提高了工作人員的工作效率和管理人員的決策效率。