閻紅巧,樊志強(qiáng),郝壯遠(yuǎn)
(中國石油集團(tuán)安全環(huán)保技術(shù)研究院有限公司HSE信息中心,北京 102206)
油氣行業(yè)具有易燃易爆炸、有毒有害、高溫高壓等生產(chǎn)特點(diǎn),一旦發(fā)生事故,不僅會(huì)造成重大的經(jīng)濟(jì)損失,而且會(huì)帶來嚴(yán)重的社會(huì)影響,因此防范安全事故的發(fā)生是石油及天然氣企業(yè)安全管理的重要目標(biāo)和方向。然而,近年來油氣生產(chǎn)企業(yè)同類型安全事故重復(fù)發(fā)生,其重要原因是企業(yè)對(duì)歷史事故事件發(fā)生的原因認(rèn)識(shí)不足。隨著信息化技術(shù)的發(fā)展,企業(yè)積累了大量的事故事件報(bào)告數(shù)據(jù),但文本挖掘技術(shù)的不足限制了事故事件資源利用的程度。
目前,我國對(duì)事故事件資源的利用水平仍然處于落后階段,主要表現(xiàn)在以下兩個(gè)方面:一是在某起重特大事故發(fā)生后對(duì)事故原因進(jìn)行深刻剖析,以預(yù)防同類型事故再次發(fā)生;二是采用人工方式批量分析事故數(shù)據(jù),統(tǒng)計(jì)各類事故發(fā)生的規(guī)律,為事故預(yù)防提供依據(jù)。上述兩者都是針對(duì)油氣生產(chǎn)企業(yè)事故發(fā)生原因和發(fā)生規(guī)律展開的分析與研究,但均存在一定的局限性:前者主要是針對(duì)某一起事故開展事故原因的分析,其數(shù)據(jù)量小,因而難以發(fā)現(xiàn)事故發(fā)生的共性原因;后者利用人工方式對(duì)事故原因開展分析,雖然其分析結(jié)果有一定的價(jià)值,但效率低。相比之下,挖掘方法將事故調(diào)查報(bào)告作為數(shù)據(jù)源,可從事故調(diào)查報(bào)告中獲取事故發(fā)生時(shí)的特征信息,有利于解釋事故發(fā)生的規(guī)律?;谖谋就诰蚍椒ǖ乃悸?,許多學(xué)者利用文本挖掘方法對(duì)事故原因進(jìn)行了分析,如薛楠楠等通過對(duì)334份建筑施工安全事故報(bào)告進(jìn)行分析,識(shí)別出8項(xiàng)建筑工人不安全行為和27項(xiàng)影響因素;李解等首次運(yùn)用 R語言和文本挖掘方法,從151份地鐵施工事故報(bào)告中提取了6項(xiàng)關(guān)鍵因素和23項(xiàng)一般因素。但這些研究大多只是關(guān)注施工安全事故的原因,對(duì)油氣行業(yè)事故影響因素的研究相對(duì)較少。為此,本文以油氣生產(chǎn)企業(yè)事故事件數(shù)據(jù)為基礎(chǔ),通過建立領(lǐng)域?qū)I(yè)詞庫和停用詞庫對(duì)事故事件數(shù)據(jù)進(jìn)行分詞,建立了詞向量并基于FastText算法形成了與油氣生產(chǎn)企業(yè)事故事件信息相匹配的HSE文本語義分析模型,并利用其自動(dòng)提取大量事故調(diào)查報(bào)告中失效屏障類型、屏障失效原因,進(jìn)而揭示導(dǎo)致事故屏障失效的管理因素,為尋找油氣生產(chǎn)企業(yè)安全管理缺陷與事故預(yù)控提供依據(jù)。
本研究收集了某油氣生產(chǎn)企業(yè)2000—2018年事故數(shù)據(jù),數(shù)據(jù)類型為非結(jié)構(gòu)化文本數(shù)據(jù),包括事故經(jīng)過描述、事故原因描述等,并考察數(shù)據(jù)的完整性和可用性。原始事故數(shù)據(jù)示例如表1所示。
表1 原始事故數(shù)據(jù)示例Table 1 Example of raw accident data
基于自然語言處理技術(shù),利用事故數(shù)據(jù)建立訓(xùn)練樣本,構(gòu)建了HSE文本語義分析模型,并利用該模型從1萬余條事故數(shù)據(jù)中自動(dòng)提取失效屏障類型、屏障失效原因和導(dǎo)致屏障失效的管理因素,進(jìn)而進(jìn)行了統(tǒng)計(jì)分析,其流程主要包括數(shù)據(jù)預(yù)處理、建立機(jī)器學(xué)習(xí)樣本、建立HSE文本語義分析模型、模型應(yīng)用、結(jié)果可視化分析和建議與措施6個(gè)環(huán)節(jié),見圖1。
圖1 事故事件歸因分析流程Fig.1 Cause analysis process of accidents and incidents
本文數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)清洗、數(shù)據(jù)集成和數(shù)據(jù)缺失標(biāo)記三項(xiàng)任務(wù)。本文主要分析事故事件發(fā)生的原因,由于原始事故文本數(shù)據(jù)中一些不相關(guān)的信息并不會(huì)為分析模型的構(gòu)建提供重要信息,反而會(huì)在模型訓(xùn)練期間制造噪音,因此需要通過數(shù)據(jù)清洗將其從訓(xùn)練集中去除;此外,原始事故文本數(shù)據(jù)中還存在缺少“事故經(jīng)過描述”或者“事故原因描述”字段的事故,因此需要通過數(shù)據(jù)集成以完善事故事件報(bào)告信息;最后,針對(duì)數(shù)據(jù)集成之后依然缺失信息的事故事件數(shù)據(jù),則標(biāo)記為數(shù)據(jù)來源不明,后續(xù)不參與建模。
本文在屏障理論的基礎(chǔ)上建立了機(jī)器學(xué)習(xí)樣本。屏障是指在事故早期階段可以阻止危害因素進(jìn)一步向事故演變的措施,它可以限制危害因素產(chǎn)生的傷害和后果。每一個(gè)屏障,如果其完好,都應(yīng)該能夠完全阻止事件的進(jìn)一步發(fā)展。
2.2.1 數(shù)據(jù)標(biāo)注
在屏障理論的基礎(chǔ)上,通過注解、打標(biāo)簽的方式建立機(jī)器學(xué)習(xí)訓(xùn)練樣本。建立訓(xùn)練樣本是本文的關(guān)鍵,這項(xiàng)任務(wù)需要具備石油領(lǐng)域?qū)I(yè)知識(shí)和安全專業(yè)素養(yǎng)的人員完成,需逐一識(shí)別出事故中失效的屏障類型,并依次分析屏障失效原因和導(dǎo)致屏障失效的管理因素。值得說明的是,失效屏障類型、屏障失效原因和導(dǎo)致屏障失效的管理因素具有對(duì)應(yīng)關(guān)系。針對(duì)每一份事故調(diào)查報(bào)告,標(biāo)記其失效的屏障類型、每類屏障的失效原因和導(dǎo)致屏障失效的管理因素,形成機(jī)器學(xué)習(xí)訓(xùn)練樣本。訓(xùn)練樣本建立的流程見圖2,訓(xùn)練樣本示例見表2。
圖2 機(jī)器學(xué)習(xí)樣本建立流程Fig.2 Process of constructing training samples for machine learning
表2 機(jī)器學(xué)習(xí)訓(xùn)練樣本示例Table 2 Examples of training samples for machine learning
2.2.2 事故事件歸因
形成事故事件歸因分類列表是建立機(jī)器學(xué)習(xí)樣本的基礎(chǔ)?;诮C(jī)器學(xué)習(xí)樣本的需要,事故事件歸因列表包括三部分,分別為屏障類型列表、屏障失效原因列表和導(dǎo)致屏障失效的管理因素列表。
(1) 屏障類型列表。本文參照國際油氣協(xié)會(huì)(International Association of Oil & Gas Producers,簡稱IOGP)的做法,將屏障劃分為技術(shù)屏障和人員屏障。其中,從安全功能角度將技術(shù)屏障分為8類,見表3;基于人員在人機(jī)系統(tǒng)中的典型活動(dòng)將人員屏障分為5類,見表4。
表3 技術(shù)屏障類型Table 3 Technical barrier types
表4 人員屏障類型Table 4 Human barrier types
(2) 屏障失效原因列表。本文將屏障失效原因列表分為技術(shù)屏障失效原因列表和人員屏障失效原因列表。其中,技術(shù)屏障失效的原因分為7類,見表5;人員屏障失效的原因分為7類,見表6。
表5 技術(shù)屏障失效的原因Table 5 Reasons for technical barrier failure
表6 人員屏障失效的原因Table 6 Reasons for human barrier failure
(3) 導(dǎo)致屏障失效的管理因素列表?;趪HHSE管理體系和油氣行業(yè)特點(diǎn),將導(dǎo)致屏障失效的管理因素分為13類,見表7。
表7 導(dǎo)致屏障失效的管理因素Table 7 Management factors leading to barrier failure
HSE文本語義分析模型的構(gòu)建過程即為訓(xùn)練HSE文本分類器的過程。本文采用監(jiān)督式的FastText模型訓(xùn)練HSE文本分類器。FastText模型架構(gòu)如圖3所示,其包含輸入層、隱含層和輸出層。其中,隱含層是模型固有結(jié)構(gòu),在此不做具體說明;輸出層為分類器;輸入層是文本向量,其處理方式?jīng)Q定了HSE文本語義分類模型的分類效果。
圖3 FastText模型架構(gòu)圖Fig.3 Architecture diagram of FastText Model
FastText模型架構(gòu)圖中x
表示文本中第i
個(gè)詞的特征向量,文本向量為詞向量的平均值,因此分詞效果對(duì)于文本向量的正確表達(dá)至關(guān)重要。本文通過爬蟲技術(shù)、行業(yè)標(biāo)準(zhǔn)和新詞發(fā)現(xiàn)等功能建立了包含19 999個(gè)領(lǐng)域的專業(yè)詞庫,并將基于領(lǐng)域?qū)I(yè)詞庫形成的文本向量作為模型輸入層。在訓(xùn)練分類模型之前將數(shù)據(jù)分割為訓(xùn)練集和驗(yàn)證集,其比例分別為70%和30%,驗(yàn)證集用來評(píng)估分類器的性能。構(gòu)建HSE文本語義分析模型的步驟,見圖4。圖4 HSE文本語義分析模型的構(gòu)建步驟Fig.4 Construction steps of HSE text semantic analysis model
值得說明的是,由于本文訓(xùn)練數(shù)量有限,因此在建立機(jī)器學(xué)習(xí)樣本時(shí)采用的是關(guān)鍵詞標(biāo)注方式,這樣機(jī)器可以高效、精準(zhǔn)地學(xué)習(xí)事故事件歸因知識(shí),從而大大提高模型構(gòu)建的效率。通過兩次模型調(diào)優(yōu)和迭代,本文最終訓(xùn)練得到的分類器模型的準(zhǔn)確率為85%、召回率為82%,模型基本可以滿足事故事件歸因信息的提取需求。
本文利用構(gòu)建的HSE文本語義分析模型自動(dòng)提取海量事故事件報(bào)告中失效屏障類型、屏障失效原因和導(dǎo)致屏障失效的管理因素,并通過統(tǒng)計(jì)其分布規(guī)律,將結(jié)果以圖像的形式直觀地展示出來,達(dá)到所見即所得的效果。
基于事故事件歸因分析結(jié)果,結(jié)合企業(yè)風(fēng)險(xiǎn)特點(diǎn)及其事故事件相關(guān)管理辦法,從防范事故事件發(fā)生的角度,提出了相應(yīng)的防控建議與措施。
本文首先采用某油氣生產(chǎn)企業(yè)300個(gè)事故報(bào)告數(shù)據(jù)作為訓(xùn)練樣本,構(gòu)建了事故事件歸因分類器,并利用此分類器從1萬余條事故事件數(shù)據(jù)中自動(dòng)提取失效屏障類型、屏障失效原因和導(dǎo)致屏障失效的管理因素,最后通過可視化的方式展示失效屏障類型的分布規(guī)律,并將其與屏障失效原因和導(dǎo)致屏障失效的管理因素進(jìn)行關(guān)聯(lián),尋找HSE管理的缺陷和短板,為持續(xù)改進(jìn)HSE管理提供建議。
幾乎每起事故事件都是技術(shù)屏障和人員屏障失效疊加所導(dǎo)致的,圖5和圖6分別展示了不同技術(shù)屏障類型和人員屏障類型對(duì)事故事件影響的比例。
由圖5和圖6可知:技術(shù)屏障類型中結(jié)構(gòu)完整性屏障失效導(dǎo)致的事故事件數(shù)量最多,其導(dǎo)致了22%的事故事件;人員屏障類型中人員操作屏障失效導(dǎo)致的事故事件數(shù)量最多,其導(dǎo)致了59%的事故事件。
圖5 不同技術(shù)屏障類型失效對(duì)事故事件的影響比例Fig.5 Influence ratio of different types of technical barrier failure on accidents and incidents
圖6 不同人員屏障類型失效對(duì)事故事件的影響比例Fig.6 Influence ratio of different types of human barriers failure on accidents and incidents
本文利用熱力圖展示了事故中13類失效屏障類型與屏障失效原因之間的關(guān)聯(lián)關(guān)系,見圖7。其中,橫軸為失效屏障類型,縱軸為屏障失效原因;顏色的深淺代表了占比大小,顏色越深表明兩者之間的關(guān)聯(lián)關(guān)系越密切。
由圖7可知:裝置/設(shè)備設(shè)計(jì)缺陷和裝置/設(shè)備運(yùn)行控制缺陷分別造成了40%和19%的結(jié)構(gòu)完整性屏障失效,它們是結(jié)構(gòu)完整性屏障失效的關(guān)鍵原因;安全意識(shí)缺乏/疏忽/失誤和安全知識(shí)/技能不足分別造成了60%和13%的人員操作屏障失效,它們是人員操作屏障失效的關(guān)鍵原因。
圖7 事故中失效屏障類型與屏障失效原因之間的關(guān)聯(lián)關(guān)系Fig.7 Correlation relationship between failure barrier types and barrier failure causes of accidents and incidents
事故中失效屏障類型與導(dǎo)致屏障失效的管理因素之間的關(guān)聯(lián)關(guān)系,見圖8。
圖8 事故中失效屏障類型與導(dǎo)致屏障失效的管理因素之間的關(guān)聯(lián)關(guān)系Fig.8 Correlation relationship between failure barrier types of accidents and incidents and management factors causing barrier failure
由圖8可知:設(shè)備管理因素和風(fēng)險(xiǎn)防控與隱患排查治理因素分別造成了27%和11%的結(jié)構(gòu)完整性屏障失效,它們是結(jié)構(gòu)完整性屏障失效的關(guān)鍵管理因素;風(fēng)險(xiǎn)防控與隱患排查治理因素和教育培訓(xùn)因素分別造成了31%和14%的人員操作屏障失效,它們是人員操作屏障失效的關(guān)鍵因素。
本文采用國際石油及天然氣行業(yè)主流的事故致因理論——屏障理論分析了事故事件調(diào)查報(bào)告數(shù)據(jù),建立了適用于石油石化行業(yè)的HSE文本語義分析模型,并從1萬余條事故事件數(shù)據(jù)中自動(dòng)提取與分析了事故事件中失效屏障類型、屏障失效原因和導(dǎo)致屏障失效的管理因素,得到如下結(jié)論與建議:
(1) 59%的事故事件與人員操作屏障失效有關(guān),22%的事故事件與結(jié)構(gòu)完整性屏障失效相關(guān);安全意識(shí)缺乏/疏忽/失誤和安全知識(shí)/技能不足是導(dǎo)致人員操作屏障失效的關(guān)鍵原因,裝置/設(shè)備設(shè)計(jì)缺陷和裝置/設(shè)備運(yùn)行控制缺陷是導(dǎo)致結(jié)構(gòu)完整性屏障失效的關(guān)鍵原因。
(2) 員工教育培訓(xùn)不到位和風(fēng)險(xiǎn)管控與隱患排查管理不到位分別是導(dǎo)致人員操作屏障失效和結(jié)構(gòu)完整性屏障失效的共性管理因素,建議從事故預(yù)防的角度,采用虛擬現(xiàn)實(shí)技術(shù)、借助模擬操作機(jī)來切實(shí)提高員工的安全技能水平,并設(shè)計(jì)科學(xué)的員工培訓(xùn)效果考核指標(biāo),減少員工違章、誤操作不安全行為,同時(shí)提高員工的風(fēng)險(xiǎn)辨識(shí)能力,加強(qiáng)風(fēng)險(xiǎn)隱患排查治理工作,切實(shí)減少事故的發(fā)生。
(3) 采用本文構(gòu)建的HSE文本語義分析模型,只需1 min即可實(shí)現(xiàn)對(duì)1萬余條事故事件報(bào)告信息的提取,而人工提取每份事故事件報(bào)告信息至少需要30 min,分析效率提高了約30萬倍,為事故事件資源價(jià)值的利用奠定了技術(shù)基礎(chǔ)。
(4) 語義分析模型領(lǐng)域?qū)I(yè)詞庫和事故事件樣本的全面性、均衡性、數(shù)量對(duì)模型性能指標(biāo)的影響較大,未來計(jì)劃完善領(lǐng)域?qū)I(yè)詞庫、補(bǔ)充事故事件樣本數(shù)據(jù)數(shù)量和質(zhì)量,持續(xù)迭代優(yōu)化模型,以提高HSE文本語義分析模型的準(zhǔn)確率和召回率。