国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)技術(shù)在油氣行業(yè)事故事件致因分析中的應(yīng)用

2021-12-04 02:44:36閻紅巧樊志強(qiáng)郝壯遠(yuǎn)
安全與環(huán)境工程 2021年6期
關(guān)鍵詞:分析模型屏障語義

閻紅巧,樊志強(qiáng),郝壯遠(yuǎn)

(中國石油集團(tuán)安全環(huán)保技術(shù)研究院有限公司HSE信息中心,北京 102206)

油氣行業(yè)具有易燃易爆炸、有毒有害、高溫高壓等生產(chǎn)特點(diǎn),一旦發(fā)生事故,不僅會(huì)造成重大的經(jīng)濟(jì)損失,而且會(huì)帶來嚴(yán)重的社會(huì)影響,因此防范安全事故的發(fā)生是石油及天然氣企業(yè)安全管理的重要目標(biāo)和方向。然而,近年來油氣生產(chǎn)企業(yè)同類型安全事故重復(fù)發(fā)生,其重要原因是企業(yè)對(duì)歷史事故事件發(fā)生的原因認(rèn)識(shí)不足。隨著信息化技術(shù)的發(fā)展,企業(yè)積累了大量的事故事件報(bào)告數(shù)據(jù),但文本挖掘技術(shù)的不足限制了事故事件資源利用的程度。

目前,我國對(duì)事故事件資源的利用水平仍然處于落后階段,主要表現(xiàn)在以下兩個(gè)方面:一是在某起重特大事故發(fā)生后對(duì)事故原因進(jìn)行深刻剖析,以預(yù)防同類型事故再次發(fā)生;二是采用人工方式批量分析事故數(shù)據(jù),統(tǒng)計(jì)各類事故發(fā)生的規(guī)律,為事故預(yù)防提供依據(jù)。上述兩者都是針對(duì)油氣生產(chǎn)企業(yè)事故發(fā)生原因和發(fā)生規(guī)律展開的分析與研究,但均存在一定的局限性:前者主要是針對(duì)某一起事故開展事故原因的分析,其數(shù)據(jù)量小,因而難以發(fā)現(xiàn)事故發(fā)生的共性原因;后者利用人工方式對(duì)事故原因開展分析,雖然其分析結(jié)果有一定的價(jià)值,但效率低。相比之下,挖掘方法將事故調(diào)查報(bào)告作為數(shù)據(jù)源,可從事故調(diào)查報(bào)告中獲取事故發(fā)生時(shí)的特征信息,有利于解釋事故發(fā)生的規(guī)律?;谖谋就诰蚍椒ǖ乃悸?,許多學(xué)者利用文本挖掘方法對(duì)事故原因進(jìn)行了分析,如薛楠楠等通過對(duì)334份建筑施工安全事故報(bào)告進(jìn)行分析,識(shí)別出8項(xiàng)建筑工人不安全行為和27項(xiàng)影響因素;李解等首次運(yùn)用 R語言和文本挖掘方法,從151份地鐵施工事故報(bào)告中提取了6項(xiàng)關(guān)鍵因素和23項(xiàng)一般因素。但這些研究大多只是關(guān)注施工安全事故的原因,對(duì)油氣行業(yè)事故影響因素的研究相對(duì)較少。為此,本文以油氣生產(chǎn)企業(yè)事故事件數(shù)據(jù)為基礎(chǔ),通過建立領(lǐng)域?qū)I(yè)詞庫和停用詞庫對(duì)事故事件數(shù)據(jù)進(jìn)行分詞,建立了詞向量并基于FastText算法形成了與油氣生產(chǎn)企業(yè)事故事件信息相匹配的HSE文本語義分析模型,并利用其自動(dòng)提取大量事故調(diào)查報(bào)告中失效屏障類型、屏障失效原因,進(jìn)而揭示導(dǎo)致事故屏障失效的管理因素,為尋找油氣生產(chǎn)企業(yè)安全管理缺陷與事故預(yù)控提供依據(jù)。

1 數(shù)據(jù)來源

本研究收集了某油氣生產(chǎn)企業(yè)2000—2018年事故數(shù)據(jù),數(shù)據(jù)類型為非結(jié)構(gòu)化文本數(shù)據(jù),包括事故經(jīng)過描述、事故原因描述等,并考察數(shù)據(jù)的完整性和可用性。原始事故數(shù)據(jù)示例如表1所示。

表1 原始事故數(shù)據(jù)示例Table 1 Example of raw accident data

2 研究方法

基于自然語言處理技術(shù),利用事故數(shù)據(jù)建立訓(xùn)練樣本,構(gòu)建了HSE文本語義分析模型,并利用該模型從1萬余條事故數(shù)據(jù)中自動(dòng)提取失效屏障類型、屏障失效原因和導(dǎo)致屏障失效的管理因素,進(jìn)而進(jìn)行了統(tǒng)計(jì)分析,其流程主要包括數(shù)據(jù)預(yù)處理、建立機(jī)器學(xué)習(xí)樣本、建立HSE文本語義分析模型、模型應(yīng)用、結(jié)果可視化分析和建議與措施6個(gè)環(huán)節(jié),見圖1。

圖1 事故事件歸因分析流程Fig.1 Cause analysis process of accidents and incidents

2.1 數(shù)據(jù)預(yù)處理

本文數(shù)據(jù)預(yù)處理主要包括數(shù)據(jù)清洗、數(shù)據(jù)集成和數(shù)據(jù)缺失標(biāo)記三項(xiàng)任務(wù)。本文主要分析事故事件發(fā)生的原因,由于原始事故文本數(shù)據(jù)中一些不相關(guān)的信息并不會(huì)為分析模型的構(gòu)建提供重要信息,反而會(huì)在模型訓(xùn)練期間制造噪音,因此需要通過數(shù)據(jù)清洗將其從訓(xùn)練集中去除;此外,原始事故文本數(shù)據(jù)中還存在缺少“事故經(jīng)過描述”或者“事故原因描述”字段的事故,因此需要通過數(shù)據(jù)集成以完善事故事件報(bào)告信息;最后,針對(duì)數(shù)據(jù)集成之后依然缺失信息的事故事件數(shù)據(jù),則標(biāo)記為數(shù)據(jù)來源不明,后續(xù)不參與建模。

2.2 建立機(jī)器學(xué)習(xí)樣本

本文在屏障理論的基礎(chǔ)上建立了機(jī)器學(xué)習(xí)樣本。屏障是指在事故早期階段可以阻止危害因素進(jìn)一步向事故演變的措施,它可以限制危害因素產(chǎn)生的傷害和后果。每一個(gè)屏障,如果其完好,都應(yīng)該能夠完全阻止事件的進(jìn)一步發(fā)展。

2.2.1 數(shù)據(jù)標(biāo)注

在屏障理論的基礎(chǔ)上,通過注解、打標(biāo)簽的方式建立機(jī)器學(xué)習(xí)訓(xùn)練樣本。建立訓(xùn)練樣本是本文的關(guān)鍵,這項(xiàng)任務(wù)需要具備石油領(lǐng)域?qū)I(yè)知識(shí)和安全專業(yè)素養(yǎng)的人員完成,需逐一識(shí)別出事故中失效的屏障類型,并依次分析屏障失效原因和導(dǎo)致屏障失效的管理因素。值得說明的是,失效屏障類型、屏障失效原因和導(dǎo)致屏障失效的管理因素具有對(duì)應(yīng)關(guān)系。針對(duì)每一份事故調(diào)查報(bào)告,標(biāo)記其失效的屏障類型、每類屏障的失效原因和導(dǎo)致屏障失效的管理因素,形成機(jī)器學(xué)習(xí)訓(xùn)練樣本。訓(xùn)練樣本建立的流程見圖2,訓(xùn)練樣本示例見表2。

圖2 機(jī)器學(xué)習(xí)樣本建立流程Fig.2 Process of constructing training samples for machine learning

表2 機(jī)器學(xué)習(xí)訓(xùn)練樣本示例Table 2 Examples of training samples for machine learning

2.2.2 事故事件歸因

形成事故事件歸因分類列表是建立機(jī)器學(xué)習(xí)樣本的基礎(chǔ)?;诮C(jī)器學(xué)習(xí)樣本的需要,事故事件歸因列表包括三部分,分別為屏障類型列表、屏障失效原因列表和導(dǎo)致屏障失效的管理因素列表。

(1) 屏障類型列表。本文參照國際油氣協(xié)會(huì)(International Association of Oil & Gas Producers,簡稱IOGP)的做法,將屏障劃分為技術(shù)屏障和人員屏障。其中,從安全功能角度將技術(shù)屏障分為8類,見表3;基于人員在人機(jī)系統(tǒng)中的典型活動(dòng)將人員屏障分為5類,見表4。

表3 技術(shù)屏障類型Table 3 Technical barrier types

表4 人員屏障類型Table 4 Human barrier types

(2) 屏障失效原因列表。本文將屏障失效原因列表分為技術(shù)屏障失效原因列表和人員屏障失效原因列表。其中,技術(shù)屏障失效的原因分為7類,見表5;人員屏障失效的原因分為7類,見表6。

表5 技術(shù)屏障失效的原因Table 5 Reasons for technical barrier failure

表6 人員屏障失效的原因Table 6 Reasons for human barrier failure

(3) 導(dǎo)致屏障失效的管理因素列表?;趪HHSE管理體系和油氣行業(yè)特點(diǎn),將導(dǎo)致屏障失效的管理因素分為13類,見表7。

表7 導(dǎo)致屏障失效的管理因素Table 7 Management factors leading to barrier failure

2.3 建立HSE文本語義分析模型

HSE文本語義分析模型的構(gòu)建過程即為訓(xùn)練HSE文本分類器的過程。本文采用監(jiān)督式的FastText模型訓(xùn)練HSE文本分類器。FastText模型架構(gòu)如圖3所示,其包含輸入層、隱含層和輸出層。其中,隱含層是模型固有結(jié)構(gòu),在此不做具體說明;輸出層為分類器;輸入層是文本向量,其處理方式?jīng)Q定了HSE文本語義分類模型的分類效果。

圖3 FastText模型架構(gòu)圖Fig.3 Architecture diagram of FastText Model

FastText模型架構(gòu)圖中

x

表示文本中第

i

個(gè)詞的特征向量,文本向量為詞向量的平均值,因此分詞效果對(duì)于文本向量的正確表達(dá)至關(guān)重要。本文通過爬蟲技術(shù)、行業(yè)標(biāo)準(zhǔn)和新詞發(fā)現(xiàn)等功能建立了包含19 999個(gè)領(lǐng)域的專業(yè)詞庫,并將基于領(lǐng)域?qū)I(yè)詞庫形成的文本向量作為模型輸入層。在訓(xùn)練分類模型之前將數(shù)據(jù)分割為訓(xùn)練集和驗(yàn)證集,其比例分別為70%和30%,驗(yàn)證集用來評(píng)估分類器的性能。構(gòu)建HSE文本語義分析模型的步驟,見圖4。

圖4 HSE文本語義分析模型的構(gòu)建步驟Fig.4 Construction steps of HSE text semantic analysis model

值得說明的是,由于本文訓(xùn)練數(shù)量有限,因此在建立機(jī)器學(xué)習(xí)樣本時(shí)采用的是關(guān)鍵詞標(biāo)注方式,這樣機(jī)器可以高效、精準(zhǔn)地學(xué)習(xí)事故事件歸因知識(shí),從而大大提高模型構(gòu)建的效率。通過兩次模型調(diào)優(yōu)和迭代,本文最終訓(xùn)練得到的分類器模型的準(zhǔn)確率為85%、召回率為82%,模型基本可以滿足事故事件歸因信息的提取需求。

2.4 結(jié)果可視化分析

本文利用構(gòu)建的HSE文本語義分析模型自動(dòng)提取海量事故事件報(bào)告中失效屏障類型、屏障失效原因和導(dǎo)致屏障失效的管理因素,并通過統(tǒng)計(jì)其分布規(guī)律,將結(jié)果以圖像的形式直觀地展示出來,達(dá)到所見即所得的效果。

2.5 建議與措施

基于事故事件歸因分析結(jié)果,結(jié)合企業(yè)風(fēng)險(xiǎn)特點(diǎn)及其事故事件相關(guān)管理辦法,從防范事故事件發(fā)生的角度,提出了相應(yīng)的防控建議與措施。

3 實(shí)例應(yīng)用與分析

本文首先采用某油氣生產(chǎn)企業(yè)300個(gè)事故報(bào)告數(shù)據(jù)作為訓(xùn)練樣本,構(gòu)建了事故事件歸因分類器,并利用此分類器從1萬余條事故事件數(shù)據(jù)中自動(dòng)提取失效屏障類型、屏障失效原因和導(dǎo)致屏障失效的管理因素,最后通過可視化的方式展示失效屏障類型的分布規(guī)律,并將其與屏障失效原因和導(dǎo)致屏障失效的管理因素進(jìn)行關(guān)聯(lián),尋找HSE管理的缺陷和短板,為持續(xù)改進(jìn)HSE管理提供建議。

3.1 失效屏障類型分析

幾乎每起事故事件都是技術(shù)屏障和人員屏障失效疊加所導(dǎo)致的,圖5和圖6分別展示了不同技術(shù)屏障類型和人員屏障類型對(duì)事故事件影響的比例。

由圖5和圖6可知:技術(shù)屏障類型中結(jié)構(gòu)完整性屏障失效導(dǎo)致的事故事件數(shù)量最多,其導(dǎo)致了22%的事故事件;人員屏障類型中人員操作屏障失效導(dǎo)致的事故事件數(shù)量最多,其導(dǎo)致了59%的事故事件。

圖5 不同技術(shù)屏障類型失效對(duì)事故事件的影響比例Fig.5 Influence ratio of different types of technical barrier failure on accidents and incidents

圖6 不同人員屏障類型失效對(duì)事故事件的影響比例Fig.6 Influence ratio of different types of human barriers failure on accidents and incidents

3.2 屏障失效原因分析

本文利用熱力圖展示了事故中13類失效屏障類型與屏障失效原因之間的關(guān)聯(lián)關(guān)系,見圖7。其中,橫軸為失效屏障類型,縱軸為屏障失效原因;顏色的深淺代表了占比大小,顏色越深表明兩者之間的關(guān)聯(lián)關(guān)系越密切。

由圖7可知:裝置/設(shè)備設(shè)計(jì)缺陷和裝置/設(shè)備運(yùn)行控制缺陷分別造成了40%和19%的結(jié)構(gòu)完整性屏障失效,它們是結(jié)構(gòu)完整性屏障失效的關(guān)鍵原因;安全意識(shí)缺乏/疏忽/失誤和安全知識(shí)/技能不足分別造成了60%和13%的人員操作屏障失效,它們是人員操作屏障失效的關(guān)鍵原因。

圖7 事故中失效屏障類型與屏障失效原因之間的關(guān)聯(lián)關(guān)系Fig.7 Correlation relationship between failure barrier types and barrier failure causes of accidents and incidents

3.3 導(dǎo)致屏障失效的管理因素分析

事故中失效屏障類型與導(dǎo)致屏障失效的管理因素之間的關(guān)聯(lián)關(guān)系,見圖8。

圖8 事故中失效屏障類型與導(dǎo)致屏障失效的管理因素之間的關(guān)聯(lián)關(guān)系Fig.8 Correlation relationship between failure barrier types of accidents and incidents and management factors causing barrier failure

由圖8可知:設(shè)備管理因素和風(fēng)險(xiǎn)防控與隱患排查治理因素分別造成了27%和11%的結(jié)構(gòu)完整性屏障失效,它們是結(jié)構(gòu)完整性屏障失效的關(guān)鍵管理因素;風(fēng)險(xiǎn)防控與隱患排查治理因素和教育培訓(xùn)因素分別造成了31%和14%的人員操作屏障失效,它們是人員操作屏障失效的關(guān)鍵因素。

4 結(jié)論與建議

本文采用國際石油及天然氣行業(yè)主流的事故致因理論——屏障理論分析了事故事件調(diào)查報(bào)告數(shù)據(jù),建立了適用于石油石化行業(yè)的HSE文本語義分析模型,并從1萬余條事故事件數(shù)據(jù)中自動(dòng)提取與分析了事故事件中失效屏障類型、屏障失效原因和導(dǎo)致屏障失效的管理因素,得到如下結(jié)論與建議:

(1) 59%的事故事件與人員操作屏障失效有關(guān),22%的事故事件與結(jié)構(gòu)完整性屏障失效相關(guān);安全意識(shí)缺乏/疏忽/失誤和安全知識(shí)/技能不足是導(dǎo)致人員操作屏障失效的關(guān)鍵原因,裝置/設(shè)備設(shè)計(jì)缺陷和裝置/設(shè)備運(yùn)行控制缺陷是導(dǎo)致結(jié)構(gòu)完整性屏障失效的關(guān)鍵原因。

(2) 員工教育培訓(xùn)不到位和風(fēng)險(xiǎn)管控與隱患排查管理不到位分別是導(dǎo)致人員操作屏障失效和結(jié)構(gòu)完整性屏障失效的共性管理因素,建議從事故預(yù)防的角度,采用虛擬現(xiàn)實(shí)技術(shù)、借助模擬操作機(jī)來切實(shí)提高員工的安全技能水平,并設(shè)計(jì)科學(xué)的員工培訓(xùn)效果考核指標(biāo),減少員工違章、誤操作不安全行為,同時(shí)提高員工的風(fēng)險(xiǎn)辨識(shí)能力,加強(qiáng)風(fēng)險(xiǎn)隱患排查治理工作,切實(shí)減少事故的發(fā)生。

(3) 采用本文構(gòu)建的HSE文本語義分析模型,只需1 min即可實(shí)現(xiàn)對(duì)1萬余條事故事件報(bào)告信息的提取,而人工提取每份事故事件報(bào)告信息至少需要30 min,分析效率提高了約30萬倍,為事故事件資源價(jià)值的利用奠定了技術(shù)基礎(chǔ)。

(4) 語義分析模型領(lǐng)域?qū)I(yè)詞庫和事故事件樣本的全面性、均衡性、數(shù)量對(duì)模型性能指標(biāo)的影響較大,未來計(jì)劃完善領(lǐng)域?qū)I(yè)詞庫、補(bǔ)充事故事件樣本數(shù)據(jù)數(shù)量和質(zhì)量,持續(xù)迭代優(yōu)化模型,以提高HSE文本語義分析模型的準(zhǔn)確率和召回率。

猜你喜歡
分析模型屏障語義
基于BERT-VGG16的多模態(tài)情感分析模型
咬緊百日攻堅(jiān) 筑牢安全屏障
屏障修護(hù)TOP10
一道屏障
語言與語義
維護(hù)網(wǎng)絡(luò)安全 筑牢網(wǎng)絡(luò)強(qiáng)省屏障
層次分析模型在結(jié)核疾病預(yù)防控制系統(tǒng)中的應(yīng)用
“上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
全啟發(fā)式語言分析模型
認(rèn)知范疇模糊與語義模糊
中阳县| 宝鸡市| 原平市| 涡阳县| 南投县| 江门市| 盱眙县| 吴川市| 托里县| 交城县| 吉水县| 久治县| 舟山市| 建始县| 张家界市| 德钦县| 府谷县| 商南县| 富平县| 修文县| 阳山县| 英山县| 濮阳市| 邹城市| 鸡东县| 民勤县| 临湘市| 阿拉善左旗| 牙克石市| 临沧市| 辽阳市| 禹城市| 永济市| 高雄市| 利辛县| 邮箱| 车致| 天津市| 沛县| 奈曼旗| 海宁市|