雷小平,張鵬鵬
(北京龍軟科技股份有限公司,北京市 100190)
大數(shù)據(jù)分析在煤礦企業(yè)安全生產(chǎn)經(jīng)營(yíng)管理中得到廣泛應(yīng)用[1-2],我國(guó)的煤炭企業(yè)和研究人員相繼展開(kāi)智能化煤礦的研究和建設(shè),建立和完善了煤礦工業(yè)控制網(wǎng)和企業(yè)局域網(wǎng)環(huán)境,以工業(yè)組態(tài)軟件為基礎(chǔ)建設(shè)綜合自動(dòng)化集控平臺(tái),開(kāi)展以煤礦安全避險(xiǎn)為主題的“六大系統(tǒng)”建設(shè),面向煤炭企業(yè)生產(chǎn)經(jīng)營(yíng)和煤礦安全生產(chǎn)專(zhuān)業(yè)部門(mén)建設(shè)了一系列業(yè)務(wù)流程化的管理信息系統(tǒng),取得了長(zhǎng)足的進(jìn)步。
目前,我國(guó)煤礦智能化建設(shè)在現(xiàn)階段已經(jīng)呈現(xiàn)出“新四化”特點(diǎn):監(jiān)控實(shí)時(shí)化、系統(tǒng)物聯(lián)化、數(shù)據(jù)海量化和決策智能化,這對(duì)煤礦安全生產(chǎn)的全面感知、實(shí)時(shí)互聯(lián)、分析決策、自主學(xué)習(xí)、動(dòng)態(tài)預(yù)警和協(xié)同控制提供了可能。然而,專(zhuān)業(yè)部門(mén)條塊分割的管理和信息系統(tǒng)建設(shè)模式導(dǎo)致了諸多的問(wèn)題,鑒于此,作者針對(duì)煤礦安全生產(chǎn)實(shí)際需求提出有必要跨越部門(mén)專(zhuān)業(yè)、統(tǒng)一人機(jī)環(huán)管、考慮歷史現(xiàn)勢(shì)和未來(lái)、整合時(shí)間和空間維度,系統(tǒng)性梳理煤礦安全生產(chǎn)數(shù)據(jù)及其關(guān)聯(lián)關(guān)系,建立煤礦安全生產(chǎn)數(shù)據(jù)的分類(lèi)體系,以煤礦安全生產(chǎn)數(shù)據(jù)分類(lèi)體系為基礎(chǔ)構(gòu)建煤礦安全生產(chǎn)大數(shù)據(jù)分析框架,為煤礦安全生產(chǎn)智能化建設(shè)提供大數(shù)據(jù)分析的框架和知識(shí)發(fā)現(xiàn)的導(dǎo)向目標(biāo)。
煤礦安全生產(chǎn)的主體是人,客體是地下的煤炭地質(zhì)體,目標(biāo)是對(duì)煤炭地質(zhì)體進(jìn)行采掘產(chǎn)出煤炭。為此,建立了一系列直接和輔助的煤礦安全生產(chǎn)活動(dòng),包括采煤、掘進(jìn)、運(yùn)輸、機(jī)電、通風(fēng)、地測(cè)和煤礦救護(hù)等。人員和設(shè)備參與到煤礦安全生產(chǎn)活動(dòng)中,對(duì)煤礦地質(zhì)體及其生產(chǎn)環(huán)境產(chǎn)生影響和破壞,煤炭地質(zhì)體和生產(chǎn)環(huán)境的破壞反過(guò)來(lái)也會(huì)造成煤礦生產(chǎn)活動(dòng)的停頓以及人員設(shè)備的損傷。為了保證煤礦安全生產(chǎn)活動(dòng)有序、高效、安全地進(jìn)行,需要制定一系列的技術(shù)方案和管理制度,如作業(yè)規(guī)程、設(shè)備操作規(guī)程、入井檢身制度等。
煤礦安全生產(chǎn)數(shù)據(jù)可以從兩個(gè)維度進(jìn)行分類(lèi),一個(gè)是生產(chǎn)準(zhǔn)備、基本生產(chǎn)、輔助生產(chǎn)和生產(chǎn)服務(wù)的生產(chǎn)活動(dòng)維度;另一個(gè)是人員、設(shè)備(物料)、環(huán)境、安全、技術(shù)和制度的維度。分類(lèi)結(jié)果如表 1所示。
表1 煤炭安全生產(chǎn)數(shù)據(jù)的二維分類(lèi)體系
大數(shù)據(jù)技術(shù)在煤炭行業(yè)的應(yīng)用以提升安全生產(chǎn)和管理水平為主要目標(biāo)。為此,需要跨越部門(mén)專(zhuān)業(yè)、統(tǒng)一人機(jī)管、考慮歷史現(xiàn)勢(shì)和未來(lái)、整合時(shí)間和空間維度,打通信息壁壘,深入理解煤礦安全生產(chǎn)數(shù)據(jù)背后的關(guān)系和故事[3-7],決定對(duì)數(shù)據(jù)的分析目標(biāo),確定數(shù)據(jù)分析采用何種方法和工具,進(jìn)而建立煤礦安全生產(chǎn)大數(shù)據(jù)分析的框架[8-9]。
煤礦安全生產(chǎn)大數(shù)據(jù)分析的目標(biāo)是對(duì)生產(chǎn)活動(dòng)、人員、設(shè)備、環(huán)境的理論要求狀態(tài)與實(shí)際運(yùn)行狀態(tài)之間的偏離進(jìn)行分析、建模、機(jī)器學(xué)習(xí)和預(yù)測(cè)預(yù)警。主要包括以下幾種類(lèi)型:
1) 圍繞生產(chǎn)活動(dòng)、人員、設(shè)備、環(huán)境某個(gè)單一維度的時(shí)空狀態(tài)變化的分析建模。如設(shè)備故障周期分析建模、瓦斯曲線(xiàn)回歸分析、沖擊地壓周期分析等。主要采用傳統(tǒng)的模式識(shí)別和時(shí)間序列分析。
因此,煤礦安全生產(chǎn)數(shù)據(jù)包括三個(gè)方面:一是對(duì)煤礦安全生產(chǎn)活動(dòng)及其人員、設(shè)備、環(huán)境的技術(shù)規(guī)格和管理制度要求;二是根據(jù)技術(shù)和管理制度要求,進(jìn)行生產(chǎn)活動(dòng)、人員、設(shè)備、環(huán)境的準(zhǔn)備情況;三是人員、設(shè)備、環(huán)境在生產(chǎn)活動(dòng)中的具體表現(xiàn)情況和狀態(tài),如圖1所示。
圖1 煤礦安全生產(chǎn)數(shù)據(jù)分類(lèi)體系
2) 圍繞生產(chǎn)活動(dòng)、人員、設(shè)備、環(huán)境多個(gè)維度之間的相關(guān)性進(jìn)行分析建模。從生產(chǎn)活動(dòng)維度集、人員維度集、設(shè)備維度集、環(huán)境維度集中選擇多個(gè)維度尋求相關(guān)性,是目前大數(shù)據(jù)分析的要義。
3) 生產(chǎn)活動(dòng)、人員、設(shè)備、環(huán)境的偏離分析。根據(jù)歷史積累的數(shù)據(jù),分析預(yù)測(cè)可能偏離規(guī)則要求的人員、設(shè)備、環(huán)境以及生產(chǎn)活動(dòng)的環(huán)節(jié)或者工序等。如:不安全行為分析、不安全設(shè)備分析等。
煤礦安全生產(chǎn)數(shù)據(jù)均具有空間屬性,煤礦安全生產(chǎn)只能在特定空間背景環(huán)境中展開(kāi)。因此,煤礦安全生產(chǎn)大數(shù)據(jù)分析,區(qū)別于互聯(lián)網(wǎng)、電子商務(wù)領(lǐng)域的大數(shù)據(jù)分析,需要在煤礦安全生產(chǎn)的特有空間環(huán)境中組織分析工具,展示分析的數(shù)據(jù)和結(jié)果[10]。GIS一張圖就是煤礦安全生產(chǎn)空間環(huán)境抽象工具。
煤礦GIS一張圖,是基于統(tǒng)一地理信息平臺(tái)的煤礦安全生產(chǎn)大數(shù)據(jù)集成和綜合展示平臺(tái),是二維GIS或四維GIS(x,y,z,t時(shí)間維度)的服務(wù)平臺(tái),其核心理念是“物聯(lián)感知、協(xié)同可控”統(tǒng)一管理、“隨時(shí)、隨地”訪(fǎng)問(wèn)使用,“持續(xù)、及時(shí)”協(xié)同、動(dòng)態(tài)更新,服務(wù)于技術(shù)、生產(chǎn)、安監(jiān)、防災(zāi)應(yīng)急、煤礦大數(shù)據(jù)分析展示等。
煤礦安全生產(chǎn)大數(shù)據(jù)平臺(tái)基于Hadoop HDFS組件以及數(shù)據(jù)倉(cāng)庫(kù)Hive和分布式鍵值對(duì)數(shù)據(jù)庫(kù)HBase實(shí)現(xiàn)海量數(shù)據(jù)存儲(chǔ),利用成熟大數(shù)據(jù)框架Hadoop和Spark相結(jié)合方式實(shí)現(xiàn)數(shù)據(jù)的批處理和流式計(jì)算以及機(jī)器學(xué)習(xí),大數(shù)據(jù)平臺(tái)技術(shù)架構(gòu)體系及OLAP系統(tǒng)架構(gòu),如圖2所示。
圖2 煤礦安全生產(chǎn)大數(shù)據(jù)平臺(tái)的技術(shù)框架
煤礦安全生產(chǎn)大數(shù)據(jù)平臺(tái)提供了數(shù)據(jù)接入、存儲(chǔ)、處理到可視化等功能。數(shù)據(jù)引擎提供CSV、TXT、文件文檔,關(guān)系數(shù)據(jù)庫(kù)等數(shù)據(jù)進(jìn)入云存儲(chǔ)環(huán)境為大數(shù)據(jù)計(jì)算做基礎(chǔ)準(zhǔn)備。為不同的應(yīng)用場(chǎng)景提供了三種存儲(chǔ)方式:HBase、Hive和HDFS。為大數(shù)據(jù)的統(tǒng)計(jì)分析提供了SparkSQL分析、RDD、DataFrame和DataSet任務(wù)提交接口;為機(jī)器學(xué)習(xí)提供決策樹(shù)快速構(gòu)建、回歸算法以及貝葉斯算法進(jìn)行常見(jiàn)的分類(lèi)和模型構(gòu)建。提供了餅狀圖、柱狀圖、雷達(dá)圖、曲線(xiàn)圖以及位置分布等接口,使計(jì)算分析結(jié)果能夠直觀(guān)展現(xiàn)。
在煤礦安全生產(chǎn)大數(shù)據(jù)平臺(tái)上,建立專(zhuān)家知識(shí)庫(kù),預(yù)測(cè)預(yù)警規(guī)則庫(kù)等,基于靜態(tài)數(shù)據(jù)、流式數(shù)據(jù)等計(jì)算框架,對(duì)煤礦安全生產(chǎn)活動(dòng)、人員、設(shè)備、環(huán)境的偏離情況等不間斷實(shí)時(shí)分析計(jì)算和預(yù)測(cè)。
煤礦安全生產(chǎn)的新四化需求:監(jiān)控實(shí)時(shí)化、系統(tǒng)物聯(lián)化、數(shù)據(jù)海量化和決策智能化,要求融合部門(mén)專(zhuān)業(yè)等條塊進(jìn)行多維度綜合的大數(shù)據(jù)分析挖掘。本文以煤礦安全生產(chǎn)對(duì)象為起點(diǎn),系統(tǒng)梳理并建立了煤礦安全數(shù)據(jù)的分類(lèi)體系,根據(jù)數(shù)據(jù)分類(lèi)體系建立了煤礦安全生產(chǎn)大數(shù)據(jù)分析的導(dǎo)向目標(biāo)、煤礦GIS一張圖展示框架、以及煤礦大數(shù)據(jù)分析的技術(shù)框架,在華陽(yáng)集團(tuán)、臨礦集團(tuán)、陜西煤業(yè)等國(guó)內(nèi)大型煤炭企業(yè)的安全生產(chǎn)共享平臺(tái)的建設(shè)中得到了實(shí)際應(yīng)用,效果良好,為煤礦安全生產(chǎn)信息化建設(shè)及其深化提供技術(shù)支撐。