吳 晶
(撫順市技術(shù)創(chuàng)新研究院,遼寧 撫順 113006)
當(dāng)前,以信息化帶動(dòng)煤炭工業(yè)化,走新型工業(yè)化道路,是煤礦企業(yè)安全生產(chǎn)保障,也是實(shí)現(xiàn)增產(chǎn)高效,增加企業(yè)核心競(jìng)爭(zhēng)力的必然趨勢(shì)。自然資源部在2021 年發(fā)布了智能礦山建設(shè)規(guī)范征求意見,意見中指出了在生產(chǎn)各個(gè)過程,包括地質(zhì)、資源、生產(chǎn)、加工、運(yùn)輸?shù)确矫娴臄?shù)字化、信息化、智能化是智能礦山建設(shè)的基礎(chǔ)[1]。煤礦智能化技術(shù)體系應(yīng)包括智能化煤礦分類、分級(jí)評(píng)價(jià)指標(biāo)體系[2-6]。露天智慧礦山框架、體系及關(guān)鍵技術(shù)也是煤礦智能化建設(shè)體系之內(nèi),是煤礦智能化的重要一環(huán)[7-8]。
露天智慧礦山解決方案是基于地理信息GIS、工作流、ERP、組態(tài)等構(gòu)建智慧礦山智能協(xié)同管控平臺(tái),實(shí)現(xiàn)礦山各類專業(yè)間業(yè)務(wù)的協(xié)同化、信息化與智能分析;采用數(shù)字化、信息化手段提升煤炭產(chǎn)業(yè)建設(shè)“監(jiān)、測(cè)、管、控一體化”的礦山綜合管理;通過建立礦山安全生產(chǎn)監(jiān)測(cè)監(jiān)控自動(dòng)化、信息化與數(shù)字化管控中心,充分發(fā)揮地測(cè)作為煤礦技術(shù)基礎(chǔ)工作的作用,推進(jìn)應(yīng)用露天煤礦的綜合管控與安全智能分析。
目前,國(guó)內(nèi)科研機(jī)構(gòu)陸續(xù)提出自動(dòng)化礦山、感知礦山、智能礦山、智慧礦山、透明礦山等概念與設(shè)想,但從露天智慧礦山行業(yè)來看,很難形成統(tǒng)一、完整的智慧礦山標(biāo)準(zhǔn),這主要?dú)w結(jié)于礦山的復(fù)雜性、學(xué)科多、管理水平等差異造成的。但就露天礦數(shù)據(jù)多源數(shù)據(jù)融合方面的發(fā)展還是有跡可循的。就層次而言,主要包括感知層、數(shù)據(jù)層、分析層、應(yīng)用層。露天智慧礦山融合平臺(tái)框圖如圖1。
圖1 露天智慧礦山融合平臺(tái)框圖
感知層是智慧礦山的基礎(chǔ),滲透于礦山穿孔、爆破、采裝、運(yùn)輸各個(gè)生產(chǎn)環(huán)節(jié),包括通信系統(tǒng)、視頻監(jiān)視系統(tǒng)、環(huán)境監(jiān)測(cè)系統(tǒng)、車輛管理與調(diào)度系統(tǒng)、產(chǎn)量計(jì)量系統(tǒng)、邊坡雷達(dá)系統(tǒng)、人員定位系統(tǒng)等[9-10]。
數(shù)據(jù)層是將各子系統(tǒng)整合,形成標(biāo)準(zhǔn)數(shù)據(jù)的過程,主要整合的數(shù)據(jù)源包括組態(tài)OPC 數(shù)據(jù)、文本數(shù)據(jù)、數(shù)據(jù)庫數(shù)據(jù)、TCP/UDP 數(shù)據(jù)、視頻數(shù)據(jù)(通過AI算法整合為統(tǒng)一的標(biāo)準(zhǔn)數(shù)據(jù))。
分析層通過數(shù)據(jù)層提供的標(biāo)準(zhǔn)數(shù)據(jù),能夠?qū)崿F(xiàn)數(shù)據(jù)實(shí)時(shí)監(jiān)控、預(yù)測(cè)預(yù)警、融合聯(lián)動(dòng)、評(píng)測(cè)評(píng)估。這些基礎(chǔ)功能為智慧礦山提供必要實(shí)現(xiàn)接口[11]。
應(yīng)用層是智慧礦山數(shù)據(jù)融合平臺(tái)的結(jié)果部分,呈現(xiàn)給用戶最終的表現(xiàn)形式,打亂原有的數(shù)據(jù)界限,數(shù)據(jù)重新融合,為用戶提供決策的依據(jù)。包括風(fēng)險(xiǎn)預(yù)警模塊、二三維“一張圖”、智慧礦山一張表、數(shù)字孿生模塊、經(jīng)營(yíng)管理模塊、企業(yè)智能模塊、礦山物聯(lián)網(wǎng)模塊等[12]。
多源異構(gòu)數(shù)據(jù)是指:①數(shù)據(jù)來源上在不同的子系統(tǒng)內(nèi);②數(shù)據(jù)結(jié)構(gòu)及傳輸方式的不同,具有形式復(fù)雜、形態(tài)多變的特點(diǎn)。這些多源異構(gòu)數(shù)據(jù)的接入一直是困擾數(shù)據(jù)融合的第一道門坎,對(duì)這些數(shù)據(jù)的接入研究也是在不斷更新,不斷深入[13]。數(shù)據(jù)的來源分布于包括穿孔、爆破、采裝、運(yùn)輸、排土露天礦生產(chǎn)的全過程,露天礦生產(chǎn)過程數(shù)據(jù)源框圖如圖2。
圖2 露天礦生產(chǎn)過程數(shù)據(jù)源框圖
數(shù)據(jù)采集是多源異構(gòu)數(shù)據(jù)處理的基礎(chǔ),將數(shù)據(jù)及時(shí)、準(zhǔn)確地采集是露天智慧礦山的基礎(chǔ)工作,這些數(shù)據(jù)包括關(guān)系型數(shù)據(jù)、鍵值型數(shù)據(jù)等,最終將數(shù)據(jù)存儲(chǔ)入統(tǒng)一的數(shù)據(jù)管理平臺(tái)[14]。
多源異構(gòu)數(shù)據(jù)分析與整理是實(shí)現(xiàn)智慧礦山數(shù)據(jù)融合的基礎(chǔ),主要工作在于數(shù)據(jù)的接入、分析、整理和存儲(chǔ)。不同的數(shù)據(jù)源要有不同的接入方案相適用,經(jīng)數(shù)據(jù)分析后,整理成統(tǒng)一的數(shù)據(jù)存儲(chǔ)方式與格式,充分發(fā)揮數(shù)據(jù)的價(jià)值,為智慧礦山的建設(shè)提供數(shù)據(jù)保障[15]。
數(shù)據(jù)的存儲(chǔ)與讀寫方式,在多源異構(gòu)數(shù)據(jù)處理過程中比較重要,通過構(gòu)建露天智慧礦山數(shù)據(jù)框架,最終形成統(tǒng)一的數(shù)據(jù)存儲(chǔ)格式或存儲(chǔ)方式。由于露天智慧礦山對(duì)數(shù)據(jù)的不同要求,對(duì)不同格式與種類的數(shù)據(jù)選擇相應(yīng)的數(shù)據(jù)庫進(jìn)行存儲(chǔ),這樣不但在檢索效率上能夠得到提高,而且在數(shù)據(jù)準(zhǔn)確度方面,也能得到提高,數(shù)據(jù)庫的正確選擇是后續(xù)數(shù)據(jù)集成與分析的基礎(chǔ)[16]。目前常用的數(shù)據(jù)庫包括SQL 數(shù)據(jù)庫、NoSQL 數(shù)據(jù)庫、NewSQL 數(shù)據(jù)庫:SQL 數(shù)據(jù)以SQL Server、MySQL、Oracle 等為代表,NoSQL 數(shù)據(jù)庫以Neo4j、HBase、Redis、MongoDB 等為代表,NewSQL 數(shù)據(jù)庫以PostgreSQL 為代表。典型數(shù)據(jù)庫對(duì)比分析見表1。
表1 典型數(shù)據(jù)庫對(duì)比分析
通過對(duì)比分析可見,每種數(shù)據(jù)庫技術(shù)均有其優(yōu)勢(shì)及應(yīng)用場(chǎng)景,在露天智慧礦山復(fù)雜的應(yīng)用場(chǎng)景中,單一的數(shù)據(jù)庫不能滿足所有多源異構(gòu)數(shù)據(jù)的存儲(chǔ)要求,因此,不得不在露天智慧礦山的體系內(nèi)呈現(xiàn)多重?cái)?shù)據(jù)庫。既然數(shù)據(jù)庫不能選擇統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),只能通過數(shù)據(jù)庫訪問模型,來完成露天智慧礦山對(duì)多源異構(gòu)數(shù)據(jù)的需求,基于Hibernate OGM 建立統(tǒng)一的SQL、NoSQL 和NewSQL 數(shù)據(jù)庫訪問框架,使得多種數(shù)據(jù)庫能夠在同一個(gè)框架下并存,統(tǒng)一以一種規(guī)則或方式進(jìn)行讀寫。實(shí)現(xiàn)數(shù)據(jù)的統(tǒng)一標(biāo)準(zhǔn)[17]。因此,根據(jù)露天智慧礦山具體的應(yīng)用場(chǎng)景與系統(tǒng)需要,選擇不同特點(diǎn)的數(shù)據(jù)庫進(jìn)行應(yīng)用與部署,讓露天智慧礦山平臺(tái)取得各類數(shù)據(jù)庫的優(yōu)勢(shì),再以統(tǒng)一框架封裝進(jìn)行統(tǒng)一管理,是多源異構(gòu)數(shù)據(jù)存儲(chǔ)管理的必然發(fā)展趨勢(shì)。
數(shù)據(jù)清洗是通過特定的算法和規(guī)律,篩除不符合規(guī)律的數(shù)據(jù),以達(dá)到數(shù)據(jù)準(zhǔn)確的目的。在露天智慧礦山的體系框架內(nèi),由于數(shù)據(jù)來源多樣、結(jié)構(gòu)復(fù)雜,采集到的數(shù)據(jù)不能確保完全準(zhǔn)確,錯(cuò)誤的、不符合規(guī)律的“臟數(shù)據(jù)”普遍存在,這些“臟數(shù)據(jù)”將給后續(xù)的分析與融合產(chǎn)生非常不利的影響。數(shù)據(jù)清洗的目的是通過檢測(cè)等手段,將檢測(cè)到多源異構(gòu)數(shù)據(jù)中存在的“臟數(shù)據(jù)”,通過篩選、修復(fù)等辦法,剔除“臟數(shù)據(jù)”,從而提高數(shù)據(jù)的質(zhì)量。
數(shù)據(jù)降維是從種類繁多、結(jié)構(gòu)復(fù)雜的多源異構(gòu)數(shù)據(jù)中,篩選對(duì)露天智慧礦山框架某項(xiàng)功能有用且準(zhǔn)確的數(shù)據(jù),剔除多數(shù)無關(guān)、冗余的多數(shù)數(shù)據(jù),獲得較少的對(duì)框架有用的真實(shí)數(shù)據(jù),從而形成新的特征數(shù)據(jù),這個(gè)過程稱之為露天智慧礦山框架內(nèi)的數(shù)據(jù)降維。在露天智慧礦山的體系框架內(nèi),也存在海量的冗余數(shù)據(jù),他們對(duì)數(shù)據(jù)集成與融合沒有用處,這些數(shù)據(jù)將很大影響系統(tǒng)性能。那么數(shù)據(jù)降維是如何選取數(shù)據(jù)特征的呢?通常情況下,露天智慧礦山框架的數(shù)據(jù)降維是通過數(shù)據(jù)功能來選取數(shù)據(jù)特征,而一種數(shù)據(jù)特征基本無法滿足篩選數(shù)據(jù)的需要,采用多重?cái)?shù)據(jù)特征的組合,形成新的數(shù)據(jù)特征集合是數(shù)據(jù)降維的通常操作[18]。隨著露天智慧礦山多源異構(gòu)數(shù)據(jù)中非結(jié)構(gòu)化數(shù)據(jù)的不斷增加,對(duì)多源異構(gòu)數(shù)據(jù)特征提取的重要性也隨之加重,這將成為多源異構(gòu)數(shù)據(jù)處理的重要難題。
數(shù)據(jù)融合是露天智慧礦山多源異構(gòu)數(shù)據(jù)處理的關(guān)鍵,也是難點(diǎn),數(shù)據(jù)融合的方法主要包括大數(shù)據(jù)分析、數(shù)據(jù)挖掘、深度學(xué)習(xí)、統(tǒng)計(jì)分析等。通過數(shù)據(jù)采集與數(shù)據(jù)集成環(huán)節(jié)的基礎(chǔ)上對(duì)多源異構(gòu)數(shù)據(jù)信息和知識(shí)進(jìn)行提取與整合。利用數(shù)據(jù)融合方法,提取出對(duì)露天智慧礦山有價(jià)值的信息和特征數(shù)據(jù),從而實(shí)現(xiàn)指導(dǎo)人員做出決策的目的[19]。數(shù)據(jù)融合環(huán)節(jié)的關(guān)鍵技術(shù)主要有關(guān)聯(lián)分析、分類分析等方法。
1)關(guān)聯(lián)分析。關(guān)聯(lián)分析是大數(shù)據(jù)分析與數(shù)據(jù)挖掘常用的一種分析方法,通過大量的數(shù)據(jù)對(duì)比,將主觀認(rèn)為無關(guān)或無規(guī)律的數(shù)據(jù)間的關(guān)聯(lián)性挖掘出來,通過這些關(guān)聯(lián),在結(jié)合現(xiàn)有的數(shù)據(jù),從而預(yù)測(cè)相關(guān)事務(wù)的發(fā)生,或者事務(wù)發(fā)展的一種方向。在露天智慧礦山體系框架內(nèi),也可適用此分析方法,實(shí)現(xiàn)對(duì)多源異構(gòu)數(shù)據(jù)內(nèi)在規(guī)律的提取。
2)分類分析。分類分析算法是大數(shù)據(jù)分析與數(shù)據(jù)挖掘重要的方法之一。分類是先定義一定的活動(dòng)類別,通過特定的算法將數(shù)據(jù)劃分到這些的已定義類別中進(jìn)行分析和總結(jié)。常用的分類算法包括決策樹算法、基于規(guī)則的分類法、人工神經(jīng)網(wǎng)絡(luò)算法、深度學(xué)習(xí)算法、支持向量機(jī)算法、貝葉斯算法等。對(duì)于露天智慧礦山體系框架來說,數(shù)據(jù)分類技術(shù)是智慧礦山預(yù)測(cè)預(yù)警十分重要的方法。
隨著工業(yè)物聯(lián)網(wǎng)的快速發(fā)展,數(shù)據(jù)的來源更多,數(shù)據(jù)結(jié)構(gòu)更加多樣、復(fù)雜。露天智慧礦山作為國(guó)家生產(chǎn)制造重要的一環(huán),也將隨著國(guó)家戰(zhàn)略進(jìn)一步實(shí)現(xiàn)數(shù)據(jù)化、信息化,同時(shí)礦山生產(chǎn)行業(yè)對(duì)數(shù)據(jù)處理的實(shí)時(shí)性、準(zhǔn)確性要求更高,要求速度與真實(shí)的程度較高,這給露天智慧礦山多源異構(gòu)數(shù)據(jù)的處理與分析帶來了巨大的挑戰(zhàn)。露天礦山設(shè)備與子系統(tǒng)的多樣性和復(fù)雜性會(huì)給數(shù)據(jù)的識(shí)別與采集方法、技術(shù)帶來更多挑戰(zhàn),因此,需要豐富多樣、可靠性強(qiáng)、效率更高的數(shù)據(jù)采集方法和技術(shù);由于露天智慧礦山具有海量的數(shù)據(jù)和復(fù)雜多樣的特點(diǎn),對(duì)數(shù)據(jù)庫的選擇上也應(yīng)該是多樣的,只有各具優(yōu)勢(shì)的數(shù)據(jù)庫才能滿足露天智慧礦山數(shù)據(jù)的存儲(chǔ)需求。采用綜合的數(shù)據(jù)存儲(chǔ)方式,再基于統(tǒng)一框架的數(shù)據(jù)存儲(chǔ)與讀取方法成為未來多源異構(gòu)數(shù)據(jù)存儲(chǔ)系統(tǒng)的發(fā)展趨勢(shì);露天智慧礦山體系框架將越來越依賴于數(shù)據(jù)清洗、降維及數(shù)據(jù)融合,這些技術(shù)的進(jìn)一步發(fā)展將帶動(dòng)露天智慧礦山體系水平的進(jìn)一步提高。