王憲 薛軍
摘 要:神東煤炭分公司早在2015年就制定了《礦山機電設(shè)備通信接口和協(xié)議》企業(yè)標準,規(guī)定了礦山機電設(shè)備的工業(yè)以太網(wǎng)通信EtherNet/IP接口和協(xié)議的術(shù)語、定義、規(guī)約。數(shù)據(jù)分析系統(tǒng)在數(shù)據(jù)標準化的基礎(chǔ)上開展綜采工作面主要設(shè)備的數(shù)據(jù)運行監(jiān)測、數(shù)據(jù)分析等工作,通過數(shù)據(jù)標準化的應(yīng)用,建立綜采工作面設(shè)備綜合評價指標對照,為設(shè)備管理工作提供參考依據(jù)。
關(guān)鍵詞:數(shù)據(jù)標準化;綜采工作面;數(shù)據(jù)分析
中圖分類號:TD76 文獻標識碼:A 文章編號:1671-2064(2018)20-0170-02
1 數(shù)據(jù)標準
數(shù)據(jù)標準化是數(shù)據(jù)分析的基礎(chǔ),也是開展數(shù)據(jù)分析工作的前提,神東煤炭分公司早在2015年就制定了《礦山機電設(shè)備通信接口和協(xié)議》企業(yè)標準,規(guī)定了礦山機電設(shè)備的工業(yè)以太網(wǎng)通信EtherNet/IP接口和協(xié)議的術(shù)語、定義、規(guī)約,標準主要包括以太網(wǎng)EtherNet/IP協(xié)議規(guī)范總則,擴展對象庫,采煤機、液壓支架、饋電開關(guān)等10類主要設(shè)備行規(guī),按照GB/T 1.1-2009給出的規(guī)則起草。
礦山機電設(shè)備通信接口和協(xié)議》企業(yè)標準EtherNet/IP協(xié)議和OSI參考模型(如圖1所示),采用ODVA:CIP網(wǎng)絡(luò)圖書館-第1卷:通用工況協(xié)議和ODVA,CIP網(wǎng)絡(luò)圖書館-第1卷:CIP的以太網(wǎng)/IP適配,構(gòu)成特定的EtherNet/IP通信規(guī)約的一般規(guī)則。
OSI參考模型包括物理層、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層、傳輸層、會話層、表示層、應(yīng)用層共7個層級,在具體實施過程中遵循以下要求:
1.1 物理層要求
物理層作為設(shè)備之間的數(shù)據(jù)通信提供傳輸媒體及互連設(shè)備,為數(shù)據(jù)傳輸提供可靠的環(huán)境。煤礦設(shè)備受礦井環(huán)境及干擾因素影響較大,設(shè)備移動性較強,物理層采用有線接口、無線接口兩種模式互補,提高可靠性,其中有線接口采用快速以太網(wǎng)技術(shù),數(shù)據(jù)速率可以達到100Mbps,支持使用屏蔽或非屏蔽銅雙絞線(Cat 5)和光纜,滿足下列標準:
(1)100BASE-TX,銅介質(zhì)雙絞線符合MT 818.14-1999的規(guī)定。(2)100BASE-FX,光纖符合MT 818.14-1999的規(guī)定。
綜采工作面采煤機、液壓支架多采用無線接口,滿足下列標準:
3G CDMA 2000:滿足國際標準3GPP2 C.S0002-E-v2.0;
物理層的功能是在兩個網(wǎng)絡(luò)設(shè)備之間提供透明的比特流傳輸,所實現(xiàn)的硬件設(shè)備有中繼器和集線器,物理層有線網(wǎng)絡(luò)的拓撲包含星形拓撲、線形拓撲、環(huán)形拓撲,用于煤礦井下的EtherNet/IP通信應(yīng)在下列條件下正常工作:(1)環(huán)境溫度:0℃~40℃;(2)平均相對濕度:不大于95%(+25℃);(3)大氣壓力:80 kPa~106 kPa;(4)有爆炸性氣體混合物,無破壞絕緣的腐蝕性氣體。
1.2 數(shù)據(jù)鏈路層
數(shù)據(jù)鏈路層位于OSI參考模型的第二層,數(shù)據(jù)鏈路層通過一些數(shù)據(jù)鏈路層協(xié)議,在不太可靠的物理鏈路上實現(xiàn)可靠的數(shù)據(jù)傳輸,主要功能是為網(wǎng)絡(luò)層提供服務(wù),包括無確認的無連接服務(wù)、有確認的無連接服務(wù)、有確認的面向連接的服務(wù)三種基本服務(wù)。其中有線通信的數(shù)據(jù)鏈路滿足IEEE802.3規(guī)范,支持10Mbps、100Mbps及更高速率,無線通信3G CDMA2000的數(shù)據(jù)鏈路滿足國際標準3GPP2 C.S0003-F-v2.0,3GPP2 C.S0004-E-v2.0,3GPP2 C.S0017-010-0-v3.0。
1.3 網(wǎng)絡(luò)層與傳輸層
網(wǎng)絡(luò)層位于TCP/IP協(xié)議棧數(shù)據(jù)鏈路層和傳輸層中間,網(wǎng)絡(luò)層接收傳輸層的數(shù)據(jù)報文,分段為合適的大小,用IP報文頭部封裝,交給數(shù)據(jù)鏈路層。企業(yè)網(wǎng)絡(luò)層與傳輸層標準滿足ODVA:CIP網(wǎng)絡(luò)圖書館-第2卷:CIP的以太網(wǎng)/IP適配中9-3,ODVA:CIP網(wǎng)絡(luò)圖書館-第1卷:通用工業(yè)協(xié)議的要求。具備如下功能:
(1)信源到信宿的傳輸。通過多條物理鏈路連接成的傳輸路徑將一個數(shù)據(jù)分組從源結(jié)點傳輸?shù)侥康慕Y(jié)點。并為傳輸層提供了完整的服務(wù),傳輸層不必關(guān)心兩結(jié)點之間傳輸信息的具體細節(jié)。(2)邏輯尋址。在數(shù)據(jù)分組的頭部加入源地址和目的地址。(3)路由。當有多條路徑可選時,選擇從源結(jié)點到目的結(jié)點傳送數(shù)據(jù)分組的最佳路徑。在這種情況下,每個數(shù)據(jù)分組可以經(jīng)過不同的路由到達目的地,然后在目的地按照原始順序重新組裝。路由所考慮的因素包括傳送速率、費用和在傳輸種改變路徑的能力。(4)地址轉(zhuǎn)換。將網(wǎng)絡(luò)層地址翻譯成對應(yīng)的物理地址或?qū)⑽锢淼刂忿D(zhuǎn)換成對應(yīng)的網(wǎng)絡(luò)層地址。(5)復用。使用同一條物理線路同時傳輸多個設(shè)備間的數(shù)據(jù)。(6)流量和擁塞控制。一個路由可能產(chǎn)生巨大的通信量,從而使路由上的某些結(jié)點超負荷工作,由此導致的擁塞經(jīng)常使某些分組信息被丟棄。網(wǎng)絡(luò)層協(xié)議必須能夠在部分報文丟失時通知發(fā)送方,調(diào)節(jié)發(fā)送的流量。(7)網(wǎng)絡(luò)互連。發(fā)送端和接收端結(jié)點可能不在一個網(wǎng)絡(luò)內(nèi),要成功實現(xiàn)端對端的傳送,必須解決網(wǎng)絡(luò)互連的有關(guān)問題。
1.4 表示層和應(yīng)用層
網(wǎng)絡(luò)應(yīng)用通過端系統(tǒng)上運行的應(yīng)用程序來實現(xiàn)。為了實現(xiàn)每一種網(wǎng)絡(luò)應(yīng)用,通信雙方都必須按照雙方都能夠理解的規(guī)范交換或處理數(shù)據(jù),也稱為網(wǎng)絡(luò)應(yīng)用協(xié)議。應(yīng)用協(xié)議包括通信雙方請求或響應(yīng)服務(wù)的信息格式、控制命令和所傳數(shù)據(jù)信息的說明等。如超文本傳輸協(xié)議HTTP,是Web服務(wù)器與客戶瀏覽器之間交換信息的協(xié)議;域名系統(tǒng)DNS,定義了客戶端向域名服務(wù)器請求域名解析服務(wù)的信息交換規(guī)范;文件傳輸協(xié)議FTP,定義了請求文件的客戶端從提供文件的服務(wù)器獲取文件操作規(guī)范等,企業(yè)表示層和應(yīng)用層標準滿足ODVA:CIP網(wǎng)絡(luò)圖書館-第1卷:通用工業(yè)協(xié)議和ODVA:CIP網(wǎng)絡(luò)圖書館-第2卷:CIP的以太網(wǎng)/IP適配。
2 數(shù)據(jù)標準的應(yīng)用
數(shù)據(jù)分析系統(tǒng)在建設(shè)初期存在數(shù)據(jù)量大、數(shù)據(jù)關(guān)聯(lián)性差、如何進行預(yù)篩選等問題。
數(shù)據(jù)量大。區(qū)域自動化四礦大柳塔礦、補連塔礦、上灣礦和哈拉溝礦合計監(jiān)測169600點,而全公司13個礦井總計監(jiān)測超過450000點,且隨著綜采工作面的推進,測點逐年增加。
數(shù)據(jù)相關(guān)性差。神東有信息化系統(tǒng)40多個,數(shù)據(jù)分析系統(tǒng)涉及到的主要系統(tǒng)有5個,系統(tǒng)間實現(xiàn)端對端集成,數(shù)據(jù)共享度不高,整合難度大,需要整體統(tǒng)籌計劃。
數(shù)據(jù)預(yù)篩選難度大。數(shù)據(jù)分析系統(tǒng)數(shù)據(jù)源包括三部分:綜合自動化系統(tǒng)(綜采、主運、通風、供排水、供電)、PM、CMES系統(tǒng),其中PM、CMES系統(tǒng)可通過數(shù)據(jù)接口實現(xiàn)數(shù)據(jù)源的同步,綜合自動化系統(tǒng)要獲取數(shù)據(jù)需按照四步走,第一,從綜合自動化組態(tài)軟件中檢索點表;第二,將檢索點表導入到數(shù)據(jù)分析及健康管理系統(tǒng)數(shù)據(jù)庫中;第三,配置監(jiān)測畫面點位;第四,配置數(shù)據(jù)分析報表點位。導致數(shù)據(jù)更新和維護環(huán)節(jié)多、工作量大、易出錯,且對人員專業(yè)性要求較高。
通過數(shù)據(jù)標準的應(yīng)用可集中解決數(shù)據(jù)量大、相關(guān)性差及數(shù)據(jù)預(yù)篩選難度大等問題,為開展數(shù)據(jù)分析系統(tǒng)的各項工作提供統(tǒng)一規(guī)范,數(shù)據(jù)分析系統(tǒng)主要對綜采工作面五種主要設(shè)備開展綜合分析工作,包括采煤機、液壓支架、刮板機等設(shè)備的電壓、電流、功率等數(shù)據(jù),首先對該類數(shù)據(jù)進行標準化轉(zhuǎn)換,轉(zhuǎn)換的主要目的是將數(shù)據(jù)按照比例進行縮放,使之落入一個小的區(qū)間范圍之內(nèi),使得不同的變量經(jīng)過標準化處理后可以由平等分析和比較的基礎(chǔ)。
企業(yè)數(shù)據(jù)標準應(yīng)用采用ODVA:CIP網(wǎng)絡(luò)圖書館-第1卷:通用工業(yè)協(xié)議的AppendixC-2中所述的數(shù)據(jù)類型,包括基本數(shù)據(jù)類型和擴展數(shù)據(jù)類型(主要指傳感器數(shù)據(jù)類型)。
2.1 數(shù)據(jù)標準化處理
采用Min-max標準化,也叫離差標準化,是對原始數(shù)據(jù)進行線性變換,使得結(jié)果在[0,1]區(qū)間,為數(shù)據(jù)預(yù)篩選做好準備,轉(zhuǎn)換公式如下:
x*=
其中,max為樣本數(shù)據(jù)的最大值,min為樣本數(shù)據(jù)的最小值。
在數(shù)據(jù)標準化應(yīng)用過程中,參與聚類的變量絕大多數(shù)都是區(qū)間型變量,不同區(qū)間型變量之間的數(shù)量單位不同,如果不加處理直接進行聚類,很容易造成聚類結(jié)果的失真。比如電流單位有的是A,有的是KA;變量的單位越小,變量可能的值域就越大,對聚類結(jié)果的影響也就越大。為了避免對度量單位的選擇依賴,在聚類之前所要采取的一個重要的技術(shù)措施就是進行數(shù)據(jù)標準化。
2.2 數(shù)據(jù)預(yù)篩選
數(shù)據(jù)預(yù)篩選直接影響數(shù)據(jù)的清洗、整理、探索等數(shù)據(jù)處理工作,而篩選有效的輸入變量更能提高數(shù)據(jù)質(zhì)量,具體體現(xiàn)在三個需要。一是篩選有效的輸入變量是提高模型穩(wěn)定性的需要。過多的輸入變量很可能會帶來干擾和過擬合等問題,這會導致模型的穩(wěn)定性下降,模型的效果變差。所以,優(yōu)質(zhì)的模型一定是遵循輸入變量少而精原則的。二是篩選有效的輸入變量是提高模型預(yù)測能力的需要。過多地輸入變量會產(chǎn)生共線性問題,所謂共線性是指自變量之間存在較強的,甚至完全的線性相關(guān)性。當自變量之間高度相關(guān)時,數(shù)據(jù)的小小變化,比如誤差的發(fā)生都會引起模型參數(shù)嚴重震蕩,明顯降低模型的預(yù)測能力,并且,共線性的發(fā)生也增加了對模型結(jié)果的解釋困難,因為要更深入地分析和判斷每個自變量對目標變量的影響程度。三是篩選有效的輸入變量也是提高運算速度和運算效率的需要。在采取各種評價指標篩選有價值的輸入變量之前,可以先直接刪除明顯的無價值的變量,這些明顯的無價值變量包括的內(nèi)容如下:常數(shù)變量或者只有一個值的變量。缺失值比例很高的變量,比如缺失值高達95%,或者視具體業(yè)務(wù)背景而定。取值太泛的類別型變量,最常見的例子就是郵政編碼,除非采取進一步措施將各個地區(qū)的編碼整合,減少類別的數(shù)量,否則原始的郵政編碼數(shù)據(jù)無法作為輸入變量來提供起碼的預(yù)測功能。
2.3 數(shù)據(jù)相關(guān)性研究
根據(jù)2017年64個工作面月報數(shù)據(jù),對月產(chǎn)量、采高、工作面儲量、容重、平均夾矸厚度等25個相關(guān)量進行多元線性回歸分析,根據(jù)分析結(jié)果分為兩類:一是月產(chǎn)量、采高、普氏系數(shù)、月推進度等直接參與計算的相關(guān)量(圖2);二是工作面儲量、夾矸厚度等弱相關(guān)量,基于原始數(shù)據(jù)得出預(yù)測曲線,將預(yù)測曲線與實測進行相關(guān)性分析(圖3),具體結(jié)果如下:
第一類:開機率=(0.003765)*月產(chǎn)量+(0.850363)*容重+(0.007413)*普氏硬度+(0.000363)*大修次數(shù)+(-0.000022)*功率+(0.000268)*月累計推進度+(-0.812831)
第二類:開機率=(0.000046)*工作面儲量+(-0.177576)*平均夾矸厚度+(-0.000053)*配套天數(shù)+(0.363765)*壽命年限+(0.380474)*新舊度系數(shù)+(-3.490963)
結(jié)論:第一類回歸分析方法較簡潔,第二類回歸分析方法較理想,兩種曲線相關(guān)系數(shù)較高,為0.66左右(理想狀態(tài)為1),月報中開機率可以采用第一類和第二類回歸分析方法進行開機率預(yù)測,并與實際開機率進行校驗。
3 結(jié)語
隨著煤礦信息化水平的提高,數(shù)字化、智能化礦山是未來煤炭發(fā)展的方向,而從電氣化到數(shù)字化乃至智能化發(fā)展的基礎(chǔ)是煤礦信息化數(shù)據(jù)標準化,所以數(shù)據(jù)標準化是一項長期而艱巨的任務(wù),下一步我們將充分利用數(shù)據(jù)上傳、在線監(jiān)測、數(shù)據(jù)分析等信息化手段,加強對各單位檢修時間監(jiān)控,針對電氣類故障制定企業(yè)標準,按照定義故障、收集故障、分析故障原因、建立故障排除計劃、執(zhí)行故障排除計劃、分析結(jié)果的流程形成故障管理體系。
煤礦數(shù)據(jù)分析勢必通過內(nèi)網(wǎng)、外網(wǎng)交互運行實現(xiàn),必然會收到病毒的入侵、黑客的攻擊等不安全因素,這些因素會造成井下自動化系統(tǒng)及監(jiān)測環(huán)境的安全隱患,導致信息泄露或病毒感染,亟需制定相關(guān)的企業(yè)安全標準,當然隨著煤礦信息化的發(fā)展及物聯(lián)網(wǎng)技術(shù)的發(fā)展,與之相關(guān)的標準將會進一步優(yōu)化和完善。