鄭磊
(國能信息技術有限公司,北京 100011)
煤礦工作面設備(采煤機、液壓支架、刮板輸送機等)突發(fā)故障造成的非計劃性停機會影響煤礦正常生產,同時會縮短設備使用壽命,增加生產成本[1]。實現工作面設備故障預測及預防性檢修,提高設備的可靠性已成為熱點研究課題[2-3]。
時間序列(時序)分析是一種根據時序數據預測未來發(fā)展趨勢的方法。時序數據是同一指標按時間順序記錄的數據列,與設備運行相關的時序數據是在設備運行階段隨時間獲取的一系列觀測數據[4-5]。時序分析通常通過數據預處理、建模、預測3個步驟實現趨勢預測,在多個領域得到研究和應用。如E.Erdem等[6]基于時序數據,采用自回歸移動平均值預測風速和風向;藺茜等[7]采用長短期記憶(Long Short-Term Memory,LSTM)網絡,根據電力變壓器監(jiān)測時序數據,實現了電力變壓器運行狀態(tài)預測;王超等[8]通過分析與齒輪箱軸承溫度相關的特征時序數據,采用LSTM網絡對齒輪箱軸承溫度進行預測,并通過滑動窗口對預測殘差進行合理分析,實現了對齒輪箱軸承故障的有效預測。但鮮有時序分析在煤礦工作面設備故障預測中應用的報道。
本文提出基于時序數據對工作面設備進行故障預測。煤礦工作面設備通常由多個復雜系統(tǒng)模塊組成,各模塊間具有強耦合性,且設備故障機理復雜,因此在進行故障預測時需對設備的運行狀態(tài)、環(huán)境參數、操作數據等進行實時監(jiān)測,獲取電氣、機械、熱工類多參數時序數據。本文以國家能源集團神東煤炭集團公司上灣煤礦8.8 m大采高綜采工作面設備為研究對象,采集設備的多狀態(tài)時序數據,采用時序數據處理中常用的LSTM網絡建立故障預測模型,實現了設備故障的有效預測。
上灣煤礦工作面設備各監(jiān)測點數據均為單序列變化時序數據,根據數據變化記錄時間戳,采樣時間無規(guī)則。以某采煤機4個監(jiān)測點數據為例,部分時序數據見表1??煽闯龈鹘M數據對應的時間戳均不相同,形成獨特的時序。為便于采用LSTM網絡處理數據,需對原始數據進行預處理。
表1 采煤機部分時序數據
根據表1數據,基于時序對齊算法將時序數據對齊并進行前值填充,具體方法:對監(jiān)測數據的時間列重新排序,以時間列為關鍵值,各監(jiān)測數據作為標簽值填入,對某一時刻空缺值以前值進行填充。對齊后的時序數據見表2。
表2 對齊后的采煤機部分時序數據
煤礦工作面設備故障種類多,各故障發(fā)生機理不同;單一設備監(jiān)測點多(可達120個),監(jiān)測數據量大[9-12]。針對某一故障選取最合理有效的相關因素是實現故障預測的關鍵環(huán)節(jié)。本文以采煤機過熱跳閘故障為例進行說明。
通過分析采煤機過熱跳閘故障表征現象和發(fā)生機理,得出引發(fā)過熱跳閘故障的相關因素集為{滾筒溫度,滾筒電流,滾筒啟停,變頻器跳閘狀態(tài),牽引溫度,變頻器設定速度,變壓器溫度,搖臂溫度}。采用Pearson相關系數分析法[13]對相關因素集進行相關性分析。相關系數為
(1)
r取值范圍為[-1,1],r>0表示存在正相關關系,r<0表示存在負相關關系,|r|≤0.3表示不存在線性相關關系,0.3<|r|≤0.5表示存在低度線性相關關系,0.5<|r|≤0.8表示存在顯著線性相關關系,0.8<|r|<1表示存在高度線性相關關系,|r|=1表示存在完全線性相關關系。
1.2.4 處置及改進階段:在培訓過程中,運用PDCA循環(huán)管理,定期總結,在對新入科的CSSD護士進行培訓過程中及時發(fā)現問題,提出改進措施,總結經驗并進行效果評價。消毒供應專業(yè)操作項目雜、設備設施多、工作量大,因此對消毒供應中心新入科護士的培訓是持續(xù)性的。對定期考核的成績應及時分析原因并進行改進。
根據監(jiān)測數據,采煤機過熱跳閘故障相關因素間相關系數如圖1所示。可看出變頻器跳閘狀態(tài)和變頻器設定速度與其他因素間相關系數較小,因此將這2個因素舍棄,將{滾筒溫度,滾筒電流,滾筒啟停,牽引溫度,變壓器溫度,搖臂溫度}作為過熱跳閘故障預測因素集。
1-滾筒溫度;2-滾筒電流;3-滾筒啟停;4-變頻器跳閘狀態(tài);5-牽引溫度;6-變頻器設定速度;7-變壓器溫度;8-搖臂溫度;9-過熱跳閘。
采用LSTM網絡對采煤機過熱跳閘故障進行預測。以故障預測因素集作為LSTM網絡輸入,過熱跳閘故障作為LSTM網絡輸出。LSTM網絡由遞歸神經網絡發(fā)展而來,其細胞結構如圖2所示。
圖2 LSTM網絡細胞結構
細胞狀態(tài)為LSTM網絡的關鍵要素,是整個LSTM網絡的記憶空間。信息是否記憶由控制門控制,包括遺忘門、輸入門和輸出門。
遺忘門控制信息是否遺忘,即以一定的概率控制是否遺忘上一層的隱藏細胞狀態(tài)。圖2中LSTM網絡細胞單元輸入為上一層隱藏細胞狀態(tài)Ht-1(t為當前細胞層數)和本層時序數據Xt,通過sigmoid激活函數(σ)得到遺忘門輸出ft。ft在[0,1]之間,其代表遺忘上一層隱藏細胞狀態(tài)的概率。
輸入門負責處理本層細胞的輸入,包括2個部分:第1部分使用sigmoid激活函數,輸出it;第2部分使用tanh激活函數,輸出at。
本層細胞狀態(tài)Ct由2個部分組成:第1部分為上一層細胞狀態(tài)Ct-1和本層細胞遺忘門輸出ft的乘積;第2部分為本層細胞輸入門的it和at乘積。
本層隱藏細胞狀態(tài)Ht的更新由2個部分組成:第1部分為由上一層隱藏細胞狀態(tài)Ht-1和本層時序數據Xt通過sigmoid激活函數得到的Ot;第2部分由本層細胞狀態(tài)Ct通過tanh激活函數得到的nt。二者相乘得到Ht。
(2)
在實際生產中,遲滯性故障與其相關因素間存在時間累積效應,即相關因素經過一段遲滯時間后才引發(fā)故障。因此故障數據與故障發(fā)生前一段時間的相關因素相關。在LSTM網絡訓練階段引入遲滯時間h,將輸入的故障預測因素集通過h與輸出故障數據建立聯(lián)系,即
(3)
式(3)表明,預測階段的輸出具有時間段h的滯后性,因此確定遲滯時間段h成為研究重點。
根據采煤機過熱跳閘故障預測因素集,選取實際生產中的9 000組數據為訓練集,3 000組數據為測試集,正常數據與故障數據比為10∶1。
對數據進行歸一化處理,把數據轉換至[-1,1]區(qū)間,將各數據絕對值變成相對值,其實質是一種線性變換,不會導致數據失效,反而能提高數據表現。歸一化公式如下。
(4)
式中:x*為歸一化時序數據;x為原始時序數據;xmax,xmin分別為原始時序數據最大值、最小值。
部分歸一化時序數據見表3。滾筒啟停以1表示啟動,0表示停止;過熱跳閘故障以0表示正常,1表示故障。
表3 部分歸一化時序數據
設置LSTM網絡細胞層數為10,隱藏細胞數為10,學習率為0.001,一次讀取樣本個數為120。以均方根誤差為指標,確定遲滯時間為60 min。則不同迭代次數下LSTM網絡迭代損失如圖3所示。從圖3可看出,隨著迭代次數增加,LSTM網絡迭代損失表現出持續(xù)性遞減,1 500次迭代后損失減小速度較小,驗證了LSTM網絡在時序數據下表現出良好的計算性能。確定迭代次數為1 500,以遲滯時間為變量對LSTM網絡迭代損失進行計算,結果如圖4所示??煽闯龅鷵p失最小時遲滯時間為30 min。
(a)迭代次數為1 000
圖4 不同遲滯時間下LSTM網絡迭代損失
根據上述結果確定LSTM網絡訓練的迭代次數為1 500,遲滯時間為30 min,采用測試集進行故障預測,結果如圖5所示。預測值為[0,1],當預測值有明顯上升趨勢或達0.5以上時,表明實現了故障預測。從圖5可看出,實際值在72 min左右達到1(發(fā)生故障),預測值從46 min開始持續(xù)上升至0.5,實現了故障超前26 min預測,與設定的故障遲滯時間相差4 min,驗證了模型具有良好的預測效果。
圖5 故障預測結果
(1)提出采用時序對齊算法對采集的煤礦工作面設備原始時序數據進行對齊及前值填充,形成了完備的基礎數據集。
(2)采用相關性分析驗證了故障與其影響因素間的相關性,選取了故障預測因素集。
(3)建立了工作面設備故障的LSTM網絡預測模型,根據工作面遲滯性故障與其相關因素間存在時間累積效應的特點,將遲滯時間段引入預測模型,通過試驗確定了遲滯時間段,并驗證了采用時序數據進行工作面設備故障預測的有效性。