江朋,陸遠,胡瑩
(南昌大學機電工程學院,江西 南昌 330031)
隨著科學技術的發(fā)展,印刷設備的工作要求不斷提高,其結構也趨于復雜化和精細化。在印刷設備運行過程中對連續(xù)運行要求高,且其檢修、維護較為困難。因此,如何實現(xiàn)對設備故障的及時診斷和提前預警成為了印刷企業(yè)最重視的問題。
傳統(tǒng)的故障診斷技術多采用單一參數指標,通過對其特征提取來完成設備的故障預警,而現(xiàn)代機械設備由于其復雜性和精密性,運行過程中有著多個關鍵參數,且常常伴隨著多個故障同時出現(xiàn)的情況。因此傳統(tǒng)故障診斷技術已遠遠不能滿足企業(yè)的實際需求,采用多參數融合技術[1]進行設備的故障預警逐步成為研究的熱點。近幾年,國內外不少學者致力于多參數融合預警技術的研究,并取得了很大的成效。對于復雜旋轉機械的故障診斷問題,王炳成等[2]提出了一種基于多參數融合的非線性度來解決,通過運用相空間重構理論和信號特征整合的方法,對多個非線性故障信號進行時間序列重構及特征參數融合,實現(xiàn)對不同故障信息的準確識別。馮玉芳等[3]通過將BP神經網絡模型和改進量子蜂群算法相結合來處理多信號參數的輸入,完成對旋轉機械的故障診斷及預測。Cai等[4]則提出了一種基于面向對象的貝葉斯網絡(OOBNs)的復雜系統(tǒng)的實時故障診斷模型,通過多源信息融合技術來解決故障診斷中的不確定性。Jiang等[5]采用離散熵的多序列聚合方法,結合LSTM神經網絡,對高維度的多個數據集進行分解、聚合等處理,最大程度保留了多尺度參數的有效信息,實現(xiàn)對航空發(fā)動機健康狀態(tài)的預測。
本文提出了一種新型的集成故障預警模型——基于長短期記憶網絡和FP-Growth算法相結合的故障預警方法。該方法針對印刷設備的特點,采用FP-Growth算法對歷史運行數據進行特征提取,并結合設備故障檢修記錄對故障進行分類匹配,構建設備故障診斷專家知識庫,完成對設備運行現(xiàn)場數據的故障診斷。核心部分還引入LSTM網絡處理運行參數的復雜關系和時空特征,將多個相關參數統(tǒng)一考慮,實現(xiàn)對設備運行狀態(tài)的有效預測,完成設備的故障預警。最后,通過相關仿真測試驗證了模型的可行性。
1997年,Hochreiter等聯(lián)合發(fā)表了與長短期記憶[6](long short-term memory,LSTM)相關的論文,自此,長短期記憶網絡開始逐步進入人們的視野。
長短期記憶網絡是一種特殊的遞歸神經網絡(recurrent neural network,RNN)。RNN結構如圖1(其中w、u、v為各類權重,X表示輸入,O表示輸出,S表示隱層處理狀態(tài))。
圖1 RNN模型展開圖
但當時間序列間隔和延遲較長時,RNN會出現(xiàn)梯度爆炸及梯度消失現(xiàn)象,這嚴重影響了數據預測的準確性。因此,引入其改進模型LSTM,來處理和預測長時依賴問題。LSTM模塊結構如圖2所示。
圖2 LSTM模塊結構圖
設定Wf、Wi、Wo、Wc以及bf、bi、bo、bc分別為3個門和單元狀態(tài)輸入的權重矩陣及偏差項,W為輸出層和隱藏層間的權重,b為輸出層的偏差項。
首先計算3個門的值和單元輸入狀態(tài)的值。遺忘門和輸入門用于更新單元內部狀態(tài):
ft=σ(Wf·[ht-1,xt]+bf)
(1)
it=σ(Wi·[ht-1,xt]+bi)
(2)
輸出門控制當前單元狀態(tài),決定輸出的內容:
Ot=σ(Wo·[ht-1,xt]+bo)
(3)
單元狀態(tài)輸入則通過tanh層生成新的候選值添加到單元狀態(tài)中去:
(4)
通過遺忘門與前單元狀態(tài)輸入丟棄不必要的信息,輸入門和單元狀態(tài)輸入保留新輸入的有效信息,得到單元的輸出狀態(tài)為:
(5)
然后,利用輸出門和單元的輸出狀態(tài)決定處理模塊的輸出:
ht=Ot·tanh(Ct)
(6)
通過上述LSTM模塊計算所得的ht值,預測網絡的輸出:
xt+1=W·ht+b
(7)
本文主要借助LSTM模塊的神經網絡訓練模型,從一組與時間序列相關的數據中提取出數據未來的特征變化,完成對各個參數的有效預測。
常用的挖掘頻繁項集的算法主要是Apriori算法,其缺陷在于原始數據量過大時,頻繁項集的發(fā)現(xiàn)速率相對低下。為改善其不足,提出FP-Growth算法,通過對原始數據集進行兩次掃描完成對頻繁項集的搜索,提高了對數據的處理效率。
FP表示的是一種頻繁模式,其算法步驟如下:
1) 掃描原始數據集,獲取數據集中每個元素出現(xiàn)的頻率;
2) 進行支持度過濾操作,刪去其中不符合最小支持度的元素項;
3) 掃描保留的頻繁元素項,并按照元素項的關鍵字進行降序排序,構建FP-Tree;
4) 從構建完成的FP-Tree中抽取頻繁項集。
FP-Tree的構建中使用到最小支持度,其描述如下。
設
Z={z1,z2,z3,z4,…,zk}
(8)
是由k個不同的數據項目組成的集合,其中:每個元素稱為項,項的集合稱為項集。給定一個事務數據庫:
B={T1,T2,T3,T4,…,Tm}
(9)
式中:每一個事務T都是項集Z的一個子集,|B|為B中的總事務數,X、Y都是T中的項或項集,且X和Y滿足X∩Y=φ。若事務T同時包含X和Y,設S為滿足條件的事務T在事務數據庫B中的所占的比例,即支持度,則
(10)
設C為B中所包含的事務X中又包含事務Y的比例,即信賴度,則
(11)
最小支持度和最小信賴度分別用支持度閾值Smin和信賴度閾值Cmin表示。
該算法雖能更高效地發(fā)現(xiàn)頻繁項集,但不能直接用于發(fā)現(xiàn)關聯(lián)規(guī)則。關聯(lián)規(guī)則的挖掘還需要利用該算法得出的頻繁項集來產生,其流程如下:
1) 對事務數據庫中的數據進行預處理;
2) 初步設定事務數據庫的支持度閾值和信賴度閾值;
3) 采用FP-Growth算法構建FP-Tree,搜索頻繁項集;
4) 根據事務庫中數據的實際情況調整支持度閾值和信賴度閾值,修剪非頻繁項集;
5) 利用滿足支持度閾值和信賴度閾值的頻繁項集抽取關聯(lián)規(guī)則。
同時滿足支持度閾值和信賴度閾值條件的頻繁項集所產生的規(guī)則稱為強關聯(lián)規(guī)則,即為數據挖掘的目標。規(guī)則的抽取就是選取符合條件的頻繁項集按照與預處理步驟相逆的過程所生成的關聯(lián)規(guī)則。本文目的就是通過關聯(lián)規(guī)則挖掘算法將各參數的異常變化與設備故障類型間的關聯(lián)規(guī)則進行發(fā)掘,利用各參數的預測值對設備的狀態(tài)進行預測。
印刷凹印設備常常由于其主傳動軸不對中、不平衡,潤滑及傳動系統(tǒng)故障產生各類事故。因此,本文提出的基于LSTM網絡和FP-Growth算法相結合的印刷設備故障診斷及預警模型用于設備狀態(tài)預測,其系統(tǒng)架構如圖3所示,主要由數據采集、數據存儲、數據預處理、數據分析及模型應用五大模塊構成。
圖3 印刷設備故障診斷及預警系統(tǒng)架構
各功能模塊具體描述如下:
1) 數據采集。數據來源主要包括各類型傳感器所采集到的數據,凹印設備控制器所記錄的印刷設備各項運行參數及專家知識庫中的故障診斷記錄等。其溫度傳感器與流量傳感器安裝的點位分別分布在壓印、印版、集色滾筒兩側,共6個測點。
2) 數據存儲。線邊控制系統(tǒng)通過以太網與PLC、凹印設備控制器及故障診斷專家知識庫連接,將相關數據提取到線邊數據庫,為設備預警提供信息支撐。線邊數據庫又分為實時數據庫和關系數據庫兩部分,實時數據庫主要用于存儲設備控制器及PLC采集的實時數據,然后將這些數據信息通過抽取、提煉和持久化轉換為有效參數存入關系數據庫中。
3) 數據預處理。通過設備管理系統(tǒng)每隔固定時間同步線邊數據庫,讀取到相關數據。同時通過數據清理和數據變換,保證數據的準確性和完整性。數據清理過程包括對數據進行缺失值補充,對錯誤或重復數據的剔除等;數據變換則是將數據規(guī)范化,使其轉換成適用于數據挖掘的形式,主要方式有數據歸一化、文字數值化等。
4) 數據分析。該模塊在數據預處理的基礎上對數據的各項特征進行提取。采用FP-Growth算法對各數據集進行挖掘,得到與故障類型相關的關聯(lián)規(guī)則,并將新規(guī)則存入故障診斷專家知識庫進行規(guī)則更新,用于設備故障的在線診斷。同時運用LSTM網絡建立預測模型,通過不同的數據集對模型進行訓練,得到各數據在下一時段的預測值,然后借助專家?guī)鞂υO備進行故障預測。
5) 模型應用。根據數據分析模塊對設備故障的診斷和預測,對其分析結果進行可視化操作,以圖或表等形式向用戶直觀地展現(xiàn)各類故障預警信息。
對印刷設備來說,不同的故障類型直接反映在設備的故障維修記錄中,因此印刷設備故障關聯(lián)規(guī)則挖掘的首要目標是各個故障維修記錄。根據故障維修記錄中設備各運行參數的數據特征與設備故障代碼、維修診斷結果等的相關關系,產生一定的關聯(lián)規(guī)則,用于構建初始的故障診斷專家知識庫。其構建流程如下:
1) 讀取設備故障維修記錄中的各項數據;
2) 對數據進行預處理,并設定支持度與可信度閾值;
3) 構建FP-Tree,搜索頻繁項集;
4) 調整閾值,修剪非頻繁項集;
5) 搜索完成,抽取關聯(lián)規(guī)則;
6) 將獲取的規(guī)則進行規(guī)則邏輯性檢驗,檢測無誤后存入故障診斷專家知識庫中,完成初始專家?guī)斓臉嫿ā?/p>
運用專家知識庫進行印刷設備的在線故障診斷,其診斷流程圖如圖4所示。對于與專家知識庫既有規(guī)則不匹配的故障類型進行規(guī)則檢驗,若其不包含錯誤信息,則根據實際維修情況增加新規(guī)則。對于可通過專家知識庫診斷出的實時故障,應及時出具診斷說明,并制定相應的維修計劃對設備進行檢修。每次診斷完成后,還應實時更新專家知識庫(包括診斷規(guī)則、故障類型及規(guī)則信賴度等)。
圖4 在線故障診斷流程圖
2.3.1 構造模型的輸入與輸出
設備狀態(tài)預測模型的輸入主要為設備故障特征參數A、設備運行參數B及環(huán)境因素C等,對應的設備的每一個工作狀態(tài)X都有對應的A、B、C值,如式(12)。
X={A,B,C}
(12)
1) 故障特征參數:印刷設備可依據各類傳感器反映的設備故障特征參數來監(jiān)控設備運行狀態(tài),例如:使用電渦流傳感器測得軸的徑向位移,監(jiān)控軸的平衡與對稱性;采用紅外溫度傳感器測量滾筒的軸承溫度,以保障合適的設備運行溫度;使用流量計計量潤滑油脂流量,監(jiān)測設備潤滑系統(tǒng)的工作。
從印刷凹印設備的實際工作情況出發(fā),發(fā)現(xiàn)設備出現(xiàn)故障時,易導致其溫度和潤滑油脂流量產生較明顯的異常變化,如軸故障、齒輪故障等。溫度的變化對于運動件來說,是其是否在正常工作范圍的重要指標,而潤滑油的作用則是對運動件進行潤滑、降溫,減少機械磨損等,故選取軸承溫度及潤滑油脂流量作為設備主要的故障特征參數。
2) 設備運行參數:主要是原凹印設備控制器在設備運行時所監(jiān)控的各項參數值,包括設備運行時的電壓、電流、工作負載、運行轉速等數值。
3) 環(huán)境因素:包括設備工作空間的溫度、濕度等。
為保證各輸入參數在同一量綱下,需要采用不同的數據處理方式對不同的參數類型進行規(guī)范化處理。待各參數特征提取完成后,按以下規(guī)則構造模型的輸入與輸出:
1) 數值分布較為集中的數值類變量(如軸承溫度、潤滑油脂流量等)采用離差標準化的方法處理,通過對原始數據的線性變換,使其結果值映射到[0,1]之間,如式(13)。
2) 原始數據分布呈近似正態(tài)分布的數值類變量(如環(huán)境溫度、濕度等自然因素)采用Z-Score標準化方式處理,使變量數值都聚集在0附近,方差為1,如式(14)。
3) 文字類型變量,則需先對變量進行分類,然后按照順序分別轉成數值1,2,3,…進行處理;若此類變量只存在發(fā)生與不發(fā)生兩種情況,則按情況有無發(fā)生轉換成數值1或0。
(13)
(14)
其中:xmax、xmin分別為某參數樣本數據中的最大值與最小值;μ為某參數所有樣本數據的均值;σ為其標準差;x為參數變量處理前的指標數值;x*為處理后的指標數值。
2.3.2 構建設備狀態(tài)預測模型
設備的工作狀態(tài)與其運行過程中的關鍵參數息息相關,且各參數間也存在著特定的聯(lián)系,故本文采用LSTM網絡構建印刷設備工作狀態(tài)預測模型。本模型的輸入與輸出參數一致,其核心模塊為一個3層的循環(huán)模塊,其結構如圖5虛線部分所示。主要包括兩個全連接層和一個隱藏處理層,第1個全連接層負責對輸入的不同參數進行特征整合;第2個連接層則作為數據分類層,輸出不同類型參數的預測值;隱藏層即為LSTM神經網絡處理模塊,實現(xiàn)對輸入值的預測。其余參數再選取為工業(yè)界常用的一般值,這些參數包括學習率、初始權重、網絡結構參數等,模型架構如圖5所示(圖中at表示t時刻參數a的值)。
圖5 設備狀態(tài)預測模型架構圖
2.3.3 模型訓練及仿真
為保證模型訓練精度,選取南昌市某特種印刷企業(yè)某臺凹印設備2019年全年運行數據的數據集作為訓練樣本對設備狀態(tài)預測模型進行訓練,全部樣本數為300組,約3 600條數據記錄。通過對設備歷史運行數據進行預處理,將其分割成多個連續(xù)的時間序列數據,其中80%作為訓練樣本,20%作為測試樣本。每個訓練樣本都由兩個相鄰時間段的時間序列組成,隨機選取訓練樣本對構建完成的狀態(tài)預測模型進行訓練。
為了使模型訓練過程可視化,引入平均絕對誤差(mean absolute error,MAE)作為損失函數,對模型的訓練結果進行監(jiān)測。當該數值越趨近于0時,則說明預測模型的擬合度越好,預測數據的準確度越高,其計算公式如式(15)。根據MAE值及誤差反向傳播算法不斷調整模型各權重系數,經過預測值與真實值的對比分析,最終得出擬合準確度較高的預測模型。
(15)
式中:NMAE為網絡模型訓練時的損失函數值;y(i)為數據的實際監(jiān)測值;y*(i)為設備狀態(tài)預測模型輸出的預測值。
1) 計算不同時間步長下訓練數據集的MAE值確定模型的時間步長。取不同的時間步長的對模型進行訓練,觀測其訓練效果,如圖6所示。
由圖6可知,不同時間步長下,模型的訓練效果有差異,隨著步長的增加,模型訓練效果逐漸變好,但當時間步長增加到6時,模型表現(xiàn)變差。故時間步長為5時,模型訓練效果最好,即通過參數前5個時間序列的數據預測第6個數據值。
時間步長
2) 取時間步長為5,對模型進行訓練并觀察其損失值變化,其模型訓練過程中損失函數的變化如圖7所示。
從圖7可以看出,經過600次左右的模型訓練后,損失函數指標穩(wěn)定在0.25左右,最終訓練樣本的擬合度約為98.5%,模型訓練效果較好。擬合度計算公式如式(16)、式(17)所示:
訓練周期
Q=∑(y-y*)2
(16)
(17)
式中:Q為殘差平方和;Rnew為擬合度指標;y為實測值;y*為預測值。
模型訓練完成后,通過測試樣本中t時刻的設備運行參數值at即可得出其下一相鄰時刻t+1的參數預測值at+1,然后采用迭代方法[8]逐點預測設備未來各時刻的運行參數值。通過設備狀態(tài)預測模型完成對各關鍵參數值的預測,針對其中異常的A、B、C參數,會觸發(fā)對異常數據的提取過程,然后結合專家知識庫進行故障在線診斷,完成對設備工作狀態(tài)的預測,實現(xiàn)對設備的有效預警。
在設備正常運轉過程中,其運動件的溫度、潤滑油脂流量在預警系統(tǒng)中實時顯示(圖8),且都有一定的限值(溫度限制值為48 ℃,流量上、下限值分別為65 mL·min-1及80 mL·min-1),超限則意味著設備發(fā)生故障,例如:油管破裂、臟堵及閥門損壞易引起流量超限,軸承、軸等的變形及磨損易導致溫度超限。通過對不同的溫度、流量監(jiān)測曲線與正常工作曲線的比較分析,借助溫度與流量的變化幅度來判斷運動件的工作狀態(tài),如圖9所示。
圖8 系統(tǒng)實時畫面
如圖9(a)中監(jiān)測的溫度發(fā)生了尖峰突變,可判斷出運動件發(fā)生損壞等情況,發(fā)出預警信號。圖9(c)處流量曲線發(fā)生階梯變化,根據曲線階梯的大小,發(fā)出管道破裂或堵塞的預警信號。圖9(b)、(d)中,溫度、流量曲線發(fā)生波動,可依據波動范圍的大小及曲線斜率的突變,判斷設備相關部件的狀態(tài),超限時發(fā)出預警信號。通過模型故障特征參數溫度、流量,設備運行參數工作負載、運行轉速等因素的異常變化,結合專家知識庫來判斷設備所存在的故障及其故障類型。
t/min
通過樣本的隨機選取,確定以2019年7月9日設備運行數據作為測試樣本對訓練模型進行測試,用于預測后1 d設備全天(9:00—20:00)運行各參數值,并與當天設備實際記錄的各參數值進行對比,采用相對誤差作為衡量標準來評價模型預測的準確度,如表1(選取軸承溫度、潤滑油脂流量兩個重要的故障特征參數作為模型驗證參數)。
表1 模型部分參數的預測值及相對誤差表
由表1的預測結果可以看出,該模型對不同參數的預測值與其實際檢測值近似,相對誤差基本控制在4%以內,表明模型預測準確度較高。
測試一:通過對設備歷史維修記錄的收集,得到了233條故障記錄,以此分別建立含200條故障記錄的挖掘庫和含33條故障記錄的測試庫,在計算機上進行故障診斷實驗。
為了測試借助FP-Growth算法所構建的專家?guī)煊糜谠O備故障診斷的優(yōu)越性和準確性,設計測試內容如下。
1) 將挖掘庫中200條故障記錄通過數據預處理按故障性質分組,分別采用FP-Growth算法和Apriori算法挖掘頻繁項集,產生關聯(lián)規(guī)則,構建專家知識庫。
2) 設備實際運行過程中發(fā)生故障概率較低,因此向測試庫中繼續(xù)添加567條設備正常運行的數據記錄,利用專家知識庫對共600條測試數據分別分成3組(每組包含189條正常數據和11條故障數據,數據隨機抽選),針對軸故障、軸承故障、潤滑故障、閥故障、齒輪故障、電機故障等多種設備常見故障進行故障診斷。測試結果如表2所示。
表2 不同算法故障診斷的效果比較
測試二:隨機選取2020年某個月(測試中選取4月份數據,共30組,約360個數據樣本)的設備運行數據,記錄該月凹印設備實際的故障發(fā)生情況,通過設備狀態(tài)預測模型對該月設備的故障特征參數溫度、流量的變化,設備運行參數工作電壓、電流及環(huán)境因素等進行預測,將預測數據作為測試樣本,借助測試一中FP-Growth算法所構建的專家知識庫進行設備故障診斷測試。
針對測試結果與實際故障情況進行比較,其診斷結果如表3所示??芍?,該模型故障預測的準確率為90%,且誤診率較低,約為1.67%,診斷效果較好。
表3 模型故障診斷的測試記錄
續(xù)表3 模型故障診斷的測試記錄
結合設備中多個監(jiān)測參數間的耦合關系,本文采用多參數信息融合預警技術及關聯(lián)規(guī)則數據挖掘算法提出了一種基于LSTM和FP-Growth算法相結合的印刷設備故障預警模型,并通過相關的模型仿真及故障測試,取得了期望的預測效果,充分證明了模型的有效性和可行性。綜上所述,得出結論:
1) 過LSTM網絡來處理和預測時間序列參數,有效解決了傳統(tǒng)神經網絡構建模型中的權值更新問題,提升了模型的訓練效果。
2) 用FP-Growth算法產生關聯(lián)規(guī)則,用其所構建的專家知識庫對于印刷設備的故障預警效果更好,故障預測準確率更高,且其算法速度快,對設備的故障診斷效率大大提高。
故采用LSTM網絡結合FP-Growth算法所構建的預警模型滿足模型預測標準,能夠應用于印刷設備的故障診斷與預警。進一步提高對設備故障預測的準確性及實現(xiàn)設備狀態(tài)的長時間預測是下一步的研究目標。