潘 磊 趙忠蓋 劉 飛
(江南大學(xué)物聯(lián)網(wǎng)工程學(xué)院 輕工過程先進控制教育部重點實驗室)
現(xiàn)代工業(yè)過程中傳感檢測信息的廣度和深度逐漸增加,使得數(shù)據(jù)驅(qū)動技術(shù)在現(xiàn)代工業(yè)過程監(jiān)控中應(yīng)用越來越普遍[1]。主元分析(PCA)作為一種常用的多元信息提取方法,在統(tǒng)計過程監(jiān)控中被廣泛應(yīng)用[2]。統(tǒng)計過程監(jiān)控一般涉及故障檢測和故障識別,其中故障檢測是檢測生產(chǎn)過程中的異常變化并提出預(yù)警,而故障識別是在檢測到故障時對故障進行定位和識別。
傳統(tǒng)的基于PCA的故障識別主要有貢獻圖法和重構(gòu)法[3]。貢獻圖法的思想是對監(jiān)控指標(biāo)貢獻值越大的變量越有可能引起故障,該方法原理簡單,不需要先驗知識[2~4]。 重構(gòu)法是利用故障方向進行重構(gòu),再根據(jù)重構(gòu)后的統(tǒng)計量指標(biāo)會回到控制限內(nèi)的性質(zhì)對故障變量進行識別[5]。相比于貢獻圖法,重構(gòu)法利用了先驗知識,因此效果往往優(yōu)于貢獻圖法。但實際工業(yè)過程中的故障方向很難獲取,并且兩種方法都存在拖尾效應(yīng),即在故障變量的影響下,非故障變量的貢獻值也會增大從而導(dǎo)致誤診[3]。Alcala C F和Qin S J提出一種基于重構(gòu)貢獻(RBC)的故障識別方法,并從理論和仿真方面驗證了在傳感器發(fā)生故障時該方法的診斷效果要優(yōu)于普通貢獻圖法[6],但使用重構(gòu)貢獻進行貢獻圖分析時也存在拖尾效應(yīng)[2]。對此,文獻[2]使用重構(gòu)貢獻法并利用組合最大化的思想提取出故障變量來避免拖尾效應(yīng),但該方法可能會過濾掉貢獻值低的故障源。文獻[7]通過引入權(quán)重因子降低重構(gòu)貢獻中無關(guān)項的大小來提高識別準(zhǔn)確率,降低拖尾效應(yīng)。Lamiaa M和Tarek A針對時變系統(tǒng)提出改進的重構(gòu)貢獻的過程傳感器故障診斷方法,并證明了對單個傳感器故障的可診斷性[8]。Li G等在重構(gòu)貢獻法的基礎(chǔ)上提出針對多變量故障的多方向重構(gòu)貢獻法(MRBC)[9]。 以上方法雖然能夠有效識別故障變量,但是無法從根本上解決拖尾效應(yīng)的影響。這是因為RBC方法的本質(zhì)是基于數(shù)據(jù)之間的相關(guān)關(guān)系而不是因果關(guān)系[10]。因果關(guān)系強調(diào)統(tǒng)計意義上的相關(guān)性,是指變量序列在時間意義上的前后連續(xù)性[11]。近幾年,因果分析的方法開始逐漸應(yīng)用在工業(yè)過程的故障識別上,文獻[12]對這些方法進行了總結(jié),其中互相關(guān)方法作為一種典型的因果分析方法具有易于理解、計算簡單等優(yōu)點。由于工業(yè)中的變量非常多,直接使用因果分析方法計算量會非常大,結(jié)果也會受到很大影響。因此,盡可能縮小故障候選變量的范圍對于因果關(guān)系分析具有重要意義[10]。
針對重構(gòu)貢獻法存在的拖尾效應(yīng),筆者提出先采用小波去噪對原始數(shù)據(jù)進行去噪預(yù)處理,再采用互相關(guān)法對重構(gòu)貢獻法篩選出的故障變量集進行因果分析。
PCA統(tǒng)計過程監(jiān)控方法是將數(shù)據(jù)投影到兩個正交的主元空間和殘差空間上,并分別構(gòu)建相應(yīng)的檢測統(tǒng)計量來監(jiān)控過程運行狀況的方法。
假設(shè)正常工況下的樣本集X∈Rn×m(其中,n為樣本數(shù),m為變量數(shù)),通過標(biāo)準(zhǔn)化處理,使其均值為0、標(biāo)準(zhǔn)差為1。則協(xié)方差矩陣有:
任意一個樣本x都可以被分解為在主元子空間和殘差子空間上的投影:
PCA故障檢測指標(biāo)以Hotelling T2和SPE統(tǒng)計量應(yīng)用最多,具體為:
SPE和T2控制限可以由SPE和T2統(tǒng)計量的抽樣分布得到[13]。若SPE或T2統(tǒng)計量值超過了相應(yīng)的控制限,則認為過程發(fā)生了異常,從而實現(xiàn)故障的檢測。
重構(gòu)貢獻法的思想主要是先對樣本變量進行重構(gòu),再通過計算故障樣本統(tǒng)計量指標(biāo)值和變量重構(gòu)后的統(tǒng)計量指標(biāo)最小值的差值作為該變量的重構(gòu)貢獻值。
假設(shè)故障樣本x=[x1,x2,…,xm]T,在變量xi上的重構(gòu)向量zi為:
其中,ξi∈Rm×1為變量方向向量, 第i個元素為1,其余位置為 0,表示第i個變量的方向向量[2];fi是故障幅值。
zi的統(tǒng)計量指標(biāo)為:
其中T2和SPE的M對應(yīng)著式(4)、(3)中的 D和
需要得到使index(zi)最小時的fi值,則有:
可得:
變量xi對故障變量檢測統(tǒng)計量的重構(gòu)貢獻值
工業(yè)現(xiàn)場采集的數(shù)據(jù)包含了不同程度的顯著誤差、測量噪聲和系統(tǒng)噪聲,噪聲水平直接影響最終模型的準(zhǔn)確性。在故障檢測前,用小波去噪對數(shù)據(jù)進行預(yù)處理,能在一定程度上提高故障診斷效率[14,15]。筆者采用非線性小波變換閾值法去噪,它具有廣泛的適應(yīng)性、計算速度快、噪聲幾乎完全得到抑制等優(yōu)點[16]。
互相關(guān)法是一種因果分析方法[17]?;ハ嚓P(guān)法首先通過不斷調(diào)整變量a和變量b之間的延遲時間,找到其最大相關(guān)系數(shù)。再對變量的隨機替代數(shù)據(jù)進行蒙特卡洛模擬來對變量間的最大相關(guān)系數(shù)進行顯著性檢驗,從而實現(xiàn)變量之間因果關(guān)系的識別。
對變量a和變量b的離散化互相關(guān)函數(shù)為[18]:
其中,ρk表示變量a與滯后k個時間刻度的變量b之間的相關(guān)系數(shù),N為變量包含的樣本數(shù)量,μa和μb分別代表變量a、b的均值,σa、σb分別代表變量a、b的方差。
這樣通過互相關(guān)函數(shù)可以得到一組滯后時間被調(diào)整后的變量a和變量b的相關(guān)系數(shù)集。找出最大的相關(guān)系數(shù)ρm,并得到相應(yīng)的最大滯后時間和滯后關(guān)系。
由于任意有限長度的兩組時間序列都存在一個最大相關(guān)系數(shù),因此需要有一個閾值來驗證變量之間是否存在有效的因果關(guān)系[18,19]。通過對信號的替代數(shù)據(jù)進行蒙特卡洛模擬來獲得這個閾值,實際上這是一個零假設(shè)問題,閾值即為置信水平[19]。 迭代幅度匹配傅里葉變換法(iAAFT)[20]產(chǎn)生的替代數(shù)據(jù)更接近原始數(shù)據(jù)分布,這里使用iAAFT法生成替代數(shù)據(jù),實現(xiàn)了生成的替代數(shù)據(jù)與原始數(shù)據(jù)的近似獨立同分布。具體方法步驟如下:
a.計算變量a和變量b的最大相關(guān)系數(shù)ρm;
b.通過 iAAFT 生成K組(ai,bi)(其中i=1,2,…,K)替代數(shù)據(jù),求出每組數(shù)據(jù)的最大相關(guān)系數(shù)ρi;
c.求出ρi的均值μλ和方差σλ,取ρth=μλ+3σλ或ρth=μλ+2σλ作為閾值;
d.若ρm>ρth,則證明變量a和變量b具有因果關(guān)系,通過滯后時間和滯后關(guān)系實現(xiàn)故障的識別。
盡管重構(gòu)貢獻法的故障識別效果在一些特定情況下好于傳統(tǒng)的貢獻圖,但由于變量之間的相互關(guān)系產(chǎn)生的拖尾效應(yīng),可能導(dǎo)致一些非故障變量的貢獻率甚至大過故障變量的貢獻率。
故障在傳播過程中,隨著控制回路等因素的影響,許多變量并未受到故障的過多影響,因此可以通過重構(gòu)貢獻法得到每個變量的貢獻率,篩選出貢獻率大的變量集,從而縮小故障變量的定位范圍。對于貢獻圖存在的拖尾效應(yīng)且無法從根源解決故障定位的問題,引入互相關(guān)因果分析法,識別變量之間的因果關(guān)系從而實現(xiàn)故障變量的識別。
筆者提出基于重構(gòu)貢獻和互相關(guān)的故障識別方法,首先對數(shù)據(jù)進行小波去噪預(yù)處理,再通過互相關(guān)法對重構(gòu)貢獻法識別出的故障變量集進行因果分析,從而完成故障變量的識別。具體步驟如下:
a.對正常歷史操作數(shù)據(jù)和故障歷史數(shù)據(jù)用非線性小波變換軟閾值去噪方法進行去噪,建立PCA模型,得到統(tǒng)計量的控制限,相比于T2,SPE統(tǒng)計量對于檢測微量故障更具優(yōu)勢,本項目采用SPE統(tǒng)計量。
b.得到故障數(shù)據(jù)的SPE統(tǒng)計量并通過控制限篩選出nf個故障樣本,利用重構(gòu)貢獻法求出每個故障樣本中每個變量的平均貢獻率。其中單個樣本變量貢獻率表示在樣本i中變量j的平均貢獻率。則nf個故障樣本下,每個變量的平均貢獻率T
d.對篩選的變量集兩兩之間利用互相關(guān)法判斷變量之間是否存在統(tǒng)計意義上顯著的因果關(guān)系,若存在則由滯后時間判斷因果關(guān)系。
e.將存在因果關(guān)系的變量對一一找出來,并繪制出相應(yīng)的因果關(guān)系傳遞圖,從而實現(xiàn)故障變量的識別。
Tennessee Eastman(TE)過程是基于實際化工生產(chǎn)過程,由納西-伊斯曼公司公開的一個仿真系統(tǒng),TE過程很好地模擬了實際復(fù)雜工業(yè)過程的主要特征,因此被廣泛應(yīng)用于控制、優(yōu)化、過程監(jiān)控和故障診斷的研究中,其過程流程參見文獻[21]。它共由5個操作單元組成:反應(yīng)器、分離器、循環(huán)壓縮機、汽提塔和冷凝器。包含41個測量變量和12個控制變量,其中測量變量又分為22個過程測量變量和19個成分測量變量。TE過程有21種故障類型,包括階躍、隨機、緩慢漂移、閥粘滯等。本項目采用22個過程測量變量進行研究,正常和故障條件下的運行時間都為960個時刻,采樣時間為3min,其中故障均從160時刻加入。整個實驗分為兩個部分:第一部分通過實驗使用小波去噪法對數(shù)據(jù)預(yù)處理;第二部分通過互相關(guān)法對具有拖尾效應(yīng)的故障進行故障識別。
以TE過程故障11、14為例,選取sym5正交小波為基小波,分解層數(shù)為3,采用啟發(fā)式閾值形式的軟閾值法進行去噪預(yù)處理。這里選取得到第161~660時刻的500個數(shù)據(jù)中去噪和非去噪數(shù)據(jù)的平均貢獻率并繪制貢獻圖。
對于故障11,由于故障為反應(yīng)器冷卻水入口溫度變化,則首先會影響到反應(yīng)器溫度變化。如圖1所示,雖然未去噪和去噪的平均貢獻率最大的都是變量9(反應(yīng)器溫度),但小波去噪后變量9的貢獻率由原來的0.13提升到0.58,同時幾乎所有的變量貢獻率都明顯降低,顯然小波去噪后的貢獻圖的拖尾效應(yīng)被顯著抑制。
圖1 故障11貢獻圖
故障14的故障類型為反應(yīng)器冷卻水閥粘滯。如圖2所示,對于未去噪處理的貢獻圖識別出貢獻率最大的為變量6(反應(yīng)器進料速度),而去噪后識別出的變量為變量21(反應(yīng)器冷卻水出口溫度),變量21的貢獻率由原來的0.078提升到0.430。仿真結(jié)果表明:小波去噪預(yù)處理后的貢獻圖能有效識別故障14的故障變量,同時有效降低拖尾效應(yīng)。
圖2 故障14貢獻圖
小波去噪預(yù)處理后,采用重構(gòu)貢獻法進行故障識別時,有時貢獻圖依然存在較為嚴重的拖尾效應(yīng)問題。以故障8的變量4為例(圖3),未去噪的識別出了錯誤結(jié)果,而去噪后雖然結(jié)果正確但變量3貢獻率與之非常接近。
圖3 故障8貢獻圖
因此,本項目將互相關(guān)法與重構(gòu)貢獻法結(jié)合來進行故障8的識別。首先通過小波去噪對數(shù)據(jù)進行預(yù)處理,然后利用重構(gòu)貢獻法計算出故障8的22個過程測量變量的平均重構(gòu)貢獻率,對于平均重構(gòu)貢獻率高于閾值限1/22≈0.046的可視為故障候選變量(圖3),由此可以得出故障8的故障候選變量集。
接下來對篩選出來的變量集兩兩信號之間用互相關(guān)法判斷是否存在因果關(guān)系,選取故障發(fā)生后的第101~500時刻即400個數(shù)據(jù)作為信號長度,這里滯后時間閾值k的取值范圍不大于100。根據(jù)互相關(guān)函數(shù)方法中的步驟c,分別用μλ+3σλ或μλ+2σλ作為閾值,具體變量間的最大相關(guān)系數(shù)和閾值分別列于表1、2,其中括號內(nèi)為閾值。加粗的數(shù)值表明變量之間存在相應(yīng)的統(tǒng)計意義上顯著的因果關(guān)系。
表1 故障8候選變量最大相關(guān)系數(shù)與閾值(3-σ)
表2 故障8候選變量最大相關(guān)系數(shù)與閾值(2-σ)
由表1可以看出,用μλ+3σλ作為閾值,沒有一組系數(shù)被識別出來,顯然是標(biāo)準(zhǔn)相對過高導(dǎo)致無法識別出因果關(guān)系。因此采用μλ+2σλ作為閾值(表2),可以看出,檢測到了4個變量之間的因果關(guān)系。
圖4為故障8的變量9和變量20替代數(shù)據(jù)的最大相關(guān)系數(shù)直方圖,可以看出近似為正態(tài)分布,由此得到的閾值為0.422,而變量之間的最大相關(guān)系數(shù)為0.473,所以可以認為變量9和變量20存在統(tǒng)計意義上的因果關(guān)系。
圖4 替代數(shù)據(jù)最大相關(guān)系數(shù)直方圖
通過互相關(guān)函數(shù)可以很容易得到變量間的滯后時間和滯后關(guān)系,從而得到故障傳播路徑。如圖5所示,準(zhǔn)確得到了故障8的故障變量為變量4。
圖5 故障8候選變量互相關(guān)分析
由于使用重構(gòu)貢獻法進行故障識別時貢獻圖容易存在拖尾效應(yīng)問題,筆者提出了先進行小波去噪預(yù)處理,再將重構(gòu)貢獻法與互相關(guān)法結(jié)合的故障識別處理方案。TE過程的仿真結(jié)果驗證了該方案的有效性。但互相關(guān)法只能檢測變量之間的線性相關(guān)作用,對于一些強非線性場合,其結(jié)果可能會有偏差。