張成,李明業(yè),潘立志,李元
1. 沈陽化工大學(xué) 理學(xué)院,遼寧 沈陽 110142
2. 沈陽化工大學(xué) 信息工程學(xué)院,遼寧 沈陽 110142
隨著現(xiàn)代化工和生物企業(yè)生產(chǎn)技術(shù)的發(fā)展,企業(yè)對生產(chǎn)過程的安全性和可靠性提出了越來越多要求。近年來,多元統(tǒng)計過程監(jiān)控(multivariate statistical process monitoring, MSPM)方法被廣泛應(yīng)用于生產(chǎn)過程的安全狀態(tài)監(jiān)控,并取得了令人滿意的結(jié)果[1-2]。在一些工業(yè)生產(chǎn)過程中,首先,MSPM根據(jù)正常的歷史數(shù)據(jù)建立過程監(jiān)控模型,然后生產(chǎn)操作人員可以根據(jù)上述訓(xùn)練階段計算出的控制限,對當(dāng)前的生產(chǎn)過程進行正?;蚬收系臎Q策。
眾所周知,主成分分析(principal component analysis, PCA)是一種重要的多元統(tǒng)計分析過程監(jiān)控方法,并已被用于監(jiān)控某些生產(chǎn)過程中的狀態(tài)[3]。需要注意的是,當(dāng)主成分分析用于監(jiān)控工業(yè)過程時,監(jiān)控數(shù)據(jù)必須遵循多元高斯分布[4]。然而,大多數(shù)研究表明,不同生產(chǎn)過程中的數(shù)據(jù)是非高斯分布[5],非高斯分布降低了PCA 的過程監(jiān)控性能。為了解決非高斯分布的數(shù)據(jù),提出了獨立分量分析(independent component analysis, ICA)方法[6]。與PCA 相比,ICA 不僅降低了高階統(tǒng)計相關(guān)性,而且可以提取監(jiān)控過程中的非高斯信息[7]。Lee 等[8]提出了基于ICA 的統(tǒng)計過程監(jiān)控方法,并使用2 個統(tǒng)計量來監(jiān)控非高斯過程的狀態(tài):I2和SPE (squared prediction error)。本質(zhì)上,ICA 是一種靜態(tài)統(tǒng)計策略,這意味著ICA 只考慮不同變量之間的相關(guān)性,而忽略了不同樣本之間的自相關(guān)和滯后相關(guān)對過程檢測的影響。然而,一些研究表明,在大多數(shù)化工過程中,動態(tài)特性是顯著的。為了克服動態(tài)過程中的非高斯問題,Lee等[9]提出了動態(tài)獨立分量分析(dynamic independent component analysis, DICA)。當(dāng)DICA用于監(jiān)控過程狀態(tài)時,分別提取樣本和變量的自相關(guān)和互相關(guān)[10-11]。在進行故障檢測時,DICA 同樣采用 I2和SPE 進行過程監(jiān)控。 I2和SPE 統(tǒng)計量主要評估樣本在子空間中的分布變化,而通常忽略樣本在時間上的變化。有研究表明,在DICA 中計算出的統(tǒng)計量仍然具有顯著的自相關(guān),這意味著一些故障樣本無法根據(jù)控制限進行識別[9]。為了考慮樣本在時間上的變化信息,Kano 等[12]定義了一個相異指數(shù),利用相應(yīng)特征值之間的差異定量評估正常和故障條件之間的分布差異。之后,Wang 等[13]提出一種相異指數(shù)分析的多變量漸進式診斷方法,并將其應(yīng)用于連續(xù)過程。Zhao 等[14]提出了基于相異指數(shù)分析的移動窗口間歇過程監(jiān)控并將相異指數(shù)應(yīng)用于非線性過程。研究表明,相異指數(shù)方法能夠快速、有效地提取數(shù)據(jù)在時間上的變化信息即自相關(guān)性并能作為一個新的統(tǒng)計量進行故障檢測。
針對DICA 在動態(tài)過程中捕獲的獨立分量存在自相關(guān)性和統(tǒng)計量存在漏報的問題,本文提出一種基于獨立分量相異性分析(DICA dissimilarity analysis, DICA-DISSIM) 的動態(tài)過程狀態(tài)監(jiān)控研究。為了實現(xiàn)對動態(tài)過程的監(jiān)控,在DICA 的基礎(chǔ)上引入了相異指數(shù)。本文方法能有效地處理獨立分量子空間中樣本之間的自相關(guān)性,減少動態(tài)特性對故障檢測的影響。
假設(shè)觀測數(shù)據(jù)X=[x1,x2,···,xm]T∈Rm×j(m為樣本個數(shù),j為變量個數(shù)),ICA 可以從原始數(shù)據(jù)X中估計出混合矩陣A和 獨立分量S[8]。
在DICA 中,首先建立增廣矩陣,其公式為
式中l(wèi)為滯后參數(shù)。接下來在矩陣X中實現(xiàn)ICA。其目的是求出解混矩陣W,然后計算重構(gòu)后的獨立分量S,計算公式為
詳細的過程主要包括白化和計算獨立分量。
在動態(tài)獨立分量分析中,主要通過白化來消除監(jiān)控變量的互相關(guān)。
式中:Q為白化矩陣, Λ和U為特征分解所得。
求解獨立分量S和解混矩陣W的計算公式為
為了估計矩陣B,使用了FastICA 算法[6]。
最后,DICA 監(jiān)控指標(biāo)的計算公式為
式中:sd=WdxT,Wd可以由W的行范數(shù)進行排序并根據(jù)行范數(shù)貢獻率選取[10],且Bd表示 B中對應(yīng)的前 d列。
混合數(shù)據(jù)集X=[X1;X2]∈Rm×j(m=m1+m2)的協(xié)方差矩陣為R,通過特征分解得到特征值的對角矩陣 ?和特征向量V,最后建立1 個新的變換矩陣P。
將數(shù)據(jù)集Xi轉(zhuǎn)換為Yi,計算其協(xié)方差矩陣Ci,最后計算出特征值和特征向量。
最后,監(jiān)控指標(biāo)D作為統(tǒng)計量,其計算公式為
相異指數(shù)D在0~1 變化。一些研究表明,當(dāng)數(shù)據(jù)集彼此十分相似時,D接近0;反之,當(dāng)數(shù)據(jù)集彼此具有差異時,D接近1[12]。
DICA 方法可以提取獨立信號,但需要注意的是,在復(fù)雜的動態(tài)過程中,提取的獨立分量含有顯著的自相關(guān)性,這將導(dǎo)致一些顯著的故障無法被檢測。此外,在DICA 中,監(jiān)控指標(biāo) I2統(tǒng)計量的控制限為圓形度量,故 I2統(tǒng)計量存在漏報的問題。
接下來將通過一個簡單的動態(tài)數(shù)值例子進行驗證DICA 的統(tǒng)計量存在的問題。例子模型為
式中w1(k)=2sin(0.02kπ),w2(k)~U(-2,2),對z進行監(jiān)控。
首先由例子模型分別生成1 組訓(xùn)練數(shù)據(jù)和1 組故障數(shù)據(jù)。其中,訓(xùn)練數(shù)據(jù)中的2 000 個樣本為正常,測試數(shù)據(jù)的前1 000 個樣本為正常,后1 000個樣本在w的第1 個變量上添加幅值為4 的階躍故障。圖1 給出獨立分量的散點圖,其中,訓(xùn)練數(shù)據(jù)外部的圓代表 I2控制限。在該數(shù)值例子中,階躍故障設(shè)置較大,而由圖1 可以看出,控制限內(nèi)的故障數(shù)據(jù)無法被檢測出,這意味著使用圓形控制限監(jiān)控獨立分量時,故障檢測率較低。除此之外,DICA 捕獲的獨立元還具有較強的自相關(guān)性,如圖2。
圖1 IC 子空間中樣本的散點圖
圖2 獨立分量的自相關(guān)性圖
基于上述分析,本文提出了一種基于獨立分量相異性分析的研究,用于監(jiān)控動態(tài)過程的狀態(tài)。
首先采集2 組正常數(shù)據(jù)集X1,X2∈Rm×j,構(gòu)造2 組正常數(shù)據(jù)的增廣矩陣L1,L2∈R(m-l)×j(l+1),通過動態(tài)獨立分量分析算法得到獨立分量S(1),S(2)。
式中:l為 時滯參數(shù),m-l為樣本個數(shù),d為獨立分量個數(shù)。
為了實現(xiàn)過程監(jiān)控,在獨立分量子空間引入滑動窗口。設(shè)窗寬為w,步長為h,第i個窗口公式為
式中i=1,2,···,(m-l-w)/h+1。
混合數(shù)據(jù)集可以表示為
將混合數(shù)據(jù)進行相異性分析,并計算其協(xié)方差矩陣,最后進行特征分解得到特征值 λ(1)。
為了監(jiān)控過程狀態(tài),由式(1)分別求出訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)的監(jiān)控指標(biāo)D和Df。最后,使用核密度估計法(kernel density estimation, KDE)[15]按照99%的置信度確定控制限D(zhuǎn)UCL,通過比較Df和DUCL確定故障檢測結(jié)果。
獨立分量相異性分析的動態(tài)過程監(jiān)控方法故障診斷過程主要包括離線建模、在線檢測和故障診斷3 個步驟。
1)離線建模
①構(gòu)造2 組訓(xùn)練數(shù)據(jù)X1,X2的增廣矩陣L1,L2;
②利用L1的均值和方差對L1,L2標(biāo)準(zhǔn)化處理,記為,;
③根據(jù)ICA 得到Lˉ1的解混矩陣Wd和獨立分量S(1),同理得到的獨立分量S(2);
④根據(jù)滑動窗口技術(shù) ,依次在S(1)和S(2)上選取窗口數(shù)據(jù)和,然后計算相異指數(shù)D,最后使用核密度估計法確定控制限D(zhuǎn)UCL。
2)在線檢測
①采集第k窗口數(shù)據(jù)集,并構(gòu)造增廣矩陣F(k);
②利用L1的均值和方差對F(k)進行標(biāo)準(zhǔn)化,記為;
⑤若>DUCL,則F(k)為故障樣本,否則,F(xiàn)(k)為正常樣本。
3)故障診斷
由于協(xié)方差矩陣的特征值代表主分量的方差,設(shè)主分量為Gd,則有
式中:Id為單位矩陣I的第d個列向量,P為轉(zhuǎn)換矩陣。若記則可表示成
式中為F(k)的第i列。
則每個獨立分量的貢獻為
最后,各監(jiān)控變量的貢獻的計算公式為
需要注意的是:本文方法并不是簡單的將DICA 與相異指數(shù)結(jié)合。DICA 方法可以通過白化降維和獲取數(shù)據(jù)的動態(tài)信息,但是無法徹底解決數(shù)據(jù)中樣本之間存在的自相關(guān)性,并且 I2統(tǒng)計量的控制限存在一定的局限性,對檢測結(jié)果造成很大影響。相異指數(shù)方法考慮了樣本在時間上的變化信息,但是無法快速提取有用的信息。因此,本文在DICA 的基礎(chǔ)上引入相異指數(shù),能夠有效地處理DICA 捕獲的獨立分量的自相關(guān)性,該方法還解決了DICA 統(tǒng)計量存在漏報的問題。最后,本文提出了一種基于貢獻圖的故障診斷方案,該方案解決了相異指數(shù)方法無法通過控制圖找出故障的問題。
將DICA-DISSIM 的故障檢測與診斷方法用于文獻[16]中的動態(tài)數(shù)值例子。具體數(shù)值例子模型為
式中w(k)為-2~2 均勻分布的二維隨機向量,對u和y進行監(jiān)控。
首先由數(shù)值例子模型生成1 組訓(xùn)練數(shù)據(jù)和1 組故障數(shù)據(jù)。訓(xùn)練數(shù)據(jù)中的1 000 個樣本為正常,測試數(shù)據(jù)的前300 個樣本為正常,后700 個樣本在w的第1 個變量上添加幅值為2 的階躍故障。
使用ICA、DICA、Diss(dissimilarity)和本文方法對此動態(tài)過程進行模擬。在本文方法中,通過交叉驗證選擇窗寬和步長,最后將窗寬設(shè)為75,步長選取為1。其中,DICA 和本文方法中的時滯參數(shù)l=2,根據(jù)核密度估計方法將檢測方法的置信度定為99%。
當(dāng)在動態(tài)數(shù)值例子中使用ICA 時,檢測結(jié)果如圖3 所示。ICA 去除了變量之間的線性相關(guān)性,但在動態(tài)過程中,ICA 捕獲的獨立分量具有較強的動態(tài)性,導(dǎo)致故障檢測率較低。
圖3 ICA 故障檢測結(jié)果
當(dāng)在動態(tài)數(shù)值例子中使用DICA 時,如圖4、5 所示,DICA 在白化中去除了變量之間的線性關(guān)系和樣本之間的動態(tài)性,但捕獲的獨立分量還存在一定的自相關(guān)性,并且由本文2.2 節(jié)分析可知DICA 統(tǒng)計量的控制限無法檢測出部分故障,所以DICA 的故障檢測率較低。DICA 的故障檢測結(jié)果如圖6 所示。使用相異指數(shù)分析動態(tài)數(shù)值例子時,故障檢測結(jié)果如圖7 所示。
圖4 DICA 的2 個獨立分量
圖5 獨立分量的自相關(guān)性圖
圖6 DICA 故障檢測結(jié)果
圖7 Diss 故障檢測結(jié)果
當(dāng)在動態(tài)數(shù)值例子中使用本文方法時,通過DICA 得到獨立分量,在獨立分量中引入相異指數(shù)D,既能捕獲數(shù)據(jù)的動態(tài)特征又能消除獨立分量的自相關(guān)性,并為新統(tǒng)計量來量化數(shù)據(jù)之間的差異。因此,本文方法比傳統(tǒng)的ICA、DICA 監(jiān)控指標(biāo)I2、SPE更適用于動態(tài)過程的監(jiān)控,檢測結(jié)果如圖8 所示??梢钥闯霰疚姆椒ǖ墓收蠙z測率明顯高于傳統(tǒng)的ICA、DICA 和相異指數(shù)方法。
圖8 本文方法故障檢測結(jié)果
最后,對動態(tài)數(shù)值例子進行故障診斷。測試數(shù)據(jù)每一個變量對統(tǒng)計量D的貢獻度如圖9 所示。由圖9 可知,變量4 的貢獻度最大,其次是變量1,即故障主要由第1、4 個變量引起。
圖9 監(jiān)控變量貢獻
在該數(shù)值例子中,監(jiān)控了u1、u2、y1、y2共4 個變量。由于在w的第1 個變量上添加了故障,通過本文所提出的故障診斷方法可知,故障在變量y2上體現(xiàn)最明顯,其次是變量u1。在圖10 中,綠色部分代表訓(xùn)練數(shù)據(jù),藍色部分代表校驗數(shù)據(jù),紅色部分代表故障數(shù)據(jù),可以看出第1 個變量u1和第4 個變量y2中的故障數(shù)據(jù)向上偏移,這與本文方法的診斷結(jié)果一致。
圖10 監(jiān)控變量
田納西-伊斯曼(tennessee-esatman,TE)過程是一個被廣泛應(yīng)用于過程監(jiān)控領(lǐng)域的仿真平臺,該過程主要是模擬實際工業(yè)過程[17-18]。TE 過程如圖11 所示,包括5 個主要操作單元,該過程將4 種反應(yīng)物送入反應(yīng)器,產(chǎn)生2 種產(chǎn)物和1 種副產(chǎn)物。
圖11 TE 過程
本節(jié)中仿真數(shù)據(jù)由TE 仿真器使用模態(tài)1 生成。將TE 仿真器中時間參數(shù)設(shè)置為10 h,采樣周期為0.01 h。在該過程中,采集了1 000 個正常樣本作為訓(xùn)練數(shù)據(jù)。對于測試數(shù)據(jù),收集28 個故障數(shù)據(jù)集,每個數(shù)據(jù)集1 000 個樣本,所有故障都是在第300 個樣本后引入。
對于在線故障檢測,本節(jié)中ICA 和DICA 按照文獻[8]負熵規(guī)則選取2 個獨立分量。在本文方法中,通過交叉驗證確定窗寬選取為75,步長選取為1。其中,DICA 和DICA-DISSIM 中的時滯參數(shù)l選取1,對第12 組測試數(shù)據(jù)集分別使用ICA、DICA 和DICA-DISSIM 方法進行測試,檢測結(jié)果分別如圖12~14 所示。通過比較4 種方法的檢測結(jié)果,可以得到本文方法能檢測出故障12 的發(fā)生,并且本文方法的故障檢測率最高。表1 給出了每組測試數(shù)據(jù)使用ICA、DICA、動態(tài)主成分分析(dynamic principal component analysis, DPCA)和DICA-DISSIM 方法進行故障檢測的結(jié)果。
表1 TE 過程中各方法的故障檢測率
圖12 ICA 故障檢測結(jié)果
圖13 DICA 故障檢測結(jié)果
圖14 本文方法故障檢測結(jié)果
使用本文方法對故障5 進行診斷。如圖15所示,前50 個變量是樣本當(dāng)前時刻的變量,后50 個變量是樣本前一時刻的變量。從圖15 可以看出,變量50 的貢獻最大。如圖16 所示,變量50 在第300 個樣本之后出現(xiàn)震蕩。對故障15 進行診斷,如圖17 所示,變量9、22 和49 貢獻較高。另外,從圖18 可以看出變量9、22 和49 在第300 個樣本之后出現(xiàn)了較大的偏移。綜上所述,故障5 和故障15 的診斷結(jié)果與實際相符,驗證了所提診斷策略的正確性。
圖15 故障5 的貢獻圖
圖16 故障5 的變量50
圖17 故障15 的貢獻圖
圖18 故障15 的變量9,22,49
經(jīng)上述分析,本文提出方法在動態(tài)過程監(jiān)控中具有更好的檢測性能。
針對動態(tài)獨立元分析在動態(tài)過程中捕獲的獨立分量存在自相關(guān)性和統(tǒng)計量漏報的問題,提出一種基于DICA 相異性分析的故障檢測與診斷方法。該方法通過DICA 與相異指數(shù)結(jié)合,能夠有效處理上述問題。本文通過動態(tài)數(shù)值例子和田納西-伊斯曼過程進行仿真測試,仿真結(jié)果表明所提方法相對于ICA 和DICA 有效提高了故障檢測率。
本文方法在動態(tài)過程的故障檢測中效果較好,接下來可以研究的方向是在非線性動態(tài)過程中,獨立元空間引入相異指數(shù)是否有效,能否處理非線性動態(tài)數(shù)據(jù)。