張曉玲, 曹玉蘋, 鄧曉剛
(1.中國石油大學 勝利學院, 山東 東營 257097;2.中國石油大學(華東) 控制科學與工程學院, 山東 青島 266580)
間歇生產方式在現代工業(yè)界所占比重越來越高,其過程監(jiān)控和故障診斷也引起廣泛關注[1]。長期以來,過程監(jiān)控的主流統(tǒng)計方法[2-5]如主元分析(principal component analysis, PCA)、偏最小二乘(partial least squares, PLS)、獨立元分析(independent component analysis, ICA)、典型相關分析(canonical correlation analysis, CCA)等在應用于間歇過程故障診斷時,都是采用將三維多批次歷史數據展開成二維的多向(multi-way)處理方法,即使針對間歇過程的不同特點涌現出一系列改進算法[6-14],也大都對數據進行展開處理,如按批次展開、按變量展開成二維矩陣的方式等。此類多向展開的處理方法將三維多批次數據中每一批次的二維矩陣展開變成向量看待,勢必會破壞原有數據的相關性,導致部分信息的丟失和特征不完全提取。
近年來,一些基于張量的數據降維方法,如張量PCA (tensor PCA, TPCA)[15-16]、張量鄰域保持嵌入算法(tensor neighborhood preserving embedding, TNPE)[17]等,使用張量模式的特征提取方法對張量形式的數據進行特征提取,保證了張量形式的特征空間不被破壞,張量分析逐漸在計算機視覺、圖像處理、模式識別等領域成為研究熱點[18]。本文借鑒以上方法中張量分析的思想,對間歇過程在線監(jiān)控時,將三維數據的每一批次看作一個二階張量,應用TPCA算法對三維數據直接提取特征信息,不破壞三維樣本中每一批次的原始矩陣空間結構,并定義R2統(tǒng)計量和SPE統(tǒng)計量建立故障檢測模型;另外,為能更及時檢測出間歇過程中常出現的漸變故障(如間歇精餾過程中催化劑活性的緩慢變化、間歇反應釜換熱器由于長時間使用結垢現象越來越嚴重而導致換熱性能的逐漸下降),本文利用累積和控制圖(cumulative sum,CUSUM)分析思想,將其應用于 TPCA算法中,提出累加和的張量主元分析(summed tensor principal component analysis, STPCA),將三維歷史數據按一定的滑動窗口累加求和,累積歷史信息,再做TPCA算法處理,建立故障檢測模型,從而提高對漸變故障在初始出現階段檢測的靈敏度。
可通過以下迭代方法實現式(1)中U、V的求解:
Step2:設置循環(huán)變量n初始值為1,進入循環(huán)迭代運算。
Step4:對CY1進行特征值分解得到特征值矩陣Λ和特征向量矩陣Vn+1,只選取前J'個最大的特征值組成,Vn+1則是由前J'個特征值對應的特征向量矩陣。
Step5:令Y2m=XmVn,求Y2的協方差陣
Step8:輸出最終的U∈RK×K'、V∈RJ×J'。
圖1 三維數據預處理Fig.1 Schematic diagram of three-way dataset preprocessing
注意,TPCA變換處理的數據X是經過標準化處理的,其處理過程如圖1所示,第1步將初始數據展開成大小為M×KJ的二維矩陣,沿著每列進行均值為0方差為1的歸一化處理,第2步再恢復成三維結構數據X(M×K×J)。此處的展開僅用于數據的預處理,應用TPCA變換時使用的仍是三維矩陣X(M×K×J)。因此,預處理后的三維數據X(M×K×J)通過以上Step1~8的迭代算法獲得U和V后,經過映射公式Ym=UTXmV,則可被投影到低維張量特征空間得到Y(M×K'×J' ) = {Ym∈K'×J',m= 1,2,… ,M}。
各類間歇過程中的漸變故障很常見,漸變故障是某變量操作值緩慢偏離正常變化區(qū)間、不斷累積的過程,故障初期變化量較小,很多故障檢測方法對該類故障存在預報大大延遲的問題。為提高檢測故障靈敏度,本文利用PAGE等[19]提出的累積和(CUSUM)控制圖思想,提出一種基于累加和的張量主元分析算法(STPCA),將經過預處理后的正常批次數據X(M×K×J)按照每批次內滑動窗口大小進行歷史信息的疊加,數據處理公式如下:
summed_xm(k)表示第m批次中按照式(2)累加和后的第k采樣時刻觀測值,h為累加求和的寬度,構成移動的滑動窗口,當k>h,每一時刻的數據值都由前h個多變量樣本求和得到,從而得到求和后的summed_X(M×K×J) = { summed_Xm∈RK?RJ,m= 1 ,2,…,M},然后用第1節(jié)中TPCA算法對其進行特征提取,求得變換矩陣U和V,為下一步故障診斷打下基礎。
在線監(jiān)控過程主要包含2個階段。
第1階段:離線模型的建立
② 對X(M×K×J)按式(2)進行累加和處理,獲得summed_X(M×K×J)。
③ 運用 TPCA算法,確定投影矩陣U∈RK×K'和V∈RJ×J',計算經過投影后的低維張量特征空間數據Y={Ym∈RK'?RJ',m= 1,2,… ,M} ,Ym是累加和處理后summed_Xm的低維投影,變換公式為:Ym=UT* s ummed_Xm*V。
④ 建立故障檢測模型。
對基于TPCA和STPCA 2種算法的間歇過程故障檢測,本文都采用 R2和SPE統(tǒng)計量。
R2是基于支持向量數據域描述(support vector domain description,SVDD)[20]方法建立的統(tǒng)計量,表示每批次Xm的投影Ym到特征空間中心的距離,其計算式如下[21]:
拉格朗日乘子iα通過下式的最大化問題求解[21]:
C為懲罰因子,可取1。
SPE統(tǒng)計量用來測量殘差空間的變化。先通過U、V重構summed_Xm的估計值,得到殘差矩陣從而得SPE統(tǒng)計量的計算式:
R2和SPE統(tǒng)計量皆可通過核密度估計法[22]確定各自95% 或99% 的置信限(也稱控制限、閾值),在每個采樣時刻k分別利用核密度估計法計算對應采樣點所有批次統(tǒng)計量的閾值,因此可得到動態(tài)變化的控制限,當統(tǒng)計量超出各自控制限所判定的正常變化范圍,則意味著故障的出現。
第2階段:在線故障檢測
①采集新批次第k采樣時刻數據根據離線建模標準化處理時得到的均值和方差進行預處理。
②對預處理后的數據xnew,k按照式(2)進行累加求和處理,得到 s ummed_xnew,k。
③計算新的投影矩陣和殘差:
其中uk表示矩陣U中的第k行向量。
④參考式(3)和(5)分別計算新的在線2R和SPE統(tǒng)計量,得到
并判斷統(tǒng)計量是否偏離各自閾值,以確定間歇過程運行狀況。
分批補料的盤尼西林發(fā)酵過程是典型的間歇式生產過程,本文基于BIROL等[23]開發(fā)的標準仿真軟件Pensim 2.0產生的盤尼西林發(fā)酵數據進行在線監(jiān)控算法仿真研究。本仿真由該軟件在正常操作范圍內對初始條件加入一定的微小偏移和適當噪聲生成30批次數據作為訓練樣本,每批次含11個觀測變量,反應時間相等,均為400 h,采樣間隔為0.5 h,從而得到用于建立MPCA、TPCA、STPCA監(jiān)控模型。另外,利用Pensim2.0產生6個故障批次,表1是3種跳變故障,表2是漸變類型故障。
表1 跳變故障Table 1 Step faults used for detection
表2 漸變故障Table 2 Gradual faults used for detection
建模時,3種方法都需要對數據進行標準化,不同的是,MPCA方法如圖1中Step 1按批次展開成二維,按列作歸一化處理,得到二維矩陣X(30×8800),即X(M×KJ),在此基礎上建立MPCA模型。TPCA和STPCA算法則需將標準化后的二維矩陣X(30×8800)再按圖1中Step 2還原成X(30× 8 00×11),在保持和不破壞原來每批次數據結構基礎上建立各自的監(jiān)控模型。因此,傳統(tǒng)PCA算法會把每批次的數據Xm∈RK?RJ轉換為向量xm∈RKJ看待,特征值分解的矩陣大小是KJ×KJ,基于張量的 TPCA方法其特征值分解的矩陣大小僅為K×K或J×J,在特征值分解計算復雜度上要更低。另外,STPCA相比TPCA方法在數據處理上多一步累加和處理,以增大對漸變故障檢測的靈敏度。最后的監(jiān)控模型所用到統(tǒng)計量也有差異:MPCA使用T2和SPE,TPCA和STPCA則運用本文定義的 R2和SPE統(tǒng)計量。
圖2 基于MPCA方法的故障1檢測結果Fig.2 Fault 1 detection results based on MPCA
圖3 基于TPCA方法的故障1檢測結果Fig.3 Fault 1 detection results based on TPCA
圖4 基于MPCA方法的故障2檢測結果Fig.4 Fault 2 detection results based on MPCA
當新批次中出現故障 1、2、3跳變故障時,基于 MPCA的在線故障檢測結果如圖2、4、6所示,MPCA的SPE統(tǒng)計量能準確預報故障的發(fā)生(140~300采樣點),但在非故障時段有較高誤報,從圖中可明顯看到有多點超出控制限,特別是對故障3達到了5.12% 的誤報率(見表3)。相對而言,圖3、5、7所示TPCA故障檢測結果中,SPE統(tǒng)計圖既能準確檢出故障,又具有較低誤報率,由表3可見,對前兩個故障的誤報率為0,僅對故障3有約1.63% 的誤報,但仍低于MPCA方法的結果。與SPE統(tǒng)計量相比,MPCA方法的T2統(tǒng)計圖檢測效果較差,只能對故障1有效,對故障2和3完全不敏感,無任何超限警報;反觀TPCA方法的 R2統(tǒng)計圖,在采樣點140~300僅無法檢測出故障3,能完全準確檢測到故障2,對故障1僅有少量點的漏報。從誤報率情況分析,TPCA的 R2統(tǒng)計量也優(yōu)于MPCA的T2統(tǒng)計量??傮w分析,TPCA兩種統(tǒng)計圖對3個故障的檢出率高于 MPCA方法,且具有較低的誤報率??梢姡瑢⒗脧埩糠纸庵苯犹幚砣S數據的TPCA方法引入到間歇過程故障檢測中,構造 R2和SPE統(tǒng)計量進行實時監(jiān)控是可行并具有一定效果的。
表3 MPCA和TPCA方法的故障檢測誤報率對比Table 3 Comparison of false positive rates (FPR) by MPCA and TPCA
圖5 基于TPCA方法的故障2檢測結果Fig.5 Fault 2 detection results based on TPCA
圖6 基于MPCA方法的故障3檢測結果Fig.6 Fault 3 detection results based on MPCA
圖7 基于TPCA方法的故障3檢測結果Fig.7 Fault 3 detection results based on TPCA
為提高檢測漸變故障的靈敏度,本文在TPCA基礎上提出基于STPCA的間歇過程故障診斷方法,同樣使用 R2和SPE統(tǒng)計圖進行故障分析。仿真實驗設置了表2所述3種故障,分別是通風速率、攪拌功率、底物流加速率從第200采樣點以一定速度呈現斜坡變化,模擬間歇過程中可能出現的漸變類故障。圖8到圖13反映了MPCA、STPCA方法對3個故障批次的檢測效果。
從圖8、10和12所示結果觀察,MPCA的T2和SPE統(tǒng)計量均在一定時刻越過閾值不斷增加,表明漸變型故障的發(fā)生;同樣,圖9、11、13中STPCA方法的統(tǒng)計結果圖也給出了故障警報。但明顯的是,兩種方法的SPE統(tǒng)計圖比基于得分的T2和基于特征空間的 R2統(tǒng)計量趨于更靈敏,給出故障預報要早。為直觀對比不同方法的檢測效果優(yōu)劣,本文通過表4列出兩種方法各統(tǒng)計量所確定的故障出現時刻,并假設統(tǒng)計量連續(xù)8個采樣點超過控制限則認定該采樣時刻為故障檢測點。對比SPE統(tǒng)計量,針對漸變故障4、5、6,STPCA分別領先MPCA方法9個、28個、30個采樣點提前給出故障指示;STPCA的2R統(tǒng)計圖檢測故障的能力雖遜于SPE統(tǒng)計量,卻仍比MPCA的2T統(tǒng)計量分別早117、336、56個采樣時刻超出控制限。綜合看來,兩種方法檢測漸變故障時,相對故障實際發(fā)生時刻都有或多或少的滯后,原因在于故障變量剛開始是緩慢變化的,偏離正常范圍需要一定的時間間隔,只有當變量值漸漸漂移累積超出一定量后,監(jiān)測系統(tǒng)才能判斷過程出現了非正常的變化。但STPCA方法將歷史批次數據進行疊加處理,放大故障變量的初始偏移,并在張量空間進行特征值分解、不破壞原有數據結構基礎上得到監(jiān)控統(tǒng)計量,結合以上結果圖和表4,不難看出該方法能更早檢測出漸變故障,體現該方法的優(yōu)越性。
圖8 基于MPCA方法的故障4檢測結果Fig.8 Fault 4 detection results based on MPCA
圖9 基于STPCA方法的故障4檢測結果Fig.9 Fault 4 detection results based on STPCA
圖10 基于MPCA方法的故障5檢測結果Fig.10 Fault 5 detection results based on MPCA
圖11 基于STPCA方法的故障5檢測結果Fig.11 Fault 5 detection results based on STPCA
圖12 基于MPCA方法的故障6檢測結果Fig.12 Fault 6 detection results based on MPCA
圖13 基于STPCA方法的故障6檢測結果Fig.13 Fault 6 detection results based on STPCA
表4 MPCA和STPCA檢出的故障發(fā)生采樣點Table 4 Fault sampling points based on MPCA and STPCA
需要說明的是,STPCA方法更適用于漸變故障存在的場合,尤其是故障出現早期,通過CUSUM累積過程中的微小變化,提高對漸進、緩慢變化類故障初期較小故障偏移的檢測。同時,該方法中累加求和寬度h的取值與檢測效果關系密切,若h取值太小,利用 CUSUM 累積的歷史信息不夠豐富,對漸變故障出現初期檢測準確率會較低,反之一味追求快速檢測出故障而將h取得過大,會因帶入部分噪聲信息而增加誤報率,導致故障檢測效果下降。目前總體上,h大小的選擇沒有統(tǒng)一標準,多是根據經驗或交叉驗證方法確定。本文通過反復試驗,選擇適當的h值,既能提高對漸變故障的檢出率,較早發(fā)出故障報警,又防止出現較高誤報的情況。另外,STPCA算法在故障檢測時,對新批次數據引入CUSUM的處理,不可避免會產生故障檢測延時,因此,本方法并不適用于故障檢測實時性要求較高的場合。
傳統(tǒng)將三維數據變成二維的間歇過程故障診斷方法,破壞數據原有的空間結構和相關特性,必然會對過程監(jiān)控效果產生不利影響。本文將基于張量分解的TPCA算法引入到間歇過程監(jiān)控中,直接將三維數據作為張量目標進行運算,保留了數據完整性,定義2R 和SPE統(tǒng)計量建立故障檢測模型。經仿真驗證,基于TPCA的間歇過程故障診斷方法適合檢測突變故障,檢測效果較好。針對間歇過程中常發(fā)生的漸變故障,本文提出STPCA方法,通過對三維數據多個連續(xù)時刻的采樣值求和,不斷放大歷史信息,同時又保證不破壞三維原始數據結構,因此在檢測漸變類型故障的仿真實驗中,STPCA方法有更好效果,提高故障檢測靈敏度,相應降低了漏檢率。
符號說明: