高學(xué)金, 孟令軍, 王 豪, 高慧慧
基于分步時(shí)空J(rèn)ITL-MKPLS的間歇過(guò)程故障監(jiān)測(cè)
高學(xué)金1,2,3,4, 孟令軍1,2,3,4, 王 豪1,2,3,4, 高慧慧1,2,3,4
(1. 北京工業(yè)大學(xué) 信息學(xué)部, 北京 100124; 2. 數(shù)字社區(qū)教育部工程研究中心, 北京 100124;3. 城市軌道交通北京實(shí)驗(yàn)室, 北京 100124; 4. 計(jì)算智能與智能系統(tǒng)北京市重點(diǎn)實(shí)驗(yàn)室, 北京 100124)
針對(duì)多階段時(shí)變的間歇過(guò)程難以用全局模型準(zhǔn)確描述生產(chǎn)過(guò)程的動(dòng)態(tài)變化及傳統(tǒng)局部建模每個(gè)工作點(diǎn)都需要重新篩選樣本建模導(dǎo)致計(jì)算量較大的問(wèn)題,提出一種分步時(shí)空即時(shí)學(xué)習(xí)的局部建模策略。采用仿射傳播(AP)聚類(lèi)的方式對(duì)歷史數(shù)據(jù)樣本集中的數(shù)據(jù)進(jìn)行初步分類(lèi),在當(dāng)前輸入樣本數(shù)據(jù)到達(dá)后,確定當(dāng)前樣本數(shù)據(jù)所屬的類(lèi)別,在此類(lèi)別所限定的子數(shù)據(jù)樣本集中使用時(shí)間和空間相結(jié)合的即時(shí)學(xué)習(xí)策略確定出局部相似樣本,建立多向核偏最小二乘監(jiān)測(cè)模型。將該算法在青霉素發(fā)酵仿真數(shù)據(jù)和大腸桿菌發(fā)酵過(guò)程生產(chǎn)數(shù)據(jù)上進(jìn)行驗(yàn)證,結(jié)果表明,所提方法不僅減少了不必要的計(jì)算量,還能夠更加精準(zhǔn)即時(shí)地進(jìn)行故障監(jiān)測(cè)。
時(shí)空即時(shí)學(xué)習(xí);分步;多向核偏最小二乘;局部建模;故障監(jiān)測(cè)
間歇過(guò)程作為現(xiàn)代工業(yè)過(guò)程中極其重要的一種生產(chǎn)方式,已經(jīng)被廣泛應(yīng)用于醫(yī)藥、食品、生物化工、半導(dǎo)體等多品種、高附加值產(chǎn)品的生產(chǎn)中[1]。但是在實(shí)際過(guò)程中,由于設(shè)備老化和外在環(huán)境突變等一系列問(wèn)題,故障時(shí)有發(fā)生。因此,對(duì)間歇過(guò)程進(jìn)行故障監(jiān)測(cè)對(duì)于保證生產(chǎn)過(guò)程的安全以及提高產(chǎn)品質(zhì)量變得至關(guān)重要[2]。
多路主成分分析(MPCA)和多路偏最小二乘(MPLS)通過(guò)將三維歷史數(shù)據(jù)首先展開(kāi)為二維矩陣再使用主成分分析(PCA)或偏最小二乘(PLS)方法對(duì)得到的二維矩陣進(jìn)行分析,在間歇過(guò)程的故障監(jiān)測(cè)領(lǐng)域得到廣泛的應(yīng)用[3-5]。然而,由于工業(yè)過(guò)程變量絕大多數(shù)是非線性的,而PLS假設(shè)監(jiān)測(cè)數(shù)據(jù)是線性的,因此不能很好地滿足于工業(yè)實(shí)踐。為了解決這個(gè)問(wèn)題,Rosipal等[6]將核技巧與PLS結(jié)合提出了一種核PLS(KPLS)算法,該算法可以有效解決監(jiān)測(cè)數(shù)據(jù)的非線性問(wèn)題[7-8]。但是傳統(tǒng)的基于KPLS的監(jiān)測(cè)方法是對(duì)整個(gè)過(guò)程建立全局模型,而對(duì)于多階段時(shí)變的間歇過(guò)程[9],建立單一的全局模型通常難以精確描述動(dòng)態(tài)過(guò)程的變化特性。因此,將整個(gè)運(yùn)行過(guò)程劃分為多個(gè)階段區(qū)域,再在每個(gè)區(qū)域內(nèi)建立局部模型顯得尤為重要。過(guò)程在不斷變化,模型需要不斷地更新來(lái)適應(yīng)過(guò)程的變化,從而才能更準(zhǔn)確地分析新樣本。為了建立局部模型,即時(shí)學(xué)習(xí)(just-in-time-learning,JITL)策略近期被提出并被廣泛應(yīng)用于過(guò)程建模和監(jiān)控[10-11]。已有學(xué)者在局部建模方面做出了貢獻(xiàn),Liu等[12]提出即時(shí)遞推核學(xué)習(xí)(just-in-time kernel learning)方法,通過(guò)構(gòu)造累積相似度因子,選擇相似的樣本集建立核學(xué)習(xí)辨識(shí)模型,但是,根據(jù)數(shù)據(jù)樣本間的空間歐氏距離和角度信息來(lái)選擇學(xué)習(xí)集,而忽略了數(shù)據(jù)的時(shí)間特性;Chen等[13]提出一種應(yīng)用遺忘因子以降低在線JITL選擇數(shù)據(jù)量的方法,Hu等[14-16]采用一系列滑動(dòng)窗以及自適應(yīng)相似性度量改進(jìn)傳統(tǒng)JITL,盡管這些方法可以減小模型的計(jì)算負(fù)擔(dān),但是,這些方法有可能使部分歷史數(shù)據(jù)丟失,而且遺忘因子或者窗口寬度的調(diào)整也存在問(wèn)題。
在基于即時(shí)學(xué)習(xí)[17-18]的建模方法中,最為關(guān)鍵的是用以建立局部模型的學(xué)習(xí)集的選取。傳統(tǒng)的即時(shí)學(xué)習(xí)算法一般根據(jù)數(shù)據(jù)樣本間的空間歐氏距離和角度信息選擇學(xué)習(xí)集,而不考慮數(shù)據(jù)的時(shí)間特性,因此當(dāng)有異常數(shù)據(jù)出現(xiàn)時(shí),就可能出現(xiàn)模型偏移的問(wèn)題,同時(shí),在進(jìn)行局部建模時(shí),對(duì)每個(gè)工作點(diǎn)都重新進(jìn)行局部建模,建模計(jì)算量較大,耗時(shí)較長(zhǎng),模型輸出的即時(shí)性也會(huì)受到影響。針對(duì)以上2個(gè)問(wèn)題,本文提出一種分步的時(shí)空即時(shí)學(xué)習(xí)算法:首先,采用仿射傳播(affinity propagation, AP)聚類(lèi)[19]用于分析經(jīng)過(guò)展開(kāi)及標(biāo)準(zhǔn)化的歷史數(shù)據(jù),計(jì)算出相對(duì)能夠代表普通歷史數(shù)據(jù)的聚類(lèi)中心。在線監(jiān)測(cè)階段,計(jì)算采集到的當(dāng)前時(shí)刻的數(shù)據(jù)與聚類(lèi)中心的關(guān)系,并對(duì)歷史數(shù)據(jù)進(jìn)行初步篩選;之后用融入時(shí)間特性[20]的時(shí)空J(rèn)ITL方法從這些初步篩選的數(shù)據(jù)中進(jìn)一步進(jìn)行精選以取得更精確的歷史數(shù)據(jù);最后,采用(multiway kernel partial least square, MKPLS)算法與選擇的這些數(shù)據(jù)建立局部模型,并對(duì)當(dāng)前的過(guò)程進(jìn)行實(shí)時(shí)監(jiān)測(cè)。
PLS作為一種分析輸入變量空間和輸出變量空間的相互關(guān)系多元回歸算法[21-22],能夠很好地將線性數(shù)據(jù)間的潛在特征提取出來(lái),但是當(dāng)這些數(shù)據(jù)是非線性時(shí),由于PLS的固有線性,很難顯示出優(yōu)越性。為了解決非線性問(wèn)題,核方法被引入到PLS算法中,它通過(guò)構(gòu)造一個(gè)投影將原始空間中的數(shù)據(jù)投影到高維空間降低數(shù)據(jù)整體的非線性。
輸出數(shù)據(jù)的預(yù)測(cè)值為
此外,在建立KPLS模型之前,通常還需要對(duì)核矩陣進(jìn)行中心化處理。
分布?xì)v史數(shù)據(jù)樣本選擇策略的思想是保持模型精確度與一般算法處在相同水平的前提下,降低計(jì)算量需求,保留對(duì)全部歷史數(shù)據(jù)進(jìn)行篩選的可能性。在傳統(tǒng)JITL方法應(yīng)用的階段,需要對(duì)歷史數(shù)據(jù)中每一個(gè)樣本進(jìn)行相似度的計(jì)算,然而這樣的計(jì)算在一個(gè)具有個(gè)數(shù)據(jù)樣本的歷史數(shù)據(jù)中需要進(jìn)行次。所提出的方法可以分為3步,即離線準(zhǔn)備階段、初步在線篩選階段、在線精選階段。首先,離線準(zhǔn)備階段需要利用AP聚類(lèi)方法取得歷史樣本的聚類(lèi)中心,以供在線階段使用;第2步,對(duì)新采集到的當(dāng)前樣本向量同初步篩選階段得到的聚類(lèi)中心計(jì)算新的隸屬關(guān)系。最后,一個(gè)相關(guān)子數(shù)據(jù)集被選擇出來(lái),并進(jìn)行在線精選之后這一組更小規(guī)模的數(shù)據(jù)會(huì)被用于局部的KPLS建模過(guò)程當(dāng)中。這種方法尋找共同的基準(zhǔn)點(diǎn),從傳統(tǒng)的大量的互為相對(duì)基準(zhǔn)點(diǎn)計(jì)算轉(zhuǎn)變?yōu)閷?duì)有限個(gè)獨(dú)立基準(zhǔn)點(diǎn)進(jìn)行的計(jì)算,從與全部歷史樣本進(jìn)行對(duì)比到只與幾個(gè)樣本進(jìn)行對(duì)比,因而在一定程度上可以減小算法的計(jì)算時(shí)間。
AP聚類(lèi)是基于數(shù)據(jù)點(diǎn)間的“信息傳遞”的一種聚類(lèi)算法,最大的優(yōu)勢(shì)是不需要在運(yùn)行算法之前人為指定聚類(lèi)的個(gè)數(shù),而經(jīng)典的K-means方法、模糊C均值(fuzzy c-means,F(xiàn)CM)方法都需要依據(jù)經(jīng)驗(yàn)事先人為指定聚類(lèi)個(gè)數(shù),帶有明顯的人為因素,因而聚類(lèi)的結(jié)果并不能保證真實(shí)有效,也無(wú)法反映實(shí)際生產(chǎn)過(guò)程的階段特性。AP聚類(lèi)算法將全部樣本點(diǎn)看作網(wǎng)絡(luò)的節(jié)點(diǎn),自動(dòng)地找尋具有代表性的聚類(lèi)中心,使得所有樣本點(diǎn)到最近的類(lèi)代表點(diǎn)的相似度之和最大[23]。
AP算法定義了吸引度信息矩陣和歸屬度信息矩陣:()表示從到的消息,描述的是樣本對(duì)象適合作為樣本對(duì)象的聚類(lèi)中心的程度;相反地,()表示從到的消息,描述的是樣本對(duì)象選擇樣本對(duì)象作為其據(jù)聚類(lèi)中心的適合程度。AP算法進(jìn)行交替2個(gè)信息傳遞的步驟,以更新2個(gè)矩陣。
首先,吸引信息r1()按照式(4)迭代。
在進(jìn)行迭代時(shí),如果迭代次數(shù)超過(guò)設(shè)定的最大值或者當(dāng)聚類(lèi)中心在若干次迭代中不發(fā)生改變時(shí)停止計(jì)算并確定類(lèi)中心及各類(lèi)的樣本點(diǎn)。
JITL是一種局部建模思想,主要目的是從歷史數(shù)據(jù)庫(kù)中選取與當(dāng)前數(shù)據(jù)對(duì)應(yīng)的最相似的歷史采樣,而全局建模利用的是歷史數(shù)據(jù)庫(kù)中的全部數(shù)據(jù)。因而利用JITL策略選擇相似樣本建模,最大的優(yōu)勢(shì)是可以提高模型的精度。傳統(tǒng)的即時(shí)學(xué)習(xí)策略在從包含歷史信息的數(shù)據(jù)庫(kù)中選擇相似樣本,并構(gòu)造學(xué)習(xí)集時(shí)采用的是基于歐氏距離和角度信息的相似度計(jì)算方法,相似度大小可以直接反映出和的靠近程度,選擇建模數(shù)據(jù)時(shí)按照相似度由大到小依次選取若干數(shù)據(jù),如式(7)所示:
傳統(tǒng)的即時(shí)學(xué)習(xí)算法一般根據(jù)數(shù)據(jù)樣本間的空間距離進(jìn)行學(xué)習(xí)集的選擇,而不考慮數(shù)據(jù)的時(shí)間特性。在間歇生產(chǎn)過(guò)程中,設(shè)備特性、生產(chǎn)狀況等會(huì)隨時(shí)間發(fā)生變化,導(dǎo)致測(cè)量的數(shù)據(jù)在時(shí)間維度上顯示出差異,因此在選取學(xué)習(xí)集的時(shí)候有必要考慮數(shù)據(jù)的時(shí)間特性。因此本文借鑒牛大鵬等[20]的方法將數(shù)據(jù)的時(shí)間特性加入即時(shí)學(xué)習(xí)算法的相似度計(jì)算公式中,用于局部模型的建立。
融入時(shí)間特性的即時(shí)學(xué)習(xí)需要確定時(shí)間權(quán)重,首先假定所選擇的學(xué)習(xí)集的時(shí)間權(quán)向量為
為了充分反映樣本中權(quán)重包含的信息程度,定義一個(gè)時(shí)間權(quán)向量的熵w,如式(10)所示。熵是度量信息大小的一個(gè)指標(biāo)。熵值越大,則數(shù)據(jù)所含信息量越小。時(shí)間權(quán)向量的熵反映了對(duì)樣本的集結(jié)過(guò)程中權(quán)重包含信息的程度。
為了反映樣本中不同時(shí)段數(shù)據(jù)的權(quán)重差異,定義一個(gè)時(shí)間度,取值在0到1之間,如式(11)所示。即=0.1時(shí),表明越注重距離當(dāng)前工作點(diǎn)較近的數(shù)據(jù);當(dāng)=0.5時(shí),說(shuō)明同樣重視所有時(shí)期數(shù)據(jù);當(dāng)=0.9時(shí),表明越注重遠(yuǎn)期的數(shù)據(jù)。
本文中時(shí)間度根據(jù)賦值規(guī)則選取,的確定既要充分考慮主觀的專(zhuān)家經(jīng)驗(yàn)知識(shí),也要兼顧時(shí)間樣本點(diǎn)本身所包含的客觀信息,所以的確定可轉(zhuǎn)化為式(12)所示的非線性規(guī)劃問(wèn)題。
綜上,基于時(shí)間和空間相結(jié)合的JITL學(xué)習(xí)集選取規(guī)則為
式中:為可以調(diào)節(jié)的參數(shù)。若輸入樣本x波動(dòng)較小時(shí)可以選取較大的值;反之,則可以選取較小的值。
間歇過(guò)程的數(shù)據(jù)一般呈三維矩陣,本文針對(duì)間歇過(guò)程的數(shù)據(jù)特性選取一種基于分步時(shí)空J(rèn)ITL-MKPLS 算法進(jìn)行故障監(jiān)測(cè)。在利用本文所提的分布時(shí)空J(rèn)ITL算法從歷史樣本選擇出與在線樣本相似的樣本后,采用MKPLS算法對(duì)篩選出的樣本進(jìn)行建模,采用Hotelling的T2統(tǒng)計(jì)量和SPE統(tǒng)計(jì)量作為監(jiān)測(cè)指標(biāo),判斷在線樣本點(diǎn)是否發(fā)生故障。T2統(tǒng)計(jì)量和SPE統(tǒng)計(jì)量定義如下:
本文提出的基于分步時(shí)空J(rèn)ITL-MKPLS的間歇過(guò)程如圖1所示,具體建模步驟如下:
圖1 分步時(shí)空J(rèn)ITL-MKPLS監(jiān)測(cè)流程圖
1) 歷史批次數(shù)據(jù)采集,包括測(cè)量變量數(shù)據(jù)和相應(yīng)的已經(jīng)測(cè)量得到的質(zhì)量變量數(shù)據(jù);
2) 將數(shù)據(jù)沿變量方向展開(kāi)并進(jìn)行標(biāo)準(zhǔn)化,記錄方差與均值;
3) 對(duì)已得到的展開(kāi)數(shù)據(jù)運(yùn)用AP聚類(lèi)算法,得到對(duì)應(yīng)的聚類(lèi)中心,聚類(lèi)個(gè)數(shù);
4) 在線監(jiān)控一新批次數(shù)據(jù),設(shè)當(dāng)前新采樣序號(hào)為,利用相同的展開(kāi)方式對(duì)該數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,方差及均值則采用歷史數(shù)據(jù)中的方差與均值;
5)選擇與最相似的類(lèi)作為初步建模數(shù)據(jù)fir;
6) 應(yīng)用時(shí)空J(rèn)ITL策略計(jì)算對(duì)應(yīng)初步歷史數(shù)據(jù)fir的相似度,精選出符合要求的第二步建模數(shù)據(jù)sec,其對(duì)應(yīng)采樣點(diǎn)的質(zhì)量數(shù)據(jù)記為sec;
7) 對(duì)所選的相似樣本進(jìn)行核計(jì)算,得到核矩陣;
8) 將和作為KPLS運(yùn)算的輸入,得到相應(yīng)的得分矩陣和,計(jì)算監(jiān)測(cè)模型的監(jiān)測(cè)限;
10) 對(duì)核向量進(jìn)行中心化和歸一化:
式中:1為值均為1/的1′維矩陣,1為值均為1/的′維矩陣,為平均中心核矩陣。
11) 對(duì)于新樣本,計(jì)算得分向量:
式中:為對(duì)應(yīng)的得分矩陣,為對(duì)應(yīng)的得分矩陣。
12) 計(jì)算在線樣本的T2和SPE統(tǒng)計(jì)量,判斷在線樣本的統(tǒng)計(jì)量是否超限。
青霉素發(fā)酵過(guò)程是一個(gè)典型的動(dòng)態(tài)、非線性、多相間歇過(guò)程。本文采用伊利諾伊理工學(xué)院開(kāi)發(fā)的用于青霉素發(fā)酵的仿真平臺(tái)進(jìn)行實(shí)驗(yàn),它可以對(duì)不同操作條件下青霉素生產(chǎn)過(guò)程的微生物濃度、CO2濃度、pH值、青霉素濃度、氧濃度以及產(chǎn)生的熱量等進(jìn)行仿真。實(shí)驗(yàn)中每批的整個(gè)持續(xù)時(shí)間為400 h,采樣間隔選擇為1 h。為了檢驗(yàn)該算法對(duì)故障監(jiān)測(cè)的有效性,本文選擇10個(gè)過(guò)程變量1、2、2345678910和2個(gè)質(zhì)量變量1、2構(gòu)建統(tǒng)計(jì)模型,變量名稱如表1所示,設(shè)計(jì)了30批正常數(shù)據(jù)樣本用于建模,一批額外正常數(shù)據(jù)和兩批故障批次用于測(cè)試。其中選擇30批正常數(shù)據(jù)的三維數(shù)據(jù)矩陣為30×10×400和30×2×400。為了更接近實(shí)際生產(chǎn)狀況,訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)均加入了1% 的噪聲。該案例的計(jì)算機(jī)配置為64位Windows并帶有8GB RAM和Intel(R) Core(TM) i5-3470 CPU,實(shí)驗(yàn)過(guò)程全程實(shí)時(shí)記錄算法消耗的時(shí)間。
表1 青霉素發(fā)酵過(guò)程主要變量
為了驗(yàn)證本文所提方法的有效性,本文選取正常樣本、突變的階躍故障和緩變的斜坡故障分別進(jìn)行監(jiān)測(cè)。通風(fēng)速率和攪拌功率的變化會(huì)影響溶解氧濃度、溫度等,最終會(huì)影響菌體濃度和青霉素的產(chǎn)物濃度,因此本實(shí)驗(yàn)選擇了這2個(gè)變量進(jìn)行故障設(shè)置,故障類(lèi)型、幅值和持續(xù)時(shí)間如表2所示。
表2 青霉素發(fā)酵過(guò)程故障類(lèi)型
為了驗(yàn)證算法的有效性,本文與傳統(tǒng)JITL-MKPLS進(jìn)行對(duì)比,在本文所設(shè)置的實(shí)驗(yàn)中,初步樣本篩選比率設(shè)置為10%,之后第2步精選過(guò)程中樣本容量設(shè)置為10個(gè)采樣點(diǎn)。AP聚類(lèi)算法最終給出的聚類(lèi)個(gè)數(shù)為3,分別為:(1-42)、(43-137)、(138-400)。如圖2所示為對(duì)正常批次生產(chǎn)過(guò)程的監(jiān)測(cè)效果,其中虛線為99%控制限。從圖2中可以看出,加入即時(shí)學(xué)習(xí)思想的MKPLS算法要比傳統(tǒng)的MKPLS算法監(jiān)測(cè)效果好,因?yàn)榘l(fā)酵過(guò)程數(shù)據(jù)具有一定的階段性和時(shí)變性,而即時(shí)學(xué)習(xí)是一種局部建模思想,因此可以彌補(bǔ)傳統(tǒng)MKPLS建立全局模型的劣勢(shì)。再對(duì)比圖2(a)和(c),傳統(tǒng)的JITL-MKPLS算法監(jiān)測(cè)指標(biāo)在整體上都接近控制限,在初始時(shí)刻及發(fā)酵后期都出現(xiàn)了誤報(bào),而本文所提的方法并沒(méi)有出現(xiàn)誤報(bào)現(xiàn)象。對(duì)比可以看出本文算法有更好的監(jiān)控性能。因?yàn)樵诎l(fā)酵過(guò)程中,生產(chǎn)狀況會(huì)隨著生產(chǎn)過(guò)程的進(jìn)行而改變,采取融入時(shí)間特性的選取規(guī)格從數(shù)據(jù)庫(kù)中選取數(shù)據(jù)集,可以使學(xué)習(xí)集的選取更加合理,從而提高建模的準(zhǔn)確性。
圖2 青霉素發(fā)酵過(guò)程正常批次監(jiān)測(cè)結(jié)果圖
如圖3所示為模型在200時(shí)刻引入6% 的通風(fēng)速率階躍故障的監(jiān)測(cè)結(jié)果圖。如圖4所示為模型在100時(shí)刻引入2%的攪拌功率斜坡故障的監(jiān)測(cè)結(jié)果圖,從圖中可以看出,采用同時(shí)考慮空間和時(shí)間的JITL策略所建立的模型比傳統(tǒng)的MKPLS和傳統(tǒng)的JITL-MKPLS更加精準(zhǔn),能夠更準(zhǔn)確地進(jìn)行故障監(jiān)測(cè)。尤其在生產(chǎn)開(kāi)始階段,各項(xiàng)指標(biāo)都不穩(wěn)定時(shí),本文所提出的方法誤報(bào)率都為0,在出現(xiàn)故障后,監(jiān)測(cè)到故障的時(shí)間也比傳統(tǒng)方法更短。同時(shí),由于采用了分步樣本篩選方法,所建立的模型在保證精度的前提下,計(jì)算時(shí)間也大大地縮短,詳細(xì)指標(biāo)如表3所示。
圖3 青霉素發(fā)酵過(guò)程通風(fēng)速率階躍故障監(jiān)測(cè)結(jié)果
大腸桿菌發(fā)酵過(guò)程的在線監(jiān)測(cè)實(shí)驗(yàn)數(shù)據(jù)是在工廠的真實(shí)生產(chǎn)環(huán)境中產(chǎn)生的,真實(shí)生產(chǎn)過(guò)程存在著人為操作等諸多不確定因素,對(duì)于算法研究更具有現(xiàn)實(shí)意義。
表3 青霉素發(fā)酵過(guò)程故障監(jiān)測(cè)指標(biāo)
本次實(shí)驗(yàn)選用的大腸桿菌發(fā)酵數(shù)據(jù)來(lái)源于北京某生物制藥廠。發(fā)酵時(shí)間為6~7 h。由于實(shí)際數(shù)據(jù)批次之間的差異,每批數(shù)據(jù)選取有72個(gè)采樣點(diǎn)。本實(shí)驗(yàn)選擇了7個(gè)過(guò)程變量與一個(gè)質(zhì)量變量OD值構(gòu)建統(tǒng)計(jì)模型,變量名稱如表4所示。
表4 大腸桿菌發(fā)酵過(guò)程主要變量
為了驗(yàn)證本文所提方法的有效性,本文選取10批正常數(shù)據(jù)建立歷史樣本庫(kù),并分別用1批正常數(shù)據(jù)和2批故障數(shù)據(jù)進(jìn)行測(cè)試,故障類(lèi)型、幅度和持續(xù)時(shí)間如表5所示。其中選擇10批正常數(shù)據(jù)的三維數(shù)據(jù)矩陣為10×7×72和10×1×72。
表5 大腸桿菌發(fā)酵過(guò)程故障類(lèi)型
為了驗(yàn)證算法的有效性,本文與傳統(tǒng)MKPLS和JITL-MKPLS進(jìn)行對(duì)比,在本文所設(shè)置的實(shí)驗(yàn)中,初步樣本篩選比率設(shè)置為10%,之后第2步精選過(guò)程中樣本容量設(shè)置為5個(gè)采樣點(diǎn)。AP聚類(lèi)算法最終給出的聚類(lèi)個(gè)數(shù)為3,分別為:(1-10)、(11-34)、(35-72)。如圖5所示為對(duì)正常批次生產(chǎn)過(guò)程的監(jiān)測(cè)效果,其中虛線為99% 控制限,從圖5(b)中可以看出,2種方法的T2對(duì)正常樣本都沒(méi)有誤報(bào),但傳統(tǒng)方法的SPE有7個(gè)時(shí)刻出現(xiàn)誤報(bào),本文方法只在前期一個(gè)時(shí)刻發(fā)生了誤報(bào)。這是因?yàn)楸疚脑谙嗨茦颖具x擇時(shí)同時(shí)考慮了樣本的時(shí)間和空間特性使得所建模型更加準(zhǔn)確。
圖5 大腸桿菌發(fā)酵過(guò)程正常批次監(jiān)測(cè)結(jié)果
階躍故障為突發(fā)故障,一般幅值也比較大,如圖6所示為模型在第21時(shí)刻引入的通風(fēng)速率階躍故障的監(jiān)測(cè)結(jié)果圖,如圖7所示為模型在第21時(shí)刻引入的攪拌功率斜坡故障的監(jiān)測(cè)結(jié)果圖,從圖中可以看出,采用同時(shí)考慮空間和時(shí)間的JITL策略所建立的模型更加精準(zhǔn),能夠更準(zhǔn)確地進(jìn)行故障監(jiān)測(cè)。本文所提出的方法誤報(bào)率都為0,在出現(xiàn)故障后,監(jiān)測(cè)到故障的時(shí)間也比傳統(tǒng)方法更短。同時(shí),由于采用了分步樣本篩選方法,所建立的模型在保證精度的前提下,算法運(yùn)行時(shí)間也大大地縮短。詳細(xì)指標(biāo)如表6所示。
表6 大腸桿菌發(fā)酵過(guò)程故障監(jiān)測(cè)指標(biāo)
本文針對(duì)傳統(tǒng)JITL-MKPLS遇到的在線計(jì)算壓力大問(wèn)題,提出了分步樣本篩選策略,首先通過(guò)AP聚類(lèi)的方法對(duì)數(shù)據(jù)樣本集中的數(shù)據(jù)進(jìn)行粗分類(lèi),在當(dāng)前輸入樣本數(shù)據(jù)到達(dá)后,先確定當(dāng)前樣本數(shù)據(jù)所屬的類(lèi)別,再在此類(lèi)別所限定的子數(shù)據(jù)樣本集中使用JITL策略確定出局部模型,減少不必要的計(jì)算量,節(jié)約監(jiān)測(cè)時(shí)間。同時(shí)將時(shí)間特性融入JITL方法中,提高了所建模型的準(zhǔn)確性和實(shí)時(shí)性,最后通過(guò)和不引入JITL策略、傳統(tǒng)的JITL策略進(jìn)行比較,本文提出的方法不僅能夠表征時(shí)變系統(tǒng)當(dāng)前狀態(tài),節(jié)約監(jiān)測(cè)時(shí)間,而且有較低的誤報(bào)率和漏報(bào)率。
[1] LV F, WEN C, BAO Z,.Fault diagnosis based on deep learning: American Control Conference [C]. Boston: American Automatic Control Council (AACC), 2016: 6851-6856.
[2] 王晶, 劉莉, 曹柳林, 等. 基于核Fisher包絡(luò)分析的間歇過(guò)程故障診斷 [J]. 化工學(xué)報(bào), 2014, 65(4): 1317-1326.
WANG J, LIU L, CAO L L,. Fault diagnosis based on kernel Fisher envelope surface for batch processes [J]. CIESC Journal, 2014, 65(4): 1317-1326.
[3] LINDGREN F, GELADI P, WOLD S. The kernel algorithm for PLS [J]. Journal of Chemometrics, 1993, 7(1): 45-59.
[4] ZHAO C H, WANG F L, LU N Y,. Stage-based soft-transition multiple PCA modeling and on-line monitoring strategy for batch processes [J]. Journal of Process Control, 2007, 17(9): 728-741.
[5] 常鵬, 王普, 高學(xué)金, 等. 基于多向核熵成分分析的微生物發(fā)酵過(guò)程多階段劃分及故障監(jiān)測(cè)[J]. 高?;瘜W(xué)工程學(xué)報(bào), 2015, 29(3): 650-656.
CHANG P, WANG P, GAO X J,. Multi-stage separation and fault monitoring of microbial fermentation processes based on multi-way kernel entropy component analysis [J]. Journal of Chemical Engineering of Chinese Universities, 2015, 29(3): 650-656.
[6] ROSIPAL R, TREJO L J. Kernel partial least squares regression in reproducing kernel Hilbert space [J]. The Journal of Machine Learning Research, 2002, 2: 97-123.
[7] 齊詠生, 王普, 高學(xué)金, 等. 基于多階段動(dòng)態(tài)PCA的發(fā)酵過(guò)程故障監(jiān)測(cè)[J]. 北京工業(yè)大學(xué)學(xué)報(bào), 2012, 38(10): 1474-1481.
QI Y S, WANG P, GAO X J,. Fault detection for fermentation process based on multiphase dynamic PCA [J]. Journal of Beijing University of Technology, 2012, 38(10): 1474-1481.
[8] YU J. Multiway gaussian mixture model based adaptive kernel partial least squares regression method for soft sensor estimation and reliable quality prediction of nonlinear multiphase batch processes [J]. Industrial & Engineering Chemistry Research. 2012, 51(40): 13227-13237.
[9] 王建林, 馬琳鈺, 邱科鵬, 等. 基于SVDD的多時(shí)段間歇過(guò)程故障檢測(cè) [J]. 儀器儀表學(xué)報(bào), 2017, 38(11): 2752-2761.
WANG J L, MA L Y, QIU K P,. Multi-phase batch processes fault detection based on support vector data description [J]. Journal of Instrumentation, 2017, 38(11): 2752-2761.
[10] XIE L, ZENG J S, GAO C H. Novel just-in-time learning-based soft sensor utilizing non-Gaussian information [J]. IEEE Transactions on Control Systems Technology, 2013, 22(1): 360-368.
[11] GE Z Q, SONG Z H. A comparative study of just-in-time-learning based methods for online soft sensor modeling [J]. Chemometrics and Intelligent Laboratory Systems, 2010, 104(2): 306-317.
[12] LIU Y, GAO Z L, LI P,. Just-in-time kernel learning with adaptive parameter selection for soft sensor modeling of batch processes [J]. Industrial & Engineering Chemistry Research, 2012, 51(11): 4313–4327.
[13] CHEN M L, KHARE S, HUANG B. A unified recursive just-in-time approach with industrial near infrared spectroscopy application [J]. Chemometrics & Intelligent Laboratory Systems, 2014, 135(14): 133-140.
[14] HU Y, MA H H, SHI H B. Enhanced batch process monitoring using just-in-time-learning based kernel partial least squares [J]. Chemometrics and Intelligent Laboratory Systems, 2013, 123: 15-27.
[15] KIM S, OKAJIMA R, KANO M,. Development of soft-sensor using locally weighted PLS with adaptive similarity measure [J]. Chemometrics and Intelligent Laboratory Systems, 2013, 124(Complete): 43-49.
[16] YUAN X F, GE Z Q, SONG Z H. Locally weighted kernel principal component regression model for soft sensing of nonlinear time-variant processes [J]. Industrial & Engineering Chemistry Research, 2014, 53(35): 13736-13749.
[17] USHIDA S, KIMURA H. Just-in-time approach to nonlinear identification and control [J]. Journal of SICE, 2005, 44 (2): 102-106.
[18] CHENG C, CHIU M S. Nonlinear process monitoring using JITL-PCA [J]. Chemometrics and Intelligent Laboratory Systems, 2005, 76(1): 1-13.
[19] FREY B J, DUECK D. Clustering by passing messages between data points [J]. Science, 2007, 315(5814): 972-976.
[20] 牛大鵬, 劉元清. 基于改進(jìn)即時(shí)學(xué)習(xí)算法的濕法冶金浸出過(guò)程建模 [J]. 化工學(xué)報(bào), 2017, 68(7): 2873-2879.
NIU D P, LIU Y Q. Modeling hydrometallurgical leaching process based on improved just-in-time learning algorithm [J]. CIESC Journal, 2017, 68(7): 2873-2879.
[21] 王錫昌, 王普, 高學(xué)金, 等. 一種新的基于MKPLS的間歇過(guò)程質(zhì)量預(yù)測(cè)方法 [J]. 儀器儀表學(xué)報(bào), 2015, 36(5): 1155-1162.
WANG X C, WANG P, GAO X J,. New quality prediction method of batch processes based on MKPLS [J]. Journal of Instrumentation, 2015, 36(5): 1155-1162.
[22] 賈潤(rùn)達(dá), 毛志忠,王福利. 基于KPLS模型的間歇過(guò)程產(chǎn)品質(zhì)量控制 [J]. 化工學(xué)報(bào), 2013, 64(4): 1332-1339.
JIA R D, MAO Z Z, WANG F L. KPLS model based product quality control for batch processes [J]. Ciesc Journal, 2013, 64(4): 1332-1339.
[23] 葛祥振, 熊偉麗, 徐保國(guó). 一種改進(jìn)自適應(yīng)AP聚類(lèi)的多模型軟測(cè)量方法[J]. 控制工程, 2017(10): 104-110.
GE X Z, XIONG W L, XU B G. A Multi-model Soft Sensor Method Based on Improved Adaptive AP Clustering Algorithm [J]. Control Engineering, 2017(10): 104-110.
Fault monitoring of batch processes based on substep time-space JITL-MKPLS
GAO Xue-jin1,2,3,4, MENG Ling-jun1,2,3,4, WANG Hao1,2,3,4, GAO Hui-hui1,2,3,4
(1. Faculty of Information Technology, Beijing University of Technology, Beijing 100124, China;2. Engineering Research Center of Digital Community, Ministry of Education, Beijing 100124, China;3. Beijing Laboratory for Urban Mass Transit, Beijing 100124, China;4. Beijing Laboratory of Computational Intelligence and Intelligent System, Beijing 100124, China)
It is difficult to accurately describe the dynamic characteristics of multi-stage time-varying batch processes with global models, while every working point of traditional local models needs to re-select samples that results in high requirement of computation. A local modeling strategy based on substep time-space just-in-time learning (JITL) was proposed. The data in the sample set of historical data were preliminarily classified by an affinity propagation (AP) clustering method. When the current input sample data arrived, the category of these data was determined. The JITL strategy combining time and space was used to determine local similar samples in the subsample of the category. A multi kernel partial least squares (MKPLS) monitoring model was established using local similar samples. The effectiveness of the proposed method was validated via simulation of penicillin fermentation andproduction of interleukin-2. The results demonstrate that the proposed method reduces unnecessary calculation and can detect faults more accurately and instantaneously.
time-space just-in-time learning; substep; multi kernel partial least squares; local modeling; fault monitoring
TH165.3
A
10.3969/j.issn.1003-9015.2021.01.015
1003-9015(2021)01-0127-13
2019-04-20;
2019-11-01。
國(guó)家自然科學(xué)基金(61803005,61640312,61763037);北京市自然科學(xué)基金(4192011,4172007);山東省重點(diǎn)研發(fā)計(jì)劃(2018CXGC0608);北京市教育委員會(huì)資助。
高學(xué)金(1973-),男,河北唐山人,北京工業(yè)大學(xué)教授,博士。
高學(xué)金,E-mail:gaoxuejin@bjut.edu.cn