鄭靜,熊偉麗
(1.江南大學(xué) 輕工過(guò)程先進(jìn)控制教育部重點(diǎn)實(shí)驗(yàn)室,江蘇 無(wú)錫 214122;2.江南大學(xué) 物聯(lián)網(wǎng)工程學(xué)院,江蘇 無(wú)錫 214122)
隨著新型傳感器、數(shù)據(jù)采集設(shè)備和系統(tǒng)的迅速發(fā)展,一些先進(jìn)工業(yè)過(guò)程積累了豐富的過(guò)程數(shù)據(jù),使得多元統(tǒng)計(jì)過(guò)程監(jiān)控(multivariate statistical process monitoring,MSPM)技術(shù)不斷進(jìn)步[1-3]。其中的主成分分析(principal component analysis,PCA)和k近鄰方法(k-nearest neighbor,kNN)是較為基礎(chǔ)的方法,得到了大量的研究和應(yīng)用[4-7]。
作為一種降維技術(shù),PCA 通過(guò)將數(shù)據(jù)投影到低維空間以有效地處理高維和線性相關(guān)的數(shù)據(jù),通過(guò)建立主元子空間和殘差子空間的統(tǒng)計(jì)量進(jìn)行過(guò)程監(jiān)控。但是,對(duì)于具有非線性和非高斯特性的過(guò)程數(shù)據(jù),PCA 方法可能無(wú)法進(jìn)行有效的監(jiān)測(cè)。He 等[8]提出基于k近鄰規(guī)則的故障監(jiān)測(cè)算法,該算法不局限于線性和高斯數(shù)據(jù),使用局部近鄰距離度量樣本相似度,根據(jù)故障樣本和正常樣本的相似度不同實(shí)現(xiàn)故障監(jiān)測(cè)。但是由于每一個(gè)樣本都需要計(jì)算與其他樣本的距離,計(jì)算量明顯增大。為此,學(xué)者們提出了許多改進(jìn)的kNN 故障監(jiān)測(cè)算法。例如:文獻(xiàn)[9]利用改進(jìn)K-means 聚類將原始建模數(shù)據(jù)分成多個(gè)類,對(duì)每個(gè)類分別建立kNN 監(jiān)測(cè)模型,大大縮短故障檢測(cè)時(shí)間;文獻(xiàn)[10]提出將動(dòng)態(tài)PCA 和kNN 相結(jié)合的故障診斷方法,先建立主元模型,再利用kNN 獲取樣本的k個(gè)近鄰,明顯提高了故障的報(bào)警率;文獻(xiàn)[11]針對(duì)kNN模型不能及時(shí)更新的問(wèn)題,提出了一種特征空間自適應(yīng)k近鄰故障檢測(cè)方法,有效提高模型實(shí)時(shí)監(jiān)測(cè)的能力;文獻(xiàn)[12]考慮到多模態(tài)過(guò)程數(shù)據(jù)具有多中心、方差差異大等特點(diǎn),通過(guò)構(gòu)造標(biāo)準(zhǔn)距離,實(shí)現(xiàn)了kNN 方法對(duì)多模態(tài)數(shù)據(jù)的有效監(jiān)測(cè)。
由于現(xiàn)代工業(yè)過(guò)程具有多個(gè)操作單元、變量關(guān)系復(fù)雜等特點(diǎn),全局建模策略無(wú)法更加準(zhǔn)確地對(duì)過(guò)程建模,多塊建模策略成為有效的解決方案。Macgrego 等[13]首次提出了多塊投影方法,為每個(gè)子塊以及整個(gè)過(guò)程建立監(jiān)測(cè)模型。文獻(xiàn)[14]采用Jarque-Bera(J-B)檢測(cè)方法并利用變量間的Hellinger 距離獲得高斯和非高斯子塊,然后分別采用不同的方法進(jìn)行建模,并對(duì)每個(gè)子塊的統(tǒng)計(jì)量進(jìn)行加權(quán)得到總的聯(lián)合指標(biāo)實(shí)現(xiàn)在線監(jiān)控;文獻(xiàn)[15]將整個(gè)過(guò)程劃分成多個(gè)子塊單元,然后在每個(gè)子塊單元內(nèi)分別進(jìn)行相對(duì)變換獨(dú)立主元分析處理,實(shí)現(xiàn)故障排查和識(shí)別;Ge 等[16]提出分布式PCA的全流程過(guò)程監(jiān)控方法,利用過(guò)程變量在主元方向上的貢獻(xiàn)度劃分子塊,有效地提高了監(jiān)控效果。
在信息論領(lǐng)域里,互信息(mutual information,MI)是一種相對(duì)成熟的統(tǒng)計(jì)分析技術(shù),可以通過(guò)信息熵度量?jī)蓚€(gè)隨機(jī)變量之間的依賴性,并且這種度量不局限于數(shù)據(jù)線性關(guān)系的假設(shè)條件[17-19],已經(jīng)在數(shù)據(jù)分析與建模領(lǐng)域得到了比較多的應(yīng)用。文獻(xiàn)[20]利用變量間的互信息定義數(shù)據(jù)的相關(guān)性矩陣,為過(guò)程數(shù)據(jù)建立更為精確的描述模型。文獻(xiàn)[21]利用互信息矩陣之和替代傳統(tǒng)主成分分析中的協(xié)方差矩陣,計(jì)算其特征向量與特征值,得到較主成分分析更好的降維效果。文獻(xiàn)[22]利用高維k 近鄰互信息方法,有效解決建模過(guò)程中的特征選擇問(wèn)題。
綜上所述,為了更加充分地對(duì)復(fù)雜過(guò)程變量之間的關(guān)系進(jìn)行描述,并提取過(guò)程的局部特征,利用多塊建模策略,提出一種基于互信息的k 近鄰故障監(jiān)測(cè)算法。該算法在計(jì)算訓(xùn)練集樣本間的互信息基礎(chǔ)上,根據(jù)互信息值的大小將變量分成多個(gè)子塊,對(duì)每個(gè)子塊建立相應(yīng)的kNN 模型,并利用核密度估計(jì)方法求出控制限,最后利用貝葉斯推斷將各子塊的監(jiān)測(cè)結(jié)果融合,使得整體的監(jiān)測(cè)效果更為直觀。本文進(jìn)一步采用基于馬氏距離的故障診斷方法,通過(guò)計(jì)算樣本中各變量與其均值的馬氏距離,找出引發(fā)故障的源變量并對(duì)其隔離。利用田納西?斯曼(Tennessee Eastmann,TE)和實(shí)際高爐煉鐵過(guò)程數(shù)據(jù),對(duì)所提方法進(jìn)行了仿真,并與幾種傳統(tǒng)監(jiān)測(cè)方法進(jìn)行了對(duì)比,驗(yàn)證了本文方法的性能。
k近鄰算法是數(shù)據(jù)挖掘和數(shù)據(jù)分類中最常用的方法之一,傳統(tǒng)kNN 算法通過(guò)尋找k個(gè)近鄰樣本,采用投票的方法確定待測(cè)樣本的類別?;趉NN 的故障監(jiān)測(cè),其基本思想是通過(guò)計(jì)算近鄰距離度量樣本間的相似度,若樣本點(diǎn)與訓(xùn)練集中前k個(gè)近鄰樣本距離的平方和大于正常樣本的相應(yīng)距離平方和,則該樣本點(diǎn)被定義為故障點(diǎn)。監(jiān)測(cè)過(guò)程包括模型建立和故障檢測(cè)兩步,具體描述如下:
1)建立模型
首先在訓(xùn)練集中,尋找每個(gè)樣本xi的前k個(gè)近鄰樣本,記做其中,表示樣本xi的第j個(gè)近鄰樣本。然后,計(jì)算每個(gè)樣本xi與其k個(gè)近鄰樣本的歐式距離平方和作為統(tǒng)計(jì)量,如式(1)所示,其中,表示樣本xi與它的第j個(gè)近鄰樣本的歐氏距離平方。接著,根據(jù)置信度α確定訓(xùn)練模型的控制限
首先,在訓(xùn)練集中尋找待測(cè)樣本x的前k個(gè)近鄰。然后,計(jì)算x與其k個(gè)近鄰樣本的歐式距離平方和,記做最后,比較的大小,若則判定為故障點(diǎn),反之為正常點(diǎn)。
在概率論和信息論領(lǐng)域,互信息是一種非常實(shí)用的信息度量方法。它可以度量?jī)蓚€(gè)隨機(jī)變量相互依賴的程度,表示出兩個(gè)變量共享的信息,反映兩個(gè)變量的相關(guān)性[21],這種度量同樣適用于非線性相關(guān)的變量。對(duì)于密切相關(guān)的變量,它們擁有較大的互信息。令隨機(jī)變量X和Y的聯(lián)合概率分布及邊緣概率分布分別為p(x,y)、p(x) 和p(y),其中x∈X,y∈Y,X的熵定義如式(2)所示。
聯(lián)合熵為
則變量X和Y之間的互信息可以定義為
若X和Y相互獨(dú)立,則X不對(duì)Y提供任何信息,此時(shí)互信息值最小,結(jié)果為0。反之,兩個(gè)變量間的相關(guān)性越高,互信息值越大。
在實(shí)際的工業(yè)過(guò)程中,變量之間大多是線性、非線性共存,高斯、非高斯混合分布,傳統(tǒng)的PCA 與kNN 方法往往從全局的角度出發(fā),系統(tǒng)的本質(zhì)特征無(wú)法得到充分的展示。因此,首先對(duì)變量進(jìn)行MI 計(jì)算,將互信息大的多個(gè)變量放在一起組成子塊,使得子塊內(nèi)的變量擁有更多相同的信息,最大化地反映變量的一個(gè)或者多個(gè)局部特征,同時(shí)也大大降低了監(jiān)控過(guò)程的復(fù)雜度,從而有效地提高系統(tǒng)的監(jiān)控效果。
對(duì)于訓(xùn)練集X∈Rn×m,xi∈X,xj∈X,計(jì)算變量xi與變量xj之間的互信息Iij,即
若Iij≥Ii,l,則把變量xj與變量xi放到相同的子塊中。Ii,l一般根據(jù)經(jīng)驗(yàn)獲得,本文結(jié)合互信息針狀圖為了更好地劃分變量,Ii,l取 1.3IiM,其中IiM是Iij的中值。本文所采用的多塊建模方法如圖1所示。
圖1 本文所采用的多塊建模方法Fig.1 Multi-block modeling method in this paper
針對(duì)劃分好的子塊,建立kNN 監(jiān)測(cè)模型。尋找各子塊中樣本的k近鄰樣本集,記做其中xib表示第b個(gè)子塊中的變量表示樣本xib的第k個(gè)近鄰樣本。
然后計(jì)算每個(gè)子塊中樣本與其k近鄰樣本的歐式距離平方和作為子塊統(tǒng)計(jì)量,即其中表示第b個(gè)子塊的統(tǒng)計(jì)量。
通過(guò)核密度估計(jì)法(kernel density estimation,KDE)估計(jì)每個(gè)統(tǒng)計(jì)量的概率密度,再繪制累加概率密度圖,根據(jù)置信度確定每個(gè)塊中統(tǒng)計(jì)量的控制限。由于子塊數(shù)目較多且產(chǎn)生多個(gè)監(jiān)測(cè)結(jié)果,無(wú)法得到一個(gè)直觀的最終決策,因此,采用貝葉斯融合策略[23],將正常事件和故障事件與貝葉斯推斷相結(jié)合,從概率的角度將所有子塊的統(tǒng)計(jì)量組合成一個(gè)新的統(tǒng)計(jì)量來(lái)得到最終的監(jiān)測(cè)結(jié)果。
在貝葉斯推斷(bayesian inference,BI)中,測(cè)試樣本xtest在第b個(gè)子塊中的D2統(tǒng)計(jì)量的故障條件概率可以表示為
式中:xtest,b表示第b個(gè)子塊中的測(cè)試樣本。條件概率可定義如式(9)所示。
其中,“N”和“F”分別代表“normal”和“fault”,即正常樣本和故障樣本。為正常樣本的先驗(yàn)概率,由置信度 α 決定,則為為新樣本在第b個(gè)子塊中的統(tǒng)計(jì)量是第b個(gè)子塊中由核密度估計(jì)方法估計(jì)得出的統(tǒng)計(jì)量的控制限。最終,融合的BIC 統(tǒng)計(jì)量即為待測(cè)樣本發(fā)生故障的概率,如式(10)所示。
BIC 統(tǒng)計(jì)量的控制限由1?α確定(本文α 取0.01),當(dāng)BIC 的值大于1?α 時(shí),判斷發(fā)生故障;否則,過(guò)程正常。
當(dāng)檢測(cè)到故障后,需要找出引發(fā)故障的源變量并對(duì)其進(jìn)行分離。計(jì)算數(shù)據(jù)樣本中各變量與其均值的馬氏距離[17],即加權(quán)計(jì)算數(shù)據(jù)樣本中各變量相較于其均值的偏移量,偏移量越大,說(shuō)明該變量對(duì)于故障貢獻(xiàn)越大。該方法可以有效辨識(shí)引發(fā)故障的源變量,即發(fā)生故障的根本原因。
基于互信息的多塊kNN 故障監(jiān)測(cè)算法流程如圖2 所示,具體步驟描述如下。
圖2 基于MI-MBkNN 的故障監(jiān)測(cè)流程Fig.2 Fault monitoring flowchart based on MI-MBkNN
1) 獲取正常訓(xùn)練數(shù)據(jù),并對(duì)其進(jìn)行標(biāo)準(zhǔn)化處理;
2) 計(jì)算兩兩變量間互信息,根據(jù)2.1 節(jié)所述方法對(duì)變量進(jìn)行分塊,得到各個(gè)子塊;
3) 對(duì)每個(gè)子塊分別建立kNN 模型,利用核密度估計(jì)方法確定各自的故障控制限;
4) 對(duì)于新來(lái)的測(cè)試樣本,同樣對(duì)其進(jìn)行標(biāo)準(zhǔn)化處理和分塊處理;
5) 對(duì)每個(gè)子塊進(jìn)行kNN 故障監(jiān)測(cè),獲得每個(gè)子塊的監(jiān)測(cè)結(jié)果;
6) 通過(guò)貝葉斯推斷方法,利用式(10)將各個(gè)子塊的統(tǒng)計(jì)量組合成為一個(gè)新的BIC 統(tǒng)計(jì)量,并根據(jù)置信度確定控制限,當(dāng)BIC 超過(guò)控制限時(shí)則判斷發(fā)生了故障,否則正常;
7) 監(jiān)測(cè)到故障后計(jì)算數(shù)據(jù)樣本中各變量與其均值的馬氏距離,確定故障變量及故障塊,分離出對(duì)故障影響最大的變量。
TE 仿真平臺(tái)是基于實(shí)際工業(yè)過(guò)程的仿真平臺(tái),它由反應(yīng)器、冷凝器、壓縮機(jī)、分離器和汽提塔5 個(gè)主要操作單元組成[24-25]。該過(guò)程包含的變量數(shù)目多,且變量與變量之間的關(guān)系復(fù)雜。主要分為12 個(gè)操作變量,41 個(gè)測(cè)量變量,21 個(gè)預(yù)設(shè)定的故障。本文選取22 個(gè)過(guò)程測(cè)量變量和11 個(gè)操作變量(不包括攪動(dòng)速度)用于監(jiān)測(cè)方法建模和監(jiān)測(cè)性能測(cè)試,具體變量描述見(jiàn)文獻(xiàn)[16]。對(duì)于每種故障,訓(xùn)練集用于訓(xùn)練建立模型,測(cè)試集用來(lái)檢驗(yàn)?zāi)P捅O(jiān)測(cè)性能。訓(xùn)練集和測(cè)試集均采用960個(gè)樣本,測(cè)試集中故障從第161 個(gè)樣本點(diǎn)引入。
為了建立多塊模型,對(duì)選取的過(guò)程變量和操作變量進(jìn)行互信息的計(jì)算并進(jìn)行分塊,分塊結(jié)果如表1 所示。圖3 分別展示了變量18、變量19、變量31 與其他32 個(gè)變量間的互信息,圖中的虛線表示為1.3 倍互信息中值,互信息超過(guò)虛線的變量即為與該變量具有較大互信息的變量。因此將變量18、變量19 和變量31 放到相同的子塊中。圖4 分別展示了變量10、變量17、變量28、變量33 與其他32 個(gè)變量間的互信息,因此將它們組成一個(gè)子塊。
圖3 子塊4 中各變量間的互信息Fig.3 Mutual information between variables in block 4
圖4 子塊5 中各變量間的互信息Fig.4 Mutual information between variables in block 5
表1 TE 過(guò)程子塊的劃分Table 1 Blocks division in the TE process
表2 給出了7 個(gè)子塊對(duì)21 種故障的報(bào)警率、平均報(bào)警率和平均誤報(bào)率。從報(bào)警率來(lái)看,對(duì)于大多數(shù)故障類型,子塊7 的監(jiān)測(cè)結(jié)果要優(yōu)于其他6 個(gè)子塊。子塊5 的平均報(bào)警率很低,但是對(duì)于某些故障(如故障5),子塊5 的報(bào)警率達(dá)96%,對(duì)整個(gè)的監(jiān)測(cè)起到了關(guān)鍵的作用。對(duì)于不同的故障,由于某些子塊擁有較高的報(bào)警率和較低的誤報(bào)率,使得最終融合的BIC 統(tǒng)計(jì)量表現(xiàn)了良好的監(jiān)測(cè)性能。從對(duì)21 種故障的監(jiān)測(cè)結(jié)果來(lái)看,對(duì)于大部分故障,融合后的監(jiān)測(cè)性能有了明顯的提高。
表2 TE 過(guò)程各故障報(bào)警率Table 2 Alarm rates of TE process
表3 給出了TE 過(guò)程21 種故障在不同監(jiān)測(cè)方法下的報(bào)警率和誤報(bào)率,主要方法包括傳統(tǒng)PCA、SVDD、kNN 和本文提出的MI-MBkNN。從仿真結(jié)果可以看出,對(duì)于絕大多數(shù)故障類型,MIMBkNN 能取得優(yōu)越于其他3 種方法的監(jiān)測(cè)結(jié)果,尤其是對(duì)故障5、故障10、故障 16、故障 19 的監(jiān)測(cè)。圖5 以故障5 為例展示了詳細(xì)的監(jiān)測(cè)過(guò)程與結(jié)果。
表3 幾種現(xiàn)有的監(jiān)測(cè)方法性能比較Table 3 Comparison of some state of monitoring methods
TE 過(guò)程中的故障5 涉及冷凝器冷卻水入口溫度的變化,當(dāng)故障發(fā)生時(shí),從冷凝器到氣/液分離器的出口流量增加,使溫度升高。使用傳統(tǒng)PCA、kNN、SVDD 方法和本文提出的MI-MBkNN 的監(jiān)測(cè)結(jié)果如圖5 所示。從圖5(a)~(d)可以發(fā)現(xiàn),在故障開(kāi)始時(shí)就可以檢測(cè)出故障,但是在大約350 個(gè)樣本的時(shí)候,統(tǒng)計(jì)量出現(xiàn)低于控制限的情況,導(dǎo)致故障的漏報(bào)。由于該故障是局部故障,因此很難在全局模型中檢測(cè)到,為了更好地找出故障的原因,圖6 給出了數(shù)據(jù)樣本在第161個(gè)樣本點(diǎn)(故障最開(kāi)始處)的各變量與其均值中心的馬氏距離。
圖5 故障5 監(jiān)測(cè)結(jié)果Fig.5 Monitoring result of fault 5
圖6 第161 樣本點(diǎn)故障5 的變量識(shí)別結(jié)果Fig.6 Variables identification results of fault 5 on the 161th point
可以看出這兩個(gè)模型都能正確識(shí)別變量在過(guò)程中的變化,如分離器冷卻水出口溫度的變化(變量22),反應(yīng)器溫度(變量9),產(chǎn)品分離器溫度(變量11)和反應(yīng)器冷卻水流量(變量32)。但是在350 個(gè)樣本點(diǎn)后,從圖7(第400 個(gè)樣本點(diǎn))可以看出,kNN 無(wú)法識(shí)別出冷凝器冷卻水流量的變化(變量33),但是MI-MBkNN 模型可以成功識(shí)別,因此MI-MBkNN 對(duì)故障5 表現(xiàn)出了優(yōu)越的監(jiān)測(cè)效果。
圖7 第400 樣本點(diǎn)故障5 的變量識(shí)別結(jié)果Fig.7 Variables identification results of fault 5 on the 400th point
故障10 是流2(C 進(jìn)料) 中溫度的隨機(jī)變化,從圖8 中可以看出350~650 樣本,傳統(tǒng)的監(jiān)測(cè)方法很難監(jiān)測(cè)到故障,但是MI-MBkNN 卻能很好地檢測(cè)出來(lái)。
圖8 故障10 監(jiān)測(cè)結(jié)果Fig.8 Monitoring result of fault 10
為了更好地找出引發(fā)故障的源變量,圖9(a)和(b)分別給出了使用kNN 和MI-MBkNN 方法時(shí)數(shù)據(jù)樣本在第400 樣本點(diǎn)處的各變量與其均值中心的馬氏距離,可以發(fā)現(xiàn)MI-MBkNN 在尋找故障源變量方面提供更重要的指導(dǎo),即汽提塔溫度(變量18),汽提塔蒸汽流量(變量19),汽提塔蒸汽閥的變量(變量31)是引起故障10 的原因,因此子塊4 的監(jiān)測(cè)效果明顯優(yōu)于其他子塊。通過(guò)貝葉斯融合后,使得整體的監(jiān)測(cè)效果得到了很高的提升。因此本文提出的方法對(duì)故障10 的監(jiān)測(cè)效果優(yōu)于其他幾種傳統(tǒng)的監(jiān)測(cè)方法。圖10 對(duì)比了PCA、kNN、本文方法的子塊4 和MI-MBkNN 的對(duì)故障16 的監(jiān)測(cè)結(jié)果,傳統(tǒng)kNN 方法在統(tǒng)計(jì)量上只能從450~500 樣本和790~840 樣本之間做到相對(duì)持續(xù)的報(bào)警,而本文監(jiān)測(cè)方法從故障引入點(diǎn)處開(kāi)始就能做到大范圍的持續(xù)報(bào)警。
圖9 變量識(shí)別結(jié)果Fig.9 Variables identification results
圖10 故障16 監(jiān)測(cè)結(jié)果Fig.10 Monitoring result of fault 16
圖11 給出了對(duì)故障16 的診斷結(jié)果,可以看出,相比于kNN,本文方法對(duì)故障提供更清晰的識(shí)別結(jié)果,即引起該故障的源變量是變量x18、x19和x31。因此子塊4 對(duì)故障10 的敏感程度遠(yuǎn)遠(yuǎn)大于其他子塊,其表現(xiàn)了良好的監(jiān)測(cè)性能。通過(guò)貝葉斯推斷融合后提升了整體的監(jiān)測(cè)效果,再次驗(yàn)證了本文所提方法的有效性。
圖11 變量識(shí)別結(jié)果Fig.11 Variables identification results
為了達(dá)到高爐煉鐵過(guò)程節(jié)能降耗的目的,必須保證鐵水的生產(chǎn)質(zhì)量和產(chǎn)量。當(dāng)氣體流動(dòng)不穩(wěn)定時(shí)會(huì)影響碳的燃燒,最終導(dǎo)致?tīng)t腹架空,產(chǎn)生懸掛故障。若沒(méi)有及時(shí)檢測(cè)出懸掛故障,將會(huì)導(dǎo)致熱應(yīng)力和內(nèi)部的氣體壓力過(guò)大,使得頂部結(jié)構(gòu)受到嚴(yán)重的破損。本節(jié)考慮了實(shí)際情況中懸掛故障的存在,采集正常工況下的8 個(gè)過(guò)程變量的2 000個(gè)樣本作為訓(xùn)練樣本,同時(shí)采集了懸掛故障下的1 900 個(gè)樣本作為測(cè)試樣本。在懸掛故障下,爐內(nèi)的溫度和壓力增加,爐頂?shù)囊谎趸己投趸紳舛壬仙?,氫氣的濃度下降。為了更好地表現(xiàn)變量的特性,表4 給出了8 個(gè)過(guò)程變量的描述,圖12給出了8 個(gè)變量的變化曲線圖,其中前2 000 個(gè)樣本為正常樣本,后1 900 個(gè)樣本為故障樣本。
表4 懸掛故障監(jiān)測(cè)中選擇的過(guò)程變量Table 4 Process variables selected for monitoring of the hanging fault
圖12 高爐過(guò)程各變量曲線圖Fig.12 Curves of Blast furnace process variable
利用上述所提分塊方法將8 個(gè)變量分成兩個(gè)子塊,子塊1 為u1、u3,子塊2 為u2、u4、u5、u6、u7、u8,圖13 給出了子塊1 中各變量間的互信息。表5 給出了不同監(jiān)測(cè)方法的監(jiān)測(cè)結(jié)果,圖14 展示了子塊1 和子塊2 的監(jiān)測(cè)結(jié)果??梢钥闯鲎訅K2 在2 200 樣本點(diǎn)后可以達(dá)到持續(xù)報(bào)警,其監(jiān)測(cè)效果明顯好于子塊1,結(jié)合圖15 給出的故障診斷結(jié)果,可以看出變量4 和變量8 是引起故障的主要原因,由于本文所提方法對(duì)變量進(jìn)行了合理分塊,把結(jié)構(gòu)相似且對(duì)故障最為敏感的變量放在同一個(gè)子塊中,使得整體的監(jiān)測(cè)性能得到了提升,再次驗(yàn)證本文所提方法的有效性和優(yōu)越性。
圖13 高爐過(guò)程子塊1 變量間的互信息Fig.13 Mutual information between variables in blast furnace process block 1
表5 不同方法的監(jiān)測(cè)性能比較Table 5 Comparison of monitoring performance of two methods in blast furnace process
圖14 高爐過(guò)程子塊1 和子塊2 的監(jiān)測(cè)性能比較Fig.14 Comparison of monitoring performance of block1 and block2 in blast furnace process
圖15 高爐過(guò)程變量識(shí)別結(jié)果Fig.15 Variables identification results of the blast furnace process
本文提出了一種基于互信息的多塊k近鄰故障監(jiān)測(cè)方法,使用互信息對(duì)過(guò)程變量進(jìn)行劃分,并在每個(gè)子塊中建立基于kNN 的故障監(jiān)測(cè)模型,所提方法反映了過(guò)程的更多局部特征,所以更易于故障的監(jiān)測(cè)和診斷。將所提方法應(yīng)用于TE 過(guò)程和實(shí)際高爐煉鐵過(guò)程中,均取得了比較好的監(jiān)測(cè)效果。本文所提方法是一種完全基于數(shù)據(jù)驅(qū)動(dòng)的監(jiān)測(cè)方法,可以考慮將其與先驗(yàn)知識(shí)或?qū)<医?jīng)驗(yàn)相結(jié)合,并且可以考慮變量間關(guān)系的更多細(xì)節(jié),提出其他分塊方法,是本文進(jìn)一步研究的工作之一。