于桂仙,楊 青,劉彥俏
(沈陽(yáng)理工大學(xué) 自動(dòng)化與電氣工程學(xué)院,沈陽(yáng) 110159)
隨著現(xiàn)代化工過(guò)程的大型化和復(fù)雜化,如何對(duì)其進(jìn)行有效的故障診斷成為一個(gè)重要的研究方向。其中,深度學(xué)習(xí)技術(shù)備受關(guān)注,在圖像和自然語(yǔ)言處理、預(yù)測(cè)、故障診斷等方面均有深度學(xué)習(xí)的應(yīng)用[1-4]。目前常使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)來(lái)提取數(shù)據(jù)特征,CNN和RNN是深度學(xué)習(xí)的兩個(gè)重要模型,兩者具有同等重要的作用和地位。CNN可有效提取數(shù)據(jù)在空間域上的特征,RNN和CNN的明顯不同之處是,RNN為一種基于記憶的模型,擁有獨(dú)一無(wú)二的記憶功能,能夠提取數(shù)據(jù)的時(shí)域特征。但標(biāo)準(zhǔn)的RNN只對(duì)近期的信息記憶清晰,對(duì)較為久遠(yuǎn)的信息記憶則較為模糊,為此Hochreiter S等[5]提出長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)模型,作為RNN的改進(jìn)模型,LSTM的應(yīng)用效果遠(yuǎn)好于標(biāo)準(zhǔn)的RNN。衷路生等[6]將深度殘差網(wǎng)絡(luò)應(yīng)用在故障診斷中,該網(wǎng)絡(luò)的恒等映射快捷連接不僅有效緩解了訓(xùn)練困難的問(wèn)題,同時(shí)對(duì)參數(shù)優(yōu)化也有一定幫助,實(shí)驗(yàn)結(jié)果表明該方法有效地提高了精度指標(biāo)。王翔等[7]通過(guò)樣本重構(gòu)的方式降低復(fù)雜度,然后采用改進(jìn)的多尺度孿生卷積網(wǎng)絡(luò)進(jìn)行故障檢測(cè)。林濤等[8]將LSTM和隨機(jī)森林(Random Forest,RF)相結(jié)合,提出改進(jìn)的LSTM-RF混合算法進(jìn)行故障診斷。鄭直等[9]采用LSTM進(jìn)行故障診斷,以改進(jìn)的鯨魚(yú)算法優(yōu)化LSTM網(wǎng)絡(luò),提高了故障診斷精度。陳佳慧等[10]提出了極大重疊離散小波變換和LSTM相結(jié)合的故障診斷方法,其中極大重疊離散小波變換用來(lái)提取故障數(shù)據(jù)在頻域上的特征,LSTM用于訓(xùn)練,獲得了良好的故障診斷效果。
本文將深度可分離卷積(Depthwise Separable Convolution,DSC)和長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM相結(jié)合,提出DSC-LSTM集合型故障診斷方法,對(duì)田納西-伊斯曼過(guò)程進(jìn)行故障診斷。首先將數(shù)據(jù)歸一化預(yù)處理,然后通過(guò)DSC提取故障數(shù)據(jù)的空域特征,再通過(guò)LSTM提取時(shí)域特征,采用時(shí)空結(jié)合的方式從兩個(gè)角度提取數(shù)據(jù)特征,最后通過(guò)全連接層進(jìn)行故障診斷,獲得診斷結(jié)果。
深度可分離卷積與普通卷積的區(qū)別在于DSC的參數(shù)更少。DSC首先進(jìn)行逐通道卷積,例如一張三通道圖片,卷積核大小為3×3,卷積核的個(gè)數(shù)與通道數(shù)一致,則卷積部分的參數(shù)有3×3×3=27個(gè),再經(jīng)過(guò)逐點(diǎn)卷積,卷積核的尺寸為 1×1,如需要20個(gè)特征圖,則逐點(diǎn)卷積的參數(shù)為3×1×1×20=60個(gè),故DSC的參數(shù)共87個(gè),而普通卷積參數(shù)需要3×3×3×20=540個(gè),因此DSC可為訓(xùn)練節(jié)省時(shí)間。
循環(huán)神經(jīng)網(wǎng)絡(luò)RNN是把網(wǎng)絡(luò)的輸出存儲(chǔ)在記憶單元中,然后再將此刻記憶單元中存儲(chǔ)的信息與下一刻的輸入一起送入網(wǎng)絡(luò),使網(wǎng)絡(luò)產(chǎn)生記憶功能。RNN基本結(jié)構(gòu)如圖1所示。
圖1 RNN結(jié)構(gòu)圖
由于RNN的長(zhǎng)時(shí)依賴性不夠好,故本文采用RNN的改進(jìn)版本LSTM。LSTM引入門(mén)控裝置(輸入門(mén)、遺忘門(mén)、輸出門(mén)),其中輸入門(mén)的作用是控制記憶單元中當(dāng)下時(shí)刻信息的輸入情況,遺忘門(mén)是 LSTM 的重要部分,用于控制上一時(shí)刻記憶單元中信息的保留或遺忘情況,輸出門(mén)控制記憶單元中輸出的信息[11]。LSTM結(jié)構(gòu)如圖2所示。
圖2 LSTM結(jié)構(gòu)圖
LSTM的相關(guān)公式如下。
ft=σ(wf·[ht-1,xt]+bf)
(1)
式中:ft為t-1時(shí)刻記憶的衰減系數(shù);wf和bf為ft對(duì)應(yīng)的權(quán)重和偏置;ht-1為t-1時(shí)刻的輸出;xt為t時(shí)刻的輸入,通過(guò)wf·[ht-1,xt]+bf進(jìn)行線性變換;σ代表sigmoid激活函數(shù),其作用是將ft的數(shù)值范圍變?yōu)?~1。
it=σ(wi·[ht-1,xt]+bi)
(2)
式中:it為當(dāng)前t時(shí)刻下記憶的衰減系數(shù),其計(jì)算方式同ft;wi和bi為it對(duì)應(yīng)的權(quán)重和偏置。
(3)
(4)
式中ct代表t時(shí)刻的記憶狀態(tài)。以上即為輸入門(mén)和遺忘門(mén)的計(jì)算過(guò)程。輸出門(mén)的計(jì)算式為
ht=ot·tanh (ct)
(5)
ot=σ(wo·[ht-1,xt]+bo)
(6)
式中:ht代表輸出;ot為輸出門(mén)對(duì)應(yīng)的系數(shù);wo和bo為ot對(duì)應(yīng)的權(quán)重和偏置。
DSC-LSTM模型結(jié)構(gòu)如圖3所示。
圖3 DSC-LSTM結(jié)構(gòu)圖
由圖3可見(jiàn),該模型首先將故障數(shù)據(jù)進(jìn)行歸一化預(yù)處理;然后將歸一化處理后的數(shù)據(jù)輸入到第一個(gè)可分離卷積層中提取空間上的特征,激活函數(shù)選取非線性函數(shù)ReLU,通過(guò)最大池化的方式來(lái)壓縮特征;再將得到的特征送入第二個(gè)可分離卷積層中,激活函數(shù)和池化方式的選取同上;再將提取到的特征送入第三個(gè)可分離卷積層中,激活函數(shù)仍采取ReLU。經(jīng)過(guò)三個(gè)可分離卷積層后,數(shù)據(jù)維度由最初的50維下降到30維;再將第三個(gè)可分離卷積層提取到的特征作為長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM的輸入,通過(guò)LSTM獨(dú)有的記憶功能提取數(shù)據(jù)在時(shí)間域上的特征;最后將LSTM的輸出送入全連接層FC中,通過(guò)全連接層完成故障診斷任務(wù)。
本文實(shí)驗(yàn)采用田納西-伊斯曼(Tennessee-Eastman,TE)數(shù)據(jù),TE過(guò)程因數(shù)據(jù)復(fù)雜、故障類(lèi)別多樣,在故障診斷方面應(yīng)用較廣。TE過(guò)程主要由反應(yīng)器、冷凝器等組成[12],其流程如圖4所示。TE過(guò)程共計(jì)28類(lèi)故障,53個(gè)變量,其中3個(gè)變量的數(shù)值保持不變。
圖4 TE過(guò)程流程圖
本文通過(guò)TE仿真模型進(jìn)行故障數(shù)據(jù)的采集,從中選取12類(lèi)故障進(jìn)行實(shí)驗(yàn),故障類(lèi)型如表1所示。首先在正常情況下運(yùn)行模型10h,10h后引入故障,模型共運(yùn)行610h,采集各類(lèi)故障數(shù)據(jù)12000條,從每一類(lèi)故障中取7200條作為訓(xùn)練集,取1800條作為測(cè)試集,同時(shí)去掉3個(gè)數(shù)值恒定的變量,然后將其歸一化;再將訓(xùn)練集轉(zhuǎn)為4800×18×50的形式,測(cè)試集轉(zhuǎn)為1200×18×50的形式,分別為其加上標(biāo)簽,便于輸入DSC-LSTM模型中完成故障診斷任務(wù)。
表1 故障類(lèi)型表
DSC-LSTM集合方法在TE數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果如圖5所示。實(shí)驗(yàn)共進(jìn)行50次迭代。
圖5 DSC-LSTM實(shí)驗(yàn)結(jié)果圖
由圖5可見(jiàn),DSC-LSTM集合方法在訓(xùn)練集上的準(zhǔn)確率可達(dá)到99%,在測(cè)試集上的準(zhǔn)確率可達(dá)到97.1%。為驗(yàn)證該方法的有效性,同時(shí)對(duì)比了其他故障診斷方法,對(duì)比結(jié)果如表2所示。從表2中可看出DSC-LSTM集合方法在故障診斷上的準(zhǔn)確率要優(yōu)于其他方法。
表2 故障診斷結(jié)果對(duì)比表
提出一種DSC-LSTM的集合型故障診斷方法。DSC網(wǎng)絡(luò)不僅可以提取數(shù)據(jù)在空間上的特征,因其參數(shù)少,還可提高故障診斷的效率;LSTM的作用是提取時(shí)間域的特征;將兩個(gè)網(wǎng)絡(luò)結(jié)合在一起,從兩個(gè)角度更加全面地提取特征;全連接層用于分類(lèi)。在TE數(shù)據(jù)上對(duì)該方法進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明,該方法的故障診斷準(zhǔn)確率可達(dá)到97.1%。但本模型尚存較多不足之處,故障診斷的準(zhǔn)確率及速度均有待提升,后續(xù)研究中可引入優(yōu)化算法來(lái)優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)一步完善模型。