鄭樂輝,孫君杰,牛 潤(rùn),黃 瑩
(1.武警工程大學(xué) 研究生大隊(duì),西安 710086; 2.武警工程大學(xué) 信息工程學(xué)院,西安 710086)
隨著科學(xué)技術(shù)的不斷發(fā)展和工業(yè)水平的不斷提高,現(xiàn)代工業(yè)裝備為滿足產(chǎn)品的各項(xiàng)要求,不斷趨于集成化、復(fù)雜化、綜合化,因此其內(nèi)部的不確定性也越來越大。為保證裝備的安全性、穩(wěn)定性、可靠性,需要提高對(duì)集成化裝備的健康管理能力,保障設(shè)備安全穩(wěn)定地完成產(chǎn)品生產(chǎn)及設(shè)備正常工作。因此故障檢測(cè)與健康管理(DHM)就應(yīng)運(yùn)而生。
故障檢測(cè)和健康管理是通過一定的信息獲取技術(shù),通過傳感器等精密靈敏的儀器,對(duì)機(jī)械設(shè)備工作信息進(jìn)行采集,然后通過一些優(yōu)化算法和模塊構(gòu)建智能檢測(cè)預(yù)測(cè)模型,對(duì)機(jī)械設(shè)備進(jìn)行實(shí)時(shí)監(jiān)控,數(shù)據(jù)收集,故障檢測(cè),分析預(yù)測(cè)等。而集成化設(shè)備是在機(jī)械設(shè)備中普遍存在的,其由于工作環(huán)境復(fù)雜,多系統(tǒng)耦合,集成復(fù)合度高,在長(zhǎng)期服役的過程中,往往由于其監(jiān)測(cè)信息“體量浩大、多源異構(gòu)、生成快速、價(jià)值稀疏”,在獲取時(shí)要耗費(fèi)大量的人力物力。而在大數(shù)據(jù)背景下通過建立深層的學(xué)習(xí)模型,利用多種算法,能更好的展現(xiàn)龐大檢測(cè)數(shù)據(jù)和集成化裝備故障檢測(cè)和健康管理間的映射關(guān)系,大大提高了故障分類、檢測(cè)和診斷的能力。
綜上所示,對(duì)集成化設(shè)備實(shí)施故障檢測(cè)和健康管理具有如下意義:
1)能保證集成化設(shè)備安全穩(wěn)定工作,防止意外事故發(fā)生。通過故障檢測(cè)模型和相應(yīng)的檢測(cè)手段,及時(shí)發(fā)現(xiàn)設(shè)備異常工作狀態(tài),并采用及時(shí)的應(yīng)對(duì)措施,相對(duì)延長(zhǎng)設(shè)備壽命,圓滿完成工作任務(wù)。
2)高效完成設(shè)備管控,減少人力物力資源,獲得潛在經(jīng)濟(jì)效益。能夠降低人力、物力資源成本,提高設(shè)備利用率,完善設(shè)備管理方案,減小設(shè)備故障損失。
3)與大數(shù)據(jù)背景下的云計(jì)算深度學(xué)習(xí)等緊密結(jié)合,具有時(shí)代前沿性??梢栽诖髷?shù)據(jù)背景下進(jìn)行特征提取,不僅大大縮短特征提取的時(shí)間,而且能夠做到實(shí)時(shí)監(jiān)測(cè)。能有效存儲(chǔ)利用海量的數(shù)據(jù),發(fā)展和優(yōu)化在集成化裝備領(lǐng)域的深度學(xué)習(xí)方法,利用邊緣運(yùn)算架構(gòu),在大數(shù)據(jù)的支持下實(shí)現(xiàn)快速精確診斷。
要完成對(duì)集成化裝備的故障檢測(cè)和健康管理,必須收集裝備的各項(xiàng)參數(shù)指標(biāo),而集成化裝備因其自身屬性原因在工作過程中往往難以進(jìn)行人工信息采集,所以現(xiàn)代工業(yè)往往采用一系列的監(jiān)視監(jiān)察系統(tǒng)對(duì)其工作狀態(tài)進(jìn)行獲取,這樣能夠保障及時(shí)獲取集成化裝備的各項(xiàng)參數(shù)指標(biāo)。在獲取裝備運(yùn)行參數(shù)和歷史運(yùn)行記錄后,也能連續(xù)地對(duì)設(shè)備運(yùn)行狀態(tài)進(jìn)行診斷和預(yù)測(cè)分析,能夠大大降低設(shè)備發(fā)生故障造成的損失,從而實(shí)現(xiàn)對(duì)設(shè)備的健康管理。
在利用CNN模型解決故障檢測(cè)問題上,何江江等[1]通過經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)和支持向量機(jī)(SVM)對(duì)信號(hào)進(jìn)行分解,并結(jié)合CNN模型,解決了端點(diǎn)發(fā)散問題,提高了精確度。文獻(xiàn)[2]將遷移學(xué)習(xí)引入滾動(dòng)軸承,通過基于遷移學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)(TCNN)和短時(shí)間傅里葉變換(STFT),構(gòu)建在線CNN和離線CNN,提高實(shí)時(shí)性,在有限訓(xùn)練時(shí)間內(nèi)達(dá)到期望的診斷精度。曲建嶺等[3]提出了一種直接作用于原始信號(hào)的自適應(yīng)一維卷積神經(jīng)網(wǎng)絡(luò)(1D-CNN)用于滾動(dòng)軸承的故障診斷,并取得了99%以上的故障識(shí)別率。文獻(xiàn)[4]通過對(duì)傳統(tǒng)的DCNN模型進(jìn)行自適應(yīng)訓(xùn)練得到了ADCNN模型,使得對(duì)軸承的故障診斷的泛化能力得到了提升。文獻(xiàn)[5]提出了一種具有擴(kuò)大接收?qǐng)龅脑鰪?qiáng)卷積神經(jīng)網(wǎng)絡(luò)(enhanced convolutional neural network,ECNN)的行星齒輪箱的故障診斷方法。通過經(jīng)過擴(kuò)張的幾個(gè)卷積層,擴(kuò)大接收?qǐng)?,然后通過ECNN訓(xùn)練模型,在精度上有了很大的提升。文獻(xiàn)[6]基于CNN網(wǎng)絡(luò),通過信號(hào)轉(zhuǎn)換,降低了電機(jī)故障診斷模型的復(fù)雜性,克服了過擬合問題。孔子遷等[7]使用CNN網(wǎng)絡(luò)在時(shí)域和頻域上提取信號(hào)特征,完成了齒輪盒健康管理的故障檢測(cè),不僅提高檢測(cè)精度,而且準(zhǔn)確對(duì)故障類別進(jìn)行分類。利用CNN雖然能保證模型的魯棒性,并提升泛化能力,但是其網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,常常需要多層網(wǎng)絡(luò)結(jié)構(gòu),對(duì)計(jì)算機(jī)的要求較高,因此常常在使用CNN網(wǎng)絡(luò)時(shí)結(jié)合其他一些算法,減少計(jì)算機(jī)的運(yùn)算時(shí)間,提高效率。
在FCM聚類算法方面,文獻(xiàn)[8]對(duì)DBN網(wǎng)絡(luò)的結(jié)構(gòu)進(jìn)行改進(jìn),將重構(gòu)獨(dú)立分析(reconstruction independt component analysis,RICA)方法引入到DBN網(wǎng)絡(luò)中,提出了RIDBN網(wǎng)絡(luò),將RIDBN網(wǎng)絡(luò)與FCM算法相結(jié)合提出了RIDBN-FCM聚類模型并且應(yīng)用于齒輪故障診斷中,不僅提高了模型的泛化能力,而且精度也有所提升。但FCM作為一種聚類算法,并不能單純地應(yīng)用于故障檢測(cè),常常要與其他網(wǎng)絡(luò)綜合使用。
在LSTM算法方面,LSTM算法可以反映前向信息和后向信息的緊密聯(lián)系,對(duì)時(shí)間信號(hào)的敏感程度很高,因此在故障檢測(cè)和預(yù)測(cè)應(yīng)用很多,比如LSTM算法在股票指數(shù)預(yù)測(cè)[9],電力負(fù)荷概率預(yù)測(cè)[10],軸承故障預(yù)測(cè)[11],車輛軌跡預(yù)測(cè)和交通流量[12]等領(lǐng)域都有應(yīng)用。但單一的LSTM網(wǎng)絡(luò)遠(yuǎn)遠(yuǎn)無法滿足現(xiàn)代化集成裝備的檢測(cè)要求,其檢測(cè)時(shí)間長(zhǎng),且模型精度達(dá)不到高效快速檢測(cè)的要求。因此其模型的診斷精度和檢測(cè)速度仍需提升。
在后續(xù)的發(fā)展過程中,研究專家們將LSTM與CNN網(wǎng)絡(luò)結(jié)合起來使用,不僅提高了模型精度,縮短了檢測(cè)時(shí)長(zhǎng),使檢測(cè)效果大幅提升。在股票指數(shù)預(yù)測(cè)方面,文獻(xiàn)[13]將LSTM模型和CNN模型結(jié)合對(duì)股票指數(shù)進(jìn)行預(yù)測(cè),基本可以達(dá)到實(shí)時(shí)預(yù)測(cè)的目的,使預(yù)測(cè)效果大大增強(qiáng)。在電力負(fù)荷預(yù)測(cè)方面,文獻(xiàn)[14]將LSTM結(jié)合CNN后,加上注意力機(jī)制模塊,使模型精度得到大幅提升。同時(shí)在軸承故障預(yù)測(cè)[15]和車輛軌跡預(yù)測(cè)[16-17]方面,當(dāng)CNN和LSTM結(jié)合后,預(yù)測(cè)效果均得到提升。LSTM和CNN的結(jié)合還應(yīng)用在無人機(jī)[18]、網(wǎng)絡(luò)[19]、單元設(shè)備[20]、工業(yè)[21]、軸承故障檢測(cè)[22-23]等領(lǐng)域得到了應(yīng)用。文獻(xiàn)[24]使用雙卡爾曼濾波對(duì)提升了故障診斷的實(shí)時(shí)性。利用CNN與長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)網(wǎng)絡(luò)結(jié)合能有效處理時(shí)間序列數(shù)據(jù)的優(yōu)點(diǎn),模型精度得到很大提升。文獻(xiàn)[25]提出了一種CNN、LSTM與遷移學(xué)習(xí)相結(jié)合的故障識(shí)別方法,可以有效的對(duì)多類故障識(shí)別。將CNN和LSTM融合模型結(jié)合起來,CNN先對(duì)信息特征進(jìn)行提取,然后LSTM網(wǎng)絡(luò)將信息的內(nèi)在聯(lián)系表達(dá)出來。CNN網(wǎng)絡(luò)對(duì)數(shù)據(jù)信息具有很大的包容性,可以高效處理數(shù)據(jù)且不使數(shù)據(jù)丟失。但LSTM無法表現(xiàn)出前向信息和后向信息的關(guān)系,而Bi-LSTM卻能將所獲取的時(shí)間信息前后聯(lián)系起來,使檢測(cè)效果更好。因此Bi-LSTM也漸漸被應(yīng)用于各個(gè)領(lǐng)域。文獻(xiàn)[26]將Bi-LSTM應(yīng)用于人機(jī)語(yǔ)言交互上,大大提高了機(jī)器人語(yǔ)言識(shí)別的準(zhǔn)確率。文獻(xiàn)[27]則將其應(yīng)用于電子裝備故障預(yù)測(cè),將電子裝備前后時(shí)間關(guān)系聯(lián)系起來,提高了預(yù)測(cè)的精度。
在Bi-LSTM和CNN結(jié)合使用方面,其在船舶[28]、鋰電池壽命預(yù)測(cè)[29],風(fēng)電機(jī)[30],太陽(yáng)輻照度預(yù)測(cè)[31]等領(lǐng)域均有應(yīng)用,且取得了非常好的檢測(cè)效果。因此本文針對(duì)集成化裝備,基于深度學(xué)習(xí)的基本框架,提出了一種基于CNN和Bi-LSTM及其優(yōu)化算法,建立了Bi-LSTM-CNN-FCM模型,提高了故障預(yù)測(cè)的精度,降低了其損失值,并與其他算法進(jìn)行對(duì)比,證明該算法的優(yōu)越性。
循環(huán)神經(jīng)網(wǎng)絡(luò)( recurrent neural network,RNN)是一類用于處理序列數(shù)據(jù)的網(wǎng)絡(luò)模型。它的本質(zhì)就是網(wǎng)絡(luò)不僅在層外建立連接,而且在層內(nèi)建立連接,其層內(nèi)的連接可以保留隱藏層節(jié)點(diǎn)的狀態(tài)并提供記憶,其大致結(jié)構(gòu)如圖1所示。長(zhǎng)短期記憶(long short term memory,LSTM)網(wǎng)絡(luò)就是RNN網(wǎng)絡(luò)的一種變形,目的就是解決了梯度反向傳播過程中的梯度消失和爆炸問題。
圖1 RNN網(wǎng)絡(luò)結(jié)構(gòu)
Bi-LSTM算法就是以LSTM算法為基礎(chǔ),在LSTM算法只記錄前向信息的情況下同時(shí)記錄后向信息,同時(shí)結(jié)合前后向信息進(jìn)行特征提取。對(duì)于時(shí)間t的輸出,前向LSTM層在輸入序列中有時(shí)間t和時(shí)間t之前的信息,后向LSTM層在輸入序列中有時(shí)間t和之后的信息。通過疊加得到正向LSTM層t時(shí)刻的輸出結(jié)果和反向LSTM層t時(shí)刻的輸出結(jié)果,并通過加法、平均法或連接法處理兩層LSTM層的矢量輸出,這樣輸出信息就較好反映時(shí)間信號(hào)前后聯(lián)系。
LSTM雖然能夠較好地捕捉到較長(zhǎng)距離的依賴關(guān)系,在時(shí)間上捕捉特征之間的聯(lián)系,但是其難以表現(xiàn)出后向信息對(duì)前向信息的影響。而故障檢測(cè)過程中需要將故障前后信息進(jìn)行綜合從而對(duì)裝備壽命進(jìn)行預(yù)測(cè)。因此改進(jìn)后的新算法BI-LSTM算法能很好地解決這個(gè)問題。
CNN是一個(gè)典型的前饋神經(jīng)網(wǎng)絡(luò),他是由多個(gè)濾波器組成,濾波器提取輸入信號(hào)的數(shù)據(jù)特征,然后逐步通過卷積層、子采樣層、全連接層和輸出層。在逐層通過時(shí)不斷提取信號(hào)中的特征,使得特征逐漸抽象,最終獲得輸入數(shù)據(jù)的平移、旋轉(zhuǎn)及縮放不變的特征。其結(jié)構(gòu)圖如圖2所示。
圖2 CNN網(wǎng)絡(luò)結(jié)構(gòu)
卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到的模式具有平移不變性,可以學(xué)習(xí)模式的空間層次結(jié)構(gòu)。它訓(xùn)練的通常順序?yàn)橥ǔm樞驗(yàn)椋狠斎搿矸e層—池化層—卷積層—池化層—…—全連接層—輸出。CNN的核心就是空間卷積核參數(shù)共享和池化,卷積層對(duì)樣本數(shù)據(jù)的特征進(jìn)行提取,子采樣層對(duì)特征進(jìn)行采樣,池化層是對(duì)提取特征的選擇和信息過濾,全連接層與前一層互連。
CNN的平移不變性使其能保證模型的魯棒性,并提升泛化能力,同時(shí)CNN能對(duì)關(guān)聯(lián)信息和數(shù)據(jù)進(jìn)行處理,因此其非常適用于集成裝備的故障檢測(cè)。CNN能克服大噪聲的干擾,也非常適用于現(xiàn)代工業(yè),可用于多源信號(hào)處理。
CNN雖然有很多優(yōu)點(diǎn),但是其網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,常常需要多層網(wǎng)絡(luò)結(jié)構(gòu),對(duì)計(jì)算機(jī)的要求較高,并且單獨(dú)使用CNN需要大量帶標(biāo)簽的數(shù)據(jù),因此,本文在使用CNN網(wǎng)絡(luò)使將結(jié)合LSTM算法和FCM算法,不僅可以降低運(yùn)算量,使網(wǎng)絡(luò)復(fù)雜結(jié)構(gòu)降低,而且可以優(yōu)化特征提取的過程,大大提高模型精度。
FCM算法是一種常用的聚類分析方法,可以根據(jù)樣本數(shù)據(jù)的特征,把有相同或相似特征的樣本或時(shí)間信息歸類,然后提取相似樣本數(shù)據(jù)的特征值。FCM算法的原理就是通過不斷更新聚類中心,使得聚類中心不再改變或兩次迭代的目標(biāo)函數(shù)值之差在允許的范圍內(nèi),從而完成聚類。
FCM算法因其較為出色的聚類能力,非常適合故障的歸類,在經(jīng)過CNN和Bi-LSTM處理后的故障信息再經(jīng)過FCM算法后可完成分類,完成對(duì)集成化裝備故障的檢測(cè)。FCM聚類在應(yīng)用過程中也存在一些缺點(diǎn),比如選擇的模糊度參數(shù)不同,也會(huì)對(duì)整個(gè)算法的精度產(chǎn)生影響,所以在使用FCM算法時(shí),常常也需要靠一些先驗(yàn)經(jīng)驗(yàn),參考一些模糊度參數(shù)的使用來完善模型。
本文提到的Bi-LSTM-CNN-FCM模型的結(jié)構(gòu)圖如3圖所示,實(shí)驗(yàn)過程模型按照如下環(huán)節(jié)進(jìn)行,如圖3所示。
圖3 Bi-LSTM-CNN-FCM網(wǎng)絡(luò)結(jié)構(gòu)
對(duì)于上述獲取的變量中的各類數(shù)據(jù),模型首先通過CNN網(wǎng)絡(luò)提取變量中的各類故障特征,然后通過BI-LSTM預(yù)測(cè)獲得數(shù)據(jù)的標(biāo)簽,通過這兩個(gè)網(wǎng)絡(luò)可以直接對(duì)變量中的數(shù)據(jù)進(jìn)行分類,模型的輸出為屬于每一個(gè)類別的概率。
獲得信號(hào)的數(shù)據(jù)在經(jīng)過序列折疊層后構(gòu)建出數(shù)據(jù)幀,在特征提取的過程中,卷積層可實(shí)現(xiàn)對(duì)故障信號(hào)的特征提取,序列展開層和扁平化層用于恢復(fù)序列結(jié)構(gòu)、輸出矢量序列。
Bi-LSTM層和輸出層用于對(duì)輸出的矢量序列進(jìn)行分類。Bi-LSTM層在輸入的信號(hào)中,不僅包含經(jīng)過預(yù)處理后的特征信息,而且還包含了原始信息,通過對(duì)信息前向和后向的共同處理,實(shí)現(xiàn)信息融合使輸入信號(hào)中包含更多信息,提高了診斷準(zhǔn)確率。在Bi-LSTM層后設(shè)置了FCM層,作為整個(gè)模型優(yōu)化參數(shù)設(shè)計(jì)的一部分,進(jìn)一步提高了診斷精度。
在現(xiàn)代軍事裝備制造領(lǐng)域,大型液體運(yùn)載火箭就是典型的集成化裝備。其內(nèi)部構(gòu)造冗雜,且大多數(shù)部件不可視化,處于黑盒狀態(tài)。由于大型液體運(yùn)載火箭故障率低,且一旦發(fā)生故障就會(huì)造成巨大損失,所以本文選取了能代表大部分集成化設(shè)備工作工程的田納西-伊斯曼化工過程。其數(shù)據(jù)的構(gòu)成及復(fù)雜程度基本與集成化設(shè)備吻合。
田納西-伊斯曼化工過程數(shù)據(jù)是基于田納西-伊斯曼化學(xué)公司的一個(gè)真實(shí)化工過程的仿真數(shù)據(jù)。該化工過程比較好的模擬了實(shí)際復(fù)雜工業(yè)過程系統(tǒng)的許多典型特征,因此被廣泛運(yùn)用于過程監(jiān)測(cè)與故障診斷的研究中。
整個(gè)過程主要包含五個(gè)操作單元,反應(yīng)器,冷凝器,循環(huán)壓縮器,分離器和氣體塔。此過程中包含了12個(gè)操縱變量和41個(gè)測(cè)量變量。許多研究者提出了該過程的控制方案較為廣泛,被引用的有基本控制,分散控制和機(jī)控制這三種控制策略。在田納西-伊斯曼化工過程中共設(shè)計(jì)了21種故障,用于模擬實(shí)際工業(yè)過程中常見的故障和擾動(dòng)。而本文也主要是針對(duì)該過程中的故障進(jìn)行檢測(cè)和預(yù)測(cè),從而實(shí)現(xiàn)對(duì)集成化裝備的健康管理。
在該過程中,共有22個(gè)訓(xùn)練集,22個(gè)測(cè)試集,每個(gè)訓(xùn)練集由52個(gè)測(cè)量信號(hào)組成,共480行,每個(gè)測(cè)試集有52個(gè)測(cè)量信號(hào)組成,共960行。本文選取變量中均有正常數(shù)據(jù)和故障數(shù)據(jù),對(duì)于同時(shí)段的變量,每個(gè)變量截取500個(gè)觀測(cè)值,構(gòu)建52*500的測(cè)量數(shù)據(jù)幀并歸一化。
在對(duì)信號(hào)進(jìn)行頻率提取時(shí),正常信號(hào)與故障信號(hào)有明顯差異。其正常信號(hào)和故障信號(hào)對(duì)比圖4所示。
圖4 正常信號(hào)與故障信號(hào)對(duì)比圖
其中上圖為五個(gè)變量在正常工作下的數(shù)據(jù)狀態(tài)。正常工作下振動(dòng)正常波動(dòng),通過設(shè)備可實(shí)時(shí)檢測(cè)。
當(dāng)其中變量出現(xiàn)故障時(shí),其運(yùn)行圖像會(huì)發(fā)生明顯變化,在一段時(shí)間幀上會(huì)有一段時(shí)間間隔內(nèi)出現(xiàn)波動(dòng)異常,甚至停止波動(dòng),能夠明顯區(qū)分出其為故障狀態(tài)。
由于不同故障其表現(xiàn)狀態(tài)也不同,但通過傳感器收集到的信息可以在經(jīng)過一定的預(yù)處理后將其分辨出來。但是要尋找到眾多故障設(shè)備并區(qū)分出故障種類,然后進(jìn)行故障預(yù)測(cè),仍然是需要考慮的問題。而本文提出的一種基于CNN和LSTM及其優(yōu)化算法的Bi-LSTM-CNN-FCM模型能很好地解決上述問題。
在對(duì)模型進(jìn)行訓(xùn)練的過程中,將80%的數(shù)據(jù)集作為訓(xùn)練集,將20%用作測(cè)試集。同時(shí)每個(gè)變量有20%的概率為故障數(shù)據(jù),這樣能夠保證數(shù)據(jù)獲取的隨機(jī)性與獨(dú)立性,通過上述的數(shù)據(jù)處理,能夠保證構(gòu)建的數(shù)據(jù)集和數(shù)據(jù)幀中包含各類正常數(shù)據(jù)和故障數(shù)據(jù)的隨機(jī)組合,實(shí)現(xiàn)數(shù)據(jù)的隨機(jī)獲取。本文實(shí)驗(yàn)使用模型采用的數(shù)據(jù)集和參數(shù)配置如表1所示。
表1 模型的數(shù)據(jù)集和參數(shù)配置
在使用神經(jīng)網(wǎng)絡(luò)時(shí),為解決其深層網(wǎng)絡(luò)模型的非線性問題,常常要用到激活函數(shù)。激活函數(shù)一般有三種:relu激活函數(shù)、tanh激活函數(shù)和sigmoid激活函數(shù)。
relu激活函數(shù)公式為:
a=g(z)=max(0,x)
sigmoid激活函數(shù)公式為:
tanh激活函數(shù)公式為:
在所有激活函數(shù)中,relu激活函數(shù)使用頻率最高,因其具有硬飽和性質(zhì),很多網(wǎng)絡(luò)都會(huì)優(yōu)先使用。tanh激活函數(shù)和sigmoid激活函數(shù)都具有軟飽和性質(zhì),sigmid激活函數(shù)常常用在輸入的數(shù)據(jù)特征不是很明顯的時(shí)候,因此常用于分類問題的輸出層。而tanh激活函數(shù)幾乎適用于大部分的網(wǎng)絡(luò),但常常還是用于輸入的數(shù)據(jù)不明顯時(shí)。
因此,本文探討的各個(gè)網(wǎng)絡(luò)層使用何種激活函數(shù)是基于使用激活函數(shù)后模型的效果和精度決定的。其具體使用效果如表2所示。
表2 激活函數(shù)選擇對(duì)模型影響
通過表中內(nèi)容可知,在訓(xùn)練時(shí)長(zhǎng)上,無論使用什么激活函數(shù),其訓(xùn)練時(shí)間基本沒有什么差異,但在精度率上,卷積層使用tanh激活函數(shù),全連接層使用relu激活函數(shù)的模型精度是遠(yuǎn)高于使用其他激活函數(shù)的,其模型精度達(dá)到了98.2%。
因此本文將tanh激活函數(shù)在卷積層使用,將relu激活函數(shù)在全連接層使用。
在實(shí)驗(yàn)過程中,本文通過不斷增加迭代次數(shù)觀察其損失值和精度隨迭代次數(shù)的變化,從判斷出最適合此過程的迭代次數(shù)。同時(shí)通過與其他方法的對(duì)比,檢驗(yàn)該方法的優(yōu)越性。
在用訓(xùn)練集將模型訓(xùn)練好后,用測(cè)試集對(duì)其進(jìn)行測(cè)試。首先我們對(duì)LSTM算法進(jìn)行驗(yàn)證,測(cè)試用單一LSTM算法訓(xùn)練的模型,觀察其迭代次數(shù)與精度和損失值之間的變化關(guān)系。其關(guān)系如圖5所示。
圖5 LSTM迭代次數(shù)與精度和損失值之間的變化關(guān)系
通過圖5分析可知,單一的LSTM算法建立的模型用于診斷時(shí),其迭代次數(shù)在3 500次左右時(shí)精度和損失值才趨于穩(wěn)定,且精度值穩(wěn)定在90%左右,損失值穩(wěn)定在0.1左右。由此可見需要對(duì)LSTM算法進(jìn)行改進(jìn)并結(jié)合新算法,減少模型運(yùn)行需要的迭代次數(shù)并提高精度和降低損失值,為達(dá)到這一目的我們引入Bi-LSTM-CNN-FCM模型,并對(duì)該模型進(jìn)行評(píng)價(jià)和對(duì)比,證明其優(yōu)越性。首先比較迭代次數(shù)對(duì)損失值和精度的影響。通過合適的訓(xùn)練測(cè)試尋找到田納西-伊斯曼化工過程數(shù)據(jù)的最適合的迭代次數(shù)。通過不斷增加迭代次數(shù),觀察其波形圖。在對(duì)Bi-LSTM-CNN-FCM模型進(jìn)行驗(yàn)證時(shí),本文最高迭代次數(shù)選擇為1 800次。其損失值和精度隨迭代次數(shù)變化的波形圖如圖6所示。
圖6 Bi-LSTM-CNN-FCM迭代次數(shù)與精度和損失值之間的變化關(guān)系
通過圖像對(duì)比,可以很明顯的發(fā)現(xiàn)當(dāng)?shù)螖?shù)達(dá)到800次時(shí),其準(zhǔn)確率和損失值趨于穩(wěn)定,準(zhǔn)確率穩(wěn)定在98%左右,損失值由于過小,觀測(cè)無法準(zhǔn)確判斷,將在進(jìn)一步的實(shí)驗(yàn)中進(jìn)行具體比較。為保證實(shí)驗(yàn)的準(zhǔn)確性,在后續(xù)實(shí)驗(yàn)中,迭代次數(shù)最高定在了1 000次。
由此可見Bi-LSTM-CNN-FCM模型在迭代次數(shù)上也能有一定的減少,經(jīng)過一定預(yù)處理后的數(shù)據(jù)在模型運(yùn)行過程也能使迭代次數(shù)減少。
為驗(yàn)證Bi-LSTM-CNN-FCM的優(yōu)越性,同時(shí)將LSTM模型、CNN模型以及Bi-LSTM-CNN-FCM模型應(yīng)用在田納西-伊斯曼化工過程數(shù)據(jù)集上,并在準(zhǔn)確度和損失值上進(jìn)行比較。準(zhǔn)確率即為模型檢測(cè)的準(zhǔn)確度,損失值即為模型的預(yù)測(cè)值和真實(shí)值不一樣的程度,損失值越低,模型性能越好。其對(duì)比結(jié)果如圖7所示。
圖7 模型性能對(duì)比圖
通過查閱文獻(xiàn)資料,最新算法中在損失值和準(zhǔn)確率綜合對(duì)比中,效果較好的是LSTM-CNN模型,其損失值為0.051 2,準(zhǔn)確率為0.972 6。為方便對(duì)比,本文將LSTM模型、CNN模型以及Bi-LSTM-CNN-FCM模型的數(shù)值對(duì)比總結(jié)如表3所示。
表3 模型性能數(shù)值對(duì)比
通過對(duì)比可以發(fā)現(xiàn)Bi-LSTM-CNN-FCM模型在性能上明顯優(yōu)越于其他兩種算法。在準(zhǔn)確率上,Bi-LSTM-CNN-FCM模型的準(zhǔn)確率為98.25%,而單一的LSTM模型的準(zhǔn)確率僅為89.19%,在準(zhǔn)確率上該模型提升了9.06%,相比于LSTM-CNN模型,準(zhǔn)確率也有小幅提升,由此可以看出在準(zhǔn)確率方面Bi-LSTM-CNN-FCM模型確實(shí)有其可取之處,能大大提高模型的準(zhǔn)確率。在損失值方面,Bi-LSTM-CNN-FCM模型的損失值僅為0.010 4,而單純的LSTM模型的損失值卻為0.070 0,LSTM-CNN模型為0.051 2,該模型在損失值方面雖然減少了不多,但也有小幅提升。由此可見Bi-LSTM-CNN-FCM模型適用于田納西-伊斯曼化工過程數(shù)據(jù)集,適用于現(xiàn)代化集成裝備的故障檢測(cè),并且在模型性能上相比于單一的LSTM模型有較大的提升。雖然相對(duì)來說這也消耗了更大的算力和運(yùn)行時(shí)間,但其模型性能得到了較大的提升,能在故障診斷和預(yù)測(cè)領(lǐng)域有較好的運(yùn)用。
本文從集成化裝備故障檢測(cè)與健康管理出發(fā),并用田納西-伊斯曼化工過程數(shù)據(jù)進(jìn)行驗(yàn)證,提出了一種基于CNN和Bi-LSTM及其優(yōu)化算法,通過對(duì)LSTM算法的改進(jìn),建立了Bi-LSTM-CNN-FCM模型。首先,通過觀察不同激活函數(shù)對(duì)模型精度和效果的影響選擇合適的激活函數(shù),然后通過對(duì)模型迭代次數(shù)的研究,確定Bi-LSTM-CNN-FCM模型的基本性能結(jié)構(gòu),最后通過實(shí)驗(yàn)驗(yàn)證以及模型對(duì)比,證明了Bi-LSTM-CNN-FCM模型在準(zhǔn)確率上有很大的提升,達(dá)到了98.25%,同時(shí)損失值也有小幅的降低,減小量達(dá)到0.040 8。由此可以看出Bi-LSTM-CNN-FCM模型在集成化裝備故障檢測(cè)與健康管理方面適用性較好。但是,由于模型復(fù)雜程度高,其所需要的算力和消耗時(shí)長(zhǎng)也更多,因此在下一步的工作中會(huì)解決模型運(yùn)行時(shí)間長(zhǎng)等問題,對(duì)模型進(jìn)行進(jìn)一步的優(yōu)化提升,同時(shí)在掌握故障檢測(cè)模型后,對(duì)模型進(jìn)行在次用化,建立故障預(yù)測(cè)模型,用RUL對(duì)模型剩余壽命進(jìn)行預(yù)測(cè)。