李方 郭煒森 張平 羅龍
(華南理工大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,廣東 廣州 510006)
故障預(yù)測(cè)和健康管理(PHM)是指利用大量狀態(tài)監(jiān)測(cè)數(shù)據(jù)和信息,借助統(tǒng)計(jì)算法或模型來評(píng)估和管理裝備的健康狀態(tài),提前對(duì)潛在故障進(jìn)行預(yù)測(cè)。剩余使用壽命(RUL)預(yù)測(cè)技術(shù)是PHM 的關(guān)鍵技術(shù)之一,其通過分析傳感器監(jiān)測(cè)的運(yùn)行數(shù)據(jù)或建立合適的退化模型對(duì)系統(tǒng)或部件的RUL進(jìn)行提前預(yù)測(cè),提高生產(chǎn)過程的安全性及降低維護(hù)成本。
目前,實(shí)現(xiàn)軸承剩余使用壽命預(yù)測(cè)的主流方法大致可以分為:基于物理模型的預(yù)測(cè)方法[1]和基于數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)方法[2],以及上述兩種方法的混合方法[3]?;谖锢砟P偷姆椒ㄒ话阈枰袠I(yè)專家的知識(shí)來對(duì)目標(biāo)系統(tǒng)內(nèi)部運(yùn)行機(jī)制進(jìn)行建模分析,構(gòu)建物理模型描述衰減過程,優(yōu)點(diǎn)是對(duì)于特定系統(tǒng)準(zhǔn)確性有保證。然而,軸承的壽命衰減過程復(fù)雜,不同環(huán)境對(duì)應(yīng)不同的衰減模式,以至于難以實(shí)時(shí)地使用物理模型對(duì)其系統(tǒng)狀態(tài)進(jìn)行描述[3]。隨著人工智能、大數(shù)據(jù)等技術(shù)的蓬勃發(fā)展,加上物聯(lián)網(wǎng)、傳感器和信號(hào)處理技術(shù)的普及,基于數(shù)據(jù)驅(qū)動(dòng)的方法逐漸成為主流[4],而在數(shù)據(jù)驅(qū)動(dòng)方法中,基于深度學(xué)習(xí)的方法是近年來的代表[5],其通過借助一些機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法,如支持向量機(jī)(SVM)[6]、相關(guān)向量機(jī)(RVM)[7]、人工神經(jīng)網(wǎng)絡(luò)(ANN)[8]、卷積神經(jīng)網(wǎng)絡(luò)(CNN)[9-10]、遞歸神經(jīng)網(wǎng)絡(luò)(RNN)[11]、長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)[12]等建立有效的RUL 預(yù)測(cè)模型,對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行處理以實(shí)現(xiàn)RUL預(yù)測(cè)。因其不依賴專家經(jīng)驗(yàn)以及所研究系統(tǒng)的內(nèi)部機(jī)制知識(shí),且性能強(qiáng)大,所以能夠自適應(yīng)地從原始數(shù)據(jù)中學(xué)習(xí)到特征,從而能準(zhǔn)確地對(duì)壽命衰減過程進(jìn)行建模[5]。
卷積神經(jīng)網(wǎng)絡(luò)有著強(qiáng)大的特征提取能力,廣泛應(yīng)用于圖像、語音識(shí)別等領(lǐng)域,也可應(yīng)用于RUL的預(yù)測(cè)。Li等[13]基于時(shí)頻域特征提取方法,對(duì)原始數(shù)據(jù)進(jìn)行短時(shí)傅里葉變換,進(jìn)而采用多尺度卷積神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行進(jìn)一步特征提取,具體為每段采樣樣本進(jìn)行多卷積層輸出的拼接,然后將連續(xù)采樣段經(jīng)過多尺度提取后的特征按元素相加,并將獲得的高層特征映射為RUL;Zhu 等[9]提出一種基于時(shí)頻域體征提取的多尺度卷積神經(jīng)網(wǎng)絡(luò)MSCNN,采用小波變換將原始數(shù)據(jù)轉(zhuǎn)化為二維圖像,然后輸入到卷積神經(jīng)網(wǎng)絡(luò),經(jīng)過多層卷積和池化操作后,將最后兩層特征圖通過拼接方式組成最終特征,通過全連接網(wǎng)絡(luò)輸出得到RUL 預(yù)測(cè)值。Wang 等[14]提出了一種基于3D 卷積的RUL 預(yù)測(cè)方法,首先將原始信號(hào)以連續(xù)小波變換轉(zhuǎn)化為2維圖,再以時(shí)間維度堆疊成3 維張量,最后輸入到3D 卷積神經(jīng)網(wǎng)絡(luò)中提取特征,并預(yù)測(cè)得到健康指標(biāo)(HI),之后利用已得到的HI 由高斯過程回歸的方法估計(jì)得到未來的健康指標(biāo)。
由于循環(huán)神經(jīng)網(wǎng)絡(luò)及其變體有著強(qiáng)大的時(shí)序建模能力,所以非常適合剩余使用壽命預(yù)測(cè)任務(wù),是長(zhǎng)久以來的研究熱點(diǎn)。Guo 等[11]提出了一種方法,其采用手工提取時(shí)域、頻域、時(shí)頻域特征,然后從中篩選出單調(diào)性和趨勢(shì)性平均最好的特征,進(jìn)而將其作為循環(huán)神經(jīng)網(wǎng)絡(luò)的輸入,最后輸出設(shè)備的健康指標(biāo)。對(duì)于未來的HI,根據(jù)當(dāng)前HI 曲線采用雙指數(shù)模型進(jìn)行擬合,得到完整的HI 曲線,并設(shè)計(jì)一個(gè)閾值,當(dāng)HI 超過該閾值時(shí)則判定設(shè)備為失效。Ma 等[15]采用連續(xù)小波變換將原始信號(hào)轉(zhuǎn)為二維矩陣,然后將該矩陣按列劃分為時(shí)間上連續(xù)的列向量,作為門控循環(huán)網(wǎng)絡(luò)(GRU)的輸入預(yù)測(cè)RUL;Chen 等[16]采用了一種編碼器-解碼器結(jié)構(gòu)的雙向GRU 網(wǎng)絡(luò),在PHM2012 數(shù)據(jù)集中,將原始數(shù)據(jù)的頻域譜分為5個(gè)子頻帶作為模型輸入,在編碼器的輸出中加入了注意力機(jī)制,解碼器經(jīng)過注意力權(quán)重計(jì)算得到預(yù)測(cè)結(jié)果;溫海茹等[17]提出了一種深度學(xué)習(xí)混合的DCNN-LSTM 網(wǎng)絡(luò)系統(tǒng)模型,將深度卷積神經(jīng)網(wǎng)絡(luò)作為特征提取網(wǎng)絡(luò)、堆疊的LSTM 作為時(shí)序特征提取器,并利用網(wǎng)格搜索算法得到最優(yōu)混合模型超參數(shù),最后在C-MAPSS 數(shù)據(jù)集上實(shí)驗(yàn),得到了較好的結(jié)果。Qin 等[18]提出了一種基于雙門閥注意力的門控循環(huán)單元網(wǎng)絡(luò),該網(wǎng)絡(luò)通過對(duì)輸入和隱狀態(tài)做一種自注意力和對(duì)重置門與更新門的注意力,來提升網(wǎng)絡(luò)對(duì)狀態(tài)轉(zhuǎn)移中的關(guān)鍵信息捕捉能力,增強(qiáng)RUL 的預(yù)測(cè)能力。Xiang 等[19]提出了一種時(shí)空多差分處理的RUL預(yù)測(cè)方法,該方法修改細(xì)胞狀態(tài),以內(nèi)部自差分的方法得到多種不同的記憶體,分別有長(zhǎng)期、長(zhǎng)中期、中期、中短期、短期狀態(tài)記憶,并將原有的全局和局部趨勢(shì)再細(xì)分為對(duì)應(yīng)趨勢(shì),他們認(rèn)為這樣的差分能夠充分反映設(shè)備長(zhǎng)期和短期衰減趨勢(shì);另外,該方法還通過循環(huán)和卷積網(wǎng)絡(luò)雙路預(yù)測(cè)分別提取傳感數(shù)據(jù)空間和時(shí)間上的特征,并預(yù)測(cè)所處階段,再根據(jù)對(duì)應(yīng)衰減階段進(jìn)行相應(yīng)的特征提取處理。
但是,將淺層特征提取器和循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行串聯(lián)結(jié)合無法最大地發(fā)揮兩者的優(yōu)勢(shì)。Wang 等[20]提出了一種基于卷積操作的門控循環(huán)單元神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)本質(zhì)上是一種結(jié)合了卷積操作的循環(huán)神經(jīng)網(wǎng)絡(luò)。該方法采用不依賴手工數(shù)據(jù)特征工程,直接將原始數(shù)據(jù)作為模型輸入,實(shí)現(xiàn)了真正端到端的學(xué)習(xí)。經(jīng)過多層卷積GRU 網(wǎng)絡(luò)后以一種蒙特卡洛丟棄的不確定性方法來預(yù)測(cè)RUL,使模型預(yù)測(cè)的不確定性降低。Ma等[3]對(duì)原始軸承振動(dòng)數(shù)據(jù)采用短時(shí)傅里葉變換方法轉(zhuǎn)換為二維圖像,然后輸入到帶有卷積操作的長(zhǎng)短期記憶單元網(wǎng)絡(luò)提取深層特征,進(jìn)而預(yù)測(cè)RUL;Lei 等[21]提出了一種帶有殘差鏈接塊的卷積長(zhǎng)短期記憶網(wǎng)絡(luò),其在每層的輸入端加深了對(duì)輸入的特征提取,并為了保證梯度更好地傳播而在此加入了殘差鏈接;另外,該文獻(xiàn)還提出了一種相比蒙特卡洛丟棄方法更有效率的不確定性RUL預(yù)測(cè)方法,其通過設(shè)計(jì)一定的損失函數(shù)和兩個(gè)子網(wǎng)絡(luò)分別預(yù)測(cè)結(jié)果的方差和均值來達(dá)到快速的不確定性預(yù)測(cè);Li等[22]采用基于一種自注意力的卷積長(zhǎng)短期記憶網(wǎng)絡(luò)的方法來預(yù)測(cè)設(shè)備剩余使用壽命。該方法提取原始信號(hào)的24 個(gè)時(shí)域和頻域特征,根據(jù)單調(diào)性和趨勢(shì)性進(jìn)行篩選,并將篩選后的特征輸入到自動(dòng)編碼器進(jìn)行特征提取和降維,最后將其輸入到帶有自注意力機(jī)制的卷積長(zhǎng)短期記憶網(wǎng)絡(luò)中,給定若干樣本點(diǎn)預(yù)測(cè)設(shè)備后續(xù)的健康指標(biāo)。
然而,在實(shí)際生產(chǎn)的RUL 預(yù)測(cè)中,如何使用數(shù)據(jù)驅(qū)動(dòng)的方法準(zhǔn)確預(yù)測(cè)軸承等設(shè)備部件的壽命,仍然面臨很多挑戰(zhàn)。首先,在不同環(huán)境下,軸承的壽命衰減行為不盡相同,即使在同一環(huán)境下,由于部件出廠狀態(tài)在統(tǒng)計(jì)上存在方差,個(gè)體之間的初始差異導(dǎo)致衰減過程存在不同,因此,設(shè)備壽命受環(huán)境影響深刻;其次,在剩余使用壽命預(yù)測(cè)任務(wù)中,不同采樣段中采集的數(shù)據(jù)存在時(shí)間相關(guān)性,即除了單段連續(xù)采樣的數(shù)據(jù)存在時(shí)序關(guān)系之外,時(shí)間上存在先后順序的不同采樣段之間的數(shù)據(jù)同樣存在一定的時(shí)間相關(guān)性,例如不同衰減狀態(tài)的數(shù)據(jù)有前后發(fā)生關(guān)系。卷積神經(jīng)網(wǎng)絡(luò)因其強(qiáng)大的特征提取能力[23]以及對(duì)噪聲不敏感而被廣泛用于圖像、語音識(shí)別等應(yīng)用中[24]。循環(huán)神經(jīng)網(wǎng)絡(luò)則因優(yōu)秀的時(shí)序依賴信息建模能力被應(yīng)用于自然語言處理任務(wù)中[25]。近年來,將上述兩者進(jìn)行結(jié)合的方法逐漸應(yīng)用于軸承的剩余使用壽命預(yù)測(cè)[3],除簡(jiǎn)單進(jìn)行拼接的網(wǎng)絡(luò)結(jié)構(gòu)之外[12],將兩種網(wǎng)絡(luò)原生地進(jìn)行融合,例如卷積長(zhǎng)短期記憶網(wǎng)絡(luò)(CLSTM)[26]在原有的時(shí)序建模體制中引入了卷積操作,考慮到了空間特征的提取。但是,現(xiàn)有的方法仍沒能實(shí)現(xiàn)時(shí)序和空間特征的深層結(jié)合,因此,在引入卷積后不同層之間空間信息利用效率的低下,致使不能有效地捕捉軸承在衰減過程中的時(shí)空信息,造成信息損失,進(jìn)而無法得到準(zhǔn)確的剩余使用壽命預(yù)測(cè)結(jié)果。
針對(duì)以上挑戰(zhàn),本文提出一種基于時(shí)空雙細(xì)胞狀態(tài)自適應(yīng)網(wǎng)絡(luò)(ST-DCSN)的軸承剩余使用壽命預(yù)測(cè)方法:采用一種時(shí)間狀態(tài)和空間狀態(tài)并存的內(nèi)嵌卷積操作雙狀態(tài)循環(huán)網(wǎng)絡(luò),同時(shí)引入水平方向傳播的時(shí)間狀態(tài)和垂直方向傳播的空間狀態(tài);提出雙細(xì)胞機(jī)制,通過靜態(tài)和動(dòng)態(tài)子細(xì)胞狀態(tài),有效準(zhǔn)確地對(duì)帶有時(shí)空特征的原始信號(hào)進(jìn)行特征提?。徊捎脮r(shí)空雙細(xì)胞狀態(tài)和子細(xì)胞狀態(tài)差分機(jī)制,實(shí)現(xiàn)對(duì)軸承衰減狀態(tài)的自適應(yīng)感知。該方法擬在時(shí)間和空間維度上對(duì)設(shè)備監(jiān)測(cè)數(shù)據(jù)進(jìn)行特征狀態(tài)的有效捕捉,解決剩余使用壽命預(yù)測(cè)中環(huán)境和時(shí)序問題對(duì)預(yù)測(cè)性能的影響。
卷積長(zhǎng)短期記憶網(wǎng)絡(luò)(CLSTM)如圖1 所示,最早在2015 年被提出[26],其衍生方法卷積門控循環(huán)單元(CGRU)在2019年被使用在剩余使用壽命預(yù)測(cè)任務(wù)上[20],此后亦被使用于提取2D 頻譜圖像中的衰減特征來預(yù)測(cè)軸承的剩余使用壽命[3]。它通過在循環(huán)神經(jīng)網(wǎng)絡(luò)中內(nèi)嵌卷積操作,于原有的長(zhǎng)短期記憶單元中將狀態(tài)轉(zhuǎn)移計(jì)算從按元素乘法操作替換成卷積操作,并且在層之間加入了池化層,能自動(dòng)地對(duì)輸入信號(hào)進(jìn)行空間維度上的特征提取。該網(wǎng)絡(luò)不僅有長(zhǎng)短期記憶網(wǎng)絡(luò)的長(zhǎng)期依賴建模能力,而且在加入卷積操作后能夠進(jìn)行輸入中的深度空間信息提取,原生地支持時(shí)空復(fù)合信息的提取。其中,時(shí)刻t的隱藏狀態(tài)輸出ht的計(jì)算過程為
圖1 卷積長(zhǎng)短期記憶網(wǎng)絡(luò)[26]Fig.1 Convolutional long-short term memory network[26]
式中:“*”代表卷積運(yùn)算;“⊙”表示哈達(dá)瑪積;“[]”表示張量拼接操作;σ和δ分別表示sigmoid和tanh激活函數(shù);ft表示遺忘門,it表示輸入門;ot表示輸出門;x為當(dāng)前細(xì)胞體的輸入數(shù)據(jù);ht-1為上一時(shí)刻細(xì)胞體隱藏狀態(tài)輸出;為當(dāng)前候選狀態(tài);ct為當(dāng)前細(xì)胞體狀態(tài);Wf、Wi、Wo、Wc分別表示對(duì)應(yīng)計(jì)算中各自獨(dú)立可訓(xùn)練的權(quán)值參數(shù);bf、bi、bo、bc表示對(duì)應(yīng)計(jì)算中各自獨(dú)立可訓(xùn)練的偏置參數(shù)。
Wang 等[27]在圖像處理和視頻預(yù)測(cè)領(lǐng)域提出了時(shí)空-長(zhǎng)短期記憶細(xì)胞的結(jié)構(gòu),本文在Wang等[20]和Ma等[3]對(duì)于軸承剩余使用壽命預(yù)測(cè)研究基礎(chǔ)上提出了ST-DCSN 網(wǎng)絡(luò)結(jié)構(gòu),如圖2所示。該網(wǎng)絡(luò)基于一維卷積并引入了全局池化層,將由深層堆疊的時(shí)空卷積長(zhǎng)短期記憶網(wǎng)絡(luò)提取的深層特征經(jīng)最后一層全局池化后,得到RUL特征。另外,本文還創(chuàng)新地引入上采樣層,充分利用每時(shí)刻縱向傳播的空間特征,反饋到下一時(shí)刻的輸入中。對(duì)比一般長(zhǎng)短期記憶細(xì)胞單元,ST-DCSN所基于的時(shí)空細(xì)胞單元輸入多了一個(gè)來自上一層上一時(shí)刻的輸入和來自上一層當(dāng)前時(shí)刻的空間細(xì)胞狀態(tài);在時(shí)序狀態(tài)轉(zhuǎn)移計(jì)算上,其加入了動(dòng)態(tài)子細(xì)胞和靜態(tài)子細(xì)胞來控制與衰減狀態(tài)變化相關(guān)的信息輸出。其中,同一層上的水平數(shù)據(jù)流動(dòng)有隱藏狀態(tài)和時(shí)序細(xì)胞狀態(tài),相鄰層上的垂直方向上數(shù)據(jù)流動(dòng)有隱藏狀態(tài)和空間細(xì)胞狀態(tài);在層次l和時(shí)間步t上(l≥2,t≥2)會(huì)有來自層次l-1 的上一時(shí)間步t-1 隱藏狀態(tài)作為當(dāng)前的輸入,結(jié)合來自層次l-1的當(dāng)前時(shí)刻t的隱藏狀態(tài),在動(dòng)態(tài)子細(xì)胞中,經(jīng)衰減狀態(tài)自差分算法計(jì)算出動(dòng)態(tài)保留項(xiàng),經(jīng)由動(dòng)態(tài)隱藏狀態(tài)傳遞到靜態(tài)子細(xì)胞,提取衰減不變信息,表示當(dāng)前時(shí)刻衰減狀態(tài)中的不變量,即最大程度不受其他因素影響,能反映衰減過程的靜態(tài)信息,記作,代表l層上時(shí)刻t的靜態(tài)子細(xì)胞隱藏狀態(tài)。為了保證相鄰時(shí)刻縱向上的空間細(xì)胞信息傳遞,最后一層的空間細(xì)胞狀態(tài)需要進(jìn)行上采樣以反饋到下一時(shí)刻第1層的細(xì)胞輸入中。在最后一層細(xì)胞循環(huán)體會(huì)輸出提取到的時(shí)空復(fù)合特征,經(jīng)過全局池化層后得到一維的特征向量。
圖2 時(shí)空雙細(xì)胞狀態(tài)網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Spatial temporal-dual cell state network structure
1.2.1 時(shí)空卷積長(zhǎng)短期記憶細(xì)胞體
ST-DCSN模型中的時(shí)空卷積長(zhǎng)短期記憶細(xì)胞體具有靜態(tài)和動(dòng)態(tài)兩種子細(xì)胞狀態(tài),也稱為細(xì)胞中的細(xì)胞(COC),每次時(shí)序狀態(tài)轉(zhuǎn)移涉及兩次轉(zhuǎn)移計(jì)算,從而得出最終的時(shí)序細(xì)胞狀態(tài)。由于空間信息亦需要在相鄰時(shí)刻細(xì)胞單元上進(jìn)行傳遞,所以在經(jīng)典的長(zhǎng)短期記憶網(wǎng)絡(luò)基礎(chǔ)上加入了空間細(xì)胞狀態(tài),負(fù)責(zé)對(duì)空間特征的狀態(tài)在空間維度和時(shí)間維度上進(jìn)行維護(hù)。
時(shí)序細(xì)胞狀態(tài)的計(jì)算過程為
式中:Ot為模型總輸出門;Wxo、Who、Wco、Wmo為上述輸出門對(duì)應(yīng)計(jì)算中可訓(xùn)練的權(quán)值參數(shù),W1×1為卷積核大小為1 的可訓(xùn)練權(quán)值參數(shù);為可訓(xùn)練的偏置參數(shù)。
式中,τUpsampling指上采樣算法。
1.2.2 動(dòng)態(tài)子細(xì)胞體
動(dòng)態(tài)子細(xì)胞體的主要功能是計(jì)算狀態(tài)自差分項(xiàng),即接收上一層的當(dāng)前時(shí)刻和上一時(shí)刻的隱藏狀態(tài)作為輸入。然后計(jì)算兩者的差,作為最終細(xì)胞體的輸入。相鄰時(shí)刻狀態(tài)的差值作為該時(shí)刻的差分動(dòng)態(tài)值,即將衰減狀態(tài)變化中的非靜態(tài)部分特征提取出來,其中就包括需要保留的衰減狀態(tài)變化信息和干擾信息,然后經(jīng)過門控機(jī)制將二者分離,留下需要保留的與狀態(tài)變化相關(guān)的信息,由此動(dòng)態(tài)子細(xì)胞體的工作完成,輸出是動(dòng)態(tài)子細(xì)胞狀態(tài)和隱藏狀態(tài)。其中動(dòng)態(tài)子細(xì)胞狀態(tài)需要繼續(xù)在水平方向上傳播到下一時(shí)刻的動(dòng)態(tài)子細(xì)胞體,隱藏狀態(tài)作為輸入進(jìn)入靜態(tài)子細(xì)胞體中進(jìn)行下一步的計(jì)算。
動(dòng)態(tài)子細(xì)胞隱藏狀態(tài)的計(jì)算過程為
1.2.3 靜態(tài)子細(xì)胞體
靜態(tài)子細(xì)胞體負(fù)責(zé)接收來自上一時(shí)刻COC 細(xì)胞體的總時(shí)序狀態(tài),以及來自當(dāng)前時(shí)刻動(dòng)態(tài)子細(xì)胞體的隱藏狀態(tài),對(duì)兩者進(jìn)行卷積求和,經(jīng)過門控機(jī)制得到靜態(tài)子細(xì)胞狀態(tài)和隱藏狀態(tài)。其中,靜態(tài)子細(xì)胞的隱藏狀態(tài)根據(jù)公式參與當(dāng)前COC細(xì)胞體時(shí)序狀態(tài)的計(jì)算,形成最終時(shí)序細(xì)胞狀態(tài)。
靜態(tài)子細(xì)胞隱藏狀態(tài)的計(jì)算過程為
基于時(shí)空雙細(xì)胞狀態(tài)的軸承剩余使用壽命預(yù)測(cè)方法流程如圖3所示。首先,利用傳感器技術(shù)獲得軸承運(yùn)行過程中的振動(dòng)傳感信息,然后將得到的傳感信息進(jìn)行相關(guān)的數(shù)據(jù)預(yù)處理操作并進(jìn)行規(guī)范化數(shù)據(jù)處理;其次,構(gòu)建時(shí)空雙細(xì)胞自適應(yīng)感知網(wǎng)絡(luò)ST-DCSN,進(jìn)行參數(shù)初始化后開始訓(xùn)練模型,即將預(yù)處理后提取到的粗特征輸入到該網(wǎng)絡(luò)中提取深層特征,最終的特征經(jīng)過剩余使用壽命預(yù)測(cè)網(wǎng)絡(luò)輸出RUL 預(yù)測(cè)值,并經(jīng)過反向傳播算法計(jì)算各層的梯度,更新網(wǎng)絡(luò)參數(shù)。訓(xùn)練完畢后,在測(cè)試數(shù)據(jù)上進(jìn)行線上測(cè)試和性能評(píng)估,圖3中給出了一個(gè)示例。
圖3 基于ST-DCSN的RUL預(yù)測(cè)流程圖Fig.3 Flow chart of RUL prediction based on ST-DCSN
本文采用軸承的振動(dòng)傳感數(shù)據(jù)作為模型的輸入,由于不依賴任何預(yù)處理操作而直接將原始信號(hào)作為輸入,因此可以實(shí)現(xiàn)更進(jìn)一步的端到端預(yù)測(cè)。
原始數(shù)據(jù)在被采集后需要進(jìn)行規(guī)范化處理,本文采用的是最小-最大規(guī)范化(Min-Max Normalization)得到規(guī)范化后的數(shù)據(jù)樣本,并將樣本數(shù)據(jù)值映射到[-1,1]范圍內(nèi)。
式中,xmax、xmin分別為一次采樣數(shù)據(jù)樣本中的最大值和最小值。
ST-DCSN的模型主要由時(shí)空雙細(xì)胞特征提取網(wǎng)絡(luò)以及剩余使用壽命預(yù)測(cè)器構(gòu)成。其中剩余使用壽命預(yù)測(cè)器是一個(gè)多層全連接網(wǎng)絡(luò),以特征提取網(wǎng)絡(luò)提取到的高維時(shí)空隱藏特征作為輸入,最終輸出剩余使用壽命預(yù)測(cè)結(jié)果。如圖3 所示,ST-DCSN 在經(jīng)過多層堆疊的卷積長(zhǎng)短期記憶細(xì)胞及迭代窗口大小的時(shí)間步后,得到了提取到的時(shí)空復(fù)合特征,再經(jīng)過一個(gè)全局池化層后,輸出的是特征f∈R1×c×w,其中c為通道數(shù),w為輸入時(shí)間窗大小。在相鄰時(shí)間步之間進(jìn)行空間信息傳遞過程中,上采樣算法采用的是線性插值算法。全局池化后的特征在平整化后作為最后的剩余使用壽命預(yù)測(cè)器的輸入,輸出得到最終的剩余使用壽命預(yù)測(cè)值,本文采用的剩余使用壽命預(yù)測(cè)器是3層全連接神經(jīng)網(wǎng)絡(luò)。
ST-DCSN模型訓(xùn)練的輸入數(shù)據(jù)是以滑動(dòng)窗口的方式構(gòu)建,窗口大小為w,損失函數(shù)采用回歸任務(wù)常用的均方誤差(MSE,LMSE)。
模型參數(shù)更新采取的是神經(jīng)網(wǎng)絡(luò)梯度下降反向傳播(BP)策略。
式中:θ為網(wǎng)絡(luò)參數(shù);θ*為更新后的網(wǎng)絡(luò)參數(shù);α為學(xué)習(xí)率;?LMSE(y)為網(wǎng)絡(luò)輸出關(guān)于均方誤差損失的梯度。
采用常見的回歸性能度量指標(biāo)根均方誤差(RMSE)、平均絕對(duì)誤差(MAE)和統(tǒng)計(jì)相關(guān)性度量指標(biāo)R2,以及PHM2012 比賽官方所給的RUL 預(yù)測(cè)打分函數(shù)[28],分別表示為RRMSE、RMAE、RR2、RScore,該4 種指標(biāo)的評(píng)價(jià)標(biāo)準(zhǔn)分別為越小越好、越小越好、越大越好、越大越好。
式中,ξi反映了某時(shí)刻的預(yù)測(cè)百分比誤差。RScore是一種雙邊不對(duì)稱的函數(shù),PHM比賽主辦方的初衷是讓預(yù)測(cè)百分比誤差盡可能是正值,即出現(xiàn)誤差時(shí)刻真實(shí)值要大,鼓勵(lì)適當(dāng)?shù)摹邦A(yù)測(cè)提前”。
由于軸承振動(dòng)信號(hào)屬于非平穩(wěn)信號(hào),直接采用深度網(wǎng)絡(luò)對(duì)其進(jìn)行特征提取往往會(huì)給預(yù)測(cè)結(jié)果帶來一定的非確定性。為了盡可能降低這種非確定性,一般會(huì)采用平滑操作,本文采用的是霍特二次指數(shù)平滑方法得到平滑預(yù)測(cè)值+h∣t。
式中:α′、β為平滑系數(shù);h為常量,一般取1;xt為時(shí)間序列;+h∣t為平滑預(yù)測(cè)值。
本文實(shí)驗(yàn)軟件環(huán)境采用Linux Ubuntu20.04 操作系統(tǒng)、Pytorch-1.11。硬件環(huán)境采用Intel Core i7-10700KF CPU,內(nèi)存為16 GB,NVIDIA GTX-3080 GPU,顯存為10 GB。
3.1.1 數(shù)據(jù)介紹
本實(shí)例采用PHM2012 比賽所用數(shù)據(jù)[28]。該數(shù)據(jù)采集自法國FEMTO-ST 實(shí)驗(yàn)室的PRONOSTIA 實(shí)驗(yàn)平臺(tái),如圖4所示,主要用到水平和垂直方向加速度傳感器采集的軸承振動(dòng)信號(hào)。本文用到的數(shù)據(jù)集工況狀態(tài)類型如表1所示,用作訓(xùn)練的數(shù)據(jù)集有工況1、2對(duì)應(yīng)的前5個(gè)軸承的數(shù)據(jù)集,對(duì)應(yīng)的最后兩個(gè)軸承的數(shù)據(jù)集B1_6、B1_7以及B2_6、B2_7作為測(cè)試集,取對(duì)應(yīng)評(píng)價(jià)指標(biāo)的平均值,用于驗(yàn)證模型的預(yù)測(cè)性能。因此,所使用的數(shù)據(jù)樣本是每個(gè)采樣段的兩個(gè)方向振動(dòng)數(shù)據(jù),大小為2×2 560×1。
圖4 FEMTO-ST數(shù)據(jù)集的PRONOSTIA實(shí)驗(yàn)平臺(tái)Fig.4 PRONOSTIA experimental platform for FEMTO-ST dataset
3.1.2 模型訓(xùn)練
在模型的訓(xùn)練過程中,以滑動(dòng)窗口的方式構(gòu)建輸入數(shù)據(jù),窗口大小為w=7,這是通過實(shí)驗(yàn)得到的最佳窗口大小值??臻g子細(xì)胞狀態(tài)在每個(gè)時(shí)間步后的信息需要回傳至下一時(shí)間步作為輸入,因此,模型每一層卷積核數(shù)設(shè)置為32,大小為8,步長(zhǎng)為1。剩余使用壽命預(yù)測(cè)器的全連接網(wǎng)絡(luò)的神經(jīng)元數(shù)量分別是32、16、1。批處理大小因計(jì)算資源限制,設(shè)置為32。為了讓模型更好地收斂,學(xué)習(xí)率和訓(xùn)練輪數(shù)分別設(shè)置為0.000 05 和50,除了RUL 預(yù)測(cè)器的輸出層,其余層激活函數(shù)均采用ReLU 激活函數(shù)。具體網(wǎng)絡(luò)參數(shù)和訓(xùn)練超參數(shù)如表2所示。
表2 ST-DCSN網(wǎng)絡(luò)訓(xùn)練的超參數(shù)Table 2 Hyper-parameters of ST-DCSN
3.1.3 實(shí)驗(yàn)結(jié)果與分析
為了測(cè)試本文提出的ST-DCSN模型的性能,本實(shí)驗(yàn)分別與近年來優(yōu)秀的直接采用原始信號(hào)作為輸入的時(shí)序模型(TCN-RSA[29]、CNN-CBLSTM[30]、RCNN[20]、CLSTM[26]、LSTM 以及經(jīng)過改進(jìn)的MSCNN[9]方法)進(jìn)行比較。其中,TCN-RSA 是采用多層時(shí)序卷積神經(jīng)網(wǎng)絡(luò)以及自注意力機(jī)制的軸承剩余使用壽命預(yù)測(cè)方法,其通過8層堆疊的時(shí)序卷積塊提取特征;CNN-CBLSTM 是一種經(jīng)4層堆疊的卷積神經(jīng)網(wǎng)絡(luò)來進(jìn)行空間特征粗提取,接著用2層雙向卷積長(zhǎng)短期記憶網(wǎng)絡(luò)進(jìn)一步提取時(shí)空特征的方法;RCNN 是一種結(jié)合了卷積操作的門控循環(huán)單元網(wǎng)絡(luò)以及采用了蒙特卡洛不確定性預(yù)測(cè)的方法,其堆疊4 層卷積循環(huán)網(wǎng)絡(luò)進(jìn)行特征提取以及3 層全連接進(jìn)行RUL預(yù)測(cè);CLSTM是一種結(jié)合了卷積操作的長(zhǎng)短期記憶網(wǎng)絡(luò)預(yù)測(cè)方法,其經(jīng)過4 層堆疊卷積LSTM 層提取數(shù)據(jù)的時(shí)序和空間信息,最后同樣是通過一個(gè)全連接層輸出預(yù)測(cè)值,是本文模型構(gòu)建的基礎(chǔ)方法,本文在其基礎(chǔ)上引入了差分鏈接、空間、動(dòng)靜態(tài)子細(xì)胞;LSTM 采用的是24個(gè)時(shí)域、頻域特征[22],窗口大小等與ST-DCSN相同,隱藏層神經(jīng)元數(shù)為16,后接一個(gè)3層全連接層作為RUL預(yù)測(cè)器;多尺度卷積神經(jīng)網(wǎng)絡(luò)MSCNN 是一種堆疊卷積網(wǎng)絡(luò),其中倒數(shù)第2層池化后的結(jié)果與最后一層卷積結(jié)果共同經(jīng)過平坦層特征拼接得到輸出特征。
從表3 可以看出,對(duì)于FEMTO-ST 工況1 數(shù)據(jù)集,ST-DCSN 模型相比起近年來的優(yōu)秀模型,在4 個(gè)性能指標(biāo)上除兩個(gè)指標(biāo)外,經(jīng)過二次指數(shù)平滑后的預(yù)測(cè)值均位列第一。落后的指標(biāo)R2 反映的是回歸任務(wù)中預(yù)測(cè)值與真實(shí)值的回歸相關(guān)性程度,由于ST-DCSN對(duì)時(shí)空信息比較敏感,會(huì)在衰減前期進(jìn)行保守預(yù)測(cè),所以回歸性相對(duì)減弱,故會(huì)導(dǎo)致R2指標(biāo)不足。但是,在實(shí)際場(chǎng)景中,往往是需要進(jìn)行保守預(yù)測(cè)來減少因過度預(yù)測(cè)造成的損失,因此STDCSN 的預(yù)測(cè)是相比較為符合設(shè)備預(yù)后管理問題中偏向于提前預(yù)測(cè)的需求,這便解釋了ST-DCSN的預(yù)測(cè)結(jié)果在Score指標(biāo)上會(huì)取得更高的值,在R2上會(huì)相對(duì)較低。B1_7 的原始預(yù)測(cè)值和經(jīng)過二次平滑后的結(jié)果如圖5所示,由圖可知經(jīng)過平滑后能得到較好的擬合效果。另外,從圖6 中可以看到,STDCSN的預(yù)測(cè)曲線的趨勢(shì)性是在幾個(gè)方法中最強(qiáng)的,且波動(dòng)性較小,同時(shí)體現(xiàn)在根均方誤差指標(biāo)中是最小的。更重要的是,在PHM 中設(shè)備生命末期的預(yù)測(cè)精度是很重要的,由于軸承在生命末期會(huì)發(fā)生衰減突變,造成預(yù)測(cè)結(jié)果波動(dòng),而ST-DCSN于多種方法中在生命末期的擬合程度是最強(qiáng)的,波動(dòng)性是最低的。對(duì)于工況2 數(shù)據(jù)集,從表4 可以看出,STDCSN 能夠在4 項(xiàng)性能指標(biāo)上取得第一,平均性能指標(biāo)超過了性能優(yōu)秀的TCN-RSA以及RCNN,這得益于時(shí)空特征的深層融合,使得預(yù)測(cè)結(jié)果回歸性能更優(yōu),在經(jīng)過平滑后基本在真值附近,如圖7所示的B2_6預(yù)測(cè)結(jié)果。
表3 ST-DCSN 在FEMTO-ST 的B1 數(shù)據(jù)集上各模型性能指標(biāo)對(duì)比Table 3 Comparison of performance indicators of ST-DCSN models on FEMTO-ST B1 dataset
表4 ST-DCSN 在FEMTO-ST 的B2 數(shù)據(jù)集上各模型性能指標(biāo)對(duì)比Table 4 Comparison of performance indicators of ST-DCSN models on the FEMTO-ST B2 dataset
圖5 ST-DCSN在FEMTO-ST數(shù)據(jù)集B1_7上的預(yù)測(cè)曲線Fig.5 Prediction curve of FEMTO-ST dataset B1_7 by ST-DCSN
圖6 各種方法在B1_7上的預(yù)測(cè)結(jié)果對(duì)比Fig.6 Comparison of forecast results of B1_7 by various methods
圖7 ST-DCSN在FEMTO-ST數(shù)據(jù)集B2_6上的預(yù)測(cè)曲線Fig.7 Prediction curve of FEMTO-ST dataset B2_6 by ST-DCSN
在消融實(shí)驗(yàn)中,本實(shí)驗(yàn)將對(duì)空間細(xì)胞狀態(tài)、動(dòng)態(tài)和靜態(tài)子細(xì)胞分別裁剪來進(jìn)行消融,分別是完全版本的ST-DCSN、去除空間細(xì)胞狀態(tài)的ST-DCSN、去除動(dòng)態(tài)和靜態(tài)子細(xì)胞的ST-DCSN。從表5 可以看出,去除空間細(xì)胞狀態(tài)時(shí),4 個(gè)指標(biāo)均比完全版本的ST-DCSN差;去除動(dòng)態(tài)子細(xì)胞和靜態(tài)子細(xì)胞狀態(tài)的實(shí)驗(yàn)中,4 個(gè)指標(biāo)均比完全版本的ST-DCSN 差??偟膩碚f,完全版本的ST-DCSN在各指標(biāo)上均比消融實(shí)驗(yàn)組更優(yōu)。
對(duì)于滑動(dòng)窗口大小對(duì)預(yù)測(cè)性能的影響,本文分別設(shè)置了窗口大小為3、5、7、9 的多組實(shí)驗(yàn),經(jīng)過重復(fù)實(shí)驗(yàn)得到的實(shí)驗(yàn)效果如圖8所示。從圖中可知,當(dāng)窗口大小設(shè)置為7時(shí),模型能獲得相對(duì)較好的預(yù)測(cè)性能。
圖8 輸入窗口大小對(duì)預(yù)測(cè)性能指標(biāo)的影響Fig.8 Influence of different window sizes on prediction performance indicators
另外,本文在對(duì)B1_7預(yù)測(cè)均值結(jié)果進(jìn)行二次指數(shù)平滑操作上進(jìn)行了平滑因子α′和趨勢(shì)因子β對(duì)預(yù)測(cè)結(jié)果影響的實(shí)驗(yàn)探究。分別將平滑因子和趨勢(shì)因子設(shè)置為0.05、0.10、0.25、0.50、0.75、1.00,可視化結(jié)果如圖9、圖10 所示。從圖中可以看到,當(dāng)平滑因子和趨勢(shì)因子同時(shí)偏大或偏小時(shí)預(yù)測(cè)結(jié)果的根均方誤差越大,說明趨勢(shì)性對(duì)于根均方誤差影響較大。均絕對(duì)誤差受到兩因子的影響比較平穩(wěn),只有在趨勢(shì)因子較大時(shí)會(huì)出現(xiàn)較大誤差值,因此,需找到一個(gè)適宜的值使得預(yù)測(cè)平滑結(jié)果更接近真值。
圖9 平滑因子α'和趨勢(shì)因子β對(duì)均絕對(duì)誤差的影響Fig.9 Influence of smoothing factor α' and trend factor β on MAE
圖10 平滑因子α′和趨勢(shì)因子β對(duì)根均方誤差的影響Fig.10 Influence of smoothing factor α' and trend factor β on RMSE error
3.2.1 數(shù)據(jù)介紹
本實(shí)例采用的數(shù)據(jù)集來自西安交通大學(xué)-昇陽科技軸承加速實(shí)驗(yàn)平臺(tái)[31],如圖11 所示。該實(shí)驗(yàn)采用了15個(gè)LDK UER204滾珠軸承,在3種不同工況下對(duì)軸承的全壽命周期數(shù)據(jù)進(jìn)行采集。該數(shù)據(jù)集包含了3種工況下的15個(gè)滾動(dòng)軸承的全壽命周期振動(dòng)信號(hào),且明確標(biāo)注了每個(gè)軸承的失效部位,與FEMTO-ST 類似,主要也是用到在其上安裝的水平和垂直方向加速度傳感器采集的軸承振動(dòng)信號(hào)。每個(gè)運(yùn)行工況下均有5個(gè)子集,本文采用的具體數(shù)據(jù)集工況狀態(tài)類型如表6 所示。本實(shí)驗(yàn)采用工況2 中的數(shù)據(jù),前3個(gè)子集作為訓(xùn)練集,最后兩個(gè)軸承的數(shù)據(jù)集作為測(cè)試集,用于驗(yàn)證模型的預(yù)測(cè)性能。因此,所使用的數(shù)據(jù)是每個(gè)采樣段的兩個(gè)方向振動(dòng)數(shù)據(jù),大小為2 × 32 768 × 1。
表6 XJTU-SY軸承數(shù)據(jù)集工況狀態(tài)類型Table 6 Working condition of XJTU-SY bearing dataset
圖11 XJTU-SY數(shù)據(jù)采集用的軸承加速壽命試驗(yàn)臺(tái)Fig.11 XJTU-SY accelerated bearing life experimental platform for data collection
3.2.2 模型訓(xùn)練
在數(shù)據(jù)預(yù)處理上,由于該數(shù)據(jù)集樣本采樣點(diǎn)數(shù)較多,無法以滑動(dòng)窗口的方式構(gòu)建輸入數(shù)據(jù),故設(shè)窗口大小為w=7。在超參數(shù)設(shè)置上,由于XJTU-SY數(shù)據(jù)集原始信號(hào)采樣點(diǎn)更多,受限于硬件內(nèi)存,批處理大小設(shè)置為4;鑒于數(shù)據(jù)樣本點(diǎn)更多,模型收斂慢,訓(xùn)練輪次設(shè)置為500,以及池化層池化大小設(shè)置為4,其余參數(shù)與FEMTO-ST實(shí)例相同。
3.2.3 實(shí)驗(yàn)結(jié)果與分析
為了測(cè)試本文提出的ST-DCSN模型的性能,本實(shí)例分別與近年來優(yōu)秀的RUL 預(yù)測(cè)模型(TCNRSA[29]、CNN-CBLSTM[30]、RCNN[20]、CLSTM[26]、LSTM 以及經(jīng)過改進(jìn)的MSCNN[9]方法)進(jìn)行預(yù)測(cè)性能比較。其中,CNN-CBLSTM、RCNN、CLSTM 均以原始振動(dòng)數(shù)據(jù)作為網(wǎng)絡(luò)輸入,其超參數(shù)和輸入均與ST-DCSN相同。
從表7 中可以看出,ST-DCSN 模型相比近年來的優(yōu)秀方法,經(jīng)過二次指數(shù)平滑后的預(yù)測(cè)性能指標(biāo)平均值在4個(gè)性能指標(biāo)上均是最優(yōu)的,這得益于雙細(xì)胞模型方法和狀態(tài)自差分算法。ST-DCSN能在軸承振動(dòng)信號(hào)中提取到一般的時(shí)間和空間特征并經(jīng)過深層網(wǎng)絡(luò)的自適應(yīng)融合,因此ST-DCSN會(huì)得到更好的預(yù)測(cè)結(jié)果。這在另一個(gè)不同類型不同工作負(fù)載的真實(shí)軸承數(shù)據(jù)集上證明了本文方法的優(yōu)越性。圖12所示為ST-DCSN在B2_4上的預(yù)測(cè)結(jié)果,可以看出,在軸承衰減前中期開始擬合效果逐漸提升,并在生命末期取得了較好的預(yù)測(cè)效果。
表7 ST-DCSN在XJTU-SY數(shù)據(jù)集上各模型性能指標(biāo)對(duì)比Table 7 Comparison of performance indicators of ST-DCSN models on XJTU-SY dataset
圖12 XJTU-SY數(shù)據(jù)集B2_4上的預(yù)測(cè)曲線Fig.12 Prediction curve of XJTU-SY dataset B2_4
本文提出了一種基于雙細(xì)胞狀態(tài)自適應(yīng)感知的剩余使用壽命預(yù)測(cè)方法,通過一種雙細(xì)胞自適應(yīng)感知特征提取神經(jīng)網(wǎng)絡(luò)ST-DCSN,解決在PHM 中軸承的剩余使用壽命預(yù)測(cè)問題中時(shí)序和空間特征難以有效提取的問題,從而提高預(yù)測(cè)準(zhǔn)確性。為了驗(yàn)證該方法的性能,本文分別在FEMTO-ST 和XJTU-SY兩個(gè)真實(shí)軸承數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)驗(yàn)證,均得到了較為優(yōu)秀的效果。這要?dú)w功于ST-DCSN優(yōu)秀的時(shí)間和空間特征提取能力,其在原有LSTM 的時(shí)序細(xì)胞狀態(tài)的基礎(chǔ)上引入了新的空間細(xì)胞狀態(tài),在深層空間特征提取過程中以空間細(xì)胞來保持對(duì)關(guān)鍵空間特征的記憶,減少在空間維度上隨著網(wǎng)絡(luò)的層次加深而丟失空間信息。通過對(duì)原卷積長(zhǎng)短期記憶細(xì)胞的改進(jìn),在一定程度上加強(qiáng)了不同層之間的空間信息和時(shí)序信息的融合,在空間提取方向上進(jìn)行了狀態(tài)的保存,增強(qiáng)了空間維度的重要信息保留程度。通過消融實(shí)驗(yàn),本文證明了所引入的空間細(xì)胞狀態(tài)和兩個(gè)子細(xì)胞狀態(tài)對(duì)預(yù)測(cè)性能提升的必要性,而且還探究和分析了不同參數(shù)對(duì)預(yù)測(cè)結(jié)果的影響。
本文雖然實(shí)現(xiàn)了對(duì)卷積長(zhǎng)短期記憶網(wǎng)絡(luò)模型中空間特征的進(jìn)一步挖掘,以及其與時(shí)序特征的融合,在層之間保留關(guān)鍵空間信息,但預(yù)測(cè)結(jié)果仍存在局部抖動(dòng)和波動(dòng)問題,即預(yù)測(cè)的不確定性不可忽略,因此需要平滑操作。在軸承生命末期有一定的抖動(dòng)說明時(shí)序信息和空間信息的融合效果仍有上升的空間,另外對(duì)于非平穩(wěn)的原始信號(hào)對(duì)預(yù)測(cè)結(jié)果帶來的不確定性也需要關(guān)注。近年來亦有較多關(guān)于不確定性的探究,接下來的工作會(huì)考慮引入不確定性預(yù)測(cè)方法如蒙特卡洛方法、深度貝葉斯網(wǎng)絡(luò)等方法進(jìn)行研究,以探索出一種盡可能降低時(shí)空信息融合不確定性的方法。