張 利,孫 軍,李大偉,牛明航,高一丹
(遼寧大學(xué) 信息學(xué)院,沈陽(yáng) 110036)(*通信作者電子郵箱zhang_li@lnu.edu.cn)
自深度學(xué)習(xí)[1-3]模型提出以來(lái),深度學(xué)習(xí)在包括故障診斷的多個(gè)領(lǐng)域都取得了快速發(fā)展。故障診斷簡(jiǎn)單來(lái)說(shuō)就是比較正常工作時(shí)的數(shù)據(jù)與測(cè)量取得的特征值判斷滾動(dòng)軸承是否處于正常狀態(tài),亞健康識(shí)別是判斷滾動(dòng)軸承是否處于正常狀態(tài)與不正常狀態(tài)之間的一種狀態(tài),是故障診斷中的一種方法,本文將故障診斷與亞健康識(shí)別看作相同概念。
隨著深度學(xué)習(xí)的發(fā)展,在故障診斷方面也出現(xiàn)了多種方法,其中自動(dòng)編碼器就是一種廣泛應(yīng)用的方法。在自動(dòng)編碼器的基礎(chǔ)上衍生出了多種編碼器方法,如稀疏、降噪、收縮、邊緣降噪自動(dòng)編碼器等。深度學(xué)習(xí)與機(jī)器學(xué)習(xí)不盡相同,深度學(xué)習(xí)可以不依賴人的經(jīng)驗(yàn)進(jìn)行學(xué)習(xí),通過(guò)從訓(xùn)練數(shù)據(jù)集中提取特征自主調(diào)節(jié)權(quán)重和偏置,當(dāng)訓(xùn)練集合適時(shí),經(jīng)過(guò)適當(dāng)?shù)挠?xùn)練就可以得到一個(gè)較為理想的模型。
本文提出一種新的滾動(dòng)軸承亞健康識(shí)別算法,嘗試將自動(dòng)編碼器與相關(guān)向量機(jī)相結(jié)合用于滾動(dòng)軸承的亞健康識(shí)別,旨在提高亞健康識(shí)別的工作效率。該算法首先從滾動(dòng)軸承上采集數(shù)據(jù)進(jìn)行傅里葉變換和歸一化處理,然后用一種改進(jìn)的稀疏邊緣降噪自動(dòng)編碼器和另一種改進(jìn)的相關(guān)向量機(jī)-深度自動(dòng)編碼器分別進(jìn)行分類,最后運(yùn)用D-S(Dempster-Shafer)證據(jù)理論融合得出最后的分類結(jié)果。與傳統(tǒng)的層疊降噪編碼器對(duì)比訓(xùn)練時(shí)間發(fā)現(xiàn),本文算法能在較短時(shí)間內(nèi)完成收斂,準(zhǔn)確率相對(duì)穩(wěn)定且有所提高,通過(guò)D-S證據(jù)理論能正確識(shí)別數(shù)據(jù)集的類別。
深度學(xué)習(xí)通過(guò)構(gòu)建有多個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)模型,從輸入數(shù)據(jù)中獲取較深層次的數(shù)據(jù)特征,這使得分類任務(wù)不僅節(jié)省了時(shí)間還提高了工作效率。工作流程大致分為兩個(gè)階段:預(yù)訓(xùn)練和微調(diào)。預(yù)訓(xùn)練階段從輸入層輸入數(shù)據(jù)通過(guò)映射方法到各個(gè)隱含層,其中下一層的輸入都為上一層的輸出。此階段網(wǎng)絡(luò)的參數(shù)已經(jīng)初步確定,然后利用反向傳播算法對(duì)網(wǎng)絡(luò)進(jìn)行微調(diào),得到最后較為理想的神經(jīng)網(wǎng)絡(luò)模型。深度學(xué)習(xí)常用的方法有自動(dòng)編碼器及其衍生出的各種自動(dòng)編碼器、玻爾茲曼機(jī)等。
假設(shè)一個(gè)含n個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)模型的輸入為i,輸出為o,則可表示為i→n1 →n2 → … →n→o的形式。神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)如圖1所示。
圖1 神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)
相關(guān)向量機(jī)(Relevance Vector Machine, RVM)[4-6]是貝葉斯理論框架下的一種機(jī)器學(xué)習(xí)方法。相比支持向量機(jī)(Support Vector Machine, SVM),相關(guān)向量機(jī)泛化能力強(qiáng)、檢測(cè)精度高,而且具有核函數(shù)選擇更加自由、魯棒性和泛化能力提高的特點(diǎn)。RVM對(duì)數(shù)據(jù)集進(jìn)行分類任務(wù)時(shí),一般采用sigmoid函數(shù),結(jié)果值位于(0,1),值越接近1表示結(jié)果越準(zhǔn)確?;静襟E如下:
1)初始化{αi},σ2,分類任務(wù)中不需要初始化σ2,α為超參數(shù)。
2)計(jì)算μ、Σ,Σ為權(quán)重的協(xié)方差。
3)利用公式
4)回到步驟2),判斷是否滿足停止條件,直到滿足為止。
5)找到相關(guān)向量,即權(quán)重非零的樣本,同時(shí)計(jì)算RVM模型參數(shù)。
文獻(xiàn)[7]中提出了用改進(jìn)的粒子群算法優(yōu)化BP(Back Propagation)網(wǎng)絡(luò)的權(quán)值,用D-S理論對(duì)輸出融合得到最后的分類,實(shí)驗(yàn)結(jié)果也表明改進(jìn)模型比單獨(dú)的BP網(wǎng)絡(luò)分類效果更好;文獻(xiàn)[8]中提出了一種改進(jìn)的堆疊降噪自動(dòng)編碼器,用粒子群算法優(yōu)化堆疊降噪自動(dòng)編碼器,并通過(guò)softmax分類,提高了泛化性能和識(shí)別準(zhǔn)確率;文獻(xiàn)[9]用改進(jìn)的蟻群算法來(lái)優(yōu)化SVM參數(shù),然后用改進(jìn)的支持向量機(jī)來(lái)檢測(cè)滾動(dòng)軸承亞健康狀態(tài),能有效提高檢測(cè)精度;文獻(xiàn)[10]中用改進(jìn)的粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò),建立了改進(jìn)的粒子群神經(jīng)網(wǎng)絡(luò)模型,經(jīng)實(shí)驗(yàn)表明改進(jìn)后的算法在學(xué)習(xí)能力、收斂速度等方面都有很大改善;文獻(xiàn)[11]將神經(jīng)網(wǎng)絡(luò)模型應(yīng)用到滾動(dòng)軸承的可靠性評(píng)估和剩余壽命預(yù)測(cè)上,并驗(yàn)證了該預(yù)測(cè)算法的合理有效性。
在原型自動(dòng)編碼器[12-15]的基礎(chǔ)上加上某些特定的限制功能就會(huì)生成一種新的衍生編碼器,稀疏邊緣降噪自動(dòng)編碼器就是將稀疏自動(dòng)編碼器與邊緣降噪自動(dòng)編碼器結(jié)合在一起,既可以減少來(lái)自噪聲的影響也可以發(fā)揮稀疏自動(dòng)編碼器的優(yōu)勢(shì),讓隱層神經(jīng)元大部分時(shí)間處于抑制狀態(tài),相當(dāng)于此時(shí)網(wǎng)絡(luò)以較少的神經(jīng)元在工作的方式,一定程度上減少了計(jì)算量。
本文也采用將稀疏自動(dòng)編碼器和邊緣降噪自動(dòng)編碼器相結(jié)合的方式,提出一種新的稀疏邊緣降噪自動(dòng)編碼器。稀疏邊緣降噪自動(dòng)編碼器與傳統(tǒng)的自動(dòng)編碼器結(jié)構(gòu)相似,由輸入層、隱含層、輸出層構(gòu)成,結(jié)構(gòu)如圖2所示。
圖2 隱含層加入規(guī)則示意圖
與傳統(tǒng)編碼器不同的是,本文改進(jìn)的模型結(jié)合了稀疏自動(dòng)編碼器和邊緣降噪自動(dòng)編碼器的特點(diǎn),在新形成的網(wǎng)絡(luò)里加入了稀疏性的約束條件L1和邊緣降噪自動(dòng)編碼器的約束條件L2,即最終模型的損失函數(shù)表達(dá)式如下:
(1)
在深度學(xué)習(xí)模型增加了隱含層的層數(shù),使得神經(jīng)網(wǎng)絡(luò)模型在很多方面表現(xiàn)出色,應(yīng)用也越來(lái)越廣泛,但是想要得到一個(gè)自己滿意的模型,需要大量的數(shù)據(jù)集來(lái)訓(xùn)練,這樣才會(huì)獲得合適的權(quán)重和偏置,因此,減少訓(xùn)練時(shí)間成了本文要解決的問(wèn)題。
本文前面已經(jīng)定義了模型的損失函數(shù)表達(dá)式,為了提高數(shù)據(jù)的處理速率,一般采用梯度下降算法,數(shù)學(xué)表達(dá)式如下:
θ(t+1)=θ(t)-η(t)▽L(θ(t))
(2)
其中:L(θ)為定義在數(shù)據(jù)集上的損失函數(shù),▽L(θ)是損失函數(shù)的梯度,θ(t+1)與θ(t)是第t+1與第t次迭代的參數(shù)值,η(t)為學(xué)習(xí)率。
為了降低▽L(θ)的代價(jià),本文用隨機(jī)梯度下降算法,即選取一部分樣本計(jì)算損失函數(shù)梯度的方式降低代價(jià),如式(3)、(4):
θ(t+1)=θ(t)-η(t)▽Lm(θ(t));m=1,2,…,M
(3)
(4)
其中:▽Lm(θ)為第m批次數(shù)據(jù)經(jīng)過(guò)計(jì)算得到的梯度值,N為第m批次數(shù)據(jù)集的大小。用隨機(jī)梯度下降算法更新網(wǎng)絡(luò)的權(quán)值和偏置方式如式(5):
(5)
其中η為學(xué)習(xí)率。
為了使網(wǎng)絡(luò)有好的適應(yīng)能力,本文選用一種自適應(yīng)的全參數(shù)形式學(xué)習(xí)策略——AdaGrad,這樣網(wǎng)絡(luò)就可以自己調(diào)節(jié)參數(shù),計(jì)算方式如下:
(6)
其中:η(0)為學(xué)習(xí)率初始化值一般為0.01,η(t)是t+1次迭代時(shí)的學(xué)習(xí)率,▽Lm是第s次迭代時(shí)損失函數(shù)的梯度,K為常數(shù)一般取值為1。分母部分可以保證學(xué)習(xí)率的變化趨勢(shì)表現(xiàn)為整體下降趨勢(shì)。
改進(jìn)后的結(jié)構(gòu)先將輸入數(shù)據(jù)通過(guò)稀疏邊緣降噪自動(dòng)編碼器采用無(wú)監(jiān)督訓(xùn)練的方式提取深層特征,但這樣的數(shù)據(jù)沒(méi)有經(jīng)過(guò)微調(diào),解決問(wèn)題的能力有限,本文使用有監(jiān)督的softmax函數(shù)對(duì)各個(gè)隱含層的參數(shù)進(jìn)行微調(diào),再利用RVM進(jìn)行訓(xùn)練,這樣就得到改進(jìn)后的模型,結(jié)構(gòu)如圖3所示。
圖3 改進(jìn)后的自動(dòng)編碼器
傳統(tǒng)的相關(guān)向量機(jī)(RVM)將低維數(shù)據(jù)映射到高維空間采用的是單一的核函數(shù)[16-18],這種方法適合樣本數(shù)較少的情況,對(duì)于訓(xùn)練樣本數(shù)據(jù)較多、結(jié)構(gòu)相對(duì)復(fù)雜的情況,需要采用更加高效的方法。本文采用Fisher準(zhǔn)則[19]計(jì)算的核參數(shù)和最大熵原理[20-21]計(jì)算的核參數(shù)相結(jié)合形成改進(jìn)的相關(guān)向量機(jī)核參數(shù)。
則樣本類間散布矩陣為:
Sb=(μ1-μ2)T(μ1-μ2)=
(7)
樣本類內(nèi)散布矩陣分別為:
(8)
(9)
根據(jù)Fisher準(zhǔn)則得到的最優(yōu)核參數(shù)為:
根據(jù)最大熵原理得到的最優(yōu)核參數(shù)為:
其中E1、E2為樣本X1、X2的分布熵:
(1-λ)×arg max(E1+E2);λ∈[0,1]
與SVM相似,RVM進(jìn)行的是二分類模式識(shí)別問(wèn)題,這對(duì)亞健康識(shí)別并不適用。為實(shí)現(xiàn)多分類模式識(shí)別,要對(duì)多個(gè)相關(guān)向量機(jī)進(jìn)行組合,本文采用“一對(duì)多”的分類方法。這種方法分類函數(shù)數(shù)量較少,不會(huì)超過(guò)目標(biāo)類別數(shù),在分類中分類速度相對(duì)較快。
D-S證據(jù)理論在多個(gè)領(lǐng)域都得到廣泛的應(yīng)用,在機(jī)械設(shè)備“亞健康”識(shí)別中更為常見(jiàn)。D-S證據(jù)理論是由Dempster提出采用一個(gè)概率范圍來(lái)模擬不確定性,后來(lái),在Dempster基礎(chǔ)上,Shafer又作了進(jìn)一步研究并給出了兩個(gè)證據(jù)的合成規(guī)則[22-24]。
本文方法流程如下:將預(yù)處理后的數(shù)據(jù)分別輸入到稀疏邊緣降噪自動(dòng)編碼器和相關(guān)向量機(jī)自動(dòng)編碼器中進(jìn)行多分類,然后根據(jù)D-S證據(jù)理論融合,再利用D-S決策理論決策出結(jié)果,得到最終的結(jié)果。其中采用的決策規(guī)則如下:
(24)
其中:A1是最后的結(jié)果,ε1、ε2是提前設(shè)定好的閾值,Θ為識(shí)別框架,m(Ai)為基本可信數(shù)。
利用美國(guó)凱斯西儲(chǔ)大學(xué)(Case Western Reserve University)的滾動(dòng)軸承實(shí)測(cè)數(shù)據(jù)來(lái)驗(yàn)證本文方法能否達(dá)到預(yù)期的效果。實(shí)驗(yàn)數(shù)據(jù)有1 000多個(gè)樣本,數(shù)據(jù)量雖然不大,但從最終實(shí)驗(yàn)結(jié)果的準(zhǔn)確率(如表5)上來(lái)看,平均準(zhǔn)確率能達(dá)到97%以上,說(shuō)明本文的方法是有效的,以花費(fèi)訓(xùn)練時(shí)間為代價(jià),深度自動(dòng)編碼器-相關(guān)向量機(jī)網(wǎng)絡(luò)模型在準(zhǔn)確率和穩(wěn)定性上都有不錯(cuò)的效果。
用DAT(data)記錄器在16通道采集振動(dòng)信號(hào),Matlab處理得到的振動(dòng)信號(hào)。采樣數(shù)字信號(hào)的頻率為12 kHz,同時(shí)以48 kHz的采樣頻率來(lái)采集驅(qū)動(dòng)端的數(shù)據(jù)。本文實(shí)驗(yàn)數(shù)據(jù)選取的采樣點(diǎn)是在驅(qū)動(dòng)端,采樣頻率為12 kHz。采集的8種滾動(dòng)軸承數(shù)據(jù)如表1所示。
表1 8種滾動(dòng)軸承數(shù)據(jù)
以0負(fù)載為例,4種狀態(tài)下對(duì)應(yīng)的振動(dòng)信號(hào)如圖4所示,經(jīng)過(guò)傅里葉變換后頻域如圖5所示。
選取隱層神經(jīng)元400個(gè),隱層層數(shù)設(shè)為3,選取了8種初始狀態(tài),所以輸出神經(jīng)元個(gè)數(shù)是8,各層學(xué)習(xí)率對(duì)比如圖6所示。從圖6(a)~(c)對(duì)比可以看出本文設(shè)計(jì)的學(xué)習(xí)率改進(jìn)方法是有效的。
表2比較了本文提出的稀疏邊緣降噪自動(dòng)編碼器與傳統(tǒng)的層疊降噪編碼器在達(dá)到穩(wěn)定狀態(tài)時(shí)訓(xùn)練時(shí)間的差別。從表2中可以看出,稀疏邊緣降噪自動(dòng)編碼器在訓(xùn)練時(shí)間上明顯縮短,本文訓(xùn)練了3次,改進(jìn)前的訓(xùn)練時(shí)間都在120 s左右,改進(jìn)后的訓(xùn)練時(shí)間在98 s左右。
表2 改進(jìn)前后訓(xùn)練時(shí)間對(duì)比
圖4 4種狀態(tài)下驅(qū)動(dòng)端振動(dòng)信號(hào)(0負(fù)載)
圖5 傅里葉變換后4種狀態(tài)驅(qū)動(dòng)端振動(dòng)信號(hào)頻譜圖
圖6 每一層學(xué)習(xí)率變化趨勢(shì)
表3列出了通過(guò)Fisher準(zhǔn)則方法、最大熵原理及本文方法計(jì)算的各參數(shù)值。表4為在Fisher準(zhǔn)則和最大熵準(zhǔn)則基礎(chǔ)上得到的最優(yōu)核參數(shù)應(yīng)用到深度自動(dòng)編碼器-相關(guān)向量機(jī)模型對(duì)數(shù)據(jù)集的識(shí)別準(zhǔn)確率,可以看出改進(jìn)后識(shí)別準(zhǔn)確率達(dá)到了98.6%,較改進(jìn)前分別提高了3.9個(gè)百分點(diǎn)和2.5個(gè)百分點(diǎn),達(dá)到了改進(jìn)的效果,提高了識(shí)別準(zhǔn)確率。
表3 不同方法求得的最優(yōu)核參數(shù)值
表4 不同方法最高準(zhǔn)確率對(duì)比
本文在選取的8種狀態(tài)下各選取3種進(jìn)行實(shí)驗(yàn),得到深度自動(dòng)編碼器-相關(guān)向量機(jī)模型的準(zhǔn)確率與準(zhǔn)確率均值如表5所示。由表5的數(shù)據(jù)可以看出,深度自動(dòng)編碼器-相關(guān)向量機(jī)模型的訓(xùn)練效果比較穩(wěn)定。
表5 識(shí)別準(zhǔn)確率對(duì)比
設(shè)置采樣頻率為12 kHz,以滾動(dòng)軸承負(fù)載為0、轉(zhuǎn)速為1 797 r/min的驅(qū)動(dòng)端的正?;€數(shù)據(jù)為正常狀態(tài),以驅(qū)動(dòng)端負(fù)載為3 HP、轉(zhuǎn)速為1 730 r/min的正?;€數(shù)據(jù)作為亞健康狀態(tài),以負(fù)載為3 HP、轉(zhuǎn)速為1 730 r/min、故障直徑為0.007 mm的滾珠故障數(shù)據(jù)作為故障狀態(tài),得到識(shí)別框架為Θ{健康狀態(tài),亞健康狀態(tài),故障狀態(tài)}三種狀態(tài),輸出結(jié)果采用二進(jìn)制編碼形式,正常狀態(tài)、亞健康狀態(tài)、故障狀態(tài)分別表示為[1 0 0]、[0 1 0]、[0 0 1]。設(shè)置ε1=0.30,ε2=0.60。識(shí)別結(jié)果如表6~7所示。
從表6可以發(fā)現(xiàn)第二空間中編號(hào)為2的樣本被分到了亞健康狀態(tài)中,但在第一證據(jù)空間和期望輸出中都是正常狀態(tài),說(shuō)明第二證據(jù)空間中得到的結(jié)果是錯(cuò)的,通過(guò)D-S證據(jù)理論融合后識(shí)別結(jié)果為正常狀態(tài),說(shuō)明已經(jīng)正確地將結(jié)果更正過(guò)來(lái)。
類似的,對(duì)于表7中的亞健康樣本可以看到,第一證據(jù)空間編號(hào)為1的樣本被分到了健康狀態(tài),但在第二證據(jù)空間和期望輸出中都是亞健康狀態(tài),說(shuō)明第一證據(jù)空間中的結(jié)果是錯(cuò)的,通過(guò)D-S證據(jù)理論融合后識(shí)別結(jié)果為亞健康狀態(tài),說(shuō)明已經(jīng)正確地將結(jié)果更正過(guò)來(lái)。
表6 D-S證據(jù)理論對(duì)正常樣本的識(shí)別結(jié)果
表7 D-S證據(jù)理論對(duì)亞健康樣本的識(shí)別結(jié)果
本文提出了一種改進(jìn)自動(dòng)編碼器的方法,首先是稀疏邊緣降噪自動(dòng)編碼器,實(shí)驗(yàn)表明改進(jìn)方法在訓(xùn)練時(shí)間上較層疊自動(dòng)編碼器有所增加;然后是改進(jìn)相關(guān)向量機(jī)自動(dòng)編碼器,經(jīng)實(shí)驗(yàn)表明這種改進(jìn)在正確率和穩(wěn)定性上都有不錯(cuò)的效果;最后結(jié)合得到的證據(jù)空間經(jīng)過(guò)D-S理論融合后能正確識(shí)別出不正確的分類,達(dá)到了目標(biāo)。不過(guò)本文模型增加了訓(xùn)練時(shí)間,還有改進(jìn)的空間,也是進(jìn)一步需要研究的內(nèi)容。