王 同,許 昕,2*,潘宏俠,2
(1.中北大學(xué) 機(jī)械工程學(xué)院,山西 太原 030051;2.中北大學(xué) 系統(tǒng)辨識(shí)與診斷技術(shù)研究所,山西 太原 030051)
軸承是旋轉(zhuǎn)機(jī)械裝備中最重要的零部件之一。在旋轉(zhuǎn)機(jī)械裝備中,很多機(jī)械裝備的失效是由軸承故障引起的,因此,對(duì)軸承進(jìn)行故障診斷是很有必要的[1]。
為了避免軸承故障引起的損失,人們一直在尋找有效的軸承故障診斷方法[2],如各種機(jī)器學(xué)習(xí)算法。利用機(jī)器學(xué)習(xí)算法的軸承故障診斷步驟一般為:先對(duì)采集到的信號(hào)進(jìn)行前期的預(yù)處理,之后經(jīng)過(guò)人為的挑選特征,將經(jīng)過(guò)一系列處理的數(shù)據(jù)輸入分類(lèi)器進(jìn)行識(shí)別。
張琛等人[3]對(duì)原始信號(hào)進(jìn)行了集合經(jīng)驗(yàn)?zāi)B(tài)分解(ensemble empirical mode decomposition, EEMD),將得到的IMF分量依據(jù)一定指標(biāo)篩選重構(gòu),結(jié)合變分模式分解(variational mode decomposition, VMD)算法得到奇異值熵,并根據(jù)其熵值大小判斷軸承的故障類(lèi)別。王望望等人[4]提取了故障軸承的時(shí)域、頻域、時(shí)頻域特征,利用核主成分分析(kernel principal component analysis, KPCA)和t-分布領(lǐng)域嵌入(t-distributed stochastic neighbor embedding, t-SNE)算法對(duì)其進(jìn)行了特征篩選,將數(shù)據(jù)輸入K近鄰算法(K-nearest neighbor,KNN)分類(lèi)器中,對(duì)軸承故障進(jìn)行了有效識(shí)別。姚德臣等人[5]對(duì)故障軸承的信號(hào)進(jìn)行小波降噪后,利用EEMD得到了信號(hào)的本征模態(tài)函數(shù),提取了多尺度排列熵作為特征,利用支持向量機(jī)(support vector machine, SVM)進(jìn)行了故障分類(lèi),在軸承故障診斷方面取得了較好的結(jié)果。
上述研究聚焦于傳統(tǒng)的機(jī)器學(xué)習(xí)算法,然而機(jī)器學(xué)習(xí)算法繁瑣的人工特征提取步驟使其在當(dāng)今生產(chǎn)業(yè)蓬勃發(fā)展的大數(shù)據(jù)時(shí)代難以繼力[6-7]。繁瑣的步驟往往會(huì)造成人力、經(jīng)濟(jì)、資源等方面的浪費(fèi),實(shí)用功能欠佳,且相同的特征處理手段在處理不同數(shù)據(jù)時(shí)效果不同。這都是基于機(jī)器學(xué)習(xí)的故障診斷手段面臨的難題。
隨著近年來(lái)計(jì)算機(jī)技術(shù)的發(fā)展,深度學(xué)習(xí)算法應(yīng)運(yùn)而生,其自動(dòng)提取特征的特點(diǎn)深受研究者喜愛(ài)[8-9]。深度學(xué)習(xí)主要的特點(diǎn)是免除了繁瑣的人工特征提取步驟,并且達(dá)到了更高的準(zhǔn)確率。其特點(diǎn)是將預(yù)處理信號(hào)作為深度學(xué)習(xí)模型的輸入進(jìn)行自動(dòng)特征提取,并將提取的特征輸送給最后的全連接層,實(shí)現(xiàn)分類(lèi)目的。
在國(guó)內(nèi)外研究中,結(jié)合深度學(xué)習(xí)尋找有效的軸承故障診斷方法成了眾多學(xué)者研究的熱點(diǎn),許多學(xué)者在此方面做了大量工作[10-13]。ZHAO Ming-hang等人[14]提出了一種無(wú)需經(jīng)過(guò)信號(hào)預(yù)處理的基于深度收縮殘差網(wǎng)絡(luò)的故障診斷方法,采用該方法對(duì)神經(jīng)網(wǎng)絡(luò)塊進(jìn)行了集成,自適應(yīng)地確定了閾值的策略,實(shí)現(xiàn)了較強(qiáng)的特征學(xué)習(xí)能力,最終在各類(lèi)型的高振動(dòng)噪聲故障診斷中,展現(xiàn)了較高的診斷精度。CHEN Yue-jian等人[15]提出了一種基于物理信息的長(zhǎng)短期記憶網(wǎng)絡(luò)(long short term memory, LSTM)的超參數(shù)選擇策略,在變速箱故障診斷中,采用該方法取得了良好的實(shí)驗(yàn)結(jié)果。XU Zi-fei等人[16]提出了一種多尺度卷積神經(jīng)網(wǎng)絡(luò)結(jié)合功能注意力機(jī)制的模型,該模型有著較好的泛化能力,在軸承故障診斷上有著較高的準(zhǔn)確率和較好的穩(wěn)定性。ZHAO Bo等人[17]提出了一種歸一化卷積神經(jīng)網(wǎng)絡(luò),采用批量歸一化的操作消除了特征分布的差異,并通過(guò)實(shí)驗(yàn)驗(yàn)證了該方法的優(yōu)越性。WANG Duo等人[18]利用元學(xué)習(xí)和一般的監(jiān)督學(xué)習(xí)相混合的方式,考慮了面對(duì)少樣本數(shù)據(jù)的故障診斷策略,使用較少的樣本對(duì)齒輪箱進(jìn)行故障診斷,取得了較好的實(shí)驗(yàn)結(jié)果。
筆者研究了這些文獻(xiàn)后發(fā)現(xiàn),結(jié)合了深度學(xué)習(xí)的軸承故障診斷方法較之傳統(tǒng)方法有更簡(jiǎn)便的流程以及更高的故障識(shí)別準(zhǔn)確率。
近年來(lái),研究者們也提出了深度學(xué)習(xí)融合信號(hào)在時(shí)域、頻域和時(shí)頻域的故障診斷方法。在軸承故障診斷工作中,對(duì)采集到的振動(dòng)信號(hào)進(jìn)行一定的預(yù)處理,往往會(huì)挖掘出隱藏在信號(hào)中的有用特征。但時(shí)域包含的信息有限,使用單一的原始信號(hào)要達(dá)到更高的識(shí)別要求也較為困難。
因此,JIN Yan-rui等人[19]對(duì)信號(hào)進(jìn)行了傅里葉變換,將變換后的結(jié)果輸入殘差網(wǎng)絡(luò)模型,通過(guò)在模型中添加注意力機(jī)制,取得了比傳統(tǒng)殘差網(wǎng)絡(luò)更好的診斷結(jié)果。DIBAJ A等人[20]結(jié)合VMD和CNN,提出了一種端對(duì)端的復(fù)合故障診斷方法。MAO Wen-tao等人[21]獲取了原信號(hào)的時(shí)域、頻域和時(shí)頻域信息,結(jié)合深度遷移學(xué)習(xí)策略,使構(gòu)建的故障診斷模型取得了優(yōu)異的故障識(shí)別結(jié)果。CHENG Yi-wei等人[22]構(gòu)建了一種連續(xù)小波變換結(jié)合局部二進(jìn)制卷積網(wǎng)絡(luò)的故障診斷模型,其利用局部二進(jìn)制卷積層代替?zhèn)鹘y(tǒng)卷積層的方法,加快了網(wǎng)路的訓(xùn)練速度,減少了過(guò)擬合現(xiàn)象。袁彩艷等人[23]提取了原始信號(hào)的多域信息,對(duì)傳統(tǒng)的殘差網(wǎng)絡(luò)進(jìn)行了密集式連接,并結(jié)合注意力機(jī)制對(duì)優(yōu)勢(shì)特征進(jìn)行了加權(quán),取得了比傳統(tǒng)網(wǎng)絡(luò)模型更好的軸承故障識(shí)別結(jié)果。葉壯等人[24]利用經(jīng)驗(yàn)?zāi)B(tài)分解算法對(duì)信號(hào)進(jìn)行了預(yù)處理,將振動(dòng)信號(hào)轉(zhuǎn)換為圖像數(shù)據(jù),并使用其提出的基于多通道加權(quán)的卷積神經(jīng)網(wǎng)絡(luò),充分提取了原信號(hào)的多尺度信息,發(fā)揮了卷積網(wǎng)絡(luò)強(qiáng)大的圖像特征提取能力。
以上方法在故障診斷領(lǐng)域發(fā)揮了一定的作用,但在面臨實(shí)際工業(yè)環(huán)境時(shí),仍有以下不足:1)故障診斷準(zhǔn)確率較低;2)模型收斂速度不足;3)無(wú)法有效平衡模型深度和訓(xùn)練參數(shù)量[25-26]。
基于此,筆者提出一種基于多域信息融合結(jié)合深度分離卷積(MDIDSC)的軸承故障診斷方法。
首先,考慮到經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decom-position, EMD)算法模態(tài)混疊,且EEMD算法產(chǎn)生的IMF分量仍有噪聲混雜情況,采用CEEMDAN算法對(duì)信號(hào)進(jìn)行分解,得到原信號(hào)的時(shí)域空間狀態(tài)矩陣;然后,利用傅里葉變換和小波變換進(jìn)一步得到原信號(hào)頻域和時(shí)頻域的空間狀態(tài)矩陣,對(duì)各空間狀態(tài)矩陣進(jìn)行信息融合后作為神經(jīng)網(wǎng)絡(luò)的多通道輸入;接著,利用所提出的卷積核深度分離方法對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,同時(shí)在訓(xùn)練過(guò)程中利用自適應(yīng)學(xué)習(xí)率退火算法對(duì)網(wǎng)絡(luò)進(jìn)行優(yōu)化以避免模型陷入局部最優(yōu);最后,引入殘差連接以避免網(wǎng)絡(luò)退化,并利用空間特征提取方法對(duì)模型參數(shù)進(jìn)行修剪后分類(lèi)輸出。
EMD通過(guò)將信號(hào)分解為一系列本征模態(tài),表征信號(hào)在各個(gè)尺度下的信息。但其易產(chǎn)生模態(tài)混疊,即IMF分量中包含了多種頻率,或一種頻率出現(xiàn)在多個(gè)IMF分量中。
為解決EMD的模態(tài)混疊問(wèn)題,WU Z等人[27]提出對(duì)原信號(hào)添加高斯白噪聲序列,再對(duì)原信號(hào)進(jìn)行EMD分解求平均,但添加的噪聲并不能在最后的分解中被完全消除。
CEEMDAN算法在EEMD的基礎(chǔ)上進(jìn)行了優(yōu)化,該算法流程如下:
步驟1。對(duì)信號(hào)添加自適應(yīng)高斯白噪聲序列w0*Ni(t),(i∈{1,…,I})。添加了自適應(yīng)白噪聲序列的信號(hào)可表示為:
xi(t)=x(t)+w0*Ni(t),(i∈{1,…,I})
(1)
式中:x(t)為原信號(hào);w0為噪聲系數(shù);Ni(t)為方差為1的高斯白噪聲序列。
步驟2。對(duì)添加了自適應(yīng)噪聲序列的信號(hào)xi(t)進(jìn)行EMD分解;對(duì)每次分解出的第一個(gè)IMF分量求平均得到第一個(gè)IMF分量c1(t),其表達(dá)式為:
(2)
式中:c1i為每次分解得到的第一個(gè)IMF分量。
步驟3。用原信號(hào)減去得到的第一個(gè)IMF分量,可得殘差r1(t),其表達(dá)式為:
r1(t)=x(t)-c1(t)
(3)
式中:x(t)為原信號(hào);c1為得到的第一個(gè)IMF分量;r1(t)為殘差。
步驟4。對(duì)得到的殘差r1(t)添加自適應(yīng)噪聲序列,得到r1+w1*E1(Ni(t)),再用EMD分解求平均的方式得到第二個(gè)IMF分量,其表達(dá)式為:
(4)
式中:w1為噪聲系數(shù);Ej(.)為一個(gè)函數(shù),表示提取EMD分解的第j個(gè)IMF。
步驟5。對(duì)得到的c2(t)重復(fù)上述步驟,依次得到各個(gè)IMF分量,直到最后得到的殘差不超過(guò)兩個(gè)極值點(diǎn)為止。
最終分解可得n個(gè)IMF分量,其表示為[c1,c2,…,cn-1,cn],構(gòu)建的時(shí)域空間狀態(tài)矩陣如下:
(5)
為了充分利用原信號(hào)攜帶的信息,筆者提出多域信息融合的理論。該方法結(jié)合時(shí)域、頻域、時(shí)頻域?qū)π盘?hào)攜帶的信息進(jìn)行表征。
首先,利用CEEMDAN分解時(shí)域信號(hào)得到各階IMF分量;然后,利用篩選出的IMF分量構(gòu)建時(shí)域空間狀態(tài)矩陣;最后,采用傅里葉變換和小波變換得到信號(hào)的頻域和時(shí)頻域空間狀態(tài)矩陣。
筆者對(duì)獲得的各域空間狀態(tài)矩陣在通道方向進(jìn)行融合合并,將合并后的數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行故障診斷。
筆者對(duì)構(gòu)建的時(shí)域空間狀態(tài)矩陣進(jìn)行傅里葉變換,得到的頻域空間特征矩陣可記為CF,其表達(dá)式如下:
(6)
通過(guò)對(duì)構(gòu)建時(shí)域空間狀態(tài)矩陣進(jìn)行小波變換,得到時(shí)頻域空間特征矩陣可記為CTF,其表達(dá)式如下:
(7)
對(duì)得到的多域信息CT、CF、CTF進(jìn)行通道融合,得到信息融合矩陣C,其可記為C=[CT,CF,CTF]。
傳統(tǒng)的CNN模型需要進(jìn)行逐層訓(xùn)練,Inception網(wǎng)絡(luò)結(jié)構(gòu)使多通道并行卷積成為了現(xiàn)實(shí)。筆者提出的深度分離卷積是對(duì)Inception網(wǎng)絡(luò)模型的進(jìn)一步提升。
Inception網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
在筆者提出的深度分離卷積中,傳統(tǒng)的3×3、5×5卷積核被深度分離為1×3、3×1,以及1×5、5×1等多個(gè)卷積核。經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證,該方法極大減少了訓(xùn)練參數(shù)和計(jì)算量,并提升了網(wǎng)絡(luò)訓(xùn)練速度。
由于數(shù)據(jù)分布存在差異,筆者在該模塊中加入批歸一化(batch normalization, BN),保證了數(shù)據(jù)的分布一致性,解決了模型在訓(xùn)練過(guò)程中出現(xiàn)的易飽和、信息丟失以及在梯度優(yōu)化過(guò)程中的梯度消失等現(xiàn)象,充分發(fā)揮了激活函數(shù)的作用。
由于模型深度過(guò)深易導(dǎo)致網(wǎng)絡(luò)退化,筆者設(shè)計(jì)添加了殘差連接,對(duì)前層網(wǎng)絡(luò)提取的特征進(jìn)行復(fù)利用,增強(qiáng)了網(wǎng)絡(luò)的穩(wěn)定性。
該模塊具體結(jié)構(gòu)如圖2所示。
圖2 深度分離卷積Fig.2 Depth separation convolutions
在訓(xùn)練過(guò)程中,當(dāng)訓(xùn)練進(jìn)行到一定程度,網(wǎng)絡(luò)訓(xùn)練的準(zhǔn)確率將不再上升,損失不再下降,此時(shí)網(wǎng)絡(luò)模型可能陷入了局部最優(yōu)的情況。為解決該問(wèn)題,需要對(duì)梯度優(yōu)化時(shí)的學(xué)習(xí)率進(jìn)行調(diào)整。
針對(duì)網(wǎng)絡(luò)易收斂到局部極值點(diǎn)的問(wèn)題,筆者提出采用自適應(yīng)學(xué)習(xí)率退火的方法優(yōu)化網(wǎng)絡(luò)訓(xùn)練。該方法通過(guò)監(jiān)測(cè)訓(xùn)練時(shí)的損失變化,自適應(yīng)地對(duì)學(xué)習(xí)率進(jìn)行調(diào)節(jié)。
其設(shè)計(jì)思想是對(duì)訓(xùn)練損失進(jìn)行持續(xù)監(jiān)測(cè),當(dāng)訓(xùn)練損失保持不變持續(xù)特定epoch后,優(yōu)化器的學(xué)習(xí)率將自適應(yīng)地減少為原來(lái)的1/λ,然后優(yōu)化器將利用新的學(xué)習(xí)率進(jìn)行梯度更新,表達(dá)式如下:
lrj=K*lrj-1
(8)
式中:K為學(xué)習(xí)率衰退因子;lrj為第j次epoch的學(xué)習(xí)率。
將卷積層提取出的特征輸入全連接層分類(lèi)時(shí),過(guò)多的參數(shù)會(huì)導(dǎo)致全連接層訓(xùn)練緩慢,過(guò)少的參數(shù)則會(huì)丟失有用特征。為解決該問(wèn)題,筆者提出一種對(duì)空間特征條件性選取的模型參數(shù)修剪方法。
考慮到不同特征圖上特征點(diǎn)在通道方向存在分布差異,因而可以對(duì)特征圖上每個(gè)位置的優(yōu)勢(shì)特征進(jìn)行提取,并剔除無(wú)效特征以減少參數(shù)量和計(jì)算量。該方法選擇不同特征圖上特征點(diǎn)在通道方向絕對(duì)值最大的數(shù)據(jù)作為有效特征,輸入全連接層進(jìn)行分類(lèi)。
該方法會(huì)將多通道特征參數(shù)修剪為一個(gè)特征圖大小,并最大程度保留原始數(shù)據(jù)的特征信息,其表達(dá)式如下:
(9)
空間特征提取操作對(duì)冗余特征進(jìn)行剔除,減少了網(wǎng)絡(luò)結(jié)構(gòu)的總參數(shù)量。
為充分驗(yàn)證MDIDSC的有效性,筆者采用了兩類(lèi)不同的數(shù)據(jù)集進(jìn)行了對(duì)比實(shí)驗(yàn)。第一類(lèi)是由西安交通大學(xué)轉(zhuǎn)子軸承實(shí)驗(yàn)室提供的滾動(dòng)軸承加速壽命實(shí)驗(yàn)數(shù)據(jù)[28];第二類(lèi)是由美國(guó)凱斯西儲(chǔ)大學(xué)提供的滾動(dòng)軸承振動(dòng)信號(hào)數(shù)據(jù)。
筆者在這兩種軸承故障數(shù)據(jù)集上,從數(shù)據(jù)分析、數(shù)據(jù)預(yù)處理、故障診斷實(shí)驗(yàn)結(jié)果分析、不同方法對(duì)比等方面展開(kāi)討論。
筆者首先利用西安交軸承數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。
該數(shù)據(jù)集有著豐富的軸承故障信息,其實(shí)驗(yàn)平臺(tái)由兩個(gè)振動(dòng)加速度傳感器(一個(gè)水平和一個(gè)豎直方向)、實(shí)驗(yàn)軸承、交流電動(dòng)機(jī)和電機(jī)轉(zhuǎn)速控制器等設(shè)備組成。
該實(shí)驗(yàn)平臺(tái)具體信息如圖3所示。
圖3 西安交通大學(xué)軸承實(shí)驗(yàn)平臺(tái)Fig.3 Xi’an Jiaotong University bearing experimental platform
3.1.1 數(shù)據(jù)故障信息
筆者對(duì)西交軸承數(shù)據(jù)集進(jìn)行分析,采用傳感器位于水平方向獲得的振動(dòng)數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。
筆者設(shè)置了外圈故障、保持架故障、內(nèi)外圈故障、內(nèi)圈故障、多種復(fù)合故障等5種故障類(lèi)型。
各故障軸承如圖4所示。
圖4 實(shí)驗(yàn)故障狀態(tài)軸承Fig.4 Fault state bearing
每類(lèi)故障共設(shè)置100個(gè)樣本,所有樣本的采樣頻率均為25.6 kHz。其中,總樣本的80%用于測(cè)試,20%用于驗(yàn)證,每個(gè)樣本共含數(shù)據(jù)點(diǎn)1 024個(gè)。
具體軸承故障信息參數(shù)如表1所示。
表1 具體故障信息和分類(lèi)標(biāo)簽Table 1 Specific fault information and classification label
3.1.2 信號(hào)預(yù)處理
筆者先對(duì)故障信號(hào)進(jìn)行分解變換,獲得了時(shí)域、頻域和時(shí)頻域空間狀態(tài)矩陣,然后對(duì)獲得的多域空間狀態(tài)矩陣進(jìn)行通道信息融合,最后將該多通道數(shù)據(jù)輸送至神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練[29-32]。
為充分表征選取的故障軸承狀態(tài)信息,筆者繪制了選取的5種故障類(lèi)型的時(shí)域信號(hào)圖形。
各故障類(lèi)型的時(shí)域信號(hào)如圖5所示。
圖5 各類(lèi)型故障信號(hào)圖Fig.5 Each type of fault signal
筆者選取了分解的前5個(gè)IMF分量構(gòu)建空間狀態(tài)矩陣。這些內(nèi)圈故障振動(dòng)信號(hào)的IMF分量如圖6所示。
圖6 內(nèi)圈故障IMF分量時(shí)域圖Fig.6 IMF time domain diagram of inner ring fault
筆者選取CEEMDAN分解出的前5個(gè)IMF分量構(gòu)建了時(shí)域空間狀態(tài)矩陣,然后利用傅里葉變換、小波變換,對(duì)時(shí)域IMF分量構(gòu)建的時(shí)域空間狀態(tài)矩陣進(jìn)行變換,分別得到頻域空間狀態(tài)矩陣和時(shí)頻域空間狀態(tài)矩陣。
3.1.3 筆者所提模型結(jié)構(gòu)
筆者先利用CEEMDAN算法對(duì)原始信號(hào)進(jìn)行分解,然后利用傅里葉變換和小波變換分別構(gòu)建時(shí)域、頻域和時(shí)頻域空間狀態(tài)矩陣,對(duì)得到的3個(gè)空間狀態(tài)矩陣進(jìn)行通道融合,并將其輸入網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
筆者在網(wǎng)絡(luò)中依次進(jìn)行卷積、批量歸一化、最大池化和Sigmoid激活,將初步訓(xùn)練后的數(shù)據(jù)送入特征提取優(yōu)化模塊提取特征;利用特征提取優(yōu)化模塊重復(fù)計(jì)算3次后進(jìn)行卷積、批量歸一化等操作;最后對(duì)得到的多通道特征圖進(jìn)行參數(shù)修剪并輸入全連接層進(jìn)行分類(lèi)輸出。
總體網(wǎng)絡(luò)結(jié)構(gòu)流程圖如圖7所示。
圖7 網(wǎng)絡(luò)結(jié)構(gòu)Fig.7 Network structure
3.1.4 實(shí)驗(yàn)結(jié)果
為充分驗(yàn)證MDIDSC的正確性,筆者記錄了在網(wǎng)絡(luò)訓(xùn)練中測(cè)試集和訓(xùn)練集準(zhǔn)確率和損失的變化。
實(shí)驗(yàn)結(jié)果如圖8所示。
圖8 準(zhǔn)確率和損失變化Fig.8 Change of accuracy and loss
由圖8可以看出:MDIDSC在訓(xùn)練一開(kāi)始損失較大、準(zhǔn)確率較低;但隨著實(shí)驗(yàn)進(jìn)行,當(dāng)訓(xùn)練到25代左右,MDIDSC便基本達(dá)到收斂,此時(shí)損失和準(zhǔn)確率不再變化,準(zhǔn)確率最高為100%。
該實(shí)驗(yàn)結(jié)果驗(yàn)證了筆者方法的有效性和穩(wěn)定性。
為進(jìn)一步展示實(shí)驗(yàn)結(jié)果,筆者繪制了某次實(shí)驗(yàn)中測(cè)試集的混淆矩陣輸出結(jié)果。
該混淆矩陣結(jié)果如圖9所示。
圖9 某次測(cè)試集混淆矩陣Fig.9 Confusion matrix of certain test set
由圖9混淆矩陣所示:在該次實(shí)驗(yàn)中,對(duì)于測(cè)試集的100個(gè)樣本,僅有1個(gè)內(nèi)圈故障被分類(lèi)為內(nèi)外圈復(fù)合故障,剩余所有樣本均分類(lèi)正確。
筆者利用t-SNE算法對(duì)輸出特征進(jìn)行了降維可視化,該可視化結(jié)果與混淆矩陣輸出結(jié)果基本一致。
可視化結(jié)果如圖10所示。
圖10 某次測(cè)試集可視化Fig.10 Visualization of certain test set
3.1.5 不同方法對(duì)比
筆者選取了較為常用的一些故障診斷方法與MDIDSC進(jìn)行了對(duì)比。選擇的對(duì)比方法分別為Inception、殘差網(wǎng)絡(luò)(residual neural network, ResNet),以及近年來(lái)機(jī)器學(xué)習(xí)中較為流行的輕量級(jí)梯度提升機(jī)器學(xué)習(xí)(light gradient boosting machine,LGB)算法。
為保證對(duì)比實(shí)驗(yàn)的公正性,筆者選取的Inception網(wǎng)絡(luò)模型和殘差網(wǎng)絡(luò)模型均具有與MDIDSC一樣的網(wǎng)絡(luò)深度和輸入。同時(shí),為了突出MDIDSC的特點(diǎn),Inception網(wǎng)絡(luò)模型沒(méi)有進(jìn)行殘差連接,殘差模型沒(méi)有通道分離操作。為了更好地進(jìn)行比較,2種方法都沒(méi)有對(duì)卷積核進(jìn)行深度分離。
最后,筆者選取了沒(méi)有通道分離和殘差連接的LGB算法,為進(jìn)一步提高LGB算法的性能,在LGB分類(lèi)前利用主成分分析(principal component analysis, PCA)對(duì)輸入數(shù)據(jù)進(jìn)行了降維。
各方法的對(duì)比結(jié)果如圖11所示。
圖11 不同方法對(duì)比Fig.11 Comparison of different methods
由圖11可以看出:MDIDSC有著較高的準(zhǔn)確率和較好的穩(wěn)定性;Inception模型和ResNet模型準(zhǔn)確率略高,且測(cè)試結(jié)果不夠穩(wěn)定;PCA-LGB方法在該數(shù)據(jù)集上的準(zhǔn)確率較低。
為充分驗(yàn)證MDIDSC的有效性,筆者利用凱斯西儲(chǔ)大學(xué)提供的軸承數(shù)據(jù)集對(duì)所提方法做了進(jìn)一步檢驗(yàn)。該數(shù)據(jù)集的實(shí)驗(yàn)平臺(tái)由一個(gè)2馬力的電動(dòng)機(jī)、滾動(dòng)軸承、扭矩傳感器、功率測(cè)試計(jì)及控制器等組成。
實(shí)驗(yàn)臺(tái)如圖12所示。
3.2.1 數(shù)據(jù)故障信息
通過(guò)對(duì)凱斯西儲(chǔ)大學(xué)的軸承數(shù)據(jù)集進(jìn)行分析,筆者選取了加速度傳感器位于電機(jī)殼體垂直向的驅(qū)動(dòng)端獲得的振動(dòng)數(shù)據(jù)進(jìn)行實(shí)驗(yàn)論證。該實(shí)驗(yàn)中,軸承外圈故障頻率為104.56 Hz,內(nèi)圈故障頻率為157.94 Hz,滾動(dòng)體故障頻率為137.48 Hz。
筆者共選取了7種不同類(lèi)型的軸承故障數(shù)據(jù)進(jìn)行實(shí)驗(yàn),各故障類(lèi)型分別為內(nèi)圈故障(負(fù)載分別有0 W、735 W兩種)、外圈故障(負(fù)載0 W、735 W兩種)、滾動(dòng)體故障(負(fù)載0 W、735 W兩種)和正常狀態(tài)。每種故障類(lèi)型的軸承損傷直徑統(tǒng)一為0.177 8 mm。
筆者選取的具體軸承故障信息參數(shù)如表2所示。
表2 故障狀態(tài)信息和分類(lèi)標(biāo)簽Table 2 Fault status information and classification label
每種故障類(lèi)型包含有100個(gè)樣本,總數(shù)據(jù)包含有700個(gè)樣本。該數(shù)據(jù)的采樣頻率為12 kHz,其中總樣本的80%用于測(cè)試,20%用于驗(yàn)證。每個(gè)樣本包含的原始振動(dòng)信號(hào)數(shù)據(jù)點(diǎn)個(gè)數(shù)為1 024個(gè)。
3.2.2 信號(hào)預(yù)處理
針對(duì)每種故障狀態(tài)信息,筆者繪制了所選取的各類(lèi)軸承故障的時(shí)域信號(hào)。
筆者選取的各類(lèi)軸承故障的時(shí)域信號(hào)如圖13所示。
圖13 各故障信號(hào)圖Fig.13 Each type of fault signal
筆者選取了分解得到的前5個(gè)IMF分量進(jìn)行空間狀態(tài)矩陣的構(gòu)建,并選取內(nèi)圈故障振動(dòng)信號(hào)的IMF分量進(jìn)行展示。
內(nèi)圈故障振動(dòng)信號(hào)的IMF分量如圖14所示。
圖14 內(nèi)圈故障IMF時(shí)域圖Fig.14 IMF time domain diagram of inner ring fault
筆者選取CEEMDAN分解出的前5個(gè)IMF分量構(gòu)建時(shí)域空間狀態(tài)矩陣,然后分別利用傅里葉變換、小波變換對(duì)所得的時(shí)域空間狀態(tài)矩陣進(jìn)行時(shí)頻變換,最終得到該數(shù)據(jù)集下的頻域空間狀態(tài)矩陣和時(shí)頻域空間狀態(tài)矩陣。
3.2.3 實(shí)驗(yàn)結(jié)果
為在該數(shù)據(jù)集上充分驗(yàn)證MDIDSC的優(yōu)越性,筆者進(jìn)行了10次測(cè)試實(shí)驗(yàn),分別記錄了在10次實(shí)驗(yàn)中訓(xùn)練集準(zhǔn)確率和測(cè)試集的損失以及準(zhǔn)確率的變化。
實(shí)驗(yàn)結(jié)果如圖15所示。
由圖15結(jié)果可知:在對(duì)該軸承數(shù)據(jù)集的10次軸承故障診斷實(shí)驗(yàn)中,訓(xùn)練集故障識(shí)別準(zhǔn)確率最高為100%、最低為99.64%,平均為99.95%;測(cè)試集故障識(shí)別準(zhǔn)確率最高為100%、最低為98.57%,平均為99.07%。訓(xùn)練集的最大損失為0.290 0,最小為0.026 2,平均為0.075 8;在測(cè)試集中的最大損失為0.134 5,最小為0.053 2,平均為0.084 1。
為進(jìn)一步展示針對(duì)MDIDSC的實(shí)驗(yàn)結(jié)果,筆者繪制了某次實(shí)驗(yàn)中測(cè)試集混淆矩陣的結(jié)果,其中橫軸代表神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)值,縱軸代表真實(shí)值。
該混淆矩陣如圖16所示。
圖16 某次測(cè)試集混淆矩陣Fig.16 Confusion matrix of certain test set
由該混淆矩陣可知:該次實(shí)驗(yàn)中,測(cè)試集的140個(gè)樣本里僅有一個(gè)735 W負(fù)載的滾動(dòng)體故障被誤分類(lèi)為無(wú)負(fù)載的滾動(dòng)體故障,剩余所有數(shù)據(jù)均分類(lèi)正確,測(cè)試準(zhǔn)確率為99.29%。
筆者利用t-SNE算法對(duì)輸出特征進(jìn)行了降維可視化處理,該可視化結(jié)果與混淆矩陣輸出結(jié)果基本一致。
可視化結(jié)果如圖17所示。
圖17 某次測(cè)試集可視化Fig.17 Visualization of certain test set
3.2.4 不同方法對(duì)比
筆者在該數(shù)據(jù)集上也設(shè)置了多組對(duì)比實(shí)驗(yàn),選擇的對(duì)比模型為Inception網(wǎng)絡(luò)、ResNet以及PCA-LGB算法。
最終的實(shí)驗(yàn)結(jié)果如圖18所示。
圖18 不同方法對(duì)比Fig.18 Comparison of different methods
由圖18可以看出:MDIDSC有著較好的穩(wěn)定性和較高的準(zhǔn)確率;ResNet的準(zhǔn)確率和穩(wěn)定性都稍遜于筆者方法;Inception和PCA-LGB算法在該數(shù)據(jù)集上的準(zhǔn)確率較低,且不夠穩(wěn)定。
考慮傳統(tǒng)CNN網(wǎng)絡(luò)在網(wǎng)絡(luò)過(guò)深時(shí)會(huì)出現(xiàn)參數(shù)過(guò)多、計(jì)算量過(guò)大、特征信息丟失以及訓(xùn)練過(guò)慢的情況,筆者提出了一種用于軸承故障診斷的網(wǎng)絡(luò)模型。
首先,利用CEEMDAN對(duì)信號(hào)進(jìn)行了分解,并采用傅里葉變換和小波變換獲得了信號(hào)的多域信息;然后,采用卷積核深度分離的方法進(jìn)行了特征提取;采用學(xué)習(xí)率退火和參數(shù)修剪的方法對(duì)網(wǎng)絡(luò)模型進(jìn)行優(yōu)化;最后,通過(guò)實(shí)驗(yàn)對(duì)MDIDSC的優(yōu)越性進(jìn)行了驗(yàn)證。
研究結(jié)果如下:
1)多域信息通道融合方法豐富了數(shù)據(jù)特征,提升了神經(jīng)網(wǎng)絡(luò)的泛化性和魯棒性,其在實(shí)驗(yàn)中的最高測(cè)試準(zhǔn)確率可達(dá)100%;
2)深度分離卷積模型減少了網(wǎng)絡(luò)模型的總參數(shù),同時(shí)使用殘差連接對(duì)網(wǎng)絡(luò)特征進(jìn)行了復(fù)利用,MDIDSC僅在一類(lèi)數(shù)據(jù)上的準(zhǔn)確率為99.29%,在其他類(lèi)別數(shù)據(jù)上的預(yù)測(cè)準(zhǔn)確率均為100%;
3)自適應(yīng)學(xué)習(xí)率退火梯度和參數(shù)修剪的網(wǎng)絡(luò)優(yōu)化訓(xùn)練方法,加速了網(wǎng)絡(luò)的收斂,同時(shí)避免了網(wǎng)絡(luò)易收斂到局部極值點(diǎn)的問(wèn)題,在凱斯西儲(chǔ)軸承數(shù)據(jù)集上的平均測(cè)試準(zhǔn)確率為99.95%。
在后續(xù)研究中,筆者將聚焦于小樣本和樣本不平衡的旋轉(zhuǎn)機(jī)械故障診斷問(wèn)題;同時(shí)擬增加抗噪模塊,以進(jìn)一步提高該網(wǎng)絡(luò)模型在不同工況下的普適性。