趙曉平, 魏旭全, 孫中波, 王榮發(fā)
(1.南京信息工程大學(xué) 計(jì)算機(jī)與軟件學(xué)院,江蘇 南京 210044;2.南京信息工程大學(xué) 數(shù)字取證教育部工程研究中心,江蘇 南京 210044)
齒輪箱是機(jī)械傳動(dòng)系統(tǒng)中的重要組件,在航空航天、風(fēng)電等領(lǐng)域發(fā)揮關(guān)鍵作用。因齒輪箱結(jié)構(gòu)復(fù)雜,工作環(huán)境惡劣,其故障多發(fā)[1]。據(jù)美國(guó)國(guó)家可再生能源實(shí)驗(yàn)室對(duì)風(fēng)電裝備零部件失效導(dǎo)致的停機(jī)維護(hù)時(shí)間統(tǒng)計(jì)分析[2],齒輪箱失效導(dǎo)致的發(fā)電量損失占比最大,而齒輪箱失效的原因主要為齒輪故障和軸承故障,這些故障發(fā)現(xiàn)不及時(shí)會(huì)造成巨大經(jīng)濟(jì)損失。因此,對(duì)齒輪箱故障診斷進(jìn)行研究具有重要意義[3]。
傳統(tǒng)的基于振動(dòng)信號(hào)的齒輪箱故障診斷方法通常設(shè)定在固定工況下[4],通過(guò)對(duì)平穩(wěn)工況下的齒輪箱振動(dòng)信號(hào)進(jìn)行處理、特征提取以及模式識(shí)別,實(shí)現(xiàn)齒輪箱狀態(tài)監(jiān)測(cè)與故障診斷。然而,實(shí)際上不少齒輪箱的運(yùn)行工況通常為變轉(zhuǎn)速、變負(fù)載的變工況。例如,風(fēng)力發(fā)電機(jī)組配備的風(fēng)電增速齒輪箱、直升機(jī)用行星齒輪減速箱等都在變工況之下運(yùn)行[5]。運(yùn)行工況的變化引起故障數(shù)據(jù)在特征層的改變,增加特征提取的難度。因此急需建立適用于變工況條件下的齒輪箱故障診斷方法。
針對(duì)變工況故障診斷問(wèn)題,研究者們提出的智能故障診斷模型,主要分為基于傳統(tǒng)機(jī)器學(xué)習(xí)、基于深度學(xué)習(xí)和基于遷移學(xué)習(xí)3類(lèi)。
在傳統(tǒng)機(jī)器學(xué)習(xí)方面,部分學(xué)者結(jié)合支持向量機(jī)[6]、BP神經(jīng)網(wǎng)絡(luò)[7]、K近鄰法[8]等進(jìn)行研究。Moshrefzadeh[9]采用一種非線(xiàn)性濾波方法,即進(jìn)行譜幅值調(diào)制(Spectral Amplitude Modulation,SAM)處理得到一系列的修正信號(hào),通過(guò)計(jì)算修正信號(hào)峰值的乘法逆,得到振動(dòng)信號(hào)的特征向量,再將特征向量輸入到支持向量機(jī)和K近鄰法中進(jìn)行分類(lèi),在辛辛那提、都靈理工和FEMTO研究所軸承數(shù)據(jù)集的變工況實(shí)驗(yàn)中均取得較好的效果。Zhang等[10]提出改進(jìn)的復(fù)合多尺度模糊熵(Refined Composite Multiscale Fuzzy Entropy,RCMFE)應(yīng)用于軸承故障特征提取,具有簡(jiǎn)單、高效的特點(diǎn),并將鯨魚(yú)優(yōu)化算法應(yīng)用到支持向量機(jī)以識(shí)別滾動(dòng)軸承故障類(lèi)別,在機(jī)械故障預(yù)防技術(shù)學(xué)會(huì)和凱斯西楚軸承數(shù)據(jù)集的變工況實(shí)驗(yàn)里,都展現(xiàn)出優(yōu)秀性能。張?chǎng)蔚萚11]使用窄帶干擾消除技術(shù)以過(guò)濾干擾信號(hào),然后對(duì)信號(hào)進(jìn)行離散小波變換重構(gòu)小波系數(shù)以得到小波分量,再提取分量的方差作為特征參數(shù)構(gòu)成特征矩陣樣本,將特征矩陣樣本輸入支持向量機(jī)進(jìn)行診斷,在變工況齒輪箱混合故障實(shí)驗(yàn)中識(shí)別準(zhǔn)確率達(dá)到100%。上述方法均依賴(lài)專(zhuān)家經(jīng)驗(yàn)進(jìn)行特征提取,需要大量的信號(hào)處理相關(guān)知識(shí)作為鋪墊,且這些淺層機(jī)器學(xué)習(xí)模型很難提取出深層故障特征。
近年來(lái),機(jī)械故障診斷步入大數(shù)據(jù)時(shí)代,深度學(xué)習(xí)被眾多學(xué)者應(yīng)用到齒輪或軸承的故障診斷中[12-13]。Li等[14]結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和自編碼器構(gòu)建故障診斷模型,其提出4種損失函數(shù)以提取與工況無(wú)關(guān)且含有故障信息的特征,在變工況軸承實(shí)驗(yàn)中達(dá)到94.89%的平均準(zhǔn)確率。Wang等[15]提出自適應(yīng)歸一化卷積神經(jīng)網(wǎng)絡(luò)用于變工況和數(shù)據(jù)不平衡的情況,采用Teager能量譜來(lái)避免大速度波動(dòng)和可變負(fù)載的影響,并使用粒子群優(yōu)化(Particle Swarm Optimization,PSO)策略對(duì)所設(shè)計(jì)模型的關(guān)鍵超參數(shù)進(jìn)行優(yōu)化,從而提高模型的整體性能,在變工況齒輪箱故障診斷實(shí)驗(yàn)中達(dá)到99.8%以上的診斷準(zhǔn)確率。趙小強(qiáng)等[16]提出一種改進(jìn)AlexNet的故障診斷方法,將時(shí)域信號(hào)按橫向插樣構(gòu)建成二維特征圖作為輸入,并調(diào)整模型中局部歸一化和池化的順序,以充分提取故障數(shù)據(jù)中的信息,提升模型在變?cè)肼暫妥冐?fù)載實(shí)驗(yàn)中的識(shí)別能力。但這些深度學(xué)習(xí)方法網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,對(duì)數(shù)據(jù)質(zhì)量要求高,應(yīng)用在實(shí)際工程場(chǎng)景容錯(cuò)率低。
此外還有學(xué)者將深度學(xué)習(xí)結(jié)合遷移學(xué)習(xí)針對(duì)變工況故障診斷作研究,Hasan等[17]提出基于聲發(fā)射信號(hào)的聲譜成像(Acoustic Spectral Imaging,ASI)結(jié)合遷移學(xué)習(xí)的故障診斷方案。ASI將加窗時(shí)域聲發(fā)射信號(hào)的頻譜分量振幅轉(zhuǎn)換為聲譜圖,從而用圖像表示聲發(fā)射信號(hào)特征,然后使用CNN進(jìn)行特征提取結(jié)合Fine-tune,在聲發(fā)射軸承數(shù)據(jù)集上實(shí)現(xiàn)94.67%的平均準(zhǔn)確率。Dong等[18]使用堆棧去噪自編碼器作特征提取器,引入聯(lián)合幾何和統(tǒng)計(jì)對(duì)齊方法處理樣本深層特征,用于減少源域和目標(biāo)域之間幾何上和統(tǒng)計(jì)量上的差異,從而提高不同工況下滾動(dòng)軸承故障診斷的準(zhǔn)確性。袁壯等[19]提出一種基于領(lǐng)域自適應(yīng)的故障診斷模型,通過(guò)將不同工況的樣本特征同步映射到一個(gè)深度隱藏層,消除工況波動(dòng)引起的分布差異,生成工況不變特征,實(shí)現(xiàn)領(lǐng)域自適應(yīng)。但基于遷移學(xué)習(xí)的方法,都需要擁有所有類(lèi)別的目標(biāo)域故障數(shù)據(jù)集才能達(dá)到比較好的效果。而在現(xiàn)實(shí)工程場(chǎng)景中,通常不能收集全部類(lèi)別的故障數(shù)據(jù),還存在類(lèi)別不均衡的現(xiàn)象,而且遷移效果依賴(lài)于目標(biāo)域和源域的相近程度和遷移策略的選擇,因此難以應(yīng)用。
以上方法均是基于單一信號(hào)開(kāi)展的故障診斷研究,而單一信號(hào)容錯(cuò)能力不佳,且包含的故障信息有限。此外,一般的故障診斷方法只考慮單獨(dú)的時(shí)域、頻域或時(shí)頻域信息,而時(shí)域、頻域特征由于對(duì)非平穩(wěn)信號(hào)不敏感、特征性能不穩(wěn)定,時(shí)頻域特征又受Heisenberg測(cè)不準(zhǔn)原理影響對(duì)非平穩(wěn)信號(hào)分析存在局限性[20]。
為解決單一來(lái)源故障特征在變工況下診斷準(zhǔn)確性有限的問(wèn)題,信息融合和卷積神經(jīng)網(wǎng)絡(luò)(Information Fusion and Convolutional Neural Network,IFCNN)從增大輸入信息量角度改進(jìn)CNN,將多傳感器信息融合結(jié)合多域特征融合改進(jìn)CNN。首先利用多傳感器信息為診斷提供更為豐富的信息,再分別從頻域和時(shí)頻域提取特征,獲取更全面的特征集合,并結(jié)合注意力機(jī)制自適應(yīng)選擇重要特征,最后進(jìn)行故障診斷。實(shí)驗(yàn)表明,IFCNN在變工況下齒輪箱故障診斷中,與其他方法相比具有更高的診斷準(zhǔn)確率。
CNN是一類(lèi)包含卷積計(jì)算且擁有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),具備強(qiáng)大的自動(dòng)特征提取能力,是深度學(xué)習(xí)的代表算法之一。CNN的結(jié)構(gòu)通常由多組卷積層和池化層堆疊構(gòu)成。卷積層實(shí)現(xiàn)數(shù)據(jù)特征的提取,池化層對(duì)數(shù)據(jù)進(jìn)行降維,再通過(guò)全連接層將提取的多個(gè)特征進(jìn)行綜合,實(shí)現(xiàn)分類(lèi),以上過(guò)程稱(chēng)為前饋運(yùn)算。然后通過(guò)反向傳播算法逐層向前反饋更新參數(shù),并在參數(shù)更新后再次前饋,重復(fù)至模型收斂,實(shí)現(xiàn)網(wǎng)絡(luò)的訓(xùn)練。
卷積層包含多個(gè)不同的卷積核,卷積核按照指定步長(zhǎng)進(jìn)行滑動(dòng)卷積,提取輸入數(shù)據(jù)的特征。卷積層的數(shù)學(xué)模型為
(1)
池化層用于壓縮數(shù)據(jù)和參數(shù)的量,可以起到增強(qiáng)數(shù)據(jù)特征不變性的作用。池化層數(shù)學(xué)模型為
(2)
Dropout[18]層也經(jīng)常被使用到CNN當(dāng)中,它被用來(lái)解決網(wǎng)絡(luò)模型過(guò)擬合問(wèn)題,從而提升模型泛化能力。在網(wǎng)絡(luò)訓(xùn)練時(shí),Dropout會(huì)隨機(jī)失活一部分神經(jīng)元,使其置零,不參與本次優(yōu)化迭代。當(dāng)Dropout率設(shè)置為0.5時(shí),即有50%的神經(jīng)元被隨機(jī)置零。隨機(jī)失活起到降低神經(jīng)元之間耦合和網(wǎng)絡(luò)集成的作用。
IFCNN模型包含多傳感器信息融合模塊、時(shí)頻域特征提取模塊、頻域特征提取模塊和多域特征融合模塊,IFCNN模型結(jié)構(gòu)如圖1所示。
圖1 IFCNN模型結(jié)構(gòu)
首先,對(duì)采集到的振動(dòng)信號(hào)進(jìn)行短時(shí)傅里葉變換(Short-Time Fourier Transform,STFT)得到其時(shí)頻圖。然后將同一時(shí)刻不同位置傳感器的時(shí)頻圖在通道維度上進(jìn)行拼接,以實(shí)現(xiàn)數(shù)據(jù)的融合,如式(3)所示。
G=[g1,g2,…,gi,…,gn],i=1,2,…,n
(3)
式中:gi為第i個(gè)傳感器的振動(dòng)信號(hào)進(jìn)行STFT后得到的時(shí)頻圖;[*]為對(duì)輸入數(shù)據(jù)g1~gn作通道上的拼接,從而得到多傳感器融合后的數(shù)據(jù)G。gi和gi+1的拼接方式如圖2所示,H和W分別為高度和寬度;C為通道數(shù)。
圖2 拼接示意圖
同時(shí),對(duì)原始振動(dòng)信號(hào)作快速傅里葉變換(Fast Fourier Transform,F(xiàn)FT)得到頻域信號(hào),然后將時(shí)頻圖在通道維度上進(jìn)行拼接,如公式(4)所示。
R=[r1,r2,…,ri,…,rn],i=1,2,…n
(4)
式中:ri為第i個(gè)傳感器的頻域信號(hào);[*]為對(duì)輸入數(shù)據(jù)r1~rn作通道上的拼接,從而得到多傳感器融合后的數(shù)據(jù)R。ri和ri+1的拼接亦如圖2所示。
時(shí)頻域特征提取模塊以多傳感器信息融合的時(shí)頻圖G作為輸入數(shù)據(jù)。因CNN對(duì)相同工況下的數(shù)據(jù)有較好的特征提取能力,對(duì)不同工況(變轉(zhuǎn)速)下的數(shù)據(jù)測(cè)試表現(xiàn)差。究其原因,CNN不能提取與工況無(wú)關(guān)的故障特征,為解決這一問(wèn)題IFCNN在三層卷積后添加Dropout層,以Dropout層減輕CNN過(guò)擬合現(xiàn)象。同時(shí),在Dropout層后連接含有32個(gè)神經(jīng)元的全連接層,用以輸出從時(shí)頻圖提取的特征P。
頻域特征提取模塊以多傳感器信息融合的頻域信號(hào)R作為輸入數(shù)據(jù)。為了從輸入數(shù)據(jù)R中最大化地提取到特征信息,本文設(shè)計(jì)兩層多尺度特征提取模塊[21],如圖1頻域特征提取模塊中的虛線(xiàn)框所示。
因使用不同尺寸的卷積核會(huì)形成不同大小的感受野,小的感受野可以看到更多的細(xì)節(jié),大的感受野可以看到更多數(shù)據(jù)整體的特征,所以在多尺度特征提取模塊采用3*1和128*1的卷積核對(duì)輸入的數(shù)據(jù)分別進(jìn)行不同尺度的特征提取。不同卷積層感受野的迭代計(jì)算步驟為
(5)
式中:lk為第k層的感受野大??;fk為當(dāng)前層的卷積核大?。籹i為第i層的步長(zhǎng);感受野初始值l0為1。
將多尺度特征提取模塊得到的不同尺度特征在通道維度拼接,以輸出提取到的特征信息,再經(jīng)過(guò)一個(gè)卷積層進(jìn)行特征提取。同樣為了減輕CNN過(guò)擬合現(xiàn)象,在卷積層后添加Dropout層。隨之連接含有32個(gè)神經(jīng)元的全連接層,用以輸出頻域信號(hào)提取的特征O。
多域特征融合模塊以時(shí)頻圖的深層特征P和頻域信號(hào)的深層特征O融合作為輸入,以獲得更全面的故障信息。目前部分研究人員在融合多網(wǎng)絡(luò)輸出、多域特征時(shí),常采用串行連接方式,此方式明顯忽略不同特征對(duì)故障診斷結(jié)果的貢獻(xiàn)度。為此,IFCNN模型串行拼接頻域和時(shí)頻域特征向量的同時(shí),引入注意力模塊。注意力模塊由Squeeze-and-Excitation[22]模塊修改而來(lái),因該模塊在網(wǎng)絡(luò)全連接層后實(shí)現(xiàn),所以去除全局池化層。
IFCNN中的注意力模塊是一種軟注意力機(jī)制。其通過(guò)引入注意力權(quán)重s,使網(wǎng)絡(luò)模型的注意力集中到對(duì)分類(lèi)任務(wù)具有更大貢獻(xiàn)的有效特征。IFCNN模型利用注意力模塊的這一特性,以確定頻域、時(shí)頻域特征的重要程度。注意力模塊結(jié)構(gòu)如圖3所示。
圖3 注意力模塊
圖3的注意力模塊以尺寸為E×1的特征作為輸入,使用序號(hào)為②的支路進(jìn)行激勵(lì)(Excitation)操作產(chǎn)生注意力權(quán)重s,如式(6)所示。
s=σ(W2δ(W1z))
(6)
式中:z為輸入的特征;W1與W2分別為兩個(gè)全連接層的權(quán)重;激勵(lì)過(guò)程中的第1個(gè)全連接層將輸入特征數(shù)由E降為E/r,以減少參數(shù);r為壓縮比。δ(*)為ReLU函數(shù),特征在經(jīng)過(guò)ReLU函數(shù)作用后僅保留大于零的值,用以學(xué)習(xí)各個(gè)特征之間的非線(xiàn)性關(guān)系。第2個(gè)全連接層將特征通道數(shù)還原至E,以便與輸入特征的數(shù)量保持一致,σ(*)為Sigmoid函數(shù),通過(guò)Sigmoid函數(shù)得到權(quán)重s。
將權(quán)重s與原有特征z按位相乘得到有效故障特征v,如式(7)所示。
vc=zc×sc
(7)
式中:zc為融合層中第c個(gè)特征;sc為與之相對(duì)應(yīng)的注意力權(quán)重;將zc與sc相乘得到第c個(gè)特征vc。對(duì)融合后的頻域和時(shí)頻域特征中的有效特征賦予高權(quán)重,以抑制無(wú)用特征,最后將處理后的特征向量送入softmax分類(lèi)器。
IFCNN診斷流程如圖4所示,包括3個(gè)步驟:數(shù)據(jù)預(yù)處理、訓(xùn)練模型和模型診斷,具體如下。
圖4 IFCNN故障診斷流程圖
① 數(shù)據(jù)預(yù)處理。對(duì)采集得到的振動(dòng)信號(hào)作FFT和STFT處理,分別得到頻域信號(hào)和時(shí)頻圖。再對(duì)頻域信號(hào)和時(shí)頻圖進(jìn)行多傳感器信息融合處理,得到所需的輸入樣本,將樣本按工況劃分成多個(gè)數(shù)據(jù)集。
② 模型訓(xùn)練。構(gòu)建IFCNN,對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行初始化。將訓(xùn)練樣本的頻域信號(hào)和時(shí)頻圖同時(shí)輸入到IFCNN中,對(duì)各層網(wǎng)絡(luò)參數(shù)進(jìn)行訓(xùn)練,最終得到訓(xùn)練好的模型。
③ 模型診斷。將測(cè)試樣本輸入到訓(xùn)練好的IFCNN模型對(duì)齒輪箱故障數(shù)據(jù)進(jìn)行自適應(yīng)特征提取和模式識(shí)別,輸出診斷結(jié)果。
為了驗(yàn)證IFCNN對(duì)齒輪箱故障診斷的有效性,以SpectraQuest公司生產(chǎn)的動(dòng)力傳動(dòng)故障診斷試驗(yàn)臺(tái)為研究對(duì)象進(jìn)行實(shí)驗(yàn)。在試驗(yàn)臺(tái)的齒輪箱的驅(qū)動(dòng)電機(jī)側(cè)和磁粉制動(dòng)器側(cè)兩個(gè)位置安裝加速度傳感器,采樣頻率為20 kHz,采樣時(shí)間為20 s。具體實(shí)驗(yàn)裝置如圖5所示。
實(shí)驗(yàn)中,通過(guò)更換齒輪箱內(nèi)的故障齒輪和故障軸承共采集9種齒輪箱狀態(tài),分別是1種正常狀態(tài)、3種軸承故障狀態(tài)(內(nèi)圈故障、外圈故障、滾子故障)和5種齒輪故障狀態(tài)(缺齒、斷齒、偏心、過(guò)度磨損、裂紋),軸承故障部件和齒輪故障部件如圖6所示。在實(shí)驗(yàn)采集過(guò)程中,會(huì)隨機(jī)使用金屬敲擊工作臺(tái)等方法產(chǎn)生人為噪聲,以模擬實(shí)際生產(chǎn)環(huán)境。被污染的信號(hào)約占總信號(hào)的5%。
圖5 實(shí)驗(yàn)裝置
圖6 軸承故障部件和齒輪故障部件
變工況通常指機(jī)器運(yùn)行狀態(tài)的轉(zhuǎn)速不同或負(fù)載不同等狀況,本文實(shí)驗(yàn)采用不同轉(zhuǎn)速模擬不同工況。因此設(shè)置4種電動(dòng)機(jī)轉(zhuǎn)速(1700 r/min、1800 r/min、3400 r/min和3800 r/min)以采集9種齒輪箱狀態(tài)的信號(hào)。每種轉(zhuǎn)速下采集傳感器1和傳感器2獲取的時(shí)域信號(hào),得到9×2個(gè)信號(hào)文件,4種轉(zhuǎn)速合計(jì)18×4個(gè)信號(hào)文件。單個(gè)信號(hào)文件包含409600個(gè)數(shù)據(jù)點(diǎn),在確保單個(gè)樣本中包含至少一個(gè)完整振動(dòng)周期的情況下,為方便后續(xù)數(shù)據(jù)處理保留400000個(gè)數(shù)據(jù)點(diǎn),按照每2000點(diǎn)為一段進(jìn)行切分,最終得到200個(gè)樣本。為提高特征提取過(guò)程中的收斂速度,對(duì)得到的樣本進(jìn)行最大最小歸一化處理,歸一化公式如式(8)所示。
(8)
對(duì)歸一化后的時(shí)域信號(hào)作FFT,從而得到1000×1的頻域信號(hào),同時(shí)對(duì)歸一化后的時(shí)域信號(hào)作STFT,得到32×32×3的時(shí)頻圖。將同一時(shí)刻不同傳感器的頻域信號(hào)和時(shí)頻圖分別在通道維度上進(jìn)行拼接,得到1000×2的頻域信號(hào)和32×32×6的時(shí)頻圖,將其視為一組樣本,作為IFCNN的輸入。
按轉(zhuǎn)速將處理后的數(shù)據(jù)劃分為A(1700 r/min)、B(1800 r/min)、C(3400 r/min)、D(3800 r/min)4個(gè)數(shù)據(jù)集。每個(gè)數(shù)據(jù)集包含9種狀態(tài),數(shù)據(jù)集劃分如表1所示。
表1 數(shù)據(jù)集劃分
在模型訓(xùn)練階段,Batch-size設(shè)置為128,采用Adam優(yōu)化器,學(xué)習(xí)率設(shè)置為0.001。IFCNN模型使用的超參數(shù)如表2所示,模型中卷積層的步長(zhǎng)均設(shè)置為2,卷積層使用的激活函數(shù)均為ReLU。實(shí)驗(yàn)評(píng)價(jià)標(biāo)準(zhǔn)以準(zhǔn)確率(Accuracy,ACC)作為指標(biāo)。
表2 IFCNN模型結(jié)構(gòu)參數(shù)
4.3.1 變工況實(shí)驗(yàn)對(duì)比分析
為了驗(yàn)證IFCNN方法在變工況下的有效性,將其與ResNet18(Residual Neural Network 18)和薛陽(yáng)等[23]所提出的MFCNN(Multimodal Fusion Convolutional Neural Network)進(jìn)行實(shí)驗(yàn)對(duì)比分析。ResNet18采用頻域信號(hào)輸入,MFCNN采用時(shí)域和頻域信號(hào)輸入。
為減少不確定因素對(duì)實(shí)驗(yàn)結(jié)果的干擾,確保方法的可靠性,做12組實(shí)驗(yàn),每組實(shí)驗(yàn)重復(fù)做10次,取均值,得到如圖7和表3所示的結(jié)果。圖7中橫坐標(biāo)代表該組實(shí)驗(yàn)使用的訓(xùn)練集和測(cè)試集。以A-B為例,A代表訓(xùn)練集,B代表測(cè)試集。從表3中可以看到,在列出的12組變工況實(shí)驗(yàn)中:ResNet18只有在A-B和B-A這兩組實(shí)驗(yàn)中達(dá)到90%以上準(zhǔn)確率,在訓(xùn)練集和測(cè)試集轉(zhuǎn)速差異大的剩余10組實(shí)驗(yàn)中準(zhǔn)確率在60%~90%之間;MFCNN在A-B實(shí)驗(yàn)中達(dá)到90.09%的準(zhǔn)確率,在其他11組實(shí)驗(yàn)中準(zhǔn)確率均低于90%;而IFCNN在12組實(shí)驗(yàn)中準(zhǔn)確率均超越其他兩種方法,只有在D-A情況下稍低,準(zhǔn)確率為94.45%。綜合分析得出,相較于其他兩種方法,本文提出的IFCNN方法具有更高的準(zhǔn)確率。
圖7 不同方法變工況實(shí)驗(yàn)結(jié)果對(duì)比
表3 不同方法變工況實(shí)驗(yàn)結(jié)果對(duì)比
為進(jìn)一步驗(yàn)證IFCNN模型的特征提取能力,采用t-SNE降維算法[24]將所提取特征按相似度投影到二維空間中進(jìn)行分析。選擇IFCNN、ResNet18、MFCNN這3個(gè)模型進(jìn)行特征降維對(duì)比。以D-A情況為例,用數(shù)據(jù)集D進(jìn)行模型訓(xùn)練,再將數(shù)據(jù)集A中樣本作為模型輸入,學(xué)習(xí)得到樣本的特征。圖8為對(duì)3個(gè)模型最后全連接層輸出的特征進(jìn)行t-SNE降維可視化的結(jié)果。
圖8 不同模型的輸出特征可視化
如圖8(a)所示,ResNet18提取的不同類(lèi)別的特征區(qū)分度較差,在圖中黑色虛線(xiàn)圈處多個(gè)類(lèi)別的特征分布錯(cuò)亂,說(shuō)明ResNet18對(duì)故障特征提取不充分。圖8(b)MFCNN輸出特征的可視化結(jié)果顯示,黑色虛線(xiàn)圈出部分標(biāo)簽樣本界限不清晰,存在大范圍的錯(cuò)分。圖8(c)為IFCNN輸出特征的可視化結(jié)果,可以看出,經(jīng)過(guò)特征提取后,不同標(biāo)簽的樣本在二維空間中分布很集中,只有極少部分被錯(cuò)分,如圖8(c)黑色虛線(xiàn)標(biāo)注。對(duì)比圖8(a)、圖8(b)和圖8(c)可知,IFCNN模型所提取的特征在相同類(lèi)別標(biāo)簽下聚合得更集中,可分性更好。
4.3.2 消融實(shí)驗(yàn)
為了驗(yàn)證多傳感器信息融合能夠更全面、更完整地表征機(jī)械設(shè)備的運(yùn)行狀態(tài),將單傳感器的數(shù)據(jù)以相同的方式輸入IFCNN作為一種方法。因有2個(gè)傳感器,即稱(chēng)為方法1和方法2,與IFCNN進(jìn)行對(duì)比實(shí)驗(yàn)。同時(shí)為了驗(yàn)證多域特征融合的有效性,將只使用單域(頻域、時(shí)頻域)特征提取模塊的IFCNN作為一種方法,即稱(chēng)為方法3和方法4,與IFCNN進(jìn)行對(duì)比。上述對(duì)比方法的超參數(shù)與IFCNN保持一致。實(shí)驗(yàn)訓(xùn)練集采用數(shù)據(jù)集D,測(cè)試集采用數(shù)據(jù)集A、數(shù)據(jù)集B、數(shù)據(jù)集C,因D-A、D-B、D-C這3組實(shí)驗(yàn)較難分類(lèi)。每組實(shí)驗(yàn)重復(fù)10次,取其均值,得到表4的結(jié)果。
表4 不同方法效果對(duì)比
表4所示的IFCNN方法、方法1、方法2的對(duì)比實(shí)驗(yàn)結(jié)果顯示,IFCNN因采用多傳感器信息融合,其平均準(zhǔn)確率達(dá)到97.33%,而方法1和方法2的平均診斷準(zhǔn)確率均在90%以下,從而說(shuō)明IFCNN能夠?yàn)闄C(jī)械故障診斷提供更全面更準(zhǔn)確的信息。
表4中方法3頻域輸入的平均準(zhǔn)確率為95.73%,方法4時(shí)頻域輸入的平均準(zhǔn)確率為84.82%,而IFCNN方法的平均準(zhǔn)確率(97.33%)均優(yōu)于上述兩種方法,這說(shuō)明IFCNN使用多域特征融合可以有效收集多個(gè)角度的故障特征,提供更加全面的信息,再結(jié)合注意力機(jī)制賦予有效故障特征高權(quán)重,提升融合效果,從而提升故障診斷效果。
為了更直觀地展示IFCNN方法在變工況故障診斷中與其他方法相比具有更好的故障診斷效果,以數(shù)據(jù)集D為訓(xùn)練集,數(shù)據(jù)集A為測(cè)試集,繪制以上5種方法對(duì)應(yīng)的混淆矩陣,不同方法的混淆矩陣如圖9所示。
圖9的所有子圖中,橫坐標(biāo)為樣本的預(yù)測(cè)類(lèi)別,縱坐標(biāo)為樣本的真實(shí)類(lèi)別,橫縱坐標(biāo)交點(diǎn)數(shù)字為預(yù)測(cè)樣本數(shù)目,測(cè)試樣本每類(lèi)200個(gè)。由圖9(a)發(fā)現(xiàn),多個(gè)類(lèi)別正確預(yù)測(cè)數(shù)目接近200個(gè),平均分類(lèi)準(zhǔn)確率為95.83%,由此可知IFCNN方法在D-A數(shù)據(jù)集上實(shí)現(xiàn)準(zhǔn)確診斷;只有對(duì)外圈故障樣本識(shí)別較差,正確預(yù)測(cè)數(shù)為150個(gè),但仍?xún)?yōu)于對(duì)比的4種方法。而由圖9(b)可以看出,方法1對(duì)外圈故障樣本、缺齒樣本預(yù)測(cè)正確數(shù)量少,分別為84個(gè)、92個(gè)。由圖9(c)可以看出,方法2對(duì)正常樣本、內(nèi)圈故障樣本、偏心樣本正確預(yù)測(cè)數(shù)目較少,分別為144個(gè)、103個(gè)、136個(gè)。究其原因,在變工況下同類(lèi)故障間的振動(dòng)幅值、能量存在較大差異,單一傳感器信息難以呈現(xiàn)深層故障特征。
由圖9(d)和圖9(e)可以看出,方法3正確預(yù)測(cè)外圈故障樣本只有111個(gè),而IFCNN識(shí)別出150個(gè)外圈故障樣本。除此以外,方法4對(duì)正常樣本、內(nèi)圈故障樣本、外圈故障樣本和磨損樣本存在大量錯(cuò)分,即在每類(lèi)200個(gè)樣本的情況下正確識(shí)別數(shù)量均在150個(gè)以下,準(zhǔn)確率低,均在75%以下。
基于以上分析,IFCNN對(duì)所有故障類(lèi)別的識(shí)別準(zhǔn)確率均優(yōu)于其他4種方法。從而表明針對(duì)變工況下的齒輪箱故障診斷問(wèn)題,IFCNN可以有效融合多種信息,深度提取故障特征,實(shí)現(xiàn)故障類(lèi)別的準(zhǔn)確預(yù)測(cè),證明IFCNN的有效性。
將多傳感器信息融合結(jié)合多域特征融合改進(jìn)CNN得到IFCNN模型,能夠解決單一來(lái)源故障特征在變工況下診斷準(zhǔn)確性有限的問(wèn)題。實(shí)驗(yàn)結(jié)果表明:
① IFCNN利用多個(gè)傳感器采集的信息對(duì)數(shù)據(jù)進(jìn)行融合,能夠獲取更加全面的振動(dòng)信息。結(jié)合CNN強(qiáng)大的非線(xiàn)性特征學(xué)習(xí)能力,可以有效提取深度故障特征,提升模型泛化能力。
② 在頻域、時(shí)頻域信息融合的基礎(chǔ)上,結(jié)合注意力機(jī)制自動(dòng)判斷頻域、時(shí)頻域所提取特征對(duì)故障診斷結(jié)果的貢獻(xiàn)度,有效利用各信號(hào)間的相關(guān)性與互補(bǔ)性,從而提升模型穩(wěn)定性。
③ 使用齒輪箱數(shù)據(jù)集對(duì)IFCNN進(jìn)行變工況實(shí)驗(yàn)驗(yàn)證,與ResNet18和MFCNN相比,多組實(shí)驗(yàn)結(jié)果表明IFCNN準(zhǔn)確率更高,適用范圍更廣,為變工況條件下的齒輪箱故障診斷提供更好選項(xiàng)。