張潤地 劉雨暉 荊曉 遠韓光信
摘 要:【目的】在實際生產(chǎn)環(huán)境中,由于機器特征復雜和工況變化,智能診斷模型在跨機組遷移時需要重復訓練,這不僅增加了時間成本,還加大了算力資源的消耗。為了解決這些問題,需要開發(fā)出一種能適應復雜機器特征并在不同工況下保持高準確度的軸承故障診斷方法,同時,減少模型遷移時所需的重復訓練,以便實現(xiàn)更高效的故障識別和預測。【方法】研究提出基于互補集合經(jīng)驗模態(tài)分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)和遷移學習的滾動軸承故障診斷方法。首先,采用CEEMD法對原始信號進行分解,并計算出對應分量的峭度值。其次,采用多核最大均值差異法對源域數(shù)據(jù)與目標域數(shù)據(jù)進行域適應處理。最后,在凱斯西儲大學軸承數(shù)據(jù)集和美國機械故障預防技術學會軸承數(shù)據(jù)集之間進行遷移故障診斷試驗及對比分析。【結果】研究結果表明,與直接遷移模型算法相比,基于CEEMD改進的遷移學習網(wǎng)絡在不同數(shù)據(jù)集上的遷移效果更好,其故障診斷的準確率最高。【結論】經(jīng)試驗驗證,研究所提的方法表現(xiàn)出良好的變工況跨機組適配能力,具有較高的故障診斷精度,為研究復雜工況下多機組相似故障診斷場景提供了非常有價值的參考。
關鍵詞:滾動軸承;互補集合經(jīng)驗模態(tài)分解;遷移學習;故障診斷
中圖分類號:TP391.4? ? ?文獻標志碼:A? ? ?文章編號:1003-5168(2024)04-0019-07
DOI:10.19968/j.cnki.hnkj.1003-5168.2024.04.004
Research on Rolling Bearing Fault Diagnosis Based on CEEMD and Transfer Learning
ZHANG Rundi1 LIU Yuhui2 JING Xiaoyuan2 HAN Guangxin1
(1.College of Information and Control Engineering, Jilin of Chemical Technology, Jilin 132022, China;
2.College of Computer Science, Guangdong University of Petrochemical Technology, Maoming 525000, China)
Abstract:[Purposes] In the actual production environment, due to the complexity of machine features and the change of working conditions, the intelligent diagnosis model needs repeated training when migrating across units, which not only increases the time cost, but also increases the consumption of computing resources. In order to solve these problems, it is necessary to develop a bearing fault diagnosis method that can adapt to complex machine features and maintain high accuracy under different working conditions. At the same time, the repeated training required for model migration is reduced to achieve more efficient fault identification and prediction. [Methods] The study proposes a rolling bearing fault diagnosis method based on CEEMD and transfer learning. First, the CEEMD decomposition method is used to decompose the original signal and the kurtosis value of the corresponding component is calculated. Then, the multi-core maximum mean difference method is used for the source domain data and the target domain data. Domain adaptation processing, and finally a migration fault diagnosis test and comparative analysis between the Case Western Reserve University dataset and the American Society for Mechanical Failure Prevention Technology dataset. [Findings]The research results show that compared with the existing direct transfer model algorithm, the improved transfer learning network based on CEEMD has a better transfer effect on different data sets, and its fault diagnosis accuracy is the highest. [Conclusions]It is verified by experiments that the method proposed in the study shows good cross-unit adaptability under variable working conditions, and has high fault diagnosis accuracy, which provides a valuable reference for studying similar fault diagnosis scenarios of multiple units under complex working conditions.
Keywords: rolling bearing; CEEMD; transfer learning; fault diagnosis
0 引言
在實際工業(yè)生產(chǎn)中,滾動軸承是旋轉機械的關鍵部件,一旦滾動軸承發(fā)生故障,極有可能會對設備造成不可修復的重大損害。若滾動軸承長期處于故障狀態(tài),不僅會影響設備的安全性和可靠性,嚴重時還會造成重大的安全事故[1]。因此,研究滾動軸承故障診斷技術對保障工業(yè)安全生產(chǎn)具有重要意義。
隨著現(xiàn)代工業(yè)機械日益精細化和復雜化,提取設備故障特征也變得越來越困難,如何在減少故障診斷成本的基礎上,對故障特征實現(xiàn)準確高效的提取,成為跨設備故障診斷工作的重要一環(huán)?,F(xiàn)有的故障特征提取大多是基于恒定工況下的信號處理方式,而在實際工業(yè)生產(chǎn)環(huán)境中,不同時刻各種機械裝備的轉速與工作負載是不同的,加上各種部件之間的耦合,導致真實運行狀態(tài)的振動信號往往都是非線性、非平穩(wěn)的。目前,常用的故障特征提取方法有小波變換(Wavelet Transform, WT)、經(jīng)驗模態(tài)分解(Empirical Mode Decomposition, EMD)。石志煒等[2]采用改進小波包閾值降噪法,根據(jù)信號的噪聲比例來改動閾值函數(shù),從而實現(xiàn)故障特征的提??;Huang等[3]提出的EMD是無須先驗知識就能自適應分解非線性、非平穩(wěn)時頻信號的方法,但存在無法準確分解信號的缺陷;針對EMD分解存在的模態(tài)疊混的問題,Wu等[4]提出集合經(jīng)驗模態(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)方法,EEMD方法利用輔助噪聲,有效避免了模態(tài)混疊問題,但其存在計算量大、分解不完備的缺陷。基于此,Yeh等[5]提出了互補集合經(jīng)驗模態(tài)分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)的方法。與EEMD相比,CEEMD的迭代次數(shù)更少,且信號分解效果更好。國內(nèi)研究學者在上述信號特征提取理論的基礎上,進行滾動軸承故障診斷的前期研究工作。張萍等[6]采用互補集合經(jīng)驗模態(tài)分解法對滾動軸承故障進行診斷,能有效地彌補EMD分解不準確的缺陷,但其準確度還是稍顯不足;王夢[7]利用EEMD與峭度譜結合的方法對旋轉機械故障進行診斷,該方法故障特征提取的準確度比EEMD法有所提高,但信號分解的計算量卻增大;宋治惠[8]提出CEEMD和峭度譜結合的方法,能準確有效地提取出滾動軸承的早期故障特征,并能有效減少計算量。
基于傳統(tǒng)機器學習的故障診斷方法雖然有著較低的計算成本,但隨著工業(yè)互聯(lián)網(wǎng)的接入與企業(yè)的數(shù)字化轉型,已不能適應當前擁有海量數(shù)據(jù)信息的智慧化工業(yè)生產(chǎn)過程。由此采用深度學習的方法,通過多層次神經(jīng)元網(wǎng)絡進行特征提取,彌補了傳統(tǒng)機器學習的缺點,并取得更好的成效。
基于深度學習的方法具有強大的特征自適應提取能力,但其分類性能受到網(wǎng)絡層數(shù)的影響。網(wǎng)絡層數(shù)越多,所提取到的特征信息越多,計算復雜度也就越高。但一味簡單地疊加神經(jīng)網(wǎng)絡會造成梯度彌散或梯度爆炸等問題,導致模型的識別精度不高,訓練時間也會大大增加。此外,在變工況跨設備的相似故障診斷場景中,常用的深度學習方法仍難以準確識別出故障類型。引入遷移學習能在減少訓練成本的同時,大大提高故障診斷的準確率。因此,一些學者也對遷移學習應用于故障診斷領域進行了探索。Yang等[9]提出一種基于特征遷移的故障診斷模型,通過引入多層最大均值差異來實現(xiàn)特征的域適應,實現(xiàn)了跨設備故障遷移診斷;為了解決數(shù)據(jù)稀疏問題,Han等[10]提出一種基于生成對抗網(wǎng)絡的故障診斷方法,利用多個并行域鑒別器進行數(shù)據(jù)匹配,再單獨進行域適應處理,從而完成故障診斷。然而,現(xiàn)有基于遷移學習的故障診斷研究仍存在兩個問題:一是用于遷移的模型大都需要多次重復訓練,而隨著網(wǎng)絡模型的加深,其所需要的標記數(shù)據(jù)和訓練設備資源也會增多,導致模型訓練成本有所增加;二是目前的研究主要處理的是一維信號的輸入數(shù)據(jù),其樣本特征存在單一性問題,導致模型無法提取到足夠多的特征用于故障識別。
綜上所述,針對實際生產(chǎn)環(huán)境中存在的復雜機器特征難以完整提取、變工況跨機組遷移時需要模型重復訓練等問題,本研究提出一種基于CEEMD和遷移學習的滾動軸承故障診斷方法。首先,在保證分解效果與EEMD相當?shù)那疤嵯?,CEEMD能抑制由白噪聲引起的重構誤差。其次,在CEEMD方法的基礎上,結合計算每個固有模態(tài)函數(shù)對應的峭度值,提取出滾動軸承故障樣本中更深層次的特征信息。最后,基于特征映射的遷移學習網(wǎng)絡模型,采用多核最大均值差異法來降低網(wǎng)絡訓練成本,并提高網(wǎng)絡對故障識別的準確率。因此,本研究基于該方法來構建改進的深度神經(jīng)網(wǎng)絡模型,以獲取更精準、更全面的故障特征,并通過試驗驗證所提出的方法,并證明該方法能更好地適應變工況跨機組的復雜場景。
1 軸承故障診斷理論
1.1 振動信號處理
在信號處理方面,有三種典型的處理方法:一是時域處理方法,如有量綱特征值分析和無量綱特征值分析;二是頻域處理方法,如傅里葉變換、能量譜和功率譜;三是時頻域分析,如小波分析。實際工業(yè)生產(chǎn)中所采集到的信號通常為時域信號,為了平衡特征提取工作的成本與準確性,本研究選擇時頻域分析方法。
時頻處理信號的方法有小波變換和EMD。小波變換是基于一個特定小波基的分析方法,一旦確定了小波基,那么在整個分析過程中都將無法對其進行更換,即使該小波基在全局可能是最優(yōu)的,但在一些局部地方卻不是最優(yōu)的。因此,小波分析不能針對不同工況和不同機組之間的情況進行適應調(diào)整。而EMD最突出的特點是解決了小波變換中基函數(shù)不能自適應的問題,對一段未知的非線性、非平穩(wěn)信號,EMD不需要去做預先分析與研究,可以直接開始分解。EMD的分解過程如下:①根據(jù)原始信號的上下極值點,分別畫出上下包絡線;②求上下包絡線的均值,并畫出均值包絡線;③原始信號減去均值包絡線,得到中間信號;④判斷該中間信號是否為IMF,如果不是,以該信號為基礎,重新進行①到④的操作;⑤在使用上述方法得到第一個IMF后(即IMF1),用原始信號減IMF1 作為新的原始信號,再通過①到④的操作,得到IMF2,以此類推,完成EMD分解。
在實際的工業(yè)機器振動信號采集過程中,一旦出現(xiàn)間歇性信號,采用EMD分解法會出現(xiàn)頻率混疊的現(xiàn)象,也叫模態(tài)混疊。具體表現(xiàn)為一個IMF分量中存在多個尺度成分或一個尺度成分在多個IMF分量中存在。
為了解決這個問題,可以采用噪聲輔助處理的方法,即EEMD。EEMD利用白噪聲均值為0的特性,在信號分解過程中,通過多次引入均勻分布的白噪聲來掩蓋原信號本身的噪聲,從而得到更加精準的上下包絡線。EEMD方法的分解過程如下:①設定原始信號的處理次數(shù)(m);②給這m個原始信號分別添加隨機白噪聲,并組成一系列新的信號;③對這一系列新信號分別進行EMD分解,得到一系列的IMF分量;④對相應模態(tài)的IMF分量分別求均值,得到EEMD分解結果。
CEEMD是在EMD和EEMD的基礎上,對信號分解過程中存在的模態(tài)混疊問題進行的改進。CEEMD以噪聲輔助數(shù)據(jù)分析方法為基礎,在信號中添加多對符號相反的白噪聲后,再應用EMD分解,對分解結果進行集成平均運算,從而獲得最終的分解結果。
在原始信號中添加一對符號相反的噪聲信號,加入的白噪聲幅值相同,其表現(xiàn)形式見式(1)、式(2)。
[m+it=xt+n+it] (1)
[m-it=xt+n-it] (2)
式中:[xt]為原始信號;[n+it]為正噪聲;[n-it]為負噪聲。
首先,對[m+it]、[m-it]進行EMD分解,得到兩組集成的IMF分量IMF1、IMF2。其中,IMF1為加入正噪聲的集成平均結果,IMF2為加入負噪聲的集成平均結果。其次,將每組IMF函數(shù)進行組合加權處理,生成一組總IMF函數(shù)。最后,對總IMF函數(shù)進行EMD分解,得到一組新的IMF函數(shù)。如此反復迭代,直到得到的IMF函數(shù)的數(shù)量不再增加為止。
在實際生產(chǎn)過程中,機組不可能維持在一個恒定的轉速、頻率下工作,因此,為了適應實際情況下的機械故障診斷,本研究還需要對采集到的時域信號進行無量綱指標提取。主要選取對這個峭度信號瞬時沖擊極為敏感的無量綱指標,為完善故障信號的特征提取提供有效補充,進而過濾CEEMD分解后的IMF分量,以提高振動信號故障特征提取效率。峭度值的計算見式(3)。
[k4x=Ex-μ4σ4] (3)
式中:[E]為求期望值;[x]為信號值;[μ]為信號均值;[σ]為標準差。
1.2 遷移學習及其網(wǎng)絡模型
卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)是目前深度學習理論中應用最為成熟的網(wǎng)絡模型,因其具有強大的特征提取和模型泛化能力而被廣泛應用于多個領域。目前,軸承故障診斷領域也有大量成果是基于CNN網(wǎng)絡模型演化而來的。CNN通常由卷積層、池化層和全連接層構成。其中,卷積層用于提取特征,是CNN網(wǎng)絡的核心;池化層對經(jīng)過卷積處理得到的特征圖進行特征降維,壓縮數(shù)據(jù)和參數(shù)的數(shù)量,同時減小網(wǎng)絡參數(shù)規(guī)模,避免過擬合;全連接層將學習到的特征進行輸出。
隨著深度學習在軸承故障診斷領域中的廣泛應用,在恒定工況下運行的單機器表現(xiàn)良好的CNN網(wǎng)絡模型,卻在變工況多機組場景下顯現(xiàn)出了訓練耗時、準確率低下等弊端。因此,需要將遷移學習方法應用于軸承故障診斷領域中,來解決上述問題。
在上述問題場景中,已訓練好的模型不能很好地適應新的目標機器,需要對不同的目標數(shù)據(jù)域重新訓練模型,從而導致學習成本太高,因此,本研究運用已有的知識或模型將訓練好的模型遷移到目標域上。根據(jù)遷移方式來劃分,遷移學習方法可分為基于實例的遷移方法、基于映射的遷移方法、基于模型的遷移方法、基于對抗的遷移方法等。
本研究采用基于映射的遷移方法,將深度學習與遷移學習相結合,構建出深度自適應網(wǎng)絡,核心是使用設計的自適應層來完成源域與目標域數(shù)據(jù)的自適應,其中,自適應層采用多核最大均值差異(Multiple Kernel Maximum Mean Discrepancy,MK-MMD)方法。最大均值差異(Maximum Mean Discrepancy,MMD)方法是遷移學習中實現(xiàn)域適應技術最常用的一種損失函數(shù),其定義見式(4)。
[MF, p, q?supf?FEpfx-Eqfy]? (4)
式中:[sup]為求上界,即最大值;[Ep]為求期望值;[f?]為映射函數(shù);[F]為函數(shù)域;[x]為源域數(shù)據(jù);[y]為目標域數(shù)據(jù);x和y的分布分別為[p]和[q];[fx]、[fy]分別為源域和目標域數(shù)據(jù)經(jīng)過映射后的值。
MK-MMD是在MMD基礎上發(fā)展而來的,用多個核去構造一個總的核,定義見式(5)。
[d2kp,q?Ep?xs-Eq?xt2Hk] (5)
式中:[d2kp,q]為[p]和[q]之間的再生核希爾伯特空間距離,其中,將核(Kernel)定義為[K],表示見式(6)。
[K?k=u=1mβuki:βu≥0,?u] (6)
式中:[βu]為權重。
本研究使用的損失函數(shù)定義見式(7)。
[l=lcDs, ys+λMK-MMD2Ds,Dt] (7)
式中:[l]為總損失;[lcDs,ys]為有標注數(shù)據(jù)上的常規(guī)損失;[λMK-MMD2Ds,Dt]為模型的多核最大均值差異損失;[Ds]為源域;[Dt]為目標域;[ys]為源域的標簽數(shù)據(jù);[λ]為權重。
2 網(wǎng)絡模型的改進與故障診斷方法
2.1 改進的AlexNet模型
AlexNet是在2012年ImageNet圖像分類競賽中提出的一種經(jīng)典的卷積神經(jīng)網(wǎng)絡,共包含5個卷積層和3個全連接層。其中,第一、二、五個卷積層后面都附加一個池化層,后三個層為全連接層。
本研究所提出的改進模型(以下稱為FineTune-AlexNet)是在AlexNet基礎上,添加不適用激活函數(shù)的線性輸出層,并將最后幾個全連接層設置為域適應層。該域適應層使用MK-MMD作為域適應的正則化項,以減少源域和目標域之間的分布差異。改進后的網(wǎng)絡模型層級如圖1所示。
2.2 基于CEEMD與深度自適應網(wǎng)絡的軸承故障診斷框架
本研究提出的軸承故障診斷方法流程如圖2所示。包括信號數(shù)據(jù)預處理、模型特征映射遷移學習、使用訓練好的模型進行滾動軸承故障診斷等。
2.2.1 信號預處理。先使用CEEMD法對機器原始時域振動信號進行分解,再求取IMF分量的峭度值,用其組成一組新的數(shù)據(jù)。
2.2.2 模型特征映射遷移。先對源域數(shù)據(jù)進行模型訓練,再利用遷移學習方法將訓練后的權重參數(shù)針對目標域的數(shù)據(jù)進行特征映射遷移,直到損失收斂完成遷移學習為止。
2.2.3 故障診斷。使用遷移學習后的模型進行故障診斷和診斷結果正確率的精度驗證。
3 試驗分析
3.1 數(shù)據(jù)集和相關參數(shù)
本研究選取凱斯西儲大學軸承數(shù)據(jù)集和美國-機械故障預防技術學會的軸承數(shù)據(jù)集(以下分別簡稱CWRU數(shù)據(jù)集和MFPT數(shù)據(jù)集)分別作為試驗的源域數(shù)據(jù)和目標域數(shù)據(jù)來源進行驗證。試驗所使用的機器如圖3所示。主要由風扇端軸承、驅動端軸承、電機、扭矩傳感器、編碼器和負載組成。
試驗所使用的CWRU源域數(shù)據(jù)集包括四種軸承健康狀態(tài)。即正常狀態(tài)、內(nèi)圈故障、外圈故障和滾動體故障,其中,故障直徑有0.017 78 cm、0.035 56 cm、0.053 34 cm這三種尺寸類型。試驗電機是在0 kW、0.735 kW、1.470 kW、2.205 kW四種不同負載和1 730 r/min、1 750 r/min、1 772 r/min、1 797 r/min四種不同轉速下工作的。
試驗所使用的MFPT目標域數(shù)據(jù)集包括三種軸承健康狀態(tài),即正常狀態(tài)、內(nèi)圈故障、外圈故障。根據(jù)不同的工作狀況,數(shù)據(jù)集包含以采樣率97 656 Hz和負載122.47 kg的基線條件的3種健康數(shù)據(jù)和3種外圈故障數(shù)據(jù)在11.34 kg、22.68 kg、45.36 kg、68.04 kg、90.72 kg、113.40 kg和136.08 kg負載下的7種外圈故障數(shù)據(jù)及在0 kg、22.68 kg、45.36 kg、68.04 kg、90.72 kg、113.40 kg和136.08 kg負載下的7種內(nèi)圈故障數(shù)據(jù)。
3.2 試驗驗證及結果分析
首先,對從上述兩個數(shù)據(jù)集提取的原始振動信號數(shù)據(jù)進行CEEMD分解預處理,分解后的時域IMF分量圖像示例如圖4所示。計算出每個分量所對應的峭度值,再按照表1的數(shù)量以8∶2的比例劃分為訓練集和驗證集。數(shù)據(jù)信號樣本分類及數(shù)量見表1。
其次,將經(jīng)過CEEMD算法處理后的分量信號及每條分量信號對應的峭度值按順序排列,并重新構建源域和目標域的數(shù)據(jù)集。
最后,分別按照是否進行信號預處理和是否進行改進的模型訓練進行消融試驗。試驗對比結果見表2,模型準確率與損失迭代的對比曲線如圖5所示。
由表2和圖5可知,相較于直接使用AlexNet模型進行不同機器間的遷移訓練,將經(jīng)過CEEMD信號預處理的訓練模型應用到目標域的故障數(shù)據(jù)集中,準確率提升了33%。而對AlexNet方法、“AlexNet+CEEMD”方法和FineTune-AlexNet方法進行對比分析,不難發(fā)現(xiàn),上述三種方法準確率均低于“FineTune-AlexNet+CEEMD”方法。這是因為本研究提出的基于目標域自適應的深度神經(jīng)網(wǎng)絡模型能有效完成特征映射遷移,從而提高故障特征信息的提取效率和故障診斷準確率。試驗得到的結果也驗證了本研究所提出的方法能更好地適應變工況跨機組的復雜場景的結論。
4 結論
針對復雜工況下機器特征提取不完備而導致的故障診斷準確率不夠高、復雜工況多機組需要多次模型訓練等問題,本研究提出一種基于CEEMD和遷移學習的滾動軸承故障診斷方法。首先,對原始振動信號進行預處理,通過CEEMD分解提取峭度值,從而增強數(shù)據(jù)特征提取精度,并減少數(shù)據(jù)運算成本;其次,將處理后的信號輸入深度遷移網(wǎng)絡模型進行訓練,并進行故障診斷;最后,經(jīng)過試驗證明,應用該方法后,變工況跨數(shù)據(jù)集間遷移精度有很大提升,并降低了數(shù)據(jù)處理的成本。本研究所提出的方案在對變工況多機組軸承故障進行診斷時,比一些先進的算法更為精確。本研究的研究結果可為實現(xiàn)智慧工廠的科學化決策提供理論參考與支持。
參考文獻:
[1]黃健豪,鄭波,陳國慶.基于無監(jiān)督遷移學習的核范數(shù)最大化軸承故障診斷方法[J].科學技術與工程,2023(11):4638-4646.
[2]石志煒,張麗萍.基于改進小波包閾值降噪的滾動軸承故障分析[J].計算機測量與控制,2019(5):58-63.
[3]HUANG N E,SHEN Z,LONG S R,et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proceedings of the Royal Society of London Series A,1998,454:903-995.
[4]WU Z H,HUANG N E.Ensemble empirical mode decomposition:a noise-assisted data analysis method[J].Advances in Adaptive Data Analysis,2009(1):1-41.
[5]YEH J R,SHIEN J S,HUANG N E.Complementary ensemble empirical mode decomposition:a novel noise enhanced data analysis method[J].Advances in Adaptive Data Analysis,2010(2):135-156.
[6]張萍,李志農(nóng),陳靜鈴,等.基于互補集合平均經(jīng)驗模態(tài)分解的滾動軸承故障診斷方法研究[J].南昌航空大學學報(自然科學版),2019(2):7-12,49.
[7]王夢.基于階次分析的旋轉機械故障診斷方法研究[D].秦皇島:燕山大學,2014.
[8]宋治惠.基于CEEMDAN的滾動軸承早期故障特征提取方法研究[D].天津:天津大學,2017.
[9]YANG B,LEI Y G,JIA F,et al.An intelligent fault diagnosis approach based on transfer learning from laboratory bearings to locomotive bearings[J].Mechanical Systems and Signal Processing,2019,122:692-706.
[10]HAN T,LIU C,WU R,et al.Deep transfer learning with limited data for machinery fault diagnosis[J].Applied Soft Computing Journal,2021,103:107150.