国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

深度自編碼與改進損失函數(shù)在極端不均衡故障診斷中的應(yīng)用

2021-05-29 01:21段敏霞董增壽
科學技術(shù)與工程 2021年11期
關(guān)鍵詞:波包軸承故障診斷

段敏霞,劉 鑫,董增壽

(太原科技大學電子信息工程學院,太原 030024)

滾動軸承是旋轉(zhuǎn)機械的重要部件,其健康狀況直接影響著機械的運轉(zhuǎn)[1],因此針對軸承的故障診斷的研究十分必要。機械故障診斷的研究大多基于振動信號[2-4]。智能診斷是在海量數(shù)據(jù)中自動提取特征,并根據(jù)特征獲得診斷結(jié)果。它包括特征提取、特征約簡和特征分類[5]3個步驟。傳統(tǒng)的智能診斷是在基于樣本均衡下建立一個模型[6-7]。但在實際應(yīng)用環(huán)境中,類別分布不均衡,故障數(shù)據(jù)往往小于正常數(shù)據(jù)[6-9]。傳統(tǒng)的分類器在故障診斷中往往偏向于大多數(shù)的類,不能準確地識別少數(shù)類的故障,尤其是在數(shù)據(jù)分布極不均衡的情況下[10]。Zhang等[11]結(jié)合了快速閱讀聚類算法和故障診斷決策樹。該方法能在旋轉(zhuǎn)機械數(shù)據(jù)非均衡的情況下更準確地識別不同類型的故障。針對高爐故障數(shù)據(jù)非均衡的問題,Liu等[12]提出了一種新的支持向量機(support vector machine,SVM)算法。通過添加未標記樣本達到平衡樣本的目的,最后采用二叉樹多類分類方法準確識別各種故障。上述方法是淺層模型下的故障診斷。但其樣本和計算單元有限,難以表示復(fù)雜函數(shù)。它可以處理簡單的分類問題,但很難處理復(fù)雜的分類問題[13]。

隨著大數(shù)據(jù)時代的到來,越來越多的學者選擇深度學習來處理數(shù)據(jù)不均衡問題。Mao 等[14]采用生成式對抗網(wǎng)絡(luò)(generative adversarial networks,GaN)擴展樣本容量,將快速傅里葉變換得到的頻譜數(shù)據(jù)輸入到疊加式去噪自編碼器中,得到良好的分類結(jié)果。Zhao等[15]將拉普拉斯正則化項加入到深度自編碼器的目標函數(shù)中。將采集到的信號輸入到構(gòu)造好的深度拉普拉斯自編碼器(deep Laplace autoencoder,DLapAE)進行特征提取,然后輸入到BP(back propagation)分類器進行分類。該方法在平衡和非平衡數(shù)據(jù)集上都取得了良好的分類效果。

上述方法并未解決故障診斷的多分類任務(wù)中可能發(fā)生的極端失衡的問題。充其量,它們只能解決80%的不平衡問題,并且會在極端不平衡的情況下降低性能。基于此,現(xiàn)提出一種基于深度自編碼器(deep auto-encoder,DAE)和加權(quán)損失函數(shù)的極端不均衡故障診斷模型,加權(quán)損失函數(shù)的權(quán)重系數(shù)由樣本數(shù)量控制。樣本數(shù)目越多的類別對應(yīng)的權(quán)重系數(shù)就越小,反之,樣本數(shù)目越少的類別,對應(yīng)的權(quán)重系數(shù)越大,使得模型在訓練時更專注于數(shù)量較少的樣本。通過在凱斯西儲大學和西安交通大學的兩個極端不均衡數(shù)據(jù)集上的實驗表明,該方法可以提高模型的診斷精度。

1 原理

1.1 DAE原理

自編碼器(auto-encoder,AE)是Rumelhart于1986年提出來的一種單隱層神經(jīng)網(wǎng)絡(luò)[16]。AE由編碼部分和解碼部分組成。編碼器通過無監(jiān)督的方式提取數(shù)據(jù)的特征信息,解碼器通過提取的特征信息盡可能地還原輸入信息,使得輸出與輸入一致。目標函數(shù)是輸入和輸出的均方誤差。

AE是一種利用反向傳播算法使得輸出值等于輸入值的神經(jīng)網(wǎng)絡(luò)。它先將輸入壓縮成潛在空間表征,然后通過這種表征來重構(gòu)輸出。簡單來說可以分為兩部分:輸入到隱藏層的編碼過程和隱藏層到輸出的解碼過程。AE結(jié)構(gòu)如圖1所示。

圖1 AE的結(jié)構(gòu)圖Fig.1 The structure of AE

H=σa(WaX+ba)

(1)

(2)

(3)

式中:Wa∈Rn×m、Ws∈Rm×n、ba∈Rm、bs∈Rn為需要優(yōu)化求解的權(quán)值和偏置,a和s分別為編碼過程和解碼過程;σa(·)、σs(·)為激活函數(shù);L()為自編碼器的損失函數(shù)。

AE只有簡單的矩陣乘法和矩陣加法運算,激活函數(shù)也是較為簡單的求導(dǎo)函數(shù),因此利用鏈式法則可以較為容易地得到梯度。AE的權(quán)值和偏置的更新利用反向傳播算法就可以得到。

DAE是由多個AE堆疊而成,是深度神經(jīng)網(wǎng)絡(luò)中的一種。主要是用來實現(xiàn)深度學習的無監(jiān)督預(yù)訓練的,其無監(jiān)督預(yù)訓練過程如圖2所示。經(jīng)過深度編碼器后,加入SoftMax對故障類型進行分類。在加入分類器之前,網(wǎng)絡(luò)使用貪心算法來訓練網(wǎng)絡(luò)參數(shù),不需要標簽,屬于無監(jiān)督訓練。加入分類器后,需要添加少量標簽數(shù)據(jù)對權(quán)重和偏置進行微調(diào),以達到更好的分類精度。該網(wǎng)絡(luò)的每一層都屬于淺層網(wǎng)絡(luò),可以防止網(wǎng)絡(luò)陷入局部最優(yōu)。

圖2 DAE的結(jié)構(gòu)圖Fig.2 The structure of DAE

1.2 加權(quán)損失函數(shù)

交叉熵損失函數(shù)(cross entropy loss, CE)可以用來衡量兩種概率分布的差異。交叉熵損失越小,真實概率分布與預(yù)測概率分布的差值越小。首先,引入交叉熵的表達式為

(4)

式(4)中:p(xi)為真實樣本標簽;q(xi)為預(yù)測概率。

交叉熵損失函數(shù)的前提是類別間分布均衡,當面對極端不均衡樣本時,交叉熵損失函數(shù)就不再適用?;诖颂岢隽艘环N加權(quán)損失函數(shù)(weighted loss function, WF),使其更適用極端不均衡樣本集。類別間的不平衡性導(dǎo)致大類別損失占據(jù)比例較大,從而控制了整個梯度傳播方向而使模型忽略對小類別樣本的學習[18]。在交叉熵損失函數(shù)前加入一個控制權(quán)重的系數(shù)w+,在多分類任務(wù)中,假設(shè)最多數(shù)類樣本的數(shù)量為N,其他少數(shù)類樣本的數(shù)量為Mj(j為其余少數(shù)類的樣本),則wj+=N/Mj,其取值范圍大于1,樣本數(shù)最多的那一類對應(yīng)的權(quán)重系數(shù)為1。某一類的樣本數(shù)量越多,則權(quán)重系數(shù)越小。[1-q(xi)]γ控制難易分類樣本的權(quán)重。加權(quán)損失函數(shù)的數(shù)學表達式為

γ≥0

(5)

1.3 本文算法流程

本文方法的流程如圖3所示,具體步驟如下:

(1)提取軸承數(shù)據(jù)的小波包能量。

(2)初始化DAE的網(wǎng)絡(luò)結(jié)構(gòu)。

(3)訓練第一層AE,將訓練好的隱藏層作為第2個AE的輸入,重復(fù)該操作,直到第n層AE訓練完成。

(4)所有AE均訓練完成后,將其堆疊形成DAE,在DAE最后一個隱藏層后添加SoftMax分類器。

圖3 本文算法流程圖Fig.3 The flow chart of the proposed method

(5)最后通過標簽數(shù)據(jù)對DAE網(wǎng)絡(luò)進行有監(jiān)督微調(diào)。

2 利用該方法進行故障診斷

由于惡劣的工作環(huán)境,軸承會遭受不同程度和類型的損壞,并造成巨大的經(jīng)濟損失。通過不同類型的軸承數(shù)據(jù),以驗證該模型在極端不平衡數(shù)據(jù)集上的有效性。

2.1 小波包能量提取

不同于小波分析,小波包在全頻率上對信號進行多層分解,提高了信號的頻率分辨率。由于系統(tǒng)出現(xiàn)故障時會對各頻帶信號的能量有較大影響,且不同的故障對各頻帶內(nèi)信號的能量影響也不同[19],根據(jù)不同頻帶內(nèi)能量的分布情況可以診斷出發(fā)生故障的類型。因此可以對故障信號進行小波包分解得到各頻帶的小波包能量,以此來進行故障診斷。用小波包分解對故障信號進行能量特征提取的步驟如下:

(1)對故障信號進行小波包分解,選取的小波基為db3,分解層數(shù)為4。

(2)分解后每個節(jié)點的小波包能量可由式(6)求得,并歸一化。

(6)

2.2 案例1:凱斯西儲大學滾動軸承故障診斷

2.2.1 數(shù)據(jù)的描述

研究數(shù)據(jù)來自凱斯西儲大學[20]。將經(jīng)過處理的故障軸承加載到測試電動機上,并在電動機功率為2.2 kW的條件下收集信號。采樣頻率為 48 kHz。軸承的不同直徑分別為0.177 8 mm(輕微故障水平),0.355 6 mm(中等故障水平)和 0.533 4 mm(嚴重故障水平)。使用測試臺,獲得了以下信息:①正常運行條件(N);②外圈故障(OR);③內(nèi)圈故障(IR);④球故障(B)。表1詳細列出了這4個數(shù)據(jù)集。每個樣本包含1 024個數(shù)據(jù)點。表1 列出了不平衡數(shù)據(jù)集的分配比率。隨機選取了50% 作為測試數(shù)據(jù)。對于不平衡數(shù)據(jù)集,通過減少故障狀態(tài)的數(shù)量使得正常狀況的樣本數(shù)量要遠多于故障狀況的樣本數(shù)量。

表1 數(shù)據(jù)集的描述Table 1 Description of the dataset

2.2.2 測試結(jié)果

設(shè)置最大迭代次數(shù)為1 000。數(shù)據(jù)按5:5的比例分為訓練集和測試集。為了客觀準確評價模型的性能,采用準確率(Acc)、精確率(P)、召回率(Re)、調(diào)和平均(F1)這4個評價指標,3個指標的公式根據(jù)二分類的混淆矩陣(表2)可得到。

表2 二分類混淆矩陣Table 2 Binary confusion matrix

(7)

(8)

(9)

(10)

針對多分類問題,在計算其中一類的評價指標時將其他類視為反例。不同故障類型的評價指標如表3所示。可以看到即使在極端不均衡樣本集下,該模型仍然可以達到較高的診斷精度,對樣本數(shù)極少的BL、IRL、ORL這三種故障,該模型能較為準確地預(yù)測出這幾種故障。

表3 測試集的評價指標Table 3 Evaluation index of test set

為了得到更準確的結(jié)果,減少隨機性的影響,對不均衡數(shù)據(jù)集UB進行10次測試,同時選取多種方法與之比較:SVM,小波包分析和BP神經(jīng)網(wǎng)絡(luò)(wavelet packet decomposition and BP neural network,WBP)[21],交叉熵損失函數(shù)的深度自編碼器(cross entropy loss-deep auto-encoder,CE-DAE)。SVM是采用小波包變換提取振動數(shù)據(jù)的小波包能量,并采用SVM識別不同類型故障;WBPM是采用BP神經(jīng)網(wǎng)絡(luò)對小波分解系數(shù)進行故障診斷;CE-DAE是采用基于傳統(tǒng)的交叉熵損失函數(shù)的DAE模型進行故障診斷。不同方法的評價指標如表4所示。對比不同的評價指標,可以發(fā)現(xiàn)本文提出的加權(quán)損失函數(shù)的深度自編碼器(weighted loss function-deep auto-encoder, WF-DAE)模型的診斷結(jié)果最好。診斷結(jié)果的準確率及召回率都遠高于其他方法。

表4 不同診斷方法的比較結(jié)果Table 4 Comparison results of different diagnostic methods

采用混淆矩陣來觀察4種方法對不同故障類型的分類準確率。4種方法的混淆矩陣如圖4所示,可以發(fā)現(xiàn)較之其他3種方法,WF-DAE模型對各種故障診斷精度都較高,這是因為其他3種方法都沒考慮到類別不均衡的情況,在訓練過程模型會過度向大類別樣本擬合,而本文方法在訓練過程中會增加小類別樣本的權(quán)重,不會使得模型偏向大類別樣本。從而提高各類別故障的診斷精度。

圖4 不同方法的混淆矩陣Fig.4 Confusion matrix of different methods

2.3 案例2:西安交通大學-浙江長興昇陽科技有限公司(SY)數(shù)據(jù)集的故障診斷

2.3.1 數(shù)據(jù)的描述

在實際的工業(yè)環(huán)境中,軸承并不是突然損壞的,而是有一個生命周期。具體來說,它可以分為以下4個周期:正常階段(N),早期故障(E),故障發(fā)展階段(FD)和故障(F)。該數(shù)據(jù)集由西安交通大學機械工程學院雷亞國教授團隊聯(lián)合浙江長興昇陽科技有限公司提供[22]。每個周期包括不同的樣本數(shù),每個樣本有32 768個數(shù)據(jù)點。極端不均衡樣本數(shù)據(jù)集的分布如表5所示。采樣周期為1 min。采樣頻率為25.6 kHz。

表5 極端非均衡的數(shù)據(jù)集Table 5 Extremely unbalanced dataset

圖5所示為軸承全壽命的理論峰度指數(shù)圖。從曲線的峰值變化來看,隨著時間的推移,幅值也發(fā)生變化。當時間達到1 064 min時,軸承首次出現(xiàn)峰值,說明軸承已進入早期故障階段。隨著時間推移,峰值已經(jīng)發(fā)生明顯變化,說明軸承已經(jīng)完全損壞。

圖5 軸承全壽命理論峰度指數(shù)Fig.5 Theoretical kurtosis index of the full life of the bearing

2.3.2 測試結(jié)果

采用本文模型對不均衡數(shù)據(jù)集進行故障診斷,模型的評價指標如表6所示,可以發(fā)現(xiàn),即使樣本數(shù)量極少,如故障發(fā)展階段(FD)和故障階段(F),它的評價指標依舊保持在92% 及以上??梢娫撃P瓦m用于極端不均衡數(shù)據(jù)集。

采用本文方法與其他方法做比較,分別測試10次以減少隨機性的影響,10次結(jié)果的平均值如表7所示??梢园l(fā)現(xiàn)本文方法的各項評價指標都高于其他3種方法。由此可得知本文方法更適用于極端不均衡故障診斷。

表6 測試集的評價指標Table 6 Evaluation index of test set

表7 不同診斷方法的比較結(jié)果Table 7 Comparison results of different diagnostic methods

3 結(jié)論

提出了一種基于DAE和加權(quán)損失函數(shù)的非均衡故障診斷模型。加權(quán)損失函數(shù)可以提高模型在不均衡樣本下的診斷精度。從兩種不同的軸承數(shù)據(jù)集的實驗結(jié)果可以得到如下結(jié)論:與傳統(tǒng)交叉熵損失函數(shù)相比,提出的加權(quán)損失函數(shù)在極端不均衡數(shù)據(jù)集下的各項評價指標都更高。由此可見加權(quán)損失函數(shù)更適用于極端不均衡數(shù)據(jù)集。

但仍存在一些不足,該模型在極端不均衡數(shù)據(jù)集下的診斷精度并未達到99% 及以上,今后的工作將著重研究生成模型在極端不均衡故障診斷中的應(yīng)用。

猜你喜歡
波包軸承故障診斷
軸承知識
軸承知識
基于包絡(luò)解調(diào)原理的低轉(zhuǎn)速滾動軸承故障診斷
基于支持向量機和小波包變換的EOG信號睡眠分期
泵用電機水潤滑軸承選擇與應(yīng)用
基于動態(tài)閾值函數(shù)的改進小波包遙測信號去噪方法
基于小波包的鍋爐爐管聲波信號自適應(yīng)壓縮感知
數(shù)控機床電氣系統(tǒng)的故障診斷與維修
基于量子萬有引力搜索的SVM自駕故障診斷
江淮同悅純電動汽車無倒檔故障診斷與排除