趙榮珍, 馬森財(cái), 吳耀春
(蘭州理工大學(xué) 機(jī)電工程學(xué)院, 甘肅 蘭州 730050)
滾動(dòng)軸承是旋轉(zhuǎn)機(jī)械的重要組成部分,其健康狀態(tài)直接決定著整臺(tái)機(jī)械設(shè)備乃至整條生產(chǎn)線能否正常運(yùn)行.滾動(dòng)軸承的振動(dòng)信號本身具有非線性和非平穩(wěn)性,且常常伴有隨機(jī)噪聲的干擾.對滾動(dòng)軸承信號進(jìn)行特征提取和狀態(tài)識別是研究的關(guān)鍵[1-2].
針對滾動(dòng)軸承振動(dòng)信號樣本量大、波動(dòng)復(fù)雜等問題,許迪[3]提出基于流形學(xué)習(xí)和M-KH-SVR(multi-variable-krill herd-support vector regression)的滾動(dòng)軸承衰退預(yù)測方法,通過多變量特征驗(yàn)證了模型的泛化性和預(yù)測精度.針對滾動(dòng)軸承故障類別難以辨識的問題,趙榮珍等[4]提出的一種EWT多尺度排列熵和GG(Gath-Geva)聚類算法相結(jié)合的診斷方法,其聚類時(shí)的類內(nèi)緊致性優(yōu)于其他聚類算法.楊平等[5]針對傳統(tǒng)深度學(xué)習(xí)網(wǎng)絡(luò)對滾動(dòng)軸承含噪信號辨識率較低的問題,提出一種基于卷積膠囊網(wǎng)絡(luò)的故障診斷方法,該模型使用兩個(gè)卷積層的卷積網(wǎng)絡(luò)對原始信號進(jìn)行特征提取,并將其送入膠囊網(wǎng)絡(luò),最終輸出每種故障類型的診斷結(jié)果.
上述方法雖取得了一定的診斷效果,但是有一定的不足.首先,忽視了振動(dòng)信號具有不確定性(模糊性,隨機(jī)性)這一客觀事實(shí);其次,深度學(xué)習(xí)網(wǎng)絡(luò)用于故障辨識時(shí),網(wǎng)絡(luò)的計(jì)算量大、硬件需求高、模型設(shè)計(jì)與搭建復(fù)雜,且深度學(xué)習(xí)網(wǎng)絡(luò)對不平衡數(shù)據(jù)比較敏感.對于不確定性問題,云理論模型具有較強(qiáng)的適應(yīng)性.近年來,該方法作為一種數(shù)據(jù)分析與概念表達(dá)手段已經(jīng)在包括電力負(fù)荷預(yù)測、狀態(tài)估計(jì)、變壓器故障診斷等方面得到了較為廣泛的應(yīng)用[6-9].同樣,作為一種能顯著提高分類器分類精度的并行式?jīng)Q策方法,Bagging集成學(xué)習(xí)因其操作比深度學(xué)習(xí)網(wǎng)絡(luò)簡便,且識別效果明顯,而被廣大學(xué)者采用[10-11].
基于上述緣由,本研究將振動(dòng)信號視為一個(gè)云團(tuán),采用改進(jìn)的逆向云算法提取振動(dòng)信號的期望、熵和超熵三個(gè)云特征參數(shù),并將云特征參數(shù)作為集成極限學(xué)習(xí)機(jī)的輸入?yún)?shù),實(shí)現(xiàn)了對軸承故障的分類.最后,以實(shí)驗(yàn)驗(yàn)證了本研究方法的有效性.
假設(shè)U是一個(gè)可以用精確數(shù)值表示的論域(維數(shù)可為一維或者多維的),H為U對應(yīng)的定性概念,?x且x∈U.存在一個(gè)具有穩(wěn)定傾向的隨機(jī)數(shù)y=μH(x),表示y是x對定性概念H的確定度.x在論域U上的分布稱為云模型,簡稱云[12].
云的數(shù)字特征用期望Ex、熵En和超熵He來表征,這是定性概念的定量表示,對于理解定性概念的內(nèi)涵和外延有重要的意義.它們的定義分別如下:
期望Ex(expected value)是云滴在論域空間的分布期望,就是最能代表定性概念的點(diǎn).它們的定義分別如下:
熵En(entropy)是定性概念的不確定性度量,由概念的隨機(jī)性和模糊性共同決定.
超熵He(eyper entropy)是熵的不確定性的度量,即熵的熵,由熵的隨機(jī)性和模糊性共同決定.
云發(fā)生器分為正向云發(fā)生器(forward cloud generator)和逆向云發(fā)生器(backward cloud generator)兩種.正向云發(fā)生器是從定性到定量的映射,它根據(jù)云的數(shù)字特征(Ex,En,He)產(chǎn)生云滴(x,y).逆向云發(fā)生器是實(shí)現(xiàn)從定量值到定性概念的轉(zhuǎn)換,它可以將云滴(x,y)轉(zhuǎn)換為以數(shù)字特征(Ex,En,He)表示的定性概念.云模型如圖1所示.
圖1 云發(fā)生器模型Fig.1 Cloud generator model
現(xiàn)實(shí)中代表概念的確定度y值并沒有給出或者難以獲得,且傳統(tǒng)逆向云算法難以向更高維推廣.針對以上問題,楊薛明等[13]引入了一種無需確定度y的逆向云算法,該算法不僅簡單、易于向高維推廣,而且精度比原來的逆向云算法高.新的逆向云算法計(jì)算過程如下:
輸入 無確定度云滴xi(i=1,2,…,N);
輸出 表示云滴xi定性概念的期望Ex、熵En和超熵He;
(1)
(2)
(3)
極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)屬于誤差前饋神經(jīng)網(wǎng)絡(luò)的一種[14],該算法旨在解決BP(back propagation)網(wǎng)絡(luò)執(zhí)行效率較低這一問題,屬于有監(jiān)督學(xué)習(xí)器的一種[15-16].根據(jù)ELM理論,有訓(xùn)練樣本(xi,yi),其L1正則化目標(biāo)函數(shù)可以定義為
(4)
s.t.WTh(xi)=yi-ξi
式中:h(xi)為對應(yīng)的隱含層特征,假定有n維;W∈Rn×T為隱含層輸出權(quán)值;ξi∈RT×N為訓(xùn)練樣本的誤差;T和N表示樣本個(gè)數(shù)和類別數(shù);C為正則化因子.
利用Lagrange對偶算法求得式(4)的最優(yōu)解為
(5)
式中:Y為訓(xùn)練樣本的輸出矩陣.
測試樣本xc在極限學(xué)習(xí)機(jī)上的分類輸出為
f(xc)=W*Th(xc)
(6)
本次實(shí)驗(yàn)的設(shè)備為無錫市厚德自動(dòng)化儀表有限公司的HZXT-DS-001型雙跨綜合故障模擬平臺(tái),實(shí)物結(jié)構(gòu)如圖2所示.
圖2 雙跨雙轉(zhuǎn)子綜合故障模擬平臺(tái) Fig.2 Double-span double-rotor comprehensive fault simulation platform
故障軸承安裝端如圖3所示.具體的故障軸承為NSK6308深溝球軸承,模擬的故障類型有4種,分別為內(nèi)圈裂紋、外圈裂紋、滾動(dòng)體損壞、保持架破裂.其中,內(nèi)外圈故障都為深1.5 mm、寬0.2 mm的凹槽,滾動(dòng)體故障和保持架故障用電火花加工而成,具體故障情況如圖4所示.
圖3 故障軸承安裝端Fig.3 Fault bearing mounting end
圖4 故障軸承的形貌特點(diǎn)Fig.4 Failure mode of fault bearing
為更完整地表征軸承的故障狀態(tài),共采集了5個(gè)通道的振動(dòng)信號.前3個(gè)通道使用加速度傳感器,采集含故障軸承在兩個(gè)相互垂直的徑向方向(x方向和y方向)和軸向方向(z方向)的振動(dòng)信號,對應(yīng)通道ch1、ch2、ch3;后2個(gè)通道使用電渦流傳感器,采集故障軸承一側(cè)軸的徑向位移信號,對應(yīng)通道ch4、ch5.采樣頻率設(shè)為8 kHZ,采樣轉(zhuǎn)速為3 000 r/min.采集4種故障狀態(tài)和正常狀態(tài)的信號各80組.
信號的小波包分解相當(dāng)于讓信號通過了一系列中心頻率不同但噪聲相同的濾波器,若給定信號的分解層數(shù)為k,則有2k個(gè)樹分支.為消除噪聲對軸承故障本征信號的影響,提高后續(xù)模式識別的準(zhǔn)確性,對采集的原始故障信號進(jìn)行sym4為基函數(shù)的4層小波包分解,以sure熵為準(zhǔn)則得到小波包分解最佳樹,選取第4層的前8個(gè)頻段重構(gòu)信號.最佳小波樹如圖5所示.
圖5 最佳小波樹Fig.5 Best wavelet tree
經(jīng)小波包分解后的重構(gòu)信號如圖6所示,各狀態(tài)下重構(gòu)信號經(jīng)云化之后對應(yīng)的云模型如圖7所示.圖7中隸屬度是衡量確定性程度的量,該值無具體單位.對重構(gòu)后的振動(dòng)信號,采用1.2節(jié)所提到的逆向云算法提取決定信號云的云特征參數(shù)期望、熵、和超熵,依此構(gòu)造出軸承的故障特征數(shù)據(jù)集.由于有5個(gè)通道同時(shí)采集實(shí)驗(yàn)臺(tái)不同部位的信號,故可得到3×5=15維的原始故障特征集.為便于后續(xù)模型分類的實(shí)現(xiàn),對原始數(shù)據(jù)進(jìn)行歸一化處理.預(yù)處理后部分故障數(shù)據(jù)的前3個(gè)通道特征如表1所列.
表1 歸一化后部分故障數(shù)據(jù)的前3個(gè)通道云特征對比
圖6 滾動(dòng)軸承在不同狀態(tài)下的振動(dòng)信號Fig.6 Bearing vibration signal in different states
圖7 不同狀態(tài)下的振動(dòng)信號的云模型Fig.7 Cloud model of bearing vibration signal in different states
極限學(xué)習(xí)機(jī)雖然訓(xùn)練和計(jì)算速度快,但和大多數(shù)神經(jīng)網(wǎng)絡(luò)一樣,其分類精度依賴于隱含層節(jié)點(diǎn)的合理選取,而且即使在網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練集不發(fā)生改變的情況下,對于同一測試集,極限學(xué)習(xí)機(jī)每次的分類準(zhǔn)確率都在跳動(dòng),即準(zhǔn)確率的穩(wěn)定性很差.本研究將Bagging集成學(xué)習(xí)算法引入其中,利用弱學(xué)習(xí)理論,使得多個(gè)在分類錯(cuò)誤上具有一定獨(dú)立性的極限學(xué)習(xí)機(jī)統(tǒng)一參與軸承故障的分類,最終分類結(jié)果用相對多數(shù)投票法得到.需要注意的是,在訓(xùn)練E-ELM時(shí)訓(xùn)練集的標(biāo)簽要用1至5的字符量表示.基分類器預(yù)設(shè)數(shù)目為30個(gè), 極限學(xué)習(xí)機(jī)的激活函數(shù)規(guī)定為sigmoid函數(shù).
極限學(xué)習(xí)機(jī)隱含層神經(jīng)元最佳數(shù)目k的確定采用了實(shí)驗(yàn)法.即先從經(jīng)驗(yàn)公式中求得極限學(xué)習(xí)機(jī)模型隱含層所需節(jié)點(diǎn)個(gè)數(shù)的最小值,并以1為增量增加隱含層的節(jié)點(diǎn)個(gè)數(shù),同時(shí)得到不同隱含層節(jié)點(diǎn)數(shù)目下的分類誤差e,最后利用二次多項(xiàng)式擬合出極限學(xué)習(xí)機(jī)隱含層節(jié)點(diǎn)數(shù)和分類誤差之間的函數(shù)曲線圖.ELM的隱含層節(jié)點(diǎn)數(shù)與集成ELM的隱含層節(jié)點(diǎn)數(shù)和各自分類誤差的關(guān)系如圖8所示.
從圖8可以看出,在隱含層節(jié)點(diǎn)相同的情況下集成極限學(xué)習(xí)機(jī)具有更好的分類精度,集成極限學(xué)習(xí)機(jī)的隱含層節(jié)點(diǎn)數(shù)確定為10個(gè).在確定了隱含層節(jié)點(diǎn)的情況下,以分類誤差不高于0.05為原則改變基分類器數(shù)目的預(yù)設(shè)值.經(jīng)驗(yàn)證,基分類器的原預(yù)設(shè)值滿足實(shí)驗(yàn)要求.至此,E-ELM的兩個(gè)超參設(shè)置完成.
圖8 節(jié)點(diǎn)數(shù)對兩種分類器分類誤差的影響
建立的集成極限學(xué)習(xí)機(jī)算法步驟:
輸入 云特征的訓(xùn)練集T和測試集U;
輸出 故障類別集S;
1) Fori=1,N為基學(xué)習(xí)器數(shù)目
(1) 對訓(xùn)練集T采用Bagging方法中的重采樣算法,得到訓(xùn)練子集Ti;
(2) 利用訓(xùn)練子集Ti訓(xùn)練出極限學(xué)習(xí)機(jī),得到Hi;
(3) 將測試集E輸入至Hi,得到結(jié)果Si;
2) 對于Si利用相對多數(shù)投票法得到最終分類結(jié)果S.
以ELM為基學(xué)習(xí)器的Bagging集成學(xué)習(xí)模型如圖9所示.從中可以看出,直接輸入至各ELM訓(xùn)練集都是初始訓(xùn)練集經(jīng)自助采樣法得到的子集,測試樣本最后的分類結(jié)果由30個(gè)ELM共同投票得到.
圖9 以ELM為基學(xué)習(xí)器的集成學(xué)習(xí)模型Fig.9 Ensemble learning model based on ELM
將軸承的云特征數(shù)據(jù)集輸入到2.3節(jié)建好的分類模型中,以30次分類準(zhǔn)確率的均值代表最終的分類準(zhǔn)確率,以準(zhǔn)確率的方差表征分類方法的穩(wěn)定性.
將BP神經(jīng)網(wǎng)絡(luò)、極限學(xué)習(xí)機(jī)、支持向量機(jī)(support vector machine,SVM)、k近鄰(k-nearest neighbor,KNN) 分類器與本研究所提的E-ELM算法進(jìn)行對比,驗(yàn)證不同分類器對于云特征的識別情況.在實(shí)驗(yàn)過程中,BP網(wǎng)絡(luò)的隱含層為1層,隱層神經(jīng)元數(shù)目設(shè)為12,訓(xùn)練最小誤差為0.1,訓(xùn)練次數(shù)為1 000次;為實(shí)驗(yàn)考慮,ELM的隱層神經(jīng)元數(shù)目和E-ELM隱層神經(jīng)元數(shù)目一樣為10;SVM的懲罰系數(shù)和核參數(shù)用交叉驗(yàn)證法選取,尋優(yōu)區(qū)間統(tǒng)一設(shè)置為[-10,10]; KNN分類器的近鄰樣本數(shù)目設(shè)置為6.E-ELM和ELM及其他分類方法在滾動(dòng)軸承故障分類上的對比如表2和表3所列.
表2 ELM和E-ELM在滾動(dòng)軸承故障分類上的對比
表3 E-ELM和其他分類方法在滾動(dòng)軸承故障分類上的對比
從表2和表3可知,本研究所提之E-ELM算法在云特征數(shù)據(jù)集上的識別率均高于傳統(tǒng)分類算法.從執(zhí)行時(shí)間來看,雖然E-ELM分類方法是以消耗時(shí)間為代價(jià)來提高其分類準(zhǔn)確率,但仍然在可接受的范圍(支持向量機(jī)執(zhí)行時(shí)間最高的原因是記入了參數(shù)尋優(yōu)的時(shí)間).E-ELM方法分類性能較好的原因分析如下:
1) Bagging集成學(xué)習(xí)算法中,理論上只要基分類器的分類誤差不小于1/k(k為類別數(shù)),就可以通過不斷增加基分類器的方法讓識別率無限接近于100%.因此,E-ELM在多個(gè)ELM參與的情況下獲得了較高的識別精度.
2) 在執(zhí)行效率方面,由于作為基分類器的ELM本身的執(zhí)行效率較高,且數(shù)據(jù)集特征的維數(shù)也較低,所以即使集成學(xué)習(xí)過程消耗了時(shí)間,但整體上E-ELM的執(zhí)行效率也較好.
旋轉(zhuǎn)機(jī)械在工作時(shí)轉(zhuǎn)速經(jīng)常會(huì)變化,為驗(yàn)證E-ELM方法是否在不同工況下具有良好的識別精度,分別在2 600、2 800、3 200 r/min的云特征數(shù)據(jù)集上進(jìn)行驗(yàn)證.在不同的軸承工作轉(zhuǎn)速下E-ELM方法仍具有較高的識別精度,結(jié)果如圖10所示.
圖10 E-ELM方法在變工況下的識別精度Fig.10 Identification accuracy of E-ELM method under variable working conditions
實(shí)際情況下獲得的數(shù)據(jù)集會(huì)由于環(huán)境的干擾含有大量的噪聲,為驗(yàn)證建立的E-ELM模型的抗噪能力,在測試集中加入隨機(jī)擾動(dòng).擾動(dòng)矩陣定義為M=0.2·F(120,15).其中,F為隨機(jī)函數(shù),指在產(chǎn)生區(qū)間為[0,1]的隨機(jī)數(shù);120表示測試樣本的數(shù)量為120個(gè),15表示測試集特征參數(shù)的個(gè)數(shù)為15個(gè).E-ELM方法與其他分類方法在抗噪性方面的對比如表4所列.
從表4可知,E-ELM分類方法與其他傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相比具有更好的抗噪性.故本研究所建立的云E-ELM方法在滾動(dòng)軸承故障辨識領(lǐng)域有良好的工程實(shí)用價(jià)值.
為驗(yàn)證基于云-集成極限學(xué)習(xí)機(jī)算法的適用性,在圖2所示的雙跨雙轉(zhuǎn)子實(shí)驗(yàn)臺(tái)上模擬了6種不同程度的不平衡狀態(tài).從左起第一個(gè)質(zhì)量盤命名為P1,第二個(gè)質(zhì)量盤命名為P2,在盤上添加若干質(zhì)量為12 g的不平衡質(zhì)量塊,模擬不同程度的不平衡,如表5所列.
表5 不平衡狀態(tài)
表5中,“P1_2”表示在質(zhì)量盤P1上添加2個(gè)質(zhì)量塊;“P1_2_P2_3” 表示在質(zhì)量盤P1上添加2個(gè)質(zhì)量塊,在質(zhì)量盤P2上添加3個(gè)質(zhì)量塊.實(shí)驗(yàn)過程中,對于單個(gè)質(zhì)量盤來說,質(zhì)量塊分布位置應(yīng)相對集中,兩個(gè)質(zhì)量盤上的質(zhì)量塊成180度分布.此次實(shí)驗(yàn)采樣轉(zhuǎn)速分別為3 000、3 200、3 400、3 600 r/min,采樣頻率為20 kHz.云-集成極限學(xué)習(xí)機(jī)算法在轉(zhuǎn)子不平衡故障數(shù)據(jù)集上的分類效果如表6所列.
表6 云-集成極限學(xué)習(xí)機(jī)算法在轉(zhuǎn)子不平衡故障數(shù)據(jù)集上的分類效果
從表6可知,本研究方法對轉(zhuǎn)子不平衡故障的辨識能力較好,具有一定的普適性.
本研究提取了滾動(dòng)軸承故障信號的云特征,將含云特征的數(shù)據(jù)集引入到了建立的集成極限學(xué)習(xí)機(jī)模型中去,實(shí)現(xiàn)了軸承故障的人工智能辨識.實(shí)驗(yàn)表明,提取的滾動(dòng)軸承云特征數(shù)據(jù)集可以良好地表征各類故障狀態(tài),所建立的分類模型在分類準(zhǔn)確率上有了較大的提升.與ELM方法相比,在隱含層節(jié)點(diǎn)一致的情況下,集成極限學(xué)習(xí)機(jī)的分類穩(wěn)定性和分類精度更高且具有良好的抗噪性.本研究提出的模型能有效地識別滾動(dòng)軸承的故障類型,它為旋轉(zhuǎn)機(jī)械的故障模式辨識提供了一種新的思路和手段.下一步的工作中,將直接構(gòu)造出云分類器來實(shí)現(xiàn)軸承故障的辨識.