黃海安,王友仁,孫燦飛,2,陳偉,王俊
(1. 南京航空航天大學(xué) 自動(dòng)化學(xué)院,江蘇 南京 210016; 2. 上海航空測(cè)控技術(shù)研究所,上海 201601)
在行星齒輪箱故障診斷中,基于振動(dòng)信號(hào)從時(shí)域、頻域、時(shí)頻域等方面提取反映運(yùn)行狀態(tài)的量化指標(biāo),可以有效地辨識(shí)齒輪箱的運(yùn)行狀態(tài)。然而隨著故障模式的復(fù)雜度提高,提取的特征會(huì)呈現(xiàn)多元化,即提取的特征包含強(qiáng)相關(guān)特征、弱相關(guān)特征和冗余特征[1]。如何從高維、非線(xiàn)性的特征集中提取故障特征子集是模式識(shí)別的核心問(wèn)題[2]。
旋轉(zhuǎn)機(jī)械故障特征優(yōu)選方法通常分為特征變換和特征選擇兩大類(lèi)?;谔卣髯儞Q的降維優(yōu)選方法采用映射關(guān)系對(duì)特征進(jìn)行空間變換,Li等[3]利用監(jiān)督局部線(xiàn)性嵌入算法實(shí)現(xiàn)故障特征集的維數(shù)約簡(jiǎn),Su等[4]利用擴(kuò)展的監(jiān)督局部切空間排列進(jìn)行特征降維。然而基于特征變換的降維技術(shù)失去了原始特征的物理意義,無(wú)法表征系統(tǒng)的本質(zhì)特性。基于特征選擇的降維方法采用評(píng)估準(zhǔn)則對(duì)特征進(jìn)行直接子集選擇,保留了原始特征含義,應(yīng)用廣泛[5]。傳統(tǒng)的特征選擇算法采用距離評(píng)估技術(shù)對(duì)特征重要性進(jìn)行排序,缺點(diǎn)是無(wú)法徹底去除冗余特征,也沒(méi)有考慮弱相關(guān)特征的組合性能。近年來(lái)多目標(biāo)進(jìn)化算法被引入到特征選擇中來(lái),2013年Bing提出基于進(jìn)化多目標(biāo)粒子群優(yōu)化特征選擇算法[6],采用分類(lèi)準(zhǔn)確率最高和特征個(gè)數(shù)最少2個(gè)目標(biāo)函數(shù)同時(shí)優(yōu)化選取Pareto前沿解,但其考慮的特征選擇因素依然過(guò)少。
針對(duì)旋轉(zhuǎn)機(jī)械故障特征優(yōu)選方法存在特征選擇考慮因素過(guò)少,可能選擇不到高質(zhì)量的特征子集問(wèn)題,結(jié)合本文行星齒輪箱具體研究對(duì)象,提出一種基于遺傳算法的多目標(biāo)故障特征選擇方法。定義3個(gè)目標(biāo)準(zhǔn)則:最小冗余準(zhǔn)則、特征維數(shù)最少準(zhǔn)則和分類(lèi)準(zhǔn)確率最高準(zhǔn)則,建立多域故障特征優(yōu)選數(shù)學(xué)模型,然后采用遺傳算法(genetic algorithm,GA)[7]求解模型得到最優(yōu)故障特征子集。通過(guò)實(shí)驗(yàn)驗(yàn)證了方法的有效性。
行星齒輪系故障特征優(yōu)選的數(shù)學(xué)模型描述為:
目標(biāo)函數(shù):
minF(S)
(1)
F(S)=λ1f1(S)+λ2f2(S)+λ3f3(S)
(2)
(3)
設(shè)數(shù)據(jù)集為:
(4)
其中,特征向量xi=(xi1,xi2,…,xiM)為行向量,xiX,X為樣本空間,i=1,2,…,N,N為樣本個(gè)數(shù),M為特征向量xi維數(shù);為列向量,表示第j個(gè)特征的N個(gè)樣本取值,j=1,2,…,M;xij是特征向量xi在第j個(gè)特征上的取值;y=(y1,y2,…,yN)T,yiy為特征向量xi的標(biāo)簽,y為標(biāo)記向量;SN×K為數(shù)據(jù)集DN×(M+1)在特征選擇中得到的一個(gè)候選子集,0 1) 冗余度最小:衡量所選擇的故障特征子集中,各特征間冗余度。優(yōu)化目標(biāo)要求冗余度最少,計(jì)算公式為: (5) 其中,xk和xk′分別是特征子集S中的第k維特征和第k′維特征,0 SU是對(duì)稱(chēng)不確定信息,計(jì)算公式為: (6) 其中,H(x)是向量x的信息熵,I(x,y)是向量x與y的互信息,x=(x1,x2,…,xN),y=(y1,y2,…,yN)。 (7) I(x,y)=H(x)+H(y)-H(x,y) (8) 其中,H(x,y)是向量x與y的聯(lián)合熵。 (9) 熵是衡量隨機(jī)變量的不確定性指標(biāo),對(duì)稱(chēng)不確定性是互信息的擴(kuò)展版本,取值為0~1,取0時(shí)表示X和Y變量完全獨(dú)立,為1時(shí)表示其中的某一變量可以完全取代另一變量。 2) 所選擇出的故障特征子集的維數(shù)最少:在保證故障分類(lèi)性能情況下,優(yōu)選的故障特征維數(shù)要最小,計(jì)算公式為: f3(S)=|S| (10) 其中,|S|表示該特征子集中總共的特征維數(shù),0 3) 分類(lèi)準(zhǔn)確率最高:衡量分類(lèi)性能, 最優(yōu)分類(lèi)準(zhǔn)確率是100%,計(jì)算公式為: (11) 其中,s是正確分類(lèi)樣本個(gè)數(shù)。0≤f4(S)≤1,本文優(yōu)化目標(biāo)是最小化,故實(shí)際計(jì)算時(shí)需要轉(zhuǎn)化為-f4(S)。 遺傳算法是Holland教授等人于20世紀(jì)70年代將優(yōu)勝劣汰原理和遺傳學(xué)的基因信息隨機(jī)交換理論融合,研究開(kāi)發(fā)出一種能模擬生物自然進(jìn)化的高性能搜索算法。它與傳統(tǒng)優(yōu)化算法相比,在實(shí)際應(yīng)用中具有群體搜索、并行運(yùn)算、全局尋優(yōu)和強(qiáng)魯棒性等性能優(yōu)點(diǎn)。本文選擇GA算法作為行星齒輪箱故障特征優(yōu)選數(shù)學(xué)模型求解算法,可以得到滿(mǎn)意的特征子集。而在子集分類(lèi)性能評(píng)價(jià)方面選擇ELM的主要原因是其具有的快速性和較好的泛化能力。與傳統(tǒng)的學(xué)習(xí)算法不同,ELM不僅可以達(dá)到最小的訓(xùn)練誤差,還能獲得最小的權(quán)值范數(shù),根據(jù)Bartlett的理論,訓(xùn)練誤差和權(quán)值范數(shù)越小,則網(wǎng)絡(luò)的泛化性能越好。ELM最大的特點(diǎn)在于隱含層參數(shù)隨機(jī)生成,這一舉措極大地提升算法的速度,通過(guò)理論證明其泛化能力也保持在很高的水平上。 本文基于遺傳算法的多目標(biāo)特征選擇算法步驟如下: 1) 編碼方案 特征選擇過(guò)程本質(zhì)上是特征集中某幾個(gè)特征選擇,而其余特征丟棄的過(guò)程。因此本文采用二進(jìn)制編碼方案,采用0和1表示未選中和選中特征。設(shè)故障特征空間D中特征向量為x=(x1,x2,…,xM),則用一個(gè)長(zhǎng)度為M的0和1字符串來(lái)表示一種特征組合設(shè)為G=(g1,g2,…,gM),其中g(shù)i=0 or 1,如果gi=0表示該特征丟棄,否則特征保留。 2) 初始化種群 設(shè)置種群規(guī)模、迭代次數(shù),然后隨機(jī)產(chǎn)生一個(gè)包含NP個(gè)個(gè)體的初始種群P。 3) 適應(yīng)度函數(shù)計(jì)算 行星齒輪箱故障特征優(yōu)選數(shù)學(xué)模型中定義了4個(gè)目標(biāo)函數(shù),為防止量綱不一致,均全部歸一化處理。適應(yīng)度函數(shù)為式(1),優(yōu)化目標(biāo)是最小化。同時(shí)在行星齒輪箱故障診斷中最重要的指標(biāo)是分類(lèi)準(zhǔn)確率,故在加權(quán)和的權(quán)重分配上設(shè)置λ3,權(quán)重必須大于其余目標(biāo)函數(shù)的權(quán)重,使得優(yōu)化過(guò)程中會(huì)偏向于保留分類(lèi)準(zhǔn)確率高的子集。設(shè)置權(quán)重取值為λ1=0,λ2=0,λ3=0。 4) 選擇、交叉與變異操作 本文的選擇算子采用輪賭選擇,交叉算子采用單點(diǎn)交叉,交叉概率為0.8,變異概率為0.05。一次特征選擇過(guò)程為:對(duì)初始化所有種群中的個(gè)數(shù)進(jìn)行二進(jìn)制編碼,對(duì)二進(jìn)制編碼后的決策變量與特征向量相乘,得到對(duì)應(yīng)的特征子集,利用該特征子集進(jìn)行3個(gè)目標(biāo)函數(shù)值計(jì)算,歸一化并且乘上相應(yīng)權(quán)重后得到適應(yīng)度值,從而可以計(jì)算得到所有個(gè)體的適應(yīng)度值。去除適應(yīng)度最高和最低的幾個(gè)個(gè)體,其余個(gè)體參與輪賭選擇,后續(xù)進(jìn)行交叉和變異操作,更新種群。通過(guò)不斷進(jìn)行選擇、交叉和變異操作,群體有望收斂于全局最優(yōu)解,同時(shí)精英保留策略直接讓群體中最好的個(gè)體進(jìn)入到下一代群體,可以保證群體質(zhì)量不會(huì)退化。 行星齒輪系故障特征進(jìn)化優(yōu)選算法實(shí)現(xiàn)步驟為: 1) 原始信號(hào)為加速度計(jì)采集的振動(dòng)信號(hào),對(duì)采樣信號(hào)分別提取時(shí)域特征、頻域特征、小波域特征和信息熵特征,構(gòu)建原始高維故障特征集,并歸一化處理; 2) 定義3個(gè)目標(biāo)函數(shù),設(shè)置每個(gè)目標(biāo)函數(shù)加權(quán)和的權(quán)重值,定義適應(yīng)度函數(shù); 3) 設(shè)置ELM隱含層節(jié)點(diǎn)個(gè)數(shù),具體操作為:對(duì)故障特征集采用10折交叉驗(yàn)證方法,分為訓(xùn)練集和測(cè)試集,比例為9∶1。采用循環(huán)迭代運(yùn)算,在不同隱含層節(jié)點(diǎn)個(gè)數(shù)情況下,計(jì)算ELM算法分類(lèi)準(zhǔn)確率,區(qū)間為[10,200],間隔為10,迭代200次。迭代完成后可得隱含層節(jié)點(diǎn)變化對(duì)分類(lèi)性能的影響曲線(xiàn),從中可以取分類(lèi)準(zhǔn)確率最高對(duì)應(yīng)的隱含層節(jié)點(diǎn)個(gè)數(shù)作為最佳隱含層節(jié)點(diǎn)個(gè)數(shù),后續(xù)計(jì)算分類(lèi)準(zhǔn)確率均采用該節(jié)點(diǎn)個(gè)數(shù)計(jì)算。 4) 設(shè)置遺傳算法的種群規(guī)模以及初始化種群,利用適應(yīng)度函數(shù)值更新種群,最終得到最優(yōu)特征子集。 圖1為行星齒輪傳動(dòng)系統(tǒng)試驗(yàn)臺(tái),其中行星齒輪箱與定軸齒輪箱均為兩級(jí)結(jié)構(gòu),行星齒輪箱參數(shù)見(jiàn)表1。實(shí)驗(yàn)設(shè)置了1種正常模式和4種太陽(yáng)輪故障模式:磨損、裂紋、切齒和斷齒,如圖2所示。在故障測(cè)試實(shí)驗(yàn)中,每種故障模式下分別設(shè)置9種變速變載工況情況:轉(zhuǎn)速取1 200 r/min、2 400 r/min和3 600 r/min,負(fù)載取0 N·m、20 N·m和40 N·m。在齒輪箱箱蓋上安裝有3個(gè)加速度傳感器,振動(dòng)信號(hào)采樣頻率為10 kHz,每種工況下每一路振動(dòng)信號(hào)連續(xù)采集時(shí)間為90 s。 圖1 行星齒輪傳動(dòng)試驗(yàn)系統(tǒng)試驗(yàn)臺(tái) 圖2 太陽(yáng)輪故障模擬件 齒輪齒數(shù)/個(gè)第一級(jí)第二級(jí)齒圈100100行星輪40(3)36(4)太陽(yáng)輪2028 將一路振動(dòng)信號(hào)采樣數(shù)據(jù)以10k點(diǎn)作為一個(gè)樣本,5個(gè)模式的時(shí)域波形如圖3所示。所展示信號(hào)的工況為:轉(zhuǎn)速2 400r/min,負(fù)載20N·m。每種故障模式、9種工況下共有773個(gè)樣本,故5種模式下總的故障樣本數(shù)為3 865。對(duì)每個(gè)樣本共提取39個(gè)特征:最大值F1、最小值F2、峰值F3、峰峰值F4、均值F5、平均幅值F6、方根幅值F7、方差F8、標(biāo)準(zhǔn)差F9、有效值F10、峭度F11、偏度F12、波形因子F13、波峰因子F14、脈沖因子F15、裕度因子F16、余隙因子F17、平均頻率F18、重心頻率F19、頻率均方根F20、頻率標(biāo)準(zhǔn)差F21、小波能量比F22~F29、小波能量熵F30、小波特征尺度熵F31~F38、小波奇異熵F39。樣本空間大小為3 86539。 對(duì)39個(gè)特征指標(biāo)進(jìn)行歸一化處理。對(duì)39個(gè)特征指標(biāo)采用高維可視化分析技術(shù):主成分分析(principal component analysis,PCA),提取前2維主成分,繪制散點(diǎn)圖,結(jié)果如圖4。 圖4 特征空間散點(diǎn)圖 從圖3和圖4可以看出,裂紋故障和磨損故障時(shí)域波形沒(méi)有差別,斷齒故障時(shí)域波形和其他模式信號(hào)差別較大,9種工況對(duì)應(yīng)9種空間分布,裂紋故障和磨損故障數(shù)據(jù)非常接近,原因是其均為早期微弱故障。 1) ELM隱含層節(jié)點(diǎn)數(shù) 首先將整個(gè)故障特征集輸入到ELM算法中,通過(guò)循環(huán)迭代運(yùn)算初步確定最佳隱含層節(jié)點(diǎn)個(gè)數(shù)。采用10折交叉驗(yàn)證和5次重復(fù)計(jì)算,結(jié)果如圖5所示。通過(guò)實(shí)驗(yàn)驗(yàn)證,當(dāng)隱含層個(gè)數(shù)為100后,再次增加個(gè)數(shù),準(zhǔn)確率增加幅度不超過(guò)0.5%,故選取100為最佳的隱含層節(jié)點(diǎn)個(gè)數(shù)。 圖5 不同隱含層節(jié)點(diǎn)分類(lèi)準(zhǔn)確率 2) 故障特征優(yōu)選結(jié)果 選擇常用的聯(lián)合互信息特征選擇(joint mutual information,JMI)、拉普拉斯分值特征選擇(laplacian score,LS)和最大相關(guān)最小冗余特征選擇(maximum correlation and minimum redundancy,MRMR)進(jìn)行對(duì)比,其中JMI是基于互信息理論計(jì)算特征與類(lèi)標(biāo)的相關(guān)度、對(duì)已選特征分類(lèi)信息的補(bǔ)充量,以此來(lái)評(píng)價(jià)特征組合所持有的分類(lèi)信息;LS是一種有效的無(wú)監(jiān)督特征選擇算法,它通過(guò)評(píng)估特征的局部保持能力來(lái)進(jìn)行特征選擇,屬于局部特征選擇算法;MRMR是一種基于互信息的全局貪婪選擇算法,主要思想是從特征集中選擇與目標(biāo)類(lèi)別有最大相關(guān)性且相互之間具有最小冗余度的m個(gè)特征,利用互信息衡量特征子集中特征與類(lèi)別、特征與特征之間的相關(guān)度。 由于JMI、LS和MRMR屬于過(guò)濾類(lèi)特征選擇算法,所選擇出的特征與分類(lèi)器無(wú)關(guān),為了方便和本文算法進(jìn)行比較,采用ELM對(duì)特征選擇后得到的按照權(quán)重排序的特征,采用前向搜索方法確定最佳分類(lèi)準(zhǔn)確率。假設(shè)數(shù)據(jù)集經(jīng)過(guò)JMI特征選擇后,得到的特征按照權(quán)重由高到低順序?yàn)閇1;4;2;7;6;5;3;8;9],則前向搜索過(guò)程為:特征1,計(jì)算分類(lèi)準(zhǔn)確率;特征1和4,計(jì)算分類(lèi)準(zhǔn)確率;特征1、4和2,計(jì)算分類(lèi)準(zhǔn)確率,依次計(jì)算直到全部特征均計(jì)算完成,本實(shí)驗(yàn)特征集在3種特征選擇算法下的結(jié)果如圖6。 圖6 分類(lèi)準(zhǔn)確率隨特征個(gè)數(shù)變化曲線(xiàn) 從圖6可以看出,3種算法分類(lèi)準(zhǔn)確率均隨著子集個(gè)數(shù)增加,分類(lèi)準(zhǔn)確率增加,然而在特征個(gè)數(shù)增加到15個(gè)時(shí),分類(lèi)準(zhǔn)確率沒(méi)有提高,說(shuō)明特征集中存在大量的冗余特征。 本文基于遺傳算法的多目標(biāo)特征選擇算法種群規(guī)模為100,最大迭代次數(shù)為500。特征選擇結(jié)果如表2所示。 表2 3種對(duì)比算法和本文算法結(jié)果 其中,序號(hào)表示對(duì)應(yīng)的特征,例如5表示該特征是F5即均值。 表3 特征子集性能比較 從表3可以看出,本文所提特征選擇方法不僅可以取得最少的特征維數(shù),同時(shí)可以得到最高的分類(lèi)性能,驗(yàn)證了方法的有效性。 針對(duì)如何獲得高效、低維的行星齒輪系故障特征集問(wèn)題,提出基于遺傳算法的多目標(biāo)故障特征優(yōu)選算法。建立了行星齒輪系故障特征優(yōu)選數(shù)學(xué)模型,采用ELM評(píng)價(jià)分類(lèi)準(zhǔn)確率,可以得到分類(lèi)準(zhǔn)確率高、特征個(gè)數(shù)少的最優(yōu)特征子集。通過(guò)實(shí)驗(yàn)測(cè)試可知,與傳統(tǒng)的特征選擇算法相比,本文優(yōu)選算法提取的特征子集維數(shù)少,分類(lèi)準(zhǔn)確率由90%提升至95%,提高了故障診斷性能。2 基于遺傳算法的多目標(biāo)特征選擇
3 實(shí)驗(yàn)與結(jié)果分析
3.1 實(shí)驗(yàn)說(shuō)明
3.2 多域故障特征提取
3.3 實(shí)驗(yàn)結(jié)果分析
4 結(jié)語(yǔ)