梁 穎,馬泳濤
(1.中原工學(xué)院機(jī)電學(xué)院,河南 鄭州 450007;2.鄭州大學(xué)機(jī)械與動(dòng)力工程學(xué)院,河南 鄭州 450001)
齒輪傳動(dòng)系統(tǒng)是機(jī)械傳動(dòng)系統(tǒng)關(guān)鍵環(huán)節(jié)之一,決定了整個(gè)機(jī)械系統(tǒng)的運(yùn)轉(zhuǎn)狀態(tài)[1]。隨著裝備機(jī)械部件的不斷增多、監(jiān)測(cè)采樣頻率的不斷提高,齒輪故障識(shí)別已經(jīng)進(jìn)入大數(shù)據(jù)分析時(shí)代[2]。面對(duì)復(fù)雜多樣、高維非線性的海量齒輪故障監(jiān)測(cè)數(shù)據(jù),如何準(zhǔn)確、高效、便捷的識(shí)別故障成為故障模式診斷面臨的新課題[3]。故障原理分析、故障信號(hào)特征提取和故障模式識(shí)別是齒輪系統(tǒng)故障診斷研究核心內(nèi)容,學(xué)者們重點(diǎn)圍繞3個(gè)方面展開(kāi)了系列研究,文獻(xiàn)[4]采用時(shí)頻分析技術(shù)對(duì)行星齒輪箱瞬時(shí)轉(zhuǎn)速精確提取問(wèn)題進(jìn)行研究,提出了一種時(shí)頻脊融合特征提取方法;文獻(xiàn)[5]研究了基于振動(dòng)信號(hào)的時(shí)域、頻域等特征的齒輪故障識(shí)別問(wèn)題。此外,文獻(xiàn)[6-8]分別從不同角度對(duì)齒輪故障信號(hào)特征進(jìn)行了研究,相應(yīng)的提出了特征提取方法,這些研究對(duì)大數(shù)據(jù)背景下的齒輪故障診斷具有重要借鑒意義,但是,上述特征選取方法更側(cè)重于故障信號(hào)產(chǎn)生機(jī)理,忽視了特征選取體量對(duì)系統(tǒng)復(fù)雜程度的影響,即使采用了特征降維處理技術(shù),但是篩選的特征子集不一定最優(yōu)。因此,研究基于多變量度量的特征子集選取具有重要意義,文獻(xiàn)[9-10]通過(guò)設(shè)計(jì)融合多個(gè)評(píng)價(jià)指標(biāo)的度量標(biāo)準(zhǔn),有效實(shí)現(xiàn)了對(duì)特征子集的選取,但是,大多數(shù)多變量度量特征子集選取方法通常采用劃分多階段選取特征子集的形式,導(dǎo)致很難滿足實(shí)時(shí)性要求。支持向量機(jī)、深度學(xué)習(xí)[2]、聚類分析[10]等是故障模式識(shí)別常采用的辨識(shí)模型,由于齒輪正常和故障信息具有邊界模糊的特性,因此,模糊聚類方法在故障識(shí)別、入侵檢測(cè)等應(yīng)用領(lǐng)域得到了廣泛應(yīng)用,模糊C-均值聚類算法(FCM)作為經(jīng)典的模糊聚類算法之一[11],有效克服FCM聚類問(wèn)題魯棒性差、聚類個(gè)數(shù)事先確定、對(duì)初始聚類中心敏感的缺陷是當(dāng)前研究熱點(diǎn),文獻(xiàn)[12-14]針對(duì)上述一個(gè)或幾個(gè)缺陷進(jìn)行研究,分別提出了改進(jìn)算法,但是,如何平衡算法復(fù)雜度和聚類精度似乎還找到更好的辦法。
鑒于此,為提高復(fù)雜高維大體量齒輪故障識(shí)別的效率,提出一種融合模糊聚類、特征子集選取和智能優(yōu)化技術(shù)的在線齒輪故障識(shí)別方法,所做主要工作有:
(1)對(duì)FCM算法進(jìn)行改進(jìn),引入多核距離度量函數(shù)和貪婪聚類中心初始化策略,以提高FCM的聚類魯棒性。提出特征子集選取機(jī)制,在保持高分辨能力的同時(shí),最大限度降低數(shù)據(jù)維度。
(2)引入混合蜻蜓優(yōu)化算法,利用算法全局尋優(yōu)能力,通過(guò)蜻蜓種群迭代進(jìn)化,以實(shí)現(xiàn)多核函數(shù)確定、最佳特征子集選取和數(shù)據(jù)聚類分析。
(3)構(gòu)建齒輪故障識(shí)別模型,利用訓(xùn)練樣本集對(duì)改進(jìn)FCM進(jìn)行參數(shù)訓(xùn)練,得到最佳模糊聚類個(gè)數(shù)等參數(shù),獲取多核函數(shù)、特征子集選取信息,并應(yīng)用于齒輪故障線上識(shí)別。
FCM作為目前最為廣泛應(yīng)用的聚類算法之一,其利用隸屬度矩陣U=[μik]C×n度量樣本點(diǎn)xk(xk∈X,X為樣本集合)與C個(gè)聚類中心V={v1,…,vC}的隸屬關(guān)系,通過(guò)迭代求解聚類目標(biāo)函數(shù)J(U,V),實(shí)現(xiàn)樣本聚類劃分。
式中:m—模糊加權(quán)指數(shù)。研究表明,采用歐式距離衡量數(shù)據(jù)間差異性的FCM,不適用于孤點(diǎn)、復(fù)雜高維數(shù)據(jù)聚類分析,為此,利用高維空間映射函數(shù)Φ(xk)處理xk,此時(shí)J(U,V)表示為:
定義Θ(x,v)=ΦT(x)Φ(v),相關(guān)文獻(xiàn)指出,當(dāng)Θ(x,v)滿足Mercer條件時(shí)[15],則不需要知道Φ(xk)的具體形式,并且稱Θ(x,v)為核函數(shù)。此時(shí)令?J/?μik=0,?J/?vi=0,有:
從式(7)可以看出,只需要確定R=(χ1,…,χm)具體形式,就可以實(shí)現(xiàn)數(shù)據(jù)集的特征子集選取。
針對(duì)FCM對(duì)初始聚類中心敏感、復(fù)雜數(shù)據(jù)聚類魯棒性差、聚類個(gè)數(shù)事先確定的缺陷,分別提出改進(jìn)策略,以提高改進(jìn)FCM(IFCM)的聚類性能。
采用核函數(shù)替代傳統(tǒng)歐式距離度量,提高了FCM處理復(fù)雜數(shù)據(jù)問(wèn)題的能力,然而單一的核函數(shù)更適用于特定的數(shù)據(jù)聚類分析問(wèn)題,為此,設(shè)計(jì)映射矩陣Φd×d:
定義核函數(shù)Θk(xi,xi)=Ak(xi)T Ak(xi),當(dāng)選取d個(gè)滿足Mercer條件的Θk(xi,xi)時(shí),就可以實(shí)現(xiàn)聚類分析。從式(9)~式(12)可以看出,多個(gè)核函數(shù)的引入,能夠更好的體現(xiàn)數(shù)據(jù)樣本間的差異性,進(jìn)一步提高了聚類結(jié)果的魯棒性。
傳統(tǒng)FCM采用隨機(jī)初始化的方式生成初始聚類中心,具有很強(qiáng)的不確定性,而且,得到的初始聚類中心并不是數(shù)據(jù)集內(nèi)個(gè)體,為此,提出貪婪聚類中心初始化聚類策略:
(1)確定v1,star。根據(jù)下式計(jì)算每個(gè)數(shù)據(jù)點(diǎn)的密度值τ(xk),選取密度值最大的點(diǎn)xk為第一個(gè)初始聚類中心v1,stɑr。
(2)確定v2,star。從X剩余數(shù)據(jù)點(diǎn)內(nèi),以概率P2選取xl為v2,star,c←3。
(3)確定vc,star。從X剩余數(shù)據(jù)點(diǎn)內(nèi),以概率Pc選取xc為vc,star。
(4)終止條件判定。若c>C,則終止迭代,輸出初始化聚類中心;否則,c←c+1,返回“(3)”。
從貪婪聚類中心初始化策略可以看出,初始聚類中心相互之間的空間距離度量較大,增強(qiáng)了算法搜索空間,具有很強(qiáng)的針對(duì)性。
蜻蜓算法(Dragonfly Algorithm,DA)是2016年才被提出的新型群智能優(yōu)化技術(shù)[16]。DA通過(guò)模擬蜻蜓群體行為,設(shè)置捕食和遷徙2個(gè)種群模態(tài),賦予個(gè)體Xi(t)具有避撞(Si(t))、結(jié)隊(duì)(Ai(t))、聚集(Ci(t))、覓食(Fi(t))、避敵(Ei(t))5種行為,并按照式(16)進(jìn)行更新。
研究成果表明,DA兼具全局搜索和局部搜索,具有較強(qiáng)的優(yōu)化能力(DA基本原理見(jiàn)相關(guān)文獻(xiàn))。為了方便問(wèn)題描述,將特征子集選取作為改進(jìn)FCM的前提,提出基于特征子集選取和混合蜻蜓優(yōu)化多核模糊聚類算法(FDMFCM),即改進(jìn)FCM在特征子集選取的基礎(chǔ)上,實(shí)現(xiàn)對(duì)數(shù)據(jù)集的聚類分析。為了評(píng)價(jià)聚類結(jié)果的好壞,定義聚類結(jié)果評(píng)定指標(biāo)CREI:
式中:ε1、ε2、ε3—比例系數(shù)。
從式(17)可以看出,CREI的分子反映了分類內(nèi)部的緊致度,分母反映了類間的分離度,CREI取值越小,表明聚類結(jié)果越好。
DA編碼:對(duì)于多核函數(shù)確定、最佳特征子集選取和聚類中心迭代計(jì)算問(wèn)題,定義個(gè)體編碼Xi(t)為:
式中:(d1,…,d i,…,d D)—D個(gè)候選核函數(shù),若di=1,則表示選取第i個(gè)核函數(shù),否則di=0,且有=d。DA編碼示意圖,如圖1所示。
圖1 DA編碼示意圖Fig.1 Schematic Diagram of DA Coding
混合迭代進(jìn)化:從DA編碼定義可以看出,Xi(t)既包含離散和連續(xù)兩種編碼位形式,對(duì)于連續(xù)編碼位可以直接采用式(16)進(jìn)行迭代更新,對(duì)于離散編碼位,給出取反Re、替換Su、交換Ex3種離散迭代進(jìn)化策略,其中Re(Xi(t))定義為選取自身G1個(gè)編碼位進(jìn)行取反操作,且:
式中:G1,max、G1,min—G1最大值和最小值。Su(Xi(t)←Xj(t))定義為選取Xj(t)內(nèi)不同于Xi(t)的G2個(gè)編碼位替換,且:
人性化護(hù)理是將“人文關(guān)懷”和“以患者為中心”的思想結(jié)合日常護(hù)理,為患者提供細(xì)節(jié)、全面、人性化的護(hù)理服務(wù)[7]。常規(guī)護(hù)理方式通常將重點(diǎn)放在患者住院期間疾病的變化過(guò)程和生命體征、檢驗(yàn)報(bào)告數(shù)據(jù)中,對(duì)于患者的在住院期間的心理變化、文化影響等缺乏關(guān)注。樂(lè)小麗等[8-9]人在研究中對(duì)宮頸炎患者采取人性化護(hù)理干預(yù)后有效改善患者焦慮、煩躁的不良情緒、提高了患者滿意度[10-11]。本研究中對(duì)患者實(shí)施人性化護(hù)理干預(yù)后,患者用藥依從性得到了顯著提高,從而有效促進(jìn)了治療效果提高。
式中:G2,max、G2,min—G2最大值和最小值,顯然,對(duì)于不同Xi(t),G2,max取值是不同的。定義Ex((Xi(t)←Xk(t)))為Xi(t)隨機(jī)選取Xk(t)內(nèi)對(duì)應(yīng)的G3個(gè)編碼位進(jìn)行交換,3種離散迭代進(jìn)化策略示意圖,如圖2所示。
圖2 離散迭代進(jìn)化策略示意圖Fig.2 Schematic Diagram of Discrete Iterative Evolution Strategy
目標(biāo)函數(shù):對(duì)于模糊聚類優(yōu)化問(wèn)題,定義混合蜻蜓算法目標(biāo)函數(shù)f(X):
式中:X′—X的編碼子集,且X′=(v1…vC)。
FDMFCM實(shí)現(xiàn):采用混合蜻蜓算法對(duì)改進(jìn)FCM進(jìn)行優(yōu)化。在每次迭代過(guò)程中,首先,對(duì)Xi(t)的離散編碼子集(d1…d D)、(χ1…χm)執(zhí)行離散進(jìn)化操作,并在此基礎(chǔ)上,確定核函數(shù)和特征子集。然后,對(duì)Xi(t)的連續(xù)編碼子集執(zhí)行次進(jìn)化操作,得到Xi(t)對(duì)用的聚類中心VXi(t)和聚類結(jié)果評(píng)定指標(biāo)CREI(Xi(t)),并據(jù)此更新種群個(gè)體信息。如此往復(fù),直到算法結(jié)束,最終得到最佳(d1…d D)best、(χ1…χm)best和聚類中心Vbest。基于混合蜻蜓優(yōu)化的改進(jìn)FCM實(shí)現(xiàn)流程圖,如圖3所示。
圖3 FDMFCM實(shí)現(xiàn)流程圖Fig.3 Flow Chart of FDMFCM Implementation
算法計(jì)算復(fù)雜度:從FDMFCM實(shí)現(xiàn)過(guò)程可以看出,對(duì)于具有P個(gè)個(gè)體的蜻蜓種群,種群初始化復(fù)雜度為O(P×(n+d+m)),每次迭代離散編碼子集更新復(fù)雜度為O(P×(d+m)),連續(xù)編碼子集更新復(fù)雜度為種群更新復(fù)雜度為O(P×(n+d+m)),故算法計(jì)算復(fù)雜度為:
利用FDMFCM算法進(jìn)行齒輪故障識(shí)別,采取線下訓(xùn)練和線上識(shí)別兩個(gè)階段。線下階段,由于聚類數(shù)C未知,提出多線程策略:設(shè)定線下共有(Cmax-1)個(gè)線程,每個(gè)線程按照聚類數(shù)c(c=2,…,…Cmax)執(zhí)行FDMFCM操作,得到該聚類數(shù)下的CREI(c),選取CREI(c)取值最小的聚類數(shù)為最佳聚類數(shù)Cbest,并將其對(duì)應(yīng)的(d1…d D)、(χ1…χm)以及其他參數(shù)作為線上識(shí)別參數(shù)輸入。線上階段,由于核函數(shù)、聚類個(gè)數(shù)、特征子集選取向量已經(jīng)確定,因此,在執(zhí)行模糊聚類操作時(shí),只需要執(zhí)行Xi(t)連續(xù)編碼位更新操作,使得算法計(jì)算復(fù)雜度下降到TmaxO(nP)級(jí)別,大大提升了線上齒輪故障識(shí)別效率。在線齒輪故障識(shí)別示意圖,如圖4所示。
圖4 在線齒輪故障識(shí)別示意圖Fig.4 Schematic Diagram of On-Line Gear Fault Identification
采用監(jiān)測(cè)實(shí)驗(yàn)平臺(tái)對(duì)所提方案進(jìn)行驗(yàn)證,監(jiān)測(cè)實(shí)驗(yàn)平臺(tái)包括轉(zhuǎn)速傳感器、電機(jī)、齒輪箱、制動(dòng)器等模塊。實(shí)驗(yàn)平臺(tái)能夠模擬齒輪點(diǎn)蝕、剝落、斷齒、正常等4種健康狀況。
表1 UCI數(shù)據(jù)集聚類對(duì)比結(jié)果Tab.1 Clustering Comparison Results of UCI Dataset
表2 人工數(shù)據(jù)集聚類對(duì)比結(jié)果Tab.2 Clustering Comparison Results of Artificial Data Sets
試驗(yàn)設(shè)置3種不同轉(zhuǎn)速,信號(hào)采樣頻率設(shè)定為1000Hz,每種工況分別采集300個(gè)樣本點(diǎn),其中260個(gè)樣本點(diǎn)組成訓(xùn)練集,其余組成測(cè)試集。對(duì)于特征集,參考文獻(xiàn)[6]提出的時(shí)域與頻域聯(lián)合特征提取方法,每個(gè)樣本由50個(gè)特征描述,4種工況下數(shù)據(jù)情況,如表3所示。
表3 數(shù)據(jù)集Tab.3 Data Sets
5.2.1 特征子集選取對(duì)故障識(shí)別正確率的影響實(shí)驗(yàn)
對(duì)于每種工況,依次增加特征子集選取規(guī)模,并采用基于多核距離度量函數(shù)和貪婪聚類中心初始化策略的改進(jìn)FCM進(jìn)行聚類分析,不同特征子集規(guī)模下故障識(shí)別正確率對(duì)比曲線圖,如圖5所示。運(yùn)算時(shí)間對(duì)比曲線圖,如圖6所示。
圖5 不同特征子集規(guī)模下故障識(shí)別正確率Fig.5 Fault Recognition Accuracy under Different Feature Subset Sizes
圖6 不同特征子集規(guī)模下運(yùn)算時(shí)間對(duì)比曲線圖Fig.6 Comparison Curve of Operation Time under Different Feature Subset Sizes
5.2.2 齒輪故障識(shí)別驗(yàn)證實(shí)驗(yàn)
將4種工況的訓(xùn)練樣本、測(cè)試樣本分別組成訓(xùn)練集和測(cè)試集,采用FDMFCM算法進(jìn)行訓(xùn)練,檢測(cè)時(shí),隨機(jī)選取測(cè)試集中的樣本進(jìn)行實(shí)驗(yàn),每次實(shí)驗(yàn)獨(dú)立運(yùn)行50次,實(shí)驗(yàn)結(jié)果取均值。某次實(shí)驗(yàn)線上識(shí)別階段混合蜻蜓算法收斂曲線,如圖7所示。不同實(shí)驗(yàn)下故障識(shí)別正確率,如圖8所示。
圖7 混合蜻蜓算法收斂曲線Fig.7 Convergence Curve of Hybrid Dragonfly Algorithm
圖8 不同實(shí)驗(yàn)下齒輪故障識(shí)別正確率Fig.8 Correct Rate of Gear Fault Recognition under Different Experiments
5.2.3 不同方法對(duì)比實(shí)驗(yàn)
為了進(jìn)一步分析這里方案性能,基于同樣的數(shù)據(jù)集,分別選取文獻(xiàn)[5]提出的齒輪局部故障識(shí)別方法、文獻(xiàn)[7]提出的齒輪箱故障診斷方法和文獻(xiàn)[10]提出的齒輪故障模式識(shí)別方法進(jìn)行對(duì)比實(shí)驗(yàn),這幾種方法的核心都是在特征子集選取的基礎(chǔ)上,利用不同的識(shí)別分類技術(shù)進(jìn)行故障識(shí)別。不同實(shí)驗(yàn)下,4種方法故障識(shí)別正確率對(duì)比,如圖9所示。
圖9 4種方法故障識(shí)別正確率對(duì)比Fig.9 Comparison of Fault Identification Accuracy of Four Methods
(1)提出的改進(jìn)FCM(IFCM)具有更好的聚類性能。從表1可以看出,對(duì)于經(jīng)典測(cè)試數(shù)據(jù),3種聚類算法都取得了不錯(cuò)的聚類效果,聚類正確率都達(dá)到了90%以上,特別的,相比其他兩種算法,IFCM聚類正確率提高了約(6.5~9.3)%。從表2可以看出,對(duì)于人工數(shù)據(jù),由于聚類數(shù)事先未知,且人為增加數(shù)據(jù)復(fù)雜度,導(dǎo)致其他兩種算法的聚類效果不佳,聚類評(píng)價(jià)指標(biāo)CREI是IFCM的4倍左右,但是,由于采用兩重循環(huán)迭代,IFCM在運(yùn)算時(shí)間上要高于其他兩種算法。之所以IFCM聚類效果更優(yōu),是因?yàn)槎嗪司嚯x度量函數(shù)的引入,提高了算法對(duì)復(fù)雜數(shù)據(jù)問(wèn)題的適應(yīng)性,貪婪聚類中心初始化的提出,提高了聚類迭代的針對(duì)性和確定性,使得算法具有更佳的聚類性能。對(duì)于IFCM運(yùn)算效率較慢的問(wèn)題,后期采用線下訓(xùn)練和線上識(shí)別兩個(gè)階段,有效避開(kāi)了線下訓(xùn)練階段消耗時(shí)間較多的缺陷。
(2)合理選取特征子集對(duì)提高故障識(shí)別效率具有重要影響。從圖5、圖6可以看出,在一定范圍內(nèi),隨著特征子集規(guī)模的不斷增加,故障識(shí)別正確率不斷提高,特別的,當(dāng)特征子集規(guī)模在20左右時(shí),識(shí)別正確率可以達(dá)到90%以上。此后,故障識(shí)別正確率隨特征子集規(guī)模變化不大,但是,算法運(yùn)行時(shí)間在迅速增加,因此,合理選取特征子集可以保持較高的故障識(shí)別正確效率,而且能夠大幅度降低算法運(yùn)算時(shí)間。
(3)提出的在線齒輪故障識(shí)別方法具有更好的識(shí)別效果。從圖7、圖8可以看出,在線上識(shí)別階段,混合蜻蜓算法能夠快速收斂全局最優(yōu)解,而且識(shí)別正確率很高,這表明,提出的在線齒輪故障識(shí)別方法能夠快速準(zhǔn)確識(shí)別出齒輪故障。從圖9可以看出,相比于其他故障識(shí)別方法,這里算法具有更好的識(shí)別正確率,而且更加穩(wěn)定,識(shí)別正確率提高了約(11.1~31.7)%。
對(duì)在線齒輪故障識(shí)別進(jìn)行了研究,提出了一種基于混合蜻蜓優(yōu)化多核模糊聚類和特征子集選取的在線齒輪故障識(shí)別方法。該方法以模糊聚類算法為核心,具有線下訓(xùn)練和在線識(shí)別兩階段結(jié)構(gòu),通過(guò)提出改進(jìn)策略以提升模糊聚類算法復(fù)雜問(wèn)題聚類性能,提高了在線齒輪故障識(shí)別正確率,實(shí)驗(yàn)仿真結(jié)果也驗(yàn)證了所提方法的有效性。下一步將圍繞小樣本故障檢測(cè)成功率進(jìn)行研究。