国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

結(jié)合馬田系統(tǒng)-SVM的滾動軸承故障模式分類研究

2021-03-23 03:44:46韓衛(wèi)宇程龍生
關(guān)鍵詞:二叉樹分類變量

韓衛(wèi)宇,程龍生

南京理工大學(xué) 經(jīng)濟(jì)管理學(xué)院,南京 210094

當(dāng)前隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、5G無線通信、移動終端、智能傳感器技術(shù)的發(fā)展和成熟,催生了工業(yè)互聯(lián)網(wǎng)的誕生。工業(yè)互聯(lián)網(wǎng)的本質(zhì)是將人、機(jī)器、數(shù)據(jù)有機(jī)地相連接[1]。機(jī)械設(shè)備的故障模式分類是工業(yè)互聯(lián)網(wǎng)重要的應(yīng)用場景之一。在機(jī)械設(shè)備的關(guān)鍵部件中,滾動軸承是最通用的,最重要的也是最容易發(fā)生故障的。在對機(jī)械設(shè)備的故障產(chǎn)生原因進(jìn)行統(tǒng)計(jì)分析后,發(fā)現(xiàn)有將近30%的故障是由滾動軸承的退化而導(dǎo)致的[2],因此對滾動軸承進(jìn)行故障模式分類是有意義的,對于日常修理或者更換工作提供了決策依據(jù),既降低了維護(hù)成本,又提高設(shè)備的可靠性,保證設(shè)備正常運(yùn)行。

在基于振動信號特征提取的滾動軸承故障模式分類中,第一步也是最為關(guān)鍵的步驟就是提取振動信號中有效的故障特征,其將直接影響到整個(gè)模型的準(zhǔn)確率和效率。采集軸承振動信號的傳感器所處的現(xiàn)場環(huán)境嘈雜,導(dǎo)致信號中含有大量干擾噪聲。并且處于故障狀態(tài)的振動信號本身就具有非平穩(wěn)、非線性的特性[3]。常用的信號處理方法包括短時(shí)傅里葉變換、小波變換和基于Hilbert-Huang變換(HHT變換)。HHT變換又包括經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)和希爾伯特變換。短時(shí)傅里葉變換和小波變換等方法無法自適應(yīng)地根據(jù)數(shù)據(jù)本身特性做相應(yīng)處理,具有一定的局限性。而EMD 是一種新型自適應(yīng)信號時(shí)頻處理方法,于1998 年由Huang 提出來的[4]。EMD 方法在理論上能夠分解任何類型的信號,在處理非平穩(wěn)及非線性數(shù)據(jù)上,具有非常明顯的優(yōu)勢。Ali[5]用EMD提取特征向量,然后利用神經(jīng)網(wǎng)絡(luò)進(jìn)行模式識別,實(shí)現(xiàn)了軸承故障模式分類。Guo等[6]采用基于多目標(biāo)優(yōu)化的EMD 方法提取滾動軸承故障特征,用于故障識別與分類。但是EMD 分解存在模態(tài)混疊現(xiàn)象,影響分類的準(zhǔn)確度。為了解決該問題,Huang 等[7]于2009 年提出了一種人為添加白噪聲的方法進(jìn)行信號處理—集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD),該方法是在原始信號中加入了高斯白噪聲,然后再進(jìn)行多次EMD分解。Deng等[8]結(jié)合EEMD和相關(guān)系數(shù)法計(jì)算出軸承的故障特征用于故障模式分類,所提的特征提取方法可以有效地消除模態(tài)混疊的影響。Yu 等[9]利用EEMD 和SVD(奇異值分解)從軸承的實(shí)時(shí)狀態(tài)數(shù)據(jù)中提取有效的故障特征,用于狀態(tài)評估。胡謐[10]先通過變換對信號進(jìn)行降噪,然后利用EEMD 和HHT變換得到信號的邊際譜進(jìn)行故障識別。

馬田系統(tǒng)是一種理論基礎(chǔ)深厚,應(yīng)用場景廣泛的多元統(tǒng)計(jì)方法,包括了特征約簡和分類預(yù)測兩部分。Shakya[11]采用施密特正交化MTS 有效地篩選出振動信號的時(shí)域、頻域等多個(gè)特征,從而對滾動軸承進(jìn)行了故障診斷。Zhao[12]將拉普拉斯算子用于降低輸入MTS的特征維度,從而對滾珠進(jìn)行健康評估。

常用的用于分類的機(jī)器學(xué)習(xí)算法有人工神經(jīng)網(wǎng)絡(luò)(ANN)、決策樹(DT)等。但基于ANN的滾動軸承故障模式分類,需要訓(xùn)練大量的樣本,學(xué)習(xí)速度慢,但是滾動軸承的樣本數(shù)量少,因此訓(xùn)練很可能會失敗。而DT 易出現(xiàn)過擬合問題導(dǎo)致泛化能力不強(qiáng),也容易忽略各個(gè)指標(biāo)屬性之間的相關(guān)性等問題。SVM表現(xiàn)出相較于其他算法的優(yōu)勢主要體現(xiàn)在SVM的理論基礎(chǔ)是統(tǒng)計(jì)學(xué)習(xí)理論,遵循結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,具有小樣本學(xué)習(xí)能力,即使訓(xùn)練樣本數(shù)量較少也只會產(chǎn)生微小誤差。并且對獨(dú)立的測試集仍能保證小的誤差,泛化能力強(qiáng)。同時(shí)SVM的模型復(fù)雜程度與特征空間的特征數(shù)量無關(guān)。由于SVM 的分類決策函數(shù)是由少數(shù)的支持向量(Support Vector)確定,其模型的復(fù)雜度和計(jì)算量只和支持向量的個(gè)數(shù)有關(guān),不會發(fā)生所謂的“維數(shù)災(zāi)難”。

隨著SVM 理論的不斷完善,學(xué)者也將其運(yùn)用的不同實(shí)際領(lǐng)域中進(jìn)行模式識別。在滾動軸承故障模式分類中,Zhang[13]等通過EEMD對振動信號進(jìn)行分解,從中提取了信號的奇異值和能量熵指標(biāo),然后使用SVM 對軸承的故障類型進(jìn)行分類。秦波等[14]提出了一種基于小波包、奇異值分解和GA-SVM 的軸承故障診斷方法。SVM 參數(shù)C和δ對分類精度的影響很大,但是難以提前確定合適的取值。各位學(xué)者紛紛引入優(yōu)化算法幫助尋優(yōu),如網(wǎng)格搜索算法、蟻群算法、遺傳算法等。但這些算法在優(yōu)化參數(shù)時(shí)存在一些劣勢,如計(jì)算開銷大導(dǎo)致的尋優(yōu)效率低等問題。相比之下,PSO算法具有諸多優(yōu)點(diǎn),如可調(diào)參數(shù)少、尋優(yōu)效率高。所以本文通過粒子群算法優(yōu)化支持向量機(jī)。

SVM 最初是解決二元分類問題的,不能直接進(jìn)行多分類,必須引入多分類算法。劉志剛[15]總結(jié)了SVM在多分類推廣的方法,從訓(xùn)練速度、測試速度和泛化水平等維度比較了每個(gè)算法的優(yōu)劣勢。

綜上所述,本文提出結(jié)合馬田系統(tǒng)和SVM 的故障模式分類方法。使用特征生成法構(gòu)建初始多維特征空間,然后使用馬田系統(tǒng)進(jìn)行降維,得到精簡特征空間,然后輸入到SVM多分類模型中進(jìn)行故障模式分類。實(shí)驗(yàn)結(jié)果表明,該方法可以有效識別故障的類型并確定受損程度。

1 相關(guān)理論基礎(chǔ)

1.1 EEMD方法

EEMD分解步驟如下:

(1)多次在原信號里加入幅值系數(shù)為k的白噪聲序列ni(t)(i|=1,2,…,h),得到h個(gè)新信號,如式(1)所示:

(2)對新信號xi(t)進(jìn)行EMD 分解,分別得到n個(gè)IMF分量,記為cij(t)(j=1,2,…,n),余量記為ri(t)。

(3)計(jì)算每個(gè)新信號分解后所得到的IMF的均值和RES的均值,把其看做是最后所得到的IMF分量及余量結(jié)果,如式(2)所示:

式中,cj(t)表示EEMD分解得到的第j個(gè)IMF分量;r(t)表示EEMD分解后的殘余函數(shù)。

1.2 故障敏感IMF選取方法

在EEMD分解過程中,原始的滾動軸承信號將會成為一系列不同頻率范圍內(nèi)的IMF,其中不同的IMF中往往包含了不同的故障信息,也與故障的相關(guān)性差別很大,所以對于故障的表達(dá)能力存在比較大差異。如果盲目將所有IMF 參與構(gòu)建初始特征空間,會引入冗余信息,導(dǎo)致運(yùn)算量增加,識別效率降低,甚至?xí)绊懛诸悳?zhǔn)確率。若能有效地建立IMF分量與故障的相關(guān)關(guān)系,將會為IMF的挑選提供依據(jù),從而挑選出對于故障信息敏感的IMF,去除其他IMF 干擾成分,提高軸承故障特征提取的效率和可靠性。所以在此基礎(chǔ)上,本文提出了故障敏感IMF選取方法。該算法具體流程如下:

(1)計(jì)算振動信號x(t)和其各IMF分量d1(t),d2(t),…,dn(t)的相關(guān)系數(shù)pi為:

(2)計(jì)算各IMF分量的敏感因子:

(3)按敏感系數(shù)從大到小的順序?qū)MF 重新排序,得到新的IMF 序列{d′n(t)} (i=1,2,…,n),并計(jì)算敏感系數(shù)的累計(jì)和:

(4)給出選擇閾值η,當(dāng)?shù)趉個(gè)IMF 的敏感系數(shù)的累計(jì)和hk >η,而第k-1 個(gè)IMF 的敏感系數(shù)的累計(jì)和hk-1<η時(shí),那么 { }d′n中的前k階 IMF 即為故障敏感的IMF,該算法的閾值η根據(jù)具體問題而確定。該算法本質(zhì)上是根據(jù)IMF各分量與原信號的相似性,旨在突出與故障特征相關(guān)性大的成分。

1.3 馬田系統(tǒng)特征篩選

1.3.1 馬田系統(tǒng)原理

馬田系統(tǒng)(MTS)是日本著名質(zhì)量工程學(xué)家田口玄一博士提出來的一種針對多變量的模式識別方法。馬田系統(tǒng)包括兩個(gè)部分,即特征變量篩選和樣本類型判斷。馬田系統(tǒng)的核心方法包括了馬氏距離、正交表和信噪比等方法。MTS 利用田口方法(包括正交表和信噪比)篩選有效特征變量,剔除冗余變量,從而實(shí)現(xiàn)優(yōu)化空間的工作。

在馬田系統(tǒng)中,是根據(jù)馬氏距離的大小來進(jìn)行決策歸屬的,為了避免變量的數(shù)量不同影響決策,馬氏距離都要除以變量數(shù)量,這樣在基準(zhǔn)空間中的樣本數(shù)據(jù)的馬氏距離平均值為1。逆矩陣法是計(jì)算馬氏距離的常用方法,它的核心是計(jì)算相關(guān)系數(shù)的逆矩陣。設(shè)空間F中包含了n×p個(gè)樣本,n是樣本個(gè)數(shù),p是樣本的變量個(gè)數(shù),第i個(gè)樣本的第j個(gè)變量的值為xij(i=1,2,…,n;j=1,2,…,p) ,對空間F進(jìn)行標(biāo)準(zhǔn)化處理得到tij=(xijxˉj)/sj,xˉj為變量j的均值,sj為變量j的標(biāo)準(zhǔn)差,從而得到樣本標(biāo)準(zhǔn)化的向量Ti=(ti1,ti2,…,tip)T,i=1,2,…,n。變量間的相關(guān)系數(shù)矩陣為U,其逆矩陣為U-1,則第i個(gè)樣本的馬氏距離為:

在多元系統(tǒng)中,數(shù)據(jù)的變量越多,會增加分類的計(jì)算量,降低分類的效率,并且變量與變量之間所表達(dá)的信息可能是相同的。所以有必要去除冗余變量。在馬田系統(tǒng)中,使用二水平正交表和信噪比來篩選特征變量。

正交表是質(zhì)量工程學(xué)的試驗(yàn)設(shè)計(jì)的方法,田口玄一將其借鑒過來,目的是通過相對少的試驗(yàn)次數(shù)來找到最佳的變量搭配。在MTS 中只使用兩水平的正交表,即使用和不使用該變量。在該表中水平“1”指的使用該變量參與建立基準(zhǔn)空間,水平“2”與之相反。

信噪比從字面意思來說是指信號與噪聲之比,將有效信號與干擾噪聲的比值來評價(jià)設(shè)備的能力,單位為dB。田口玄一將信噪比引入正交實(shí)驗(yàn)中的主要目的是作為指標(biāo)篩選的規(guī)則。

在MTS 中,通過二水平正交表可以構(gòu)建不同的基準(zhǔn)空間,利用每個(gè)基準(zhǔn)空間計(jì)算異常樣本的MD,然后根據(jù)式(7)計(jì)算出每一個(gè)試驗(yàn)條件下的信噪比,從而求出每個(gè)變量的主效應(yīng)。

MTS 中特征變量的選擇由變量的信息增益差Δ(即變量的主效應(yīng))決定。一般來說,信息增益差Δ越大,表明該變量有助于提高分類準(zhǔn)確度:

SNR+表示正交表中某個(gè)變量水平為“1”時(shí)的信噪比之和,SNR-表示正交表中某個(gè)變量水平為“2”時(shí)的信噪比之和。如果Δ大于0,說明該特征變量對分類起到積極作用,應(yīng)該挑選該變量;如果Δ小于0,說明該特征變量對分類起到消極作用,應(yīng)該舍棄該變量。這樣就完成了特征變量篩選的工作,使分類效率和準(zhǔn)確率更高。

1.3.2 篩選特征變量步驟

馬田系統(tǒng)中只有正常樣本和異常樣本兩類數(shù)據(jù)。根據(jù)研究問題的實(shí)際情況,定義正常樣本并確定原始的特征變量,從而構(gòu)建基準(zhǔn)空間。計(jì)算基準(zhǔn)空間的均值向量和協(xié)方差矩陣等信息。正常情況下,基準(zhǔn)空間內(nèi)正常樣本的馬氏距離均值大約為1,這種特點(diǎn)使得基準(zhǔn)空間可以作為測量尺度的參考集,對識別異常樣本有明顯的效果。運(yùn)用2水平正交表Lq(2n)來進(jìn)行試驗(yàn),正交表的每一列表示一個(gè)變量,每一行表示一次試驗(yàn)。在每一次試驗(yàn)時(shí),都會選擇不同的變量組成一個(gè)數(shù)據(jù)集,生成對應(yīng)的基準(zhǔn)空間。在每一次試驗(yàn)過程中,首先先計(jì)算正常樣本的均值、標(biāo)準(zhǔn)差和協(xié)方差矩陣,然后使用正常樣本的均值、標(biāo)準(zhǔn)差、協(xié)方差矩陣再計(jì)算所有異常樣品的馬氏距離,將結(jié)果代入式(7)這樣就得到了信噪比。最后計(jì)算各變量的信噪比增量,大于0予以保留,小于0予以剔除。這樣就得到了最優(yōu)的變量組合,實(shí)現(xiàn)了優(yōu)化基準(zhǔn)空間的目的。

1.4 偏二叉樹多分類方法

SVM 是用于解決多維模式識別中的二分類問題。但是,在實(shí)踐中存在很多多分類問題。因此,構(gòu)造合理的多分類算法是擴(kuò)展馬田系統(tǒng)應(yīng)用場景的重要手段。多分類問題可以表述為:給定屬于k類的m維n個(gè)訓(xùn)練樣本 (x1,y1),(x2,y2),…,(xn,yj),其中xi∈Rm,i=1,2,…,n,且yj∈{ }

1,2,…,k,要通過上述訓(xùn)練樣本構(gòu)造一個(gè)分類函數(shù)f,使對未知樣本x進(jìn)行分類時(shí),錯(cuò)誤率盡可能小。目前,一般解決多分類的方法是將多個(gè)二分類器相互連接,組成一個(gè)整體,當(dāng)輸入樣本的數(shù)據(jù)就輸出樣本類別。不同的連接方式適用不同的樣本,有不同的分類效果。目前多分類器一般包括“一對多”法、“一對一”法、有向無環(huán)圖法和二叉樹法等。二叉樹分類器在訓(xùn)練數(shù)據(jù)時(shí)只需建立k-1 個(gè)分類器,并且也不需經(jīng)歷所有分類器和所有類別的數(shù)據(jù)。因?yàn)樵酵乱粚蛹売?xùn)練,參與訓(xùn)練的數(shù)據(jù)越少,效率越高。相較于其他三種分類法,它的訓(xùn)練效率、決策速度和預(yù)測精度均較高。

雖然二叉樹分類器有諸多優(yōu)點(diǎn),但是如果待解決的問題背景比較復(fù)雜時(shí),二叉樹模型層次結(jié)構(gòu)的建立存在一定風(fēng)險(xiǎn),因?yàn)槎鏄涞牟煌瑢哟谓Y(jié)構(gòu)對分類精度有很大影響。也即分離的類別順序不同,整個(gè)模型的分類精度也不同。如果在某個(gè)節(jié)點(diǎn)上發(fā)生分類錯(cuò)誤,該錯(cuò)誤將擴(kuò)展到下一個(gè)節(jié)點(diǎn),后續(xù)分類的錯(cuò)誤率將會越來越高。因此,有必要選擇適當(dāng)?shù)慕Y(jié)構(gòu),在這個(gè)結(jié)構(gòu)下,先分出容易劃分的類別(即與其他類別相差最大的樣本),然后再分出不容易劃分的類別。這樣就盡可能將可能的錯(cuò)誤遠(yuǎn)離根源,提高模型的準(zhǔn)確率。

為解決上述問題,本文借鑒“聚類分析”的思想,采用類間距離法來確定二叉樹的結(jié)構(gòu),具體思路如下:首先計(jì)算訓(xùn)練集數(shù)據(jù)各類別之間的距離,得到每個(gè)類別距離其他類的距離之和,并得到了每一類相距其他類的“遠(yuǎn)近順序”,按照這個(gè)順序建立了偏二叉樹結(jié)構(gòu),然后沿著層級進(jìn)行訓(xùn)練,并最終依次將各類分離開來。

本文使用計(jì)算相對簡單的重心法來定義各類數(shù)據(jù)之間的距離。而兩個(gè)類重心之間的距離采用歐式距離。假設(shè)訓(xùn)練集樣本X包含k個(gè)類別,X1表示第1 類的訓(xùn)練集,X2表示第2類的訓(xùn)練集,X1和X2的樣本數(shù)為N1和N2,都有p個(gè)特征向量,則X1和X2的樣本重心分別為:

則Xi和Xj的樣本重心的距離為:

選擇樣本重心距離其他類樣本重心最遠(yuǎn)的類別作為第一個(gè)分離的類別,以此類推就確定了偏二叉樹的分離順序。

2 結(jié)合馬田系統(tǒng)和SVM的多分類模型

由于SVM模型的兩個(gè)參數(shù)會對故障模式分類的結(jié)果有很大的影響,因此對SVM 的參數(shù)進(jìn)行尋優(yōu)就很有必要了。并且本文所構(gòu)建的SVM模型中可調(diào)參數(shù)有兩個(gè),分別是懲罰因子C和核函數(shù)的參數(shù)δ。本文通過比較分析,最終使用PSO 算法來進(jìn)行SVM 模型的參數(shù)尋優(yōu)。PSO優(yōu)化SVM的具體步驟如下:

步驟1構(gòu)建偏二叉樹SVM 多分類結(jié)構(gòu),確定每個(gè)二分類器的初始特征空間,并使用馬田系統(tǒng)的前半部分(正交表和信噪比)得到精簡特征空間,從而構(gòu)成了SVM多分類模型。

步驟2設(shè)置SVM 參數(shù)C和δ的范圍。初始化粒子群算法的參數(shù)。確定種群數(shù)量、迭代次數(shù)、學(xué)習(xí)因子和權(quán)重,在解空間中隨機(jī)生成粒子群。

步驟3將訓(xùn)練集的樣本輸入SVM 模型進(jìn)行訓(xùn)練,以測試集模型整體的樣類別預(yù)測準(zhǔn)確率為適應(yīng)度函數(shù)值。計(jì)算各粒子適應(yīng)度并尋找當(dāng)前最優(yōu)粒子,確定個(gè)體最優(yōu)和全局最優(yōu),將更新后的粒子適應(yīng)度與最優(yōu)適應(yīng)度進(jìn)行比較,選擇更優(yōu)的值。

步驟4監(jiān)測模型是否達(dá)到預(yù)先設(shè)定的條件(適應(yīng)度達(dá)到100%或者達(dá)到最大迭代次數(shù)),否則轉(zhuǎn)步驟3。

步驟5對粒子所處的位置和速度進(jìn)行實(shí)時(shí)更新。更新SVM的參數(shù)C和δ。

步驟6得到最優(yōu)解,輸出最優(yōu)解對應(yīng)的SVM 參數(shù)C和δ。

粒子群優(yōu)化多分類SVM模型的流程圖如圖1所示。

圖1 結(jié)合MTS和SVM多分類模型

3 實(shí)例計(jì)算

3.1 實(shí)驗(yàn)說明

本文采用的滾動軸承故障振動信號數(shù)據(jù)集來自于凱斯西儲大學(xué)軸承故障模擬實(shí)驗(yàn)臺。在實(shí)驗(yàn)初期,先采取電火花加工技術(shù)設(shè)置好故障點(diǎn)來假定軸承的故障發(fā)生。在型號為SKF 的軸承的不同部位預(yù)先設(shè)置故障點(diǎn)來分別模擬軸承內(nèi)圈故障(Inner Raceway,IR)、外圈故障(Outer Raceway,OR)和滾動體故障(rolling Body,B)。在每個(gè)部位分別設(shè)置深度為0.18 mm、0.36 mm、0.54 mm的故障點(diǎn),以模擬每個(gè)部位不同受損程度的故障(分別為輕微故障、中度故障和嚴(yán)重故障)。驅(qū)動端軸承故障數(shù)據(jù)采樣頻率為48 kHz,風(fēng)扇端軸承故障數(shù)據(jù)采樣頻率則設(shè)置為12 kHz。通過16通道的DAT記錄器采集振動信號,將原始數(shù)據(jù)保存為MATLAB 格式用于后期使用。

本文采用SKF驅(qū)動端軸承數(shù)據(jù),外圈部位故障點(diǎn)為6點(diǎn)鐘方向,轉(zhuǎn)速為1 730 r/min,分別采集軸承正常狀態(tài)和3 種故障類型的不同故障受損程度的振動信號。所以,一共采集到了10 個(gè)類型數(shù)據(jù)。其中每個(gè)類型數(shù)據(jù)包括100 個(gè)樣本,每個(gè)樣本信號中由1 024 個(gè)數(shù)據(jù)點(diǎn)所構(gòu)成,這樣就總共有10×100×1 024=1 024 000 個(gè)數(shù)據(jù)點(diǎn)。在每一類型數(shù)據(jù)中,訓(xùn)練集樣本數(shù)量和測試集樣本數(shù)量比值為3∶2,即采用隨機(jī)抽取方式,將每一類型數(shù)據(jù)分為5份,選3份作為訓(xùn)練集樣本,剩下2份作為測試集樣本,這樣方便之后的交叉驗(yàn)證。

3.2 信號處理

將采集的1 000個(gè)原始振動信號樣本進(jìn)行EEMD分解,均獲得5個(gè)IMF分量和一個(gè)RES余量,圖2展示了正常狀態(tài)的EEMD信號分解圖,圖中按照頻率高低將IMF分量從上到下依次排列,第一排是原始信號,最后一排是RES余量。由圖可知,每種狀態(tài)的振動信號均被分解成了5個(gè)IMF分量和一個(gè)剩余分量,并且每個(gè)IMF分量的圖像是平穩(wěn)的,說明了EEMD分解的良好效果。

圖2 正常信號EEMD分解圖

3.3 篩選敏感IMF

使用故障敏感IMF 選取方法可以挑選出對故障信息敏感的IMF分量。η取0.6,得到表1結(jié)果。

3.4 計(jì)算統(tǒng)計(jì)特征值

計(jì)算原始信號的能力熵特征以及各IMF 分量的時(shí)域特征和頻域特征。時(shí)域特征有4 個(gè),分別為均方根值、峰值、極差、峭度;頻域特征有1 個(gè),即頻率標(biāo)準(zhǔn)差,即每個(gè)IMF 分量提取5 個(gè)特征量。各故障模式的原始信號經(jīng)過故障敏感IMF 選擇方法篩選了1~4 個(gè)不等的IMF分量,當(dāng)對不同模式進(jìn)行分類時(shí)要選擇不同的IMF分量。當(dāng)對正常樣本進(jìn)行分類時(shí),選擇4個(gè)IMF,這樣就提取了21個(gè)特征值,構(gòu)成了1 000×21 初始特征空間。

表1 故障敏感IMF選取方法結(jié)果

3.5 確定偏二叉樹結(jié)構(gòu)

當(dāng)對未知的滾動軸承樣本的故障模式進(jìn)行類別預(yù)測時(shí),首先判斷故障類型,其次確定故障的受損程度。所以,先將訓(xùn)練樣本分為四大類(正常樣本、內(nèi)圈故障、外圈故障和滾動體故障),通過偏二叉樹分類器確定樣本的故障類型;然后對每種故障類型再各分為三小類(輕微故障、中度故障和嚴(yán)重故障),分別使用偏二叉樹分類器,確定故障的受損程度,這樣就完成了馬田系統(tǒng)故障模式多分類。

從每類故障模式隨機(jī)選取60 個(gè)樣本構(gòu)成訓(xùn)練集,剩下40個(gè)樣本構(gòu)成測試集。為了方便計(jì)算類別重心距離,將訓(xùn)練集的特征向量個(gè)數(shù)都定為21。首先將訓(xùn)練集分為4 大類,分別為正常類和3 種故障類型。正常類樣本構(gòu)成為60×21,各故障樣本構(gòu)成為180×21,然后計(jì)算每一類的樣本重心,最后計(jì)算各個(gè)類之間的歐氏距離,結(jié)果如表2所示。

表2 故障類型重心距離計(jì)算結(jié)果

距離其他類最遠(yuǎn)的類別先分離出去,由表2 可得,二叉樹的分離順序?yàn)檎n?、滾動體故障、內(nèi)圈故障和外圈故障,同理可得各故障類型的不同受損程度分離順序。最終得到了馬田二叉樹多分類結(jié)構(gòu),如圖3 所示。由圖3 可以清晰地看出,一共需要構(gòu)建9 個(gè)二分類器。第1~3 分類器可以判斷故障類型,4~9 分類器可以確定故障受損程度。

圖3 偏二叉樹多分類結(jié)構(gòu)

3.6 馬田系統(tǒng)降維

通過前面章節(jié)的計(jì)算,得到了9 個(gè)SVM 分類器的初始特征空間。然后使用馬田系統(tǒng)對每個(gè)特征空間進(jìn)行降維,得到精簡特征空間。表3是每個(gè)分類器的參數(shù)。

表3 信噪比增量圖

3.7 粒子群算法優(yōu)化SVM

使用粒子群算法優(yōu)化SVM。在粒子群的尋優(yōu)部分參數(shù)設(shè)置:種群數(shù)量20,學(xué)習(xí)因子c1=c2=2,慣性權(quán)重的值w進(jìn)行線性遞減,計(jì)算公式為:

式中,wmax=0.4,wmin=0.1,k為目前迭代次數(shù),kmax為最大迭代次數(shù),kmax=100。

在 SVM 模型構(gòu)建的參數(shù)設(shè)置:C∈(0.1,103),δ∈(0.1,200),粒子維度為2。將訓(xùn)練集樣本進(jìn)行SVM模型訓(xùn)練,測試集樣本進(jìn)行測試,以確定適應(yīng)度函數(shù)值。

3.7.1 故障類型尋優(yōu)

當(dāng)對故障類型進(jìn)行分類時(shí),圖4 刻畫了在測試時(shí)PSO尋優(yōu)的過程,紅色線代表每次迭代的最佳適應(yīng)度的情況,當(dāng)?shù)降?3次時(shí)最佳適應(yīng)度達(dá)到98.50%,之后就不再變化;藍(lán)色線代表每次迭代的平均適應(yīng)度的情況,分布在90%和97.75%之間,平均值為94.175%。通過尋優(yōu)的過程得到了最佳的參數(shù)組合,即懲罰因子C為24.56,RBF 核函數(shù)參數(shù)σ為 5.58。所以,將 400 個(gè)測試集樣本輸入PSO 優(yōu)化的SVM 模型,分類準(zhǔn)確率達(dá)到98.50%(394/400),具體分類結(jié)果如表4所示。

圖4 PSO-SVM故障類型分類模型迭代適應(yīng)度值

表4 故障類型預(yù)測結(jié)果

3.7.2 故障受損程度尋優(yōu)

當(dāng)對故障受損程度進(jìn)行分類時(shí),圖5刻畫了在測試時(shí)PSO尋優(yōu)的過程,紅色線代表每次迭代的最佳適應(yīng)度的情況,在前17 次都處于95%,第18 次到37 次達(dá)到了95.75%,第38次時(shí)達(dá)到了96.5%,之后就不再變化;藍(lán)色線代表每次迭代的平均適應(yīng)度的情況,分布在84.25%和94.5%之間,平均值為90.807 5%。通過尋優(yōu)的過程得到了最佳的參數(shù)組合,即懲罰因子C為16.82,RBF核函數(shù)參數(shù)σ為2.96。將400 個(gè)測試集樣本輸入PSO 優(yōu)化的SVM模型,分類準(zhǔn)確率達(dá)到96.5%(386/400),具體分類結(jié)果如表5所示。

圖5 PSO-SVM故障受損程度分類模型迭代適應(yīng)度值

表5 故障受損程度預(yù)測結(jié)果

為了進(jìn)一步分析誤分情況,得到測試集的混淆矩陣,見表6。

表6 測試集混淆矩陣

由表4和表5可得,PSO-SVM多分類器對故障類型和故障受損程度的預(yù)測準(zhǔn)確率都很高。由表6可得,誤報(bào)率(即正常樣本被錯(cuò)分為故障狀態(tài))為0,漏報(bào)率(即故障狀態(tài)被錯(cuò)分為正常狀態(tài))也為0。從虛線框內(nèi)可以看出3 種故障類型之間的錯(cuò)分率很低。故障受損程度之間的錯(cuò)分率也很低,說明該模型的有效性。

本文使用交叉驗(yàn)證,即將每種故障模式的100個(gè)樣本隨機(jī)分為5份,每份20個(gè)樣本。輪流選擇3份作為訓(xùn)練集,剩余2 份作為測試集,一共需要做C35=10 次實(shí)驗(yàn)。計(jì)算10 次分類結(jié)果平均值,即為該模型最終的準(zhǔn)確率。經(jīng)過10 次試驗(yàn)后,故障類型的類別預(yù)測準(zhǔn)確率為97.90%,耗時(shí)34.7 s。故障受損的類別預(yù)測準(zhǔn)確率為95.975%,耗時(shí)57.6 s。

4 對比分析

本文通過EEMD進(jìn)行信號處理,得到一系列IMF分量,然后使用故障敏感IMF選取算法篩選出一部分IMF分量,然后從中提取出21 個(gè)特征值構(gòu)成了初始特征空間。使用馬田系統(tǒng)的前半部分,即正交表和信噪比進(jìn)行特征約簡,得到了精簡特征空間。最后通過PSO優(yōu)化的SVM進(jìn)行故障模式多分類。為了驗(yàn)證本文所提出的方法的有效性,需要進(jìn)行對比分析,每組實(shí)驗(yàn)都經(jīng)過交叉驗(yàn)證。

(1)使用EMD 方法進(jìn)行信號處理,其他方法不變,來驗(yàn)證EEMD 方法的有效性。預(yù)測結(jié)果如表7 所示。由實(shí)驗(yàn)1 和4 可知,EEMD 進(jìn)行信號處理后模型的預(yù)測準(zhǔn)確率高于EMD方法,說明了EEMD較EMD的優(yōu)越性。

表7 特征生成方法對比分析

(2)為了驗(yàn)證故障敏感IMF 選取算法的有效性,對照組為全部IMF分量參與計(jì)算特征值,這樣每個(gè)分類器的初始特征空間都是21 維。預(yù)測結(jié)果如表7 所示。由實(shí)驗(yàn)2 和4 可知,通過選取敏感IMF 分量可以有效提高分類模型的準(zhǔn)確率。

(3)為了驗(yàn)證正交表+信噪比降維的有效性,對照組設(shè)置為不經(jīng)過降維的過程,直接將初始特征空間輸入到分類模型中。預(yù)測結(jié)果如表7 所示。由實(shí)驗(yàn)3 和4 可知,不經(jīng)過降維的初始特征空間輸入到多分類模型后準(zhǔn)確率略低于正交表+信噪比降維,此組實(shí)驗(yàn)說明了特征降維是非常有必要的。

(4)對SVM 模型的兩個(gè)參數(shù)進(jìn)行尋優(yōu)的方法有很多,如粒子群算法、網(wǎng)格搜索算法和遺傳算法等,本文將這些分類方法進(jìn)行比較,預(yù)測結(jié)果如表8 所示。由表8可知,未經(jīng)優(yōu)化的SVM 準(zhǔn)確率遠(yuǎn)低于3 種優(yōu)化SVM 的方法,但所用時(shí)間遠(yuǎn)少于3 種優(yōu)化方法。在對3 種優(yōu)化方法之間對比后發(fā)現(xiàn),粒子群方法的準(zhǔn)確率和效率都優(yōu)于其他兩種方法,說明了本文所提出方法的有效性。

表8 SVM尋優(yōu)方法對比分析

5 結(jié)論

本文構(gòu)建了結(jié)合馬田系統(tǒng)和支持向量機(jī)的故障模式分類模型。首先利用EEMD 方法對原始振動信號進(jìn)行分解,得到一系列IMF。經(jīng)過故障敏感IMF選取方法篩選IMF 后計(jì)算其時(shí)域和頻域特征參數(shù)以及原始信號的能量熵參數(shù),構(gòu)造初始的多維特征空間。接下來運(yùn)用馬田系統(tǒng)中的正交表和信噪比進(jìn)行特征降維,得到精簡特征空間。接下來使用偏二叉樹方法構(gòu)建支持向量機(jī)多分類模型。最后通過實(shí)驗(yàn)數(shù)據(jù)進(jìn)行模型驗(yàn)證,結(jié)果表明該方法可以實(shí)現(xiàn)滾動軸承故障模式分類。主要結(jié)論有3個(gè)。

(1)運(yùn)用故障敏感IMF選取方法可以有效篩選出與故障敏感度高的IMF,提高特征量空間合理性。

(2)馬田系統(tǒng)可以高效地剔除冗余變量,使構(gòu)建的精簡特征空間更加的合理。

(3)構(gòu)造了改進(jìn)的偏二叉樹SVM結(jié)構(gòu),并采用類間距離法來確定二叉樹的結(jié)構(gòu),該結(jié)構(gòu)可以高效地判斷故障類型并確定故障的受損程度,提高模型的效率和預(yù)測精度。

猜你喜歡
二叉樹分類變量
CSP真題——二叉樹
二叉樹創(chuàng)建方法
分類算一算
抓住不變量解題
也談分離變量
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
一種由層次遍歷和其它遍歷構(gòu)造二叉樹的新算法
SL(3,3n)和SU(3,3n)的第一Cartan不變量
漳浦县| 泰兴市| 南华县| 格尔木市| 蒙山县| 福鼎市| 通江县| 静安区| 万源市| 攀枝花市| 正镶白旗| 武冈市| 保康县| 衡山县| 寿光市| 苍山县| 潮安县| 息烽县| 湘潭市| 连城县| 宜春市| 丹阳市| 宁武县| 沾益县| 双牌县| 广灵县| 石阡县| 明光市| 平乡县| 湘潭县| 额尔古纳市| 嘉荫县| 白玉县| 南皮县| 绥宁县| 达日县| 霍州市| 藁城市| 长阳| 万山特区| 镇坪县|