高紅霞,郜 偉
(1.河南工程學(xué)院 計算機學(xué)院,鄭州 451191;2.信息工程大學(xué) 理學(xué)院,鄭州 450001)
?
基于不完全信息的軸承故障聚類識別方法
高紅霞1,郜偉2
(1.河南工程學(xué)院 計算機學(xué)院,鄭州451191;2.信息工程大學(xué) 理學(xué)院,鄭州450001)
摘要:聯(lián)合收獲機中零部件繁多及滾珠滑失等因素,導(dǎo)致監(jiān)測信號中軸承組件的特征頻率并非總能找到,進而影響了故障診斷的正確率。為了解決該問題,提出了一種基于不完全信息的軸承故障聚類識別方法。該方法將特征頻率顯著的樣本作為先驗信息,利用這些信息進行相關(guān)成分分析,從而給相關(guān)程度高的特征賦予大的權(quán)重,然后利用改進的半監(jiān)督聚類算法對所有樣本進行聚類識別。其中,提出了近鄰擴展方法對先驗信息進行擴充,增加了目標(biāo)函數(shù)懲罰環(huán)節(jié)對聚類過程予以指導(dǎo)。將所提方法應(yīng)用于聯(lián)合收獲機的軸承滾珠和外圈故障識別,與其它幾種聚類方法相比,故障識別率提高了2.78%~7.22%。
關(guān)鍵詞:谷物聯(lián)合收獲機;故障診斷;先驗信息;半監(jiān)督聚類
0引言
谷物聯(lián)合收獲機能夠高效完成農(nóng)作物的收割、脫粒、分離、清選及秸稈處理等一系列任務(wù),是現(xiàn)代農(nóng)業(yè)生產(chǎn)中常見的一種大型自動化設(shè)備[1-3]。其中,軸承部件在該設(shè)備的傳動、行走和控制等裝置中被大量地使用,是一類影響設(shè)備運行狀態(tài)的重要部件。尤其在脫粒裝置上用到的滾筒軸承,不僅影響脫粒的效果,而且由于在惡劣工況下工作,屬于設(shè)備中的易損件。因此,有效監(jiān)測滾筒軸承部件的運行狀態(tài),對聯(lián)合收獲機的正常運行具有重要意義[4]。目前,軸承故障診斷的一個重要方法是通過識別其組成部件(滾動體、保持架、內(nèi)圈、外圈)之間相互碰撞而產(chǎn)生的特征頻率來完成識別;但在實際監(jiān)測過程中,得到的振動信號中并非總是可以找到對應(yīng)的特征頻率,而是表現(xiàn)為時有時無的情況。造成這一情況的原因主要有兩方面:①傳感器只能在軸承表面獲取信號,整個聯(lián)合收獲機設(shè)備中存在的干擾信號也比較大,使得特征頻率對應(yīng)的信號時常被淹沒;②軸承中的滾動體在運行過程中容易發(fā)生滑失,使得與其余部件碰撞而產(chǎn)生的特征頻率缺失,使得特征頻率不顯著的信號片段難以被識別,從而影響了整體的診斷效果。
信號中特征頻率顯著的片段實際是可以用來幫助提高整體診斷效果的[5]。因為其對應(yīng)的故障狀態(tài)易于判別,從而可將它們作為狀態(tài)已知的先驗信息,然后與未知狀態(tài)的信號片段混合,再利用常見的頻域特征來進行識別,這是一種半監(jiān)督的聚類或分類方法,目前已有一些學(xué)者進行了相應(yīng)的探索和研究[6]。畢錦煙等人[7]提出一種半監(jiān)督模糊核聚類算法用于齒輪輕微點蝕故障的檢測。徐超等人[8]則提出一種半監(jiān)督模糊聚類算法用于發(fā)動機磨損故障的檢測。他們均是直接對目標(biāo)函數(shù)進行改造,但特征空間中各個特征對數(shù)據(jù)識別的作用通常是不一的,不能很好利用距離機制來評價樣本的相似程度。為此,提出了一種基于不完全信息的聚類方法(Clustering Approach based on Partial Information,CAPI)用于軸承故障的識別。該方法在兩方面利用了已知樣本的信息:①利用已知樣本對特征空間進行變換,從而實現(xiàn)距離機制的學(xué)習(xí),以便更好地評價各個樣本之間的相似程度;②利用近鄰原則先對已知樣本進行擴充,再將擴充后的已知樣本用于目標(biāo)函數(shù)的設(shè)計。最后,在某型小麥聯(lián)合收獲機滾筒軸承的滾珠輕微損傷故障及滾珠損傷和外圈損傷復(fù)合故障的識別中,驗證了所提方法的有效性。
1基于先驗信息的距離學(xué)習(xí)方法
將監(jiān)測得到的信號分為若干段,每段信號即對應(yīng)一個樣本,假設(shè)一共有n個樣,C類狀態(tài)。其中,第i個類有nil個已知樣本、niu個未知樣本。CAPI首先對數(shù)據(jù)集X中的已知樣本進行相關(guān)成分分析[9],得到變換矩陣W,從而將所有樣本取值進行轉(zhuǎn)換,即xnew,j=Wxj,xj=(xj1,xj2,…,xjd),d為特征總數(shù)。其具體步驟如下:
1)計算第i個類已知樣本的均值vil,則
(1)
2)計算各類已知樣本對應(yīng)的協(xié)方差矩陣Cor,有
(2)
3)計算變換矩陣W,則
(3)
變換矩陣是一個將有用特征顯現(xiàn)的過程。它給一些特征賦予大的權(quán)重,因為這些特征對類的區(qū)分有重要作用;而在其余特征上樣本取值的變化主要是由于各類內(nèi)部取值波動引起的,對類的區(qū)分并無貢獻,則賦予小的權(quán)重。
2改進的半監(jiān)督聚類算法
改進的半監(jiān)督聚類算法是在轉(zhuǎn)換后的特征空間下進行的,它在目標(biāo)函數(shù)中融入了已知樣本的約束,還在求解過程中利用粒子群算法克服了K均值聚類易陷入局部極值的缺點。
2.1近鄰擴展策略
近鄰擴展策略是根據(jù)相鄰樣本的狀態(tài)很可能相同的原理設(shè)計的。其具體操作步驟為:
1)對于數(shù)據(jù)集Xnew中的每一個已知狀態(tài)的樣本,按照歐式距離的取值找出其k個近鄰樣本;
2)若近鄰樣本y本身即為已知樣本,則不做任何操作;
3)否則,若近鄰樣本y只是一個已知樣本的近鄰,則令其所屬的類標(biāo)號與已知樣本的類標(biāo)號相同;
4)若近鄰樣本y同時是多個已知樣本的近鄰,則計算各個已知樣本與近鄰樣本y的歐式距離,找出其中最小距離對應(yīng)的已知樣本,記為x*,近鄰樣本y的類標(biāo)號,即與x*的類標(biāo)號相同。通過近鄰擴展策略,使得已知樣本的信息得以盡可能地被發(fā)掘,從而加強已知信息對聚類結(jié)果的影響[10]。
2.2目標(biāo)函數(shù)懲罰機制的設(shè)計
由于已知部分樣本的類別標(biāo)記,本文在設(shè)計的目標(biāo)函數(shù)中引入了懲罰機制。若已知樣本被錯誤的劃為其它類別,則增大目標(biāo)函數(shù)值,否則不影響函數(shù)取值。又由于近鄰擴展策略中得到的已知樣本具有一定的不可靠性,為了規(guī)避該風(fēng)險,若擴展所得已知樣本被錯誤劃分時,則依據(jù)k近鄰的次序給出不同程度的懲罰。設(shè)計的目標(biāo)函數(shù)為
(4)
其中,uij取值為1或0,表示第j個樣本是否被劃分到第i個類;vi為第i個類的中心;L表示未擴展時已知樣本構(gòu)成的集合;KL為擴展過程中產(chǎn)生的已知樣本構(gòu)成的集合。當(dāng)樣本屬于集合L且被錯誤劃分時,D1(xnew,ij)取值為1,否則取值為0;當(dāng)樣本屬于集合UL時,D1(xnew,ij)按相同方式取值。其中,k值表示樣本xnew,ij在近鄰擴展策略中所對應(yīng)的近鄰順序。若為最近鄰,則k值為1,次近鄰則為2,依次增大。
每次迭代后所有樣本的劃分按照歐式距離最近的原則進行,則
(5)
其它各類中心向量的更新為
(6)
2.3基于粒子群算法的聚類過程實現(xiàn)
利用粒子群算法來優(yōu)化所提目標(biāo)函數(shù),并采用聚類中心的實數(shù)編碼方式,個體zi=(zi1,zi2,…,zim)。其中,m為總的編碼長度,取值為m=Cd,即每d個基因位對應(yīng)一個類的中心向量,一共有C個類。個體zi中每個基因位的取值均為0和1之間的實數(shù),所以在計算前所有樣本均要歸一化到0,1范圍內(nèi)。粒子群算法的算子為
(7)
其中,vecijt表示個體zi在基因為j上的速度;t表示代數(shù);zi*表示個體zi在其進化歷史中所發(fā)現(xiàn)的目標(biāo)函數(shù)值最小時所對應(yīng)的個體;zgt表示目前種群中已發(fā)現(xiàn)的目標(biāo)函數(shù)值最小的個體,wI為慣性權(quán)重;c1、c2、r1和r2則為權(quán)重系數(shù)。
此外,為了抑制種群早熟和提高種群的多樣性,本文采用了每間隔一定代數(shù)t0即選擇一定比例的較差個體并重新生成。其具體操作方式為:將種群按照目標(biāo)函數(shù)取值降序排列,選取前q個個體,令其每個基因位的取值在0,1之間隨機生成。
基于上述改進,CAPI的運行流程為:
1)將正常工況下樣本標(biāo)記為已知樣本,并找出監(jiān)測信號中特征頻率顯著的樣本,對應(yīng)到相應(yīng)故障狀態(tài)中,也標(biāo)記為已知樣本,而剩余樣本則為未知樣本;
2)利用所有已知樣本進行相關(guān)成分分析,從而將所有樣本在特征空間中進行轉(zhuǎn)換;
3)將已知樣本進行近鄰擴展;
4)對擴展后的樣本進行基于粒子群算法的聚類,目標(biāo)函數(shù)值最小個體對應(yīng)的即為聚類的最終結(jié)果,根據(jù)未知樣本和擴展所得已知樣本被劃分的聚類標(biāo)號,即得到它們對應(yīng)的故障狀態(tài)。
3實驗結(jié)果與分析
實驗采用雷沃谷神4LZ-2.5E系列自走小麥聯(lián)合收獲機為研究對象,測試其滾筒軸承徑向的振動加速度信號。一共測試了3種狀態(tài):正常狀態(tài)、滾珠有輕微凹坑的狀態(tài)及外圈和滾珠均有輕微凹坑的狀態(tài)。每種狀態(tài)均得到了60個樣本,正常狀態(tài)在設(shè)備早期使用過程中獲得,全部為已知的樣本;而后兩種狀態(tài)通過包絡(luò)譜分析,找出特征頻率顯著的樣本分別有22個和29個,即為已知樣本,其余則為未知樣本。圖1~圖4是兩種故障狀態(tài)中未知樣本的時域和頻域圖。
圖1 滾珠故障未知樣本的時域信號
圖2 滾珠故障未知樣本的頻域信號
圖3 滾珠和外圍復(fù)合故障未知樣本的時域信號
圖4 滾珠和外圍復(fù)合故障未知樣本的頻域信號
從圖1~圖4中可以看出:這些樣本在時域信號中難以區(qū)分,而在頻域信號中盡管缺乏特征頻率,但其頻譜仍然存在一些不同。所以,本文按照文獻[11]提出的7個頻域特征來構(gòu)建相應(yīng)的特征空間,用以識別未知樣本。這7個頻域特征具體是平均頻率、波形穿過時域信號平均值的平均頻度、波形的穩(wěn)定系數(shù)、變異系數(shù)、頻域偏斜度、峭度和均方根比。
為了更好地說明所提各項改進的性能,本文設(shè)置了3個對比算法,分別為:
1)先對數(shù)據(jù)進行主成分分析,然后按照貢獻率超過85%的標(biāo)準(zhǔn)構(gòu)建新的投影空間,再對其按照本文所提目標(biāo)函數(shù)和粒子群方法來進行聚類,該方法稱為PCACA;
2)目標(biāo)函數(shù)中不加入關(guān)于已知樣本的懲罰項,其余保持和CAPI方法一致,稱為CAPI1;
3)不進行已知樣本的近鄰擴展,其余保持和CAPI方法一致,稱為CAPI2。
本文將所有算法中所需參數(shù)設(shè)置為:近鄰擴展策略中的k值設(shè)為1,種群大小為50,一共進化80代,慣性權(quán)重設(shè)為0.79,c1為2,c2為1.6,r1和r2為0和1之間的隨機數(shù),速度vec的最大和最小值為2.1和-2.1,每隔10代選取目標(biāo)函數(shù)值最差的5個個體重新隨機生成。表1給出了各種算法將所有樣本進行分類的正確率和虛警率(正常樣本判為故障樣本的比率),以及將未知樣本分類的漏報率(未知故障樣本判別為正常樣本的比率)和誤報率(將未知故障樣本的故障類型判別為其它故障類型的比率)。
表1 4種算法的對比測試結(jié)果
由表1的測試結(jié)果可知:CAPI具有最高的正確率,其正確率相比其它3種算法分別提高了2.78%、7.22%和5.55%。CAPI還具有最低的虛警率、漏報率及誤報率,其與另外3種算法相比,虛警率、漏報率和誤報率最多降低了2.22%、5.79%和5.80%,并且CAPI所得虛警的樣本個數(shù)為0。CAPI與PCACA的對比結(jié)果表明:基于已知樣本信息的特征空間轉(zhuǎn)換方法比無監(jiān)督的PCA方法更有效力:而CAPI與CAPI1、CAPI2的對比結(jié)果說明:本文對目標(biāo)函數(shù)的改進及提出的近鄰擴展策略對未知樣本的正確識別有顯著的促進作用。
4結(jié)論
提出了一種針對聯(lián)合收獲機滾筒軸承故障的半監(jiān)督聚類識別方法。其中,在先驗信息的利用中,提出了兩種具體實現(xiàn)方式,分別為用已知樣本對數(shù)據(jù)特征空間進行變換和對目標(biāo)函數(shù)進行改造,還提出在樣本利用中可借助近鄰概念擴充已知樣本的數(shù)量。所提方法的有效性在小麥聯(lián)合收獲機的軸承故障識別實驗中得以驗證。它們對提高故障識別的正確率,降低虛警率、漏報率和誤報率具有重要作用。同時,實驗結(jié)果表明:基于相關(guān)成分分析的特征空間重構(gòu)方法顯著提高了算法的性能,為半監(jiān)督聚類算法中已知信息的利用提供了一條有效的途徑。
參考文獻:
[1]梁喜鳳,楊犇,王永維.番茄收獲機械手軌跡跟蹤模糊控制仿真與試驗[J].農(nóng)業(yè)工程學(xué)報,2013, 29(17):16-23.
[2]閆鵬程,連光耀,劉曉芹,等.基于多故障模糊組的序貫多故障診斷方法[J].計算機測量與控制, 2012, 20(1):34-37.
[3]侯衛(wèi)平,鐘蘇麗,劉曉輝,等.農(nóng)業(yè)機械發(fā)動機曲軸主軸承負(fù)荷特性研究[J].農(nóng)機化研究, 2011, 33(5):222-225.
[4]胡榮華,樓佩煌,唐敦兵,等.基于EMD和免疫參數(shù)自適應(yīng)SVM的滾動軸承故障診斷[J].計算機集成制造系統(tǒng),2013,19(2):438-447.
[5]高宏賓,侯杰,劉勁飛.分布式密度和中心點數(shù)據(jù)流聚類算法的研究[J].計算機應(yīng)用與軟件,2013, 30(10):181-184.
[6]樊帆,徐亞兵.基于半監(jiān)督聚元自組織映射的齒輪早期故障檢測[J].機械傳動,2011,35(11):66-70.
[7]畢錦煙,李巍華.基于半監(jiān)督模糊核聚類的齒輪箱離群檢測方法[J].機械工程學(xué)報,2009, 45(10):48-52.
[8]徐超,張培林,任國全,等.基于改進半監(jiān)督模糊C-均值聚類的發(fā)動機磨損故障診斷[J].機械工程學(xué)報, 2011,47(17):55-60.
[9]Tenenbaum J B, Freeman W T. Separating style and content with bilinear models[J]. Neural Computation, 2000,12(6):1247-1283.
[10]郝曉麗,張靖.基于改進自適應(yīng)聚類算法的RBF神經(jīng)網(wǎng)絡(luò)分類器設(shè)計與實現(xiàn)[J].計算機科學(xué),2014,41(6):260-263.
[11]軒建平,史鐵林,廖廣蘭,等.利用遺傳編程提取齒輪多重故障分類特征[J].振動工程學(xué)報,2006,19(1):70-74.
Abstract ID:1003-188X(2016)02-0058-EA
A Clustering Approach Based on Partial Information for Recognizing Bearing Fault
Gao Hongxia1, Gao Wei2
(1.College of Computer, Henan Institute of Engineering, Zhengzhou 451191, China; 2. Institute of Sciences, Information Engineering University, Zhengzhou 450001, China)
Abstract:Due to the reasons of too many components in combine harvester and the skid of rolling balls, the characteristic frequencies of bearing assembly in monitoring signals are not always clearly existing, which causes the low accuracy of fault diagnosis. Hence, a clustering approach based on partial information is proposed to tackle this problem. This approach sets these samples with clearly characteristic frequencies as priori information, and then uses them to make relevant component analysis to high weights to relevant dimensions. This approach also design an advanced clustering algorithm to recognize all the samples, wherein an extension strategy based on neighborhood is presented to obtain more priori information, and a penalty step is added to the objective function to guiding the clustering. The fault data on ball and outer race of bearing of a combine harvester is used to validate the proposed approach. The results show that our proposed approach works better than others, where the recognition accuracy is higher than others from 2.78% to 7.22%.
Key words:combine harvester; fault diagnosis; priori information; semi-supervised clustering
文章編號:1003-188X(2016)02-0058-04
中圖分類號:S232.8+1
文獻標(biāo)識碼:A
作者簡介:高紅霞(1978-),女,河南開封人,講師,碩士,(E-mail) gaohx78@126.com。
基金項目:國家自然科學(xué)基金項目(61301232);河南省基礎(chǔ)與前沿技術(shù)研究計劃項目(142300410131)
收稿日期:2015-01-16