李國慶,侯國安,張 浩
(銀川能源學(xué)院,寧夏 銀川 750015)
隨著現(xiàn)代工業(yè)的發(fā)展,工業(yè)由原來的簡單控制系統(tǒng)發(fā)展為復(fù)雜的智能化控制系統(tǒng),齒輪箱是現(xiàn)代化機(jī)械設(shè)備中最常用到的動(dòng)力部件,主要起傳遞運(yùn)動(dòng)和調(diào)配速度的作用。齒輪箱一旦發(fā)生故障,整個(gè)機(jī)械設(shè)備就會(huì)因此而無法正常運(yùn)行或無法保證運(yùn)行精度,從而造成巨大經(jīng)濟(jì)損失[1]。
現(xiàn)今,數(shù)據(jù)挖掘[1]已成為一種新的知識發(fā)現(xiàn)方法,在工程診斷領(lǐng)域的發(fā)展日益重要,在監(jiān)測診斷項(xiàng)目方面,許多國家和研究機(jī)構(gòu)都已開始了對數(shù)據(jù)挖掘的研究和應(yīng)用[2]。
軸承的故障一般表現(xiàn)為軸承疲勞剝落和點(diǎn)蝕,外圈故障和內(nèi)圈故障[4]。
(1)軸承疲勞剝落和點(diǎn)蝕的主要特征:在其頻譜中高頻區(qū)外環(huán),固有頻率附近出現(xiàn)明顯的調(diào)制峰群,產(chǎn)生以外環(huán)固有頻率為載波頻率,以軸承通過頻率為調(diào)制頻率的固有頻率調(diào)制現(xiàn)象;由于滾動(dòng)軸承在變速箱中產(chǎn)生的振動(dòng)與齒輪振動(dòng)相比能量較小,解調(diào)譜中調(diào)制頻率幅值較小,一般只出現(xiàn)一階[5]。
(2)外圈故障特征:在轉(zhuǎn)頻、外滾道特征頻率及其高倍頻處有明顯的譜線。
(3)內(nèi)圈故障特征:在轉(zhuǎn)頻、內(nèi)滾道特征頻率及其高倍頻處有明顯的幅值下降的譜線。
軸的主要故障有軸向竄動(dòng)、軸不平衡和軸嚴(yán)重彎曲。
(1)軸向竄動(dòng)故障的主要特征:故障軸上齒數(shù)多的齒輪嚙合頻率的幅值大幅度增加;振動(dòng)能量(包括有效值和峭度指標(biāo))有較大程度的增加[6]。
(2)軸不平衡故障的主要特征:以齒輪嚙合頻率、諧波為載波頻率,齒輪所在軸轉(zhuǎn)頻、倍頻為調(diào)制頻率的嚙合頻率調(diào)制,調(diào)制邊頻帶數(shù)量少而稀,解調(diào)譜上一般只出現(xiàn)所在軸的轉(zhuǎn)頻;故障軸的轉(zhuǎn)頻成分有較大程度的增加;振動(dòng)能量(包括有效值和峭度指標(biāo))有一定程度的增加,包絡(luò)能量有一定程度的增加。
(3)軸嚴(yán)重彎曲故障的主要特征:以齒輪嚙合頻率、諧波、齒輪固有頻率、箱體固有頻率為載波頻率,以齒輪所在軸轉(zhuǎn)頻為調(diào)制頻率的嚙合頻率調(diào)制,如果彎曲軸上有多對齒輪嚙合,則會(huì)出現(xiàn)多對嚙合頻率調(diào)制,譜圖上邊帶數(shù)量較寬,解調(diào)譜上出現(xiàn)所在軸的轉(zhuǎn)頻和多階高次諧波;振動(dòng)能量(包括有效值和峭度指標(biāo))有較大程度的增加,包絡(luò)能量有大幅度的增加。
粒子群優(yōu)化是1995年提出的,Kennedy博士是首位研究者,他是源于對遷徙類覓食過程,通過觀察鳥類的遷移和群居的擬態(tài)[7]。其數(shù)學(xué)表達(dá)方式描述為:Pd=(Pd1Pd2…Pdn),V=(Vi1Vi2…Vin),Pi=(Pi1Pi2…Pin),X=(Xi1Xi2…Xin)。
設(shè)目標(biāo)為d維,種群由m構(gòu)成,每個(gè)粒子按照此式:
vid(t+1)=vid(t)+c1r1(pid-xid(t))+c2r2(pgd-xid(t))
(1)
所有的值都要大于零,其中i取值[1,M],r1,r2是在[0,1]范圍,d的取值[1,D],c1,c2為加速因子,c1=c2=2ptd,表示最優(yōu)的位置;在實(shí)際的工程應(yīng)用速度之前要乘以系數(shù)ω,通常粒子的速度迭代公式(1),pxtd(t)表示現(xiàn)在的方位;ω取值范圍為0.1~0.9之間。
條件屬性的個(gè)數(shù)為T,根據(jù)粗糙集理論[8]中粒子群優(yōu)化算法,基于決策表的成型的構(gòu)成特點(diǎn),實(shí)際應(yīng)用中將連續(xù)屬性離散化,并且是每一個(gè)屬性都要一一的進(jìn)行離散化[9]。
定義:設(shè)斷點(diǎn)個(gè)數(shù)h,則起初位置是h×t的矩陣向量。
粗糙集理論粒子群優(yōu)化算法中的速度公式表示如下:
v(t+1)=wv(t)+c1r1(pbest-p(t))+c2r2(Gbest-p(t))
(2)
p(t+1)=p(t)+v(t)
(3)
粒子群優(yōu)化的基礎(chǔ)理論是粗糙集理論的核心基礎(chǔ),對于這點(diǎn)不足,導(dǎo)致屬性歸類效果難以分辨[10]。
粗糙集理論的基礎(chǔ)是它的決策能力,通過對Na?ve Scaler算法的靈活應(yīng)用也可以發(fā)現(xiàn)基本與粒子優(yōu)化沒有關(guān)系,依據(jù)決策屬性值選取斷點(diǎn)值。
但是,有可能兩個(gè)決策值不同,隨著信息的組合不同會(huì)被除去。為了處理類似情況,其中改進(jìn)的 Naive Scaler算法[11]可以在原來的NS算法中加入一個(gè)步驟,具體如下:
(1)每一個(gè)a的大小組合,a∈C,根據(jù)(xi)的值,仍記xi,…x,不失一般性,并將樣本保留1個(gè)以方便決策;
(2)如果D(xi)D(xi+1)≠a(xi)a(xi+1),得到一個(gè)斷點(diǎn)c,取c=(a(xi)+a(xi+1))/2。
如果a(xi)≠a(xi+1)且D(xi)=D(xi+1),a(xi+1)=a(xi+2)且D(xi+1)D(xi+2),則得到一個(gè)斷點(diǎn),取c=(a(xi)+a(xi+2))/2。
如果a(xi)=a(xi+1)且D(xi)=D(xi+1)且屬性值與決策值都相同的樣本只保留一個(gè),D(xi)≠D(xi+1),a(xi+1)≠a(xi+2),則得到一個(gè)斷點(diǎn),取,c=(a(xi)+a(xi+2))/2,加入兩條計(jì)算斷點(diǎn)的規(guī)則。
分析上述過程,在所得不相同理論值之間的理論算法和屬性相結(jié)合的離散化算法中都找到了數(shù)量不等的斷點(diǎn),在進(jìn)行屬性約簡[12]后改進(jìn)的NS算法中,離散化的斷點(diǎn)個(gè)數(shù)數(shù)量就會(huì)大大的減少,這樣就有利于計(jì)算生成規(guī)則[13]。
表1的數(shù)據(jù)是利用敏感元件進(jìn)行對齒輪箱故障詳細(xì)診斷所得到的基本數(shù)據(jù)情況,決策屬性D分別用1、2、3、4、5、6表示齒輪箱故障的六種情況:良好、內(nèi)圈劃傷、外圈剝落、保持架壞、齒面磨損、崩齒;C={a,b,c,d,e}為條件屬性,U代表論域,通過HS算法分解后,得到能夠代表不同情況的數(shù)值,總共二十個(gè)樣本,每種情況取三到四個(gè)樣本。下面分別采用基于改進(jìn)NS的全局尋優(yōu)的離散化算法對該決策表進(jìn)行離散化。
表1 連續(xù)屬性決策
表2 改進(jìn)NS的斷點(diǎn)集
計(jì)算離散化前條件:
X1={x1},X2={x2},X3={x3},X4={x4},X5={x5},X6={x6},X7={x7},X8={x8},X9={x9},…X20={x20}。
計(jì)算離散化前決策的屬性:
D1={x1,x2,x3,x5},D2={x6,x7,x8,x9,x10},D3={x11,x12,x13,x14,x15,x16},D4={x17,x18,x19,x20}。
則POSc(D)={x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12,x13,x14,x15,x16,x17,x18,x19,x20}。
各個(gè)條件屬性的斷點(diǎn)集用改進(jìn)的NS算法計(jì)算,0.5528,0.3979,0.5712,0.3618,0.16322通過選取原則各取一個(gè)斷點(diǎn),NS算法得出的決策表見表3。
表3 離散化后的決策表
Pawlak屬性約簡算法的公式如下:
sig(a;B;D)=γ(B)-γb-(a)(D)
sig(a;B;D)={card(posIND(B)(D))-card(posIND(B-(a))(D))}/card(posIND(B)(D))
可根據(jù)公式直接證明定理[15],具體從略。
D核B=core(D)={a,b};
U/IND(c)={{1},{2}…{20}};
U/IND(D)={{1,2,3,4};{5,6,7};{8,9,10,11};{12,13,14};{15,16,17};{18,19,20}};
U/IND(B)={{1,2,3,12,13,14,17};{5,6,8,10,11,15,18,19};{4,7,9,16,20};{12,13,14};{15,16,17};{18,19,20}};
U/IND(B∪{c})={{1,2,3,12,13,14,17};{5,6,8,10,11,15,18,19};{4,7,9,16,20}};
U/IND(B∪syggg00)={{1,2,3,12,13,14,17};{5,6,8,10,11,15,18,19};{4,7,9,16,20}};
U/IND(B∪{e})={{14};{6,8,10};{1,2,3,4,5,7,9,12,17,16,20,11,15,18,19}}。
根據(jù)上述可得:
posB(D)=B{x}={1,2,3,12,14,17};
posB∪(c)={1,2,3,12,14,17};
posB∪(d)={1,2,13,14,17};
posB∪(e)={14}。
由此可以消除d、e,得到化簡后的決策表4。
表4 化簡后的決策表
計(jì)算條件屬性等價(jià)類:
X1={x1},X2={x1,x5},X3={x3},X4={x4},X5={x6,x7,x8,x9,x10},X6={x11,x12},X8={x14},X9={x16,x17,x18,x19,x20}。
最終的離散化決策表就是表4。
當(dāng)且φ≠∩[t]∈B,集合T是B的最小決策值,即最小值約簡。
該表存在5個(gè)決策值:(D,1),(D,2),(D,3),(D,5),(D,6),D1=(D,1)={1,2},D2={5},D3={9},D5={16},D6={20}。
該表的每個(gè)屬性有兩個(gè)屬性值對,共有八個(gè):(a,0),(a,1),(b,0)(b,1),(c,0),(c,1),(d,o),(d,1)。
為便于表示,用A0,A1,B0,B1,C0,C1,D0,D1表示。
A0=(a,0)={1,4,20};A1={5,9,11};B0={1,9,16};B1={4,5,20};C0={1,4,16};C1={5,9,20};D0={1,16};D1={1,4,16}。
可以根據(jù)定義逐個(gè)看條件屬性的不可分辨關(guān)系以及組合求解。
A0≠D1,A0≠D2,A0≠D3,A0≠D,A0≠D6,同理A1,B0,B1,C1,C0,D0,D1均無法推導(dǎo)出規(guī)則。
變換組合求解得以下規(guī)則:
表5 規(guī)則表
由此推斷出新的診斷規(guī)則,也可知道粗糙集理論的診斷優(yōu)勢。本文只針對齒輪箱內(nèi)部主要事故進(jìn)行分析,此規(guī)則也只是適用于集中且大量出現(xiàn)的故障。
經(jīng)過數(shù)據(jù)挖掘算法的粗糙集理論得出了一種診斷規(guī)則,我們需要對其進(jìn)行驗(yàn)證。把訓(xùn)練樣本數(shù)據(jù)處理后代入得出的規(guī)則中,進(jìn)行準(zhǔn)確率驗(yàn)證。
表6 待驗(yàn)證離散化表
采用10組驗(yàn)證數(shù)據(jù),由表7驗(yàn)證表得出,診斷規(guī)則準(zhǔn)確率為90%。
表7 驗(yàn)證表
通過差別矩陣和決策樹得出的診斷規(guī)則準(zhǔn)確率為80%。
由此得出粗糙集理論中改進(jìn)的Na?ve Scaler屬性約簡算法和基于決策間不可分辨關(guān)系的值約簡算法得出的診斷規(guī)則優(yōu)于決策樹和差別矩陣所得出的規(guī)則。所以,此次改進(jìn)的算法具有一定的可行性和實(shí)用性。
在全局動(dòng)態(tài)尋優(yōu)離散化算法中,改進(jìn)Na?ve Scaler算法能夠得到所有保證不可分辨關(guān)系的斷點(diǎn),通過斷點(diǎn)均分樣本集、逐漸增加斷點(diǎn),動(dòng)態(tài)地選擇斷點(diǎn)集,在信息系統(tǒng)分類能力不改變的情況下,使斷點(diǎn)個(gè)數(shù)最少,最終得出診斷規(guī)則;和決策樹的數(shù)據(jù)挖掘算法進(jìn)行比較,表明改進(jìn)Na?ve Scaler算法的全局動(dòng)態(tài)尋優(yōu)離散化算法準(zhǔn)確率較高,說明該算法有一定的優(yōu)越性和有效性。