劉兆政,肖明清,胡陽光,2,李劍峰,王俊東
(1.空軍工程大學(xué) 航空工程學(xué)院,西安 710038; 2.西北工業(yè)大學(xué) 航天學(xué)院,西安 710072;3.中國人民解放軍 95920部隊(duì),河北 衡水 253801)
隨著科技的不斷發(fā)展,機(jī)械自動(dòng)化水平不斷提高,機(jī)械功能的滿足需要提高系統(tǒng)復(fù)雜程度才能實(shí)現(xiàn)。近些年復(fù)雜機(jī)械產(chǎn)生的機(jī)械故障也導(dǎo)致事故案件的頻繁發(fā)生,保障工程機(jī)械設(shè)備的安全穩(wěn)定運(yùn)行成為亟待解決的問題[1]。現(xiàn)代機(jī)械的使用環(huán)境多樣,工作狀況復(fù)雜,機(jī)械結(jié)構(gòu)往往呈現(xiàn)出狀態(tài)信息不完備的形態(tài),導(dǎo)致描述工程機(jī)械故障診斷的數(shù)據(jù)存在不完備的信息。
相關(guān)學(xué)者對(duì)于不完備條件下的機(jī)械故障診斷涉及多個(gè)方面的研究,張錚提出粗糙集理論,對(duì)不完備故障信息進(jìn)行屬性約簡(jiǎn),建立智能故障診斷模型,為復(fù)雜設(shè)備的故障診斷提供了新的方法[2];周頔將對(duì)不完備數(shù)據(jù)進(jìn)行完備化之后,利用蟻群算法優(yōu)化神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)系統(tǒng)故障診斷[3];陳士剛等利用多重支持向量域?qū)Ω邏焊綦x開關(guān)進(jìn)行不完備故障類別下的故障診斷[4]。不完備下的機(jī)械故障診斷方法大多從數(shù)據(jù)處理分析的角度進(jìn)行算法優(yōu)化,缺少故障位置之間的圖形化直觀展示。
流向圖理論是波蘭學(xué)者Z.P.在2003年的粗糙集理論國際會(huì)議上提出的[5],是一種將故障征兆屬性值故障類型圖形化表達(dá)的新方法,并運(yùn)用于機(jī)器學(xué)習(xí)、模式識(shí)別、系統(tǒng)分析等各種專業(yè)領(lǐng)域的研究。許志銘等人通過流向圖完成對(duì)柴油機(jī)箱的故障診斷研究[6];黃文濤等人將流向圖應(yīng)用于數(shù)據(jù)挖掘以及決策規(guī)則提取[7];于軍等利用流向圖進(jìn)行齒輪箱故障診斷的知識(shí)發(fā)現(xiàn)[8]。流向圖的廣泛運(yùn)用對(duì)于不完備信息下的故障診斷,具有較好前景。
傳統(tǒng)的導(dǎo)彈故障診斷主要是利用有限的診斷知識(shí)并結(jié)合領(lǐng)域?qū)<业慕?jīng)驗(yàn)得到診斷的結(jié)果,而診斷知識(shí)的不完備性給診斷的過程帶來極大問題。由于導(dǎo)彈具有“長(zhǎng)期貯存,一次使用”的特點(diǎn),可以獲得的故障診斷數(shù)據(jù)有限,如何充分利用有限的不完備故障診斷知識(shí)對(duì)故障進(jìn)行分類和獲取,是研究的熱點(diǎn)問題。
這些研究方法都是流向圖的具體運(yùn)用,針對(duì)故障診斷的具體問題,可以將診斷推理的流程圖形化表述,獲得準(zhǔn)確有效的故障診斷知識(shí),為不完備條件下刻畫故障原因和故障征兆之間的關(guān)系提供更為清晰的展現(xiàn)。本文首先分析不完備信息系統(tǒng)的定義,并具體說明一個(gè)不完備信息系統(tǒng)的主要構(gòu)成要素;然后根據(jù)特征關(guān)系對(duì)不完備故障診斷信息進(jìn)行處理,提高導(dǎo)彈故障診斷實(shí)例分類的準(zhǔn)確率;最后,利用不完備信息流向圖對(duì)其進(jìn)行知識(shí)獲取,計(jì)算路徑的置信度和覆蓋度,得到最終的完整路徑,為導(dǎo)彈的故障診斷工作提供有效參考。
不完備信息系統(tǒng)是對(duì)比傳統(tǒng)信息系統(tǒng)而言的,傳統(tǒng)信息系統(tǒng)通常都是完備的,即一個(gè)對(duì)象在確定屬性下的取值是存在且唯一的,而現(xiàn)實(shí)的系統(tǒng)往往會(huì)因?yàn)楦鞣N問題,造成數(shù)據(jù)的偏差、對(duì)數(shù)據(jù)的定義不準(zhǔn)確等情況,進(jìn)而產(chǎn)生不完備信息系統(tǒng),例如在齒輪箱系統(tǒng)中,由于零件極易發(fā)生各種類型的故障,但故障產(chǎn)生的原因各有不同,因此采集到的齒輪箱故障診斷信息就是存在偏差的不完備信息[9]。
對(duì)比傳統(tǒng)的完備狀態(tài)下的信息系統(tǒng),即一個(gè)任意屬性值在確定條件下的取值是存在且唯一的,可以得到不完備故障診斷信息系統(tǒng)的定義是指由于信息獲取的過程中出現(xiàn)機(jī)械故障,或者在信息傳遞的過程中出現(xiàn)錯(cuò)誤的診斷信息,而導(dǎo)致缺失屬性值的情況,形成不完備故障診斷信息系統(tǒng)。類比完備信息系統(tǒng)的定義,可以得到對(duì)于不完備信息系統(tǒng)的定義如下:
建立完備一個(gè)不完備信息系統(tǒng),一個(gè)四元組S={U,AT,V,f}可以描述為信息系統(tǒng)S,其中U是代表對(duì)象的有限非空集合,稱為論域;AT是代表描述對(duì)象的所有屬性的有限非空集集合,稱為屬性集;Va表示屬性a的所有可能取值,稱為屬性a值域;V表示所有屬性的可能取值,稱為屬性值域;定義信息函數(shù)f為U×AT到V的一個(gè)映射,即對(duì)任意的x∈U,a∈AT,f(x,a)∈Va[10]。
例如,在一個(gè)典型的導(dǎo)彈導(dǎo)引系統(tǒng)不完備信息故障診斷實(shí)例中,為判斷系統(tǒng)內(nèi)陀螺是否完好,取測(cè)試點(diǎn)TP1,TP2,TP3測(cè)量陀螺頻率,得到該系統(tǒng)故障診斷決策表如表1所示。
其中,對(duì)象集合U={u1,u2,u3,u4,u5,u6,u7}表示陀螺的7個(gè)健康狀態(tài),AT={T1,T2,T3}為該系統(tǒng)的三個(gè)征兆屬性,VT1={VL,L,N,H},VT2={L,N,H},VT3={*,L,N,H},其中VL表示非常低,L表示偏低,N表示正常,H表示偏高,*表示空值。
表1 陀螺不完備故障診斷決策表
設(shè)不完備信息系統(tǒng)S={U,AT,V,f},令屬性集B?AT,對(duì)a∈AT和v∈V,(a,v)是一個(gè)屬性值對(duì);若屬性值是已知的,則滿足a(x)=v的所有實(shí)例x∈U組成的集合為屬性值對(duì)(a,v)的屬性值對(duì)塊[11],記為[(a,v)]。
定義未知屬性值為以下兩種,第一種稱為缺失屬性值,用符號(hào)“?”表示,用于定義在陀螺頻率測(cè)量過程中丟失的信息,且該種類屬性值不可比較、不可以用已知屬性值替代;第二種稱為未知屬性值,用符號(hào)“*”表示,用于定義未知信息,但可以用已知屬性值替代的未知屬性值。則缺失屬性值的屬性對(duì)塊為[(a,?)]=U,未知屬性值的屬性對(duì)塊為所有包含a的屬性對(duì)塊的交集。
設(shè)不完備信息系統(tǒng)S={U,AT,V,f},令屬性集B?AT,對(duì)于?x∈U,則實(shí)例x在屬性集B下的特征集KB(x)為所有屬性值對(duì)塊的交集:
(1)
特征關(guān)系R(B)定義如下[12]:
R(B)={(x,y)∈U×U|y∈KB(x)}
(2)
采用特征關(guān)系處理兩種未知屬性值,是根據(jù)其優(yōu)于容差關(guān)系和非對(duì)稱相似關(guān)系的性能,可以將兩種不同屬性類別的不完備故障統(tǒng)一處理[13]。
定義不完備條件下的故障診斷信息系統(tǒng)流向圖為有向、非循環(huán)圖IG=(N,M,D,B,φ),N為節(jié)點(diǎn)的集合;M為征兆屬性節(jié)點(diǎn)集合,M={m1,m2,…,mm},征兆屬性m1的值域是指系統(tǒng)在征兆屬性m1條件下所有的狀態(tài)集合;D為決策屬性節(jié)點(diǎn)集合,D=syggg00;決策屬性d的值域是指系統(tǒng)所有狀態(tài)的決策屬性集合;B?N×N為有向分支集合,φ定義為流量,任意一個(gè)屬性節(jié)點(diǎn)x的輸入和輸出分別由I(x)和O(x)[14]。
定義不完備故障診斷流向圖IG=(N,M,D,B,φ)的任意一個(gè)征兆屬性節(jié)點(diǎn),定義輸入流量為:
(3)
輸出流量定義為:
(4)
任意一個(gè)決策屬性節(jié)點(diǎn)的輸入流量定義為:
(5)
從征兆屬性節(jié)點(diǎn)mi(x)到?jīng)Q策屬性節(jié)點(diǎn)dj的有向路徑定義為mi(x),…,dj,其完整路徑可以表示為[mi(x),…,dj]。
通過不完備流向圖可以將決策表中的每個(gè)實(shí)例都用完整的路徑表示出來,為了進(jìn)一步定量分析不完備流向圖中每一條路徑的可靠程度,引入置信度和覆蓋度的概念,定義如下。
定義不完備流向圖中的置信度為:
(6)
其中:instance{[m1(x),…,mi(x),dj]}為路徑中表示已知屬性節(jié)點(diǎn)的實(shí)例個(gè)數(shù),instance{[m1(x),…,mi(x)]}為只滿足路徑條件中表示已知屬性節(jié)點(diǎn)的實(shí)例個(gè)數(shù)。
定義不完備流向圖中的覆蓋度為:
(7)
其中:instance{[m1(x),…,mi(x),dj]}為路徑中表示已知屬性節(jié)點(diǎn)的實(shí)例個(gè)數(shù),instance{[dj]}為只滿足路徑流向決策部分屬性節(jié)點(diǎn)的實(shí)例個(gè)數(shù)[15]。
在不完備流向圖中置信度表示路徑的可靠程度,置信度越大依照該路徑做出的故障診斷決策的可靠性越高;覆蓋度表示此路徑在流過其決策屬性節(jié)點(diǎn)的路徑中所占的比重。
導(dǎo)彈不完備故障診斷信息指的是在導(dǎo)彈測(cè)試過程中,某些數(shù)據(jù)或者一些事例存在不完整、丟失或者遺漏的未知屬性值,進(jìn)而影響導(dǎo)彈的故障診斷準(zhǔn)確性。在現(xiàn)有的導(dǎo)彈故障診斷技術(shù)中,以往的歷史數(shù)據(jù)起到重要作用。很多原因可能造成導(dǎo)彈故障診斷信息的不完備,而且造成的未知屬性缺失也都有不同的特點(diǎn),例如未知屬性的來源可能是因?yàn)樵O(shè)備的失靈、損壞,也可能是由于數(shù)據(jù)在傳輸?shù)倪^程中受到干擾,出現(xiàn)通信上的臨時(shí)中斷導(dǎo)致信息沒有被有效采集。綜合上述觀點(diǎn)可以將導(dǎo)彈故障診斷信息不完備的原因分為以下三點(diǎn):
1)導(dǎo)彈關(guān)鍵部件發(fā)生故障。在導(dǎo)彈故障診斷過程中,由于設(shè)備工作環(huán)境影響,工況復(fù)雜,其需要進(jìn)行故障檢測(cè)關(guān)鍵部件發(fā)生故障,造成采集的數(shù)據(jù)集中的一些關(guān)鍵數(shù)據(jù)及其某些征兆屬性缺失,引發(fā)故障診斷信息不完備。
2)故障征兆屬性值獲取困難。由于導(dǎo)彈具有長(zhǎng)期貯存,一次使用的特點(diǎn),短時(shí)間內(nèi)很難獲取足夠的故障診斷信息。而且測(cè)試、掛飛訓(xùn)練等通電時(shí)間較短,也導(dǎo)致診斷信息的測(cè)試周期或者性能可能沒有滿足測(cè)量設(shè)備,故障征兆屬性的信息獲取較為困難,也可能造成信息不完備。
3)數(shù)據(jù)歸一化的影響。為了提取數(shù)據(jù)中的有效信息,一般需要對(duì)數(shù)據(jù)進(jìn)行歸一化處理,得到抽象層級(jí)的故障征兆屬性值,但是由于在歸一化進(jìn)程中會(huì)引入一些錯(cuò)誤或者矛盾數(shù)據(jù),所以也會(huì)造成診斷信息不完備。
上述三個(gè)方面的原因造成了導(dǎo)彈故障信息的不完備,同時(shí)增加了導(dǎo)彈故障診斷的難度。
導(dǎo)彈系統(tǒng)中由于各個(gè)子系統(tǒng)、各個(gè)部件之間連接性比較強(qiáng),考慮到導(dǎo)彈產(chǎn)生故障往往是在某一層級(jí)的子系統(tǒng)或者某個(gè)更小的單元,因此在確定導(dǎo)彈故障診斷知識(shí)的時(shí)候,要對(duì)關(guān)鍵部件的子系統(tǒng)進(jìn)行分別建立故障診斷知識(shí)獲取框架,得到最終整體的故障診斷知識(shí)獲取結(jié)果,用于提高導(dǎo)彈故障診斷準(zhǔn)確率。
陀螺是導(dǎo)彈導(dǎo)引系統(tǒng)的一個(gè)關(guān)鍵部件,主要由陀螺轉(zhuǎn)子、萬向支架和電機(jī)等組成,利用其定軸性保持導(dǎo)引頭正常工作,利用進(jìn)動(dòng)性實(shí)現(xiàn)對(duì)于目標(biāo)的跟蹤,對(duì)于導(dǎo)彈能否有效發(fā)揮戰(zhàn)斗力,擊毀目標(biāo)具有重要作用。在對(duì)陀螺進(jìn)行故障診斷的過程中,通過測(cè)量陀螺頻率可以有效計(jì)算陀螺耗電量,當(dāng)導(dǎo)彈陀螺耗電量過大時(shí),可能會(huì)導(dǎo)致在制導(dǎo)過程中無法持續(xù)跟蹤目標(biāo)。以導(dǎo)彈導(dǎo)引系統(tǒng)的陀螺為例,不完備條件下獲取其故障診斷知識(shí)步驟如下。
首先,利用采集到的故障診斷信息提取故障特征,建立不完備陀螺不完備故障診斷系統(tǒng)診斷表;然后,基于特征關(guān)系對(duì)信息進(jìn)行處理,提高故障分類的準(zhǔn)確率;最后,繪制不完備故障診斷流向圖,生成完整故障診斷路徑,最終達(dá)到故障診斷知識(shí)表達(dá)和獲取的目的。具體流程如圖1所示。
圖1 知識(shí)獲取流程
對(duì)其進(jìn)行故障診斷知識(shí)獲取研究分析。表2是由9個(gè)故障診斷實(shí)例構(gòu)成的集合,即U={u1,u2,u3,u4,u5,u6,u7,u8,u9},其中U1={u1,u2,u3,u4,u5,u6,u7}為發(fā)生故障實(shí)例集,U2={u8,u9}為未發(fā)生故障的實(shí)例集。AT={t1,t2,t3}為征兆屬性集,選取測(cè)試點(diǎn)TP1,TP2,TP3測(cè)量導(dǎo)彈該子系統(tǒng)的陀螺頻率偏移量的大小,對(duì)數(shù)據(jù)進(jìn)行離散化,k為在同一測(cè)試點(diǎn)相同實(shí)例的個(gè)數(shù)。出于對(duì)于數(shù)據(jù)的保密要求,本文對(duì)測(cè)試節(jié)點(diǎn)數(shù)據(jù)值采用偏離正常數(shù)據(jù)值得程度來表示,即偏小,正常,偏大。若偏小,則t(x)=1;若正常,則t(x)=2;若偏大,則t(x)=3。決策屬性為d,其值域表示為{Y,N},其中決策屬性值Y表示陀螺發(fā)生故障,決策屬性值N表示陀螺工作狀態(tài)良好。
利用特征關(guān)系對(duì)表2進(jìn)行處理,根據(jù)屬性值對(duì)塊的定義,獲得導(dǎo)彈陀螺儀不完備故障診斷信息系統(tǒng)中所有屬性值對(duì)塊如下[(a,v)]:
表2 陀螺不完備故障診斷決策表
[(t1,1)]={u1,u3,u4,u7,u8},[(t1,2)]={u3,u5,u8,u9},
[(t1,3)]={u2,u3,u6,u8},[(t2,1)]={u2,u7,u8},
[(t2,2)]={u1,u2,u6,u7,u9},[(t2,3)]={u2,u3,u4,u5,u7},
[(t3,1)]={u2,u3,u4,u5,u8},[(t3,2)]={u7,u8,u9}。
根據(jù)特征集的定義,計(jì)算該陀螺儀不完備故障診斷信息系統(tǒng)中各實(shí)例的特征集如下:
KC(u1)=[(t1,1)]∩[(t2,2)]∩U={u1,u7},同理可得:
KC(u2)={u2},KC(u3)={u3},
KC(u4)={u3,u4},KC(u5)={u3,u5},
KC(u6)={u2,u6},KC(u7)={u7},
KC(u8)={u8},KC(u9)={u9}。
由1節(jié)中對(duì)特征關(guān)系定義可知,該不完備診斷信息系統(tǒng)中各實(shí)例的特征關(guān)系如下:
R(C)={(u1,u1),(u1,u7),(u2,u2),(u3,u3),(u3,u4),(u4,u4),
(u5,u5),(u6,u6),(u6,u7),(u7,u7),(u8,u8),(u9,u9)}
經(jīng)特征關(guān)系處理后,可以對(duì)實(shí)例進(jìn)行有效分類,例如實(shí)例u1和實(shí)例u7屬于同一特征集,且具有相同的決策屬性值,因此,針對(duì)這種不完備的數(shù)據(jù)集,就可以通過相同的特征集對(duì)其進(jìn)行判斷,提高對(duì)于不完備故障診斷知識(shí)的處理能力,利用有限的故障知識(shí)獲得對(duì)于實(shí)際工作的參考范例,同時(shí)提高故障診斷知識(shí)的分類準(zhǔn)確率。
針對(duì)上述故障診斷決策表進(jìn)行圖形化表示,利用不完備故障診斷流向圖,將故障征兆屬性值和故障決策屬性值之間的關(guān)系,具體清晰地表示出來。首先根據(jù)三個(gè)測(cè)試點(diǎn)的陀螺頻率測(cè)量結(jié)果,確定出每個(gè)測(cè)試點(diǎn)實(shí)際的征兆屬性,決策屬性值表示是否發(fā)生故障,不完備屬性值用“*”和“?”來表示。然后根據(jù)不完備故障診斷決策表中的情況,從左至右連接各個(gè)節(jié)點(diǎn),形成有向分支,通過流向圖中的有向分支可以清晰地掌握故障診斷的流程和數(shù)據(jù)之間的相互影響。最后,計(jì)算節(jié)點(diǎn)流量和有向分支流向,出于簡(jiǎn)化圖形的目的,圖中僅表示出節(jié)點(diǎn)、有向分支和節(jié)點(diǎn)流量,有向分支流量未在圖中標(biāo)出。建立不完備故障診斷流向圖,如圖2所示。
上述實(shí)例是以16個(gè)典型的故障樣本進(jìn)行分析,則根據(jù)2節(jié)對(duì)于不完備診斷流向圖處理的相關(guān)理論,可以完整表述出故障診斷知識(shí)的路徑。計(jì)算路徑的置信度和覆蓋度,部分完整路徑及其相關(guān)指標(biāo)如表3所示。
表3 不完備故障診斷流向圖中包含的完整路徑
通過上述路徑計(jì)算結(jié)果可知,該方法可以定量描述故障診斷路徑的可靠程度,在不完備故障診斷知識(shí)的獲取和利用上取到了較好效果。
本文提出了不完備信息條件下導(dǎo)彈故障診斷知識(shí)的獲取方法。通過導(dǎo)彈導(dǎo)引系統(tǒng)陀螺故障實(shí)例驗(yàn)證了該知識(shí)獲取方法的可行性和有效性,通過特征關(guān)系處理,對(duì)故障診斷實(shí)例進(jìn)行分類。結(jié)果表明,該方法可以準(zhǔn)確表示故障診斷路徑,并描述其可靠程度,通過不完備流向圖的方法,充分利用和處理不完備信息,將其具體化、圖像化,并在實(shí)際的導(dǎo)彈故障診斷過程中,較好地提高了不完備故障數(shù)據(jù)處理和利用效率。同時(shí),在下一步工作中將對(duì)缺失故障數(shù)據(jù)的類別,進(jìn)一步細(xì)化和處理,以擴(kuò)大該方法的實(shí)際使用范圍,更好地在工程實(shí)踐中發(fā)揮作用。