史兵波
(中國(guó)電子科技集團(tuán)公司第二十研究所,陜西 西安 710068)
先進(jìn)通信設(shè)備是構(gòu)建區(qū)域一體化通信網(wǎng)絡(luò),互聯(lián)各平臺(tái)信息終端,匯聚全要素信息池和實(shí)現(xiàn)信息按需取用的骨干裝備,在信息化對(duì)抗中發(fā)揮著重要作用。由于該設(shè)備設(shè)計(jì)指標(biāo)要求高、各電路模塊信號(hào)傳導(dǎo)復(fù)雜、數(shù)據(jù)鏈路節(jié)點(diǎn)多、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)多樣,導(dǎo)致故障情況高發(fā),且故障演化機(jī)理復(fù)雜,故障診斷和恢復(fù)困難。傳統(tǒng)基于人工判定的診斷方式效率低下,戰(zhàn)時(shí)難以滿足設(shè)備故障快速恢復(fù)的要求。因此,研究智能高效的設(shè)備故障診斷方法具有重要的現(xiàn)實(shí)意義。
故障診斷的實(shí)質(zhì)是技術(shù)人員依據(jù)故障現(xiàn)象,不斷迭代進(jìn)行故障機(jī)理的“判定-驗(yàn)證-調(diào)整”過(guò)程,直至最終定位故障原因和提出解決措施的思維決策活動(dòng)。該活動(dòng)可以抽象為一個(gè)分類學(xué)習(xí)的行為[1-2]:將“故障現(xiàn)象”作為輸入,通過(guò)一個(gè)“分類模型”的判定(該模型具有可接受的分類錯(cuò)誤率),輸出“故障原因”標(biāo)簽,再將帶標(biāo)簽信息的故障信息與數(shù)據(jù)庫(kù)中的已有“故障記錄”進(jìn)行相似度計(jì)算,得出“解決措施”。
本文提出的故障診斷方法采用了機(jī)器學(xué)習(xí)[3-4]的思路模擬了故障診斷的思維決策過(guò)程,主要包括:故障診斷知識(shí)表示、故障診斷算法研究、故障向量的相似度計(jì)算三部分內(nèi)容。故障診斷知識(shí)表示對(duì)不同來(lái)源的故障診斷知識(shí)進(jìn)行了同一化的向量描述,故障診斷算法構(gòu)建了一個(gè)適于故障診斷的分類模型,故障向量的相似度計(jì)算得出了故障的解決措施。故障診斷方法原理如圖1所示。
圖1 基于遷移學(xué)習(xí)的先進(jìn)通信設(shè)備故障診斷原理
先進(jìn)通信設(shè)備故障診斷知識(shí)主要有專家經(jīng)驗(yàn)和故障實(shí)例兩個(gè)來(lái)源。專家經(jīng)驗(yàn)是設(shè)備企業(yè)或領(lǐng)域內(nèi)的專家關(guān)于故障診斷問(wèn)題形成的存在于個(gè)人大腦或相關(guān)論述中的知識(shí),如故障歸零報(bào)告;故障實(shí)例是既往處理故障問(wèn)題時(shí)形成的記錄性文檔,如故障報(bào)告單。這兩類知識(shí)雖屬同一領(lǐng)域,但因存在形式、表述方式和用途側(cè)重點(diǎn)不同,在應(yīng)用于故障診斷前需進(jìn)行預(yù)處理和同一化表示。
本文采用“故障現(xiàn)象→故障演化路徑→故障原因→解決措施”的邏輯過(guò)程對(duì)故障診斷知識(shí)進(jìn)行數(shù)學(xué)建模,具體用一個(gè)四元組向量E( Example)表示一例故障診斷樣本。
E={F,P,L,S}
F(Fault)是一個(gè)有限集合,表示設(shè)備故障現(xiàn)象;P(Path)是一個(gè)有限非空集合,表示故障演化路徑;L(Label)是一個(gè)非空集合,表示故障原因的標(biāo)簽信息;S(Solutions)表示解決措施。
在訓(xùn)練分類模型時(shí),如果以少量高置信度的專家經(jīng)驗(yàn)樣本作為訓(xùn)練數(shù)據(jù)集,不足以訓(xùn)練出一個(gè)可靠的分類模型,而以大量低置信度的故障實(shí)例樣本作為訓(xùn)練數(shù)據(jù)集,又無(wú)法保證得到的分類模型具有可接受的分類錯(cuò)誤率;如果將專家經(jīng)驗(yàn)和故障實(shí)例樣本合并起來(lái)學(xué)習(xí),大量低置信度的數(shù)據(jù)可能會(huì)稀釋高置信度的數(shù)據(jù),依然訓(xùn)練不出一個(gè)可靠的分類模型。實(shí)際上,我們認(rèn)為在故障實(shí)例中存在一部分高置信度的樣本數(shù)據(jù),如果能將這部分?jǐn)?shù)據(jù)篩選出來(lái),并遷移到專家經(jīng)驗(yàn)樣本中進(jìn)行學(xué)習(xí),成為訓(xùn)練一個(gè)可靠分類模型的關(guān)鍵。因此,本文采用遷移學(xué)習(xí)理論[5-6]對(duì)real-AdaBoost[7-8]分類算法進(jìn)行了改進(jìn),使其具有樣本遷移的能力。該算法在訓(xùn)練分類模型時(shí),將少量高置信度的專家經(jīng)驗(yàn)樣本作為目標(biāo)訓(xùn)練數(shù)據(jù),將大量低置信度的故障實(shí)例作為源訓(xùn)練數(shù)據(jù),在每次迭代訓(xùn)練時(shí),通過(guò)不斷調(diào)整樣本權(quán)值的策略從故障實(shí)例中篩選出高置信度的樣本數(shù)據(jù),并將其遷移到專家經(jīng)驗(yàn)樣本中,經(jīng)過(guò)N次迭代,訓(xùn)練出N個(gè)弱分類模型,再將所有弱分類模型進(jìn)行線性組合,生成一個(gè)適用于故障診斷的強(qiáng)分類模型。
定義1:Xa為目標(biāo)樣本空間,Xb為源樣本空間,Y={1,2,...,l}為類標(biāo)簽空間;
函數(shù)c:X→Y,將樣本x∈X映射到其真實(shí)的類標(biāo)簽c(x)∈Y上去。
定義2:測(cè)試數(shù)據(jù)集S={x1,...,xm},其中m為集合S中的元素個(gè)數(shù)。
輸入:兩類已標(biāo)注數(shù)據(jù)集:目標(biāo)數(shù)據(jù)集TT,源數(shù)據(jù)集Ts1,Ts2,…,TsK;一個(gè)測(cè)試數(shù)據(jù)集S;一個(gè)基本分類算法“Learner”;迭代次數(shù)N。
采用夾角余弦法對(duì)故障向量的相似度[9-10]進(jìn)行計(jì)算:
在使用該算式前需對(duì)向量中的元素進(jìn)行無(wú)量綱化處理,使各元素都為正,這時(shí)夾角余弦的取值范圍為[0,1],取值越大表明兩向量越相似,值為1時(shí)兩向量完全相,值為0時(shí)兩向量無(wú)相似性。
實(shí)驗(yàn)的主要目的是驗(yàn)證分類模型的分類準(zhǔn)確率。本文選擇支持向量機(jī)(SVM)作為基本分類算法,將不具有遷移能力的SVM和AdaBoost作為對(duì)比算法,以MATLAB軟件作為實(shí)驗(yàn)平臺(tái)。訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)均來(lái)自某研究所。實(shí)驗(yàn)結(jié)果如圖2所示。
圖2 三種算法分類準(zhǔn)確率比較
可以看出,在目標(biāo)訓(xùn)練樣本比例較低時(shí)三種算法分類準(zhǔn)確率都較低,增加目標(biāo)訓(xùn)練樣本后分類準(zhǔn)確率均有提高,說(shuō)明高置信度的訓(xùn)練樣本對(duì)分類模型的性能提高貢獻(xiàn)很大。本文提出的分類算法相比其他兩種分類算法具有較高的分類準(zhǔn)確率,但上限僅為0.6左右,后期將對(duì)該模型進(jìn)一步優(yōu)化,提高分類準(zhǔn)確率。
本文從理論上闡述了利用分類學(xué)習(xí)思想實(shí)現(xiàn)先進(jìn)通信設(shè)備故障高效智能診斷的可行性,并通過(guò)實(shí)驗(yàn)驗(yàn)證了故障診斷算法的有效性,為后續(xù)工作提供了理論基礎(chǔ)和方法途徑,下一步研究工作將重點(diǎn)關(guān)注診斷算法模型的優(yōu)化。