陳 榮,劉 富
(北京衛(wèi)星導(dǎo)航中心,北京 100088)
?
芯片信息加載故障診斷的故障樹分析法
陳榮,劉富
(北京衛(wèi)星導(dǎo)航中心,北京100088)
針對(duì)導(dǎo)航接收機(jī)芯片信息加載故障診斷中出現(xiàn)的依賴技術(shù)人員經(jīng)驗(yàn)、診斷效率低下等問(wèn)題,采用故障樹分析法對(duì)芯片信息加載故障進(jìn)行分析;通過(guò)芯片信息加載故障特性分析,建立故障樹;進(jìn)行定性、定量分析,根據(jù)故障統(tǒng)計(jì)結(jié)果給出各底事件的發(fā)生概率,計(jì)算得出頂事件發(fā)生的概率;并給出芯片信息加載故障的預(yù)防和診斷方法。結(jié)果表明該方法能夠有效提高故障診斷效率,并減少故障發(fā)生率。
導(dǎo)航接收機(jī);故障樹分析法;芯片信息加載;故障診斷;故障預(yù)防
導(dǎo)航接收機(jī)芯片信息加載涉及到眾多的環(huán)節(jié)。一方面導(dǎo)航接收機(jī)生產(chǎn)廠家較多較雜,部分廠家未嚴(yán)格按照協(xié)議實(shí)現(xiàn);另一方面由于信息加載設(shè)備不夠完善,芯片狀態(tài)多變等原因,芯片信息加載過(guò)程時(shí)有故障發(fā)生,輕則無(wú)法加載,影響正常使用,重則造成芯片損壞,接收機(jī)返廠。特別是對(duì)異地接收機(jī)的芯片信息加載故障往往需要多次往返,不僅影響正常使用,而且會(huì)造成人員、經(jīng)費(fèi)、時(shí)間的極大浪費(fèi):因此對(duì)芯片信息加載的故障診斷顯得尤為重要。
目前對(duì)芯片信息加載的故障診斷主要依靠技術(shù)人員的經(jīng)驗(yàn),診斷效率較低且依賴少數(shù)有經(jīng)驗(yàn)的技術(shù)人員。本文采用故障樹分析法對(duì)芯片信息加載故障進(jìn)行定性和定量分析,以期提高故障診斷效率,并且找出容易造成芯片信息加載故障的薄弱環(huán)節(jié),減少故障發(fā)生的概率。
故障樹分析(fault tree analysis,F(xiàn)TA )法是故障診斷技術(shù)中的一種有效方法。FTA法是將系統(tǒng)的各種故障原因(包括硬件、環(huán)境、人為因素)由總體至部分、按樹枝狀結(jié)構(gòu)自上而下逐層細(xì)化的分析方法,是用于大型復(fù)雜系統(tǒng)可靠性、安全性分析和風(fēng)險(xiǎn)評(píng)價(jià)的一種普遍、有效的方法[1-4]。20 世紀(jì) 60 年代初,文獻(xiàn)[5]首先使用故障樹分析方法,對(duì)民兵式導(dǎo)彈發(fā)射控制系統(tǒng)的隨機(jī)失效問(wèn)題成功地做出了預(yù)測(cè)?;诠收蠘涞目煽啃苑治鲋饕峭ㄟ^(guò)定性和定量分析找出系統(tǒng)的薄弱環(huán)節(jié),及時(shí)確定故障源。
對(duì)故障樹進(jìn)行定性和定量分析的目的是找出其所有最小割集,確定頂事件和底事件的發(fā)生概率。故障樹的1個(gè)最小割集代表系統(tǒng)的1個(gè)故障模式,只要有1個(gè)最小割集存在,系統(tǒng)就處于故障狀態(tài)。在對(duì)故障樹進(jìn)行可靠性分析之前,作以下假設(shè):1)底事件之間相互獨(dú)立;2)底事件和頂事件只考慮2種狀態(tài),即正?;蚬收稀?/p>
設(shè)系統(tǒng)有K個(gè)最小割集K=(K1,K2,…,Kk),在K個(gè)最小割集中,只要有1個(gè)最小割集發(fā)生,頂事件就發(fā)生。為了便于對(duì)故障樹作定性和定量分析,常采用結(jié)構(gòu)函數(shù)對(duì)故障樹進(jìn)行數(shù)學(xué)描述。故障樹的結(jié)構(gòu)函數(shù)可表示為
(1)
式中每個(gè)最小割集Kj(1≤j≤k)是底事件Xi(1≤i≤n)(n:底事件數(shù)目)的積事件。通過(guò)結(jié)構(gòu)函數(shù)可以分析故障樹頂事件的發(fā)生概率 (系統(tǒng)不可靠度為FS,頂事件為T)為
P(T)=P(T)=p(k1+k2+...+kk)=
F1-F2+…+(-1)k-1Fk。
(2)
當(dāng)每個(gè)底事件發(fā)生概率<0.01時(shí),可近似地認(rèn)為
FS≈F1-F2/2,
(3)
或者
(4)
影響芯片信息加載成敗的環(huán)節(jié)共有4個(gè),分別是信息管理系統(tǒng)、便攜式信息加載設(shè)備、接收機(jī)、芯片。任何一個(gè)環(huán)節(jié)出問(wèn)題都會(huì)導(dǎo)致芯片信息加載失敗,如圖1所示。
信息管理系統(tǒng)會(huì)導(dǎo)致信息加載失敗的問(wèn)題,包括系統(tǒng)內(nèi)部錯(cuò)誤和人為操作失誤:系統(tǒng)內(nèi)部錯(cuò)誤指系統(tǒng)由于考慮不周、測(cè)試不充分導(dǎo)致的程序漏洞;人為操作失誤指各種會(huì)導(dǎo)致信息加載失敗的人為操作失誤,包括提交數(shù)據(jù)錯(cuò)誤、錯(cuò)下數(shù)據(jù)和漏下數(shù)據(jù)。
圖1 芯片信息加載流程
便攜式信息加載設(shè)備會(huì)導(dǎo)致信息加載失敗的問(wèn)題,包括設(shè)備硬件故障、設(shè)備軟件故障和人為操作失誤(設(shè)備電量低導(dǎo)致設(shè)備無(wú)法開機(jī));設(shè)備內(nèi)部數(shù)據(jù)錯(cuò)誤的原因應(yīng)該歸因于信息管理系統(tǒng),不屬于便攜式信息加載設(shè)備的錯(cuò)誤。安全存儲(chǔ)介質(zhì)在信息加載時(shí)通常和便攜式信息加載設(shè)備配合使用,會(huì)導(dǎo)致失敗的原因包括安全存儲(chǔ)介質(zhì)硬件故障和人為操作失誤(安全存儲(chǔ)介質(zhì)和便攜式信息加載設(shè)備不匹配)。
接收機(jī)會(huì)導(dǎo)致信息加載失敗的原因包括接收機(jī)硬件故障、接收機(jī)未按標(biāo)準(zhǔn)協(xié)議實(shí)現(xiàn)(使用舊協(xié)議導(dǎo)致信息加載報(bào)錯(cuò)、使用舊軟件導(dǎo)致接收機(jī)顯示錯(cuò)誤、使用舊協(xié)議導(dǎo)致串口不通、未停止串口發(fā)送數(shù)據(jù)導(dǎo)致報(bào)錯(cuò))。
芯片會(huì)導(dǎo)致加注失敗的原因包括原發(fā)性芯片硬件故障、芯片軟件出廠缺陷。
芯片信息加載不是一個(gè)像汽車發(fā)動(dòng)機(jī)、運(yùn)載火箭之類的硬件系統(tǒng),芯片信息加載涉及到4種硬件設(shè)備、1種軟件信息加載,以及一系列的人工操作。芯片信息加載成功的標(biāo)志是:信息成功加載,同時(shí)接收機(jī)能夠利用相關(guān)信息正常工作。由于芯片信息加載過(guò)程和一般硬件系統(tǒng)的差別,某些特定故障診斷方法,如基于物理化學(xué)現(xiàn)象的方法、基于信號(hào)處理的方法、基于傳感器的方法,明顯不適用于芯片信息加載的故障診斷。適合對(duì)其進(jìn)行故障診斷的方法主要包括基于神經(jīng)網(wǎng)絡(luò)的方法、基于案例推理機(jī)制(case-based reasoning,CBR)的方法、模糊診斷法、基于故障樹的方法。
基于神經(jīng)網(wǎng)絡(luò)的方法能夠?qū)崿F(xiàn)故障診斷的自動(dòng)化和智能化;但是該診斷方法屬于“黑箱”方法,不能揭示出系統(tǒng)內(nèi)部的一些潛在關(guān)系,無(wú)法對(duì)診斷過(guò)程給予明確解釋,無(wú)法給予清晰和一目了然的實(shí)踐指導(dǎo),無(wú)法利用工程師的經(jīng)驗(yàn)和技術(shù),網(wǎng)絡(luò)訓(xùn)練時(shí)間較長(zhǎng),并且對(duì)未在訓(xùn)練樣本中出現(xiàn)的故障無(wú)診斷能力[6-11]。
基于案例推理機(jī)制的方法是通過(guò)訪問(wèn)知識(shí)庫(kù)中過(guò)去同類問(wèn)題的求解從而獲得當(dāng)前問(wèn)題解決的一種推理模式。該方法應(yīng)用于故障診斷有廣闊的前景,對(duì)曾出現(xiàn)過(guò)的故障的診斷有較高的效率;但是應(yīng)用該方法需要積累起大量的故障診斷實(shí)例,同時(shí)對(duì)新機(jī)理的故障難以給出正確診斷:因此需要和其他故障診斷方法結(jié)合進(jìn)行[12]。
模糊診斷法認(rèn)為復(fù)雜系統(tǒng)的故障原因和相應(yīng)癥狀之間的相互關(guān)系一般沒(méi)有明確的規(guī)律可循,很難甚至不可能用精確的數(shù)學(xué)模型來(lái)描述;只能利用模糊數(shù)學(xué)分析方法來(lái)分析和處理。模糊診斷法一般和其他故障診斷方法結(jié)合使用。
基于故障樹的方法的優(yōu)點(diǎn)是:能夠?qū)崿F(xiàn)快速診斷;知識(shí)庫(kù)很容易動(dòng)態(tài)修改,并能保持一致性;概率推理可在一定程度上被用于選擇規(guī)則的搜尋通道,提高診斷效率;診斷技術(shù)與領(lǐng)域無(wú)關(guān),便于將工程師在工作和科研實(shí)踐中獲取的經(jīng)驗(yàn)和技術(shù)應(yīng)用起來(lái);建立的故障樹可以給人清晰直觀的感受,便于指導(dǎo)實(shí)際的故障診斷。
基于各種故障診斷方法的分析比較,本文采用基于故障樹的方法對(duì)芯片信息加載進(jìn)行故障診斷。
4.1建立故障樹
根據(jù)故障樹頂事件的定義,確定“芯片信息加載失敗”作為頂事件。根據(jù)芯片信息加載故障特性,按照建立故障樹的基本規(guī)則和方法,依次列出中間事件,用或門連接各事件后從上而下推理出底事件,建立故障樹圖,如圖2所示??梢钥闯鑫覀兘⒌墓收蠘涫菃握{(diào)關(guān)聯(lián)故障樹。
圖2 芯片信息加載故障樹圖
圖2中各符號(hào)含義如表1所示,共有 9 項(xiàng)中間事件、17 項(xiàng)底事件。根據(jù)芯片信息加載故障記錄,得出各底事件概率。
4.2故障樹分析
利用故障樹定性分析法中的上行法來(lái)求解故障樹的最小割集,經(jīng)簡(jiǎn)化、吸收,得到全部17 個(gè)最小割集分別為17個(gè)底事件{X1}、{X2}、{X3}、{X4}、{X5}、 {X6}、{X7}、{X8}、{X9}、{X10}、{X11}、{X12}、{X13}、{X14}、{X15}、{X16}、{X17}。
由式(2)可以計(jì)算出頂事件概率P(T)=20.625%。頂事件概率偏大主要是由2項(xiàng)底事件“芯片軟件出廠缺陷”和“使用舊軟件導(dǎo)致顯示錯(cuò)誤”概率偏大造成的。其他各項(xiàng)底事件概率均在可接受范圍內(nèi)。
從各中間事件、底事件概率中可以看到,中間事件“接收機(jī)未按標(biāo)準(zhǔn)協(xié)議實(shí)現(xiàn)”概率最高,這是符合目前芯片信息加載實(shí)際情況的。由于接收機(jī)廠家繁多,總會(huì)有部分廠家由于溝通原因未按標(biāo)準(zhǔn)協(xié)議實(shí)現(xiàn),或者錯(cuò)誤地使用了舊版本的協(xié)議和軟件,這些都會(huì)導(dǎo)致芯片信息加載故障。
表1 芯片信息加載故障樹圖含義 (%)
“芯片軟件出廠缺陷”概率較高,該事件雖是偶發(fā)事件,經(jīng)過(guò)整改后可以解決;但是生產(chǎn)廠家必須要注意生產(chǎn)質(zhì)量,否則影響范圍會(huì)很大。
“信息管理系統(tǒng)內(nèi)部錯(cuò)誤”故障概率雖不高,但一旦出錯(cuò),影響就是全局性的;生產(chǎn)廠家要提高責(zé)任心,加強(qiáng)測(cè)試力度,保證提交產(chǎn)品的質(zhì)量。
4.3芯片信息加載故障預(yù)防與診斷方法
芯片信息加載故障預(yù)防措施:1)加強(qiáng)宣貫力度,保證新版本的協(xié)議及時(shí)下發(fā)到每一家接收機(jī)廠家;2)在接收機(jī)測(cè)試環(huán)節(jié)增加接收機(jī)協(xié)議一致性測(cè)試,確保接收機(jī)嚴(yán)格按照協(xié)議實(shí)現(xiàn);3)芯片和信息管理系統(tǒng)生產(chǎn)廠家要加強(qiáng)測(cè)試,保證提交產(chǎn)品的質(zhì)量。
芯片信息加載故障診斷方法:參照芯片信息加載故障樹圖,結(jié)合具體故障現(xiàn)象,逐項(xiàng)排查故障。排查順序?yàn)榻邮諜C(jī)、芯片、安全存儲(chǔ)介質(zhì)、便攜式信息加載設(shè)備、信息管理系統(tǒng)。
通過(guò)為期半年的實(shí)際應(yīng)用,結(jié)果表明上述故障預(yù)防和診斷方法可以有效降低故障率、縮短故障診斷時(shí)間。通過(guò)實(shí)施故障診斷辦法,業(yè)務(wù)人員可以更快速地實(shí)施故障診斷,故障診斷從動(dòng)輒數(shù)小時(shí)乃至數(shù)天,到平均耗時(shí)控制在1 h以內(nèi);通過(guò)實(shí)施改進(jìn)措施,故障率畸高的2項(xiàng)底事件“芯片軟件出廠缺陷”和“使用舊軟件導(dǎo)致顯示錯(cuò)誤”的概率大大降低;通過(guò)實(shí)施故障預(yù)防措施,底事件“未停止發(fā)送串口數(shù)據(jù)導(dǎo)致報(bào)錯(cuò)”和“使用舊協(xié)議舊軟件導(dǎo)致串口不通”的概率也得以降低,頂事件的概率從而得以顯著降低,達(dá)到了降低故障率的目的。
本文采用故障樹法對(duì)芯片信息加載故障進(jìn)行分析,通過(guò)對(duì)芯片信息加載故障特性的分析,建立了芯片信息加載故障樹圖,并進(jìn)行了定性和定量分析,給出了芯片信息加載故障預(yù)防和診斷的方法。經(jīng)過(guò)為期半年的實(shí)際應(yīng)用證明,本文提出的故障診斷和故障預(yù)防措施是有效的,可以較好提高故障診斷效率,減少故障出現(xiàn)概率。下一步將開展故障樹和模糊診斷、基于案例推理機(jī)制方法相融合的故障診斷方法的研究。
[1]王東,郭永,胡經(jīng)民,等.基于故障樹分析法火箭測(cè)量系統(tǒng)故障診斷研究[J].北華航天工業(yè)學(xué)院學(xué)報(bào),2014,24(3):20-23.
[2]陳春俊,王雪梅.測(cè)控系統(tǒng)故障檢測(cè)與診斷[M].成都:西南交通大學(xué)出版社,2008:21-22.
[3]國(guó)防科學(xué)技術(shù)工業(yè)委員會(huì).GJB/Z 768A-1998:故障樹分析指南[S].北京:國(guó)防工業(yè)出版社,1998:1-2.
[4]梁芬,姜宏偉,郭亞男,等.基于FTA的焊接機(jī)器人故障診斷技術(shù)研究[J].機(jī)電工程,2014,31(8):1067-1070.
[5]王玉剛,王海東.基于故障樹的某型裝備故障診斷專家系統(tǒng)[J].儀器儀表用戶,2012,19(2):3-5.
[6]欽勁,董豆豆,孫權(quán),等.基于故障樹的導(dǎo)彈故障快速診斷決策支持系統(tǒng)[J].裝備學(xué)院學(xué)報(bào),2006,17(1):107-110.
[7]郭博.基于神經(jīng)網(wǎng)絡(luò)和故障樹的運(yùn)載火箭故障診斷系統(tǒng)的研究[D].成都:電子科技大學(xué),2010:45-47.
[8]閆劍平.一種故障樹模塊的劃分方法[J].北方交通大學(xué)學(xué)報(bào),2000,24(5):63-66.
[9]蔡偉,王瑞林,李濤.基于模糊故障樹的某型步槍卡彈故障機(jī)理分析[J].科技通報(bào),2013,29(6):50-52.
[10]何桂青,陳英,范麗云,等.運(yùn)載火箭故障診斷專家系統(tǒng)[J].北京理工大學(xué)學(xué)報(bào),1998,18(6):685-688.
[11]王英,沙云東.航空發(fā)動(dòng)機(jī)故障診斷技術(shù)綜述[J].沈陽(yáng)航空工業(yè)學(xué)院學(xué)報(bào),2007,24(2):11-14.
[12]李曉輝,劉妍秀.基于實(shí)例推理機(jī)制(CBR)綜述[J].長(zhǎng)春大學(xué)學(xué)報(bào),2006,16(4):68-70.
Fault tree analysis on fault-diagnosis of chip information loading
CHEN Rong,LIU Fu
(Beijing Satellite Navigation Center,Beijing100088,China)
Aiming at the problem of the experience dependency and diagnostic inefficiency in the process of the fault-diagnosis of chip information loading by the navigation receiver,this paper studied the fault-diagnosis of information loading based on the fault tree analysis:building the fault tree was built through analyzing the fault characteristics of chip information loading;the qualitative and quantitative analysis was carried out for fault-diagnosis,the bottom-event occurrence rate was given with the statistical results of faults and the top-event occurrence rate was calculated then;meanwhile,the prevention measure and diagnosis method were presented finally.Result showed that the proposed method could increase the fault diagnostic efficiency and decrease the fault incidence rate.
navigation receiver;fault tree analysis;chip information loading;fault-diagnosis;trouble-saving
2015-10-29
陳榮(1978—),女,江蘇南通人,工程師,研究方向?yàn)樾l(wèi)星導(dǎo)航和裝備可靠性及維修性。
10.16547/j.cnki.10-1096.20160302.
P228
A
2095-4999(2016)03-0006-04
引文格式:陳榮,劉富.芯片信息加載故障診斷的故障樹分析法[J].導(dǎo)航定位學(xué)報(bào),2016,4(3):6-9.(CHEN Rong,LIU Fu.Fault tree analysis on fault-diagnosis of chip information loading[J].Journal of Navigation and Positioning,2016,4(3):6-9.)