姜新亮,趙建民,蘇波
(1.軍械工程學(xué)院,石家莊050003;2.解放軍73158部隊(duì),福建廈門361100)
基于可用度的電子設(shè)備告警系統(tǒng)檢查策略研究*
姜新亮1,趙建民1,蘇波2
(1.軍械工程學(xué)院,石家莊050003;2.解放軍73158部隊(duì),福建廈門361100)
針對電子設(shè)備告警系統(tǒng)故障具有隱蔽性的特點(diǎn),考慮檢查不完善的因素,運(yùn)用延遲時(shí)間概念,以系統(tǒng)期望可用度最大為優(yōu)化目標(biāo),建立了電子設(shè)備隱蔽功能故障檢查優(yōu)化模型。提出了優(yōu)化檢查間隔期的算法,并通過實(shí)際案例驗(yàn)證了模型的有效性。
電子設(shè)備,告警系統(tǒng),延遲時(shí)間,隱蔽功能故障,檢查間隔
近年來,電子產(chǎn)品在人們的生產(chǎn)生活中扮演著越來越重要的角色,對其可靠性與安全性要求也越來越高,特別是在航天航空、軍事、交通運(yùn)輸領(lǐng)域等,一旦設(shè)備停機(jī),所帶來的損失可能無法度量。為了提高電子產(chǎn)品的可靠性,人們在電子產(chǎn)品研制時(shí)通常會(huì)對重要部位安裝告警裝置或預(yù)警系統(tǒng),通過對設(shè)備運(yùn)行中的技術(shù)指標(biāo)進(jìn)行實(shí)時(shí)監(jiān)控,提供異常情況告警,使操作人員能提前預(yù)判設(shè)備可能出現(xiàn)的不良狀況,從而采取相應(yīng)的措施,以避免或減小因系統(tǒng)功能故障所造成的損失。由于這些告警系統(tǒng)通常處于非工作狀態(tài),所以設(shè)備正常工作時(shí)操作人員無法感知這些告警系統(tǒng)是否存在故障,只有通過特定的檢查手段或方法才能發(fā)現(xiàn),因此,這些告警系統(tǒng)的故障就具有隱蔽性。
國內(nèi)外學(xué)者從不同角度對隱蔽故障、檢測間隔、維修模型、維修評估以及維修優(yōu)化等維修關(guān)鍵問題進(jìn)行了研究,取得了大量的研究成果。文獻(xiàn)[1-5]運(yùn)用延遲時(shí)間概念,從經(jīng)濟(jì)性或使用性等不同角度建立了潛在故障檢查與維修模型,并應(yīng)用于工業(yè)設(shè)備維修管理實(shí)踐中。文獻(xiàn)[7-11]對設(shè)備隱蔽功能故障進(jìn)行了研究,其中文獻(xiàn)[6]提出“隱蔽故障(hidden failure)”概念,在此基礎(chǔ)上對保護(hù)裝置的檢查間隔期決策問題做了研究;文獻(xiàn)[7]研究了基于日歷時(shí)間和基于工作時(shí)間的隱蔽故障檢查決策問題,建立了以可用度為決策目標(biāo)的檢查模型;文獻(xiàn)[8-9]研究了系統(tǒng)內(nèi)部零部件失效的共因性,運(yùn)用神經(jīng)網(wǎng)絡(luò)技術(shù)建立了新的隱蔽性故障率模型,實(shí)現(xiàn)了動(dòng)態(tài)描述隱蔽性故障率,克服了原模型精度不足的問題;文獻(xiàn)[10-11]對隱蔽故障維修與檢查間隔期的決策問題進(jìn)行了研究探索。然而上述研究大都假設(shè)檢查是完備的,即所有已形成的故障都能通過一次檢查被發(fā)現(xiàn),但是由于檢測手段或設(shè)備的缺乏,以及人為差錯(cuò)等情況的存在,使得檢測本身不可能絕對完善,因此,故障檢出率是檢查決策中不可忽視的因素。
許多情況下,對于電子設(shè)備來說可用度遠(yuǎn)比維修費(fèi)用更重要,那么這時(shí)候在維修決策中強(qiáng)調(diào)可用性比強(qiáng)調(diào)經(jīng)濟(jì)性更符合實(shí)際[12]。因此,研究如何合理安排檢查間隔時(shí)間使得期望可用度最大,是電子設(shè)備維修決策的核心問題。本文針對電子設(shè)備功能故障發(fā)展的特點(diǎn),研究運(yùn)用延遲時(shí)間的概念,以單位時(shí)間的平均可用度最大為目標(biāo),考慮檢查不完善等實(shí)際情況,建立電子設(shè)備告警系統(tǒng)檢查策略模型。給出確定告警系統(tǒng)檢查間隔期的優(yōu)化算法,并舉例加以驗(yàn)證。
眾所周知,電子部件系統(tǒng)有其自身特殊的性質(zhì):首先,電子部件的偶然失效期較長,在這個(gè)時(shí)期內(nèi)可以認(rèn)為是效率近似恒定的;其次,電子部件的故障產(chǎn)生主要是由外部沖擊造成的,表現(xiàn)出較強(qiáng)的突發(fā)性、隨機(jī)性和隱蔽性特點(diǎn),很難通過傳統(tǒng)的監(jiān)控手段對其狀態(tài)進(jìn)行監(jiān)測,從而發(fā)現(xiàn)其臨近發(fā)生故障的狀態(tài)或征兆。因此,對于電子設(shè)備告警系統(tǒng)故障預(yù)防的最有效辦法,就是有計(jì)劃地對告警系統(tǒng)進(jìn)行檢查、維修、更新,從而減少或避免多重故障的發(fā)生。
本文中所述電子設(shè)備的狀態(tài)涵蓋3種情況:正常狀態(tài)、隱蔽故障狀態(tài)、功能故障狀態(tài),其中,“正常工作狀態(tài)”是指設(shè)備交付使用時(shí)的狀態(tài),此時(shí)設(shè)備狀況良好;“隱蔽功能故障狀態(tài)”是指告警系統(tǒng)出現(xiàn)故障,但是設(shè)備并未發(fā)生功能故障,設(shè)備依然能夠正常工作,只不過此時(shí)設(shè)備發(fā)生功能故障的概率增加了;“功能故障階段”是指設(shè)備不能夠完成規(guī)定功能的狀態(tài),這種狀態(tài)可能是因?yàn)楦婢到y(tǒng)故障而引發(fā)的多重故障造成的,也可能是設(shè)備自身固有缺陷造成的。將設(shè)備首先發(fā)生隱蔽功能故障,而后再經(jīng)過一段時(shí)間發(fā)生功能故障的具有延遲特點(diǎn)的特性叫作延遲性,將設(shè)備從發(fā)生隱蔽功能故障到發(fā)生功能故障的這一段時(shí)間稱為延遲時(shí)間,這與用以描述系統(tǒng)潛在故障的發(fā)展過程P-F曲線[13]有許多相同點(diǎn)。因此,延遲時(shí)間模型可以為產(chǎn)品隱蔽功能故障檢查問題提供一個(gè)可行的基礎(chǔ)。
基于以上分析,電子設(shè)備告警系統(tǒng)的具體檢查策略可以描述如下:
①討論電子設(shè)備在一個(gè)更新周期內(nèi)發(fā)現(xiàn)隱蔽功能故障(備用系統(tǒng)故障)和發(fā)生功能故障的有關(guān)事件及其概率,將該更新周期看作是k+1個(gè)檢查周期,每個(gè)檢查周期是相等的;
②如果電子設(shè)備在檢查間隔期內(nèi)發(fā)生功能故障,則立即進(jìn)行修復(fù);
③如在檢查間隔期內(nèi)未發(fā)生功能故障,在檢查中發(fā)現(xiàn)隱蔽功能故障,則立即進(jìn)行修復(fù),以避免產(chǎn)生多重故障;
④如在一個(gè)檢查間隔期內(nèi)既無功能故障發(fā)生,也未在檢查點(diǎn)發(fā)現(xiàn)隱蔽功能故障,則進(jìn)入下一個(gè)檢查間隔期,并按上述檢查策略重復(fù)進(jìn)行。
2.1基本假設(shè)
為了便于模型的建立,做假設(shè)如下:
①告警系統(tǒng)的故障與否必須經(jīng)過檢查才能發(fā)現(xiàn);
②若經(jīng)過檢查發(fā)現(xiàn)告警系統(tǒng)已經(jīng)故障,則立即進(jìn)行修理;
③經(jīng)過修理后可將設(shè)備完全恢復(fù)到正常工作狀態(tài),即修復(fù)如新;④檢查和維修工作所占用的時(shí)間小于檢查周期;⑤檢查是不完善的,告警系統(tǒng)故障在一次檢查中被發(fā)現(xiàn)的概率為α;
⑥固有缺陷導(dǎo)致的功能故障和告警系統(tǒng)故障引發(fā)的多重故障相互獨(dú)立。
2.2可用度分析
系統(tǒng)可用度是指在某時(shí)刻具有或維持其規(guī)定功能的概率,長時(shí)期使用的系統(tǒng)的期望可用度可以表示為[14]:
式(1)中ED表示一個(gè)周期內(nèi)的期望停機(jī)時(shí)間;EL表示期望更新周期的長度。
在任意時(shí)刻造成設(shè)備不可用的主要原因有以下幾種情況:一是告警裝置檢查維護(hù)所造成的停機(jī),這種情況通?;ㄙM(fèi)的時(shí)間較少;二是當(dāng)檢查出告警系統(tǒng)后對其進(jìn)行維修所造成的停機(jī);三是修復(fù)設(shè)備功能故障所造成的停機(jī),由于造成設(shè)備功能故障的情況通常比較復(fù)雜,因此,修復(fù)設(shè)備功能故障所學(xué)要的時(shí)間通常較長。設(shè)f(u)、F(u)分別為告警系統(tǒng)故障的概率密度函數(shù)和分布函數(shù);g(h)、G(h)為延遲時(shí)間的概率密度函數(shù)和分布函數(shù);電子設(shè)備的固有可靠度為R0(t);進(jìn)行一次檢查所需要的時(shí)間為Ti;設(shè)備功能故障所導(dǎo)致的停機(jī)時(shí)間為Ta;修復(fù)一次告警系統(tǒng)所需時(shí)間為Tb。
根據(jù)上文的分析,討論電子設(shè)備在k+1個(gè)周期內(nèi)發(fā)現(xiàn)預(yù)警系統(tǒng)故障(為了便于理解,以下將之稱為“隱蔽功能故障”)和電子設(shè)備發(fā)生功能故障的有關(guān)事件及其概率。
電子設(shè)備在(k+1)T第一次檢出隱蔽功能故障和首次發(fā)生功能故障的事件有:
事件1:設(shè)備在kT以前即已出現(xiàn)隱蔽功能故障,且kT前的各次檢查中未被檢出,同時(shí)設(shè)備也未發(fā)生功能故障,但在(k+1)T被檢出隱蔽功能故障。
在kT以前即已出現(xiàn)隱蔽功能故障的事件有多種可能。即包括在[0,T]、[T,2T]…[(k-1)T,kT]都可能出現(xiàn)隱蔽功能故障,而延遲時(shí)間h的終點(diǎn)應(yīng)該超過區(qū)間(k+1)T點(diǎn),如圖1所示。
其中,對于第i個(gè)檢查間隔期[(i-1)T,iT]出現(xiàn)隱蔽功能故障,在(k+1)T首次被檢出的概率為:
因此,事件1發(fā)生的概率:
事件2:電子設(shè)備在kT以后才出現(xiàn)隱蔽功能故障,但未發(fā)展為功能故障,在(k+1)T被檢出隱蔽功能故障,此時(shí)延遲時(shí)間h的終點(diǎn)應(yīng)該超過區(qū)間(k+1)T點(diǎn),如圖2所示:
圖2 事件2示意圖
事件2發(fā)生的概率為:
事件3:電子設(shè)備在kT以前已經(jīng)出現(xiàn)隱蔽功能故障,且kT前的各次檢查中未被檢出,在[kT,(k+1)T]中發(fā)展為功能故障。
與事件1類似,電子設(shè)備在kT以前即已出現(xiàn)隱蔽功能故障的可能事件包括:分別在[0,T]、[T, 2T]…[(k-1)T,kT]出現(xiàn)隱蔽功能故障,而延遲時(shí)間應(yīng)該延續(xù)到區(qū)間[kT,(k+1)T]內(nèi),如圖3所示:
圖3 事件3示意圖
其中,對于第i個(gè)檢查間隔期[(i-1)T,iT]出現(xiàn)隱蔽功能故障,在[kT,(k+1)T]中發(fā)展為功能故障的概率為:
所以事件3發(fā)生的概率為:
事件4:電子設(shè)備在kT以后才出現(xiàn)隱蔽功能故障,在[kT,(k+1)T]中發(fā)展為功能故障。此時(shí),延遲時(shí)間h應(yīng)該延續(xù)到區(qū)間內(nèi),如圖4所示:
圖4 事件4示意圖
其概率為:
事件5:設(shè)備在[kT,(k+1)T]中未出現(xiàn)隱蔽功能故障,但發(fā)生了功能故障。
造成該事件發(fā)生的主要原因是設(shè)備自身的缺陷。由固有可靠性決定的故障密度函數(shù)為:,而未發(fā)生隱蔽功能故障的概率為:1-F(t)。因此,事件5發(fā)生的概率為:
根據(jù)更新周期定義,將電子設(shè)備從開始投入使用到發(fā)生功能故障或檢查出隱蔽功能故障的累計(jì)工作時(shí)間間隔記為一個(gè)更新周期。那么對應(yīng)于事件1和事件2的情形,其更新間隔時(shí)間就可以看作是(k+1)T。而對于事件3~事件5的情形,其更新周期可以看作是u+h。
綜上所述,可以得到電子設(shè)備更新周期的期望為:
在一個(gè)更新周期內(nèi),恰好進(jìn)行了n次檢查的概率為:
所以,一個(gè)更新周期內(nèi)的平均檢查次數(shù)為:
一個(gè)更新周期內(nèi)的隱蔽功能故障檢查所需要的時(shí)間為:
一個(gè)更新周期內(nèi)功能故障發(fā)生的概率為:
一個(gè)更新周期內(nèi)因功能故障所導(dǎo)致的停機(jī)時(shí)間為:
一個(gè)更新周期內(nèi)通過檢查發(fā)現(xiàn)隱蔽功能故障的概率為:
所以,一個(gè)更新周期內(nèi)因隱蔽功能故障修復(fù)所需要的時(shí)間為:
綜上所述,一個(gè)更新周期內(nèi)因檢查和修復(fù)所需要花費(fèi)的總時(shí)間為:
分別將式(9)和式(17)代入式(1)就可以得到一個(gè)更新周期內(nèi)設(shè)備期望可用度Aav(T)。
2.3優(yōu)化算法
本文研究的最優(yōu)檢查策略是,在一個(gè)更新周期內(nèi),以系統(tǒng)可用度最大為目標(biāo),確定最優(yōu)檢查間隔時(shí)間T*??梢圆扇?shù)值迭代的方法來求解T*,設(shè)T*為非負(fù)整數(shù),求解步驟如圖5所示。
以某型通信設(shè)備遠(yuǎn)程告警系統(tǒng)為例,該告警裝置通過對通信設(shè)備輸出參數(shù)指標(biāo)進(jìn)行實(shí)時(shí)監(jiān)控,及時(shí)發(fā)現(xiàn)設(shè)備存在的異常狀況,并第一時(shí)間通過撥打電話的方式通知設(shè)備維修人員進(jìn)行維修,以減小或避免設(shè)備故障造成的損失。正常情況下,操作人員無法感知告警系統(tǒng)是否存在故障,只有通過相應(yīng)的檢查才能知道其狀態(tài)。因此,該告警系統(tǒng)的故障就屬本文所述“隱蔽故障”范疇。假設(shè)通信設(shè)備的固有可靠度服從λ=0.000 5/h的指數(shù)分布,假設(shè)告警系統(tǒng)發(fā)生隱蔽故障時(shí)間u和延遲時(shí)間h的分布函數(shù)分別為:
圖5 最優(yōu)檢查間隔期的求解步驟
假設(shè)每進(jìn)行一次告警系統(tǒng)檢查所需要的時(shí)間為2 h,進(jìn)行一次告警系統(tǒng)故障修復(fù)所用的時(shí)間為6 h,修復(fù)通信設(shè)備功能故障所需要的時(shí)間為12 h。下面,根據(jù)上文所提供的求解方法進(jìn)行優(yōu)化,優(yōu)化過程如下:
假設(shè)故障檢出率α的取值為0.9,根據(jù)2.3節(jié)所提出的優(yōu)化算法,可以得到檢查間隔期與系統(tǒng)期望可用度的關(guān)系,如下頁圖6所示。
由圖中可以看出,當(dāng)檢查間隔時(shí)間T=96(h)時(shí),設(shè)備的期望可用度最大為0.962 7。所以,當(dāng)備用系統(tǒng)故障檢出率α=0.9時(shí),對于通信設(shè)備來說最優(yōu)的檢查間隔期為T*=96 h。
下面,討論告警系統(tǒng)故障檢出率α的取值對系統(tǒng)可用度的影響。
假設(shè)其他參數(shù)不變,分別取α的值為0.6,0.7,0.8,0.9,可以得到不同α值下期望可用度與檢查間隔期的關(guān)系,如圖7所示:
圖6 檢查間隔期與可用度的關(guān)系
圖7 檢查間隔期與期望可用度的關(guān)系
從圖7中可以看出,其他條件不變,當(dāng)檢查間隔期相同時(shí),故障檢出率越高設(shè)備可用度就越高,這與實(shí)際維修情況是相符合的。因此,改進(jìn)故障檢查手段,提高故障檢出率是提高系統(tǒng)可用度的有效手段。此外,從圖中還可以看出系統(tǒng)可用度隨檢查間隔期的增長有一個(gè)從增大到減小的過程,這是因?yàn)槿绻麢z查間隔期越短,單位時(shí)間內(nèi)的檢查次數(shù)就越多,因檢查而造成的停機(jī)時(shí)間也越長,相應(yīng)的期望可用度也就越小。檢查間隔期過長,單位時(shí)間內(nèi)的檢查次數(shù)過少,不能及時(shí)發(fā)現(xiàn)告警裝置故障,造成設(shè)備功能故障,導(dǎo)致較長的停機(jī)維修時(shí)間,從而造成系統(tǒng)期望可用度的下降。
本文在前人研究的基礎(chǔ)上,針對電子設(shè)備告警系統(tǒng)故障具有隱蔽性的特點(diǎn),利用延遲時(shí)間模型,考慮故障檢查不完善的因素,研究分析了檢查間隔時(shí)間與系統(tǒng)可用度的關(guān)系,建立了基于可用度最大的電子設(shè)備隱蔽功能故障檢查模型,提出了最佳檢查間隔期的優(yōu)化算法。最后以某型通信設(shè)備遠(yuǎn)程告警裝置為例,進(jìn)行了驗(yàn)證分析,表明該檢查模型具有合理性而且有較大的實(shí)際應(yīng)用價(jià)值。
[1]趙建民,王云峰.兩階段功能檢查模型研究[J].系統(tǒng)工程與電子技術(shù),2000,12(12):49-51.
[2]趙建民,張森林,田燕.潛在故障檢查策略及案例研究[J].中國機(jī)械工程,2009,20(23):2832-2836.
[3]趙建民,白進(jìn)達(dá).考慮修理延誤情況下的最優(yōu)維修測[J].系統(tǒng)工程與電子技術(shù),2009,31(5):1288-1258.
[4]CHRISTER A H,WANG W,CHOI JM,et al.The delay-timemodeling of preventivemaintenance of plant given limited PM Data and Selective repair at PM[J].IMA JMathsApplBus Ind 1998,9:355-79.
[5]WANGW.An inspectionmodel for a processwith two types of inspections and repairs[J].ReliabEngSystSaf,2009,94:526-33.
[6]CHAY SC,MAZUMDAR M.Determination of test intervals in certain repairable standby protective systems[J].IEEE Transactionson Reliability,1975:201-205.
[7]TANGTQ,LINDM,ANDREW K S.Jardine availability of asystem subject to hidden failure inspected atconstant intervals with non-negligible downtime due to inspection and downtime due to repair/replacement[J].JournalofStatistical Planningand Inference,2013,143:176-185.
[8]倪愛偉,謝里陽,翁剛,等.基于RCMII和CCF理論的隱蔽性故障的新評價(jià)模型[J].東北大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,29(1):105-108.
[9]倪愛偉,謝里陽,翁剛,等.神經(jīng)網(wǎng)絡(luò)求解隱蔽性故障率[J].機(jī)械制造,2007,45(514):4-6.
[10]蘇義.記載設(shè)備隱蔽性故障及維修策略[J].航空制造技術(shù),2010,12:86-88.
[11]刁海飛,蔡景,林海彬,等.基于多目標(biāo)的隱蔽功能故障檢測間隔優(yōu)化方法研究[J].飛機(jī)設(shè)計(jì),2014,34(3):33-36.
[12]ELSAYED A.ELSAYED.可靠性工程[M].楊舟,譯.北京:電子工業(yè)出版社,2013.
[13]CHRISTER A H,WALLER W M.Reducing production downtimeusing delay time analysis[J].Journalof the OperationalResearch Society,1984,35(6):499-512.
[14]賈希勝.以可靠性為中心的維修模型[M].北京:國防工業(yè)出版社,2007.
An Inspection Policy for Alarm System of Electronic Equipment Based on Availability
JIANGXin-liang1,ZHAO Jian-min1,SU Bo2
(1.Ordnance Engineering College,Shijiazhuang 050003,China;2.Unit73158 of PLA,Xiamen 361100,China)
The failure of alarm system of electronic equipment has the properties of hidden,based on the properties,a model is developed to optimize the inspection schedule by using the concept of delay time.The model is provided to maximizes expected availability,and the situation of imperfect inspection is considered.Finally,an example proves that themodel is effective and economical.
electronic equipment,alarm system;delay time,hidden function failure,inspection interval
E92
A
1002-0640(2016)09-0161-05
2015-03-05
2015-05-07
國家自然科學(xué)基金資助項(xiàng)目(71401173)
姜新亮(1982-),男,河南扶溝人,碩士。研究方向:可靠性工程。