顏世剛
(92941部隊94分隊 葫蘆島 125001)
艦炮火控設(shè)備板級故障快速分析定位方法
顏世剛
(92941部隊94分隊 葫蘆島 125001)
結(jié)合某新型艦炮武器試驗中故障排除實際經(jīng)驗,針對裝備故障定位分析,提出了板級故障樹分析法;對其中涉及的基本概念、方法步驟等方面進行了介紹。通過裝備的故障實例,對板級故障分析法的應(yīng)用進行了詳細(xì)闡述;實踐證明板級故障樹分析法對裝備各類軟硬故障定位分析有很高的實用性和推廣價值。
故障; 板級; 故障樹; 事件
Class Number TJ391
隨著新型武器裝備技術(shù)快速發(fā)展,裝備的復(fù)雜度、集成度越來越高,裝備功能模塊化,模塊集成板級化,單塊板子能實現(xiàn)多種復(fù)雜功能。武器裝備在出現(xiàn)故障時,對于故障板子如何通過正確有效的方法分析模塊故障,定位故障點,這在戰(zhàn)場快速維修中至關(guān)重要;迅速定位故障點,是快速修復(fù)武器裝備的關(guān)鍵,而科學(xué)合理的故障分析方法是快速故障定位的基礎(chǔ)和前提[1]。一種科學(xué)合理能夠快速定位故障的分析方法,其一能夠縮短故障修復(fù)時間,快速恢復(fù)裝備狀態(tài),保證作戰(zhàn)任務(wù)的完成,其二提高設(shè)備故障維修效率,節(jié)省相關(guān)經(jīng)費。本文根據(jù)在多型艦炮武器系統(tǒng)試驗中排除故障的實際經(jīng)驗,總結(jié)出一套行之有效的板級故障定位分析方法,對于各類裝備板級故障的快速定位修復(fù),具有很強的實用性和指導(dǎo)意義。
板級故障定位分析方法的理論基礎(chǔ)是故障樹,通過建立板級故障樹,并對故障樹的每一個事件按照故障樹的邏輯關(guān)系展開具體分析;依據(jù)板級電路功能和電路邏輯關(guān)系,分析故障樹事件的組成,定義故障樹的頂事件和底事件,分析硬件電路的邏輯,建立板級樹狀邏輯關(guān)系故障圖,按照板級故障樹的層次邏輯定性和定量分析排除故障,稱之為板級故障樹分析法。
2.1 板級故障樹分析法的基本概念
故障樹分析方法是一種安全可靠的分析技術(shù),也是目前故障診斷中應(yīng)用較多的方法之一,它建立在對故障經(jīng)驗庫基礎(chǔ)上,采用逆向推理,將系統(tǒng)級的故障現(xiàn)象(頂事件)與最基本的故障原因(底事件)之間的內(nèi)在關(guān)系表示成樹形的網(wǎng)絡(luò)圖,各層事件之間通過“與”、“或”“非”、“異或”等邏輯關(guān)系相關(guān)聯(lián)[2,5,8]。板級故障樹分析法通常把故障狀態(tài)稱為頂事件,然后找出系統(tǒng)故障和導(dǎo)致系統(tǒng)故障的諸原因之間的邏輯關(guān)系。并將這些邏輯關(guān)系用邏輯符號表示出來,由上而下逐層分解,直到不能分解為止,推導(dǎo)出各故障和各單元故障之間的邏輯關(guān)系,利用這種邏輯關(guān)系從頂層事件故障出發(fā),逐漸向下演繹,最終找出對應(yīng)的底層故障原因。
2.2 板級故障樹建立的基本步驟
1) 確定頂事件。頂事件是指定進行邏輯分析的故障事件,一般為故障現(xiàn)象。
2) 分析頂事件。尋找引起頂事件發(fā)生的直接、必要和充分原因。將頂事件作為輸出事件,將所有直接原因作為輸入事件,也稱底事件,并根據(jù)這些事件實際的邏輯關(guān)系用適當(dāng)?shù)倪壿嬮T相聯(lián)系,并按板子硬件電路功能邏輯進行分析。
3) 分析每一個與頂事件直接相聯(lián)系的底事件。如果該事件還能進一步分解,則將其作用下一級的輸出事件,如同步驟2)中對頂事件那樣進行處理,底事件單元確定要盡量按照板子中相對獨立的硬件電路功能來劃分。
4) 重復(fù)上述步驟,逐級向下分解,直到所有的輸入事件不能再分解或不必要再分解為止,即建成了一棵故障樹。
5) 分析排查每一個底事件,找出故障的底事件,分析底事件,也就是分析一個個縮小簡單的硬件電路功能單元,看是否能實現(xiàn)其正常的功能。
3.1 故障現(xiàn)象
在某型艦炮武器系統(tǒng)試驗中,火控設(shè)備的射擊指揮臺任務(wù)計算機多次出現(xiàn)死機現(xiàn)象:應(yīng)用程序停滯,與外部通信停止,外接操控設(shè)備無響應(yīng),多次死機之后該計算機無視頻信號輸出,無啟動提示音,不能正常啟動。經(jīng)分析確認(rèn),該計算機的CM主板故障。
3.2 故障主板功能及上電過程分析
CM主板為單板加固計算機模塊,主要功能包括處理器子系統(tǒng)、存儲子系統(tǒng)、顯示子系統(tǒng)、I/O接口子系統(tǒng)和總線接口子系統(tǒng)。通過分析CM主板電路邏輯[3],得出其上電啟動過程原理如圖1所示。
圖1 CM主板上電啟動過程原理框圖
上電后,+5V電壓監(jiān)控芯片輸出PWRGOOD高電平信號;1.5V_PWRGD和PWRGOOD信號經(jīng)過與門后,輸出ICH1.5V_PGD高電平信號;PWRGOOD信號啟動南北橋電壓轉(zhuǎn)換電路。南北橋電壓轉(zhuǎn)換電路輸出電壓VCCP_PWRGD及VCC_GMCH_PWRGD,這兩個信號經(jīng)過與門后輸出IMVP_PG高電平信號;IMVP_PG和ICH1.5V_PGD信號經(jīng)過與門后,輸出ALL_PWRGD_OK高電平信號;ALL_PWRGD_OK信號通過與門輸出PWRGD_OK高電平信號;處理器核心電壓轉(zhuǎn)換電路檢測到IMVP_PG及PWRGD_OK信號為高電平后,啟動CPU核心電壓轉(zhuǎn)換電路;ICH7M檢測到CPU_VR_PWRGD和PWRGD_OK信號都為高電平后,發(fā)出H_PWRGD高電平信號給處理器,并發(fā)出PLT_RST低電平脈沖;PLT_RST低電平脈沖信號復(fù)位并初始化BIOS、網(wǎng)絡(luò)控制芯片、PCI橋接芯片、IDE、U7等;U7收到PLT_RST脈沖信號后,發(fā)出H_CPURST#,復(fù)位CPU;ICH7M發(fā)出PLT_RST低電平脈沖后,發(fā)出H_INIT低電平脈沖給BIOS芯片和CPU,CPU收到該信號后,執(zhí)行BIOS內(nèi)容。
3.3 板級故障樹的建立
通過對CM主板進行初步故障測試分析以及上電過程分析,先確定頂事件,把故障現(xiàn)象定為頂事件,即:主板上電無法啟動,根據(jù)故障現(xiàn)象、主板功能、板子上電分析和1.2故障樹建立的基本方法步驟分析,劃分底事件,建立故障樹,如圖2CM板上電不能啟動故障樹所示。
圖2 CM板上電不能啟動故障樹
故障樹中頂事件為:D:主板上電無法啟動。
底事件包括:D1:BIOS程序故障;D2:時鐘信號故障;D3:電源故障;D4:主要控制信號故障;D5:外圍器件故障;D6:北橋芯片U7故障。
3.4 故障樹事件排查分析
3.4.1 排查D1 BIOS程序故障
BIOS程序燒寫錯誤或BIOS芯片損壞會導(dǎo)致主板上電無法正常啟動。將功能確認(rèn)正常的已燒寫B(tài)IOS程序的芯片安裝到故障板卡上,主板上電無法啟動,故障未消除;將故障板上的BIOS芯片安裝到功能確認(rèn)正常的板卡上,主板上電正常啟動。通過將故障板和正常板卡上的BIOS芯片對調(diào)試驗,可以確認(rèn)故障板上的BIOS芯片及程序良好,除底事件D1。
3.4.2 排查D2時鐘信號故障
板上的時鐘信號故障會造成板上主要芯片無法正常工作,最終導(dǎo)致主板無法正常啟動。給板上芯片提供時鐘信號的晶體及芯片有:Y3,OSC1,Y1;板卡上電后,用示波器對各時鐘信號進行測量,Y3的頻率為33MHz,Y1的頻率為14.3MHz,,OSC1的頻率為27MHz。經(jīng)過檢測對比,上述時鐘信號波形與正常主板相應(yīng)波形完全一致,滿足芯片工作對時鐘信號的要求,因此上述時鐘信號波形正常,排除底事件D2。
3.4.3 排查D3電源故障
電源是向芯片及其他電子部件提供電能的裝置,當(dāng)板上某個電壓出現(xiàn)故障時,個別芯片無法正常工作,也會導(dǎo)致主板上電無法啟動。CM主板上的電壓有:12V,5V,3.3V,1.8V_DDR2,0.9VS,VCC_GMCH_CORE,2.5VS,1.05VS,VCC_CORE,1.5VSB,M22_2.5V,M22_1.8V,VDDC_CT,VCC3.3V等,通過萬用表對板上各電壓進行測量發(fā)現(xiàn),測量電壓2.5VS時為0V,而非正常的2.5V,其他電壓測量為正常,因此對2.5VS電壓進行對地阻抗測量,發(fā)現(xiàn)2.5VS對GND短路。通過對板上供電電壓進行測量,確認(rèn)電源故障是導(dǎo)致主板無法啟動的一個原因,底事件D3電源故障是導(dǎo)致主板無法啟動的一個原因。
3.4.4 排查D5外圍器件故障
由D3底事件得知,板上2.5VS對GND短路,2.5VS主要給北橋U7供電,北橋芯片無法正常工作導(dǎo)致主板上電無法正常啟動。2.5VS由電源芯片U40(ISL6537)產(chǎn)生的,相關(guān)電路圖見圖3所示。
為了確認(rèn)具體故障點,將Q21去掉,用萬用表測量Q21前后兩端發(fā)現(xiàn),電源芯片U40端短路故障消失,北橋一端短路故障仍然存在,所以將故障范圍確定在北橋和北橋外圍器件(電容)上。板上電源2.5VS的去耦電容包括C261、BC141、BC160、C359,C107、C686、BC153、C343,將所有關(guān)聯(lián)電容去掉后,短路故障未消除,排除此底事件D5。
3.4.5 排查D6北橋芯片U7故障
在排除底事件D5后,造成2.5VS對GND短路的故障點暫時確認(rèn)為北橋芯片U7故障。北橋芯片U7提供處理器的64位前端總線,集成內(nèi)存控制器,提供×16 PCi-Express總線(用于擴展獨立顯示芯片),北橋芯片負(fù)責(zé)與CPU的聯(lián)系并控制內(nèi)存和顯示數(shù)據(jù)。將北橋芯片U7焊下后,用萬用表測量故障板上2.5VS和GND兩端,結(jié)果短路故障消失,更換新的北橋芯片U7之后此主板可以正常啟動,底事件D6北橋芯片U7故障是造成主板無法正常啟動的原因。
圖3 2.5VS電壓相關(guān)電路圖
3.4.6 排查D4主要控制信號故障
在排查底事件D3時得知,板上電壓存在故障,在電壓存在故障的前提下無法對板上主要控制信號進行測量分析。更換新的北橋芯片U7之后對主要控制信號進行相關(guān)測量,各信號皆正常,由此可真正排除底事件D4。
3.5 故障定位及解決措施
根據(jù)上述分析排查可得出北橋芯片U7故障是造成主板無法正常啟動的原因,將故障板上的U7更換后主板可以正常啟動。
板級故障樹分析法通過清晰的故障樹圖形,直觀地列出功能板內(nèi)各模塊的內(nèi)在的聯(lián)系,并指出內(nèi)部電路之間發(fā)生故障的邏輯聯(lián)系,因此容易找出系統(tǒng)的薄弱環(huán)節(jié)[9~10]。板級故障樹分析的過程也是一個對裝備硬件結(jié)構(gòu)原理更深入認(rèn)識的過程。通過板級故障樹,使維修人員能夠清晰把握裝備功能實現(xiàn)的內(nèi)在聯(lián)系以及板級電路的邏輯原理,弄清各種潛在因素對故障發(fā)生影響的途徑和程度,在分析過程中便能發(fā)現(xiàn)問題,及時加以解決。它不僅分析了現(xiàn)有的問題,而且提出了解決辦法和改進措施,從而增加了使用維修人員對裝備的原理、結(jié)構(gòu)、硬件邏輯等認(rèn)識的深度。
故障分析中要考慮諸多因素,板級故障樹分析法都能考慮進去,它不限于對裝備故障進行一般性分析,而是分析裝備的各種故障狀態(tài)、板級硬件電路的邏輯關(guān)系。故障樹建成后,對其他使用維修人員來說有了一個內(nèi)容豐富、邏輯嚴(yán)密、形象快捷的維修指南。裝備板級故障樹分析方法,對于快速定位分析裝備板級故障提供了一個很好的思路,對于各類裝備中弱電路類故障排除具有極強的借鑒意義和推廣價值。
[1] 馬世寧,等.裝備戰(zhàn)場應(yīng)急維修技術(shù)[M].北京:國防工業(yè)出版社,2009:1-9.
[2] 包勇,張德銀,莊緒巖.基于動態(tài)故障樹技術(shù)的故障診斷專家系統(tǒng)[J].四川大學(xué)學(xué)報(自然科學(xué)版),2014,51(6):1211-1216.
[3] 史新福,等.32位微型計算機原理.接口技術(shù)及其應(yīng)用[M].北京:清華大學(xué)出版社,2007:15-50.
[4] 金亮亮.基于故障樹的航天器故障診斷專家系統(tǒng)研究[D].南京:南京航空航天大學(xué)碩士學(xué)位論文,2008:12-23.
[5] 孫濤,李曉芳,石晨光,等.基于本體的艦炮故障樹建模方法研究[J].艦船電子工程,2014(8):103-106.
[6] 王曉輝,龔俊宇,紀(jì)浩.測控系統(tǒng)典型案故障例分析[J].計算機測量與控制,2015,23(8):2610-2613.
[7] 白穎,李俊年.基于故障樹的某型艦炮轉(zhuǎn)彈阻鐵不解脫故障分析與處理[J].四川兵工學(xué)報,2014(1):28-30.
[8] 胡隆基.基于故障樹分析法的某型高炮隨動系統(tǒng)故障診斷[J].四川兵工學(xué)報,2011(4):40-43.
[9] 高美娟,劉白林,張振華.火控系統(tǒng)故障預(yù)測與健康管理技術(shù)[J].火力指揮與控制,2015(5):1-3.
[10] 樊水康,郭會兵,郭慧鑫.火控系統(tǒng)故障檢測與智能診斷[J].火力指揮與控制,2014(6):143-145.
Fast Location Method of Board Level Fault of Shipborne Gun Fire Control Unit
YAN Shigang
(Unit 94, No. 92941 Troop of PLA, Huludao 125001)
For equipment failure analysis and location, the paper combined the practical experience of trouble shooting in a new shipborne gun weapon system test, proposed the analytical method of board level fault tree. In the paper, some basic concepts, method and steps were introduced. Combined with a example of equipment failure, the paper discussed the application of the analytical method of board leve fault tree in detail. Practical results indicated that the analytical method of board leve fault tree had better practicability and value popularization.
fault, board level, fault tree, event
2016年8月1日,
2016年9月23日
顏世剛,男,碩士研究生,高級工程師,研究方向:武器系統(tǒng)試驗鑒定與仿真。
TJ391
10.3969/j.issn.1672-9730.2017.02.026