宋 丫,劉宵辰,王曉航
(中國航空工業(yè)集團(tuán)公司 西安航空計算技術(shù)研究所,陜西 西安 710065)
機(jī)載電子設(shè)備,例如機(jī)電管理計算機(jī),通常使用非易失隨機(jī)訪問存儲器(NVRAM,Non-Volatile Random Access Memory)進(jìn)行產(chǎn)品故障信息記錄。主要由于NVRAM可實(shí)現(xiàn)持久化的信息存儲,即在產(chǎn)品斷電后仍能保持所存儲的數(shù)據(jù)不會丟失,從而在故障發(fā)生后的第一時間讀取歷史信息,復(fù)原故障現(xiàn)場。
由于現(xiàn)代飛機(jī)功能設(shè)計越來越豐富,各接口部件間的交聯(lián)關(guān)系也愈發(fā)復(fù)雜,一起故障的發(fā)生往往是由于多重因素導(dǎo)致。傳統(tǒng)的故障記錄通常按照接口類型逐一列舉,這種遍歷式的記錄方法雖然可以覆蓋硬件接口,但由于缺乏對重要接口及故障場景的區(qū)分,導(dǎo)致數(shù)據(jù)冗余,排查人員將大量時間耗費(fèi)在讀取并篩選數(shù)據(jù)上,同時要求排查人員精通項目設(shè)計,能夠從大量平鋪式數(shù)據(jù)中甄別出異常以及相關(guān)聯(lián)系。這遠(yuǎn)不能滿足現(xiàn)有綜合化系統(tǒng)的故障診斷、分析及定位需求。
本文提出了一種基于失效場景的故障記錄方法,該方法具有維護(hù)效率高、可移植性強(qiáng)、靈活性高的特點(diǎn)。通過對失效場景下相關(guān)信息的綜合分析,快速排查故障可能誘因,節(jié)約時間及人力成本。
本文設(shè)計的故障記錄方法主要用于機(jī)載電子設(shè)備故障信息存儲,并為設(shè)備的工作現(xiàn)場復(fù)現(xiàn)、故障分析、定位提供了依據(jù)。在進(jìn)行具體的案例設(shè)計時,可以從以下幾個步驟入手:
1) 根據(jù)不同機(jī)載設(shè)備對失效場景的需求設(shè)計NVRAM模塊,例如對參考電壓的監(jiān)控,看門狗報警,機(jī)翼折疊展開控制,火警告警等。另外,產(chǎn)品自測試(BIT,Built-in Test)作為一項重要的故障檢測手段也需要記錄在內(nèi),方便排查接口的硬線故障。
2) 根據(jù)設(shè)備配置的NVRAM存儲容量、失效場景種類、接口BIT數(shù)量、單項故障信息記錄格式所占存儲容量等,進(jìn)行NVRAM區(qū)域劃分。
3) 在NVRAM中分別設(shè)置信息區(qū)域及索引區(qū)域。信息區(qū)域用來記錄各類故障信息,索引區(qū)域用于記錄每類故障信息的實(shí)時記錄位置,方便讀寫的同時防止信息覆蓋。本文方案設(shè)計如圖1所示,BIT分為上電BIT、周期BIT、維護(hù)BIT,失效場景有參考電壓異常監(jiān)控,看門狗報警,火警告警。
圖1 NVRAM區(qū)域劃分
4) 當(dāng)發(fā)生一項故障時,首先根據(jù)此項故障類型,進(jìn)行索引查找,獲取該條記錄應(yīng)該的存儲地址,而后將發(fā)生該類故障的故障時間、故障分類、故障現(xiàn)場等信息寫入NVRAM對應(yīng)位置中,最后更新索引為下一次記錄地址。
首先,根據(jù)產(chǎn)品設(shè)計需求,確定故障記錄的格式,即一條記錄包括哪些內(nèi)容。本文采用的故障記錄格式如圖2所示。
圖2 故障記錄格式
其次,根據(jù)設(shè)備配置的NVRAM容量,進(jìn)行NVRAM區(qū)域劃分。例如NVRAM為128 kB,可將0 kB~100 kB設(shè)置為信息記錄區(qū)域,而將索引區(qū)域設(shè)置在101 kB~128 kB范圍中。綜合考慮幾類故障發(fā)生的頻次,為高頻次的故障類型預(yù)留更多的記錄空間。本文為上電BIT、周期BIT、維護(hù)BIT,參考電壓異常,看門狗報警,火警告警分配的空間占比為1∶5∶1∶1∶1∶1。
另外,在進(jìn)行故障記錄時,可結(jié)合設(shè)備的具體工作狀態(tài)和是否為重復(fù)單一型故障,為各類型故障設(shè)置單次上電記錄上限,以避免出現(xiàn)某種故障反復(fù)發(fā)生而大量占用NVRAM存儲資源的情況,尤其是周期BIT的故障記錄,當(dāng)某一接口反復(fù)出錯時,只需要記錄一次故障狀態(tài),若后續(xù)故障消失,則記錄為非持續(xù)性故障。此外還需注意,如果同一時刻發(fā)生多項故障,應(yīng)根據(jù)設(shè)備的處理能力,在不影響正常功能運(yùn)行的前提下酌情選擇記錄。
最后,完整的故障記錄過程應(yīng)包括:1) 產(chǎn)品上電后,判斷現(xiàn)存的NVRAM索引區(qū)域范圍是否有效。如果某項索引未在預(yù)先設(shè)定的范圍內(nèi),則將該項索引重置到對應(yīng)范圍起始地址,開始新一輪的記錄。2) 當(dāng)發(fā)生某類故障時,根據(jù)類型進(jìn)行索引查找并記錄到索引位置,如果查找到的索引未在預(yù)設(shè)范圍內(nèi),則進(jìn)行索引重置,將該項索引重置到對應(yīng)范圍起始地址。3) 將該類型故障的發(fā)生/消失時間、故障項編碼、故障機(jī)理等信息按照規(guī)定的故障記錄格式寫入NVRAM中,并將相應(yīng)類型的索引進(jìn)行更新。
在設(shè)備發(fā)生故障時,NVRAM中存儲的故障信息對系統(tǒng)故障的診斷、分析及定位具有重要的參考價值。使用NVRAM的出發(fā)點(diǎn)是為了更好地記錄信息、還原故障現(xiàn)場。本文提出的故障信息記錄方法靈活可靠、可移植性強(qiáng)。通過對故障信息進(jìn)行分類記錄,可快速還原失效場景,極大降低了故障排查、分析及定位難度,節(jié)約人力及時間成本,為設(shè)備的高效維護(hù)提供了有力保障。