呂 達(dá),王啟寧,熊浩倫,李志剛
一種小衛(wèi)星綜合電子計(jì)算機(jī)故障檢測與系統(tǒng)重構(gòu)方法
呂 達(dá),王啟寧,熊浩倫,李志剛
(航天東方紅衛(wèi)星有限公司 北京 100094)
小衛(wèi)星綜合電子計(jì)算機(jī)相當(dāng)于衛(wèi)星的大腦,對可靠性、處理能力有很高的要求。故障檢測與系統(tǒng)重構(gòu)方法是提高綜合電子計(jì)算機(jī)可靠性的有效方法。針對小衛(wèi)星綜合電子計(jì)算機(jī)采用的余度結(jié)構(gòu),進(jìn)行軟件管理策略的研究和設(shè)計(jì),提出基于節(jié)點(diǎn)健康矩陣的余度總線重構(gòu)方法及多CPU并行處理系統(tǒng)自適應(yīng)重構(gòu)方法。在故障注入試驗(yàn)中,綜合電子計(jì)算機(jī)在遇到故障時(shí)能夠?qū)崟r(shí)檢測出故障,診斷故障類型,并對故障進(jìn)行處理,實(shí)現(xiàn)系統(tǒng)重構(gòu),保證小衛(wèi)星長期在軌的安全飛行。
綜合電子計(jì)算機(jī);容錯(cuò);余度管理;CAN總線
傳統(tǒng)衛(wèi)星各分系統(tǒng)多采用相互獨(dú)立的設(shè)計(jì)方案,使衛(wèi)星的姿態(tài)控制、推進(jìn)控制、熱控控制、星地鏈路通信及電源控制等功能分散,導(dǎo)致整星質(zhì)量重、功耗高、體積大、接口關(guān)系復(fù)雜、系統(tǒng)重構(gòu)能力弱、功能密度低。目前國內(nèi)外已有多顆衛(wèi)星采用衛(wèi)星綜合電子技術(shù)[1-4],將各分系統(tǒng)獨(dú)立設(shè)計(jì)改為對整星一體化設(shè)計(jì),硬件資源統(tǒng)一應(yīng)用、調(diào)配和運(yùn)行,并充分發(fā)揮軟件的各種功能,實(shí)現(xiàn)整星的信息共享、系統(tǒng)簡便配置和總體性能優(yōu)化。
綜合電子計(jì)算機(jī)對衛(wèi)星的平臺和載荷數(shù)據(jù)進(jìn)行集中處理,對CPU的處理速度提出了很高的要求,采用單一CPU很難滿足需求[5,6]。因此,本文采用多CPU并行處理系統(tǒng)提高綜合電子計(jì)算機(jī)的處理能力。小衛(wèi)星綜合電子系統(tǒng)FDIR[7-10](Fault Detection Isolation and Recovery)技術(shù)是提高衛(wèi)星故障處理能力的重要手段,是綜合電子計(jì)算機(jī)設(shè)計(jì)一項(xiàng)重要內(nèi)容,本文對綜合電子計(jì)算機(jī)進(jìn)行了故障檢測與系統(tǒng)重構(gòu)設(shè)計(jì),提出了基于節(jié)點(diǎn)健康矩陣的余度總線重構(gòu)方法及多CPU并行處理系統(tǒng)自適應(yīng)重構(gòu)方法。
綜合電子計(jì)算機(jī)采用雙余度對稱結(jié)構(gòu)設(shè)計(jì),包含2個(gè)中央處理單元(CPUA0/CPUB0)、2個(gè)接口擴(kuò)展單元(CPUA1/CPUB1)和2個(gè)信號處理擴(kuò)展單元(CPUA2/CPUB2),多CPU系統(tǒng)采用了相似余度,相同的功能單元具有相同的硬件配置。中央處理單元與各擴(kuò)展單元之間采用機(jī)內(nèi)總線/共享內(nèi)存實(shí)現(xiàn)數(shù)據(jù)的共享和交互。2個(gè)中央處理單元各包含2路CAN接口、5路RS422接口,DI及DO接口,負(fù)責(zé)總線通信、遙測遙控、健康管理、時(shí)間管理等功能,為系統(tǒng)的主控單元。2個(gè)接口擴(kuò)展單元各包含AD采集接口、控溫、測溫回路、OC指令輸出接口,實(shí)現(xiàn)模擬量采集、預(yù)處理、控溫算法與溫控輸出、OC指令輸出等,是系統(tǒng)的從屬單元。2個(gè)信號處理擴(kuò)展單元各包含2 路LVDS 接口及1553B接口,負(fù)責(zé)與外部載荷的信息處理與傳輸,其中包括信息的采集、數(shù)據(jù)的運(yùn)算與處理、數(shù)據(jù)存儲、輸出,也作為系統(tǒng)的從屬單元。
圖1 綜合電子計(jì)算機(jī)硬件架構(gòu)
綜合電子計(jì)算機(jī)采用雙余度備份,在余度結(jié)構(gòu),余度數(shù)目相同的情況下,余度級別不同,其系統(tǒng)可靠度也大不相同。余度級別可以分為功能模塊級冗余及系統(tǒng)級冗余。
并聯(lián)系統(tǒng)可靠度公式為
①若采用功能模塊級的雙余度,先并后串,綜合電子計(jì)算機(jī)拓?fù)浣Y(jié)構(gòu)如圖2所示。
模塊級雙冗余拓?fù)浣Y(jié)構(gòu)余度可靠度公式如下
②若采用系統(tǒng)級的雙余度,先串后并,綜合電子計(jì)算機(jī)拓?fù)浣Y(jié)構(gòu)如圖3所示。
圖3 系統(tǒng)級雙冗余
系統(tǒng)級雙冗余度拓?fù)浣Y(jié)構(gòu)可靠度公式如下
綜合電子計(jì)算機(jī)作為小衛(wèi)星的大腦,通過星上雙余度CAN總線實(shí)現(xiàn)與所有下位機(jī)間的數(shù)據(jù)交互,發(fā)送間接指令及輪詢遙測數(shù)據(jù)。綜合電子計(jì)算機(jī)(簡稱主機(jī))為主節(jié)點(diǎn),其余下位機(jī)均作為子節(jié)點(diǎn),對于某個(gè)下位機(jī),主機(jī)結(jié)合節(jié)點(diǎn)的健康狀態(tài)與優(yōu)先級選擇其中一條總線與下位機(jī)通信,在通信過程中實(shí)現(xiàn)故障的檢測并完成動態(tài)重構(gòu)。
圖4 可靠性曲線
假定系統(tǒng)中含有個(gè)下位機(jī),主機(jī)和各個(gè)下位機(jī)通過雙冗余總線形成星上網(wǎng)絡(luò),定義節(jié)點(diǎn)健康狀態(tài)矩陣
表示各子節(jié)點(diǎn)健康狀態(tài)(1表示故障,0表示正常,初始值為0)。定義主機(jī)接口的健康狀態(tài)λ,如式(6)所示。若主節(jié)點(diǎn)通過總線與所有下位機(jī)均通信失敗次數(shù)均達(dá)到max0,則1。