李 瑭,王志生,楊 洋,王紹山
(北京跟蹤與通信技術研究所 北京 100094)
航天測控系統(tǒng)是對航天器飛行進行跟蹤測量、對工作狀態(tài)進行監(jiān)視與控制的技術系統(tǒng)[1],是天地聯(lián)系的唯一手段。在載人航天任務中,系統(tǒng)還提供天地話音、圖像和應用數(shù)據(jù)傳輸?shù)裙δ?,被稱為測控通信系統(tǒng)。因此,在航天任務中,測控系統(tǒng)的可靠運轉是航天器正常運行和航天員安全的重要保障,對系統(tǒng)可靠性的定量分析是實現(xiàn)系統(tǒng)最優(yōu)化設計的重要依據(jù),尤其是在航天器和航天員長期在軌工作階段,可靠性定量化分析結果可直接指導測控通信資源配置。
航天測控系統(tǒng)本質上屬于多階段任務系統(tǒng)PMS[2]。從上世紀以來,國內外學者對PMS 提出了經典的可靠性求解算法[3-6],但是,關于航天測控系統(tǒng)的可靠性研究的相關成果較少,現(xiàn)有研究成果主要是基于經典的可靠性計算理論進行的。
Jeff B.Berried 指出了研究測控網(wǎng)可靠性的必要性,以及單元可靠性對系統(tǒng)可靠性的影響[7],但并未對可靠性評價方法進行論述。南加州噴氣推進實驗室使用可靠性框圖模型和仿真方法,建立了美國國家航空航天局的SIM(Space Interferometry Mission)任務的可靠模型[8]。Erdem Demircioglu 等對航天測控系統(tǒng)的可靠性進行了分析[9],仿真建立了航天測控系統(tǒng)可靠性指標曲線,用于優(yōu)化系統(tǒng)結構。文獻[10]介紹了串、并、混聯(lián)、備份等經典的系統(tǒng)可靠性分析技術。高薇等運用故障樹分析方法對航天測控系統(tǒng)中的應急通信網(wǎng)絡系統(tǒng)進行了基本可靠性計算[11]。馬順南等深入研究了測控系統(tǒng)的可靠性計算框架[12],按照不同的測控業(yè)務建立可靠性原理框圖,通過Bayes 模型計算整個系統(tǒng)的可靠性。
分析表明,上述方法均為近似描述航天測控系統(tǒng),未全面反映系統(tǒng)的特點。因此,可靠性定量化準確計算成為長期以來困擾測控系統(tǒng)的難題。本文提出了基于Markov 模型的航天測控系統(tǒng)可靠性計算方法,借鑒Markov 鏈描述航天測控系統(tǒng)可靠性階段內狀態(tài)轉移過程;綜合利用全概率思想進行階段間狀態(tài)映射,體現(xiàn)階段間的依賴性;最后通過與蒙特卡洛仿真結果的比對,驗證Markov 方法的準確性。
航天測控系統(tǒng)由多個任務中心、分布在國內外的地面測控站、航行在海上的測量船、接近全球覆蓋的中繼衛(wèi)星系統(tǒng)以及地面通信網(wǎng)組成。在可靠性方面,航天測控系統(tǒng)的特點包括動態(tài)性、復雜性、可維修性、階段間相關性等。
①動態(tài)性:中繼衛(wèi)星系統(tǒng)、地面測控站分布于不同的地理位置,各測控資源為航天器提供服務的時間有所不同,因此不同時間段內系統(tǒng)的參試結構和組成不同,呈現(xiàn)動態(tài)變化。
② 復雜性:系統(tǒng)執(zhí)行任務的環(huán)節(jié)包括任務中心、通信網(wǎng)、測控設備等,測控設備可提供多種的服務,不同的服務之間使用的通信方式、涉及的任務中心不完全相同,因此系統(tǒng)的邏輯結構并非簡單的串聯(lián)、并聯(lián)等,呈現(xiàn)復雜性。
③可維修性:測控設備、通信設備、任務中心均設計為可修復產品,出現(xiàn)故障后可在一定時間內修復。
④ 階段間相關性:執(zhí)行航天任務時,存在同一設備參與多個任務階段(或圈次)的情況,各時段間并非統(tǒng)計獨立的關系,存在相關性和依賴性。
在可靠性計算過程中,必須要真實反映上述特點,計算的結果才具有較高的可信度。通過分析現(xiàn)有經典可靠性計算模型的適用性,串、并聯(lián)等方法均不適用于測控系統(tǒng)工作場景。
航天測控系統(tǒng)本質上是一個具有多個任務階段的動態(tài)結構系統(tǒng),系統(tǒng)由多個單元組成,在執(zhí)行不同階段的任務時,參試的單元不盡相同,各單元間的邏輯結構也有所不同,同時,各階段間還存在著一定的相關性。
基于Markov 模型和全概率思想的航天測控系統(tǒng)可靠性計算的主要思路是,按系統(tǒng)參試結構是否變化分別處理,參試結構固定時以Markov 思想進行狀態(tài)轉移,在每一個任務階段分別建立各自的Markov模型,利用狀態(tài)轉移矩陣表示各參試單元在正常與故障之間的變化;當系統(tǒng)結構變化時以全概率思想將前一階段的最終狀態(tài)映射為下階段的初態(tài)。依次對各階段的任務可靠性進行遞推求解,即得到全過程的任務可靠性。
設某一階段有m個單元參加任務,每個單元有故障和正常兩種狀態(tài),建立這些單元的狀態(tài)向量為A={A1,A2,…Ai…,Am},其中,Ai=1,0分別表示第i個單元正?;蚬收?。m個單元參加任務時,微觀狀態(tài)空間S共有個狀態(tài)。記在時刻t系統(tǒng)的狀態(tài)向量為
設起始時刻為0,則根據(jù)可靠性模型,可以利用公式(1)確定狀態(tài)轉移概率關系[13,14]:
其中,P(0)為系統(tǒng)處于X(0)的概率向量。給定第k個任務階段系統(tǒng)的結構函數(shù)為Φ(A),則系統(tǒng)的失效狀態(tài)集為:
設系統(tǒng)在階段初處于各正常狀態(tài)的概率向量為 [p1,p2...pn],任務時間為t,則階段末的任務可靠度為:
航天測控系統(tǒng)中,各任務階段間密切相關,且每個階段參試單元數(shù)量不盡相同,因此,不同階段間的系統(tǒng)狀態(tài)一般不能直接映射,而應將后一階段各狀態(tài)的概率初值采用前階段各狀態(tài)概率的全概率函數(shù)表示。需注意的是,因某一階段的吸收態(tài)不會對整個任務可靠性產生貢獻,狀態(tài)映射時不對前一階段末的吸收狀態(tài)進行映射。
由于各階段間是無縫銜接的,所以在階段轉移期間可以認為共用單元的狀態(tài)不會發(fā)生變化。因此,兩個連續(xù)任務弧段間狀態(tài)映射的基本規(guī)則為:當前弧段中狀態(tài)的初始概率值為前一弧段末相同狀態(tài)對應的概率值。由于不同階段的參試單元并不相同,給階段間狀態(tài)匹配增加了復雜度。
系統(tǒng)狀態(tài)可以用一個二進制字符串M=s1s2…表示,其中si對應某個參試單元ui的狀態(tài)。令表示階段k-1(arck-1)中的第i種狀態(tài),表示階段k(arck)中的第j種狀態(tài)。下面分三種情況進行討論。
情況一:當前任務弧段有新的參試單元加入。
若arck中有新的參試單元加入,由于新單元初始狀態(tài)為正常,因此包含新單元為“0”的狀態(tài)在arck的初始概率為0;對于包含新單元為“1”的狀態(tài)二進制串中新單元的對應位剔除,然后按照上述基本規(guī)則將狀態(tài),得到arck的初始狀態(tài)概率向量。舉例,設arck-1中的參試單元為u1、u2,arck中的參試單元為u1、u2和新單元u3,則其狀態(tài)映射過程如圖1 所示。
圖1 情況一階段間狀態(tài)映射過程Fig.1 Process of state mapping between stages for case 1
情況二:前一任務弧段的某些參試單元在以后的任務弧段中都不再執(zhí)行任務。
圖2 情況二階段間狀態(tài)映射過程Fig.2 Process of state mapping between stages for case 2
情況三:前一階段的單元在當前階段不參試,但會在后續(xù)階段中再次使用。這種情況下,該單元雖不承擔任務但應保持運行狀態(tài),可認為該單元在arck中進行正常的狀態(tài)轉移,但不影響任務成敗。因此,arck中的狀態(tài)是包含了對這些單元的描述。舉例,設arck-1中的參試單元為u1、u2和u3,arck中的單元為u1,單元u2和u3在arck中暫不參試,但在以后的任務弧段中還會繼續(xù)使用,則其狀態(tài)映射過程如圖3 所示。
圖3 情況三階段間狀態(tài)映射過程Fig.3 Process of state mapping between stages for case 3
基于Markov 模型的系統(tǒng)可靠性計算流程如圖4 所示。
圖4 基于Markov 模型的可靠性計算流程Fig.4 Flow chart of Markov-based reliability analysis
為了驗證基于Markov 模型的可靠性計算方法的正確性和有效性,本章將使用該算法和蒙特卡洛仿真法針對同一場景進行可靠性計算,比較二者結果的一致性。蒙特卡洛仿真法的思路是,直接仿真測控系統(tǒng)執(zhí)行任務的過程,根據(jù)各單元的可靠性指標隨機仿真其發(fā)生故障和修復故障的時間,據(jù)此判定任務的成敗,通過大樣本次數(shù)仿真統(tǒng)計得到系統(tǒng)可靠性的近似值。這里的仿真次數(shù)設置為一千萬次,可以證明此時與精確解的近似精度優(yōu)于10-4。
下面以某航天任務關鍵飛行段落為例進行可靠性計算。測控系統(tǒng)需提供軌道測量、遙控與數(shù)據(jù)注入、遙測接收等業(yè)務,上述任務由兩個控制中心、兩個測控站及地面通信網(wǎng)完成,如圖5 所示。
圖5 測控系統(tǒng)布局示意圖Fig.5 Illustration of TT&C system layout
首先,按照本文第2 節(jié)的方法建立任務可靠性模型。第一層次模型按照參加任務的組成單元是否發(fā)生變化切分為三個時段,每個時段相同的部分為兩個任務中心和地面通信網(wǎng),不同的部分為參試的測控站,t1時段為測站一,t2時段為測站一和測站二,t3時段為測站二,如圖6 所示。
圖6 按時段構建的可靠性模型Fig.6 Reliability model of TT&C system for time stages
以t1時間段為例,給出軌道測量、遙測接收、遙控及數(shù)據(jù)注入任務的可靠性模型。
軌道測量任務由任務中心利用測站一的外測數(shù)據(jù)計算完成。其中,兩個任務中心均具備計算能力,構成并聯(lián)關系;地面通信網(wǎng)由雙路由組成,構成并聯(lián)關系。軌道測量的可靠性模型如圖7 所示。
圖7 軌道測量可靠性模型Fig.7 Reliability model of orbit measurement
遙測接收任務由任務中心處理測站一接收的遙測數(shù)據(jù)完成。其中,僅一個任務中心具備遙測處理能力;測站一具有遙測和數(shù)傳接收能力,數(shù)傳數(shù)據(jù)中也包含遙測數(shù)據(jù),遙測功能和數(shù)傳功能構成并聯(lián)關系;遙測數(shù)據(jù)利用雙路由向任務中心發(fā)送,數(shù)傳數(shù)據(jù)僅從單路由向任務中心發(fā)送。遙測接收的可靠性模型如圖8 所示。
圖8 遙測接收可靠性模型Fig.8 Reliability model of telemetry receiving
遙控及數(shù)據(jù)注入任務由任務中心通過測站一向航天器發(fā)送上行數(shù)據(jù)完成。其中,僅一個任務中心具備發(fā)送上行數(shù)據(jù)的能力;地面通信網(wǎng)由雙路由組成,構成并聯(lián)關系。遙控及數(shù)據(jù)注入可靠性模型如圖9所示。
圖9 遙控及數(shù)據(jù)注入可靠性模型Fig.9 Reliability model of remote control
t2時段、t3時段內各測控任務可靠性模型可參考t1時段,這里不再贅述。
表1 給出各單元的可靠性參數(shù);t1、t2、t3三個時段的時長分別是1.5 min、1 min、3 min,對于可靠性模型中的各參試單元,不妨設故障率、修復率服從指數(shù)分布。
表1 單元可靠性參數(shù)Table 1 Reliability of equipment
在已知輸入條件和可靠性模型的基礎上,利用Markov 方法和蒙特卡洛仿真法[15]分別計算可靠性,最終的可靠性計算結果見表2,兩種不同的方法得到結果的一致性較好。由于仿真次數(shù)足夠多,仿真結果偏差可基本忽略,因此兩種方法計算結果的吻合證明了Markov 方法的有效性。需要說明的是,蒙特卡洛仿真法的計算精確度取決于仿真次數(shù),因此,為獲取較為準確的計算結果需要較大的仿真工作量,對應的計算時間較長;相比之下,Markov 方法屬于解析算法,計算量要小得多,在計算時間方面具有一定優(yōu)勢。
表2 可靠性計算結果Table 2 Result of reliability
本文分析了航天測控系統(tǒng)的特點,建立了系統(tǒng)可靠性模型,提出了基于Markov 模型的精確求解可靠性的理論方法,能夠針對測控通信系統(tǒng)執(zhí)行任務的實際情況進行較為準確的定量化計算。該方法的應用前景主要有兩個方向:一是直接用于當前任務狀態(tài)下系統(tǒng)可靠性評價,指導系統(tǒng)方案設計和資源合理調配,實現(xiàn)資源效益最大化;二是用于指導系統(tǒng)可靠性指標分配,消除系統(tǒng)可靠性短板,為后續(xù)任務系統(tǒng)建設方案論證提供重要參考。