李健 趙琳
摘要: 隨著航空電子技術(shù)的發(fā)展及軟硬件技術(shù)的進步,飛機對航空電子系統(tǒng)的要求隨之不斷提高。而航空電子系統(tǒng)的架構(gòu)也由聯(lián)合式航空電子系統(tǒng)發(fā)展為綜合化模塊化的航空電子系統(tǒng)及分布式綜合化模塊化的航空電子系統(tǒng)。而通信系統(tǒng)是航空電子系統(tǒng)中不可缺少的一部分,各計算資源之間的數(shù)據(jù)傳遞和數(shù)據(jù)共享都是由通信系統(tǒng)來完成。因此通信系統(tǒng)的性能直接影響到了航空電子系統(tǒng)的性能。FC網(wǎng)絡(luò)具備傳輸速率高、傳輸距離遠、誤碼率低、實時性強、可擴展性好等優(yōu)點,滿足航空電子系統(tǒng)對網(wǎng)絡(luò)的需求。為了提升系統(tǒng)的診斷能力與容錯能力,提出了一種FC網(wǎng)絡(luò)的健康管理方法,對整個FC網(wǎng)絡(luò)中的終端節(jié)點和交換機的健康狀態(tài)進行維護管理。
關(guān)鍵詞:FC(光纖通道);容錯;故障診斷
中圖分類號:TP391 文獻標識碼:A
文章編號:1009-3044(2019)09-0033-02
1 引言
目前的航空電子系統(tǒng)架構(gòu),正在朝著稱作為綜合化航空電子系統(tǒng)和分布式綜合化航空電子系統(tǒng)發(fā)展。在這種航空電子系統(tǒng)架構(gòu)中,多使用高性能的計算平臺。該平臺以模塊化的設(shè)備搭建,以網(wǎng)絡(luò)為通信基礎(chǔ)實現(xiàn)全互聯(lián)結(jié)構(gòu)。該平臺具有靈活性高及交互操作性強的特點。交互性允許計算資源的共享,計算數(shù)據(jù)的交互則是通過網(wǎng)絡(luò)來傳遞。
隨著航空電子系統(tǒng)復(fù)雜性不斷提高,適用于傳統(tǒng)聯(lián)合式航空電子系統(tǒng)的網(wǎng)絡(luò)已經(jīng)不能適應(yīng)新的需求。高性能計算平臺需要一個靈活、容錯和高速的通信系統(tǒng)來支持模塊間通信,而FC網(wǎng)絡(luò)滿足其需求。航空電子系統(tǒng)的發(fā)展及提供功能的增加,必然會加重網(wǎng)絡(luò)的負擔(dān)。網(wǎng)絡(luò)的規(guī)模會越來越大,網(wǎng)絡(luò)配置也會越發(fā)復(fù)雜,所以管理整個網(wǎng)絡(luò)的運行狀態(tài)和健康狀態(tài)就顯得尤為重要。
2 研制背景
在綜合化模塊化的航空電子系統(tǒng)和分布式綜合化模塊化的航空電子系統(tǒng)中,F(xiàn)C網(wǎng)絡(luò)的拓撲結(jié)構(gòu)多以交換網(wǎng)絡(luò)拓撲結(jié)構(gòu)為主。網(wǎng)絡(luò)結(jié)構(gòu)是以FC網(wǎng)絡(luò)交換機為核心,各個FC節(jié)點連接至FC網(wǎng)絡(luò)交換機。在整個網(wǎng)絡(luò)通信過程中,F(xiàn)C網(wǎng)絡(luò)交換機對于FC節(jié)點來說是透明的。在FC網(wǎng)絡(luò)的使用過程中,目前缺乏一個快速獲取且集中處理故障的健康管理機制,導(dǎo)致有時在事后分析FC網(wǎng)絡(luò)出現(xiàn)的問題時缺乏支撐數(shù)據(jù),給排故帶來較大困難。
3 系統(tǒng)設(shè)計
上圖所示的是一個雙余度、交換機式網(wǎng)絡(luò)拓撲的FC網(wǎng)絡(luò)系統(tǒng)。該系統(tǒng)中包含兩塊FC網(wǎng)絡(luò)交換機,多個FC網(wǎng)絡(luò)終端,一個故障管理模塊和一個FC網(wǎng)絡(luò)監(jiān)控設(shè)備。其中FC網(wǎng)絡(luò)終端的個數(shù)一般根據(jù)系統(tǒng)應(yīng)用功能需求分配而決定,也受FC網(wǎng)絡(luò)交換機端口數(shù)目的限制。該FC網(wǎng)絡(luò)為一個雙余度的FC網(wǎng)絡(luò),每個FC網(wǎng)絡(luò)終端都有兩個FC通道,分別連接至兩個交換機的同一個普通端口(例如兩個FC端口分別連接至交換機1和交換機2的12端口)。FC網(wǎng)絡(luò)監(jiān)控設(shè)備同樣具備兩個FC端口,分別連接至兩個交換機的同一個監(jiān)控端口上。
交換機1和交換機2有一個端口連接在一起,用來進行信息交互。
3.1 FC網(wǎng)絡(luò)交換機
該系統(tǒng)中有2個FC網(wǎng)絡(luò)交換機,主要負責(zé)FC網(wǎng)絡(luò)中數(shù)據(jù)的轉(zhuǎn)發(fā)功能。FC網(wǎng)絡(luò)交換機支持單播,組播和廣播功能。其中故障管理模塊作為一個普通的FC網(wǎng)絡(luò)終端連接至交換機的普通端口上。FC網(wǎng)絡(luò)交換機具備FC監(jiān)控端口,用來監(jiān)控FC網(wǎng)絡(luò)上的通信數(shù)據(jù)。
其中FC網(wǎng)絡(luò)交換機的組播功能和監(jiān)控功能需要預(yù)先配置。配置完成后如果有組播消息,則交換機會通過查詢預(yù)先配置組播表而確定組播消息的成員后,給各個成員一起轉(zhuǎn)發(fā)消息。當FC網(wǎng)絡(luò)中有數(shù)據(jù)通信時,F(xiàn)C網(wǎng)絡(luò)交換機會通過查詢預(yù)先配置的監(jiān)控表來確認哪些消息是需要監(jiān)控的,然后會將需要監(jiān)控的FC消息通過監(jiān)控端口轉(zhuǎn)發(fā)出去。
3.2 FC網(wǎng)絡(luò)終端
在FC網(wǎng)絡(luò)中,F(xiàn)C網(wǎng)絡(luò)終端作為網(wǎng)絡(luò)的普通節(jié)點。承載了整個系統(tǒng)分配的應(yīng)用功能任務(wù)。FC網(wǎng)絡(luò)終端包含了計算、控制和網(wǎng)絡(luò)接口功能。FC網(wǎng)絡(luò)終端的計算和控制(應(yīng)用功能的運行)功能由CPU單元來執(zhí)行。FC網(wǎng)絡(luò)接口功能由FC接口單元來執(zhí)行。
其中FC網(wǎng)絡(luò)接口由CPU單元進行控制,包括FC網(wǎng)絡(luò)接口的初始化,狀態(tài)管理,數(shù)據(jù)收發(fā)控制等。
3.3 故障管理模塊
在FC網(wǎng)絡(luò)中故障管理模塊主要功能為故障的記錄功能,記錄故障后為后續(xù)的故障排查和分析提供依據(jù)。故障管理模塊包含了CPU單元和FC網(wǎng)絡(luò)接口單元。FC網(wǎng)絡(luò)接口由CPU單元進行控制,包括FC網(wǎng)絡(luò)接口的初始化,狀態(tài)管理,數(shù)據(jù)收發(fā)控制等。
3.4 FC網(wǎng)絡(luò)監(jiān)控設(shè)備
在FC網(wǎng)絡(luò)中,F(xiàn)C網(wǎng)絡(luò)監(jiān)控設(shè)備連接至FC網(wǎng)絡(luò)交換機的監(jiān)控端口,負責(zé)FC網(wǎng)絡(luò)通信數(shù)據(jù)的記錄功能,即將交換機監(jiān)控端口轉(zhuǎn)發(fā)過來的數(shù)據(jù)保存到本地,為后續(xù)數(shù)據(jù)分析提供支撐。
FC網(wǎng)絡(luò)監(jiān)控設(shè)備包含CPU單元及FC網(wǎng)絡(luò)監(jiān)控單元,其中CPU單元功能與FC網(wǎng)絡(luò)終端中的CPU功能一致。FC網(wǎng)絡(luò)監(jiān)控單元主要完成FC網(wǎng)絡(luò)監(jiān)控數(shù)據(jù)的記錄功能。
3.5 健康管理
整個FC網(wǎng)絡(luò)的健康管理以FC網(wǎng)絡(luò)交換機為核心,交換機進行統(tǒng)一收集FC網(wǎng)絡(luò)健康狀態(tài)并進行處理,處理完成后會將故障整合并發(fā)給故障管理模塊進行記錄保存或顯示。其中重要的故障也會保存在本地的NVRAM中。其中具體的管理方法如下:
(1)FC網(wǎng)絡(luò)交換機可以實時檢測到各個端口的狀態(tài)機變化(上/下線狀態(tài)變化),交換機會將整個網(wǎng)絡(luò)的上下線信息及變化的時間保存在本地;如果判斷到交換機邏輯異?;蛘吖收瞎芾砟K異常則將保存的狀態(tài)存儲到NVRAM中。每個交換機獲取到FC網(wǎng)絡(luò)的上/下狀態(tài)后,兩個交換機進行信息交互,綜合判斷某個節(jié)點單通道故障還是整個鏈路故障,并保存故障類型;
(2)交換機的邏輯會產(chǎn)生心跳信息由CPU進行判斷處理,如果心跳異常則CPU會將該故障及發(fā)生時間保存到本地的NVRAM中。兩個交換機會通過連接的端口互相發(fā)送心跳信息,如果某個交換機故障,則另外一個交換機會采到故障狀態(tài)并保存故障類型;
(3)交換機會周期廣播各網(wǎng)絡(luò)終端(包含F(xiàn)C監(jiān)控設(shè)備)的狀態(tài)獲取命令,各網(wǎng)絡(luò)終端收到后會提交給CPU,然后由CPU處理完成后給交換機返回狀態(tài)。交換機會判斷各FC網(wǎng)絡(luò)終端健康狀態(tài),以及接收到的網(wǎng)絡(luò)終端的狀態(tài)信息,經(jīng)過兩個交換機信息綜合后保存故障類型;
(4)FC網(wǎng)絡(luò)終端會周期判斷FC接口的心跳信息,如果FC接口心跳異常則將該故障的發(fā)生時間和故障類型保存在本地的NVRAM中;
(5)FC網(wǎng)絡(luò)交換機及FC網(wǎng)絡(luò)終端上電后會讀取本地模塊上光收發(fā)器的發(fā)送光功率的數(shù)值,并匯總至交換機進行綜合處理;
(6)FC網(wǎng)絡(luò)交換機在進行FC網(wǎng)絡(luò)健康信息綜合時,當有狀態(tài)變化或系統(tǒng)進入維護模式時,都會將所有的健康信息發(fā)送給故障管理模塊進行保存。同時故障管理模塊會監(jiān)控交換機的心跳信息,如果異常則會將該故障的發(fā)生時間和故障類型記錄在本地的NVRAM中。
4 總結(jié)評價
本文介紹了一種基于交換式FC網(wǎng)絡(luò)拓撲結(jié)構(gòu)的FC網(wǎng)絡(luò)的健康管理方法。對FC網(wǎng)絡(luò)系統(tǒng)中的各設(shè)備在健康管理中所起的作用、涉及管理的內(nèi)容和方法做了介紹,其中包括FC網(wǎng)絡(luò)交換機作為健康管理的核心部件進行管理的具體方法和FC網(wǎng)絡(luò)終端、故障管理模塊及FC網(wǎng)絡(luò)監(jiān)控設(shè)備需要實現(xiàn)的內(nèi)容。這套健康管理方法能夠極大的提高FC網(wǎng)絡(luò)系統(tǒng)的故障診斷能力,并為FC網(wǎng)絡(luò)狀態(tài)監(jiān)控及故障排查提供有力的數(shù)據(jù)支撐。
參考文獻:
[1] Fibre Channel Framing and Signaling – 3 (FC-FS-3) Rev 0.60, American National Standard for Information Technology 2008-08-15
[2] 黃浩益.光纖通道技術(shù)在航電系統(tǒng)中的應(yīng)用[J].航空電子技術(shù),2005(3).
[3] 周耀榮.航空系統(tǒng)結(jié)構(gòu)發(fā)展趨勢[Z].2006.
【通聯(lián)編輯:梁書】