王張穎
摘 要 對AIMS系統(tǒng)的系統(tǒng)模型、軟件模塊等方面進行分析闡述,分析了AIMS系統(tǒng)軟件故障。
關(guān)鍵詞 AIMS系統(tǒng)架構(gòu);軟件模塊;故障分析
中圖分類號:TP3 文獻標(biāo)識碼:A 文章編號:1671-7597(2014)01-0056-01
航管信息自動化處理系統(tǒng)(俗稱:航管自動化系統(tǒng),英文簡稱AIMS)是一套專為民航管制機構(gòu)設(shè)計的重要生產(chǎn)系統(tǒng),它建立在多任務(wù)操作系統(tǒng)和大型ORACLE數(shù)據(jù)庫之上,能夠?qū)崟r、高效的響應(yīng)用戶操作和業(yè)務(wù)功能,能夠有效的減輕管制人員的工作強度。該系統(tǒng)面向包括塔臺、區(qū)調(diào)、站調(diào)、統(tǒng)計室、預(yù)報等各崗位用戶,為所有保障飛行安全的相關(guān)人員了解航空器飛行計劃、掌握飛行動態(tài)、進行相關(guān)業(yè)務(wù)數(shù)據(jù)處理和顯示提供服務(wù),由于該系統(tǒng)需要直接獲取AFTN平面電報網(wǎng)數(shù)據(jù)所以一般都由轉(zhuǎn)報崗位進行維護。
1 系統(tǒng)架構(gòu)
AIMS系統(tǒng)采用交換式以太網(wǎng)互聯(lián)的方式組網(wǎng)。它為每個節(jié)點提供專用的以太網(wǎng)連接,以確保該網(wǎng)段專有的100Mbps性能。系統(tǒng)通過TCP/IP協(xié)議組成一個網(wǎng)絡(luò)環(huán)境,采用廣播的方式進行消息的傳遞,當(dāng)某些終端進行數(shù)據(jù)操作時,將立即以廣播的方式通知其他終端,使各個終端之間達到數(shù)據(jù)同步。
電報數(shù)據(jù)源從轉(zhuǎn)報機傳至AIMS前置機進行集中處理,而用戶處理席位進行分散處理。服務(wù)器配備大容量存儲器并安裝ORACLE 10G數(shù)據(jù)庫系統(tǒng),用于數(shù)據(jù)的存放和數(shù)據(jù)檢索。在AIMS主用系統(tǒng)上操作的各種業(yè)務(wù)數(shù)據(jù)都將由主用服務(wù)器數(shù)據(jù)庫統(tǒng)一存放,各個終端都必須從數(shù)據(jù)庫中獲取數(shù)據(jù),從而最終保證了系統(tǒng)數(shù)據(jù)來源的統(tǒng)一。前置機提供對轉(zhuǎn)報機的接口并安裝AFTN電報網(wǎng)關(guān)、飛行數(shù)據(jù)服務(wù)模塊FDS,對各類報文進行預(yù)處理,對用戶提出的數(shù)據(jù)服務(wù)請求進行處理。用戶終端安裝飛行數(shù)據(jù)管理模塊FDM、資料庫、電報查詢模塊等客戶端程序,用戶可以通過客戶端程序查看和處理飛行動態(tài)、檢索出所需的報文、對選定的航班記錄進行操作。AIMS系統(tǒng)設(shè)計以數(shù)據(jù)庫為中心,采用客戶機/服務(wù)器訪問方式,系統(tǒng)軟件模塊可分三層結(jié)構(gòu)。
2 常見故障分析
機房環(huán)境的各項指標(biāo)對AIMS系統(tǒng)的穩(wěn)定安全運行有著重要的影響。過高的環(huán)境溫度無疑會嚴(yán)重影響設(shè)備的性能。雖然現(xiàn)在AIMS系統(tǒng)本身散熱性能就很好,但過高的溫度仍然會使系統(tǒng)工作時產(chǎn)生的熱量散不出去,有可能燒毀機器的板卡或其他配件,引起硬件故障。溫度過低則可能導(dǎo)致系統(tǒng)的各配件之間接觸不良。
2.1 軟件故障
軟件故障可分為客戶端軟件故障和服務(wù)端軟件故障??蛻舳塑浖收峡煞譃榻K端應(yīng)用軟件故障、終端操作系統(tǒng)故障兩大類型,具體表現(xiàn)為終端發(fā)報不正常、終端不能自動打印進程單、終端無法保存統(tǒng)計打印、終端誤操作等問題。服務(wù)端軟件故障主要有網(wǎng)關(guān)軟件故障、FDS軟件故障、ORACLE10G數(shù)據(jù)庫軟件故障等。
AIMS軟件故障產(chǎn)生的原因多種多樣,有可能有誤操作、文件丟失、病毒破壞等,造成的現(xiàn)象也各不相同。病毒會給AIMS系統(tǒng)帶來難以預(yù)料的破壞,例如感染硬盤中的可執(zhí)行文件,破壞系統(tǒng)文件、甚至有的破壞系統(tǒng)硬件等。發(fā)生軟件故障時,系統(tǒng)一般都會給出錯誤提示,管制部門會向技術(shù)部門反映情況,有些軟件故障是屬于程序BUG,這種情況下我們技術(shù)人員會聯(lián)系廠家,對客戶端應(yīng)用程序、軟件版本、批處理腳本等進行升級。
在值班過程中我曾遇到過網(wǎng)關(guān)滾報現(xiàn)象,此次故障表現(xiàn)為網(wǎng)關(guān)LOG日志不斷循環(huán)增大。一般每天的LOG日志大小僅為1KB,當(dāng)由于報文格式不正確日時組缺失時,網(wǎng)關(guān)無法對該報文進行處理,網(wǎng)關(guān)只好不斷重復(fù)發(fā)送該份報文,導(dǎo)致LOG日志迅速增大,甚至可達到4M左右。發(fā)現(xiàn)故障后立即進行排查,最后在ORACLE數(shù)據(jù)庫中找到該份報文的ID號,將該份報文刪除解決此次故障。網(wǎng)關(guān)滾報容易造成網(wǎng)關(guān)不穩(wěn)定,影響網(wǎng)關(guān)的安全運行。
執(zhí)行命令語句為:
Select * from SENDRAWMSG WHERE ISOUT=0;
Update sendrawmsg set isout=1 where msgid=#;
這兩句SQL語句表示:從SENDRAWMSG表中找出報文處理標(biāo)志位ISOUT設(shè)置為0的數(shù)據(jù),更新sendrawmsg表,將msgid為#的行(即為該份報文)的報文處理標(biāo)志位isout設(shè)置為1,將該份報文放入值班處理。若有其他不能處理的報文,在數(shù)據(jù)庫中有一個殘缺報文表專門存放殘缺報。
用戶在終端上做的每一操作在系統(tǒng)日志中都會有記錄,當(dāng)更改某一不符合規(guī)則的選項時,系統(tǒng)就會無法識別或者無法進行寫操作,同時會在FDS的LOG日志進行記錄,出現(xiàn)Error : ORA-00920: 無效的關(guān)系運算符等之類的錯誤提示信息,維護人員可以根據(jù)提示進行錯誤點定位從而解決問題。下面是一個SSR分配/回收時間設(shè)置不符合規(guī)定的提示信息,在AIMS系統(tǒng)上SSR分配回收時間必須設(shè)置為在距計劃/動態(tài)ETD前后15-180鐘,若是超出這個時間范圍則不被系統(tǒng)識別會出現(xiàn)以下的錯誤提示信息:
SQL Statment : Select PID from Today
Where (bitand(DP,2) = 2) and BJ1=0 and Ap1 In (Select AirPort From AirPortInArea Where Dept =2 And AirPort<>'ZYTL')
and ((DYNA_ETD>='0200' and '11-11-02 '||DYNA_ETD) between '11-11-02 2311' and '11-11-02 2311'
DYNA_ETD表示動態(tài)ETD,PLN_ETD表示計劃ETD,且信息提示中出現(xiàn)SSR,根據(jù)這些提示內(nèi)容可以進行初步判斷,再在FDM該選項框中進行查看即可定位報錯點。
2.2 經(jīng)驗總結(jié)
在日常的維護工作中,我們要遵循先外設(shè)后主機,先軟件后硬件的工作原則,不要雜亂無章的進行判斷,浪費時間和精力,但是具體情況要具體分析,順藤摸瓜找到真正的故障點。同時要注意避免潛在的隱患故障,多通過學(xué)習(xí)以及技術(shù)交流,加深對全系統(tǒng)的了解,不斷提高維護水平,提高自己的故障解決能力。
參考文獻
[1]航管信息自動化處理系統(tǒng)用戶手冊[M].民航數(shù)據(jù)通信有限責(zé)任公司,2003.
[2]航管信息自動化處理系統(tǒng)安裝維護手冊[M].民航數(shù)據(jù)通信有限責(zé)任公司,2007.
[3]李柯,賈貴娟,施炎林,汪洪蛟.空管安全風(fēng)險管理信息系統(tǒng)分析與設(shè)計[J].中國安全科學(xué)學(xué)報,2009(02).endprint