朱盛文
【摘要】 民航氣象數(shù)據(jù)庫系統(tǒng)是民航氣象傳真廣播一期系統(tǒng)的延續(xù),工程的主要目的是改進現(xiàn)有系統(tǒng)的運行模式,提高現(xiàn)有系統(tǒng)的運行效率,使之能更有效的適應(yīng)當(dāng)今民航氣象業(yè)務(wù)發(fā)展的需要,為民航系統(tǒng)的運行提高更全面的服務(wù)。
【關(guān)鍵詞】 民航氣象 數(shù)據(jù)庫
一、引言
呼倫貝爾機場民航氣象數(shù)據(jù)庫系統(tǒng),主要由數(shù)據(jù)庫服務(wù)器、WEB應(yīng)用服務(wù)器、通信服務(wù)器、預(yù)報平臺工作站,監(jiān)控終端等組成,軟件主要有AIX操作系統(tǒng)、LINUX操作系統(tǒng)、ORACLE數(shù)據(jù)庫、MQ通信中間件等。該系統(tǒng)自2008年5月運行,設(shè)備運行穩(wěn)定可靠,系統(tǒng)故障較少。但在實際使用過程中,也出現(xiàn)過無法進行數(shù)據(jù)交換的故障,下面筆者對以下兩例故障進行分析。
二、常見故障及維修
2.1網(wǎng)絡(luò)傳輸設(shè)備故障
故障現(xiàn)象:2013年11月7日,值班人員發(fā)現(xiàn)數(shù)據(jù)庫中資料不能及時更新,中心交換服務(wù)器有大量消息積壓且通道章臺顯示為Running,MQ消息傳輸延時較長。
故障分析及處理過程:值班機務(wù)員仔細查看交換機、路由器、基帶貓工作指示燈顯示正常,使用ping命令測試到民航華北氣象中心的傳輸鏈路通信質(zhì)量,發(fā)現(xiàn)ICMP丟失現(xiàn)象比較頻繁。檢查DB00、DB01服務(wù)器傳輸正常。聯(lián)系氣象中心確認對方交換服務(wù)器運行正常,可以排除對方數(shù)據(jù)庫故障的情況。聯(lián)系本單位技術(shù)保障部們=門檢查更換傳輸線路,確認本地線路正常。聯(lián)系網(wǎng)絡(luò)公司確認北京至本地的數(shù)據(jù)傳輸正常,這樣可以排除北京至本地網(wǎng)絡(luò)線路故障的可能性。聯(lián)系北京網(wǎng)控中心臨時更換ATM傳輸端口,確認ATM網(wǎng)絡(luò)數(shù)據(jù)傳輸正常。這樣故障點初步判斷在路由器、交換機、基帶貓三個方面,通過監(jiān)控終端ping通信機、及服務(wù)器不存在丟包現(xiàn)象,所以交換機可以排除。更換備用路由器,故障依舊。所以初步判斷故障點應(yīng)該在基帶貓,由于基帶貓沒有備件,拆開基帶貓后,檢查Modem電源模塊輸出電壓不穩(wěn),經(jīng)過搶修以后更換電源模塊,數(shù)據(jù)鏈路恢復(fù)正常,丟包現(xiàn)象消失,MQ消息傳輸正常。
2.2通信機故障
故障現(xiàn)象:2015年7月12日,14:50分左右,值班機務(wù)員發(fā)現(xiàn)通過CMTS客戶端發(fā)現(xiàn)無法清除AB報,ping北京服務(wù)器及本地服務(wù)器均正常;使用telnet命令無法登陸通信機。在19:30左右,再次出現(xiàn)以上情況,重啟恢復(fù);在24:00左右再次出現(xiàn)以上情況。
故障分析及處理過程:根據(jù)以往處理經(jīng)驗,由于硬盤滿,無法提供存儲空間及程序運行空間,易出現(xiàn)類似情況, 重啟通信機后,設(shè)備恢復(fù),通過查看硬盤空間,硬盤空間充足。
通過查看通信機目錄,在comm/receive/caac 目錄下面一個未處理的氣象預(yù)報文件; 刪除該未處理的文件,未發(fā)生通信機死機情況,判斷通信機死機與該未處理的文件有關(guān);太極公司技術(shù)人員聯(lián)系,得到證實,由于文件處理后,程序未刪除掉,會再次調(diào)用程序處理,這樣重復(fù)處理,后逐漸占用更大的內(nèi)存空間,直至內(nèi)存沾滿,每次死機間隔時間在4小時左右,也大概消耗與機器的內(nèi)存量相符 。
2.3報文的轉(zhuǎn)發(fā)
故障現(xiàn)象:2015年8月10日,本場數(shù)據(jù)庫無法收到其他機場的氣象情報。08:05 (北京時)預(yù)報員通過在藍波終端發(fā)請求報的方式請求所需的實況及預(yù)報報文 。值班機務(wù)員在設(shè)備巡視中,發(fā)現(xiàn)民航氣象數(shù)據(jù)庫系統(tǒng)MQ線路轉(zhuǎn)發(fā)了某地機場的氣象情報,值班機務(wù)員立即進行排查。
故障分析及處理過程:機務(wù)員通過對通信系統(tǒng)$HOME/ COMM/history/的留底文件進行檢查,確認了請求報所請求的報文被通過MQ線路所轉(zhuǎn)發(fā)。為了進一步分析轉(zhuǎn)發(fā)的原因,仔細對通信系統(tǒng)BSB控制數(shù)據(jù)進行檢查,檢查結(jié)果正常,控制數(shù)據(jù)無誤,在存儲轉(zhuǎn)發(fā)參數(shù)設(shè)置為N。對數(shù)據(jù)庫系統(tǒng)各個進程進行檢查,檢查結(jié)果正常,對轉(zhuǎn)報機藍波終端軟件進行檢查,發(fā)現(xiàn)發(fā)送的RQM請求報的請求地址包含本地地址。
藍波終端發(fā)送RQM請求報:報文內(nèi)容如下:
GG ZBBBYPYX,ZBBBYZYX,ZNNNYMYX,
RQM/SAZXXX,ZMMM FC=
請求地址為:ZBBBYPYX,ZBBBYZYX,ZNNNYMYX,發(fā)送請求報時,錯誤增加本地數(shù)據(jù)庫請求地址,紅色字體部分 。故障原因分析為本地數(shù)據(jù)庫收到請求報后,將本地數(shù)據(jù)庫ZXXX、ZMMM最新時次報文收集,以公報形式附加本地報頭發(fā)送到轉(zhuǎn)報機,轉(zhuǎn)報機收到報文后,再次將報文發(fā)送至ZNNNYMYX(本地數(shù)據(jù)庫),數(shù)據(jù)庫系統(tǒng)收到的這份報,由于報頭是本地的報頭,并且時次是最新的,于是數(shù)據(jù)庫系統(tǒng)做存儲轉(zhuǎn)發(fā)處理,通過MQ線路,轉(zhuǎn)發(fā)至華北地區(qū)氣象中心民航氣象數(shù)據(jù)庫。
三、小結(jié)
對于維修人員來說,設(shè)備出現(xiàn)故障之后要沉著冷靜分析,平時多看業(yè)務(wù)維修手冊,對系統(tǒng)有整體的把握,熟悉數(shù)據(jù)的處理流程,有利于快速判斷故障點,分析故障原因,必要時向廠家尋求技術(shù)支持,可達到事半功倍的效果,要善于對故障進行記錄、歸納、總結(jié)。通過實踐的學(xué)習(xí),經(jīng)驗的積累,這樣就可以快速的解決設(shè)備故障,為維修帶來方便。從而保證設(shè)備的正常運轉(zhuǎn),充分發(fā)揮設(shè)備的作用。
參 考 文 獻
[1]太極計算機股份有限公司,民航氣象衛(wèi)星傳真廣播系統(tǒng)用戶手冊,1-60