摘 要:上海浦東國際機(jī)場(chǎng)一期于 1999 年正式建成通航。機(jī)場(chǎng)方通過國際招標(biāo)引進(jìn)了由澳大利亞Intersystem 公司開發(fā),配以IBM 小型機(jī)及 SAN 存儲(chǔ)組成機(jī)場(chǎng)航班信息顯示系統(tǒng)(以下簡(jiǎn)稱航顯系統(tǒng))的基本后臺(tái)架構(gòu)。后經(jīng)過二期建設(shè)、虛擬化技術(shù)的引入以及衛(wèi)星廳的擴(kuò)容,目前的航顯系統(tǒng)已經(jīng)足夠強(qiáng)大和穩(wěn)定。作為浦東機(jī)場(chǎng)的核心信息系統(tǒng),其強(qiáng)大的續(xù)航能力只是基礎(chǔ),還需要通過科學(xué)、完善、契合的維護(hù)方式對(duì)其進(jìn)行養(yǎng)護(hù),以維持其一貫的穩(wěn)定性。
關(guān)鍵詞:航顯系統(tǒng);信息安全:設(shè)備運(yùn)維:人機(jī)結(jié)合
中圖法分類號(hào):V351文獻(xiàn)標(biāo)識(shí)碼:A
1 系統(tǒng)簡(jiǎn)介
1.1 概述
作為國內(nèi)最大的國際機(jī)場(chǎng)、航空樞紐港,浦東機(jī)場(chǎng)航班信息顯示系統(tǒng)是浦東機(jī)場(chǎng)的核心系統(tǒng)。其通過與集成系統(tǒng)的接口連接獲取當(dāng)日乃至次日的航班信息,通過外圍顯示設(shè)備為旅客及工作人員提供實(shí)時(shí)準(zhǔn)確的航班動(dòng)態(tài)信息。
自1999 年浦東機(jī)場(chǎng)開航至今,航顯系統(tǒng)的后臺(tái)構(gòu)成模式從IBM 小型機(jī)逐漸演化成以VMware 虛擬化為主,共有24 臺(tái)虛擬服務(wù)器組成,其中12 臺(tái)作為主服務(wù)器,12 臺(tái)作為備用服務(wù)器。其兼?zhèn)淞颂摂M化層面的實(shí)時(shí)切換技術(shù),同時(shí)也具備軟件層面的熱備技術(shù)。其外圍顯示由2 200 臺(tái)設(shè)備組成,包括7 種不同的顯示設(shè)備。
隨著浦東機(jī)場(chǎng)衛(wèi)星廳的開航,后臺(tái)又進(jìn)行了大量的擴(kuò)容,目前其后臺(tái)由3 個(gè)主機(jī)房組成,形成3 地(T1、T2 航站樓和衛(wèi)星廳)異地互備,同時(shí)2018 年建成了航顯系統(tǒng)的備份系統(tǒng),在極端情況下備份系統(tǒng)能完全替代主運(yùn)營系統(tǒng),并在不影響現(xiàn)場(chǎng)業(yè)務(wù)的情況下接管主運(yùn)行系統(tǒng)。
1.2 機(jī)房設(shè)備
機(jī)房設(shè)備主要包括服務(wù)器、光纖交換機(jī)、存儲(chǔ),通過雙機(jī)房備份、虛擬化共享技術(shù)實(shí)現(xiàn)系統(tǒng)的強(qiáng)大冗余能力。網(wǎng)絡(luò)拓?fù)鋱D如圖1 所示。
2 系統(tǒng)維護(hù)中的難點(diǎn)及解決方案
作為浦東機(jī)場(chǎng)的核心業(yè)務(wù)系統(tǒng),航顯系統(tǒng)應(yīng)具備7?24 小時(shí)的運(yùn)行能力,任何的例行維護(hù)、系統(tǒng)升級(jí)都不應(yīng)對(duì)其業(yè)務(wù)工作產(chǎn)生影響[1] 。因此,合理、科學(xué)、完善的運(yùn)維方式必不可少,本文將從以下幾方面對(duì)其進(jìn)行研究。
2.1 信息安全
作為近期國家和公司大力推進(jìn)和強(qiáng)化的一項(xiàng)基礎(chǔ)工作,信息安全在系統(tǒng)運(yùn)維的過程中需要做到規(guī)范、合理化,以保證系統(tǒng)免受網(wǎng)絡(luò)攻擊和非法外部入侵,以下是本文在信息安全方面的思路和解決方案。
2.1.1 建立主機(jī)root 用戶口令的管理制度
(1)嚴(yán)格控制知曉口令的人員。
(2)制定root password 規(guī)則,有條件可定期更改此規(guī)則。
(3)如有條件口令,可由2 位系統(tǒng)管理員產(chǎn)生,每一位制定口令的一半。
(4)使用passwd 命令定期修改root 口令,更改頻率為至少1 年1 次,并填寫口令修改記錄。
2.1.2 建立應(yīng)用系統(tǒng)管理員admin 用戶口令的管理制度
(1)嚴(yán)格控制知曉口令的人員。
(2)如有條件口令,可由2 位系統(tǒng)管理員產(chǎn)生,每一位制定口令的一半。
(3)使用passwd 命令定期修改sadmin 口令,更改頻率為至少1 年1 次,并填寫口令修改記錄。
2.1.3 建立操作員的安全管理制度
(1)利用安全管理工具來控制對(duì)Rapid Fids 的所有應(yīng)用工具和數(shù)據(jù)的存取權(quán)限。
2.1.4 建立航顯系統(tǒng)備份策略
(2)對(duì)所有服務(wù)器虛機(jī)每年備份1 次。
(3)在系統(tǒng)的操作系統(tǒng)和數(shù)據(jù)庫升級(jí)前,對(duì)系統(tǒng)進(jìn)行備份。
2.1.5 建立航顯系統(tǒng)賬戶管理制度
(1)每年度對(duì)用戶的賬號(hào)進(jìn)行整理與清除無效賬號(hào),并對(duì)活動(dòng)的賬號(hào)進(jìn)行口令的更改,由用戶提出申請(qǐng),系統(tǒng)管理員更改口令。
(2)若有人員變動(dòng)不再擔(dān)任系統(tǒng)管理員,則必須將該賬戶禁用或刪除。
(3)管理員賬號(hào)每年度更改一次密碼,由各管理員自行更改。
(4)航顯系統(tǒng)工作站的密碼每年度更改一次,由系統(tǒng)管理員自行更改。
2.1.6 建立航顯系統(tǒng)密碼管理制度
(1)若只有口令密碼,則管理員有將口令密碼告知他人的權(quán)利,其他口令密碼知情人不得將口令密碼告知他人。服務(wù)器密碼和終端管理員權(quán)限密碼由系統(tǒng)管理員掌握。終端受限賬號(hào)密碼和應(yīng)用軟件密碼由用戶掌握,并設(shè)專人負(fù)責(zé)保密和維護(hù)工作。
(2)嚴(yán)格限制服務(wù)器、終端、應(yīng)用軟件口令密碼的知情人員范圍。
(3)密碼長度必須不小于8位,密碼為數(shù)字、字母大寫、小寫和特殊字符中至少2 種的組合,所有密碼都不能為連續(xù)或重復(fù)的字母與數(shù)字;密碼不能具有某種規(guī)律性。
2.1.7 建立航顯系統(tǒng)日志檢查記錄制度
管理員每周對(duì)服務(wù)器上的系統(tǒng)日志進(jìn)行檢查,并對(duì)除以下情況外的記錄做進(jìn)一步記錄和分析。
(1)定期出現(xiàn)、原因已知且對(duì)系統(tǒng)沒有重大影響的報(bào)錯(cuò)。
(2)曾經(jīng)出現(xiàn)、原因已知且對(duì)系統(tǒng)沒有重大影響的報(bào)錯(cuò)。
(3)非系統(tǒng)核心區(qū)域出現(xiàn)的報(bào)錯(cuò),如某一終端報(bào)錯(cuò),確認(rèn)不會(huì)對(duì)系統(tǒng)造成影響的報(bào)錯(cuò)。
2.2 系統(tǒng)日常維護(hù)
為保持系統(tǒng)的穩(wěn)定,需要持續(xù)地對(duì)系統(tǒng)進(jìn)行健康性檢查,依據(jù)歷年來的經(jīng)驗(yàn)做實(shí)時(shí)地調(diào)整和優(yōu)化,包括以下部分。
2.2.1 航顯系統(tǒng)例行檢查日維護(hù)
每日對(duì)系統(tǒng)中的服務(wù)器資源使用情況進(jìn)行巡檢:其中包括磁盤空間和CPU 檢查、資源組online 情況、JBoss 進(jìn)程運(yùn)行情況等內(nèi)容,并對(duì)其進(jìn)行記錄。
2.2.2 航顯系統(tǒng)例行檢查季度維護(hù)
每個(gè)季度需對(duì)系統(tǒng)進(jìn)行重啟HA 操作:手動(dòng)關(guān)閉和開啟HA,并對(duì)重啟后的運(yùn)行狀態(tài)進(jìn)行確認(rèn),并進(jìn)行記錄。
2.2.3 航顯系統(tǒng)例行檢查節(jié)日維護(hù)
重大節(jié)日前需對(duì)系統(tǒng)進(jìn)行檢查,其中包括所有服務(wù)器的工作狀態(tài)檢查,航顯工作站檢查等。
2.2.4 航顯系統(tǒng)例行檢查年度維護(hù)
每年度需對(duì)系統(tǒng)進(jìn)行一次清理AQ 操作。
2.3 應(yīng)急預(yù)案制定
作為系統(tǒng)維護(hù)中必不可少的部分,應(yīng)急預(yù)案在系統(tǒng)發(fā)生故障時(shí)有很大的參考價(jià)值,也可作為對(duì)新同事新員工的培訓(xùn)內(nèi)容。應(yīng)急預(yù)案若做得好就能很快地找到故障原因并對(duì)其排除,大量減少處置時(shí)間和縮小對(duì)生產(chǎn)運(yùn)行的影響范圍。因此,根據(jù)以往的維護(hù)經(jīng)驗(yàn),總結(jié)出典型的重大故障的應(yīng)急處置方案,并制定流程圖。
2.3.1 航顯數(shù)據(jù)庫服務(wù)器故障應(yīng)急預(yù)案
(1)故障現(xiàn)象。
本故障可能導(dǎo)致航顯系統(tǒng)以下故障現(xiàn)象:
①所有航顯顯示設(shè)備無法更新顯示;
②現(xiàn)場(chǎng)航顯設(shè)備(行李小鍵盤、FCS)無法操作;
③TOC 操作人員無法使用客戶端軟件;
④所有離港操作終端與柜臺(tái)航顯設(shè)備無聯(lián)動(dòng)。
(2)故障判斷。
根據(jù)服務(wù)器日志和故障現(xiàn)象判斷。
(3)風(fēng)險(xiǎn)分析。
級(jí)別:嚴(yán)重影響航班運(yùn)營。
后果:航顯系統(tǒng)癱瘓,各終端設(shè)備保留故障前顯
示內(nèi)容,無法顯示航班動(dòng)態(tài)信息,操作終端無法操作。
風(fēng)險(xiǎn)概率:待定(依據(jù)實(shí)際穩(wěn)定情況)。
(4)故障處理。
用root 用戶登錄10.28.170.11 pvgrs6db01 運(yùn)行
#ha_standby.sh pvgrs6db01
#ha_mon.sh 檢查pvgrs6db02 是否正常運(yùn)行
#ha_online.sh pvgrs6db01 保持節(jié)點(diǎn)pvgrs6db01 啟動(dòng)
2.3.2 航顯應(yīng)用服務(wù)器故障應(yīng)急預(yù)案
(1)故障現(xiàn)象。
本故障可能導(dǎo)致航顯系統(tǒng)以下故障現(xiàn)象:
①航顯顯示設(shè)備無法更新顯示;
②DMU 中無法連接現(xiàn)場(chǎng)設(shè)備;
③離港操作終端與柜臺(tái)航顯設(shè)備無聯(lián)動(dòng)。
(2)故障判斷。
根據(jù)服務(wù)器日志和故障現(xiàn)象判斷。
(3)風(fēng)險(xiǎn)分析。
級(jí)別:影響航班運(yùn)營。
后果:根據(jù)不同應(yīng)用服務(wù)器功能,導(dǎo)致無法顯示
航班動(dòng)態(tài)信息,操作終端無法操作等故障。
風(fēng)險(xiǎn)概率:待定(依據(jù)實(shí)際穩(wěn)定情況)。
(4)故障處理。
用root 用戶登錄10.28.170.51 pvgrs6isa01 運(yùn)行
#ha_standby.sh pvgrs6isa01
#ha_mon.sh 檢查pvgrs6isa02 上是否正常運(yùn)行
#ha_online.sh pvgrs6isa01 保持節(jié)點(diǎn)pvgrs6isa01啟動(dòng)
2.3.3 航顯核心進(jìn)程故障應(yīng)急預(yù)案
(2)故障現(xiàn)象。
本故障可能導(dǎo)致航顯系統(tǒng)以下故障現(xiàn)象:
①航顯顯示設(shè)備無法更新;
②部分航顯功能無法正常使用。
(3)故障判斷。
根據(jù)服務(wù)器日志和故障現(xiàn)象判斷。
(4)風(fēng)險(xiǎn)分析。
級(jí)別:影響航班運(yùn)營。
后果:航顯部分功能無法使用。
風(fēng)險(xiǎn)概率:待定(依據(jù)實(shí)際穩(wěn)定情況)。
(5)故障處理。
連接CS 服務(wù)器10.28.170.102,進(jìn)入u/ fids/ lbin運(yùn)行核心進(jìn)程重啟腳本。
2.4 航顯系統(tǒng)上下屏規(guī)則制定
由于航顯系統(tǒng)的實(shí)時(shí)性及需求的多變性,需要根據(jù)旅客、工作人員、服務(wù)部門的一些要求做臨時(shí)或?qū)崟r(shí)調(diào)整[2] ,對(duì)此要制定各個(gè)區(qū)域的航班顯示規(guī)則,并根據(jù)多方要求評(píng)估規(guī)則的可行性和調(diào)整范圍,為此制定如下航班顯示規(guī)則。上屏規(guī)則如表1 所列。
以下是特殊情況下的顯示規(guī)則。
航班狀態(tài)“NOP”需TOC 座席人員手工操作。值機(jī)柜臺(tái)FCS 操作:柜臺(tái)計(jì)劃開始辦票前60 分鐘,計(jì)劃結(jié)束辦票后120 分鐘。
登機(jī)口FCS 操作:計(jì)劃開始登機(jī)前10 小時(shí),計(jì)劃結(jié)束登機(jī)后10 小時(shí)。
登機(jī)口更改顯示規(guī)則,國際國內(nèi)均顯示3 小時(shí)內(nèi)更改信息。
2.5 人機(jī)結(jié)合的維護(hù)模式
除上文例行維護(hù)內(nèi)容外,建立監(jiān)控平臺(tái)并實(shí)行實(shí)時(shí)監(jiān)控,用短信、聲光的方式對(duì)發(fā)生的故障進(jìn)行通告,以達(dá)到預(yù)防、預(yù)警、預(yù)控的目的,保持系統(tǒng)的持續(xù)穩(wěn)定運(yùn)行。
3 結(jié)束語
作為浦東機(jī)場(chǎng)的重要信息系統(tǒng),航班信息顯示系統(tǒng)的覆蓋范圍涉及全部旅客及現(xiàn)場(chǎng)工作人員,所以保障航顯系統(tǒng)及其他重要信息系統(tǒng)的持續(xù)穩(wěn)定運(yùn)行是運(yùn)維部門的首要職責(zé),本文對(duì)航顯系統(tǒng)的運(yùn)維研究及方案制定,可作為其他信息系統(tǒng)的參考標(biāo)準(zhǔn),并逐步推廣、落實(shí),以及持續(xù)改進(jìn)。
參考文獻(xiàn):
[1] 褚瑞娟.航顯系統(tǒng)顯示方案設(shè)計(jì)與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2014.
[2] 金輝,石敏. 成都雙流國際機(jī)場(chǎng)航顯系統(tǒng)的設(shè)計(jì)實(shí)現(xiàn)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2003(3):8?11.
作者簡(jiǎn)介:
唐源源(1981—),本科,工程師,研究方向:工業(yè)自動(dòng)化系統(tǒng)、人工智能在機(jī)場(chǎng)運(yùn)行和管理中的功能與運(yùn)行保障。