曾慶明
摘 要:采用自動監(jiān)控技術和計算機技術建成的機房監(jiān)控對機房環(huán)境和設備統(tǒng)一監(jiān)控,能保障信息的安全可靠運行,可以實現(xiàn)科學管理,提出了高校機房監(jiān)控總體解決方案。
關鍵詞:機房管理;網絡;監(jiān)控系統(tǒng)
中圖分類號:C931.9 文獻標識碼:A 文章編號:1005-569X(2009)01-0024-03
隨著信息網絡技術的不斷發(fā)展,各類大、中型組織的網絡信息化建設的設備資金投入日趨增加,其職能運行與計算機網絡的結合日趨緊密。計算機網絡的建設與發(fā)展使人們極大地開闊了信息視野、也極大地提升了辦公、生活中信息處理、傳播效率。與此同時人們在工作、生活中對網絡的依賴性也日益增強,網絡的維護管理負擔也日趨繁重。
為保證組織的安全、穩(wěn)定、高效運行,保證網絡設備的良好運行狀態(tài)和設備使用壽命與安全,實現(xiàn)用戶的最大投資效益,就有必要對網絡運行環(huán)境的電力供應、溫度、濕度、漏水、空氣含塵量等諸多環(huán)境變量,UPS、空調、新風、除塵、除濕等諸多設備運行狀態(tài)變量,進行24小時實時監(jiān)測與智能化調節(jié)控制,以保證網絡運行環(huán)境的穩(wěn)定與網絡軟硬件資源、設備的安全以及相關信息數(shù)據(jù)的安全。
因此設計建設一套能夠對網絡物理運行環(huán)境變量、設備狀態(tài)變量以及安防、消防狀況進行全方位監(jiān)測、智能化自動調控報警,分布式遠程控制管理的系統(tǒng),已經成為各類組織當前信息化建設的首要之務。
機房監(jiān)控系統(tǒng)是對分布在機房內的各個獨立的動力設備和機房環(huán)境監(jiān)控對象進行數(shù)據(jù)采集,實時監(jiān)測系統(tǒng)和設備的運行狀態(tài),記錄和處理相關數(shù)據(jù),及時偵測故障,并作必要的控制操作,及時通知機房管理人員處理。機房監(jiān)控系統(tǒng)包括供配電、UPS、空調、溫濕度、防漏水、防火、防雷、安防、門禁等監(jiān)控要求,有的還包括攝像監(jiān)控的要求。
1 機房監(jiān)控系統(tǒng)
1.1 監(jiān)控系統(tǒng)功能機房監(jiān)控系統(tǒng)主要實現(xiàn)以下三種功能
1.1.1 數(shù)據(jù)采集和控制
數(shù)據(jù)采集是監(jiān)控系統(tǒng)最基本的功能要求,必須精確和迅速;對設備的控制是為實現(xiàn)維護要求而立即改變系統(tǒng)運行狀態(tài)的有效手段必須可靠;對各種被監(jiān)控設備如供配電、空氣開關、空調,UPS、消防設備、攝像設備等進行集中監(jiān)控,為實現(xiàn)機房少人或無人值守創(chuàng)造了條件。
1.1.2 設備運行和維護
運行和維護是基于數(shù)據(jù)采集和設備控制之上的系統(tǒng)核心功能,完成日常的告警處理、控制操作和規(guī)定的數(shù)據(jù)記錄等。
1.1.3 維護管理
管理功能應實現(xiàn)以下四組管理功能:
(1)配置管理。配置管理提供包括系統(tǒng)配置、現(xiàn)場監(jiān)控對象的一般配置、告警門限配置等各種配置的功能組。
(2)故障管理。故障管理提供對被監(jiān)控對象運行情況異常進行檢測和報告的功能組。及時發(fā)現(xiàn)緊急事件,防止因設備原因造成系統(tǒng)中斷、機房失火等重大事件的發(fā)生。提供告警等級管理,告警信號的人機界面,告警確認,告警門限設置和告警屏蔽等。
(3)性能管理。性能管理提供對監(jiān)控對象的狀態(tài)以及網絡的有效性評估和報告的功能組。例如提供設備主要運行數(shù)據(jù)及參數(shù);停電、供電情況;設備故障、告警統(tǒng)計等。
(4)安全管理。安全管理提供保證運行中的監(jiān)控系統(tǒng)安全的功能組。
1.2 監(jiān)控系統(tǒng)結構
機房監(jiān)控系統(tǒng)一般由監(jiān)控管理中心(SC),監(jiān)控管理站(SS)、監(jiān)控單元(SU)組成,它們通過計算機網絡(WAN或LAN)互連起來,也即為三級監(jiān)控管理結構模式。
SC(Supervision Center)監(jiān)控管理中心:是整個監(jiān)控系統(tǒng)的管理中心,它為適應集中監(jiān)控、集中維護和集中管理的要求而設置。
SS(Supervision Station)監(jiān)控管理站(又稱為監(jiān)控管理分中心):區(qū)域管理維護單位,監(jiān)控站為滿足區(qū)域管理要求而設置的,負責轄區(qū)內各監(jiān)控單元的管理。
SU(Supervision Unit)監(jiān)控單元:監(jiān)控單元為最基本的測控單元,它完成對被監(jiān)控對象的數(shù)據(jù)采集和必要的控制功能。在機房監(jiān)控規(guī)模小的情況下,也可以采用二級管理,即省略監(jiān)控管理站SS這一級,只保留監(jiān)控管理中心SC和監(jiān)控單元Suo在單個機房的情況下,整個系統(tǒng)就簡化為監(jiān)控單元SU和監(jiān)控管理中心SC同處一地了。監(jiān)控單元通過串口(RS232,RS485)或網絡(TCP/IP)等通信方式與被監(jiān)控設備互聯(lián),采集被監(jiān)控設備的實時數(shù)據(jù)。
1.3 監(jiān)控對象
機房監(jiān)控系統(tǒng)的監(jiān)控對象一般有以下幾種。
1.3.1 低壓配電設備
三相電壓,三相電流,有功功率,無功功率,有功電度,無功電度,功率因數(shù),頻率等電量,空氣開關狀態(tài)。
1.3.2 不間斷電源(UPS)
三相輸人電壓,直流輸人電壓,三相輸出電壓,三相輸出電流,輸出頻率,蓄電池電壓,蓄電池溫度,同步/不同步狀態(tài),UPS/旁路供電,蓄電池放電電壓低,市電故障,整流器故障,逆變器故障,旁路故障。
1.3.3 空調設備
空調主機工作電壓,工作電流,送風溫度,回風溫度,送風濕度,回風濕度,壓縮機吸氣壓力,壓縮機排氣壓力,開/關機,電壓、電流過高/低,回風溫度過高/低,回風濕度過高/低,過濾器正常/堵塞,風機正常/故障,壓縮機正常/故障。
1.3.4 環(huán)境
溫度,濕度,煙感,水浸,紅外,玻璃破碎,門磁等。
2 高校機房監(jiān)控總體解決方案
為保障校園網的運行在核心機房中通常有大量的外圍支持系統(tǒng)(UPS、空調、門禁等)和不同類型的設備(服務器、終端、交換機、路由器等)。系統(tǒng)實現(xiàn)的目標是在通常情況下通過現(xiàn)有的網絡(校園網)遠程監(jiān)控各個機房里面的運行環(huán)境和網絡運行狀態(tài),同時管理控制和維護各個機房的管理設備,在特殊情況下能利用公共通信平臺(傳統(tǒng)有線電話和移動電話網)對遠程機房實施控制和管理。對于環(huán)境監(jiān)控深度要達到各種環(huán)境情況的檢測和視頻圖像的監(jiān)控,對于網絡運行狀態(tài)能達到基于應用的檢測、對設備管理的深度能達到BIOS層,且能實現(xiàn)遠程開關設備電源。系統(tǒng)實現(xiàn)滿足以下原則:
實用性:系統(tǒng)的設置可以實現(xiàn)核心機房無人(或少人)值守,同時充分利用現(xiàn)有網絡資源和公共通訊平臺,使系統(tǒng)具有較高的性能價格比。
可靠性:系統(tǒng)的設置在不影響網絡安全、穩(wěn)定的情況下,可穩(wěn)定地工作,采集和傳輸各種信號。
實用性:可以及時傳輸和顯示各種數(shù)據(jù)和告警信息,并對被監(jiān)控設備進行實時控制。
開放性:可以兼容不同的產品,靈活擴容。
靈活性:組網方式靈活,可以方便地增減控制信息和控制點。
高校校園網是學??蒲泻徒虒W必不可少的基礎設施,由于學校在多處都有校區(qū)作為科研和教學場所,各校區(qū)都已建有各校區(qū)的校園網并已互聯(lián)成一個大的高校校園網。為了更好地保障校園網的正??煽窟\行,高校將建設一套覆蓋各個校區(qū)的機房監(jiān)控系統(tǒng)來監(jiān)測機房內的輔助設備(如UPS、空調、供配電等)與環(huán)境參數(shù)。
2.1 高校機房監(jiān)控系統(tǒng)總體結構[ST]
高校機房監(jiān)控系統(tǒng)采用三級監(jiān)控管理結構模式,即由高校機房監(jiān)控系統(tǒng)管理中心、各校區(qū)監(jiān)控管理站和監(jiān)控單元組成。監(jiān)控管理中心包括監(jiān)控中心管理系統(tǒng)、監(jiān)控數(shù)據(jù)庫及數(shù)據(jù)分析管理系統(tǒng)、圖像監(jiān)控顯示系統(tǒng)、機房監(jiān)控顯示界面等組成,它主要完成如下任務:
2.1.1 實時監(jiān)控
實時監(jiān)視各監(jiān)控單元所采集的動力設備和環(huán)境的工作狀態(tài)和運行參數(shù),接收故障告警信息;根據(jù)需要,查詢各校區(qū)監(jiān)控管理站(SS)和監(jiān)控單元(SU)采集的各種監(jiān)測數(shù)據(jù)和告警信息;實時監(jiān)視各監(jiān)控管理站(SS)的工作狀態(tài);可透過監(jiān)控管理站(SS)對監(jiān)控單元(SU)下達監(jiān)測和控制命令。
2.1.2 告警管理
設定告警等級、用戶權限。
2.1.3 運行管理
具有統(tǒng)計功能,能生成各類統(tǒng)計報表及曲線圖;具有文件存檔和數(shù)據(jù)庫管理功能。
2.1.4 監(jiān)控系統(tǒng)自身管理
在接管監(jiān)控站(SS)的控制權后,對于告警信息的處理與監(jiān)控管理站(SS)相同,也就是具有告警過濾能力;向各校區(qū)監(jiān)控管理站定時下發(fā)時鐘校準命令;監(jiān)視各校區(qū)監(jiān)控管理站和各監(jiān)控單元自身工作狀態(tài),一旦發(fā)現(xiàn)各校區(qū)監(jiān)控管理站和各監(jiān)控單元故障及時報普。
[HTH][STHZ]2.2 監(jiān)控管理系統(tǒng)[ST]
監(jiān)控管理站包括監(jiān)控管理站監(jiān)控管理系統(tǒng),它主要完成如下任務:
2.2.1 實時監(jiān)控
實時監(jiān)視各各監(jiān)控單元所采集的動力設備和機房環(huán)境的工作狀態(tài),接收故障告警信息;查詢監(jiān)控單元(SU)采集的各種監(jiān)測數(shù)據(jù)和告警信息。
2.2.2 告警管理
設定告警等級、用戶權限;設定各個監(jiān)測量性能門限值,具有告警過濾能力。
2.2.3 運行管理
具有統(tǒng)計功能,能生成各種統(tǒng)計報表及曲線圖;具有數(shù)據(jù)存儲功能,告警數(shù)據(jù)、操作數(shù)據(jù)和監(jiān)測數(shù)據(jù)應至少保存半年時間。監(jiān)控系統(tǒng)自身管理。能同時監(jiān)視轄區(qū)內SU的工作狀態(tài)并與監(jiān)控管理中心(SC)保持通信;接收監(jiān)控中心(SC)定時下發(fā)的時鐘校準命令;實時向監(jiān)控中心(SC)轉發(fā)緊急告警信息,必要時(如監(jiān)控站SS夜間無人值守),可設置成將所收到的全部告警信息轉送到監(jiān)控管理中心(SC)。
3 結 語
計算機信息系統(tǒng)的發(fā)展使得作為其網絡設備、主機服務器、數(shù)據(jù)存儲設備、網絡安全設備等核心設備存放地的計算機機房日益顯現(xiàn)出它的重要地位,而機房的環(huán)境和動力設備如供配電、UPS、空調、消防、保安等必須時時刻刻為計算機信息系統(tǒng)提供正常的運行環(huán)境。目前國內普遍缺乏機房環(huán)境設備的專業(yè)管理人員,在許多地方的機房不得不安排軟件人員或者不太懂機房設備管理甚至根本不懂機房設備維護的人員值班,這對機房的安全運行無疑又是一個不利,因此監(jiān)控系統(tǒng)已經越來越成為新建大型機房所必需的一部分,這將無疑的為信息化社會的建設管理大大的提高工作效率。
參考文獻:
[1] 高鴻峰,何禹,於斌,等.校園網無人值守核心機房的設計管理.2006.
[2] 鄧敏,周曉斌,胡才永,等.信息機房遠程網絡環(huán)境監(jiān)控的實現(xiàn).2005.