朱智勝
摘要:目前企業(yè)監(jiān)控系統(tǒng)得到了廣泛的應(yīng)用,市場(chǎng)前景良好,該領(lǐng)域內(nèi)的技術(shù)更新工作也在不斷推進(jìn)中。該文首先介紹了目前常見的監(jiān)控系統(tǒng)的結(jié)構(gòu)特征,核心技術(shù)和實(shí)現(xiàn)過(guò)程,在此基礎(chǔ)上探討了將三種開放網(wǎng)絡(luò)協(xié)議應(yīng)用到企業(yè)級(jí)的監(jiān)控系統(tǒng)中的可行性,設(shè)計(jì)了相關(guān)的構(gòu)建方案,并實(shí)現(xiàn)了對(duì)應(yīng)的具體功能,滿足了企業(yè)對(duì)各種主機(jī)、網(wǎng)絡(luò)設(shè)備和存儲(chǔ)設(shè)備的遠(yuǎn)程實(shí)時(shí)化管理的需求。
關(guān)鍵詞:WMI;SNMP;SMI-S;監(jiān)控系統(tǒng)
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2017)13-0020-02
1概述
隨著企業(yè)對(duì)信息化技術(shù)的重視程度不斷加深,各種信息管理系統(tǒng)的應(yīng)用也得到了有效的推廣,企業(yè)各項(xiàng)業(yè)務(wù)的高效運(yùn)作越來(lái)越依賴于信息化管理系統(tǒng)的支持。這種市場(chǎng)發(fā)展趨勢(shì)有力促進(jìn)了信息化產(chǎn)業(yè)的飛速進(jìn)步,但同時(shí)也對(duì)信息化服務(wù)水平提出了更新的要求,尤其是在人力資源有限的情況下,如何實(shí)現(xiàn)對(duì)設(shè)備和系統(tǒng)運(yùn)行狀況進(jìn)行實(shí)時(shí)化的動(dòng)態(tài)監(jiān)控,是目前企業(yè)級(jí)的信息化管理系統(tǒng)所遇到的首要問(wèn)題。
在經(jīng)過(guò)了詳細(xì)的市場(chǎng)調(diào)研后發(fā)現(xiàn),目前市面上雖然存在一些大型的網(wǎng)絡(luò)設(shè)備監(jiān)控系統(tǒng),但普遍存在一些問(wèn)題,如復(fù)雜度過(guò)高、操作繁瑣、使用門檻高、管理功能的針對(duì)性不強(qiáng)等。因此,根據(jù)我國(guó)企業(yè)的經(jīng)營(yíng)特點(diǎn),設(shè)計(jì)出一款符合我國(guó)市場(chǎng)規(guī)律的,功能清晰完備的、操作簡(jiǎn)單易懂的監(jiān)控系統(tǒng),并提供自動(dòng)化的維護(hù)服務(wù)具有十分重要的經(jīng)濟(jì)價(jià)值和社會(huì)意義。
2企業(yè)監(jiān)控平臺(tái)需求分析
目前我國(guó)企業(yè)規(guī)模發(fā)展飛快,隨著業(yè)務(wù)不斷增多,企業(yè)擁有的各類型信息化系統(tǒng)設(shè)備數(shù)量也在不斷增加,為了保障企業(yè)業(yè)務(wù)執(zhí)行的高效性和穩(wěn)定性,就必須保證這些信息化設(shè)備的可靠運(yùn)轉(zhuǎn),因此需要對(duì)其進(jìn)行實(shí)時(shí)化的動(dòng)態(tài)監(jiān)控。通過(guò)對(duì)企業(yè)經(jīng)營(yíng)過(guò)程中發(fā)生的安全事件進(jìn)行全面統(tǒng)計(jì)后發(fā)現(xiàn),其中絕大多數(shù)的生產(chǎn)事故均是由于信息化系統(tǒng)的相關(guān)設(shè)備異常造成的,如網(wǎng)絡(luò)擁塞、中間設(shè)備故障、系統(tǒng)異常掛起等,這些故障有一個(gè)共同的特征,即均是在生產(chǎn)工作的第一線被發(fā)現(xiàn),并由基層員工首先匯報(bào)的,因此,當(dāng)維護(hù)人員確認(rèn)故障信息并趕至現(xiàn)場(chǎng)進(jìn)行處理時(shí),往往已是數(shù)十分鐘之后,這對(duì)生產(chǎn)和管理工作的影響無(wú)疑是巨大的。因此,只靠管理員進(jìn)行人工管理維護(hù)很難保證系統(tǒng)的良好正常運(yùn)轉(zhuǎn),只有依賴智能化的監(jiān)控系統(tǒng),對(duì)各種信息化設(shè)備的靜、動(dòng)態(tài)參數(shù)進(jìn)行實(shí)時(shí)抓取,并傳輸至控制中心進(jìn)行及時(shí)分析,發(fā)現(xiàn)異常后即可在最短時(shí)間內(nèi)進(jìn)行定位和判斷,分析其故障類型,以確保被監(jiān)控設(shè)備和服務(wù)的安全性和正常平穩(wěn)運(yùn)行。
3開放網(wǎng)絡(luò)協(xié)議概述
目前已有的開放網(wǎng)絡(luò)協(xié)議有三種,分別為Windows管理規(guī)范WMI協(xié)議、簡(jiǎn)單網(wǎng)絡(luò)管理SNMP協(xié)議和存儲(chǔ)管理接口規(guī)范SMI-S協(xié)議,以下分別進(jìn)行介紹。
(1)WMI一種用來(lái)描述Windows系統(tǒng)目前可用資源的組件,封裝于操作系統(tǒng)服務(wù)包當(dāng)中,由微軟公司開發(fā)并投入市場(chǎng),其優(yōu)勢(shì)是對(duì)于Windows系列系統(tǒng)實(shí)現(xiàn)了良好的支持,通過(guò)該組件可獲得由Windows系統(tǒng)管理的各種設(shè)備參數(shù),包括硬件運(yùn)行狀態(tài)、資源占用比和軟件執(zhí)行效率等。
(2)SNMP是現(xiàn)代計(jì)算機(jī)網(wǎng)絡(luò)體系中的一款專門用于網(wǎng)絡(luò)設(shè)備管理的通信協(xié)議,負(fù)責(zé)從管轄的各種網(wǎng)絡(luò)設(shè)備中抓取相關(guān)的狀態(tài)信息,同時(shí)采取統(tǒng)一的格式進(jìn)行封裝,并以互聯(lián)網(wǎng)為平臺(tái)實(shí)現(xiàn)了遠(yuǎn)距離傳輸。該協(xié)議一般的管理對(duì)象均為網(wǎng)絡(luò)通信設(shè)備,如路由器、交換機(jī)、網(wǎng)關(guān)等。
(3)SMI-S則是專門針對(duì)網(wǎng)絡(luò)中存儲(chǔ)設(shè)備進(jìn)行管理和監(jiān)控的一組標(biāo)準(zhǔn)規(guī)范,利用該規(guī)范提供的統(tǒng)一接口,可方便實(shí)現(xiàn)網(wǎng)絡(luò)存儲(chǔ)設(shè)備性能的監(jiān)控,并將相關(guān)信息傳輸至遠(yuǎn)端的控制主機(jī)。該標(biāo)準(zhǔn)最大的優(yōu)勢(shì)就在于解決了眾多存儲(chǔ)設(shè)備之間的互不兼容的問(wèn)題,無(wú)論硬件設(shè)備自身的運(yùn)行機(jī)制如何,在采用了SMI-S的統(tǒng)一接口標(biāo)準(zhǔn)之后,管理系統(tǒng)就可一視同仁的對(duì)其進(jìn)行監(jiān)控與管理。
4基于開放網(wǎng)絡(luò)協(xié)議的監(jiān)控技術(shù)
4.1系統(tǒng)結(jié)構(gòu)設(shè)計(jì)
圖1給出了本設(shè)計(jì)中監(jiān)控系統(tǒng)的整體結(jié)構(gòu),如圖所示,本系統(tǒng)由兩臺(tái)高性能服務(wù)器組成基本框架,其中一臺(tái)作為存儲(chǔ)數(shù)據(jù)庫(kù),另一臺(tái)則用作數(shù)據(jù)處理分析設(shè)備使用,并基于互聯(lián)網(wǎng)實(shí)現(xiàn)了對(duì)各種監(jiān)控設(shè)備的遠(yuǎn)程管理。
4.2系統(tǒng)邏輯設(shè)計(jì)
監(jiān)控系統(tǒng)主要涉及的對(duì)象有:被管理對(duì)象、Agent服務(wù)器、采集到的數(shù)據(jù)、數(shù)據(jù)庫(kù)、命令及配置信息、APP展示界面、報(bào)警信息、管理員等。監(jiān)控系統(tǒng)的工作流程如下:
1)監(jiān)控系統(tǒng)(管理端)發(fā)起對(duì)被管理端運(yùn)行狀態(tài)的輪詢,輪詢間隔時(shí)間可根據(jù)需求進(jìn)行靈活設(shè)定,若設(shè)備運(yùn)行相對(duì)穩(wěn)定,則此時(shí)間間隔可適當(dāng)延長(zhǎng),以節(jié)約網(wǎng)絡(luò)通信資源;
2)被監(jiān)控對(duì)象與管理端實(shí)時(shí)抓取相關(guān)性能參數(shù),并按照網(wǎng)絡(luò)開放協(xié)議要求的格式進(jìn)行預(yù)處理;
3)將處理完成的數(shù)據(jù)存入數(shù)據(jù)庫(kù),以備接受輪詢時(shí)將其發(fā)送至控制臺(tái)予以展示;
4)控制臺(tái)在收到了采集數(shù)據(jù)后,對(duì)其進(jìn)行分析計(jì)算,當(dāng)信息中存在出發(fā)告警的數(shù)據(jù)時(shí),則通過(guò)郵件或短信對(duì)管理人員進(jìn)行報(bào)警處理;
5)在報(bào)警的同時(shí),在監(jiān)控主機(jī)的WEB頁(yè)面上顯示相關(guān)監(jiān)測(cè)信息;
根據(jù)以上監(jiān)控系統(tǒng)工作流程,將監(jiān)控系統(tǒng)設(shè)計(jì)劃分為多個(gè)模塊,包括設(shè)備添加配置模塊、信息采集模塊、存儲(chǔ)模塊、數(shù)據(jù)分析模塊、輪詢模塊、告警模塊、展示模塊等,如圖2所示。
4.3開放網(wǎng)絡(luò)協(xié)議在監(jiān)控系統(tǒng)中的應(yīng)用
1)WMI協(xié)議的應(yīng)用
由于WMI協(xié)議對(duì)Windows系統(tǒng)的支持度最高,可實(shí)現(xiàn)真正的無(wú)縫式管理,因此選擇該協(xié)議來(lái)執(zhí)行從控制機(jī)A到被監(jiān)控機(jī)B的遠(yuǎn)程訪問(wèn)。在構(gòu)建這一訪問(wèn)時(shí),必須首先構(gòu)建從A到B的COM連接;在B上則需開啟WMI協(xié)議,并為A提供可用的管理員賬號(hào),A憑借這一信息登錄B并抓取相關(guān)信息,包括CPU占用率、磁盤空間和利用率、內(nèi)存容量和使用率、磁盤10信息等各種與操作系統(tǒng)相關(guān)的參數(shù),其操作界面如圖3所示。
2)SNMP協(xié)議的應(yīng)用
如前文所述,對(duì)于網(wǎng)絡(luò)設(shè)備的監(jiān)控,一般采用SNMP協(xié)議。首先,需要被監(jiān)控的網(wǎng)絡(luò)設(shè)備支持開啟SNMP服務(wù),并設(shè)置訪問(wèn)連接的團(tuán)體字符串,該字符串即作為監(jiān)控過(guò)程中輪詢環(huán)節(jié)的標(biāo)識(shí)符和監(jiān)控機(jī)訪問(wèn)被監(jiān)控設(shè)備的憑證。SNMP協(xié)議主要針對(duì)網(wǎng)絡(luò)通信數(shù)據(jù)進(jìn)行監(jiān)控,如網(wǎng)絡(luò)接口流量、數(shù)據(jù)包丟棄率、數(shù)據(jù)包碎片數(shù)、超大數(shù)據(jù)包比例等重要參數(shù),相關(guān)的操作界面如圖4所示。
3)SMI-S標(biāo)準(zhǔn)的應(yīng)用
對(duì)于存儲(chǔ)設(shè)備的監(jiān)控,不同廠商提供了不同的方式,但底層通訊遵循相同的存儲(chǔ)服務(wù)協(xié)議SMI-S。在本系統(tǒng)當(dāng)中,采用EMC存儲(chǔ)系列產(chǎn)品來(lái)完成數(shù)據(jù)存儲(chǔ)的任務(wù)。在監(jiān)控過(guò)程中,首先通過(guò)EMC低端存儲(chǔ)收集網(wǎng)絡(luò)中EMC的存儲(chǔ)信息,隨后將該信息通過(guò)統(tǒng)一接口標(biāo)準(zhǔn)SMI-S發(fā)送到監(jiān)控平臺(tái),由其負(fù)責(zé)過(guò)濾并分析這些數(shù)據(jù),在得出相關(guān)結(jié)論后通過(guò)圖形化界面展示給用戶。
EMC高端存儲(chǔ)系列的監(jiān)控方式與低端存儲(chǔ)不同,存儲(chǔ)信息的收取需要通過(guò)EMC公司為高端存儲(chǔ)專門定制的Provider。本系統(tǒng)配置一臺(tái)通過(guò)光纖交換機(jī)與被監(jiān)控存儲(chǔ)連接的主機(jī),并在被監(jiān)控存儲(chǔ)設(shè)備中隔離出一部分空間分配給此臺(tái)主機(jī),并在主機(jī)上安裝EMC SMI-S Provider。此臺(tái)主機(jī)通過(guò)Provider收集存儲(chǔ)信息,并將信息發(fā)送給監(jiān)控平臺(tái)。SMI-S協(xié)議可獲得大量關(guān)于存儲(chǔ)設(shè)備的性能參數(shù),如控制器信息、RAID卡信息、磁盤容量和LUN信息、存儲(chǔ)卷信息、存儲(chǔ)卷所映射的主機(jī)等,相關(guān)的操作界面如圖5所示。
5結(jié)束語(yǔ)
隨著信息化設(shè)備使用規(guī)模的不斷擴(kuò)大,相關(guān)的設(shè)備性能監(jiān)控系統(tǒng)也層出不窮,本文提出的采用開放網(wǎng)絡(luò)協(xié)議為基礎(chǔ)的監(jiān)控系統(tǒng)較好的結(jié)合了WMI協(xié)議,SNMP協(xié)議和SMI-S標(biāo)準(zhǔn),分別針對(duì)Windows操作系統(tǒng)、網(wǎng)絡(luò)通信設(shè)備和網(wǎng)絡(luò)存儲(chǔ)設(shè)備的各項(xiàng)參數(shù)進(jìn)行實(shí)時(shí)監(jiān)控,及時(shí)的向管理者匯報(bào)這些設(shè)備在運(yùn)行過(guò)程中出現(xiàn)的異常情況,提高了系統(tǒng)運(yùn)維工作的反應(yīng)速度,縮短了故障處理時(shí)間,有效保障了公司信息基礎(chǔ)設(shè)施的安全、連續(xù)、司靠運(yùn)行。