顏廣杰 深圳市天威網(wǎng)絡(luò)工程有限公司
HFC網(wǎng)絡(luò)是以光纖為骨干網(wǎng)絡(luò),同軸電纜為分支網(wǎng)絡(luò)的高帶寬網(wǎng)絡(luò),HFC擁有高度的靈活性和強(qiáng)大的功能,這些特性使得其成為了電信服務(wù)供應(yīng)商和有線電視的首選技術(shù)。HFC通信網(wǎng)由于擁有種類繁多的各種通信設(shè)備,所以更需要借助專用網(wǎng)管系統(tǒng)來(lái)對(duì)其加以管理。HFC通信機(jī)房由于地理分布較廣,而CM、光發(fā)射模塊、交換機(jī)、CMTS等設(shè)備運(yùn)行信息都需要被監(jiān)控,所以設(shè)計(jì)一個(gè)HFC網(wǎng)通信設(shè)備集中監(jiān)控告警系統(tǒng)來(lái)集中管理各種通信設(shè)備的告警信息是非常有必要的。
本文設(shè)計(jì)的HFC網(wǎng)絡(luò)設(shè)備集中告警系統(tǒng)主要通過(guò)集中告警平臺(tái)實(shí)現(xiàn)對(duì)HFC網(wǎng)絡(luò)相關(guān)通信設(shè)備實(shí)行集中告警。系統(tǒng)通過(guò)數(shù)據(jù)采集模塊從系統(tǒng)中各設(shè)備采集各種設(shè)備告警、性能越限告警和網(wǎng)絡(luò)告警等信息,通過(guò)將各孤立的設(shè)備、事件進(jìn)行關(guān)聯(lián),根據(jù)設(shè)備關(guān)聯(lián)關(guān)系、事件關(guān)聯(lián)關(guān)系,消除狀態(tài)閃爍變化而產(chǎn)生告警及關(guān)鍵節(jié)點(diǎn)引發(fā)的連鎖告警,同時(shí)根據(jù)告警時(shí)間、閾值、持續(xù)時(shí)間、消除持續(xù)時(shí)間等技術(shù)參數(shù)對(duì)告警進(jìn)行智能壓縮,然后借助相關(guān)通訊手段呈現(xiàn)給系統(tǒng)運(yùn)維人員,進(jìn)而實(shí)現(xiàn)對(duì)告警信息的集中管理。借助本系統(tǒng),系統(tǒng)運(yùn)維人員能夠迅速知道各系統(tǒng)故障發(fā)生的位置,以及導(dǎo)致故障發(fā)生的可能原因等信息。
數(shù)據(jù)采集主要是指系統(tǒng)從各網(wǎng)絡(luò)設(shè)備中采集數(shù)據(jù)的功能。系統(tǒng)是通過(guò)SNMP接口自動(dòng)采集各網(wǎng)元的設(shè)備告警、性能越限告警和設(shè)備數(shù)據(jù)等信息后,將越限告警/原始告警于數(shù)據(jù)庫(kù)中存儲(chǔ),再通過(guò)過(guò)濾以及轉(zhuǎn)換,統(tǒng)一為相同告警格式,然后及時(shí)通知應(yīng)用服務(wù)層,以便對(duì)告警信息進(jìn)行分析與處理。根據(jù)網(wǎng)管接口,告警采集方式可以分為以下兩種:一是trap主動(dòng)上報(bào)。各網(wǎng)絡(luò)設(shè)備主動(dòng)將各種告警信息上報(bào)給系統(tǒng)。二是被動(dòng)采集。系統(tǒng)從各網(wǎng)絡(luò)設(shè)備主動(dòng)采集告警信息。正常情況下,系統(tǒng)主要是被動(dòng)采集告警信息,但是限于一些需要進(jìn)行告警同步和一些系統(tǒng)功能的應(yīng)用場(chǎng)景,此時(shí)就需要系統(tǒng)采用trap主動(dòng)上報(bào)。
采集的告警信息主要包含以下內(nèi)容:告警源、告警級(jí)別、告警類型、告警名稱、告警產(chǎn)生以及恢復(fù)時(shí)間等。按告警嚴(yán)重程度,在本系統(tǒng)中將其依次分為告警恢復(fù)、提示告警、次要告警、重要告警、緊急告警五個(gè)級(jí)別。按告警狀態(tài),在本系統(tǒng)中分為歷史告警和當(dāng)前告警兩類。系統(tǒng)將根據(jù)不同級(jí)別、不同類型、不同設(shè)備的告警對(duì)過(guò)濾條件予以設(shè)置,針對(duì)同一告警信息重復(fù)出現(xiàn)的情況,系統(tǒng)會(huì)自動(dòng)將其壓縮為一條信息,但是會(huì)給出初次發(fā)生時(shí)間、最后發(fā)生時(shí)間以及告警次數(shù)。
告警合并是NMS通過(guò)相關(guān)信息將網(wǎng)絡(luò)中各設(shè)備節(jié)點(diǎn)進(jìn)行自動(dòng)關(guān)聯(lián),將相同、類似、可能相關(guān)的告警能夠自動(dòng)合并。比如系統(tǒng)在分析光節(jié)點(diǎn)健康狀態(tài)時(shí),檢查到市電丟失,同時(shí)檢查到,UPS供電不穩(wěn),光功率低,端口SNR低,CM在線率低,此時(shí),該光節(jié)點(diǎn)的故障會(huì)合并為一條告警,之后該光節(jié)點(diǎn)的將不再產(chǎn)生告警,直到此次告警恢復(fù)為止。系統(tǒng)告警通過(guò)過(guò)濾壓縮之后,有效壓縮率可以達(dá)到90%,極大地提高了告警信息的可讀性和有效性。
例如告警:電壓不穩(wěn)
系統(tǒng)在分析光節(jié)點(diǎn)健康狀態(tài)時(shí),檢查到市電丟失,同時(shí)檢查到,UPS供電不穩(wěn),光功率低,端口SNR低,CM在線率低,此時(shí),該光節(jié)點(diǎn)的故障會(huì)合并為一條告警,之后該光節(jié)點(diǎn)的將不再產(chǎn)生告警,直到此次告警恢復(fù)為止。
系統(tǒng)接收告警信息后,及時(shí)通知各告警終端,更新告警狀態(tài),并及時(shí)通知運(yùn)維人員。
本文設(shè)計(jì)的HFC網(wǎng)絡(luò)設(shè)備集中告警系統(tǒng),實(shí)現(xiàn)了告警管理的前移,很好地解決了原網(wǎng)絡(luò)系統(tǒng)存在的信息分散,無(wú)法將告警信息及時(shí)主動(dòng)借助相關(guān)通訊手段通知系統(tǒng)運(yùn)維人員這一缺陷,并將系統(tǒng)與BOSS系統(tǒng)、TMS系統(tǒng)、資源管理系統(tǒng)、GIS系統(tǒng)、工單管理系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)交換,進(jìn)而實(shí)現(xiàn)從告警檢測(cè)、告警響應(yīng)、告警處理、故障消除、告警報(bào)表管理的全過(guò)程管理,增加了HFC網(wǎng)絡(luò)專業(yè)的管理水平,更好地為HFC網(wǎng)絡(luò)生產(chǎn)服務(wù)。