宮琦
摘 要:文章在實(shí)現(xiàn)無線網(wǎng)絡(luò)小區(qū)退服集中監(jiān)控的基礎(chǔ)上,在無線專業(yè)派障流程、告警梳理、實(shí)施細(xì)則等方面為拓展無線網(wǎng)絡(luò)集中監(jiān)控、逐步建設(shè)綜合監(jiān)控系統(tǒng)提供了有效的嘗試和經(jīng)驗(yàn)積累,最終實(shí)現(xiàn)告警的統(tǒng)一呈現(xiàn)、關(guān)聯(lián)分析,實(shí)現(xiàn)故障的聯(lián)動(dòng)處理和自動(dòng)派單。
關(guān)鍵詞:移動(dòng);無線網(wǎng)絡(luò);集中監(jiān)控;網(wǎng)管系統(tǒng)
1 概述
近年來,隨著移動(dòng)業(yè)務(wù)的發(fā)展,移動(dòng)網(wǎng)絡(luò)維護(hù)工作的壓力也日漸加重,無線網(wǎng)絡(luò)基站退服的管控直接關(guān)系到用戶感知和業(yè)務(wù)收入的有效增長。圍繞集中化、專業(yè)化、一體化的“三集中”運(yùn)維工作總體思路,通過集中派障和對(duì)末梢故障處理過程的精確管控,將有效縮短故障響應(yīng)時(shí)長,激勵(lì)末梢維護(hù)人員,加快故障處理速度,從而提升移動(dòng)網(wǎng)絡(luò)質(zhì)量和品牌形象。
由于無線網(wǎng)絡(luò)廠家和網(wǎng)元數(shù)量眾多、告警類型復(fù)雜多樣,因此可以分步驟實(shí)施移動(dòng)無線網(wǎng)絡(luò)的集中監(jiān)控工作,先實(shí)現(xiàn)無線網(wǎng)絡(luò)小區(qū)退服自動(dòng)派單的集中管控,后續(xù)將向?qū)崿F(xiàn)影響業(yè)務(wù)類的其它告警、重點(diǎn)指標(biāo)越限監(jiān)控及包括動(dòng)環(huán)監(jiān)控等在內(nèi)的綜合管控拓展。
2 無線網(wǎng)絡(luò)集中監(jiān)控系統(tǒng)的結(jié)構(gòu)和功能
移動(dòng)無線網(wǎng)絡(luò)小區(qū)退服集中監(jiān)控主要實(shí)現(xiàn)“省公司一級(jí)監(jiān)控,省地二級(jí)派單”。在原有移動(dòng)綜合網(wǎng)管和電子運(yùn)維系統(tǒng)基礎(chǔ)上,通過簡單的硬件擴(kuò)容和軟件開發(fā)實(shí)現(xiàn)系統(tǒng)自動(dòng)派單,有效提高派單效率,同時(shí)通過對(duì)故障發(fā)生、派發(fā)、接收、到達(dá)現(xiàn)場、故障處理、反饋等各個(gè)環(huán)節(jié)的逐一管控,實(shí)現(xiàn)對(duì)全省移動(dòng)網(wǎng)末梢維護(hù)人員的有效管理和考核,獎(jiǎng)優(yōu)罰劣,整體縮短故障處理時(shí)長,大幅提高響應(yīng)速度,有效提升用戶感知。
2.1 集中監(jiān)控系統(tǒng)的結(jié)構(gòu)
集中監(jiān)控系統(tǒng)由移動(dòng)綜合網(wǎng)管和電子運(yùn)維系統(tǒng)兩部分組成,其中網(wǎng)絡(luò)告警采集和歸類主要在移動(dòng)綜合網(wǎng)管實(shí)現(xiàn),短信和工單派發(fā)主要在電子運(yùn)維系統(tǒng)實(shí)現(xiàn)。綜合網(wǎng)管系統(tǒng)實(shí)時(shí)采集專業(yè)網(wǎng)管告警、根據(jù)一定派發(fā)規(guī)則將需要派發(fā)工單的告警發(fā)送至集中監(jiān)控系統(tǒng)、系統(tǒng)自動(dòng)派發(fā)工單。 同時(shí),網(wǎng)絡(luò)每發(fā)生一條告警,系統(tǒng)將依據(jù)預(yù)先設(shè)定的判斷規(guī)則,自動(dòng)觸發(fā)告警發(fā)生和告警恢復(fù)短信。另根據(jù)故障工單類型的不同,依據(jù)相應(yīng)的考核時(shí)長,采用不同的故障超時(shí)短信督辦升級(jí)流程,分級(jí)別逐級(jí)向上一級(jí)相關(guān)領(lǐng)導(dǎo)發(fā)送短信進(jìn)行故障升級(jí)督辦,以確保各類告警的及時(shí)處理。
2.2 集中監(jiān)控系統(tǒng)的流程及功能
2.2.1 集中監(jiān)控系統(tǒng)流程
集中監(jiān)控流程包括綜合網(wǎng)管采集專業(yè)網(wǎng)管告警、過濾歸類告警、將需要派發(fā)的工單派發(fā)至電子運(yùn)維、電子運(yùn)維自動(dòng)派發(fā)工單、地市接單人員接單并進(jìn)行轉(zhuǎn)派、地市故障處理人員接單處理故障、處理完畢反饋、地市接單人員審核并歸檔等8個(gè)主要環(huán)節(jié)。
集中監(jiān)控范圍內(nèi)的故障發(fā)生后,對(duì)符合派發(fā)條件的故障自動(dòng)派發(fā)工單至各地市故障工單接單部門,對(duì)割接、周期性斷電小區(qū)故障不派發(fā)工單。
各地市集中監(jiān)控工單受理人員接到工單后,對(duì)工單中的告警情況進(jìn)行初步判斷,派往下級(jí)接單單位或派往最終故障處理單位。需要時(shí)可以派往多個(gè)單位。故障處理單位應(yīng)核實(shí)故障信息、判斷故障原因并及時(shí)處理。若不屬于本單位處理應(yīng)及時(shí)反饋工單并說明原因。
省派單單位為工單發(fā)起單位,對(duì)工單處理過程要全程監(jiān)督。地市故障工單接單部門對(duì)派發(fā)至本地的工單進(jìn)行監(jiān)督。
工單處理單位處理完故障后要填寫詳細(xì)故障原因,故障處理完畢后,由地市故障工單接單部門進(jìn)行確認(rèn)、審核、結(jié)單并歸檔。對(duì)于審核不通過的工單駁回重新處理。
同時(shí),結(jié)合無線網(wǎng)絡(luò)維護(hù)工作的特殊性,對(duì)于由于外部原因如政府施工、自然災(zāi)害等原因?qū)е鹿收隙虝r(shí)間內(nèi)無法恢復(fù)的故障,可以申請掛起工單,工單掛起后維護(hù)人員需在要求時(shí)限內(nèi)排除、解決故障,及時(shí)恢復(fù)基站的正常運(yùn)行,并通過解掛的方式使工單進(jìn)入正常流轉(zhuǎn)的環(huán)節(jié)。
2.2.2 集中監(jiān)控工單分類
根據(jù)全網(wǎng)小區(qū)退服告警的產(chǎn)生、分布、分類情況,將工單分為5種類型:
⑴較大故障工單。2分鐘內(nèi)同一地區(qū)120個(gè)及以上小區(qū)退服且未恢復(fù)。
⑵批量中斷工單。2分鐘內(nèi)同一地區(qū)30個(gè)及以上、120個(gè)以下小區(qū)退服且未恢復(fù)。
⑶頻繁中斷工單。非VIP基站下掛小區(qū)30分鐘內(nèi)發(fā)生5次及5次以上退服。
⑷A類中斷工單。A類基站下小區(qū)發(fā)生退服并持續(xù)30分鐘未恢復(fù)。派單前將1分鐘內(nèi)發(fā)生的未恢復(fù)的同一邏輯站下的小區(qū)退服合并為一個(gè)工單。
⑸普通中斷工單。除以上情況外發(fā)生小區(qū)中斷并持續(xù)30分鐘未恢復(fù)的退服。派單前將1分鐘內(nèi)發(fā)生的未恢復(fù)的同一邏輯站下的小區(qū)退服合并為一個(gè)工單。
2.2.3 集中監(jiān)控系統(tǒng)模塊的功能
集中監(jiān)控系統(tǒng)為維護(hù)人員提供兩種處理系統(tǒng)派發(fā)工單的方式,一種是通過電腦終端登錄電子運(yùn)維系統(tǒng)進(jìn)行工單處理,另一種是通過掌中運(yùn)維手機(jī)終端進(jìn)行工單操作處理。
電子運(yùn)維系統(tǒng)實(shí)現(xiàn)短信和工單的派發(fā),其主要功能包括工單流轉(zhuǎn)、工單統(tǒng)計(jì)、相關(guān)派單規(guī)則設(shè)置等。工單類型包括較大故障、批量中斷、頻繁中斷、A類中斷、普通中斷五類工單。工單流轉(zhuǎn)實(shí)現(xiàn)從綜合網(wǎng)管接收告警、確定故障工單類型、生成派發(fā)相應(yīng)工單、以及工單受理、轉(zhuǎn)派、處理、反饋、審核歸檔等所有流轉(zhuǎn)環(huán)節(jié)。工單統(tǒng)計(jì)可按地市、部門、網(wǎng)絡(luò)類型、受理人、處理人、網(wǎng)元等信息查詢統(tǒng)計(jì),同時(shí)實(shí)現(xiàn)工單流轉(zhuǎn)過程、工單處理時(shí)長、超時(shí)工單等專項(xiàng)統(tǒng)計(jì)。相關(guān)派單設(shè)置規(guī)則包括基站周期性斷電、割接不派發(fā)工單的規(guī)則設(shè)置。
掌中運(yùn)維可以通過手機(jī)終端實(shí)現(xiàn)與PC端相同的工單流轉(zhuǎn)、數(shù)據(jù)查詢功能,通過移動(dòng)終端可以實(shí)時(shí)監(jiān)控和移動(dòng)管控故障工單從派發(fā)到處理的每一個(gè)環(huán)節(jié),同時(shí)還可以遠(yuǎn)程記錄網(wǎng)絡(luò)維護(hù)外勤人員出發(fā)、進(jìn)站、出站的維護(hù)動(dòng)作時(shí)間點(diǎn),從而更加方便快捷的實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)維護(hù)工作的有效監(jiān)督管控。
3 無線網(wǎng)絡(luò)集中監(jiān)控系統(tǒng)的發(fā)展趨勢
通過無線網(wǎng)絡(luò)小區(qū)退服自動(dòng)派單的集中管控,實(shí)現(xiàn)對(duì)移動(dòng)網(wǎng)末梢無線維護(hù)人員從故障發(fā)生、派發(fā)、接收、到達(dá)現(xiàn)場、故障處理、反饋等各個(gè)環(huán)節(jié)的時(shí)間軸的有效管控。該系統(tǒng)涉及的無線專業(yè)派障流程、告警梳理、實(shí)施細(xì)則、維護(hù)人員信息、統(tǒng)計(jì)報(bào)表等工作內(nèi)容將為無線網(wǎng)絡(luò)集中監(jiān)控的拓展提供有效的嘗試和經(jīng)驗(yàn)積累。因此,在實(shí)現(xiàn)無線網(wǎng)絡(luò)集中監(jiān)控的基礎(chǔ)上,逐步建設(shè)綜合監(jiān)控系統(tǒng),實(shí)現(xiàn)告警的統(tǒng)一呈現(xiàn)、關(guān)聯(lián)分析,實(shí)現(xiàn)故障的聯(lián)動(dòng)處理和自動(dòng)派單。
3.1 綜合監(jiān)控系統(tǒng)的定位
綜合監(jiān)控系統(tǒng)定位于圍繞發(fā)現(xiàn)故障、分析故障、解決故障,面向各級(jí)運(yùn)維管理和生產(chǎn)人員,全面提供全網(wǎng)絡(luò)監(jiān)控功能,實(shí)現(xiàn)全網(wǎng)的集中監(jiān)控、派單。綜合監(jiān)控系統(tǒng)位于OSS域,定位于網(wǎng)管類系統(tǒng),在各專業(yè)綜合網(wǎng)管系統(tǒng)之上。
3.2 集中監(jiān)控發(fā)展遵循的原則
為了確保系統(tǒng)的整體部署、互聯(lián)互通、協(xié)調(diào)運(yùn)營與統(tǒng)一管理,系統(tǒng)在建設(shè)過程中應(yīng)該遵循以下原則:
3.2.1 標(biāo)準(zhǔn)化原則
綜合監(jiān)控系統(tǒng)是一個(gè)面向全專業(yè)的復(fù)雜的通信網(wǎng)絡(luò)的實(shí)時(shí)監(jiān)控系統(tǒng),管理網(wǎng)元范圍廣,上層應(yīng)用種類不斷變化和增加,因此,綜合監(jiān)控系統(tǒng)在設(shè)計(jì)時(shí)應(yīng)滿足數(shù)據(jù)模型的標(biāo)準(zhǔn)化和接口的標(biāo)準(zhǔn)化。
3.2.2 組件通用原則
綜合監(jiān)控系統(tǒng)采用SOA的設(shè)計(jì)方法,實(shí)現(xiàn)業(yè)務(wù)分層和功能服務(wù)模塊化的分布式體系結(jié)構(gòu),用以保證系統(tǒng)的易用性、可維護(hù)性和通用性。
3.2.3 分層設(shè)計(jì)原則
綜合監(jiān)控的底層數(shù)據(jù)處理和應(yīng)用要分層設(shè)計(jì),滿足應(yīng)用層靈活擴(kuò)展要求。
3.2.4 技術(shù)先進(jìn)性
采用技術(shù)成熟、穩(wěn)定且具備先進(jìn)設(shè)計(jì)理念的產(chǎn)品,系統(tǒng)在建成后能通過平滑升級(jí)保持其先進(jìn)性,延長生命周期。
3.2.5 高可靠性
系統(tǒng)軟硬件均具備極高的可靠性。主要部件采用冗余機(jī)制;高效的故障管理保證系統(tǒng)具備極高的可用性,在最短時(shí)間內(nèi)即可恢復(fù)業(yè)務(wù)。軟件采用模塊化、分層隔離以及負(fù)載均衡的設(shè)計(jì)思想充分保證系統(tǒng)的高可靠性。
3.2.6 高安全性
解決方案從主機(jī)、數(shù)據(jù)及網(wǎng)絡(luò)等多方面采取相應(yīng)措施,確保系統(tǒng)的高安全性。
3.2.7 高可用性
系統(tǒng)具有高效的軟硬件使用效率,關(guān)鍵設(shè)備均達(dá)到硬件配置最高的使用率,同時(shí)采用優(yōu)化的流程設(shè)計(jì)確保系統(tǒng)的高效率。
3.2.8 易維護(hù)性
系統(tǒng)硬件可以很方便的實(shí)現(xiàn)遠(yuǎn)程管理及維護(hù);系統(tǒng)軟件均采用模塊化的設(shè)計(jì),并提供友好的人機(jī)接口,確保系統(tǒng)的易維護(hù)性。
3.2.9 靈活的擴(kuò)展性
系統(tǒng)關(guān)鍵設(shè)備均采用集群技術(shù)以及負(fù)載均衡技術(shù),可充分保證系統(tǒng)隨著網(wǎng)絡(luò)規(guī)模容量的擴(kuò)展,實(shí)現(xiàn)系統(tǒng)的平滑擴(kuò)容。軟件系統(tǒng)架構(gòu)充分利用網(wǎng)絡(luò)的擴(kuò)展性強(qiáng)的特點(diǎn),采用分散控制、集中管理的結(jié)構(gòu),使得系統(tǒng)可擴(kuò)充性很強(qiáng)。網(wǎng)絡(luò)構(gòu)建靈活,既可以實(shí)現(xiàn)平臺(tái)的集中處理,又能提供全面的透過網(wǎng)絡(luò)的分散能力,適應(yīng)多種應(yīng)用環(huán)境及場合。
3.3 綜合監(jiān)控系統(tǒng)的應(yīng)用場景
綜合監(jiān)控系統(tǒng)應(yīng)具備靈活、高效、多維度、可定制的場景監(jiān)控能力。應(yīng)用場景主要涵蓋概況監(jiān)控、日常監(jiān)控、節(jié)假日監(jiān)控、重保監(jiān)控、場景定制等。
⑴概況監(jiān)控場景用于呈現(xiàn)全網(wǎng)設(shè)備運(yùn)行情況或重點(diǎn)專業(yè)設(shè)備運(yùn)行狀況,可基于地圖或網(wǎng)絡(luò)拓?fù)鋪沓尸F(xiàn)網(wǎng)絡(luò)資源信息、告警信息、性能信息、工單信息、工程信息、業(yè)務(wù)質(zhì)量監(jiān)控信息等。
⑵日常監(jiān)控場景是從不同類型的用戶視角出發(fā)來呈現(xiàn)用于管理和維護(hù)所需的網(wǎng)絡(luò)運(yùn)行情況。
⑶節(jié)假日監(jiān)控主要對(duì)重大節(jié)假日業(yè)務(wù)量、系統(tǒng)負(fù)荷、業(yè)務(wù)質(zhì)量等信息進(jìn)行全專業(yè)監(jiān)控展示,可根據(jù)需要靈活定制所需的信息,并基于地圖或網(wǎng)絡(luò)拓?fù)鋪沓尸F(xiàn)信息。
⑷重保監(jiān)控主要實(shí)現(xiàn)對(duì)于重大事件的通訊保障的管理,重保監(jiān)控通過將多種類型的數(shù)據(jù)有機(jī)整合,從不同角度監(jiān)控重保區(qū)域內(nèi)的網(wǎng)絡(luò)運(yùn)行情況。
⑸場景定制指選擇監(jiān)控對(duì)象、監(jiān)控信息、監(jiān)控模式組合成監(jiān)控人員直接監(jiān)控的界面,包括監(jiān)控對(duì)象的定制、監(jiān)控信息的定制、監(jiān)控模式的定制、場景定制、場景監(jiān)控等場景監(jiān)控信息的定制展現(xiàn),用戶定制的場景可以保存。
3.4 集中監(jiān)控發(fā)展的目標(biāo)
建立全省集中的綜合監(jiān)控系統(tǒng),采集各專業(yè)網(wǎng)告警數(shù)據(jù)、配置數(shù)據(jù)、性能數(shù)據(jù)、資源數(shù)據(jù)等。通過專業(yè)內(nèi)告警標(biāo)準(zhǔn)化、網(wǎng)元設(shè)備命名規(guī)范尋找根告警壓縮大量衍生告警;利用資源模板實(shí)現(xiàn)專業(yè)間告警關(guān)聯(lián),為專業(yè)間性能數(shù)據(jù)關(guān)聯(lián)性分析提供數(shù)據(jù)依據(jù);利用性能分析模塊提取話務(wù)量、流量、性能數(shù)據(jù)來驗(yàn)證告警恢復(fù)情況,通過設(shè)置性能數(shù)據(jù)閥值,將故障扼殺在萌芽狀態(tài),提升網(wǎng)絡(luò)健壯性,通過分析性能數(shù)據(jù),為市場經(jīng)營決策提供趨勢性分析數(shù)據(jù)依據(jù),為網(wǎng)絡(luò)建設(shè)提供累計(jì)和忙時(shí)業(yè)務(wù)量數(shù)據(jù),滿足網(wǎng)絡(luò)規(guī)劃數(shù)據(jù)需求;利用派單模塊提供網(wǎng)絡(luò)變更上報(bào)流程,滿足資源及時(shí)更新、工程告警及性能打標(biāo)識(shí)的目的,將壓縮后告警、性能匹配維護(hù)人員后以工單形式一派到底,減少中間流轉(zhuǎn)環(huán)節(jié),提高維護(hù)效率,減少維護(hù)量,提升落地執(zhí)行力,從而最終提升客戶感知及網(wǎng)絡(luò)支撐能力。[1]
[參考文獻(xiàn)]
[1]焦曉光.淺談移動(dòng)通信機(jī)房設(shè)備故障集中監(jiān)控系統(tǒng)的應(yīng)用[J].科技與企業(yè),2012(8).