臧紅偉
(中國電信吉林公司,130033)
電信網(wǎng)綜合告警系統(tǒng)為提高轉(zhuǎn)單有效率而探索
臧紅偉
(中國電信吉林公司,130033)
隨著三大電信運(yùn)營商綜合業(yè)務(wù)的發(fā)展,電信運(yùn)營商的網(wǎng)絡(luò)告警監(jiān)控至關(guān)重要,各省紛紛建立綜合告警系統(tǒng),將傳輸、數(shù)據(jù)、交換、無線、平臺等專業(yè)的告警都集中到一個(gè)平臺上,并實(shí)現(xiàn)告警自動(dòng)派單功能。文章的主要內(nèi)容是介紹了在提高轉(zhuǎn)單有效率方面進(jìn)行的探索,以及未來發(fā)展的趨勢。
綜合告警;轉(zhuǎn)單有效率
1.1 背景
隨著三大電信運(yùn)營商綜合業(yè)務(wù)的發(fā)展,電信運(yùn)營商的網(wǎng)絡(luò)告警監(jiān)控至關(guān)重要,各省紛紛建立綜合告警系統(tǒng),將傳輸、數(shù)據(jù)、交換、無線、平臺等專業(yè)的告警都集中到一個(gè)平臺上,并實(shí)現(xiàn)告警自動(dòng)派單功能。
在實(shí)現(xiàn)告警自動(dòng)派單功能的初期,由于各專業(yè)各網(wǎng)管的各種規(guī)則不完善,導(dǎo)致告警工單錯(cuò)派、漏派、多派不等問題非常多。無效工單很多,即轉(zhuǎn)單有效率很低,這給工單管控人員和維護(hù)人員帶來麻煩和困擾。
1.2 意義
提高轉(zhuǎn)單有效率已經(jīng)成為綜合告警系統(tǒng)最重要的工作內(nèi)容之一。提高轉(zhuǎn)單有效率,一方面可以減輕監(jiān)控人員的工作壓力,讓監(jiān)控工作和工單管控變得更迅捷、更精準(zhǔn)、更智能;另一方面可以幫維護(hù)人員去除無效工單和不重要告警的干擾,使其更高效的處理網(wǎng)絡(luò)故障,避免處理大量的無效工單。
因此建立一個(gè)規(guī)則完善的綜合告警系統(tǒng),盡可能的提高轉(zhuǎn)單有效率的需求迫在眉睫。
隨著各方對轉(zhuǎn)單有效率的要求越來越高,在我們不斷的探索下,各種規(guī)則應(yīng)運(yùn)而生,這些規(guī)則有告警過濾、告警壓縮、告警豐富、告警關(guān)聯(lián)、級別重定義、重復(fù)告警判斷,合并派單,抑制派單等。這些規(guī)則就是提高轉(zhuǎn)單有效率的有效方案,它們的不斷產(chǎn)生和完善是綜合告警系統(tǒng)向前發(fā)展的最大動(dòng)力,本文將闡述它們的功能。
2.1 告警過濾
由于全網(wǎng)告警都接入到綜合告警系統(tǒng),因此綜合告警系統(tǒng)處理告警的量非常大。為了緩解這一問題,我們根據(jù)系統(tǒng)建設(shè)經(jīng)驗(yàn),經(jīng)維護(hù)人員同意,梳理了告警過濾規(guī)則。即,對于有必要的網(wǎng)管,將很輕微的告警在綜合告警系統(tǒng)采集時(shí)過濾掉,不采集入庫,更不會呈現(xiàn)在告警板上。這種告警過濾規(guī)則的實(shí)施,將無用告警擋在外面,不僅不會干擾監(jiān)控人員,而且也不會有降低轉(zhuǎn)單有效率的情況發(fā)生,是最直接有效的。
2.2 告警壓縮
網(wǎng)絡(luò)層告警反復(fù)發(fā)生的情況很常見,將這些告警壓縮成一個(gè)告警在很多網(wǎng)管中是有必要的,這樣做不僅有利于告警監(jiān)控而且有益于提高轉(zhuǎn)單有效率。我們根據(jù)經(jīng)驗(yàn),總結(jié)了很多告警壓縮規(guī)則,在這方面工作的探索中,有成功也有失敗。成功實(shí)施壓縮的是那些適合壓縮的網(wǎng)管產(chǎn)生的告警,失敗的是某網(wǎng)管的告警不適合被壓縮,如強(qiáng)行壓縮,會有不可調(diào)和的問題。就是在這種不斷研究和嘗試中,最終形成了告警壓縮規(guī)則文檔,記錄了各種壓縮規(guī)則,并在后續(xù)實(shí)際工作中不斷完善和改進(jìn)。
2.3 告警豐富
告警豐富是綜合告警系統(tǒng)將接收到的告警按照規(guī)則匹配出其他有用的信息,例如資源信息。這種告警豐富的規(guī)則是在實(shí)際生產(chǎn)工作中形成的,是為了解決某些問題而必須實(shí)施的功能,它們直接解決了告警本身信息不全的問題,為告警關(guān)聯(lián)、工單呈現(xiàn)等工作創(chuàng)造了必要的條件,也為提高轉(zhuǎn)單有效率帶來間接的貢獻(xiàn)。例如,傳輸原始告警中無電路代號和客戶名稱等信息,根據(jù)相應(yīng)的告警豐富規(guī)則,系統(tǒng)用告警源和端口等信息去資源數(shù)據(jù)中查詢,將查詢到的電路代號和客戶信息匹配到告警中,從而進(jìn)行實(shí)際應(yīng)用。
2.4 告警關(guān)聯(lián)
告警關(guān)聯(lián)很重要。告警關(guān)聯(lián)分為專業(yè)內(nèi)告警關(guān)聯(lián)和跨專業(yè)告警關(guān)聯(lián),有的告警關(guān)聯(lián)簡單易實(shí)現(xiàn),有的告警關(guān)聯(lián)復(fù)雜難實(shí)施。告警關(guān)聯(lián)的關(guān)鍵在于“規(guī)則”,沒有規(guī)則或者規(guī)則不可操作都是無法實(shí)現(xiàn)告警關(guān)聯(lián)的原因。綜合告警系統(tǒng)建設(shè)初期,派單規(guī)則的制定就經(jīng)歷了較長時(shí)間的過程,因此初期的告警關(guān)聯(lián)無人問津,但是隨著大量告警自動(dòng)派單,告警關(guān)聯(lián)的重要性逐漸被重視起來,一個(gè)一個(gè)的規(guī)則產(chǎn)生并實(shí)施。專業(yè)內(nèi)的告警關(guān)聯(lián)規(guī)則,是具有專業(yè)能力的人總結(jié)出來的,但是網(wǎng)絡(luò)復(fù)雜、告警無規(guī)律、缺乏資源支撐等因素影響著告警關(guān)聯(lián)發(fā)展。而跨專業(yè)告警關(guān)聯(lián)規(guī)則,更是需要專業(yè)間共同制定,互相配合,甚至不斷研究。告警關(guān)聯(lián)后根告警派單,衍生告警不單獨(dú)派單,直接提高轉(zhuǎn)單有效率,相反的,告警沒關(guān)聯(lián)上,無效工單多,這帶給維護(hù)人員非常不好的感知。例如,傳輸割接或者故障引起數(shù)據(jù)專業(yè)告警,如果跨專業(yè)告警關(guān)聯(lián)上,只有傳輸專業(yè)能收到故障工單,數(shù)據(jù)專業(yè)無需處理,但如果跨專業(yè)告警沒有關(guān)聯(lián)上,數(shù)據(jù)專業(yè)也會收到告警工單,這種工單被視為無效工單。
各種告警關(guān)聯(lián)的實(shí)現(xiàn)為提高轉(zhuǎn)單有效率帶來最直接的效果,不斷建設(shè)和完善它們是綜合告警系統(tǒng)最重要的工作內(nèi)容之一??傊?,告警關(guān)聯(lián)發(fā)展的道路任重而道遠(yuǎn),告警關(guān)聯(lián)的建設(shè)程度也代表了綜合告警系統(tǒng)的發(fā)展水平。
2.5 級別重定義
由于告警原始級別的形式多樣,為了統(tǒng)一規(guī)范告警等級,因此綜合告警系統(tǒng)將告警級別重新定義為緊急、主要、次要和提示四種,呈現(xiàn)顏色也與國際接軌。告警級別重定義規(guī)則文檔也是在生產(chǎn)實(shí)際中逐漸形成的,各專業(yè)各網(wǎng)管的告警都有自己的規(guī)則,其不斷修改和完善的頻率較高,僅次于派單規(guī)則。重定義規(guī)則有利于派單規(guī)則的實(shí)施,往往相同級別的告警,在工單處理時(shí)長、告警是否派單等規(guī)則中要求一致,是與派發(fā)規(guī)則相輔相成的,它們間接地提高轉(zhuǎn)單有效率,保證自動(dòng)派單的準(zhǔn)確性。
2.6 重復(fù)告警判斷
由于實(shí)行網(wǎng)絡(luò)層障礙工單自動(dòng)派發(fā)以來,工單量較大,其中,存在“重復(fù)告警”多次發(fā)生從而多次派單的情況,這嚴(yán)重降低了轉(zhuǎn)單有效率,也給監(jiān)控人員和工單處理人員帶來很大的工作負(fù)擔(dān)。
為了實(shí)現(xiàn)“重復(fù)告警”不重復(fù)派單,對“重復(fù)告警”的鑒別進(jìn)行了深入研究,發(fā)現(xiàn)判斷全專業(yè)網(wǎng)元的“重復(fù)告警”沒有規(guī)律而言,但是針對具體專業(yè)同類網(wǎng)元,還是可以找到較合適的規(guī)則,因此決定建立“重復(fù)告警派單規(guī)則”,具體如下:
●逐項(xiàng)梳理各專業(yè)各網(wǎng)管的重復(fù)告警規(guī)律,分別建立個(gè)性化的“重復(fù)告警判斷規(guī)則”。
●將判為重復(fù)告警的“重復(fù)告警信息”同步給相應(yīng)地未歸檔的工單中。
●通過“告警ID號”能區(qū)別出“重復(fù)告警”與“清除告警”的對應(yīng)關(guān)系,避免因?yàn)槎鄠€(gè)“重復(fù)告警”引起混亂。
重復(fù)告警判斷規(guī)則的制定和實(shí)施,實(shí)現(xiàn)了重復(fù)告警同步客調(diào)工單的功能。每天,都有與轉(zhuǎn)單數(shù)量相當(dāng)?shù)闹貜?fù)告警同步發(fā)生,在提高轉(zhuǎn)單有效率方面的作用是有目共睹的。
2.7 合并派單
合并派單,起初是在告警關(guān)聯(lián)不強(qiáng)大的情況下,采集的一種“無奈之舉”。合并派單規(guī)則誕生于自動(dòng)派單初期,那時(shí)候告警關(guān)聯(lián)規(guī)則如鳳毛麟角,為了解決同一故障多個(gè)告警導(dǎo)致多個(gè)工單的問題,我們嘗試在派單規(guī)則中加入合并派單規(guī)則,以保障大幅度提高轉(zhuǎn)單有效率。沒有想到的是,這種合并派單規(guī)則大面積應(yīng)用在各個(gè)專業(yè)的各個(gè)網(wǎng)管告警中,效果非常好。
其實(shí),合并派單規(guī)則具有通用性,只是合并的條件有所差別。在合并派單功能實(shí)施的過程中,一旦出現(xiàn)“合并派單中的告警不是同一原因引起”的情況,我們就研究、討論、修改合并派單規(guī)則,力圖讓合并派單規(guī)則更合理。目前,合并派單中的告警絕大多數(shù)是同一原因引起的,極少出現(xiàn)異常,可以說合并派單規(guī)則日臻完善。
現(xiàn)在,合并派單已經(jīng)是派單規(guī)則中必不可少的一部分,它幾乎相當(dāng)于一種告警關(guān)聯(lián)規(guī)則了,它為提高轉(zhuǎn)單有效率做出了重要貢獻(xiàn)。
2.8 抑制派單
抑制派單分為工程抑制和規(guī)則抑制兩種。工程抑制是通過工程預(yù)約實(shí)現(xiàn)工程割接期間的告警不派單。工程預(yù)約模塊是綜合告警系統(tǒng)重要的功能之一,應(yīng)用廣泛。規(guī)則抑制是為了定制個(gè)性化抑制派單規(guī)則而開發(fā)的功能,適合長期抑制派單的情況。這兩類抑制派單,有效地提高了轉(zhuǎn)單有效率,避免維護(hù)人員處理無用工單的問題。
綜合告警系統(tǒng)不斷發(fā)展,提高轉(zhuǎn)單有效率的工作也永遠(yuǎn)不會停止。告警關(guān)聯(lián)、工程預(yù)約關(guān)聯(lián)等工作會繼續(xù)提高轉(zhuǎn)單有效率。
臧紅偉,女,1976年10月生,1999年7月畢業(yè)于吉林大學(xué),獲得學(xué)士學(xué)位,2004年7月畢業(yè)于吉林大學(xué),獲得碩士學(xué)位,現(xiàn)工作在中國電信吉林公司,從事支撐系統(tǒng)維護(hù)工作,現(xiàn)職稱為通信工程師
The comprehensive alarm system of telecommunication network is an exploration for improving the efficiency of the conversion
Zang Hongwei
(China Telecom Jilin company,130033)
With the development of the three major telecom operators integrated services,telecom operators in the network alarm surveillance is critical,the provinces have established integrated alarm system, alarm transmission,data exchange,wireless,platform etc.professional on a platform,and achieve alarm automatically send a single function.The main content of the article is to introduce the exploration of the efficiency of the conversion,and the trend of the future development..
comprehensive alarm conversion efficiency