李 凌,金文杰,陳躍國(guó)
(國(guó)網(wǎng)浙江省電力有限公司金華供電公司,浙江 金華 321000)
電網(wǎng)系統(tǒng)建設(shè)作為國(guó)家重要的發(fā)展戰(zhàn)略之一,始終是我國(guó)基礎(chǔ)建設(shè)投入資金最大的項(xiàng)目之一。尤其是近年來(lái),隨著工業(yè)化水平的不斷發(fā)展,電網(wǎng)系統(tǒng)承載的工作量與日俱增,電網(wǎng)系統(tǒng)的各項(xiàng)內(nèi)容不斷趨向智能化。與傳統(tǒng)電網(wǎng)系統(tǒng)相比,現(xiàn)代電網(wǎng)系統(tǒng)擁有更加復(fù)雜的結(jié)構(gòu)、承載更多的工作內(nèi)容且運(yùn)行程序更加多樣。因此,任何一個(gè)環(huán)節(jié)出現(xiàn)問(wèn)題,都會(huì)對(duì)供電系統(tǒng)的正常工作帶來(lái)困擾[1]。所以,專業(yè)人員需要有效監(jiān)督和管理電網(wǎng)系統(tǒng)。智能網(wǎng)絡(luò)告警系統(tǒng)可以有效監(jiān)督管理系統(tǒng),全天候監(jiān)控系統(tǒng)的運(yùn)行,并在發(fā)生故障時(shí)第一時(shí)間反饋并精準(zhǔn)定位故障地點(diǎn),幫助工作人員快速解決問(wèn)題。
隨著互聯(lián)網(wǎng)技術(shù)的不斷深化,網(wǎng)絡(luò)規(guī)模與復(fù)雜程度越來(lái)越高?;诰W(wǎng)絡(luò)智能化的電力告警系統(tǒng)將直接影響電力系統(tǒng)的安全和正常運(yùn)行[2]。電力系統(tǒng)監(jiān)控涉及許多復(fù)雜的設(shè)備,而告警系統(tǒng)的工作是集中收集和管理監(jiān)控設(shè)備內(nèi)容,并及時(shí)反饋突發(fā)情況。
電力監(jiān)控系統(tǒng)與其他系統(tǒng)相比,具有設(shè)備與用戶相對(duì)確定、網(wǎng)絡(luò)空間隔離性強(qiáng)且服務(wù)私有可控等特點(diǎn)。所以,一旦出現(xiàn)脫離用戶和設(shè)備常規(guī)使用內(nèi)容的操作,便被視為出現(xiàn)安全隱患[3-4]。安全監(jiān)測(cè)系統(tǒng)與產(chǎn)品一般基于網(wǎng)絡(luò)流量與報(bào)文分析技術(shù),工作對(duì)象一般基于互聯(lián)網(wǎng)通用服務(wù)與協(xié)議,并不適用于電力監(jiān)控系統(tǒng)。
傳統(tǒng)使用的內(nèi)網(wǎng)安全監(jiān)控平臺(tái)只能對(duì)便捷網(wǎng)防護(hù)進(jìn)行有限范圍的監(jiān)控,無(wú)法排除系統(tǒng)內(nèi)部的危險(xiǎn)隱患,也無(wú)法及時(shí)有效地監(jiān)控分析安全區(qū)內(nèi)部主機(jī)和數(shù)據(jù)庫(kù)等的相關(guān)內(nèi)容。基于此,在原有的內(nèi)部安全平臺(tái)上,采用基于事件和面向設(shè)備的技術(shù)路線,以主機(jī)操作系統(tǒng)和網(wǎng)絡(luò)設(shè)備固件作為依托,實(shí)時(shí)直接管理設(shè)備[5]。另外,基于調(diào)度數(shù)據(jù)網(wǎng)絡(luò)、廠站監(jiān)控、配網(wǎng)調(diào)度、配電自動(dòng)化以及負(fù)荷控制等系統(tǒng)實(shí)現(xiàn)集中監(jiān)控,并且進(jìn)一步完善網(wǎng)絡(luò)綜合管理功能,保證電力系統(tǒng)的安全運(yùn)行。
電力系統(tǒng)的內(nèi)容復(fù)雜,其告警系統(tǒng)的流程涉及較多,主要步驟如圖1所示。
圖1 告警系統(tǒng)流程圖
當(dāng)前電力系統(tǒng)中的網(wǎng)絡(luò)告警系統(tǒng)在各個(gè)階段還存在許多問(wèn)題。第一,告警信息采集階段。當(dāng)前告警信息的采集主要依靠專業(yè)網(wǎng)管或者廠商設(shè)備采集告警消息,存在告警通報(bào)方式缺乏統(tǒng)一的通報(bào)標(biāo)準(zhǔn)、告警信息漏報(bào)以及告警風(fēng)暴與接入數(shù)據(jù)不完整等問(wèn)題。第二,告警關(guān)聯(lián)分析階段。該階段主要是向告警內(nèi)容添加標(biāo)注,常見(jiàn)問(wèn)題包括缺乏清晰的關(guān)聯(lián)規(guī)則與對(duì)業(yè)務(wù)產(chǎn)生影響的關(guān)聯(lián)分析等。第三,告警呈現(xiàn)階段。該階段將經(jīng)過(guò)關(guān)聯(lián)與分析后的處理信息告知用戶,常見(jiàn)問(wèn)題包括告警呈現(xiàn)存在滯后性、關(guān)鍵的告警信息往往因?yàn)榇罅扛蓴_導(dǎo)致推送緩慢等,后期應(yīng)當(dāng)與物理對(duì)象和地理等各類信息相結(jié)合,實(shí)現(xiàn)故障定位。第四,告警預(yù)處理階段。該階段的主要問(wèn)題包括無(wú)法自動(dòng)識(shí)別和判斷故障原因、難以將日常人工經(jīng)驗(yàn)以智能程序化處理方式固化。第五,告警處理階段。該階段的主要問(wèn)題是如何有效屏蔽工程預(yù)警并實(shí)現(xiàn)智能派單。第六,故障恢復(fù)階段。該階段主要通過(guò)分析告警信息對(duì)異常告警信息進(jìn)行歸檔,并對(duì)規(guī)章告警指標(biāo)進(jìn)行專題分析,面臨的主要問(wèn)題是無(wú)法全面準(zhǔn)確地分析異常告警,難以有效體現(xiàn)故障收集管理取得的成果。
4.1.1 告警標(biāo)準(zhǔn)規(guī)范統(tǒng)一化
通過(guò)多對(duì)一的映射關(guān)系,統(tǒng)一標(biāo)準(zhǔn)且清晰的告警信息,搭建消息連發(fā)機(jī)制,杜絕漏報(bào)告警現(xiàn)象。設(shè)備生產(chǎn)廠家在設(shè)備消息發(fā)送時(shí),要求數(shù)據(jù)消息以連續(xù)正整數(shù)作為編號(hào)[6]。從數(shù)字1開(kāi)始,以信息實(shí)時(shí)發(fā)布通道(如一個(gè)MQ隊(duì)列或socket端口)為單位進(jìn)行編號(hào)。當(dāng)編號(hào)數(shù)值超過(guò)最大值時(shí),可以重新開(kāi)始編號(hào)。在信息緩存方面,數(shù)據(jù)生產(chǎn)者最少要保存5萬(wàn)條以上數(shù)據(jù),或者保存6 h之內(nèi)的告警。
4.1.2 搭建優(yōu)先上報(bào)通道,解決告警風(fēng)暴
優(yōu)先上報(bào)通道的流程,如圖2所示。建立重要告警優(yōu)先上報(bào)機(jī)制,依據(jù)告警級(jí)別、專業(yè)、標(biāo)題以及對(duì)象類型等相關(guān)參數(shù),制定告警優(yōu)先上報(bào)規(guī)則[7]。將優(yōu)先隊(duì)列和普通隊(duì)列同時(shí)解析入庫(kù),告警風(fēng)暴出現(xiàn)后,優(yōu)先觸發(fā)重要告警優(yōu)先觸發(fā)機(jī)制,優(yōu)先處理普通隊(duì)列,并且生成相關(guān)文件。
圖2 優(yōu)先上報(bào)通道
4.1.3 建立資源與告警核查,保證接入的數(shù)據(jù)可覆蓋全專業(yè)
核查接入的資源,內(nèi)容包括數(shù)據(jù)的完整性、有效性、數(shù)據(jù)格式的規(guī)范性以及網(wǎng)元連接關(guān)系。
選擇可能出現(xiàn)關(guān)聯(lián)性的告警條目范圍,分析以往經(jīng)常出現(xiàn)的大范圍故障類報(bào)警。例如,大范圍設(shè)備退服等,時(shí)常伴隨大量的los和linkdonw告警[8]。
自主設(shè)定關(guān)聯(lián)規(guī)則,確定可關(guān)聯(lián)告警所包括的專業(yè)網(wǎng)元類型,選擇可關(guān)聯(lián)的字段,包括資源關(guān)聯(lián)關(guān)系、端口描述以及機(jī)房地址等,還可選擇關(guān)聯(lián)規(guī)則,如模糊匹配和完全匹配等。
模擬驗(yàn)證告警關(guān)聯(lián)。主要模擬兩類告警,第一類是關(guān)聯(lián)告警,第二類為衍生告警[8-9]。制定關(guān)聯(lián)規(guī)則后,選取相關(guān)歷史警告開(kāi)展模擬關(guān)聯(lián)、生成關(guān)聯(lián)成功率和無(wú)關(guān)聯(lián)告警清單等數(shù)據(jù)。
依據(jù)故障的具體情況,根據(jù)相關(guān)監(jiān)控部門的預(yù)處理能力,將故障分成人工預(yù)處理與系統(tǒng)預(yù)處理兩類。通過(guò)兩類處理方式補(bǔ)充相關(guān)信息,以此不斷完善處理方案,并為下一環(huán)節(jié)的工作提供參考,以此提高整體效率。告警預(yù)處理的工作流程如圖3所示。
自我設(shè)定工程告警的屏蔽規(guī)則,即首先匯總各專業(yè)網(wǎng)管的屏蔽規(guī)則,其次選取故障告警系統(tǒng)和專業(yè)網(wǎng)管屏蔽規(guī)則數(shù)據(jù)共有的數(shù)據(jù),再次選擇跨專業(yè)網(wǎng)元關(guān)聯(lián)規(guī)則并對(duì)其進(jìn)行人工確認(rèn),最后完成工程告警屏蔽。
4.5.1 告警入庫(kù)階段
告警入庫(kù)后,統(tǒng)計(jì)專業(yè)網(wǎng)管的告警是否標(biāo)準(zhǔn)化,是否為異常告警,并匯總無(wú)法歸納的告警。
圖3 告警預(yù)處理
4.5.2 告警關(guān)聯(lián)階段
判斷可能需要關(guān)聯(lián)的告警,并分析和總結(jié)無(wú)關(guān)聯(lián)告警與無(wú)法關(guān)聯(lián)情況。
4.5.3 告警預(yù)處理階段
記錄每次進(jìn)行預(yù)處理的告警過(guò)程,包括是否經(jīng)過(guò)預(yù)處理和結(jié)果等[9],并對(duì)預(yù)處理失敗情況進(jìn)行分析和分類,如登陸或者指令下失敗等。
綜合網(wǎng)管告警系統(tǒng)的網(wǎng)絡(luò)方案不僅考慮當(dāng)下的實(shí)際需要,還要從未來(lái)考慮整體規(guī)劃。所以,告警系統(tǒng)的網(wǎng)絡(luò)架構(gòu)要保證做到開(kāi)放性和可擴(kuò)展性。系統(tǒng)網(wǎng)絡(luò)架構(gòu)如圖4所示。
圖4 系統(tǒng)網(wǎng)絡(luò)架構(gòu)
系統(tǒng)由集中告警、告警采集、告警發(fā)布平臺(tái)、數(shù)據(jù)庫(kù)以及業(yè)務(wù)處理與WEB服務(wù)器等部分組成。系統(tǒng)使用插件方式與各專業(yè)網(wǎng)管系統(tǒng)的告警數(shù)據(jù)相連接,如將數(shù)據(jù)適配器插件和數(shù)據(jù)庫(kù)接口連接[10]。在具體的實(shí)際應(yīng)用中,可以依據(jù)具體情況將多個(gè)平臺(tái)安放在一臺(tái)機(jī)器中,如將數(shù)據(jù)庫(kù)、業(yè)務(wù)處理以及WEB服務(wù)器放置在同一機(jī)器。
隨著經(jīng)濟(jì)的快速發(fā)展,電力系統(tǒng)的規(guī)模逐漸擴(kuò)大,以往單純依靠?jī)?nèi)網(wǎng)安全監(jiān)視平臺(tái)和增加維護(hù)人員的方式已經(jīng)無(wú)法解決現(xiàn)存問(wèn)題。通信網(wǎng)絡(luò)的變化帶來(lái)告警信息量的增加,使用最少的投入實(shí)現(xiàn)最大化的解決維護(hù)困難問(wèn)題是根本途徑。綜合網(wǎng)絡(luò)告警收集系統(tǒng)除了要智能化升級(jí)傳統(tǒng)的內(nèi)網(wǎng)安全監(jiān)視平臺(tái)外,還要利用維護(hù)人員制定的告警信息分類和維護(hù)規(guī)則,準(zhǔn)確分辨和優(yōu)先處理重要告警事件。不僅提高了工作效率,還提高了反應(yīng)速度和準(zhǔn)確性,保證了電力系統(tǒng)運(yùn)行的穩(wěn)定性。