国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Zabbix的電力信息服務(wù)器告警及巡檢一體化系統(tǒng)設(shè)計(jì)

2022-04-18 11:27譚理珂張曉光
水電站機(jī)電技術(shù) 2022年4期
關(guān)鍵詞:積壓觸發(fā)器運(yùn)維

譚理珂,張曉光

(廣東省能源集團(tuán)天生橋一級水電開發(fā)有限責(zé)任公司水力發(fā)電廠,貴州 興義 562400)

1 Zabbix基本概述

Zabbix是一個(gè)基于web界面的提供對各種分布式信息系統(tǒng)監(jiān)視以及網(wǎng)絡(luò)監(jiān)視功能的企業(yè)級開源解決方案[1]。可適用于各類Linux、Free BSD、Windows(2000/2003/XP/Vista)、WindowsNT4.0、AIX、Tru64/OSF1、Windows sever、Open BSD、OSX等系統(tǒng)。分為Zabbix server和Zabbix agent配合,服務(wù)器端輪巡使用Zabbix agent插件,可以選擇主動(dòng)接收Zabbix agent發(fā)送的監(jiān)視包,或被動(dòng)接收Zabbix agent發(fā)送的數(shù)據(jù)包。還可以配合SNMP協(xié)議收集交換機(jī)等設(shè)備監(jiān)視數(shù)據(jù)包[2]。

由于Zabbix系統(tǒng)具有系統(tǒng)開源免費(fèi)、安裝配置簡單、支持多種語言等優(yōu)點(diǎn),并且具有可收集監(jiān)視數(shù)據(jù)廣泛,包括CPU負(fù)荷、內(nèi)存使用情況、磁盤使用情況、網(wǎng)絡(luò)狀況等。可用于電力信息服務(wù)器的狀態(tài)監(jiān)視及告警推送,本系統(tǒng)就是基于Zabbix進(jìn)行設(shè)計(jì)。

2 電廠服務(wù)器巡檢需求分析

電廠服務(wù)器巡檢一般為實(shí)體服務(wù)器巡檢+網(wǎng)絡(luò)監(jiān)控巡檢相結(jié)合的巡檢方式,當(dāng)巡視服務(wù)器存在告警信號(hào)時(shí)通常需要通過終端登陸服務(wù)器后臺(tái)查看告警信息。網(wǎng)絡(luò)監(jiān)控巡檢需要逐個(gè)登陸服務(wù)器查看告警信息,費(fèi)時(shí)費(fèi)力還容易存在人工巡檢時(shí)遺漏現(xiàn)象。為達(dá)到快速獲取告警信息,以及降低人工成本,提出如下需求:

(1)告警信息及運(yùn)行信息自動(dòng)采集;

(2)告警信息及運(yùn)行信息匯總并圖形化展示;

(3)實(shí)體服務(wù)器巡檢時(shí)能通過移動(dòng)終端或web網(wǎng)頁及時(shí)查詢告警信息及運(yùn)行信息;

(4)存在告警時(shí)能推送至運(yùn)維人員。

基于以上需求,建立本系統(tǒng)以滿足廠站信息系統(tǒng)巡檢需求。

3 總體架構(gòu)

3.1 數(shù)據(jù)采集

虛擬化服務(wù)器通過直接安裝Zabbix agent將實(shí)時(shí)告警信息推送至Zabbix服務(wù)器,AC控制器及交換機(jī)、路由器等網(wǎng)絡(luò)設(shè)備則通過ICMP/IPMI/SNMP等報(bào)文形式監(jiān)測系統(tǒng)狀態(tài)及告警信息[3]。

3.2 數(shù)據(jù)存儲(chǔ)

將 存 儲(chǔ) 數(shù) 據(jù) 分 為actions、Trends、Hosts、History、Items、Events、Trigger等幾個(gè)數(shù)據(jù)表,設(shè)ID為主鍵,將其余所有外鍵通過主鍵ID關(guān)聯(lián)起來。其中actions中存儲(chǔ)了當(dāng)觸發(fā)器動(dòng)作時(shí)應(yīng)該采取的動(dòng)作;Hosts用于存儲(chǔ)監(jiān)控主機(jī)中的hosts記錄;Items用于存儲(chǔ)監(jiān)控主機(jī)中的Item設(shè)置[4]。

3.3 數(shù)據(jù)展示

運(yùn)維人員通過web訪問客戶端,可查詢的數(shù)據(jù)包括設(shè)備的歷史信息記錄、實(shí)時(shí)信息及狀態(tài)和服務(wù)器的信息及狀態(tài)等數(shù)據(jù)??梢赃x擇查詢主機(jī)的實(shí)時(shí)監(jiān)控項(xiàng)數(shù)據(jù),也可以選擇監(jiān)控項(xiàng)數(shù)據(jù)查看所有主機(jī)當(dāng)前監(jiān)控項(xiàng)的數(shù)據(jù)對比。對查詢的數(shù)據(jù)和監(jiān)控采集到的數(shù)據(jù)進(jìn)行分類整理,生成對應(yīng)的報(bào)表數(shù)據(jù)。

3.4 告警推送管理

Zabbix系統(tǒng)自帶多種告警推送功能,常見的有郵箱告警、Jira告警、短信告警等。如需配置以上告警通知,直接通過Zabbix中調(diào)用告警通知的接口程序。但由于郵箱告警經(jīng)常發(fā)生延遲告警的情況,并且考慮到運(yùn)維人員不能隨時(shí)查看郵件信息。Jira告警需要登錄Jira界面才能接收到信息,也不能滿足簡單方便運(yùn)維人員工作的要求。短信告警需要配置短信告警服務(wù)器購買短信費(fèi)用,也存在告警信息過多或短信誤屏蔽等弊端。所以最好采用能實(shí)時(shí)將告警推送到即時(shí)通信類軟件中,本系統(tǒng)選擇通過企業(yè)微信來推送重要設(shè)備告警或嚴(yán)重告警,避免告警信息推送過多造成告警覆蓋。由于電廠運(yùn)維人員工作性質(zhì),需要定期對設(shè)備進(jìn)行巡檢工作,定期巡檢時(shí)則采用web查詢告警。

3.4.1 登陸web查詢告警

運(yùn)維人員通過web登陸客戶端,在客戶端首頁可設(shè)置儀表板,顯示存在的告警信息以及主機(jī)Zabbix agent運(yùn)行狀態(tài)。可查看主機(jī)實(shí)時(shí)狀態(tài)及實(shí)時(shí)告警信息。

從“監(jiān)測-主機(jī)”中可查看所有設(shè)備在線情況、設(shè)備實(shí)時(shí)狀態(tài)、設(shè)備重要信息(如C盤容量、CPU閾值信息、內(nèi)存使用信息等)。通過圖形界面可查看設(shè)備重要信息的趨勢圖及歷史信息,趨勢圖能直觀反映設(shè)備一段時(shí)間內(nèi)的運(yùn)行健康情況,判斷服務(wù)器性能是否符合應(yīng)用系統(tǒng)需求,根據(jù)實(shí)際情況合理調(diào)配服務(wù)器性能,滿足應(yīng)用系統(tǒng)需求的同時(shí)做到精簡配置。

3.4.2 企業(yè)微信告警推送

系統(tǒng)通過設(shè)定某些監(jiān)控值達(dá)到設(shè)定閾值時(shí)進(jìn)行告警推送至企業(yè)微信,企業(yè)微信可查看主機(jī)名稱、時(shí)間、IP、告警項(xiàng)目及詳情等信息數(shù)據(jù)。可自定義推送內(nèi)容及告警項(xiàng)、閾值等信息[5]。

3.4.3 自定義告警信息

由于Zabbix系統(tǒng)告警及事件推送過多,不能將所有告警信息和事件都推送至企業(yè)微信內(nèi),所以必須在微信告警推送中自定義推送的內(nèi)容,選擇性的發(fā)送重要告警或者重要設(shè)備事件,而不是將所有告警信息和事件統(tǒng)一推送,一般告警信息由每天定時(shí)web登陸查看。

由于Zabbix系統(tǒng)不自帶企業(yè)微信告警推送模塊,本系統(tǒng)通過自定義Python腳本進(jìn)行告警推送。通過腳本將Zabbix采集的告警信息,由群聊機(jī)器人發(fā)送至企業(yè)微信群中。可以自定義發(fā)送告警的嚴(yán)重程度,確保維護(hù)人員能夠看到重要設(shè)備告警信息。當(dāng)主機(jī)出現(xiàn)告警后,則發(fā)送至企業(yè)微信群內(nèi),并用腳本生成發(fā)送日志,即可查看發(fā)送成功率。

在Zabbix后臺(tái)配置動(dòng)作,發(fā)生對應(yīng)事件源后觸發(fā)觸發(fā)器,在動(dòng)作選項(xiàng)欄內(nèi)點(diǎn)擊“創(chuàng)建動(dòng)作 ”填寫對應(yīng)的信息;在動(dòng)作頁面填寫對應(yīng)的信息,本文以服務(wù)器設(shè)備內(nèi)存使用率超過9成為例,設(shè)定需要同時(shí)符合以下條件才觸發(fā)觸發(fā)器。

A and B

A:主機(jī)群組=Windows servers;

B:觸發(fā)器=Windows servers模板內(nèi)的物理內(nèi)存使用率在連續(xù)的5 min等于或大于90%。

滿足條件后觸發(fā)觸發(fā)器,在操作中作出對應(yīng)的動(dòng)作,設(shè)定操作步驟多久執(zhí)行一次、操作標(biāo)題及消息內(nèi)容。操作類型中選擇發(fā)送消息。并對應(yīng)的配置恢復(fù)操作時(shí)發(fā)送復(fù)歸消息。消息格式需要采用Zabbix使用宏才能發(fā)送消息。

問題:{EVENT.NAME}

告警信息:{TRIGGER.NAME}

告警地址:{HOST.NAME}

監(jiān)控項(xiàng)目:{ITEM.NAME}

監(jiān)控取值:{EVENT.VALUE}

告警嚴(yán)重性:{EVENT.SEVERITY}

當(dāng)前狀態(tài):{EVENT.STATUS}

告警時(shí)間:{EVENT.DATE} {EVENT.TIME}

事件ID:{EVENT.ID}

告警信息:{TRIGGER. NAME}

告警地址:{HOST.NAME}

監(jiān)控項(xiàng)目:{ITEM.NAME}

監(jiān)控取值:{EVENT.RECOVERY.VALUE}

告警嚴(yán)重性:{EVENT.SEVERITY}

當(dāng)前狀態(tài):{EVENT.RECOVERY.STATUS}

告警時(shí)間:{EVENT.DATE} {EVENT.TIME}

恢復(fù)時(shí)間:{EVENT.RECOVERY.TIME}

持續(xù)時(shí)間:{EVENT.AGE}

事件ID:{EVENT.RECOVERY.ID}[6]

在Python腳本中按照企業(yè)微信推送格式編寫推送腳本,即可將告警信息推送至企業(yè)微信中。

4 基于Zabbix的電力信息服務(wù)器告警及巡檢一體系統(tǒng)設(shè)計(jì)

圖1為基于Zabbix的電力信息服務(wù)器告警及巡檢一體系統(tǒng)的架構(gòu)圖,在廠站虛擬化服務(wù)器系統(tǒng)中新建Zabbix服務(wù)器,采用B/S結(jié)構(gòu),巡檢人員通過瀏覽器查看服務(wù)器實(shí)時(shí)狀態(tài)、企業(yè)微信等第三方APP接收服務(wù)器實(shí)時(shí)告警。對實(shí)體服務(wù)器、交換機(jī)等設(shè)備進(jìn)行巡檢時(shí),直接掃描服務(wù)器設(shè)備標(biāo)識(shí)中二維碼,通過內(nèi)部網(wǎng)絡(luò)查看實(shí)時(shí)狀態(tài)及實(shí)時(shí)告警信息。

2.積壓物資責(zé)任劃分不明確。一直以來物資積壓的主體由物資供應(yīng)部門負(fù)責(zé),計(jì)劃提報(bào)部門、審核部門、設(shè)計(jì)部門等都不承擔(dān)積壓的責(zé)任,而物資積壓的源頭卻是來自于這些部門,因?yàn)榉e壓考核與計(jì)劃提報(bào)脫鉤使得計(jì)劃申報(bào)不準(zhǔn)確得不到約束,導(dǎo)致需求計(jì)劃提報(bào)隨意性較大。供應(yīng)部門為了防止及處理積壓采取過很多的手段和方法,如制定最低儲(chǔ)備定額、廠家回購、利庫代用、ABC庫存管理,有一定的效果,但無法從根本上減少物資的積壓。而且大部分方法都是事后處理,工作的重點(diǎn)放在了處理積壓上,年年處理年年增加,無法從根本上解決積壓的形成。

圖2 基于Zabbix的電力信息服務(wù)器告警及巡檢一體系統(tǒng)的架構(gòu)圖

將實(shí)體主機(jī)Zabbix地址生成二維碼,同設(shè)備標(biāo)簽張貼于實(shí)體主機(jī)上。當(dāng)告警產(chǎn)生或設(shè)備巡檢需要查看服務(wù)器信息時(shí),可使用移動(dòng)終端掃描二維碼,快速查詢實(shí)體主機(jī)服務(wù)器實(shí)時(shí)告警及實(shí)時(shí)信息。

運(yùn)維人員巡檢時(shí)采用實(shí)體服務(wù)器巡檢結(jié)合Zabbix二維碼查詢服務(wù)器狀態(tài)信息,通過企業(yè)微信告警信息推送實(shí)時(shí)接收服務(wù)器告警。將告警信息與巡檢系統(tǒng)集合為一體,提高運(yùn)維人員管理各個(gè)分散系統(tǒng)的工作效率,面對突發(fā)情況更能從容的面對和處理。

5 應(yīng)用效果

目前基于Zabbix的電力信息服務(wù)器告警及巡檢一體系統(tǒng)內(nèi)已接入主機(jī)數(shù)量91臺(tái),監(jiān)控項(xiàng)數(shù)量26 226項(xiàng),觸發(fā)器數(shù)量13 007項(xiàng),其中觸發(fā)器故障數(shù)為46項(xiàng),故障率為0.3%。嚴(yán)重告警推送18項(xiàng),因嚴(yán)重告警推送至運(yùn)維人員,得到及時(shí)處理告警項(xiàng),避免了事故進(jìn)一步發(fā)展,保障了電廠內(nèi)信息服務(wù)器的穩(wěn)定運(yùn)行,取得了較為理想的效果。

本文系統(tǒng)運(yùn)行穩(wěn)定,故障推送及時(shí),系統(tǒng)投運(yùn)使用前通過MyEclipse軟件平臺(tái)進(jìn)行采集時(shí)間及告警準(zhǔn)確率測試,測試結(jié)果見表1。

表1 采集時(shí)間及準(zhǔn)確率測試

分析表1中的數(shù)據(jù)可得,數(shù)據(jù)量在3 000 b內(nèi),采集時(shí)間均能實(shí)現(xiàn)1 s以內(nèi),平均采集時(shí)間僅為0.63 s,且平均準(zhǔn)確率為97.97%。系統(tǒng)采集時(shí)間、運(yùn)算性能及告警準(zhǔn)確率都能滿足現(xiàn)有電廠服務(wù)器需求。

6 結(jié)束語

本文利用Zabbix開源系統(tǒng),針對電廠信息系統(tǒng)管理系統(tǒng)進(jìn)行設(shè)計(jì),實(shí)現(xiàn)對電廠內(nèi)部服務(wù)器、交換機(jī)、網(wǎng)絡(luò)、應(yīng)用程序等分散系統(tǒng)的統(tǒng)一管理。設(shè)計(jì)了基于Zabbix的電力信息服務(wù)器告警及巡檢一體化系統(tǒng),對告警查詢、告警推送、設(shè)備巡檢、后臺(tái)維護(hù)等流程進(jìn)行優(yōu)化,使得運(yùn)維人員能迅速且準(zhǔn)確地發(fā)現(xiàn)故障、確定故障原因從而解決故障,提高了工作效率,進(jìn)一步提高了電廠系統(tǒng)運(yùn)行的可靠性。

猜你喜歡
積壓觸發(fā)器運(yùn)維
高速公路智能運(yùn)維平臺(tái)
配置觸發(fā)器有條件啟動(dòng)Windows服務(wù)
珠三角水產(chǎn)品存塘積壓真的大得驚人嗎?千萬別好心幫倒忙
運(yùn)維技術(shù)研發(fā)決策中ITSS運(yùn)維成熟度模型應(yīng)用初探
波音的煩惱
觸發(fā)器在酒店管理系統(tǒng)中的應(yīng)用
配電線路的運(yùn)維管理探討
基于一體化的變電標(biāo)準(zhǔn)運(yùn)維模式
幾種常見觸發(fā)器工作方式的討論
基于電路原理的觸發(fā)器波形分析