戴晨昱
摘? 要:近些年來,可以說監(jiān)控技術(shù)的發(fā)展在突破種種障礙和困難后,才可以獲取當(dāng)前的成果,也就是當(dāng)前受到廣泛歡迎的智能監(jiān)控技術(shù)。尤其是在電信企業(yè)運(yùn)維支撐系統(tǒng)的應(yīng)用,更是充分展現(xiàn)出了智能監(jiān)控技術(shù)的優(yōu)點(diǎn),并有效的幫助其解決了各式各樣的棘手問題。由此,文章將就智能監(jiān)控技術(shù)在電信企業(yè)運(yùn)維支撐系統(tǒng)中的應(yīng)用展開分析和探討,旨在為相關(guān)人員提供有意義的參考。
關(guān)鍵詞:智能監(jiān)控;IT運(yùn)維;解決方案
中圖分類號:TP277? ? ? ? ?文獻(xiàn)標(biāo)志碼:A 文章編號:2095-2945(2019)33-0155-02
Abstract: In recent years, it can be said that the development of monitoring technology can only obtain the current results after breaking through a variety of obstacles and difficulties, that is, the current widely welcomed intelligent monitoring technology. Especially in the Telecom enterprise operation and maintenance support system application, but also fully show the advantages of intelligent monitoring technology, and effectively help it solve a variety of thorny problems. Therefore, this paper will analyze and discuss the application of intelligent monitoring technology in the operation and maintenance support system of Telecom enterprises, in order to provide meaningful reference for the relevant personnel.?Keywords: intelligent monitoring; IT operation and maintenance; solution
1 智能監(jiān)控的工作原理
所謂的智能監(jiān)控,即將平常手工方法執(zhí)行的運(yùn)行維護(hù)工作,逐漸轉(zhuǎn)變?yōu)殡娮踊椒ê陀?jì)算機(jī)技術(shù)相聯(lián)合的方法去獲取目標(biāo)。一般來講,我們主要將智能監(jiān)控系統(tǒng)分為三個(gè)層次,即監(jiān)控代理層、數(shù)據(jù)處理層及展現(xiàn)層。究其關(guān)系來看,各方之間主要是通過監(jiān)控代理層,然后借助JMX采集插件、JDBC采集插件等,最終達(dá)到獲取各業(yè)務(wù)平臺(tái)資源指標(biāo)信息的目的。完成上述步驟后,則需要將所獲得的數(shù)據(jù)上傳到數(shù)據(jù)處理層,通過處理數(shù)據(jù),然后形成有用的告警信息等,并經(jīng)由展現(xiàn)層實(shí)施配置。
2 智能監(jiān)控方式采取的先進(jìn)技術(shù)
(1)Agent采集技術(shù)。Agent中的采集插件擁有著數(shù)據(jù)采集的作用,而且智能監(jiān)控系統(tǒng)的數(shù)據(jù)在收集數(shù)據(jù)的過程中,就是通過Agent來達(dá)到目的的。不包括Agent采集插件在內(nèi),監(jiān)控平臺(tái)還擁有各種各樣的插件,如JMX采集插件、SNMP采集插件等,這些插件在采集命令的引導(dǎo)下一同完成各自的工作使命。(2)事件壓制技術(shù)。事件管理可以容納Syslog服務(wù)器、SNMPTrap服務(wù)器,并根據(jù)一致的要求格式化事件信息,經(jīng)由事件壓制規(guī)則壓制各種渠道的類似事件。比如Syslog服務(wù)器、SNMPTrap服務(wù)器報(bào)告了同樣的事件,那么則可以壓制成為同一事件。(3)事件自動(dòng)關(guān)聯(lián)技術(shù)。其實(shí),事件和事件間難免會(huì)存在諸多的聯(lián)系,所以在具體操作過程中,就非常有必要采取流程分析圖,以此來研究已發(fā)生的事件,最終更好的辨別故障存在的情況。(4)資源可用性評估技術(shù)?;谌矫鎭砜?,資源可用性狀態(tài)又可分為5個(gè)級別,即正常、警告、主要故障、次要故障以及重大故障。采取資源可用性評估技術(shù),能夠以最快的速度計(jì)算出現(xiàn)階段可用性狀態(tài)所處的級別,而這樣則對于及時(shí)實(shí)施補(bǔ)救方法有著重要的作用。
3 系統(tǒng)組成結(jié)構(gòu)及部署結(jié)構(gòu)
(1)系統(tǒng)組成結(jié)構(gòu)。事實(shí)上,智能監(jiān)控系統(tǒng)主要組成部分包括三個(gè)層次,第一主要為Agent。Agent在采集監(jiān)控?cái)?shù)據(jù)的過程中,通過采取不同的接口等,從而達(dá)到處理監(jiān)控系統(tǒng)的目的。第二主要為Center Server。其主要是將經(jīng)過Agent處理完成的數(shù)據(jù)傳輸給Center Server,并借助統(tǒng)一數(shù)據(jù)模型從而有效的劃分、存儲(chǔ)數(shù)據(jù),另外,所能看到的界面可以采取IE等瀏覽器,進(jìn)而達(dá)到查看,以及配置針對性指標(biāo)的目的。所有數(shù)據(jù)處理時(shí)都離不開系統(tǒng)的內(nèi)部通信引擎,只有這樣才可以達(dá)到信息互換的目的。(2)物理部署結(jié)構(gòu)。物理部署結(jié)構(gòu)的底層為所要監(jiān)控的對象,各個(gè)監(jiān)控對象部署命令服務(wù)器,上層代理為Agent,而且其能夠部署在單獨(dú)的一臺(tái)甚至數(shù)臺(tái)主機(jī)上,最后實(shí)際需要部署幾臺(tái)主機(jī),則必須由監(jiān)控對象的數(shù)量來決定,代理上層為服務(wù)中心,服務(wù)中心涵蓋服務(wù)器和數(shù)據(jù)庫服務(wù)器,服務(wù)器能夠做雙機(jī)。如需出報(bào)表,則還非常有必要提供報(bào)表服務(wù)器,另外,報(bào)警服務(wù)中心可利用報(bào)警服務(wù)器,從而實(shí)現(xiàn)語音報(bào)警的目的。頂層需配置相應(yīng)數(shù)量的終端,以便維護(hù)工作者巡查系統(tǒng)的狀態(tài)。
4 方案的特點(diǎn)與優(yōu)勢
通過上述分析發(fā)現(xiàn),將智能監(jiān)控技術(shù)應(yīng)用在電信企業(yè)運(yùn)維支撐系統(tǒng)中有著顯著的優(yōu)點(diǎn),主要可從如下方面著手研究:
4.1 先進(jìn)的設(shè)計(jì)理念,完善的知識(shí)儲(chǔ)備
第一,先進(jìn)的設(shè)計(jì)理念。此研究主要以引進(jìn)先進(jìn)的設(shè)計(jì)理念而實(shí)施設(shè)計(jì)的,主要是按照ITIL理論等IT服務(wù)管理內(nèi)容而展開的,與當(dāng)前IT服務(wù)管理要求相適應(yīng)。第二,完善的知識(shí)儲(chǔ)備。此研究在進(jìn)一步認(rèn)識(shí)和監(jiān)控IT系統(tǒng)時(shí),主要是通過采取IT資源結(jié)構(gòu)樹,從而將IT系統(tǒng)的物理組成結(jié)構(gòu)還有邏輯關(guān)系,統(tǒng)統(tǒng)規(guī)劃到系統(tǒng)當(dāng)中來,并且可以非常清楚的掌握各項(xiàng)情況。
4.2 全方位的監(jiān)控手段和管理手段
第一,全方位的監(jiān)控手段。IT資源結(jié)構(gòu)樹清楚的勾劃出了IT資源的各個(gè)部分,IT資源的運(yùn)行環(huán)境受到IT資源的子資源運(yùn)行環(huán)境的影響,全方位的監(jiān)控方法,是從監(jiān)控IT資源的子資源的運(yùn)行環(huán)境來就IT資源自身的運(yùn)行環(huán)境來實(shí)施監(jiān)控的。此種監(jiān)控方法對于及時(shí)發(fā)現(xiàn)IT資源故障所在位置是非常有幫助的。第二,全方位的管理手段。以往的系統(tǒng)管理思想主要是利用底層IT構(gòu)架來達(dá)到監(jiān)管的目的,最終提高業(yè)務(wù)的可用性。此種方法也存在著一些不足之處,如并未基于業(yè)務(wù)工作者的層面,提供業(yè)務(wù)可用性的視圖。
4.3 故障發(fā)現(xiàn)的主動(dòng)性,告警的及時(shí)準(zhǔn)確性
第一,故障發(fā)現(xiàn)的主動(dòng)性。故障發(fā)現(xiàn)的主動(dòng)系統(tǒng)經(jīng)由Agent技術(shù),7×24h對所管理的對象資源實(shí)施智能監(jiān)視,當(dāng)資源所具有的性質(zhì)改變時(shí),那么就需要以最快的速度通過事件檢測引擎監(jiān)測事件發(fā)生。第二,告警的及時(shí)準(zhǔn)確性。所發(fā)生的事件一旦經(jīng)系統(tǒng)成功檢測后,那么再采取針對性的壓制和根源研究處理,系統(tǒng)就能夠以多種形式迅速的告知有關(guān)運(yùn)維管理者,如發(fā)短信等。此種通知的方式在某種程度上,能夠通過告警規(guī)則的基本含義,從而達(dá)到提升告警、延遲告警的目的。
4.4 一鍵式配置特色,可配置性
第一,一鍵式配置特色。為了避免監(jiān)控平臺(tái)對服務(wù)器產(chǎn)生各種各樣的影響,那么使用者就可調(diào)整監(jiān)控服務(wù)器上不同資源的監(jiān)控頻度,而且整個(gè)過程也無需過于復(fù)雜的步驟。第二,可配置性。(1)展示方法的可配置按照監(jiān)控對象的種類,系統(tǒng)權(quán)限者可配置數(shù)據(jù)的顯現(xiàn)方法,系統(tǒng)提供各種各樣的顯示方法,如曲線圖、餅圖等,可配置數(shù)據(jù)是否顯現(xiàn),還有明確所要顯現(xiàn)的內(nèi)容。如管理者可設(shè)置在主界面上呈現(xiàn)出數(shù)個(gè)文件系統(tǒng)中設(shè)備的情況,可設(shè)置在CPU的獨(dú)立顯現(xiàn)界面中,最后采取餅圖等方法顯現(xiàn)出CPU的具體應(yīng)用情況等。(2)事件類別的可配置系統(tǒng)權(quán)限者按照監(jiān)控的所需適當(dāng)增刪事件類別。(3)事件產(chǎn)生規(guī)則的可配置系統(tǒng)管理者可按照具體情況和積累的新的,從而對事件產(chǎn)生規(guī)則的門閥值進(jìn)行設(shè)置。(4)告警的可配置系統(tǒng)權(quán)限者,可以按照事件的重要程度,然后對所需告警的事件設(shè)置告警規(guī)則,一旦符合告警條件那么就會(huì)出現(xiàn)告警。基本來講,告警規(guī)則更多是以暫停、告警轉(zhuǎn)發(fā)等為主。(5)系統(tǒng)使用者還有權(quán)限的可配置基于角色的權(quán)限設(shè)置,在功能模塊的權(quán)限控制方面實(shí)施了基于角色的權(quán)限控制;基于應(yīng)用的權(quán)限設(shè)置,在監(jiān)控對象上實(shí)施了基于應(yīng)用的權(quán)限設(shè)置。
4.5 開放性,可擴(kuò)展性
第一,開放性。何為開放性,即思想能夠跟上時(shí)代發(fā)展的步伐,而智能監(jiān)控技術(shù)就是一個(gè)很好的例子,其通過采取系統(tǒng)分層設(shè)計(jì)思想,從而有效的保證各系統(tǒng)間全部提供有開放的API接口,而這樣在能夠確保標(biāo)準(zhǔn)協(xié)議和通信協(xié)議,全部會(huì)有Syslog服務(wù)器、SNMPTrap服務(wù)器組件來實(shí)施匹配,開放型顯著。另外,現(xiàn)階段市場中比較受歡迎的IT服務(wù)管理軟件,同樣是通過智能監(jiān)控技術(shù)來獲取事件接口,經(jīng)過應(yīng)用,發(fā)現(xiàn)具有顯著的應(yīng)用價(jià)值。第二,可擴(kuò)展性??蓴U(kuò)展性具體體現(xiàn)在如下兩個(gè)方面。(1)數(shù)據(jù)存儲(chǔ)方面的可擴(kuò)展性。其主要是指在對數(shù)據(jù)庫實(shí)施設(shè)計(jì)的過程中,實(shí)施橫表變縱表的方法,而這樣做的目的,主要是在于當(dāng)監(jiān)控對象及指標(biāo)出現(xiàn)增多的情況時(shí),數(shù)據(jù)庫結(jié)構(gòu)也無修改的必要。(2)監(jiān)控對象的可擴(kuò)展性。其主要是指一旦監(jiān)控系統(tǒng)必須要添加監(jiān)控對象時(shí),也無在系統(tǒng)本身做任何修改,可以一步到位為新添加的擴(kuò)展對象配置數(shù)據(jù)。
4.6 被管理對象資源消耗可控制性,可維護(hù)性
第一,可控制性。起初,在系統(tǒng)設(shè)計(jì)過程中,就需要全方位的考慮對管理對象所產(chǎn)生的資源消耗等。為了避免管理區(qū)域內(nèi)的網(wǎng)絡(luò)傳輸資源被過多地占用,系統(tǒng)就實(shí)施了監(jiān)控代理技術(shù),然后將監(jiān)控代理安裝在所需要被管理的資源系統(tǒng)上,而這樣一來,就可以由監(jiān)控代理負(fù)責(zé)監(jiān)督管理被監(jiān)管者的性質(zhì),而且從本質(zhì)上來講,其本身就擁有相應(yīng)的智能性和功能性,能夠屏蔽掉諸多無用的數(shù)據(jù),最終規(guī)避網(wǎng)絡(luò)傳輸資源被大量占用的情況發(fā)生。第二,可維護(hù)性。此方案采取分層設(shè)計(jì)思想,即將一系列復(fù)雜的問題優(yōu)化為簡單的問題,然后通過層與層間相互影響、相互作用的關(guān)系,最終提升系統(tǒng)的維護(hù)能力。
5 智能監(jiān)控技術(shù)應(yīng)用于電信企業(yè)運(yùn)維支撐系統(tǒng)的建議
眾所周知,作為一項(xiàng)全新的技術(shù),智能監(jiān)控在具體使用過程中,更是充分的展現(xiàn)出了自身所具有的優(yōu)點(diǎn),而這對于電信企業(yè)運(yùn)維支撐系統(tǒng)而言,能夠較好的提升運(yùn)維系統(tǒng)的安全能力和穩(wěn)定能力。但從另外一方面來講,因?yàn)閷Υ隧?xiàng)新技術(shù)在認(rèn)知上不夠全面,所以經(jīng)常會(huì)發(fā)生各種各樣的問題,由此為了更好的克服不同的問題,就需要我們在采用智能監(jiān)控技術(shù)時(shí),一定要盡可能的發(fā)揮其所具有的優(yōu)勢,并主動(dòng)解決當(dāng)前已經(jīng)存在的問題,通過豐富自身的經(jīng)驗(yàn),增加科學(xué)研究的力度,然后更好的健全智能監(jiān)控技術(shù),而這樣才可以確保智能監(jiān)控技術(shù)以更快的速度投入到市場使用當(dāng)中來,同時(shí)還可通過實(shí)際行動(dòng)積極宣傳“技術(shù)最優(yōu)”的理念,以便創(chuàng)造一個(gè)昂揚(yáng)向上的創(chuàng)新文化環(huán)境,爭取為我國各方面的發(fā)展提供強(qiáng)大的技術(shù)支持。
6 結(jié)束語
由于傳統(tǒng)監(jiān)控技術(shù)已經(jīng)無法滿足現(xiàn)如今人們對智能數(shù)字化等方面的需求,所以智能監(jiān)控技術(shù)就應(yīng)運(yùn)而生,并成為未來發(fā)展的重頭戲,被這個(gè)時(shí)代重新定義。另外,我們在實(shí)際應(yīng)用此技術(shù)的過程中,因?yàn)槭艿讲煌矫嬖虻母蓴_,所以仍舊存在著諸多的問題,非常有必要引起相關(guān)人員的重視,并致力于該項(xiàng)技術(shù)的研討,爭取培養(yǎng)出更多綜合素養(yǎng)高的技術(shù)人才,以此確保智能監(jiān)控技術(shù)可以得到更快的發(fā)展和成長。
參考文獻(xiàn):
[1]蔣志文.大數(shù)據(jù)分析技術(shù)在數(shù)據(jù)中心運(yùn)維中的應(yīng)用[J].信息與電腦(理論版),2018,409(15):160-161.
[2]索宸耀,陳博,張斌.網(wǎng)絡(luò)綜合監(jiān)控及智能運(yùn)維平臺(tái)的構(gòu)建與研究[J].智能計(jì)算機(jī)與應(yīng)用,2019,9(01):63-67.
[3]王東妍,沈鹍,王瑞.智能運(yùn)維在高鐵工務(wù)作業(yè)安全監(jiān)控管理的應(yīng)用[J].鐵路計(jì)算機(jī)應(yīng)用,2019,28(04):47-50.