国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

應用系統(tǒng)運行維護平臺的應用

2013-03-25 06:39:08
東北電力技術 2013年6期
關鍵詞:運維分布式架構

壽 增

(遼寧省電力有限公司,遼寧 沈陽 110006)

隨著智能電網(wǎng)建設的推進及IT技術的廣泛應用,遼寧電網(wǎng)公司已經(jīng)建立了核心業(yè)務系統(tǒng),如ERP、用電信息采集及電網(wǎng)調度技術支持系統(tǒng)等,公司運營離不開這些IT系統(tǒng),任何1個故障造成的損失、影響都很大,甚至影響整個公司的業(yè)務。傳統(tǒng)的運行維護管理模式比較被動,只有當系統(tǒng)出問題時,才會引起注意和得到解決[1],這種管理模式已不能適應目前環(huán)境下的發(fā)展需求。

為了保證應用系統(tǒng)的可用性,不但要保證應用程序本身的正確性和可靠性,同時還要保證從網(wǎng)絡到應用程序端的可用性,為此,從運行維護的角度來看,必須從整體的角度規(guī)劃,對與應用系統(tǒng)相關的IT基礎設施、支撐平臺進行集中監(jiān)控,并與應用系統(tǒng)進行關聯(lián),一旦出現(xiàn)故障,可迅速定位并解決。同時定義相關的流程以保證某個應用的變更不會對其它應用產(chǎn)生影響,對出現(xiàn)的問題從根源上找原因,并進行解決,從而保證系統(tǒng)的高可用性[2]。

1 關鍵技術

1.1 實時監(jiān)測和原始數(shù)據(jù)存儲

對于大型企業(yè)海量業(yè)務運維監(jiān)測數(shù)據(jù)、原始定位和取證數(shù)據(jù),系統(tǒng)采用對等分布式海量數(shù)據(jù)存儲技術,來解決海量數(shù)據(jù)的存儲及查詢問題。

隨著數(shù)據(jù)業(yè)務幾何數(shù)級的提升,現(xiàn)有的軟件系統(tǒng)結構及單機多處理器的硬件結構不能滿足快速增長的數(shù)據(jù)流量及流向分析需求,本項目根據(jù)目前業(yè)務數(shù)據(jù)流量、流向及統(tǒng)計分析的需求,即要求海量數(shù)據(jù)存儲及高并發(fā)快速訪問,提出自有特色的對等分布式海量數(shù)據(jù)存儲技術,其特點是充分利用現(xiàn)有硬件資源,結合網(wǎng)絡技術、Raid5數(shù)據(jù)存儲技術將海量數(shù)據(jù)以冗余條帶的方式對等分布各分布式計算節(jié)點,同時使用快速主內(nèi)存分布式哈希技術編目各節(jié)點數(shù)據(jù)分區(qū)的數(shù)據(jù)位置,可實現(xiàn)大容量數(shù)據(jù)分區(qū)存儲、高并發(fā)數(shù)據(jù)訪問及數(shù)據(jù)尋址。

系統(tǒng)采用DHT技術保障了對等分布式并行數(shù)據(jù)庫處理中的快速數(shù)據(jù)及節(jié)點信息同步,采用HDFS(High Performance Distributed File System)作為DHT數(shù)據(jù)的備份機制,防止節(jié)點異常關機造成的信息數(shù)據(jù)不同步。

在對等分布式環(huán)境中,主節(jié)點與各節(jié)點間的數(shù)據(jù)節(jié)點信息存儲及信息同步依靠的高性能分布是利用哈希表技術實現(xiàn)的,具有快速及高可靠性數(shù)據(jù)及信息同步的特點,為了實現(xiàn)高性能并行快速的同步數(shù)據(jù)節(jié)點數(shù)據(jù)及信息,本項目采用改進的分布式哈希表并行尋址技術,采用并行Bloom及內(nèi)存動態(tài)分區(qū)技術實現(xiàn)節(jié)點數(shù)據(jù)分區(qū)及信息編碼快速尋址。

1.2 統(tǒng)一數(shù)據(jù)模型

系統(tǒng)的UDM體系奠定了統(tǒng)一的網(wǎng)絡和應用性能管理解決方案的基礎。UDM具有可整合性能數(shù)據(jù)結構、適用于任何網(wǎng)絡拓撲結構、可識別所有應用的特點。UDM把從各種不同的數(shù)據(jù)源 (如SNMP、MIBII、NetFlow、NetStream 和 sFlow、Net-Flow探針、業(yè)務路徑探針、性能探針等)采集到的數(shù)據(jù)進行整合、關聯(lián),并用統(tǒng)一平臺的軟件加以管理,從而能夠在前后一致的環(huán)境中采集、傳送性能信息。

另外,UDM技術可將這些集中整合的數(shù)據(jù)提供給諸如網(wǎng)絡模擬、網(wǎng)絡IDS和計費等應用系統(tǒng),從而完善這些應用系統(tǒng)的功能。UDM為各類用戶提供了符合需要的、實時的和歷史的網(wǎng)絡信息數(shù)據(jù),極大提高了企業(yè)組織和運作的效率。借助于UDM,企業(yè)無需購置新的工具或進行系統(tǒng)升級,就可輕松方便地增加新的網(wǎng)絡拓撲結構或采用新的網(wǎng)絡技術,從而減少企業(yè)網(wǎng)絡基礎設施的總成本。

2 系統(tǒng)的設計

2.1 系統(tǒng)架構

系統(tǒng)的解決方案主要由系統(tǒng)數(shù)據(jù)管理及分析服務器、性能探針、xFlow轉換器和BigStream設備組成,見圖1。

可見系統(tǒng)解決方案可收集網(wǎng)絡中的多種數(shù)據(jù)源,包括探針、網(wǎng)絡設備的 NetFlow、NetStream、sFlow數(shù)據(jù)、RMON信息、MIB信息、SNMP信息。多種數(shù)據(jù)匯總到系統(tǒng)數(shù)據(jù)管理及分析服務器,實現(xiàn)對網(wǎng)絡最全面、最有效的性能管理。

2.2 功能架構

業(yè)務性能監(jiān)控系統(tǒng)集成了網(wǎng)絡流量分析、深度流探測、業(yè)務撥測及路徑性能探測、專家系統(tǒng)管理、長期流量分析報告等功能,同時能通過標準的SNMP、RMON2,與其它的網(wǎng)絡管理系統(tǒng)相集成,共同構成整體網(wǎng)絡管理系統(tǒng)[3]。

圖1 系統(tǒng)架構

業(yè)務性能監(jiān)控系統(tǒng)包括數(shù)據(jù)源及管理軟件2個組成部分。系統(tǒng)的數(shù)據(jù)結構采用標準化的RMON格式的SNMPMIB2格式,具有很高的互通性,可以接受不同網(wǎng)絡設備,如交換機、路由器、防火墻、負載均衡器等的SNMPMIB2及內(nèi)置型RMONMIB網(wǎng)管數(shù)據(jù)信息,除此也可收集Cisco的NetFlow、華為的NetStream和Foundry的sFlow等流數(shù)據(jù)信息,同時也包括了專用的硬件探針設備,見圖2。

2.3 系統(tǒng)部署

系統(tǒng)在結構設計上允許集中式和分布式數(shù)據(jù)采集與計算,根據(jù)管理需求可選擇集中式或分布式部署。集中式部署允許數(shù)據(jù)的采集與計算在網(wǎng)絡的同一位置,通過單一平臺進行配置和管理。分布式部署允許數(shù)據(jù)的采集端分布在網(wǎng)絡的不同位置,最后通過統(tǒng)一的平臺進行配置和管理,方便用戶配置操作。

分布式數(shù)據(jù)獲取有如下優(yōu)點。

a. 分布式管理數(shù)據(jù)采集貼近管理對象,對管理效率與功能的提升有極大意義。

b. 分布式數(shù)據(jù)采集有效支持了多種不同的數(shù)據(jù)采集方式,將數(shù)據(jù)采集與數(shù)據(jù)處理有效分離。

c. 支持安全管理模式,考慮到數(shù)據(jù)安全,某些管理數(shù)據(jù)不允許遠程跨網(wǎng)段傳輸。

3 系統(tǒng)的實現(xiàn)

3.1 業(yè)務運維監(jiān)控

系統(tǒng)著眼于從IT整體架構到整體業(yè)務的綜合服務品質,引入服務水平協(xié)議 (SLA)機制和業(yè)務視圖,將各層次元素的管理貫穿和統(tǒng)一起來,被動性局部維護改為主動性宏觀管理,重視預警機制和智能分析,致力于提高企業(yè)整體運營品質,提高資源的利用率。

圖2 功能架構

系統(tǒng)對于業(yè)務管理,可概括為5個方面:業(yè)務架構、業(yè)務運行、業(yè)務使用、事件原因分析、基于業(yè)務統(tǒng)計與分析。通過業(yè)務架構和業(yè)務運行圖形化展現(xiàn),對業(yè)務實現(xiàn)了可視化管理,對必要的業(yè)務元素進行監(jiān)控,保障了業(yè)務的正常使用,通過服務水平管理衡量IT服務對業(yè)務部門支持的質量[4]。

3.2 業(yè)務運行質量監(jiān)控

系統(tǒng)的網(wǎng)絡流量分析功能以流設備 (支持并開啟Flow信息采集的路由器或交換機)、流接口(開啟Flow信息采集的接口)為分析對象,對網(wǎng)絡流量、流速、數(shù)據(jù)包數(shù)、會話數(shù)等指標進行匯總分析和趨勢分析,幫助運維人員了解網(wǎng)絡系統(tǒng)運行狀況和變化趨勢;通過會話信息查詢、會話明細查詢功能,幫助運維人員分析、定位問題;對網(wǎng)絡流量提供基于流量、協(xié)議、應用服務、數(shù)據(jù)包大小、主機、會話、QoS等多個維度的分析,幫助運維管理人員多角度了解網(wǎng)絡運行狀況,及時發(fā)現(xiàn)潛在問題。

3.3 業(yè)務運行性能分析

系統(tǒng)建立業(yè)務實時使用管理,監(jiān)測管理業(yè)務的使用狀況、用戶的分布情況,剝離不同業(yè)務的實時流量情況。脫離業(yè)務使用情況談業(yè)務保障是沒有意義的,對業(yè)務來說,最終使用對象是人,業(yè)務系統(tǒng)是否健康,業(yè)務量是否飽滿,如何看待各類系統(tǒng)運行參數(shù),這些都是和在線使用情況直接相關的,業(yè)務性能分析不能脫離業(yè)務負荷這個前提。

系統(tǒng)提供核心業(yè)務在線用戶分析,結合IP地址管理規(guī)劃,對業(yè)務在線情況、使用情況進行分析[5]。系統(tǒng)的業(yè)務在線用戶分析依托強大的網(wǎng)絡管理能力直接從網(wǎng)絡交換層汲取數(shù)據(jù)進行實時分析,將分析結果按IP地址管理規(guī)劃進行分類統(tǒng)計,系統(tǒng)能自動分析出不同用戶所屬的不同區(qū)域,管理人員能夠清楚了解該業(yè)務當前使用者從哪里登錄、這些用戶屬于哪些業(yè)務區(qū)域、這些用戶是否在工作、這些流量的變化趨勢是什么,直接可以得出某區(qū)域、某網(wǎng)段甚至某個人的實時業(yè)務訪問情況,根據(jù)這些能分析出業(yè)務系統(tǒng)的效能,為業(yè)務系統(tǒng)分析提供數(shù)據(jù)參考。

3.4 業(yè)務流量管理

業(yè)務流量管理可為數(shù)據(jù)中心提供網(wǎng)絡流量信息統(tǒng)計和分析功能,能夠讓客戶及時了解各種網(wǎng)絡應用占用的網(wǎng)絡帶寬,各種業(yè)務消耗的網(wǎng)絡資源和網(wǎng)絡應用中TopN流量的源主機,可幫助網(wǎng)絡管理員及時發(fā)現(xiàn)網(wǎng)絡瓶頸,防范網(wǎng)絡病毒的攻擊,并提供豐富的網(wǎng)絡流量分析報表,幫助客戶在網(wǎng)絡規(guī)劃、網(wǎng)絡監(jiān)控、網(wǎng)絡優(yōu)化、故障診斷等方面做出客觀準確的決策。

3.5 告警管理

告警管理是實現(xiàn)對被管對象和本系統(tǒng)所產(chǎn)生的告警進行集中管理的模塊,告警主要包括設備產(chǎn)生的原始告警、本系統(tǒng)產(chǎn)生的衍生告警兩大類。其中,設備產(chǎn)生的告警是不同廠家自行定義的,網(wǎng)管系統(tǒng)需要對其進行歸一化。本系統(tǒng)產(chǎn)生的衍生告警是指通過本系統(tǒng)的分析、判斷,由系統(tǒng)自身產(chǎn)生的告警,一般包括業(yè)務性能告警、配置告警、相關性告警等。

告警處理中,首先是告警的采集,即將告警信息收集到系統(tǒng),然后是對海量的告警進行處理以抽取出最需要關注的告警呈現(xiàn)給用戶,同時告訴用戶該告警影響哪些業(yè)務,目前有效告警的抽取采用相關性分析及根據(jù)告警分析來進行[6]。

4 結束語

應用系統(tǒng)運行維護平臺采用開放的SOA架構,并提出“智能融合、業(yè)務協(xié)同、架構開放”全新的管理理念,為用戶提供業(yè)務資源、業(yè)務用戶和業(yè)務應用的統(tǒng)一融合管理,實現(xiàn)業(yè)務應用的端到端管理。同時以全開放的、組件化的架構原型,向平臺及其承載業(yè)務提供分布式、分級式交互管理特性,提供最可靠的、可擴展的、高性能的業(yè)務管理平臺。平臺提供了從基礎架構、業(yè)務應用系統(tǒng)、業(yè)務性能、業(yè)務質量 (流量分析)、業(yè)務運營異常行為乃至業(yè)務服務運維流程管理等方面的豐富功能,實現(xiàn)物理和邏輯資源自動化、業(yè)務性能可視化、服務運維規(guī)范化[7]。

系統(tǒng)在遼寧電網(wǎng)實施后,運維管理水平得到了很大的提高,整個IT環(huán)境故障的解決時間大大縮短,并且由于管理水平的提高,設備的非計劃停機時間也大大縮短,可在故障發(fā)生前提前預警,通過手機短信、Email、語音等多種手段通知管理人員,為故障處理贏得時間,縮短網(wǎng)絡服務意外中斷時間,提高網(wǎng)絡運行率。

[1] 龍 泉.云南電網(wǎng)IT運行維護管理系統(tǒng)設計與實現(xiàn) [J].云南電力技術,2006,34(5):76-77.

[2] 邵 勇.用ITIL來指導IT系統(tǒng)的運行維護[J].網(wǎng)絡與信息,2007,21(10):78-79.

[3] 張文艷.電力企業(yè)如何做好信息安全工作[J].東北電力技術,2010,31(11):50-52.

[4] 顧 菲,麻鐵錚.淺析基于ITIL的中小IT企業(yè)IT系統(tǒng)運行維護[J].科技創(chuàng)新導報,2008,22(8):33.

[5] 陳世春,許 婷.省級集中營銷業(yè)務應用系統(tǒng)的運行維護管理[J].電力需求側管理,2011,13(5):50-52.

[6] 郭 巍.建立合理的非IT運營部門運維管理體系[J].中國高新技術企業(yè),2008,15(20):24-26.

[7] 張智軍.GIS設備的運行維護 [J].東北電力技術,2009,30(7):24-26.

猜你喜歡
運維分布式架構
基于FPGA的RNN硬件加速架構
功能架構在電子電氣架構開發(fā)中的應用和實踐
汽車工程(2021年12期)2021-03-08 02:34:30
運維技術研發(fā)決策中ITSS運維成熟度模型應用初探
風電運維困局
能源(2018年8期)2018-09-21 07:57:24
分布式光伏熱錢洶涌
能源(2017年10期)2017-12-20 05:54:07
雜亂無章的光伏運維 百億市場如何成長
能源(2017年11期)2017-12-13 08:12:25
分布式光伏:爆發(fā)還是徘徊
能源(2017年5期)2017-07-06 09:25:54
LSN DCI EVPN VxLAN組網(wǎng)架構研究及實現(xiàn)
電信科學(2017年6期)2017-07-01 15:45:17
基于ITIL的運維管理創(chuàng)新實踐淺析
基于DDS的分布式三維協(xié)同仿真研究
雷達與對抗(2015年3期)2015-12-09 02:38:50
正蓝旗| 株洲县| 芮城县| 桂阳县| 扶余县| 斗六市| 定襄县| 滦南县| 永州市| 刚察县| 长岭县| 祁东县| 德钦县| 连云港市| 塔河县| 永兴县| 东源县| 贵南县| 黄平县| 镇康县| 临高县| 东山县| 长乐市| 洪洞县| 乌拉特后旗| 合川市| 德化县| 英超| 广安市| 清丰县| 灵寿县| 会昌县| 丹凤县| 东台市| 邵东县| 荃湾区| 甘南县| 乌兰浩特市| 扬中市| 中阳县| 武强县|