国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

IT健康度模型的設(shè)計(jì)與實(shí)踐

2015-04-02 00:18梁奐等
移動(dòng)通信 2014年24期
關(guān)鍵詞:利用率組件監(jiān)控

梁奐等

1 引言

隨著信息化日益普及和互聯(lián)網(wǎng)時(shí)代的到來(lái),企業(yè)對(duì)信息系統(tǒng)及網(wǎng)絡(luò)系統(tǒng)的依賴程度日益增加,企業(yè)IT應(yīng)用的系統(tǒng)架構(gòu)和環(huán)境日趨復(fù)雜,運(yùn)營(yíng)商對(duì)IT應(yīng)用系統(tǒng)運(yùn)行的穩(wěn)定性和可靠性要求越來(lái)越高。為保證運(yùn)營(yíng)商網(wǎng)絡(luò)和業(yè)務(wù)系統(tǒng)安全穩(wěn)定運(yùn)行,運(yùn)營(yíng)商迫切需要建立一個(gè)對(duì)網(wǎng)絡(luò)環(huán)境、業(yè)務(wù)系統(tǒng)實(shí)行集中監(jiān)控、維護(hù)和管理的系統(tǒng),即IT監(jiān)控系統(tǒng)。

應(yīng)用系統(tǒng)作為IT監(jiān)控的一個(gè)重要對(duì)象,其運(yùn)行健康依賴于承載傳輸網(wǎng)絡(luò)、主機(jī)設(shè)備、操作系統(tǒng)及其他必要的構(gòu)成組件如數(shù)據(jù)庫(kù)、中間件等,這些組件的運(yùn)行狀態(tài)會(huì)直接或間接地影響IT系統(tǒng)的運(yùn)行狀態(tài),甚至導(dǎo)致業(yè)務(wù)運(yùn)作的失敗。那么,能否像人體“健康”那樣,為IT系統(tǒng)做定期的健康情況檢查呢?

2 IT系統(tǒng)健康度設(shè)計(jì)思路

“健康”一詞最早源于醫(yī)學(xué)概念。依據(jù)世界衛(wèi)生組織(WHO)關(guān)于健康的定義,“健康”乃是一種在身體上、精神上的完滿狀態(tài)以及良好的適應(yīng)力,而不僅僅是沒(méi)有疾病和衰弱的狀態(tài),這就是人們所指的身心健康。推廣到IT系統(tǒng)上,IT系統(tǒng)健康是指IT系統(tǒng)的各組件(業(yè)務(wù)服務(wù)、應(yīng)用軟件及支撐平臺(tái)資源等)運(yùn)行時(shí),系統(tǒng)可用性、性能負(fù)荷、資源利用的狀態(tài)良好,不存在故障或隱患。

華佗說(shuō):“上醫(yī)者治未病,中醫(yī)者治欲病,下醫(yī)者治已病?!敝挝床?,其實(shí)就是在未得病時(shí)防止得病。體檢可以幫助醫(yī)生了解身體狀況,判斷可能要得什么病,并有針對(duì)性地提出預(yù)防措施,從而達(dá)到治未病的效果。人為了保持健康,定期需要進(jìn)行全面體檢,根據(jù)體檢報(bào)告采取相應(yīng)治療措施,保證身體健康發(fā)展。IT系統(tǒng)也一樣,需要定期進(jìn)行健康度評(píng)估,可以達(dá)到治未病的境界。通過(guò)全面的系統(tǒng)健康檢查可以變被動(dòng)的響應(yīng)式服務(wù)為主動(dòng)維護(hù),通過(guò)定期對(duì)系統(tǒng)進(jìn)行體檢,能夠全面地掌握整個(gè)IT系統(tǒng)運(yùn)行狀況,消除故障隱患、提高系統(tǒng)的可用性,改變“頭痛醫(yī)頭,腳痛醫(yī)腳”的現(xiàn)象。

2.1 IT系統(tǒng)健康度設(shè)計(jì)思路

IT系統(tǒng)健康度有兩層含義:第一層是“健康”的含義,是指系統(tǒng)業(yè)務(wù)功能滿足用戶需求,用戶滿意度較高,系統(tǒng)各組件性能良好和持續(xù)穩(wěn)定;第二層是“度”的含義,是指測(cè)量、判別系統(tǒng)運(yùn)行是否健康而必須要具備的評(píng)估標(biāo)準(zhǔn)和可量化的工具。

IT系統(tǒng)健康度的設(shè)計(jì)首先應(yīng)該分析IT系統(tǒng)構(gòu)成模型。從監(jiān)控角度來(lái)看,IT系統(tǒng)包括支撐平臺(tái)層(網(wǎng)絡(luò)設(shè)備、計(jì)算機(jī)硬件及操作系統(tǒng)、存儲(chǔ)、數(shù)據(jù)庫(kù)及中間件等基礎(chǔ)硬件和軟件)、應(yīng)用軟件層(應(yīng)用進(jìn)程、系統(tǒng)接口、參數(shù)配置文件等應(yīng)用軟件的組件)及業(yè)務(wù)服務(wù)層(業(yè)務(wù)服務(wù)、業(yè)務(wù)數(shù)據(jù)環(huán)節(jié)及業(yè)務(wù)流程等),如圖1所示。因此,IT系統(tǒng)的健康應(yīng)包含支撐平臺(tái)、應(yīng)用軟件和業(yè)務(wù)服務(wù)這3個(gè)層面的健康組成,而且三者間有依賴關(guān)系,如支撐平臺(tái)的故障會(huì)導(dǎo)致應(yīng)用軟件和業(yè)務(wù)服務(wù)的運(yùn)行故障,應(yīng)用軟件的故障也會(huì)導(dǎo)致業(yè)務(wù)服務(wù)的故障。

IT系統(tǒng)的健康度需要專門(mén)的監(jiān)測(cè)指標(biāo)來(lái)評(píng)估。監(jiān)控工具通過(guò)對(duì)IT支撐平臺(tái)、應(yīng)用軟件、業(yè)務(wù)服務(wù)的運(yùn)行狀態(tài)和關(guān)鍵運(yùn)行指標(biāo)的監(jiān)控,實(shí)時(shí)掌握IT支撐平臺(tái)、應(yīng)用軟件的運(yùn)行性能狀況,通過(guò)對(duì)業(yè)務(wù)服務(wù)的關(guān)鍵指標(biāo)監(jiān)控,及時(shí)掌握業(yè)務(wù)運(yùn)行狀態(tài)和質(zhì)量,主動(dòng)發(fā)現(xiàn)異常情況及性能瓶頸,從而能夠采取針對(duì)性的處理及優(yōu)化措施,提高IT系統(tǒng)運(yùn)行質(zhì)量以及業(yè)務(wù)的可靠性和可用性。

2.2 IT系統(tǒng)健康度通用模型設(shè)計(jì)

根據(jù)IT系統(tǒng)分層構(gòu)成模型,采用自下而上分析方法,設(shè)計(jì)了IT系統(tǒng)健康度模型。該模型包括IT支撐平臺(tái)健康度、應(yīng)用軟件健康度和業(yè)務(wù)服務(wù)健康度3個(gè)部分,如圖2所示。

IT系統(tǒng)是一個(gè)復(fù)雜的系統(tǒng),要對(duì)全部組件進(jìn)行監(jiān)測(cè)并不現(xiàn)實(shí),因此建議有針對(duì)性地選取3個(gè)層面的關(guān)鍵組件進(jìn)行監(jiān)測(cè)。例如:對(duì)于IT支撐平臺(tái)方面,可選取主機(jī)設(shè)備、數(shù)據(jù)庫(kù)系統(tǒng)和中間件系統(tǒng)等組件進(jìn)行監(jiān)測(cè);對(duì)于應(yīng)用軟件方面,可選取應(yīng)用進(jìn)程、系統(tǒng)接口和配置文件等進(jìn)行監(jiān)測(cè);對(duì)于業(yè)務(wù)服務(wù)方面,可根據(jù)系統(tǒng)特點(diǎn)選取相應(yīng)的核心業(yè)務(wù)進(jìn)行監(jiān)測(cè)。

健康度模型需要預(yù)先制定監(jiān)測(cè)指標(biāo)及評(píng)估標(biāo)準(zhǔn)。對(duì)于IT系統(tǒng)中各組件,可選取1個(gè)到多個(gè)監(jiān)測(cè)點(diǎn),如對(duì)于主機(jī)設(shè)備,可選取CPU利用率、內(nèi)存利用率、主機(jī)網(wǎng)卡通斷狀態(tài)、主機(jī)狀態(tài)等指標(biāo)監(jiān)測(cè)。對(duì)于每個(gè)監(jiān)測(cè)指標(biāo),必須預(yù)先根據(jù)經(jīng)驗(yàn)設(shè)置好健康評(píng)估的區(qū)間值,這是作為后續(xù)健康度計(jì)算的基礎(chǔ)。

IT系統(tǒng)健康度由系統(tǒng)各組件的健康指標(biāo)匯聚計(jì)算而成。例如,對(duì)于主機(jī)設(shè)備這個(gè)組件,從CPU利用率、內(nèi)存利用率、主機(jī)網(wǎng)卡通斷狀態(tài)、主機(jī)狀態(tài)這4個(gè)方面來(lái)監(jiān)測(cè),每個(gè)指標(biāo)都根據(jù)重要程度設(shè)置權(quán)重。主機(jī)設(shè)備健康度是通過(guò)這4個(gè)方面指標(biāo)得分通過(guò)加權(quán)而得到。進(jìn)一步往上匯聚,通過(guò)主機(jī)設(shè)備、數(shù)據(jù)庫(kù)系統(tǒng)和中間件系統(tǒng)的健康度,加權(quán)計(jì)算而得到承載系統(tǒng)的硬件健康度。同理,IT系統(tǒng)的健康度也可以通過(guò)硬件、關(guān)鍵應(yīng)用和業(yè)務(wù)運(yùn)營(yíng)這3個(gè)方面的健康值加權(quán)計(jì)算而得到,健康值越高(一般最高為100)表示系統(tǒng)越健康,當(dāng)健康值為0時(shí),表示系統(tǒng)已崩潰或不可用狀態(tài),其他值表示系統(tǒng)存在故障或會(huì)導(dǎo)致業(yè)務(wù)不可用的隱患。

3 健康度模型實(shí)踐及應(yīng)用效果

3.1 某電信公司IT系統(tǒng)健康度模型

某電信公司根據(jù)IT系統(tǒng)健康度通用模型,結(jié)合電信企業(yè)IT系統(tǒng)的特點(diǎn),定義了自身的IT系統(tǒng)健康度模型。該模型包括IT支撐平臺(tái)、應(yīng)用軟件和業(yè)務(wù)服務(wù)3個(gè)部分,合共包括17個(gè)核心監(jiān)測(cè)指標(biāo),具體如表1所示。本健康度模型監(jiān)測(cè)指標(biāo)可分為以下2類:

(1)量化的數(shù)值指標(biāo),如CPU利用率和內(nèi)存利用率等,這些指標(biāo)需要分別定義相應(yīng)的評(píng)估標(biāo)準(zhǔn)。例如,CPU利用率評(píng)估標(biāo)準(zhǔn)一般可設(shè)為:CPU利用率≥ 95%為不健康狀態(tài),95%>CPU利用率≥85%為亞健康狀態(tài),而CPU利用率<85%屬于健康狀態(tài)等。當(dāng)然,這個(gè)評(píng)估標(biāo)準(zhǔn)可以根據(jù)不同系統(tǒng)的特點(diǎn)來(lái)靈活設(shè)定。

(2)一些開(kāi)關(guān)量指標(biāo),也叫關(guān)鍵健康因子。這些指標(biāo)只有可用和不可用2種狀態(tài),權(quán)重分別設(shè)為1和0。當(dāng)指標(biāo)為不可用狀態(tài)時(shí),表示上一層組件也是不可用狀態(tài),即關(guān)鍵指標(biāo)采用一票否決算法。例如,主機(jī)狀態(tài)指標(biāo)只有指標(biāo)正常(用“1”表示)時(shí),主機(jī)是可用狀態(tài);否則,主機(jī)就是不可用狀態(tài)。

系統(tǒng)各層組件的健康程度可以通過(guò)下級(jí)各監(jiān)測(cè)指標(biāo)匯聚計(jì)算得到,如通過(guò)硬件的各類指標(biāo)狀態(tài)、數(shù)據(jù)庫(kù)的各類指標(biāo)狀態(tài)、中間件的各類指標(biāo)狀態(tài),從而得到IT支撐平臺(tái)健康值;通過(guò)支撐平臺(tái)、關(guān)鍵應(yīng)用健康值、關(guān)鍵業(yè)務(wù)服務(wù)的健康值,最終加權(quán)計(jì)算得出IT系統(tǒng)整體運(yùn)行情況的健康值。

3.2 某電信公司IT系統(tǒng)健康度應(yīng)用效果

某電信公司通過(guò)在IT監(jiān)控系統(tǒng)中采用健康度分析模型,實(shí)現(xiàn)了全國(guó)各省的CRM、服務(wù)開(kāi)通、服務(wù)激活、統(tǒng)一充值等8個(gè)系統(tǒng)的數(shù)據(jù)采集和上傳,及時(shí)監(jiān)控全國(guó)IT系統(tǒng)的運(yùn)行健康情況,實(shí)現(xiàn)IT系統(tǒng)的可視化運(yùn)營(yíng)。目前采用的IT系統(tǒng)健康度評(píng)估標(biāo)準(zhǔn)如表2所示。

根據(jù)IT系統(tǒng)健康度評(píng)估標(biāo)準(zhǔn),全國(guó)某時(shí)刻的CRM系統(tǒng)運(yùn)行健康度情況如圖3所示。

4 結(jié)束語(yǔ)

通過(guò)某電信公司IT系統(tǒng)健康度實(shí)踐證明,采用將IT監(jiān)控的對(duì)象進(jìn)行建模的方式,通過(guò)對(duì)IT內(nèi)部監(jiān)控組件間的健康值進(jìn)行加權(quán)計(jì)算,以單一的數(shù)值表示系統(tǒng)的健康程度,進(jìn)一步以不同的顏色展示出來(lái),從而使得IT系統(tǒng)健康情況直觀明了。但在應(yīng)用過(guò)程中也發(fā)現(xiàn),各項(xiàng)IT監(jiān)控指標(biāo)的閾值設(shè)置會(huì)有不合理的地方,需要在實(shí)踐中調(diào)整;另外,不同系統(tǒng)間的健康度模型也不盡相同,模型應(yīng)支持靈活地增加或裁減??傊?,IT系統(tǒng)健康度模型的優(yōu)化,特別是監(jiān)控指標(biāo)閾值的調(diào)整,都需要在實(shí)踐中逐步完善。

參考文獻(xiàn):

[1] 陳宏峰,劉億舟. 中國(guó)IT服務(wù)管理指南[M]. 北京: 北京大學(xué)出版社, 2004.

[2] Peter Brooks. IT服務(wù)管理指標(biāo)[M]. 豐祖軍,譯. 北京: 清華大學(xué)出版社, 2008.

[3] 中國(guó)電信集團(tuán)公司. CTG-MBOSS V2.0規(guī)范——IT服務(wù)管理規(guī)范V2.0[S]. 2010.

[4] 譚鑫. IT業(yè)務(wù)系統(tǒng)監(jiān)控及其關(guān)鍵技術(shù)研究[D]. 長(zhǎng)沙: 中南大學(xué), 2012.

[5] 童曉薇. 一種基于網(wǎng)絡(luò)的業(yè)務(wù)系統(tǒng)健康度評(píng)估方法[J]. 重慶理工大學(xué)學(xué)報(bào): 自然科學(xué), 2012(8): 101-105.endprint

猜你喜歡
利用率組件監(jiān)控
無(wú)人機(jī)智能巡檢在光伏電站組件診斷中的應(yīng)用
The Great Barrier Reef shows coral comeback
新型碎邊剪刀盤(pán)組件
2019年全國(guó)煤炭開(kāi)采和洗選業(yè)產(chǎn)能利用率為70.6%
U盾外殼組件注塑模具設(shè)計(jì)
你被監(jiān)控了嗎?
Zabbix在ATS系統(tǒng)集中監(jiān)控中的應(yīng)用
化肥利用率穩(wěn)步增長(zhǎng)
淺議如何提高涉煙信息的利用率
板材利用率提高之研究
阳高县| 临桂县| 自治县| 黎城县| 精河县| 凉山| 赤峰市| 雷山县| 保康县| 佛学| 兴和县| 永州市| 霍城县| 关岭| 当涂县| 边坝县| 浦江县| 孙吴县| 汪清县| 石台县| 大石桥市| 库伦旗| 漠河县| 屏东市| 清涧县| 林周县| 呼伦贝尔市| 墨江| 固镇县| 江口县| 平阳县| 祁连县| 铅山县| 泾阳县| 玉田县| 临江市| 信丰县| 东阿县| 禹州市| 德州市| 炎陵县|