席敏暉
摘 要:作為企業(yè)數(shù)據(jù)傳輸、計算和存儲中心的數(shù)據(jù)中心,集中了各種軟硬件資源和關鍵業(yè)務系統(tǒng),需要解決很多問題,這也讓數(shù)據(jù)中心的運行管理變得很困難。一定要將軟件和硬件管理好,使得數(shù)據(jù)中心的各項指標標準化后,可以完成自動化目標。這一過程需要靈活的管理機制和方法,讓各方面協(xié)調(diào)起來并不容易,企業(yè)數(shù)據(jù)中心管理人員要予以重視。加強企業(yè)級數(shù)據(jù)中心運維管理還能夠節(jié)省人力,讓相關的技術(shù)人員可以全身心的投入到系統(tǒng)、流程的優(yōu)化工作中,逐步實現(xiàn)數(shù)據(jù)中心運維管理自動化,節(jié)約成本,企業(yè)通過數(shù)據(jù)中心的自動化管理能夠更安全、有效的展開工作,文章即是在國內(nèi)外相關研究的基礎上,對企業(yè)級數(shù)據(jù)中心運維管理進行分析和討論,借此希望能夠?qū)ο嚓P企業(yè)和單位的數(shù)據(jù)中心管理有所幫助。
關鍵詞:IT運維;運維管理規(guī)范;安全運維管理;運維管理自動化
1 企業(yè)級數(shù)據(jù)中心運維管理面臨的挑戰(zhàn)
如今,作為企業(yè)數(shù)據(jù)傳輸、計算和存儲中心的數(shù)據(jù)中心,集中了各種軟硬件資源和關鍵業(yè)務系統(tǒng),需要解決很多問題,這也讓數(shù)據(jù)中心的運行管理變得很困難。首先,依據(jù)上層業(yè)務的角度來看,計算是數(shù)據(jù)中心的主要任務,所以一定要對性能參數(shù)和業(yè)務流量進行調(diào)整,以確保服務器、數(shù)據(jù)庫、中間件和Web等運行正常;其次,依據(jù)基礎設施角度來看,要整合管理工具并在一個平臺內(nèi)對路由器、交換機、服務器等設備進行管理,以滿足數(shù)據(jù)中心可視化管理的要求;再次,依據(jù)運維和服務的角度來看,數(shù)據(jù)中心各個方面的服務質(zhì)量和服務流程是影響業(yè)務部門業(yè)務的直接因素;最后,依據(jù)技術(shù)發(fā)展趨勢方面來看,一定要將軟件和硬件管理好,使得數(shù)據(jù)中心的各項指標標準化后,可以完成自動化目標。這一過程需要靈活的管理機制和方法,讓各方面協(xié)調(diào)起來并不容易,企業(yè)數(shù)據(jù)中心管理人員要予以重視。
企業(yè)級數(shù)據(jù)中心運維管理具體來說就是系統(tǒng)進行規(guī)劃、協(xié)調(diào)、控制一達到信息系統(tǒng)服務的標準,是信息系統(tǒng)服務有關各項管理工作的總稱,它主要分為以下五個階段:
(1)數(shù)據(jù)中心戰(zhàn)略階段:這一階段要在資源設施的基礎上分析業(yè)務目標,明確IT與業(yè)務方案,為數(shù)據(jù)中心提供規(guī)劃和發(fā)展的藍圖,再進行高級執(zhí)行規(guī)劃。
(2)數(shù)據(jù)中心設計階段:要依靠先進設備和高新技術(shù),統(tǒng)計數(shù)據(jù)中心各項數(shù)據(jù),規(guī)劃工程體系結(jié)構(gòu)、治理模型。
(3)數(shù)據(jù)中心轉(zhuǎn)換階段:是協(xié)調(diào)新數(shù)據(jù)中心盡快運作起來,要在數(shù)據(jù)中心建設實施的時候就進行相關的物理設備部署、試運轉(zhuǎn)、驗收等動作,讓新數(shù)據(jù)中心快速的轉(zhuǎn)人生產(chǎn)運行階段。
(4)數(shù)據(jù)中心運行階段:依靠自動化管理軟件,管理復雜異構(gòu)數(shù)據(jù)中心環(huán)境,為端口提供服務器、存儲、網(wǎng)絡以及審計、應用等管理。
(5)數(shù)據(jù)中心持續(xù)改進階段:通過ITIL/ITSM進行實踐,選取最佳的實施方案和評估制度,并在新IT技術(shù)和外包選擇的基礎上,持續(xù)不斷的提升數(shù)據(jù)中心的服務質(zhì)量,實現(xiàn)成本中心向創(chuàng)中心的轉(zhuǎn)變目標。
所以,數(shù)據(jù)中心生命周期法是一項重要的管理原則,通過它可以有效的管理數(shù)據(jù)中心,這對于數(shù)據(jù)中心管理的運營和服務的改進意義重大。從整體上來看,數(shù)據(jù)中心的運維管理主要有運行和持續(xù)改進兩個階段,不過這一過程所需要的時間較長,需要投入一定的精力才可以管理好,充分發(fā)揮出數(shù)據(jù)中心的作用,確保數(shù)據(jù)中心業(yè)務系統(tǒng)應用達到更好的效果。
2 企業(yè)級數(shù)據(jù)中心的運維管理規(guī)范
運維管理規(guī)范了相應的數(shù)據(jù)中心運維服務原則和基本要求,能夠推動數(shù)據(jù)中心服務框架的構(gòu)成。數(shù)據(jù)中心運維服務規(guī)范的制定,可以根據(jù)規(guī)范需求選擇相應的提供商,并對其服務進行評價,進而督促提供商提高服務質(zhì)量,進一提升數(shù)據(jù)中心運維服務,提高工作效率。
機房基礎設施、網(wǎng)絡及網(wǎng)絡設備、服務器及存儲、軟件、數(shù)據(jù)是企業(yè)級數(shù)據(jù)中心服務的對象。數(shù)據(jù)中心服務有例行操作、響應支持、優(yōu)化改善和咨詢評估等服務流程。需要根據(jù)約定條件和服務規(guī)定來進行監(jiān)控和防護、檢查等作業(yè),根據(jù)不同的響應前提,可以分為事件驅(qū)動響應、服務請求響應和應急響應。適應性改進、增強性改進和預防性改進是優(yōu)化改善服務的三個形式,按照客戶的要求可以進行相關的服務方案和運行系統(tǒng)管理,對服務對象的運行狀況、運行環(huán)境進行現(xiàn)狀調(diào)研、系統(tǒng)分析和評估。
3 企業(yè)級數(shù)據(jù)中心的安全運維管理
根據(jù)系統(tǒng)的重要性網(wǎng)絡安全、密集程度等因素企業(yè)級數(shù)據(jù)中心可以分為安全域和實施信息安全等級進行保護。根據(jù)不同的需求可以對信息安全資源進行優(yōu)化整合,構(gòu)建數(shù)據(jù)中心應急響應系統(tǒng)和災難備份系統(tǒng),將信息安全設備的作用充分發(fā)揮出來。不斷的提升保障體系建設,并逐步的完善相關的安全機制,根據(jù)相應的安全管理制度,加強數(shù)據(jù)中心安全和防護能力。所以,企業(yè)級數(shù)據(jù)中心在進行安全體系建設時要結(jié)合實際情況,采取相應的安全措施,依法辦事,讓安全防護體系的構(gòu)架更完善。
4 企業(yè)級災備中心的運維管理
一般大型的數(shù)據(jù)中心中都會有災備中心建設,在進行建設災備中心以后,就可以管理相應的中心運營制度,主要有災難報告、災難恢復的審批及處理、日常備份等運行管理制度,應用好這些制度能夠保障災備業(yè)務的照常運行,并能夠有效的支持災備工作開展,發(fā)揮其最大的作用。災備中心運營管理是一個復雜的過程,需要專業(yè)的管理和運營制度。
5 企業(yè)級數(shù)據(jù)中心運維管理的自動化
從總體上來說,數(shù)據(jù)中心需要通過自動化的方式解決成本加大、運作復雜、數(shù)據(jù)架構(gòu)等問題,以滿足相關標準和客戶需求。實現(xiàn)數(shù)據(jù)中心的自動化管理是數(shù)據(jù)中心的發(fā)展方向,如今IT服務管理成本逐步加大,其運維風險也不斷升高,所以需要通過數(shù)據(jù)中心自動化管理實現(xiàn)IT運維自動化,讓IT團隊實現(xiàn)資源轉(zhuǎn)型,提高服務水平。
6 結(jié)束語
降低人工操作的失誤率,加強對于整個系統(tǒng)的監(jiān)控,讓運作更加簡單,是企業(yè)級數(shù)據(jù)中心運維管理的重要任務。同時,加強企業(yè)級數(shù)據(jù)中心運維管理還能夠節(jié)省人力,讓相關的技術(shù)人員可以全身心的投入到系統(tǒng)、流程的優(yōu)化工作中,逐步實現(xiàn)數(shù)據(jù)中心運維管理自動化,節(jié)約成本,企業(yè)通過數(shù)據(jù)中心的自動化管理能夠更安全、有效的展開工作,適應時代發(fā)展的需求,并得到長足的發(fā)展。
參考文獻
[1]朱偉雄,王德安,蔡建華.新一代數(shù)據(jù)中心建設理論與實踐[M].北京:人民郵電出版社,2009.
[2]ITSS信息技術(shù)服務標準工作組.信息技術(shù)服務《運行維護》第四部分:數(shù)據(jù)中心規(guī)范[S].2009.endprint