尹 鵬
(中國石油中東公司 魯邁拉項目部 IT部)
信息化應用
淺談ITIL在ROO石油公司的應用
尹 鵬
(中國石油中東公司 魯邁拉項目部 IT部)
目前,IT技術正在迅速改變石油企業(yè)傳統(tǒng)的管理和運營模式。2009年, BP、中石油與伊拉克南方石油公司(SOC)及銷售公司SOMO共同組建聯(lián)合作業(yè)體Rumalia Operating Organization (以下簡稱:ROO)進行魯邁拉油田的開發(fā)生產(chǎn)。管理上,ROO各部門沿用BP的管理模式。本文結合五年來在魯邁拉油田工作的親身經(jīng)歷與感受,就BP在ITIL在ROO石油公司應用的一些經(jīng)驗與做法進行了總結,希望BP的管理經(jīng)驗能夠?qū)鴥?nèi)油企在信息化建設與如何提升IT服務管理水平等方向提供些許參考與借鑒。
BP; IT;ITIL;管理流程;服務
魯邁拉油田位于伊拉克南部城市巴士拉以西50公里,是伊拉克儲量第一,世界儲量第六的巨型油田。截止2016年底,魯邁拉油田原油日產(chǎn)突破150萬桶,占伊拉克國家原油產(chǎn)量的60%,是伊拉克國家經(jīng)濟的重要支柱。
ROO成立前期,受伊拉克戰(zhàn)爭影響,巴士拉地區(qū)局勢仍極不穩(wěn)定,油田生產(chǎn)尚未大規(guī)模展開,ROO維持低產(chǎn)量運行,公司業(yè)務對IT服務的需求也相對較少。2011年,隨著當?shù)匕脖P蝿莸暮棉D(zhuǎn)及ROO總部營地的建成,大批外籍雇員開始到魯邁拉現(xiàn)場工作。人員的急劇增加要求IT部門盡快提供現(xiàn)場工作所需的各種IT服務。自2011年下半年起,ROO進入了IT建設的高峰期。
隨著IT服務逐項交付使用及ROO員工的飛速增加,IT部門開始面對新的挑戰(zhàn):IT服務需求爆炸式增長,常有用戶的IT需求被遺忘,造成用戶滿意度下降、IT與用戶部門關系緊張;技術故障重復發(fā)生;IT的運維作業(yè)干擾了用戶的正常使用;Internet頻繁中斷;用戶數(shù)據(jù)文件損壞,無法修復等。
如何提升IT服務管理水平,提高用戶滿意度,使IT服務對公司業(yè)務的平穩(wěn)高效運行提供更好的技術保障?這是當時擺在IT部門面前的新問題。在BP的倡導下,ROO IT開始采用BP全球統(tǒng)一推廣使用的ITIL作為IT服務管理的參考依據(jù)。
ITIL,信息技術基礎架構庫,Information Technology Infrastructure Library(ITIL)的簡稱,是由英國政府部門CCTA(后并入英國政府商務辦公室)在上世紀80年代整理發(fā)布的系列IT服務管理流程、程序、清單集。ITIL旨在為企業(yè)的IT服務管理提供了一個客觀、嚴謹、可量化的標準和規(guī)范,企業(yè)的IT部門和最終用戶可以根據(jù)自己的能力和需求定義自己所要求的不同服務水平,參考ITIL來規(guī)劃和制定其IT基礎架構及服務管理,從而確保IT服務管理能為企業(yè)的業(yè)務運營提供更好的支持。對企業(yè)來說,實施ITIL的最大意義在于把IT與業(yè)務緊密地結合起來,讓企業(yè)的IT投資回報最大化。
ITIL自出現(xiàn)以來在歐美發(fā)達國家的企業(yè)、組織和政府部門得到了廣泛推廣,尤其在大型企業(yè)和組織中得到了深度應用。BP的IT服務管理流程便是將ITIL與公司實際業(yè)務相結合的產(chǎn)物,并且在BP總部及所有項目統(tǒng)一作為IT部門服務管理的主要參考依據(jù)進行推廣。除BP外,殼牌、??松梨诘任鞣绞凸镜腎T服務管理流程也多源于ITIL。
ITIL歸納總結了IT服務管理的5個生命周期及26個管理流程。簡而言之,ITIL將宏觀的IT服務管理體系分解成服務戰(zhàn)略、服務設計、服務轉(zhuǎn)換、服務運營和服務的持續(xù)改進五個生命周期,并就每個生命周期中涉及的IT服務,進一步細化為服務臺管理、事件管理、變更管理等26個具體的業(yè)務管理流程。每個流程都是ITIL基于IT業(yè)界的最佳管理實踐進行的總結與提煉,對企業(yè)在IT服務管理方面具有極高的參考價值。
以下就以BP在ROO IT服務管理中四個具有代表性的管理流程為例,介紹BP的具體做法及其對國內(nèi)油企在提高IT服務管理方面的借鑒意義。
2.1服務臺 管理
服務臺是一個企業(yè)IT部門和用戶之間的單一聯(lián)系點。服務臺的主要目標是協(xié)調(diào)用戶和IT部門之間的聯(lián)系,為IT服務運作提供支持,從而提高客戶的滿意度。也就是說:服務臺是存在于IT部門技術人員與用戶之間的橋梁。
BP很重視服務臺在其IT部門中的作用。在ROO,服務臺作為IT部下屬的一個獨立部門,直接向IT部門經(jīng)理負責。服務臺的工單完成率也是BP IT的一項重要KPI(key performance indicators,關鍵績效指標)指標。
BP的服務臺管理主要包括以下三方面內(nèi)容:一級技術支持、用戶溝通、工單管理。
2.1.1一級技術支持
BP的IT技術支持共分三級管理:
(1)一級技術支持:由服務臺完成,主要針對簡單用戶需求及問題提供技術支持。例如:用戶賬號創(chuàng)建、密碼服務、軟件安裝、打印機故障等。理想的服務臺可以解決70%以上的用戶需求。
(2)二級技術支持:對超出服務臺能力之外的用戶需求,服務臺可通過工單系統(tǒng)將需求分派給二級技術支持。二級技術支持資源包括IT部門的各技術組,如:網(wǎng)絡組、服務器組、應用系統(tǒng)組、通訊組等。各技術組的工作范圍分別針對IT服務的某一領域,提供較服務臺更為全面和深入的技術支持。一、二級技術支持理論上可解決企業(yè)95%以上的用戶需求。
(3)三級技術支持:BP的三級技術支持一般由系統(tǒng)制造原廠商、服務提供商、專業(yè)技術咨詢機構等組成。例如:思科的付費技術支持服務、摩托羅拉遠程支持中心等。三級技術支持提供遠程支持、咨詢等服務,并通過二級技術支持在現(xiàn)場負責解決問題。
ROO IT服務臺目前一級技術支持用戶IT需求完成率已達78%,并在2013年獲得BP全球最佳服務臺榮譽。
2.1.2用戶溝通
用戶溝通是服務臺管理的又一項重要內(nèi)容。當一項IT服務投入運行后,IT技術人員對服務的任何變動都可能會對最終用戶的使用產(chǎn)生影響,從而影響到用戶體驗。通過計劃、提前、及時、跟進的用戶溝通,提前告知用戶可能受到的影響,可以增進理解,消除誤會,提高用戶滿意度。
BP的用戶溝通主要是通過電子郵件形式來完成,溝通類型主要包括計劃變更通知(變更管理流程)和突發(fā)事件通知(事件管理流程)兩種:
(1)計劃變更通知:計劃變更通知是指對IT部門計劃內(nèi)的對IT服務會產(chǎn)生干擾的工作提前通知受影響的用戶群以便用戶提前安排工作,避免干擾。IT人員在通知的時間窗口內(nèi)完成工作。此類通知一般提前三天提醒用戶注意,在工作完成后不再對用戶更新。
(2)突發(fā)事件通知:突發(fā)事件通知是指對IT服務的突發(fā)故障,服務臺會在第一時間通知受影響的用戶群,告知用戶發(fā)生了什么、對用戶造成的影響、用戶需要采取的措施等等。通知的同時,IT技術人員盡快排除故障、恢復服務。此類通知會隨時更新用戶事件的進展,直至故障排除。
通過快速、高效的用戶溝通,排除了因溝通問題帶來的誤解與困擾,使用戶時刻掌握事態(tài)進展,提升了用戶滿意度,也緩和了因服務中斷造成的用戶部門與IT部門的緊張。
2.1.3工單(Ticket)管理
在小型企業(yè)或組織中,IT人員少,用戶有需求時可以直接聯(lián)系IT人員解決問題。但當企業(yè)或組織變得龐大,為確保大量的用戶需求都能被IT部門登記、跟進、處理、解決而不被遺漏,此時便需要IT工單系統(tǒng)。
工單對應著用戶提交的每一個IT服務需求。工單管理旨在確保用戶提交每一個服務需求均能得到及時妥善的處理直至關閉。基于工單系統(tǒng)的工單管理是服務臺的第三個重要職責。
在ROO,BP采用的工單系統(tǒng)LanDesk是嚴格基于ITIL服務臺管理流程開發(fā)的IT服務工單管理系統(tǒng)。當用戶需求被提交時,以下信息將被登記:①工單號(唯一、系統(tǒng)自動生成);②用戶信息;③需求描述;④工單分配信息;④工單狀態(tài)⑤附件。
工單生成后如服務臺團隊可以解決,則如“一級技術支持”部分描述的那樣,由服務臺直接提供服務;否則由服務臺按照需求分類的不同在系統(tǒng)中將任務分派給二級技術支持。IT的各技術支持組通過工單系統(tǒng)獲取、處理、完成用戶需求。同時,用戶也可通過工單系統(tǒng)獲知需求的完成進度,從而很好地實現(xiàn)了IT部門和最終用戶間的良好溝通。
此外,工單系統(tǒng)還具有強大的報表功能,可以統(tǒng)計工單的完成情況、各技術組的工單負載情況、服務水平協(xié)議(SLA)的執(zhí)行情況等,給IT部門運維和管理提供重要的參數(shù)依據(jù)。
2.2事件(Incident)管理
IT服務管理中的事件是指非計劃內(nèi)的對IT服務水平和質(zhì)量的影響。事件管理流程負責鑒別、分析、解決事件并監(jiān)督整個處理過程直至事件的解決和關閉。事件管理的目標是在不影響業(yè)務的情況下,盡可能快速恢復服務,從而保證最佳的效率和服務的可持續(xù)性。
BP的事件管理流程按事件重要程度的不同而有不同的處理方式。按照事件影響范圍的大小、對公司業(yè)務影響的輕重、緊急程度的不同,ROO IT將事件由重到輕分為P(Priority,重要性)1-P4四種級別。
P1、P2事件:是指影響范圍廣(如:P1-整個油田;P2-整個南部或北部地區(qū))、對公司業(yè)務影響較大且相對緊急的事件,由事件管理團隊負責跟進處理。事件管理團隊由各技術組組長構成,其主要職責是在事件發(fā)生后采取緊急響應,根據(jù)事件重要性的不同,采取不同策略應對處理直至事件解決。
P3、P4事件:是指影響范圍相對較小、對業(yè)務影響不大、緊急程度不高的事件,此類事件可通過服務臺的工單系統(tǒng)進行管理。
通過事件管理流程,確保每次事件發(fā)生后都有跟蹤,事件原因都能得到充分分析并對潛在的隱患問題進行處理,避免類似事件的再次發(fā)生。同時,事后的歸檔總結可為今后類似事件的再次發(fā)生提供參考依據(jù),減少同類事件的重發(fā)率,進而提升IT服務的整體水平。
作為預防性措施,BP在ROO的事件管理中還按照魯邁拉的現(xiàn)狀進行了擴展,增加了安全例檢、風險登記和故障登記三個流程。這三種管理形式,有效降低了隱患、故障發(fā)生的幾率。作為事件管理在ROO的一種新的嘗試,在實際應用中證實了其管理價值。
2.3變更管理
變更管理是ITIL服務管理中極為重要的一個環(huán)節(jié),貫穿整個服務轉(zhuǎn)換過程。成功的變更管理就是優(yōu)化風險;減少影響和破壞程度,其目的是用標準化的方法和程序有效快速處理變更。
IT部門對已投產(chǎn)交付服務的任何變更都存在著對最終用戶的影響和使現(xiàn)有服務中斷的風險。但出于IT日常運維的需要,變更是IT部門極為常見的一種工作。只有將變更合理有效地管理好,才能將因變更而對服務和用戶造成的潛在影響降到最低。
BP的變更管理完全沿用ITIL標準。當IT人員要對現(xiàn)有運行的系統(tǒng)進行變更操作時,需先提交變更申請(Request For Change,簡稱RFC)。RFC的內(nèi)容包括:變更描述、變更類別、執(zhí)行人、執(zhí)行時間窗口、執(zhí)行計劃、回滾計劃、測試計劃、資源需求、對數(shù)據(jù)中心的影響、對用戶的影響、是否需要用戶通知等信息。ROO IT每周召開變更咨詢委員會(Change Advisory Board,簡稱CAB)會議兩次,討論所有提交的變更申請。CAB由IT部門的各技術組組長組成,各組分別就提交的變更是否與其分管業(yè)務及負責的服務存在沖突、從各自專業(yè)角度出發(fā)是否預見變更中可能存在的風險、是否與本組其他變更存在沖突等方面綜合評估,只有CAB成員全體通過,變更中所有潛在的風險均被充分評估后,變更才可執(zhí)行。變更管理流程確保每個變更在實施前計劃詳細周到,將變更可能帶來的風險和影響降到最低。變更要在CAB批準的RFC規(guī)定的時間窗口之內(nèi)完成,且執(zhí)行步驟嚴格按照RFC的執(zhí)行計劃,如果變更失敗,則必須按照RFC的回滾計劃將服務還原。
按照ITIL的定義,BP的變更管理類型分為標準變更、普通變更和緊急變更三種:
(1)標準變更。標準變更是指周期性發(fā)生、執(zhí)行程序不變、風險較低的IT日常變更操作。對標準變更,RFC只需提交一次,無需每次報批。標準變更在BP的IT變更管理中又稱正常營業(yè)(Business As Usual,簡稱BAU)。
(2)普通變更。一般的變更都屬于普通變更,普通變更多指一次性需求,不具有重復性。上述變更管理流程描述的就是普通變更管理。
(3)緊急變更。緊急變更是指針對突發(fā)事件而采取緊急措施,無法等到常規(guī)CAB會議批準而必須立刻執(zhí)行的變更。緊急變更程序與普通變更類似,只是在RFC中的變更類型處選擇緊急變更,并由輪值CAB主席批準即可。
變更常與服務臺的用戶溝通流程同時使用,確保及時通知用戶IT變更對其可能產(chǎn)生的影響。
變更管理流程的采用大大降低了因?qū)ψ兏^程考慮不周、變更不當引起的服務中斷和延緩時間,是IT服務管理中極為重要的管理手段。
變更管理的目的絕非要將IT管理復雜化,也并非所有IT工作均需納入變更管理流程。只有對已交付運行的IT服務和運行中的生產(chǎn)系統(tǒng)可能產(chǎn)生影響或存在潛在風險的操作才屬于變更管理流程處理的范圍。對尚未交付,與生產(chǎn)系統(tǒng)隔絕的操作,如:未交付的且與生產(chǎn)系統(tǒng)分離的新系統(tǒng)、新項目,對其變更操作就無需執(zhí)行變更管理。
ITIL在ROO的引入至今已有近七年時間。七年間,ITIL對ROO IT服務管理水平的提升帶來的巨大變化。據(jù)統(tǒng)計,ITIL的投用使ROO IT部門的平均運維效率提高25%-30%,事故重發(fā)率由30%降至4%,因不當變更引起的延誤時間減少73%。此外,ITIL對國內(nèi)油企在提升IT服務管理水平方面也有一定的借鑒意義。
(1)提升企業(yè)整體的IT服務管理水平。確保IT流程支撐業(yè)務流程,整體上提高了業(yè)務運營的質(zhì)量;通過事故管理流程、變更管理流程和服務臺等提供了更可靠的業(yè)務支持;客戶對IT有更合理的期望,并更加清楚為達到這些期望他們所需要付出的成本;提高了客戶和業(yè)務人員的生產(chǎn)率;提供更加及時有效的業(yè)務持續(xù)性服務;客戶和IT服務提供者之間建立更加融洽的工作關系;提高了客戶滿意度。
(2)提供一種國際化的標準IT服務管理語言,促進中石油的IT隊伍與國際接軌。ITIL目前已成為西方石油公司IT服務管理的通用語言。正如英語是國際合作中的通用工作語言一樣,IT服務管理同樣需要一個國際標準,而中石油走出去的國際戰(zhàn)略,勢必要求我們自己的隊伍盡快掌握專業(yè)化的行業(yè)語言,ITIL所提供的正是在IT服務管理方面的國際化語言。對ITIL的了解與掌握,可以更快促進中方隊伍與他國同行尤其是以西方石油公司同行的同步,促進中石油IT隊伍與國際接軌。
(3)提供統(tǒng)一、完整的IT管理與信息化建設思路。管理方法的多樣對于一個小型企業(yè)或組織來說是可行的,但對大型企業(yè)來說,管理方法的多樣勢必造成管理的混亂和管理成本的增加。以中石油的海外業(yè)務來說,地區(qū)公司、各海外項目的IT服務管理如果各行其道,勢必造成管理指令上傳下達的不統(tǒng)一,且在人員項目間輪換時因管理方式的不同,員工每到一個項目便需要重新學習熟悉,造成管理成本的無謂增加。