趙子林 王金亮
(1.山東高速路橋集團股份有限公司,山東 濟南 250021;2.山東高速信息集團有限公司,山東 濟南 250021)
數據中臺最早是由阿里巴巴集團提出的,通過建設數據中臺,實現了阿里巴巴集團內部海量數據的采集、匯聚、計算、存儲、加工,并能夠為其集團內提供高效的數據服務,大幅提升其數據資源復用程度和數據服務開發(fā)效率。此后,數據中臺的概念迅速席卷國內互聯網行業(yè),騰訊、百度、京東、美團等,紛紛開始打造自己的企業(yè)級數據中臺。根據相關報告數據,2020年數據中臺市場規(guī)模達到68.2億元,隨著企業(yè)數字化轉型驅動,預計到2023年將達到183.2億元。
通過分析國內數據中臺項目的建設結果,也應當清醒地認識到,數據中臺項目的建設并非都是一帆風順的,每個項目都存在已知的或未知的風險,也有不少項目因無法承擔風險的代價而中途暫停、返工,甚至出現項目廢止的后果。某知名家電銷售集團的董事長在數據中臺上線后發(fā)布長篇文章表示“花了上億元的中臺項目,效果與預期相去甚遠”;某知名視頻互聯網公司投入幾百人建設數據中臺,卻在短短十幾個月后叫停項目,人員轉崗或被裁;某知名車企運用數據中臺建立了客戶評估與流失管理模型,得出的結果卻被證明是錯誤的。
但自2020年起,黨中央、國務院在深化新一代信息技術與制造業(yè)融合發(fā)展、打造數字經濟新優(yōu)勢等方面進行決策部署,積極引導國有企業(yè)把握數字經濟發(fā)展機遇,加速提高企業(yè)創(chuàng)新能力。大型國有企業(yè)對此紛紛響應,啟動數字化轉型。在此過程中,數據中臺自然成為當前國有企業(yè)信息化體系中不可或缺的重要組成部分,其數據中臺項目的建設也呈現出更加冷靜和理性的趨勢。
本文基于以上情況,分析集團型企業(yè)數據中臺項目中較為常見的共性風險問題,并在風險識別與分析、風險登記與評估、主要應對策略、風險跟蹤流程、風險經驗知識庫等方面提出合理化建議,從而有針對性地對項目的類似風險進行預判和有效管控,降低集團型企業(yè)數據中臺項目運營管理風險。
數據中臺項目不僅包括過程管理風險和中臺開發(fā)技術風險,還包括項目所屬組織自身的風險,以及來自于組織外部的風險。主要風險如下:
(1)過程管理風險??尚行匝芯?、規(guī)劃設計、研發(fā)實施、系統(tǒng)運行等。
(2)技術風險。技術選型、技術框架發(fā)展、技術團隊、知識轉移等。
(3)組織自身風險。信息化建設現狀、高層認知程度、團隊能力水平等。
(4)組織外部風險。產品供應商、合作開發(fā)流程等。
基于集團型企業(yè)對于數據中臺安全性、可靠性和易用性等方面的要求,企業(yè)數據中臺項目一般采用國際/國內較為主流的相關技術,整體框架一般分為數據接入層、存儲層、計算層、分析層、服務層和應用層。在傳統(tǒng)的項目管理方法論中,風險識別的方法一般包括頭腦風暴、德爾菲、調研、根本原因分析等在內的信息收集技術以及文檔分析、專家分析和SWOT分析等。對于多數集團型企業(yè)來說,往往是第一次進行數據中臺項目建設,內部可借鑒的經驗不多,因此建議采用以調研、專家分析為主的風險識別手段開展工作。
通過識別與分析,目前集團型企業(yè)數據中臺項目普遍存在以下共性風險問題:
(1)領導層重視程度不夠,對數據中臺項目的風險認識不足。在這種情況下會出現組織人員之間、業(yè)務單元之間、權屬單位之間協(xié)同力不足,造成項目進度延期、溝通成本增加等風險。
(2)對數據源前期建設情況、接入方式、網絡情況、數據結構等現狀了解不足。企業(yè)內外部各數據源由各業(yè)務或管理領域的信息化系統(tǒng)產生,因此各數據源對應的信息系統(tǒng)在建設時間、技術路線、運維模式、網絡部署位置等方面存在較大差異,如果沒有全面掌握各數據源的現狀細節(jié),后續(xù)工作將會有多方面風險。
(3)數據源質量存在缺陷,或在接入數據中臺后,部分數據源質量發(fā)生變化。低質量或存在質量缺陷的數據源,會直接導致數據計算后的產出物無法對業(yè)務起到有效的支撐作用,甚至因為分析結果不準確或錯誤,還會給企業(yè)運營管理造成負面影響。
(4)數據加工任務繁多,造成不必要的服務器資源消耗,以及較大的維護難度。目前大部分數據中臺能夠實現加工任務可視化管理的功能,但是在中臺運行過程中,運維和開發(fā)團隊往往會出于簡單快速見效的考慮,在處理數據需求時直接增加新的數據加工任務,而不是考慮有限復用或改造復用現有任務,長此以往將會造成系統(tǒng)消耗的浪費,并會大幅增加硬件資源成本。
(5)數據服務粒度規(guī)劃不清晰,可能會導致數據中臺不但沒有實現數據資源的高效服用,反而帶來了更多的開發(fā)和維護成本。此類風險與上一類風險類似,由于運行過程中復用程度低,造成資源浪費和成本增加。不同之處在于,數據服務復用程度的高低往往取決于業(yè)務規(guī)劃是否清晰和能否做到根據業(yè)務變化而及時更新。
(6)數據應用的合規(guī)性與安全性。近幾年隨著國家數據安全相關政策法規(guī)的發(fā)布,數據應用的合規(guī)合法、數據安全、隱私保護等風險日益凸顯出來,許多業(yè)界知名互聯網公司也因觸犯了數據安全這條紅線而受到巨額罰款。對于企業(yè)數據中臺項目來說,如果沒有對接入的數據源進行確權,并且沒有對業(yè)主方、責任方、運營方的權利義務明確劃分,那就意味著在后續(xù)的數據運營過程中企業(yè)將承擔巨大的法律風險。
(7)其他不可控風險,如選定的技術路線發(fā)生重大變更等。數據中臺建設涉及運用整個數據體系內多方面的技術,而以大數據技術為代表的技術在近幾年發(fā)展到相對成熟的階段,同時依然呈現出高速發(fā)展的態(tài)勢。這就意味著隨著技術的演進,項目建設時期所采用的技術路線很有可能在不遠的將來會發(fā)生變化,如何應對技術路線變化的風險,也是項目建設方需要提前規(guī)劃和考慮的重要內容。
通過風險識別和初步分析得到的結果應記錄在風險登記冊(表1)中,形成該文檔最初始化的內容。這些初始風險登記至少要包括風險ID、所屬分類、概括和詳細描述、負責人、原因分析、應對策略和潛在的應對措施等內容。
表1 第一次風險識別后的風險登記冊
根據風險登記冊清單,可逐條開展風險量化評估,本環(huán)節(jié)的重要手段是風險概率與影響評估技術。具體工作的開展可分為3個步驟:
(1)建立風險影響分級表。風險影響分級表的定義是否合理將直接決定項目風險管理工作的價值,建議通過調研訪談、內外部專家會議、歷史項目文檔庫檢索,充分參考集團型企業(yè)數據中臺項目或同等投資規(guī)模、實施難度的項目,以保證風險影響分級劃定相對合理并接近實際。某集團公司數據中臺項目風險影響分級表,見表2。
表2 風險影響分級表
(2)形成風險發(fā)生概率與影響矩陣。風險發(fā)生概率是指每個風險發(fā)生的可能性,一般常見的有信息系統(tǒng)項目中風險事件發(fā)生的概率。它可以通過對功能需求的描述與歷史項目文檔庫的比對,或調研具有類似項目經驗的人員等方式進行評估。但是對于集團型企業(yè)數據中臺項目來說,往往可借鑒的信息寥寥無幾,建議邀請行業(yè)內數據中臺專家以召開會議的形式進行評估,并邀請具備豐富風險管理經驗的專家作為主持人引導討論過程。結合風險清單逐條進行風險發(fā)生概率評估,評估過程可能會出現被認為發(fā)生概率極低的風險,對于此類風險一般可不進行下一步風險影響程度值的計算,但不要把它們從風險登記冊中刪除,而是要在備注中做出標記,供將來進一步觀察。
(3)風險影響程度值的計算。公式如下
風險影響程度值=風險影響程度級別×風險發(fā)生概率
根據風險清單采用公式對每項風險進行計算,將風險影響程度值、風險發(fā)生概率、風險影響級別一并更新至風險登記冊。
根據集團型企業(yè)數據中臺項目的建設經驗,為增加項目成功機會、減少風險帶來的威脅,可有針對性地從組織意識、數據源、安全合規(guī)和技術路線等四個方面制定相應的風險應對策略。
對于集團型企業(yè)來說,公司高層對數據中臺及其技術的認知不足,是發(fā)生概率較大、影響程度等級較高的風險,往往會對項目推進產生較大的負面影響。集團型企業(yè)本身存在規(guī)模大、人員多、機構層級復雜的特點,如果缺少高層領導的支持和統(tǒng)一把控,數據中臺項目很有可能停滯不前甚至最終以失敗告終。近年來,很多走在數字化前列的集團型企業(yè)紛紛設立CIO(首席信息官)、CDO(首席數據官)等高層崗位,就是為了讓企業(yè)能夠更好地掌握和開發(fā)所擁有的數據資產,這也確實在信息化項目推進和數字化建設過程中起到了十分積極的作用。
在項目可行性研究、項目立項階段要充分利用外部相關資源,如專家會議、行業(yè)數字化建設調研等方式,借助內外部力量盡可能促進公司高層對數據中臺的理解,進而提升整個企業(yè)對數據中臺項目的認知水平。
集團型企業(yè)數據中臺項目中的數據源風險,往往是發(fā)生概率最大、影響程度等級中等的風險。如果把數據中臺比作生產工具,那么平臺接入的各個數據源就是生產資料,如果數據源缺失或存在問題,那么數據中臺就如同無源之水,難以發(fā)揮其應有的作用和價值。在數據中臺項目風險中,數據源系統(tǒng)的網絡連接穩(wěn)定性、數據全面性、數據抽取持續(xù)性等問題一般來說是占比最高的風險,而數據源風險的影響又因集團型企業(yè)業(yè)務線廣、信息系統(tǒng)多、網絡情況復雜等特點,表現得更為突出。
應對數據源風險,要求項目團隊從前期調研、數據接入技術、數據質量提升、持續(xù)性管理等方面開展相應工作。在數據源調研階段,要全面了解數據源實際情況,掌握每個數據源接入的可行性、數據范圍、網絡連接方式、預期存儲占用、預期更新頻率、數據庫用戶權限與連接串配置等信息。在接入技術方面,需要綜合考慮數據源現狀、數據中臺業(yè)務需求、性能資源等因素,選擇在線或離線抽取數據的方式,同時注意技術路線要符合當前發(fā)展方向。在數據質量方面,要明確不存在一直百分之百完美的數據,數據質量提升的目標是使數據質量長期保持在一個較高的水平,具體手段可以通過系統(tǒng)邏輯檢查、人工抽查、定期生成數據質量報告等方式,持續(xù)促進各數據源信息系統(tǒng)開展數據質量改善,進而達到提高企業(yè)數據資源整體質量的目標。除質量管理之外,數據源的運營維護、基于數據資源的服務開發(fā)、數據服務的生命周期管理等工作,也都會貫穿項目始終,并且是數據中臺項目運行期間持續(xù)存在的工作,在由專職團隊人員負責的基礎上,還需要制定相應的管理辦法和規(guī)范制度進行約束。
對于集團型企業(yè)來說,數據中臺項目安全合規(guī)風險發(fā)生概率不高,但是影響程度等級較高,一旦發(fā)生類似事件,有可能嚴重損壞企業(yè)的社會形象和品牌價值。隨著國家《數據安全法》的出臺,數據合規(guī)與安全已經成為企業(yè)運用數據資源開展經營活動的紅線,在遵守國家相關法規(guī)的基礎上,集團型企業(yè)內部也需要建立一套標準化的數據資源管理流程,使數據資產能夠在安全合規(guī)的前提下為業(yè)務賦能。流程應至少包括數據資源的確權、接入、存儲、加工、服務、調用等環(huán)節(jié)。
在確權和接入的過程中,數據中臺項目應采取積極告知和簽署文件的形式,以便讓相關數據資源歸屬組織能夠充分了解數據接入后的權利和義務。在數據形成服務和被調用的過程中,數據中臺可采取實時獲取、按周期訂閱、按需發(fā)起等多種形式,做好調用記錄管理,以及調用次數和數據規(guī)模的計量,為后續(xù)相關審計工作提供有效依據。
對于集團型企業(yè)來說,如果通過采購純商業(yè)化產品去建設企業(yè)數據中臺,這部分風險相對較小,并且可以通過合同條款將此風險轉移。如果通過企業(yè)信息化團隊自主研發(fā)或聯合開發(fā)數據中臺,一旦所采用的開源技術框架發(fā)生重大變化調整,將對研發(fā)工作造成極大影響,這就要求在項目建設過程中針對相關風險提前制定相應的回避或減輕策略。
回避策略可采用多技術路線并行的方式進行預防,數據中臺所使用到的技術較為廣泛,數據抽取一般采用ETL/Sqoop/Kafka、數據存儲一般采用HDFS/Hbase/Redis/PG/Hive、數據計算一般采用MapReduce/Flink等技術,在一個功能板塊內,建議采用不少于兩種平行的技術路線,以實現技術互補與互為備份。
減輕策略可制訂相應的技術替換方案,通過培訓學習、招聘借調等方式確保團隊具備相關的技術能力,通過規(guī)劃應急儲備應對該風險發(fā)生后帶來的額外成本。
風險管理活動應貫穿數據中臺項目始終,要根據風險管理計劃通過分級定期匯報、處置過程跟蹤、風險審計、風險再評估、風險退出、維護歷史風險庫等流程,實現項目全生命周期的風險閉環(huán)管理。
根據項目風險影響嚴重程度、緊急程度、發(fā)生概率預測等信息,有針對性地按照不同周期召開風險專題會,由責任人對近期情況進行匯報。在風險發(fā)生并采取相應的應對措施后,要全程保持對風險處置情況的跟蹤,檢查相關措施是否有效。當風險處置完成后,通過風險再評估環(huán)節(jié)判斷風險是否可以關閉,或者已經減輕到何種程度。風險的退出環(huán)節(jié),要提交盡可能詳細的分析報告并召開評審會,通過評審確認符合條件的風險可以正式關閉。在項目風險管理全生命周期的過程中,相關清單文件、數據報表、分析報告、會議紀要均應保留在企業(yè)風險文檔庫中,形成組織過程資產。
組織過程資產中數據中臺項目相關信息的累積,是企業(yè)在實踐中形成的獨特過程資產,將直接影響企業(yè)類似項目的成功。對于集團型企業(yè)數據中臺項目的乙方,也就是數據中臺的建設方來說,形成組織過程資產,將更能夠直接提升其在數據中臺領域市場中的核心競爭力。
本文對集團型企業(yè)數據中臺項目的風險分類、識別分析、風險評估、風險應對、閉環(huán)管理等方面進行闡述,并結合理論知識與實踐經驗,分析了項目過程中較為典型的風險問題,提出了有針對性的風險應對策略。希望本文中提到的建議和措施能夠運用到集團型企業(yè)數據中臺項目的建設中,并能夠產生積極的影響,切實提升企業(yè)項目風險管控水平。