黃敏珍
(中國鐵道科學(xué)研究院集團有限公司 電子計算技術(shù)研究所,北京 100081)
隨著大數(shù)據(jù)技術(shù)的應(yīng)用和企業(yè)數(shù)字化的發(fā)展,數(shù)據(jù)被認(rèn)為是企業(yè)的資產(chǎn)已經(jīng)成為一種共識,數(shù)據(jù)具有巨大潛在價值,要從數(shù)據(jù)中獲取價值,需要企業(yè)高度重視并對其進行常態(tài)化管理。很多企業(yè)都開展了相關(guān)資產(chǎn)管理平臺的研究,利用大數(shù)據(jù)技術(shù)進行數(shù)據(jù)匯集、數(shù)據(jù)治理、數(shù)據(jù)挖掘分析與可視化展示。在技術(shù)支持的同時,如何構(gòu)建完整并易于實踐的數(shù)據(jù)資產(chǎn)管理體系,如何處理好數(shù)據(jù)資產(chǎn)管理體系與企業(yè)的項目管理體系之間的關(guān)系,如何把數(shù)據(jù)資產(chǎn)管理的理念融入到現(xiàn)有的項目管理體系中等,這些已成為亟待研究的問題,本文結(jié)合國際數(shù)據(jù)管理協(xié)會(DAMA,Data Management Association)體系的內(nèi)容,并融合CMMI、ISO9001 等項目管理體系的理念,闡述項目管理實踐中數(shù)據(jù)資產(chǎn)管理的實踐策略。
DAMA 是數(shù)據(jù)管理專業(yè)人士組織。DAMA 體系是這個協(xié)會對數(shù)據(jù)管理領(lǐng)域理論和實踐的總結(jié)。DAMA 體系認(rèn)為,在大數(shù)據(jù)時代,數(shù)據(jù)也是企業(yè)的資產(chǎn),資產(chǎn)通常被認(rèn)為是財產(chǎn),可以變現(xiàn)為價值,而要從數(shù)據(jù)中獲取價值,就需要對數(shù)據(jù)進行常態(tài)化管理。在DAMA 體系中,對數(shù)據(jù)管理的各個知識領(lǐng)域進行了詳細的定義和闡述[1-2]。
數(shù)據(jù)的生命周期包括數(shù)據(jù)采集、存儲、處理、傳輸、交換共享、銷毀等過程,在數(shù)據(jù)的整個生命周期中,可以通過清理、轉(zhuǎn)換、合并、增強或聚合數(shù)據(jù)的方式進行處理。
在大數(shù)據(jù)時代,數(shù)據(jù)資產(chǎn)化已經(jīng)得到廣泛認(rèn)可。在工廠、營銷、決策等很多方面,數(shù)據(jù)已經(jīng)起到了導(dǎo)向作用[3]。數(shù)據(jù)資產(chǎn)管理是在數(shù)據(jù)管理的基礎(chǔ)上進一步發(fā)展的,既有聯(lián)系又有區(qū)別,具體如下。
(1)體系建設(shè)。數(shù)據(jù)資產(chǎn)管理體系在組織建設(shè)上,需要建立更加專業(yè)化的管理組織,并且融合資產(chǎn)運營的理念和思路。
(2)管理側(cè)重點。數(shù)據(jù)管理主要管理數(shù)據(jù)的質(zhì)量,避免問題數(shù)據(jù)帶來損失;而數(shù)據(jù)資產(chǎn)管理把數(shù)據(jù)的價值管理作為重點關(guān)注點。
(3)應(yīng)用場景。數(shù)據(jù)資產(chǎn)管理在數(shù)據(jù)管理的基礎(chǔ)上,更加關(guān)注大數(shù)據(jù)場景下數(shù)據(jù)的共享和匯集管理,增加了數(shù)據(jù)價值管理。
(4)數(shù)據(jù)價值。數(shù)據(jù)資產(chǎn)的價值包括使用價值和變現(xiàn)價值。使用價值是指數(shù)據(jù)分析共享和使用后所產(chǎn)生的價值,包括企業(yè)效益的提升、管理水平的提高等。變現(xiàn)價值是通過出售或者租賃數(shù)據(jù)的方式獲得直接的經(jīng)濟收益。
目前,數(shù)據(jù)管理主要包括DAMA、數(shù)據(jù)治理協(xié)會(DGI,The Data Governance Institute)和IBM 公司等為代表的理論體系[4],但數(shù)據(jù)管理體系主要是將數(shù)據(jù)作為信息進行管理,對數(shù)據(jù)作為資產(chǎn)和價值方面關(guān)注的比較少。在數(shù)據(jù)資產(chǎn)化背景下,數(shù)據(jù)資產(chǎn)管理在數(shù)據(jù)管理的基礎(chǔ)上在管理視角、管理職能和組織體系上都進一步發(fā)展。
當(dāng)前,國內(nèi)外相關(guān)學(xué)者面向不同場景提出了多種與數(shù)據(jù)資產(chǎn)管理相關(guān)的體系。
(1)數(shù)據(jù)管理的知識體系(DMBOK1.0)和DAMA-DMBOK2。DAMA 在2009 年發(fā)布了數(shù)據(jù)管理知識體系,即DMBOK 1.0,該體系將數(shù)據(jù)管理體系分為10 個知識領(lǐng)域[5]。近年來,隨著大數(shù)據(jù)技術(shù)的發(fā)展,以及數(shù)據(jù)治理和數(shù)據(jù)倫理方面的新變化,DAMA 編寫了 DAMA-DMBOK2,重新制定了DAMA 數(shù)據(jù)管理框架(DAMA 車輪圖),使得DMBOK 更加深入、豐富。
(2)DMM 和DCMM。在數(shù)據(jù)能力成熟度方面,在2014 年,卡內(nèi)基梅隆大學(xué)旗下機構(gòu)以CMMI 為參考,發(fā)布了數(shù)據(jù)能力成熟度(DMM)模型,該模型包括數(shù)據(jù)管理戰(zhàn)略、數(shù)據(jù)操作、數(shù)據(jù)治理、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)平臺和體系,以及支撐流程等6 個職能域[4]。在2018 年,全國信息安全標(biāo)準(zhǔn)化技術(shù)委員會提出了數(shù)據(jù)管理能力成熟度模型(DCMM),提出了包括數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)治理和數(shù)據(jù)生命周期管理等在內(nèi)的8 個能力域[4]。
除了如上數(shù)據(jù)管理方面的體系,國內(nèi)外在大數(shù)據(jù)領(lǐng)域開展了很多數(shù)據(jù)相關(guān)的標(biāo)準(zhǔn)化研究工作[6],在鐵路領(lǐng)域,部署在中國國家鐵路集團有限公司主數(shù)據(jù)中心的鐵路數(shù)據(jù)服務(wù)平臺已實現(xiàn)數(shù)據(jù)登記、數(shù)據(jù)匯聚、數(shù)據(jù)質(zhì)量管控、數(shù)據(jù)共享等應(yīng)用[7]。
在融合CMMI、ISO9001 及DevOps 項目管理理念的基礎(chǔ)上[8],本文結(jié)合數(shù)據(jù)管理和數(shù)據(jù)資產(chǎn)管理的理念,結(jié)合10 項知識領(lǐng)域中的關(guān)鍵內(nèi)容,研究如圖1 所示的6 個關(guān)鍵數(shù)據(jù)資產(chǎn)管理實施策略。
圖1 數(shù)據(jù)資產(chǎn)管理6 個關(guān)鍵方面
不管在系統(tǒng)研發(fā)的全生命周期過程中,還是在數(shù)據(jù)資產(chǎn)管理體系中,數(shù)據(jù)架構(gòu)管理是其核心。
3.1.1 項目管理過程
(1)項目生命周期的需求分析、設(shè)計階段的管理是非常重要的階段,對項目的需求分析、概要設(shè)計和詳細設(shè)計文檔都有非常明確的要求,并且經(jīng)過專家的評審后,才進行項目下一步編碼。
(2)其中與數(shù)據(jù)相關(guān)的最重要的過程就是數(shù)據(jù)架構(gòu)以及數(shù)據(jù)庫的設(shè)計,而數(shù)據(jù)資產(chǎn)管理,從數(shù)據(jù)架構(gòu)入手,實現(xiàn)各個獨立系統(tǒng)的數(shù)據(jù)從“黑盒”向“白盒”轉(zhuǎn)化。
(3)研發(fā)項目的關(guān)系型數(shù)據(jù)庫過程是先通過需求形成概念模型、再形成邏輯模型、最后形成物理模型。
(4)數(shù)據(jù)資產(chǎn)架構(gòu)管理是對已經(jīng)存在的數(shù)據(jù)架構(gòu)進行梳理,是先梳理物理模型、邏輯模型,再梳理業(yè)務(wù)邏輯模型。
3.1.2 項目研發(fā)過程
項目研發(fā)過程正向的設(shè)計,數(shù)據(jù)資產(chǎn)反向的數(shù)據(jù)結(jié)構(gòu)梳理,主要都涉及數(shù)據(jù)架構(gòu)的梳理,所以在項目實踐過程中,要重點加強數(shù)據(jù)建模管理,進行物理模型、邏輯模型和業(yè)務(wù)邏輯模型的梳理和管理。
3.1.3 項目管理實踐
加強項目的需求管理、設(shè)計管理,設(shè)計的開始階段強化數(shù)據(jù)架構(gòu)意識,加強變更管理。隨著項目研發(fā)的進展,系統(tǒng)數(shù)據(jù)庫相關(guān)數(shù)據(jù)表或字段變更后,需要及時更新設(shè)計文檔。如果各個系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)設(shè)計文檔都是齊全和完整的,那么后期在數(shù)據(jù)資產(chǎn)管理的過程中,對數(shù)據(jù)架構(gòu)的分析就會減少工作量。
Malcolm Chisholm 提出了一種6 層的數(shù)據(jù)分類法,把數(shù)據(jù)分為元數(shù)據(jù)、參考數(shù)據(jù)、企業(yè)結(jié)構(gòu)數(shù)據(jù)、交易活動數(shù)據(jù)、交易結(jié)構(gòu)數(shù)據(jù)和交易審計數(shù)據(jù)6 種類別[2]。主數(shù)據(jù)包括參考數(shù)據(jù)、企業(yè)結(jié)構(gòu)數(shù)據(jù)和交換結(jié)構(gòu)數(shù)據(jù)的聚合。
在項目管理實踐中,我們把元數(shù)據(jù)管理、主數(shù)據(jù)管理、參考數(shù)據(jù)管理的理念融合到數(shù)據(jù)采集、清洗、匯聚過程中,主要包括如下策略。
(1)加強數(shù)據(jù)目錄管理。按照數(shù)據(jù)分類方法,對數(shù)據(jù)進行分類管理,形成統(tǒng)一的數(shù)據(jù)目錄,方便數(shù)據(jù)的檢索和獲取管理。
(2)加強數(shù)據(jù)采集和匯集管理。大數(shù)據(jù)項目中,包括對多個業(yè)務(wù)系統(tǒng)數(shù)據(jù)的采集、清洗和匯集等工作,加強各業(yè)務(wù)系統(tǒng)元數(shù)據(jù)、參考數(shù)據(jù)、主數(shù)據(jù)的梳理。對于不同業(yè)務(wù)系統(tǒng)中同種類別的元數(shù)據(jù)和參考數(shù)據(jù)要統(tǒng)一管理;而對各業(yè)務(wù)系統(tǒng)的核心的主數(shù)據(jù),要加強數(shù)據(jù)建模管理,在數(shù)據(jù)匯集過程中加強進行數(shù)據(jù)清洗等,嚴(yán)格質(zhì)量管理。
(3)加強安全管理。在數(shù)據(jù)匯集過程中,對涉及商業(yè)秘密、個人隱私數(shù)據(jù),要加強安全管理,在數(shù)據(jù)匯集的過程中進行脫敏或加密處理。
在項目管理實踐中,管理數(shù)據(jù)質(zhì)量的工作不是一次性的。
(1)可對數(shù)據(jù)質(zhì)量制定專項管理體系,并且量化評估指標(biāo),對數(shù)據(jù)質(zhì)量進行階段檢查和審查,及時發(fā)現(xiàn)、分析和解決數(shù)據(jù)質(zhì)量問題,然后針對問題進行持續(xù)改進。在質(zhì)量評估指標(biāo)方面,DAMA UK 發(fā)布的一份白皮書里對數(shù)據(jù)質(zhì)量的6 個維度進行了描述,包括數(shù)據(jù)完備性、唯一性、及時性、有效性、準(zhǔn)確性和一致性等。
(2)數(shù)據(jù)質(zhì)量的管理需要融合到項目管理過程中,在系統(tǒng)研發(fā)的整個過程中要持續(xù)進行質(zhì)量管理,在數(shù)據(jù)創(chuàng)建、轉(zhuǎn)換和存儲過程中要不斷完善數(shù)據(jù)質(zhì)量。
(3)可使用數(shù)據(jù)清理、數(shù)據(jù)增強、數(shù)據(jù)解析、格式化、數(shù)據(jù)轉(zhuǎn)換與標(biāo)準(zhǔn)化等多種方式提升數(shù)據(jù)質(zhì)量。
數(shù)據(jù)安全包括安全策略和過程的規(guī)劃、開發(fā)和執(zhí)行,為數(shù)據(jù)和信息資產(chǎn)提供正確的身份認(rèn)證、授權(quán)、訪問和審計[2]。
數(shù)據(jù)不僅蘊藏著價值和機會,也存在風(fēng)險。在項目實踐過程中,數(shù)據(jù)安全管理的實施需要重點考慮如下幾個方面。
(1)建立體系化的安全管理規(guī)范。企業(yè)需要結(jié)合自身和系統(tǒng)的實際情況,建立數(shù)據(jù)安全管理制度,開發(fā)規(guī)范和相關(guān)管理辦法。
(2)敏感數(shù)據(jù)分級分類管理。根據(jù)國家、行業(yè)、用戶和企業(yè)對數(shù)據(jù)安全管控的要求,對現(xiàn)有數(shù)據(jù)進行敏感分級、分類管理,形成敏感數(shù)據(jù)目錄。在此基礎(chǔ)上,對不同敏感等級的數(shù)據(jù),識別安全風(fēng)險,制定響應(yīng)的安全防范措施和安全管理策略。
(3)識別安全風(fēng)險。對系統(tǒng)的安全風(fēng)險進行識別與檢查;在濫用特權(quán)、濫用合法權(quán)限、未經(jīng)授權(quán)的特權(quán)升級、共享賬號濫用、平臺入侵攻擊、注入漏洞、默認(rèn)密碼等方面檢查;對重大安全風(fēng)險問題及時整改。
(4)制定安全管理策略。安全管理策略包括數(shù)據(jù)訪問權(quán)限控制、數(shù)據(jù)審計管理、數(shù)據(jù)遷移策略、數(shù)據(jù)安全控制和備份策略等。另外,對敏感數(shù)據(jù)目錄和定義策略實行動態(tài)管理,持續(xù)完善優(yōu)化策略,以保證數(shù)據(jù)安全策略的實地落實。
(5)實行安全測試。根據(jù)相關(guān)安全等級的要求,定期對系統(tǒng)進行安全測試,及時發(fā)現(xiàn)安全漏洞,對系統(tǒng)的安全策略進行持續(xù)優(yōu)化。
隨著大數(shù)據(jù)、物聯(lián)網(wǎng)、5G 技術(shù)的發(fā)展和廣泛應(yīng)用,全球數(shù)據(jù)呈現(xiàn)爆發(fā)增長。每年都產(chǎn)生比以往更大量的結(jié)構(gòu)化和非結(jié)構(gòu)化的海量數(shù)據(jù)。如何采取更好的數(shù)據(jù)管理方式,更好地利用數(shù)據(jù),構(gòu)建以數(shù)據(jù)為關(guān)鍵要素的數(shù)字經(jīng)濟,核心就是數(shù)據(jù)資產(chǎn)管理[9]。在項目管理實踐中,在如下方面加強數(shù)據(jù)的開發(fā)利用。
(1)加強數(shù)據(jù)的分級分類管理。數(shù)據(jù)的開發(fā)利用離不開數(shù)據(jù)的共享,管曉宏[10]認(rèn)為數(shù)據(jù)分類分級管理是實現(xiàn)數(shù)據(jù)安全有序共享的基礎(chǔ)保障。例如,在鐵路領(lǐng)域,可按照共享維度、安全維度、時間維度和空間維度將數(shù)據(jù)分級分類形成數(shù)據(jù)集[11]。
(2)應(yīng)用人工智能等各種技術(shù)。雖然都說數(shù)據(jù)是一種資產(chǎn),但只有被充分開發(fā)利用產(chǎn)生價值的數(shù)據(jù)才是真正的資產(chǎn)。對于數(shù)據(jù)的應(yīng)用,需要通過各種統(tǒng)計學(xué)算法、建模算法、機器學(xué)習(xí),以及數(shù)據(jù)可視化方面的綜合應(yīng)用,充分挖掘數(shù)據(jù)對于決策的支持能力。
(3)加強數(shù)據(jù)的全生命周期管理。對數(shù)據(jù)的采集、存儲、應(yīng)用等全生命周期進行管理,按照資產(chǎn)管理的理念對數(shù)據(jù)進行管理,形成數(shù)據(jù)價值管理和評估體系,更好地服務(wù)于數(shù)據(jù)價值的開發(fā)、數(shù)據(jù)共享和數(shù)據(jù)流通。
在項目管理實踐中,數(shù)據(jù)的共享分為內(nèi)部共享和外部共享。在數(shù)據(jù)共享的實施過程中,要加強如下方面的管理。
(1)統(tǒng)一的數(shù)據(jù)共享體系。建立企業(yè)的統(tǒng)一的數(shù)據(jù)管理規(guī)范、共享機制和流程,對數(shù)據(jù)進行分級分類管理,不同類別實施不同的數(shù)據(jù)共享方式和流程。
(2)數(shù)據(jù)共享管理。數(shù)據(jù)共享包括數(shù)據(jù)倉庫管理和數(shù)據(jù)共享等方面。在數(shù)據(jù)倉庫管理方面,加強數(shù)據(jù)的模型管理,并且隨著業(yè)務(wù)系統(tǒng)的變化,要及時進行變更管理,保證共享數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)的準(zhǔn)確性;在數(shù)據(jù)共享方面,分為內(nèi)部共享和對外共享,建立統(tǒng)一的數(shù)據(jù)開放共享平臺,對于內(nèi)部共享和外部共享制定相應(yīng)的共享策略,進行數(shù)據(jù)共享應(yīng)用。
(3)加強數(shù)據(jù)安全和保密管理。在數(shù)據(jù)開放共享的同時,加強數(shù)據(jù)安全管理和保密管理,利用安全技術(shù)和保密策略保證數(shù)據(jù)共享過程中的安全,另外,對于個人隱私或者保密數(shù)據(jù),要嚴(yán)格按照相關(guān)的保密要求,防止信息的泄露。
隨著大數(shù)據(jù)、物聯(lián)網(wǎng)、5G 技術(shù)的不斷應(yīng)用和數(shù)字化、智能化的發(fā)展,企業(yè)積累的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)將呈現(xiàn)爆發(fā)式增長,那么如何將數(shù)據(jù)的安全、數(shù)據(jù)治理、數(shù)據(jù)質(zhì)量和數(shù)據(jù)共享管理理念融入到日常項目管理實踐中,成為我們亟待解決的問題。本文通過對DAMA 體系的研究,對數(shù)據(jù)的架構(gòu)、匯集、共享、開發(fā)利用,以及質(zhì)量和安全管理等方面與日常項目管理進行了融合研究,提出了相關(guān)實踐應(yīng)用策略,推進數(shù)據(jù)治理體系和數(shù)據(jù)資產(chǎn)管理體系的建設(shè)和應(yīng)用。