周泓,陳釗
(國(guó)家電網(wǎng)公司西南分部,四川成都610041)
基于數(shù)據(jù)溯源圖的數(shù)據(jù)資產(chǎn)質(zhì)量評(píng)估研究
周泓,陳釗
(國(guó)家電網(wǎng)公司西南分部,四川成都610041)
隨著大數(shù)據(jù)時(shí)代的蓬勃發(fā)展,企業(yè)對(duì)數(shù)據(jù)重要性的認(rèn)識(shí)也達(dá)到了一個(gè)新的高度,數(shù)據(jù)資產(chǎn)成為了企業(yè)發(fā)展的重要戰(zhàn)略資源,越來越多的企業(yè)已經(jīng)開展常態(tài)化的專業(yè)數(shù)據(jù)管理工作。為了提升公司數(shù)據(jù)資產(chǎn)的應(yīng)用價(jià)值,數(shù)據(jù)資產(chǎn)質(zhì)量成為企業(yè)數(shù)據(jù)資產(chǎn)管理的重要指標(biāo)之一。通過數(shù)據(jù)資產(chǎn)溯源管理,確定數(shù)據(jù)資產(chǎn)形成的全過程模型,對(duì)數(shù)據(jù)資產(chǎn)質(zhì)量開展多維度評(píng)估,量化數(shù)據(jù)資產(chǎn)質(zhì)量,為企業(yè)數(shù)據(jù)資產(chǎn)管理提供一個(gè)重要參考指標(biāo)。
大數(shù)據(jù);數(shù)據(jù)資產(chǎn);常態(tài)化;數(shù)據(jù)資產(chǎn)溯源;數(shù)據(jù)資產(chǎn)質(zhì)量
信息技術(shù)的快速發(fā)展使得數(shù)據(jù)逐漸成為實(shí)現(xiàn)企業(yè)業(yè)務(wù)價(jià)值最重要的資源之一。然而隨著數(shù)據(jù)量的不斷增大,數(shù)據(jù)質(zhì)量問題也隨之而來。數(shù)據(jù)缺失、錯(cuò)誤、不一致等問題使企業(yè)對(duì)其的應(yīng)用受到阻礙,嚴(yán)重的甚至?xí)?dǎo)致企業(yè)做出錯(cuò)誤決策,損失重要價(jià)值進(jìn)而引發(fā)信任危機(jī)。
數(shù)據(jù)資產(chǎn)的本質(zhì)是作為一種經(jīng)濟(jì)資源參與企業(yè)的經(jīng)營(yíng)活動(dòng),可以減少和消除企業(yè)經(jīng)濟(jì)活動(dòng)中的風(fēng)險(xiǎn),為企業(yè)的管理控制和科學(xué)決策提供合理依據(jù),并預(yù)期給企業(yè)帶來經(jīng)濟(jì)利益。只有經(jīng)過資產(chǎn)化管理[1]、具有“可信度”[2]的數(shù)據(jù)才能形成數(shù)據(jù)資產(chǎn),并通過數(shù)據(jù)使用、重新計(jì)算、分析模型等實(shí)現(xiàn)增值。
2.1 數(shù)據(jù)、數(shù)據(jù)資源、數(shù)據(jù)資產(chǎn)
數(shù)據(jù):以文本、數(shù)字、圖形、圖像、聲音和視頻等格式對(duì)事實(shí)進(jìn)行表現(xiàn)。數(shù)據(jù)本身是“一個(gè)事實(shí)”。
數(shù)據(jù)(信息)資源:企業(yè)生產(chǎn)及管理過程中所涉及的一切文件、資料、圖表等信息的總稱。它涉及企業(yè)生產(chǎn)和經(jīng)營(yíng)活動(dòng)過程中所產(chǎn)生、獲取、處理、存儲(chǔ)、傳輸和使用的一切數(shù)據(jù)(信息)資源,貫穿于企業(yè)管理的全過程。
數(shù)據(jù)資產(chǎn):企業(yè)在運(yùn)營(yíng)活動(dòng)中形成的,由企業(yè)擁有,在數(shù)據(jù)的產(chǎn)生、獲取、處理、存儲(chǔ)、傳輸和應(yīng)用全過程可控的,并能夠給企業(yè)帶來價(jià)值的數(shù)據(jù)。
2.2 數(shù)據(jù)資產(chǎn)化
數(shù)據(jù)資產(chǎn)化是指針對(duì)數(shù)據(jù)經(jīng)過分類、描述、加工和計(jì)算等途徑實(shí)現(xiàn)數(shù)據(jù)的資源化,再對(duì)數(shù)據(jù)資源進(jìn)行核查梳理、分析、加工、識(shí)別等過程,從而實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)化。
2.3 數(shù)據(jù)資產(chǎn)化溯源
面向結(jié)構(gòu)化數(shù)據(jù),以指標(biāo)數(shù)據(jù)為基礎(chǔ),以回溯為手段,形成樹狀的數(shù)據(jù)溯源視圖。數(shù)據(jù)資產(chǎn)逐步溯源,構(gòu)建出全局?jǐn)?shù)據(jù)溯源視圖。
2.4 數(shù)據(jù)資產(chǎn)質(zhì)量監(jiān)測(cè)
針對(duì)數(shù)據(jù)資產(chǎn)溯源全過程中的節(jié)點(diǎn)進(jìn)行及時(shí)性、完整性、準(zhǔn)確性、實(shí)效性、一致性和關(guān)聯(lián)核查等多方面的監(jiān)測(cè),主要方式有技術(shù)監(jiān)測(cè)和業(yè)務(wù)監(jiān)測(cè)兩種。
3.1 構(gòu)建全景視圖
從整體角度對(duì)企業(yè)數(shù)據(jù)資源進(jìn)行的全方位、多層次、動(dòng)靜結(jié)合的描述,即以企業(yè)數(shù)據(jù)標(biāo)準(zhǔn)為基礎(chǔ)、以各應(yīng)用系統(tǒng)數(shù)據(jù)為來源,依據(jù)企業(yè)業(yè)務(wù)規(guī)劃,梳理產(chǎn)生的企業(yè)數(shù)據(jù)資源的管理、業(yè)務(wù)、技術(shù)屬性信息,以及相應(yīng)的信息化描述和展現(xiàn)。以回溯為手段,形成樹狀結(jié)構(gòu)的溯源視圖,從數(shù)據(jù)資產(chǎn)產(chǎn)生、加工、應(yīng)用全過程節(jié)點(diǎn)實(shí)現(xiàn)過程可控。
3.2 溯源過程
數(shù)據(jù)資產(chǎn)溯源作業(yè)標(biāo)準(zhǔn)方法包含業(yè)務(wù)溯源、物理溯源、結(jié)果驗(yàn)證、成果固化四個(gè)步驟。
首先,公司業(yè)務(wù)部門召集業(yè)務(wù)專家依據(jù)運(yùn)營(yíng)數(shù)據(jù)資產(chǎn)的業(yè)務(wù)涵義,從業(yè)務(wù)的角度展開溯源,分析運(yùn)營(yíng)數(shù)據(jù)資產(chǎn)的各個(gè)業(yè)務(wù)來源,確定數(shù)據(jù)資產(chǎn)形成的全過程業(yè)務(wù)模型,繪制業(yè)務(wù)溯源圖。
然后,業(yè)務(wù)系統(tǒng)建設(shè)廠商充分理解業(yè)務(wù)溯源圖,對(duì)業(yè)務(wù)溯源圖中的錄入節(jié)點(diǎn)、存儲(chǔ)節(jié)點(diǎn)、處理節(jié)點(diǎn)進(jìn)行規(guī)范化描述,填寫數(shù)據(jù)資產(chǎn)溯源的“錄入節(jié)點(diǎn)描述表”、“存儲(chǔ)節(jié)點(diǎn)描述表”、“處理節(jié)點(diǎn)描述表”。
接著對(duì)數(shù)據(jù)資產(chǎn)全過程業(yè)務(wù)模型驗(yàn)證和溯源節(jié)點(diǎn)描述信息中的物理實(shí)現(xiàn)邏輯驗(yàn)證。物理實(shí)現(xiàn)邏輯驗(yàn)證是指將溯源節(jié)點(diǎn)描述信息中的物理實(shí)現(xiàn)邏輯轉(zhuǎn)換為可執(zhí)行腳本或程序,運(yùn)行可執(zhí)行腳本或程序獲得溯源節(jié)點(diǎn)對(duì)應(yīng)數(shù)值;再將溯源節(jié)點(diǎn)對(duì)應(yīng)數(shù)值與業(yè)務(wù)系統(tǒng)中的對(duì)應(yīng)數(shù)值進(jìn)行驗(yàn)證對(duì)比;業(yè)務(wù)模型驗(yàn)證是指根據(jù)溯源圖中的業(yè)務(wù)邏輯匯總計(jì)算溯源節(jié)點(diǎn)對(duì)應(yīng)數(shù)值,反向驗(yàn)證業(yè)務(wù)邏輯的完整性。
上述兩類驗(yàn)證若是通過,則繼續(xù)“成果固化”步驟;若是溯源節(jié)點(diǎn)描述信息中的物理實(shí)現(xiàn)邏輯驗(yàn)證不通過,則需重新進(jìn)行“物理溯源”步驟,對(duì)溯源節(jié)點(diǎn)中的物理實(shí)現(xiàn)邏輯進(jìn)行修正完善;若是運(yùn)營(yíng)數(shù)據(jù)資產(chǎn)全過程業(yè)務(wù)模型驗(yàn)證不通過,則需要回到“業(yè)務(wù)溯源”步驟,對(duì)業(yè)務(wù)溯源圖進(jìn)行修正完善。
最后,進(jìn)行成果固化。主要是將溯源的成果固化到數(shù)據(jù)資產(chǎn)溯源支撐工具中,主要包括數(shù)據(jù)資產(chǎn)形成的全過程業(yè)務(wù)模型圖、“錄入節(jié)點(diǎn)描述表”、“存儲(chǔ)節(jié)點(diǎn)描述表”、“處理節(jié)點(diǎn)描述表”、溯源節(jié)點(diǎn)可執(zhí)行腳本或程序。
運(yùn)營(yíng)數(shù)據(jù)資產(chǎn)溯源支撐工具可多視角展示數(shù)據(jù)資產(chǎn)的全過程業(yè)務(wù)模型圖,雙擊業(yè)務(wù)模型圖中的溯源節(jié)點(diǎn),實(shí)時(shí)顯示節(jié)點(diǎn)規(guī)范化描述信息。圖1為數(shù)據(jù)資產(chǎn)溯源示意圖。
3.3 數(shù)據(jù)資產(chǎn)質(zhì)量分析
數(shù)據(jù)資產(chǎn)質(zhì)量主要從數(shù)據(jù)資產(chǎn)完成率、數(shù)據(jù)資產(chǎn)可信度等多個(gè)維度進(jìn)行分析。
3.3.1 數(shù)據(jù)資產(chǎn)完成率
主要包括數(shù)據(jù)資產(chǎn)臺(tái)賬完成率和數(shù)據(jù)資產(chǎn)溯源完成率。
首先對(duì)數(shù)據(jù)資產(chǎn)臺(tái)賬根據(jù)權(quán)重判斷方式進(jìn)行屬性分類,主要分為具有一票否決制的權(quán)重較大的屬性A類和利用層次分析法判斷權(quán)重的屬性B類,然后計(jì)算數(shù)據(jù)資產(chǎn)臺(tái)賬完成率=屬性A類*60%+屬性B類*40%;
圖1 數(shù)據(jù)資產(chǎn)溯源示意圖
數(shù)據(jù)資產(chǎn)溯源完成率是針對(duì)不同類型的節(jié)點(diǎn)完成率加權(quán)得出,節(jié)點(diǎn)類型主要有輸入節(jié)點(diǎn)、處理節(jié)點(diǎn)、傳輸節(jié)點(diǎn)和存儲(chǔ)節(jié)點(diǎn)四類。單個(gè)節(jié)點(diǎn)完成率包括手工和自動(dòng)。若某節(jié)點(diǎn)完成率為0,則此節(jié)點(diǎn)反推至輸入節(jié)點(diǎn)路徑(含輸入節(jié)點(diǎn))內(nèi)的全部節(jié)點(diǎn)完成率重置為0。數(shù)據(jù)資產(chǎn)溯源完成率=(完成率)/n,n指存在的節(jié)點(diǎn)總數(shù);
數(shù)據(jù)資產(chǎn)完成率=50%*數(shù)據(jù)資產(chǎn)臺(tái)賬完成率+50%*數(shù)據(jù)溯源完成率。
3.3.2 數(shù)據(jù)資產(chǎn)可信度
通過對(duì)影響數(shù)據(jù)資產(chǎn)可信度的關(guān)聯(lián)因素進(jìn)行分析,并利用層次分析法對(duì)評(píng)估項(xiàng)目進(jìn)行權(quán)重分析,從而量化數(shù)據(jù)資產(chǎn)可信度。首先對(duì)數(shù)據(jù)資產(chǎn)的各類節(jié)點(diǎn)開展數(shù)據(jù)來源溯源分析,然后對(duì)各節(jié)點(diǎn)的權(quán)重計(jì)算得出數(shù)據(jù)資產(chǎn)可信度。
在數(shù)據(jù)資產(chǎn)管理工作中,數(shù)據(jù)資產(chǎn)質(zhì)量是一個(gè)關(guān)鍵問題,直接影響了企業(yè)數(shù)據(jù)資產(chǎn)管理質(zhì)量和應(yīng)用程度。利用數(shù)據(jù)資產(chǎn)溯源,構(gòu)建數(shù)據(jù)資產(chǎn)全景視圖,結(jié)合數(shù)據(jù)資產(chǎn)形成過程,定期進(jìn)行數(shù)據(jù)資產(chǎn)質(zhì)量評(píng)估,形成量化指標(biāo),從數(shù)據(jù)資產(chǎn)的完整、準(zhǔn)確、有效、精度、無重復(fù)、冗余、可訪問、及時(shí)、明確、可用、適用等多種維度為企業(yè)數(shù)據(jù)資產(chǎn)管理提供指導(dǎo)依據(jù)。
[1]DAMA International.DAMA數(shù)據(jù)管理知識(shí)體系指南[M].馬歡,劉晨,譯.北京:清華大學(xué)出版社,2012.
[2]West D.Neural Network Credit Scoring Models[J].Computer& Operations Research,2000(27):1131-1152.
[3]王麗云.企業(yè)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的影響因素研究[J].現(xiàn)代經(jīng)濟(jì)信息,2015(12):14-20.
[4]宋麗芳,宋旭東,于學(xué)偉,等.社區(qū)信息化建設(shè)數(shù)據(jù)質(zhì)量評(píng)估模型的研究[J].微計(jì)算機(jī)信息,2010,26(4-3):11-12.
[5]黃心宇.數(shù)據(jù)質(zhì)量評(píng)價(jià)模型的建立與實(shí)現(xiàn)[J].商場(chǎng)現(xiàn)代化, 2008(8):396-397.
[6]袁滿,張雪.一種基于規(guī)則的數(shù)據(jù)質(zhì)量評(píng)價(jià)模型[J].計(jì)算機(jī)技術(shù)與發(fā)展,2013,23(3):81-89.
[7]李謙,白曉明,張林,等.供電企業(yè)數(shù)據(jù)資產(chǎn)管理與數(shù)據(jù)化運(yùn)營(yíng)[J].華東電力,2014(3):487-490.
[8]黃海潮,陳順德.電網(wǎng)企業(yè)數(shù)據(jù)資產(chǎn)全壽命周期管理研究[J].管理觀察,2015(1):62-66.
Research on Data Asset Quality Evaluation Based on Data Traceability Graph
ZHOU Hong,CHEN Zhao
(Southwest Branch of SGCC,Chengdu 610041,China)
With the vigorous development of large data age,Business awareness of the importance of the data has reached a new height,data assets has become an important strategic resource for enterprise development,more and more enterprises have carried out normalized professional data management.In order to enhance the application value of the company's data assets,the quality of data assets has become one of the important indexes of enterprise data asset management.Through data assets traceability man?agement,determine the whole process model of data asset formation,the multi-dimensional assessment of the quality of data as?sets,quantify data assets,which provides an important reference index for enterprise data asset management.
Big data,data assets,normalized,data assets traceability,quality of data asset
TP181
A
1009-3044(2017)19-0184-02
2017-05-15
周泓(1981—),高級(jí)工程師,工學(xué)碩士,從事電網(wǎng)建設(shè)運(yùn)行管理工作;陳釗(1981—),工程師,工學(xué)碩士,從事電網(wǎng)建設(shè)運(yùn)行管理工作。