国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù):發(fā)展現(xiàn)狀與未來趨勢

2020-04-22 00:35中國信息通信研究院
中國經(jīng)濟(jì)報告 2020年1期
關(guān)鍵詞:數(shù)據(jù)分析云計算大數(shù)據(jù)

中國信息通信研究院

【提??要】當(dāng)前,全球大數(shù)據(jù)正進(jìn)入加速發(fā)展時期,技術(shù)產(chǎn)業(yè)與應(yīng)用創(chuàng)新不斷邁向新高度。大數(shù)據(jù)通過數(shù)字化豐富要素供給,通過網(wǎng)絡(luò)化擴(kuò)大組織邊界,通過智能化提升產(chǎn)出效能,不僅是推進(jìn)網(wǎng)絡(luò)強國建設(shè)的重要領(lǐng)域,更是新時代加快實體經(jīng)濟(jì)質(zhì)量變革、效率變革、動力變革的戰(zhàn)略依托。本文聚焦近期大數(shù)據(jù)各領(lǐng)域的進(jìn)展和趨勢,梳理主要問題并進(jìn)行展望。在技術(shù)方面,重點探討了近兩年最新的大數(shù)據(jù)技術(shù)及其融合發(fā)展趨勢;在產(chǎn)業(yè)方面,重點討論了中國大數(shù)據(jù)產(chǎn)品的發(fā)展情況;在數(shù)據(jù)資產(chǎn)管理方面,介紹了行業(yè)數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)資產(chǎn)管理工具的最新發(fā)展情況,并著重探討了數(shù)據(jù)資產(chǎn)化的關(guān)鍵問題;在安全方面,從多種角度分析了大數(shù)據(jù)面臨的安全問題和技術(shù)工具。

【關(guān)鍵詞】??大數(shù)據(jù);數(shù)據(jù)分析;云計算

一、國際大數(shù)據(jù)發(fā)展概述

近年,全球大數(shù)據(jù)的發(fā)展仍處于活躍階段。根據(jù)國際權(quán)威機(jī)構(gòu)Statista的統(tǒng)計和預(yù)測,全球數(shù)據(jù)量在2019年有望達(dá)到41ZB?(圖1)。

2019年以來,全球大數(shù)據(jù)技術(shù)、產(chǎn)業(yè)、應(yīng)用等多方面的發(fā)展呈現(xiàn)了新的趨勢,也正在進(jìn)入新的階段。本章將對國外大數(shù)據(jù)戰(zhàn)略、技術(shù)、產(chǎn)業(yè)等領(lǐng)域的最新進(jìn)展進(jìn)行簡要敘述。

(一)大數(shù)據(jù)戰(zhàn)略持續(xù)拓展

相較于幾年前,2019年國外大數(shù)據(jù)發(fā)展在政策方面略顯平淡,只有美國的《聯(lián)邦數(shù)據(jù)戰(zhàn)略第一年度行動計劃(Federal?Data?Strategy?Year-1?Action?Plan)》草案比較受到關(guān)注。2019年6月5日,美國發(fā)布了《聯(lián)邦數(shù)據(jù)戰(zhàn)略第一年度行動計劃》草案,這個草案包含了每個機(jī)構(gòu)開展工作的具體可交付成果,以及由多個機(jī)構(gòu)共同協(xié)作推動的政府行動,旨在編纂聯(lián)邦機(jī)構(gòu)如何利用計劃、統(tǒng)計和任務(wù)支持?jǐn)?shù)據(jù)作為戰(zhàn)略資產(chǎn)來發(fā)展經(jīng)濟(jì)、提高聯(lián)邦政府的效率、促進(jìn)監(jiān)督和提高透明度。

相對于三年前頒布的《聯(lián)邦大數(shù)據(jù)研發(fā)戰(zhàn)略計劃》,美國對于數(shù)據(jù)的重視程度繼續(xù)提升,并出現(xiàn)了聚焦點從“技術(shù)”到“資產(chǎn)”的轉(zhuǎn)變,其中更是著重提到了金融數(shù)據(jù)和地理信息數(shù)據(jù)的標(biāo)準(zhǔn)統(tǒng)一問題。此外,配套文件中“共享行動:政府范圍內(nèi)的數(shù)據(jù)服務(wù)”成為亮點,針對數(shù)據(jù)跨機(jī)構(gòu)協(xié)同與共享,從執(zhí)行機(jī)構(gòu)到時間節(jié)點都進(jìn)行了戰(zhàn)略部署。

早些時候,歐洲議會通過了一項決議,敦促歐盟及其成員國創(chuàng)造一個“繁榮的數(shù)據(jù)驅(qū)動經(jīng)濟(jì)”。該決議預(yù)計,到2020年,歐盟GDP將因更好的數(shù)據(jù)使用而增加1.9%。但遺憾的是,據(jù)統(tǒng)計目前只有1.7%的公司充分利用了先進(jìn)的數(shù)字技術(shù)。

拓寬和深入大數(shù)據(jù)技術(shù)應(yīng)用是各國數(shù)據(jù)戰(zhàn)略的共識之處。據(jù)了解,美國2020年人口普查有望采用差分隱私等大數(shù)據(jù)隱私保護(hù)技術(shù)來提高對個人信息的保護(hù)。英國政府統(tǒng)計部門正在探索利用交通數(shù)據(jù),通過大數(shù)據(jù)分析及時跟蹤英國經(jīng)濟(jì)走勢,提供預(yù)警服務(wù),幫助政府進(jìn)行精準(zhǔn)決策。

(二)大數(shù)據(jù)底層技術(shù)逐步成熟

近年來,大數(shù)據(jù)底層技術(shù)發(fā)展呈現(xiàn)出逐步成熟的態(tài)勢。在大數(shù)據(jù)發(fā)展的初期,技術(shù)方案主要聚焦于解決數(shù)據(jù)“大”的問題,Apache?Hadoop定義了最基礎(chǔ)的分布式批處理架構(gòu),打破了傳統(tǒng)數(shù)據(jù)庫一體化的模式,將計算與存儲分離,聚焦于解決海量數(shù)據(jù)的低成本存儲與規(guī)?;幚?。Hadoop憑借其友好的技術(shù)生態(tài)和擴(kuò)展性優(yōu)勢,一度對傳統(tǒng)大規(guī)模并行處理(Massively?Parallel?Processor,?MPP)數(shù)據(jù)庫的市場造成影響。但當(dāng)前MPP在擴(kuò)展性方面不斷突破(2019年中國信通院大數(shù)據(jù)產(chǎn)品能力評測中,MPP大規(guī)模測試集群規(guī)模已突破512節(jié)點),使得MPP在海量數(shù)據(jù)處理領(lǐng)域又重新獲得了一席之位。

MapReduce暴露的處理效率問題以及Hadoop體系龐大復(fù)雜的運維操作,推動計算框架不斷進(jìn)行著升級演進(jìn)。隨后出現(xiàn)的Apache?Spark已逐步成為計算框架的事實標(biāo)準(zhǔn)。在解決了數(shù)據(jù)“大”的問題后,數(shù)據(jù)分析時效性的需求愈發(fā)突出,Apache?Flink、Kafka?Streams、Spark?Structured?Streaming等近年來備受關(guān)注的產(chǎn)品為分布式流處理的基礎(chǔ)框架打下了基礎(chǔ)。在此基礎(chǔ)上,大數(shù)據(jù)技術(shù)產(chǎn)品不斷分層細(xì)化,在開源社區(qū)形成了豐富的技術(shù)棧,覆蓋存儲、計算、分析、集成、管理、運維等各個方面。據(jù)統(tǒng)計,目前大數(shù)據(jù)相關(guān)開源項目已達(dá)上百個。

(三)大數(shù)據(jù)產(chǎn)業(yè)規(guī)模平穩(wěn)增長

國際機(jī)構(gòu)Statista在2019年8月發(fā)布的報告顯示,到2020年,全球大數(shù)據(jù)市場的收入規(guī)模預(yù)計將達(dá)到560億美元,較2018年的預(yù)期水平增長約33.33%,較2016年的市場收入規(guī)模翻一倍。隨著市場整體的日漸成熟和新興技術(shù)的不斷融合發(fā)展,未來大數(shù)據(jù)市場將呈現(xiàn)穩(wěn)步發(fā)展的態(tài)勢,增速維持在14%左右。在2018-2020年的預(yù)測期內(nèi),大數(shù)據(jù)市場整體的收入規(guī)模將保持每年約70億美元的增長,復(fù)合年均增長率約為15.33%(圖2)。

從細(xì)分市場來看,大數(shù)據(jù)硬件、軟件和服務(wù)的市場規(guī)模均保持較穩(wěn)定的增長,預(yù)計到2020年,三大細(xì)分市場的收入規(guī)模將分別達(dá)到150億美元(硬件)、200億美元(軟件)、210億美元(服務(wù))。具體來看,2016-2017年,軟件市場規(guī)模增速達(dá)到了37.5%,在數(shù)值上超過了傳統(tǒng)的硬件市場。隨著機(jī)器學(xué)習(xí)、高級分析算法等技術(shù)的成熟與融合,更多的數(shù)據(jù)應(yīng)用和場景正在落地,大數(shù)據(jù)軟件市場將繼續(xù)高速增長。預(yù)計在2018-2020年間,每年約有30億美元的增長規(guī)模,復(fù)合年均增長率約為19.52%。大數(shù)據(jù)相關(guān)服務(wù)的規(guī)模始終最高,預(yù)計在2018-2020年間的復(fù)合年均增長率約為14.56%。相比之下,硬件市場增速最低,但仍能保持約11.8%的復(fù)合年均增長率。從整體占比來看,軟件規(guī)模占比將逐漸增加,服務(wù)相關(guān)收益將保持平穩(wěn)發(fā)展的趨勢,軟件與服務(wù)之間的差距將不斷縮小,而硬件規(guī)模在整體的占比則逐漸減?。▓D3)。

(四)大數(shù)據(jù)企業(yè)加速整合

近兩年來,國際具有影響力的大數(shù)據(jù)公司也遭遇了一些變化。2018年10月,美國大數(shù)據(jù)技術(shù)巨頭Cloudera?和Hortonworks?宣布合并。在Hadoop領(lǐng)域,兩家公司的合并意味著“強強聯(lián)手”,而在更加廣義的大數(shù)據(jù)領(lǐng)域,則更像是“抱團(tuán)取暖”。但毫無疑問,這至少可以幫助兩家企業(yè)結(jié)束近十年的競爭,并且依靠壟斷地位早日擺脫長期虧損的窘?jīng)r。而從第三方的角度來看,這無疑會影響整個Hadoop的生態(tài)。開源大數(shù)據(jù)目前已經(jīng)成為互聯(lián)網(wǎng)企業(yè)的基礎(chǔ)設(shè)施,兩家公司合并意味著Hadoop的標(biāo)準(zhǔn)將更加統(tǒng)一,長期來看新公司的盈利能力也將大幅提升,并將更多的資源用于新技術(shù)的投入。從體量和級別上來看,新公司將基本代表Hadoop社區(qū),其他同類型企業(yè)將很難與之競爭。

2019年8月,惠普(HPE)收購大數(shù)據(jù)技術(shù)公司MapR的業(yè)務(wù)資產(chǎn),包括MapR的技術(shù)、知識產(chǎn)權(quán)以及多個領(lǐng)域的業(yè)務(wù)資源等。MapR創(chuàng)立于2009年,屬于Hadoop全球軟件發(fā)行版供應(yīng)商之一。專家普遍認(rèn)為,企業(yè)組織越來越多以云服務(wù)形式使用數(shù)據(jù)計算和分析產(chǎn)品是使得MapR需求減少的重要原因之一。用戶需求正從采購以Hadoop為代表的平臺型產(chǎn)品,轉(zhuǎn)向結(jié)合云化、智能計算后的服務(wù)型產(chǎn)品。這也意味著,全球企業(yè)級IT廠商的戰(zhàn)爭已經(jīng)進(jìn)入到了一個新階段,即滿足用戶從平臺產(chǎn)品到云化服務(wù),再到智能解決方案的整體需求。

(五)數(shù)據(jù)合規(guī)要求日益嚴(yán)格

近兩年來,各國在數(shù)據(jù)合規(guī)性方面的重視程度越來越高,但數(shù)據(jù)合規(guī)的進(jìn)程仍任重道遠(yuǎn)。2019年5月25日,旨在保護(hù)歐盟公民的個人數(shù)據(jù)、對企業(yè)的數(shù)據(jù)處理提出了嚴(yán)格要求的《通用數(shù)據(jù)保護(hù)條例》(GDPR)實施滿一周年,數(shù)據(jù)保護(hù)相關(guān)的案例與公開事件數(shù)量攀升,同時也引起了諸多爭議。

牛津大學(xué)的一項研究發(fā)現(xiàn),GDPR實施滿一年后,未經(jīng)用戶同意而設(shè)置的新聞網(wǎng)站上的Cookies數(shù)量下降了22%。歐盟EDPB的報告顯示,GDPR實施一年以來,歐盟當(dāng)局收到了約145000份數(shù)據(jù)安全相關(guān)的投訴和問題舉報;共判處5500萬歐元行政罰款。蘋果、微軟、Twitter、WhatsApp、Instagram等企業(yè)也都遭到調(diào)查或處罰。

GDPR正式實施之后,帶來了全球隱私保護(hù)立法的熱潮,并成功提升了社會各領(lǐng)域?qū)τ跀?shù)據(jù)保護(hù)的重視。例如,2020年1月起,美國加州消費者隱私法案(CCPA)也將正式生效。與GDPR類似,CCPA將對所有和美國加州居民有業(yè)務(wù)的數(shù)據(jù)商業(yè)行為進(jìn)行監(jiān)管。CCPA在適用監(jiān)管的標(biāo)準(zhǔn)上比GDPR更寬松,但是一旦滿足被監(jiān)管的標(biāo)準(zhǔn),違法企業(yè)受到的懲罰更大。2019年8月份,IAPP(世界上信息隱私方面的專業(yè)協(xié)會)OneTrust(第三方風(fēng)險技術(shù)平臺)對部分美國企業(yè)進(jìn)行了CCPA準(zhǔn)備度調(diào)查,結(jié)果顯示,74%的受訪者認(rèn)為他們的企業(yè)應(yīng)該遵守CCPA,但只有大約2%的受訪者認(rèn)為他們的企業(yè)已經(jīng)完全做好了應(yīng)對CCPA的準(zhǔn)備。除加州CCPA外,更多的法案正在美國紐約州等多個州陸續(xù)生效。

二、融合成為大數(shù)據(jù)技術(shù)發(fā)展的重要特征

當(dāng)前,大數(shù)據(jù)體系的底層技術(shù)框架已基本成熟。大數(shù)據(jù)技術(shù)正逐步成為支撐型的基礎(chǔ)設(shè)施,其發(fā)展方向也開始向提升效率轉(zhuǎn)變,逐步向個性化的上層應(yīng)用聚焦,技術(shù)的融合趨勢愈發(fā)明顯。本章將針對當(dāng)前大數(shù)據(jù)技術(shù)的幾大融合趨勢進(jìn)行探討。

(一)算力融合:多樣性算力提升整體效率

隨著大數(shù)據(jù)應(yīng)用的逐步深入,場景愈發(fā)豐富,數(shù)據(jù)平臺開始承載人工智能、物聯(lián)網(wǎng)、視頻轉(zhuǎn)碼、復(fù)雜分析、高性能計算等多樣性的任務(wù)負(fù)載。同時,數(shù)據(jù)復(fù)雜度不斷提升,以高維矩陣運算為代表的新型計算范式具有粒度更細(xì)、并行更強、高內(nèi)存占用、高帶寬需求、低延遲高實時性等特點,以CPU為底層硬件的傳統(tǒng)大數(shù)據(jù)技術(shù)無法有效滿足新業(yè)務(wù)需求,出現(xiàn)性能瓶頸。

當(dāng)前,以CPU為調(diào)度核心,協(xié)同GPU、FPGA、ASIC及各類用于AI加速“xPU”的異構(gòu)算力平臺成為行業(yè)熱點解決方案,以GPU為代表的計算加速單元能夠極大提升新業(yè)務(wù)計算效率。不同硬件體系融合存在開發(fā)工具相互獨立、編程語言及接口體系不同、軟硬件協(xié)同缺失等工程問題。為此,產(chǎn)業(yè)界試圖從統(tǒng)一軟件開發(fā)平臺和開發(fā)工具的層面來實現(xiàn)對不同硬件底層的兼容,例如Intel公司正在設(shè)計支持跨多架構(gòu)(包括CPU、GPU、FPGA和其他加速器)開發(fā)的編程模型oneAPI,它提供一套統(tǒng)一的編程語言和開發(fā)工具集,來實現(xiàn)對多樣性算力的調(diào)用,從根本上簡化開發(fā)模式,針對異構(gòu)計算形成一套全新的開放標(biāo)準(zhǔn)。

(二)流批融合:平衡計算性價比的最優(yōu)解

流處理能夠有效處理即時變化的信息,從而反映出信息熱點的實時動態(tài)變化。而離線批處理則更能夠體現(xiàn)歷史數(shù)據(jù)的累加反饋??紤]到對于實時計算需求和計算資源之間的平衡,業(yè)界很早就有了lambda架構(gòu)的理論來支撐批處理和流處理共同存在的計算場景。隨著技術(shù)架構(gòu)的演進(jìn),流批融合計算正在成為趨勢,并不斷在向更實時更高效的計算推進(jìn),以支撐更豐富的大數(shù)據(jù)處理需求。

流計算的產(chǎn)生來源于對數(shù)據(jù)加工時效性的嚴(yán)苛要求。數(shù)據(jù)的價值隨時間流逝而降低時,我們就必須在數(shù)據(jù)產(chǎn)生后盡可能快的對其進(jìn)行處理,比如實時監(jiān)控、風(fēng)控預(yù)警等。早期流計算開源框架的典型工具是Storm,雖然它是逐條處理的典型流計算模式,但并不能滿足“有且僅有一次(Exactly-once)”的處理機(jī)制。之后的Heron在Storm上做了很多改進(jìn),但相應(yīng)的社區(qū)并不活躍。同期的Spark在流計算方面先后推出了Spark?Streaming和Structured?Streaming,以微批處理的思想實現(xiàn)流式計算。而近年來出現(xiàn)的Apache?Flink,則使用了流處理的思想來實現(xiàn)批處理,很好地實現(xiàn)了流批融合的計算,國內(nèi)包括阿里、騰訊、百度、字節(jié)跳動,國外包括Uber、Lyft、Netflix等公司都是Flink的使用者。2017年由伯克利大學(xué)AMPLab開源的Ray框架也有相類似的思想,由一套引擎來融合多種計算模式,螞蟻金服基于此框架正在進(jìn)行金融級在線機(jī)器學(xué)習(xí)的實踐。

(三)TA融合:混合事務(wù)/分析支撐即時決策

TA融合是指事務(wù)(Transaction)與分析(Analysis)的融合機(jī)制。在數(shù)據(jù)驅(qū)動精細(xì)化運營的今天,海量實時的數(shù)據(jù)分析需求無法避免。分析和業(yè)務(wù)是強關(guān)聯(lián)的,但由于這兩類數(shù)據(jù)庫在數(shù)據(jù)模型、行列存儲模式和響應(yīng)效率等方面的區(qū)別,通常會造成數(shù)據(jù)的重復(fù)存儲。事務(wù)系統(tǒng)中的業(yè)務(wù)數(shù)據(jù)庫只能通過定時任務(wù)同步導(dǎo)入分析系統(tǒng),這就導(dǎo)致了數(shù)據(jù)時效性不足,無法實時地進(jìn)行決策分析。

混合事務(wù)/分析處理(HTAP)是Gartner提出的一個架構(gòu),它的設(shè)計理念是為了打破事務(wù)和分析之間的“墻”,實現(xiàn)在單一的數(shù)據(jù)源上不加區(qū)分的處理事務(wù)和分析任務(wù)。這種融合的架構(gòu)具有明顯的優(yōu)勢,可以避免頻繁的數(shù)據(jù)搬運操作給系統(tǒng)帶來的額外負(fù)擔(dān),減少數(shù)據(jù)重復(fù)存儲帶來的成本,從而及時高效地對最新業(yè)務(wù)操作產(chǎn)生的數(shù)據(jù)進(jìn)行分析。

(四)模塊融合:一站式數(shù)據(jù)能力復(fù)用平臺

大數(shù)據(jù)的工具和技術(shù)棧已經(jīng)相對成熟,大公司在實戰(zhàn)經(jīng)驗中圍繞工具與數(shù)據(jù)的生產(chǎn)鏈條、數(shù)據(jù)的管理和應(yīng)用等逐漸形成了能力集合,并通過這一概念來統(tǒng)一數(shù)據(jù)資產(chǎn)的視圖和標(biāo)準(zhǔn),提供通用數(shù)據(jù)的加工、管理和分析能力。

數(shù)據(jù)能力集成的趨勢打破了原有企業(yè)內(nèi)的復(fù)雜數(shù)據(jù)結(jié)構(gòu),使數(shù)據(jù)和業(yè)務(wù)更貼近,并能更快地使用數(shù)據(jù)驅(qū)動決策。主要針對性地解決三個問題:一是提高數(shù)據(jù)獲取的效率;二是打通數(shù)據(jù)共享的通道;三是提供統(tǒng)一的數(shù)據(jù)開發(fā)能力。這樣的“企業(yè)級數(shù)據(jù)能力復(fù)用平臺”是一個由多種工具和能力組合而成的數(shù)據(jù)應(yīng)用引擎、數(shù)據(jù)價值化的加工廠,來連接下層的數(shù)據(jù)和上層的數(shù)據(jù)應(yīng)用團(tuán)隊,從而形成敏捷的數(shù)據(jù)驅(qū)動精細(xì)化運營的模式。阿里巴巴提出的“中臺”概念和華為公司提出的“數(shù)據(jù)基礎(chǔ)設(shè)施”概念都是模塊融合趨勢的印證。

(五)云數(shù)融合:云化趨勢降低技術(shù)使用門檻

大數(shù)據(jù)基礎(chǔ)設(shè)施向云上遷移是一個重要的趨勢。各大云廠商均開始提供各類大數(shù)據(jù)產(chǎn)品以滿足用戶需求,紛紛構(gòu)建自己的云上數(shù)據(jù)產(chǎn)品。早期的云化產(chǎn)品大部分是對已有大數(shù)據(jù)產(chǎn)品的云化改造,現(xiàn)在,越來越多的大數(shù)據(jù)產(chǎn)品從設(shè)計之初就遵循了云原生的概念進(jìn)行開發(fā),生于云長于云,更適合云上生態(tài)。

向云化解決方案演進(jìn)的最大優(yōu)點是用戶不用再操心如何維護(hù)底層的硬件和網(wǎng)絡(luò),能夠更專注于數(shù)據(jù)和業(yè)務(wù)邏輯,在很大程度上降低了大數(shù)據(jù)技術(shù)的學(xué)習(xí)成本和使用門檻。

(六)數(shù)智融合:數(shù)據(jù)與智能多方位深度整合

大數(shù)據(jù)與人工智能的融合主要體現(xiàn)在大數(shù)據(jù)平臺的智能化與數(shù)據(jù)治理的智能化。

智能的平臺:用智能化的手段來分析數(shù)據(jù)是釋放數(shù)據(jù)價值高階之路,但用戶往往不希望在兩個平臺間不斷的搬運數(shù)據(jù),這促成了大數(shù)據(jù)平臺和機(jī)器學(xué)習(xí)平臺深度整合的趨勢,大數(shù)據(jù)平臺在支持機(jī)器學(xué)習(xí)算法之外,還將支持更多的AI類應(yīng)用。Databricks為數(shù)據(jù)科學(xué)家提供一站式的分析平臺Data?Science?Workspace,Cloudera?也推出了相應(yīng)的分析平臺Cloudera?Data?Science?Workbench。2019年底,阿里巴巴基于Flink開源了機(jī)器學(xué)習(xí)算法平臺Alink,并已在阿里巴巴搜索、推薦、廣告等核心實時在線業(yè)務(wù)中有廣泛實踐。

智能的數(shù)據(jù)治理:數(shù)據(jù)治理的輸出是人工智能的輸入,即經(jīng)過治理后的大數(shù)據(jù)。AI數(shù)據(jù)治理,是通過智能化的數(shù)據(jù)治理使數(shù)據(jù)變得智能:通過智能元數(shù)據(jù)感知和敏感數(shù)據(jù)自動識別,對數(shù)據(jù)自動分級分類,形成全局統(tǒng)一的數(shù)據(jù)視圖。通過智能化的數(shù)據(jù)清洗和關(guān)聯(lián)分析,把關(guān)數(shù)據(jù)質(zhì)量,建立數(shù)據(jù)血緣關(guān)系。數(shù)據(jù)能夠自動具備類型、級別、血緣等標(biāo)簽,在降低數(shù)據(jù)治理復(fù)雜性和成本的同時,得到智能的數(shù)據(jù)。

三、大數(shù)據(jù)產(chǎn)業(yè)蓬勃發(fā)展

近年來,中國大數(shù)據(jù)產(chǎn)業(yè)蓬勃發(fā)展,融合應(yīng)用不斷深化,數(shù)字經(jīng)濟(jì)量質(zhì)提升,對經(jīng)濟(jì)社會的創(chuàng)新驅(qū)動、融合帶動作用顯著增強。本章將從政策環(huán)境、主管機(jī)構(gòu)、產(chǎn)品生態(tài)、行業(yè)應(yīng)用等方面對中國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的態(tài)勢進(jìn)行簡要分析。

(一)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展政策環(huán)境日益完善

產(chǎn)業(yè)發(fā)展離不開政策支撐。中國政府高度重視大數(shù)據(jù)的發(fā)展。自2014年以來,中國國家大數(shù)據(jù)戰(zhàn)略的謀篇布局經(jīng)歷了四個不同階段。

1.預(yù)熱階段:2014年3月,“大數(shù)據(jù)”一詞首次寫入政府工作報告,為中國大數(shù)據(jù)發(fā)展的政策環(huán)境搭建開始預(yù)熱。從這一年起,“大數(shù)據(jù)”逐漸成為各級政府和社會各界的關(guān)注熱點,中央政府開始提供積極的支持政策與適度寬松的發(fā)展環(huán)境,為大數(shù)據(jù)發(fā)展創(chuàng)造機(jī)遇。

2.起步階段:2015年8月31日,國務(wù)院正式印發(fā)了《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》(國發(fā)〔2015〕50號),成為中國發(fā)展大數(shù)據(jù)的首部戰(zhàn)略性指導(dǎo)文件,對包括大數(shù)據(jù)產(chǎn)業(yè)在內(nèi)的大數(shù)據(jù)整體發(fā)展作出了部署,體現(xiàn)出國家層面對大數(shù)據(jù)發(fā)展的頂層設(shè)計和統(tǒng)籌布局。

3.落地階段:《十三五規(guī)劃綱要》的公布標(biāo)志著國家大數(shù)據(jù)戰(zhàn)略的正式提出,彰顯了中央對于大數(shù)據(jù)戰(zhàn)略的重視。2016年12月,工信部發(fā)布《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016-2020年)》,為大數(shù)據(jù)產(chǎn)業(yè)發(fā)展奠定了重要的基礎(chǔ)。

4.深化階段:隨著國內(nèi)大數(shù)據(jù)迎來全面良好的發(fā)展態(tài)勢,國家大數(shù)據(jù)戰(zhàn)略也開始走向深化階段。2017年10月,黨的十九大報告中提出推動大數(shù)據(jù)與實體經(jīng)濟(jì)深度融合,為大數(shù)據(jù)產(chǎn)業(yè)的未來發(fā)展指明方向。12月,中央政治局就實施國家大數(shù)據(jù)戰(zhàn)略進(jìn)行了集體學(xué)習(xí)。2019年3月,政府工作報告第六次提到“大數(shù)據(jù)”,并且有多項任務(wù)與大數(shù)據(jù)密切相關(guān)。

自2015年國務(wù)院發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》系統(tǒng)性部署大數(shù)據(jù)發(fā)展工作以來,各地陸續(xù)出臺促進(jìn)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的規(guī)劃、行動計劃和指導(dǎo)意見等文件。截至目前,除港澳臺外全國31個省級單位均已發(fā)布了推進(jìn)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的相關(guān)文件??梢哉f,中國各地推進(jìn)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的設(shè)計已經(jīng)基本完成,陸續(xù)進(jìn)入了落實階段。梳理31個省級行政單位的典型大數(shù)據(jù)產(chǎn)業(yè)政策可以看出,大部分?。▍^(qū)、市)的大數(shù)據(jù)政策集中發(fā)布于2016年至2017年。而在近兩年發(fā)布的政策中,更多的地方將新一代信息技術(shù)整體作為考量,并加入了人工智能、數(shù)字經(jīng)濟(jì)等內(nèi)容,進(jìn)一步地拓展了大數(shù)據(jù)的外延。同時,各地在頒布大數(shù)據(jù)政策時,除注重大數(shù)據(jù)產(chǎn)業(yè)的推進(jìn)外,也在更多地關(guān)注產(chǎn)業(yè)數(shù)字化和政務(wù)服務(wù)等方面,這也體現(xiàn)出了大數(shù)據(jù)與行業(yè)應(yīng)用結(jié)合及政務(wù)數(shù)據(jù)共享開放近年來取得的進(jìn)展。

醫(yī)療健康方面,醫(yī)療大數(shù)據(jù)成為2019年大數(shù)據(jù)應(yīng)用的熱點方向。2018年7月頒布的《國家健康醫(yī)療大數(shù)據(jù)標(biāo)準(zhǔn)、安全和服務(wù)管理辦法》為健康行業(yè)大數(shù)據(jù)服務(wù)指導(dǎo)了方向。電子病歷、個性化診療、醫(yī)療知識圖譜、臨床決策支持系統(tǒng)、藥品器械研發(fā)等成為行業(yè)熱點。

除以上行業(yè)之外,教育、文化、旅游等各行各業(yè)的大數(shù)據(jù)應(yīng)用也都在快速發(fā)展。中國大數(shù)據(jù)的行業(yè)應(yīng)用更加廣泛,正加速滲透到經(jīng)濟(jì)社會的方方面面。

四、數(shù)據(jù)資產(chǎn)化步伐穩(wěn)步推進(jìn)

在黨的十九屆四中全會上,中央首次公開提出“健全勞動、資本、土地、知識、技術(shù)、管理和數(shù)據(jù)等生產(chǎn)要素按貢獻(xiàn)參與分配的機(jī)制”?。這是中央首次在公開場合提出數(shù)據(jù)可作為生產(chǎn)要素按貢獻(xiàn)參與分配,反映了隨著經(jīng)濟(jì)活動數(shù)字化轉(zhuǎn)型加快,數(shù)據(jù)對提高生產(chǎn)效率的乘數(shù)作用凸顯,成為最具時代特征新生產(chǎn)要素的重要變化。

(一)數(shù)據(jù):從資源到資產(chǎn)

“數(shù)據(jù)資產(chǎn)”這一概念是由信息資源和數(shù)據(jù)資源的概念逐漸演變而來的。信息資源是在20世紀(jì)70年代計算機(jī)科學(xué)快速發(fā)展的背景下產(chǎn)生的,信息被視為與人力資源、物質(zhì)資源、財務(wù)資源和自然資源同等重要的資源,高效、經(jīng)濟(jì)地管理組織中的信息資源是非常必要的。數(shù)據(jù)資源的概念是在20世紀(jì)90年代伴隨著政府和企業(yè)的數(shù)字化轉(zhuǎn)型而產(chǎn)生,是有含義的數(shù)據(jù)集結(jié)到一定規(guī)模后形成的資源。數(shù)據(jù)資產(chǎn)在21世紀(jì)初大數(shù)據(jù)技術(shù)的興起背景下產(chǎn)生,并隨著數(shù)據(jù)管理、數(shù)據(jù)應(yīng)用和數(shù)字經(jīng)濟(jì)的發(fā)展而普及。

中國信通院在2017年將“數(shù)據(jù)資產(chǎn)”定義為“由企業(yè)擁有或者控制的,能夠為企業(yè)帶來未來經(jīng)濟(jì)利益的,以一定方式記錄的數(shù)據(jù)資源”。這一概念強調(diào)了數(shù)據(jù)具備的“預(yù)期給會計主體帶來經(jīng)濟(jì)利益”的資產(chǎn)特征。

(二)數(shù)據(jù)資產(chǎn)管理理論體系仍在發(fā)展

數(shù)據(jù)管理的概念是伴隨著20世紀(jì)80年代數(shù)據(jù)隨機(jī)存儲技術(shù)和數(shù)據(jù)庫技術(shù)的使用而誕生的,主要指在計算機(jī)系統(tǒng)中的數(shù)據(jù)可以被方便地存儲和訪問。經(jīng)過40年的發(fā)展,數(shù)據(jù)管理的理論體系主要形成了國際數(shù)據(jù)管理協(xié)會(DAMA)、IBM和數(shù)據(jù)管控機(jī)構(gòu)(DGI)所提出的三個流派,如表1所示。

然而,以上三種理論體系都是大數(shù)據(jù)時代之前的產(chǎn)物,其視角還是將數(shù)據(jù)作為信息來管理,更多的是為了滿足監(jiān)管要求和企業(yè)考核的目的,并沒有從數(shù)據(jù)價值釋放的維度來考慮。

在數(shù)據(jù)資產(chǎn)化背景下,數(shù)據(jù)資產(chǎn)管理是在數(shù)據(jù)管理基礎(chǔ)上的進(jìn)一步發(fā)展,可以視作數(shù)據(jù)管理的“升級版”。主要區(qū)別表現(xiàn)為以下三方面。一是管理視角不同,數(shù)據(jù)管理主要關(guān)注的是如何解決問題數(shù)據(jù)帶來的損失,而數(shù)據(jù)資產(chǎn)管理則關(guān)注如何利用數(shù)據(jù)資產(chǎn)為企業(yè)帶來價值,需要基于數(shù)據(jù)資產(chǎn)的成本、收益來開展數(shù)據(jù)價值管理。二是管理職能不同,傳統(tǒng)數(shù)據(jù)管理的管理職能包含數(shù)據(jù)標(biāo)準(zhǔn)管理、數(shù)據(jù)質(zhì)量管理、元數(shù)據(jù)管理、主數(shù)據(jù)管理、數(shù)據(jù)模型管理、數(shù)據(jù)安全管理等,而數(shù)據(jù)資產(chǎn)管理針對不同的應(yīng)用場景和大數(shù)據(jù)平臺建設(shè)情況,增加了數(shù)據(jù)價值管理和數(shù)據(jù)共享管理等職能。三是組織架構(gòu)不同,在“數(shù)據(jù)資源管理轉(zhuǎn)向數(shù)據(jù)資產(chǎn)管理”的理念影響下,相應(yīng)的組織架構(gòu)和管理制度也有所變化,需要有更專業(yè)的管理隊伍和更細(xì)致的管理制度來確保數(shù)據(jù)資產(chǎn)管理的流程性、安全性和有效性。

(三)各行業(yè)積極實踐數(shù)據(jù)資產(chǎn)管理

各行業(yè)實踐數(shù)據(jù)資產(chǎn)管理普遍經(jīng)歷3-4個階段。最初,行業(yè)數(shù)據(jù)資產(chǎn)管理主要是為了解決報表和經(jīng)營分析的準(zhǔn)確性,并通過建立數(shù)據(jù)倉庫實現(xiàn)。隨后,行業(yè)數(shù)據(jù)資產(chǎn)管理的目的是治理數(shù)據(jù),管理對象由分析域延伸到生產(chǎn)域,并在數(shù)據(jù)庫中開展數(shù)據(jù)標(biāo)準(zhǔn)管理和數(shù)據(jù)質(zhì)量管理。隨著大數(shù)據(jù)技術(shù)的發(fā)展,企業(yè)數(shù)據(jù)逐步匯總到大數(shù)據(jù)平臺,形成了數(shù)據(jù)采集、計算、加工、分析等配套工具,建立了元數(shù)據(jù)管理、數(shù)據(jù)共享、數(shù)據(jù)安全保護(hù)等機(jī)制,并開展了數(shù)據(jù)創(chuàng)新應(yīng)用。而目前,許多行業(yè)的數(shù)據(jù)資產(chǎn)管理已經(jīng)進(jìn)入到數(shù)據(jù)資產(chǎn)運營階段,數(shù)據(jù)成為了企業(yè)核心的生產(chǎn)要素,不僅滿足企業(yè)內(nèi)部各項業(yè)務(wù)創(chuàng)新,還逐漸成為服務(wù)企業(yè)外部的數(shù)據(jù)產(chǎn)品。企業(yè)也積極開展如數(shù)據(jù)管理能力成熟度模型(DCMM)等數(shù)據(jù)管理能力評估工作,不斷提升數(shù)據(jù)資產(chǎn)管理能力。

金融、電信等行業(yè)普遍在2000年至2010年間就開始了數(shù)據(jù)倉庫建設(shè)(簡稱數(shù)倉建設(shè)),并將數(shù)據(jù)治理范圍逐步擴(kuò)展到生產(chǎn)域,建立了比較完善的數(shù)據(jù)治理體系。2010年后通過引入大數(shù)據(jù)平臺,企業(yè)實現(xiàn)了數(shù)據(jù)的匯聚,并逐漸向數(shù)據(jù)湖發(fā)展,內(nèi)部的數(shù)據(jù)應(yīng)用較為完善,不少企業(yè)逐漸在探索數(shù)據(jù)對外運營和服務(wù)。

(四)數(shù)據(jù)資產(chǎn)管理工具百花齊放

數(shù)據(jù)資產(chǎn)管理工具是數(shù)據(jù)資產(chǎn)管理工作落地的重要手段。由于大數(shù)據(jù)技術(shù)棧中開源軟件的缺失,數(shù)據(jù)資產(chǎn)管理的技術(shù)發(fā)展沒有可參考的模板,工具開發(fā)者多從數(shù)據(jù)資產(chǎn)管理實踐與項目中設(shè)計工具架構(gòu),各企業(yè)數(shù)據(jù)資產(chǎn)管理需求的差異化使得數(shù)據(jù)資產(chǎn)管理工具的形態(tài)各異。因此,數(shù)據(jù)資產(chǎn)管理工具市場呈現(xiàn)百花齊放的狀態(tài)。數(shù)據(jù)資產(chǎn)管理工具可以是多個工具的集成,并以模塊化的形式集中于數(shù)據(jù)管理平臺。

元數(shù)據(jù)管理工具、數(shù)據(jù)標(biāo)準(zhǔn)管理工具、數(shù)據(jù)質(zhì)量管理工具是數(shù)據(jù)資產(chǎn)管理工具的核心,數(shù)據(jù)價值工具是數(shù)據(jù)資產(chǎn)化的有力保障。中國信通院對數(shù)據(jù)管理平臺的測試結(jié)果顯示,數(shù)據(jù)管理平臺對于元數(shù)據(jù)管理工具、數(shù)據(jù)標(biāo)準(zhǔn)管理工具和數(shù)據(jù)質(zhì)量管理工具的覆蓋率達(dá)到了100%,這些工具通過追蹤記錄數(shù)據(jù)、標(biāo)準(zhǔn)化數(shù)據(jù)、稽核數(shù)據(jù)的關(guān)鍵活動,有效地管理了數(shù)據(jù),提升了數(shù)據(jù)的可用性。與此同時,主數(shù)據(jù)管理工具和數(shù)據(jù)模型管理工具的覆蓋率均低于20%,其中主數(shù)據(jù)管理多以解決方案的方式提供服務(wù),而數(shù)據(jù)模型管理多在元數(shù)據(jù)管理中實現(xiàn),或以獨立工具在設(shè)計數(shù)據(jù)庫或數(shù)據(jù)倉庫階段完成。超過80%的數(shù)據(jù)價值工具以直接提供數(shù)據(jù)源的方式進(jìn)行數(shù)據(jù)服務(wù),其它的數(shù)據(jù)服務(wù)方式包括數(shù)據(jù)源組合、數(shù)據(jù)可視化和數(shù)據(jù)算法模型等。超過95%的數(shù)據(jù)價值工具動態(tài)展示數(shù)據(jù)的分布應(yīng)用和存儲計算情況,但僅有不到10%的工具量化數(shù)據(jù)價值,并提供數(shù)據(jù)增值方案。

未來,數(shù)據(jù)資產(chǎn)管理工具將向智能化和敏捷化發(fā)展,并以自助服務(wù)分析的方式深化數(shù)據(jù)價值。Gartner在2019年關(guān)于分析與商務(wù)智能軟件市場的調(diào)研報告中顯示,該市場在2018年增長了11.7%,而基于自助服務(wù)分析的現(xiàn)代商務(wù)智能和數(shù)據(jù)科學(xué)平臺分別增長了23.3%和19%。隨著數(shù)據(jù)量的增加和數(shù)據(jù)應(yīng)用場景的豐富,數(shù)據(jù)間的關(guān)系變得更加復(fù)雜,問題數(shù)據(jù)也隱藏于數(shù)據(jù)湖中難以被發(fā)覺。智能化的探索梳理結(jié)構(gòu)化數(shù)據(jù)間、非結(jié)構(gòu)化數(shù)據(jù)間的關(guān)系將節(jié)省巨大的人力,快速發(fā)現(xiàn)并處理問題數(shù)據(jù)也將極大的提升數(shù)據(jù)的可用性。在數(shù)據(jù)交易市場尚未成熟的情況下,通過擴(kuò)展數(shù)據(jù)使用者的范圍,提升數(shù)據(jù)使用者挖掘數(shù)據(jù)價值的能力,將最大限度地開發(fā)和釋放數(shù)據(jù)價值。

(五)數(shù)據(jù)資產(chǎn)化面臨諸多挑戰(zhàn)

目前,困擾數(shù)據(jù)資產(chǎn)化的關(guān)鍵問題主要包括數(shù)據(jù)確權(quán)困難、數(shù)據(jù)估值困難和數(shù)據(jù)交易市場尚未成熟。

1.數(shù)據(jù)確權(quán)困難。明確數(shù)據(jù)權(quán)屬是數(shù)據(jù)資產(chǎn)化的前提,但目前在數(shù)據(jù)權(quán)利主體以及權(quán)力分配上存在諸多爭議。數(shù)據(jù)權(quán)不同于傳統(tǒng)物權(quán)。物權(quán)的重要特征之一是對物的直接支配,但數(shù)據(jù)權(quán)在數(shù)據(jù)的全生命周期中有不同的支配主體,有的數(shù)據(jù)產(chǎn)生之初由其提供者支配,有的產(chǎn)生之初便被數(shù)據(jù)收集人支配(如微信聊天內(nèi)容、電商消費數(shù)據(jù)、物流數(shù)據(jù)等);在數(shù)據(jù)處理階段被各類數(shù)據(jù)主體所支配。原始數(shù)據(jù)只是大數(shù)據(jù)產(chǎn)業(yè)的基礎(chǔ),其價值屬性遠(yuǎn)低于集合數(shù)據(jù)為代表的增值數(shù)據(jù)所產(chǎn)生的價值。

因此,法律專家們傾向于將數(shù)據(jù)的權(quán)屬分開,即不探討整體數(shù)據(jù)權(quán),而是從管理權(quán)、使用權(quán)、所有權(quán)等維度進(jìn)行探討。而由于數(shù)據(jù)從法律上目前尚沒有被賦予資產(chǎn)的屬性,所以數(shù)據(jù)所有權(quán)、使用權(quán)、管理權(quán)、交易權(quán)等權(quán)益沒有被相關(guān)的法律充分認(rèn)同和明確界定。數(shù)據(jù)也尚未像商標(biāo)、專利一樣,有明確的權(quán)利申請途徑、權(quán)利保護(hù)方式等,對于數(shù)據(jù)的法定權(quán)利,尚未有完整的法律保護(hù)體系。

2.數(shù)據(jù)估值困難。影響數(shù)據(jù)資產(chǎn)價值的因素主要有質(zhì)量、應(yīng)用和風(fēng)險三個維度。質(zhì)量是決定數(shù)據(jù)資產(chǎn)價值的基礎(chǔ),合理評估數(shù)據(jù)的質(zhì)量水平,才能對數(shù)據(jù)的應(yīng)用價值進(jìn)行準(zhǔn)確預(yù)測;應(yīng)用是數(shù)據(jù)資產(chǎn)形成價值的方式,數(shù)據(jù)與應(yīng)用場景結(jié)合才能貢獻(xiàn)經(jīng)濟(jì)價值;風(fēng)險則是指法律和道德等方面存在的限制(見表2)。

目前,常用的數(shù)據(jù)資產(chǎn)估值方法主要有成本法、收益法和市場法三類。成本法從資產(chǎn)的重置角度出發(fā),重點考慮資產(chǎn)價值與重新獲取或建立該資產(chǎn)所需成本之間的相關(guān)程度;收益法基于目標(biāo)資產(chǎn)的預(yù)期應(yīng)用場景,通過未來產(chǎn)生的經(jīng)濟(jì)效益的折現(xiàn)來反映數(shù)據(jù)資產(chǎn)在投入使用后的收益能力,而根據(jù)衡量無形資產(chǎn)經(jīng)濟(jì)效益的不同方法又可具體分為權(quán)利金節(jié)省法、多期超額收益法和增量收益法;市場法則是在相同或相似資產(chǎn)的市場可比案例的交易價格的基礎(chǔ)上,對差異因素進(jìn)行調(diào)整,以此反映數(shù)據(jù)資產(chǎn)的市場價值。

評估數(shù)據(jù)資產(chǎn)的價值需要考慮多方面因素,數(shù)據(jù)的質(zhì)量水平、不同的應(yīng)用場景和特定的法律道德限制均對數(shù)據(jù)資產(chǎn)價值有所影響。雖然目前已有從不同角度出發(fā)的數(shù)據(jù)資產(chǎn)估值方法,但在實際應(yīng)用中均存在不同的問題,有其適用性的限制。構(gòu)建成熟的數(shù)據(jù)資產(chǎn)評價體系,還需要以現(xiàn)有方法為基礎(chǔ)框架,進(jìn)一步探索在特定領(lǐng)域和具體案例中的適配方法。

3.數(shù)據(jù)交易市場尚未成熟。2014年以來,國內(nèi)出現(xiàn)了一批數(shù)據(jù)交易平臺,各地方政府也成立了數(shù)據(jù)交易機(jī)構(gòu),包括貴陽大數(shù)據(jù)交易所、長江大數(shù)據(jù)交易中心、上海數(shù)據(jù)交易中心等。同時,互聯(lián)網(wǎng)領(lǐng)軍企業(yè)也在積極探索新的數(shù)據(jù)流通機(jī)制,提供了行業(yè)洞察、營銷支持、輿情分析、引擎推薦、API數(shù)據(jù)市場等數(shù)據(jù)服務(wù),并針對不同的行業(yè)提出了相應(yīng)的解決方案。

但是,由于數(shù)據(jù)權(quán)屬和數(shù)據(jù)估值的限制,以及數(shù)據(jù)交易政策和監(jiān)管的缺失等因素,目前國內(nèi)的數(shù)據(jù)交易市場盡管在數(shù)據(jù)服務(wù)方式上有所豐富,卻發(fā)展依然面臨諸多困難,阻礙了數(shù)據(jù)資產(chǎn)化的進(jìn)程。主要體現(xiàn)在如下兩點。一是市場缺乏信任機(jī)制,技術(shù)服務(wù)方、數(shù)據(jù)提供商、數(shù)據(jù)交易中介等可能會私下緩存并對外共享、交易數(shù)據(jù),數(shù)據(jù)使用企業(yè)不按協(xié)議要求私自留存、復(fù)制甚至轉(zhuǎn)賣數(shù)據(jù)的現(xiàn)象普遍存在。中國各大數(shù)據(jù)交易平臺并未形成統(tǒng)一的交易流程,甚至有些交易平臺沒有完整的數(shù)據(jù)交易規(guī)范,使得數(shù)據(jù)交易存在很大風(fēng)險。二是缺乏良性互動的數(shù)據(jù)交易生態(tài)體系。數(shù)據(jù)交易中所涉及的采集、傳輸、匯聚活動日益頻繁,相應(yīng)的,個人隱私、商業(yè)機(jī)密等一系列安全問題也日益突出,亟需建立包括監(jiān)管機(jī)構(gòu)和社會組織等多方參與的,法律法規(guī)和技術(shù)標(biāo)準(zhǔn)多要素協(xié)同的,覆蓋數(shù)據(jù)生產(chǎn)流通全過程和數(shù)據(jù)全生命周期管理的數(shù)據(jù)交易生態(tài)體系。

五、數(shù)據(jù)安全合規(guī)要求不斷提升

2019年以來,大數(shù)據(jù)安全合規(guī)方面不斷有事件曝出。2019年9月6日,位于杭州的大數(shù)據(jù)風(fēng)控平臺杭州魔蝎數(shù)據(jù)科技有限公司被警方控制,高管被帶走,相關(guān)服務(wù)暫時癱瘓。同日,另一家提供大數(shù)據(jù)風(fēng)控服務(wù)的新顏科技人工智能科技有限公司高管被帶走協(xié)助調(diào)查。以兩平臺被查為開端,短短一周內(nèi),多家征信企業(yè)分別有人被警方帶走調(diào)查,市場紛紛猜測是否與爬蟲業(yè)務(wù)有關(guān)。一時間,大數(shù)據(jù)安全合規(guī)的問題,特別是對于個人信息保護(hù)的問題,再次成為了行業(yè)關(guān)注熱點。

(一)數(shù)據(jù)相關(guān)法律監(jiān)管日趨嚴(yán)格規(guī)范

與全球不斷收緊的數(shù)據(jù)合規(guī)政策相類似,中國在數(shù)據(jù)法律監(jiān)管方面也日趨嚴(yán)格規(guī)范。

當(dāng)前中國大數(shù)據(jù)方面的立法呈現(xiàn)出以個人信息保護(hù)為核心,包含基本法律、司法解釋、部門規(guī)章、行政法規(guī)等綜合框架。一些綜合性法律中也涉及了個人信息保護(hù)條款。

2019年以來,數(shù)據(jù)安全方面的立法進(jìn)程明顯加快。中央網(wǎng)信辦針對四項關(guān)于數(shù)據(jù)安全的管理辦法相繼發(fā)布征求意見稿,其中,《兒童個人信息網(wǎng)絡(luò)保護(hù)規(guī)定》已正式公布,并于2019年10月1日開始施行。一系列行政法規(guī)的制訂,喚起了民眾對數(shù)據(jù)安全的強烈關(guān)注。

但不可否認(rèn)的是,從法律法規(guī)體系方面來看,中國的數(shù)據(jù)安全法律法規(guī)仍不夠完善,呈現(xiàn)出缺乏綜合性統(tǒng)一法律、缺乏法律細(xì)節(jié)解釋、保護(hù)與發(fā)展協(xié)調(diào)不夠等問題。2018年,十三屆全國人大常委會立法規(guī)劃中的“條件比較成熟、任期內(nèi)擬提請審議的法律草案”包括了《個人信息保護(hù)法》《數(shù)據(jù)安全法》兩部。個人信息和數(shù)據(jù)保護(hù)的綜合立法時代即將來臨。

(二)數(shù)據(jù)安全技術(shù)助力大數(shù)據(jù)合規(guī)要求落地

數(shù)據(jù)安全的概念來源于傳統(tǒng)信息安全的概念。在傳統(tǒng)信息安全中數(shù)據(jù)是內(nèi)涵,信息系統(tǒng)是載體,數(shù)據(jù)安全是整個信息安全的關(guān)注重點,信息安全的主要內(nèi)容是通過安全技術(shù)保障數(shù)據(jù)的秘密性、完整性和可用性。從數(shù)據(jù)生命周期的角度區(qū)分,數(shù)據(jù)安全技術(shù)包括作用于數(shù)據(jù)采集階段的敏感數(shù)據(jù)鑒別發(fā)現(xiàn)、數(shù)據(jù)分類分級標(biāo)簽、數(shù)據(jù)質(zhì)量監(jiān)控;作用于數(shù)據(jù)存儲階段的數(shù)據(jù)加密、數(shù)據(jù)備份容災(zāi);作用于數(shù)據(jù)處理階段的數(shù)據(jù)脫敏、安全多方計算、聯(lián)邦學(xué)習(xí);作用于數(shù)據(jù)刪除階段的數(shù)據(jù)全副本銷毀;作用于整個數(shù)據(jù)生命周期的用戶角色權(quán)限管理、數(shù)據(jù)傳輸校驗與加密、數(shù)據(jù)活動監(jiān)控審計等。

當(dāng)前中國數(shù)據(jù)安全法律法規(guī)重點關(guān)注個人信息的保護(hù),大數(shù)據(jù)行業(yè)整體合規(guī)也必然將以此作為核心。而在目前的數(shù)據(jù)安全技術(shù)中有為數(shù)不少的技術(shù)手段瞄準(zhǔn)了敏感數(shù)據(jù)在處理使用中的防護(hù),例如數(shù)據(jù)脫敏?、安全多方計算?、聯(lián)邦學(xué)習(xí)?等。

在《數(shù)據(jù)安全管理辦法(征求意見稿)》中明確要求,對于個人信息的提供和保存要經(jīng)過匿名化處理,而數(shù)據(jù)脫敏技術(shù)是實現(xiàn)數(shù)據(jù)匿名化處理的有效途徑。應(yīng)用靜態(tài)脫敏技術(shù)可以保證數(shù)據(jù)對外發(fā)布不涉及敏感信息,同時在開發(fā)、測試環(huán)境中保證敏感數(shù)據(jù)集本身特性不變的情況下能夠正常進(jìn)行挖掘分析;應(yīng)用動態(tài)脫敏技術(shù)可以保證在數(shù)據(jù)服務(wù)接口能夠?qū)崟r返回數(shù)據(jù)請求的同時杜絕敏感數(shù)據(jù)泄露風(fēng)險。

安全多方計算和聯(lián)邦學(xué)習(xí)等技術(shù)能夠確保在協(xié)同計算中任何一方實際數(shù)據(jù)不被其他方獲得的情況下完成計算任務(wù)并獲得正確計算結(jié)果。應(yīng)用這些技術(shù)能夠在有效保護(hù)敏感數(shù)據(jù)以及個人隱私數(shù)據(jù)不存在泄露風(fēng)險的同時完成原本需要執(zhí)行的數(shù)據(jù)分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等任務(wù)。

上述技術(shù)是當(dāng)前最為主流的數(shù)據(jù)安全保護(hù)技術(shù),也是最有利于大數(shù)據(jù)安全合規(guī)落地的數(shù)據(jù)安全保護(hù)技術(shù)。其中的各項技術(shù)分別具有各自的技術(shù)實現(xiàn)方式、應(yīng)用場景、技術(shù)優(yōu)勢和當(dāng)前存在的問題,具體的對比如表3。

上述技術(shù)均存在多種技術(shù)實現(xiàn)方式,不同實現(xiàn)方式可能達(dá)到對于隱私數(shù)據(jù)的不同程度保護(hù),不同的應(yīng)用場景對于隱私數(shù)據(jù)的保護(hù)程度和可用性也有不同的需求。作為助力實現(xiàn)大數(shù)據(jù)安全合規(guī)落地的主要技術(shù),在實際應(yīng)用中使用者應(yīng)根據(jù)具體的應(yīng)用場景選擇合適的隱私保護(hù)技術(shù)以及合適的實現(xiàn)方式,而繁多的實現(xiàn)方式和產(chǎn)品化的功能點區(qū)別導(dǎo)致技術(shù)使用者具體進(jìn)行選擇時會遇到很大的困難。通過標(biāo)準(zhǔn)對相應(yīng)隱私保護(hù)技術(shù)進(jìn)行規(guī)范化,可以有效地應(yīng)對這種情況。

未來伴隨著大數(shù)據(jù)產(chǎn)業(yè)的不斷發(fā)展,個人信息和數(shù)據(jù)安全相關(guān)法律法規(guī)將不斷出臺,在企業(yè)合規(guī)方面,應(yīng)用標(biāo)準(zhǔn)化的數(shù)據(jù)安全技術(shù)是十分有效的合規(guī)落地手段。隨著公眾數(shù)據(jù)安全意識的提升和技術(shù)本身的不斷進(jìn)步完善,數(shù)據(jù)安全技術(shù)將逐漸呈現(xiàn)出規(guī)范化、標(biāo)準(zhǔn)化的趨勢,參照相關(guān)法律法規(guī)要求進(jìn)行相關(guān)產(chǎn)品技術(shù)標(biāo)準(zhǔn)制定,應(yīng)用符合相應(yīng)技術(shù)標(biāo)準(zhǔn)的數(shù)據(jù)安全技術(shù)產(chǎn)品,保證對于敏感數(shù)據(jù)和個人隱私數(shù)據(jù)的使用合法合規(guī),將成為未來大數(shù)據(jù)產(chǎn)業(yè)合規(guī)落地的一大趨勢。

(三)數(shù)據(jù)安全標(biāo)準(zhǔn)規(guī)范體系不斷完善

相對于法律法規(guī)和針對于數(shù)據(jù)安全技術(shù)的標(biāo)準(zhǔn),在大數(shù)據(jù)安全保護(hù)中,標(biāo)準(zhǔn)和規(guī)范也發(fā)揮著不可替代的作用?!缎畔踩夹g(shù)個人信息安全規(guī)范》是個人信息保護(hù)領(lǐng)域重要的推薦性標(biāo)準(zhǔn)。標(biāo)準(zhǔn)結(jié)合國際通用的個人信息和隱私保護(hù)理念,提出了“權(quán)責(zé)一致、目的明確、選擇同意、最少夠用、公開透明、確保安全、主體參與”七大原則,為企業(yè)完善內(nèi)部個人信息保護(hù)制度及實踐操作規(guī)則提供了更為細(xì)致的指引。2019年6月25日,該標(biāo)準(zhǔn)修訂后的征求意見稿正式發(fā)布。

一系列聚焦數(shù)據(jù)安全的國家標(biāo)準(zhǔn)近年來陸續(xù)發(fā)布。包括《大數(shù)據(jù)服務(wù)安全能力要求》(GB/T?35274-2017)《大數(shù)據(jù)安全管理指南》(GB/T?37973-2019)《數(shù)據(jù)安全能力成熟度模型》(GB/T?37988-2019)《數(shù)據(jù)交易服務(wù)安全要求》(GB/T?37932-2019)等,這些標(biāo)準(zhǔn)對于中國數(shù)據(jù)安全領(lǐng)域起到了重要的指導(dǎo)作用。

中國通信標(biāo)準(zhǔn)化協(xié)會大數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)推進(jìn)委員會(CCSA?TC601)推出的《可信數(shù)據(jù)服務(wù)》系列規(guī)范將個人信息保護(hù)推廣到企業(yè)數(shù)據(jù)綜合合規(guī)。標(biāo)準(zhǔn)針對數(shù)據(jù)供方和數(shù)據(jù)流通平臺的不同角色身份,從管理流程和管理內(nèi)容等方面對企業(yè)數(shù)據(jù)合規(guī)提出了推薦性建議。規(guī)范列舉了數(shù)據(jù)流通平臺提供數(shù)據(jù)流通服務(wù)時,在平臺管理、流通參與主體管理、流通品管理、流通過程管理等方面的管理要求和建議,以及數(shù)據(jù)供方提供數(shù)據(jù)產(chǎn)品時,在數(shù)據(jù)產(chǎn)品管理、數(shù)據(jù)產(chǎn)品供應(yīng)管理等方面需滿足和體現(xiàn)服務(wù)能力與服務(wù)質(zhì)量的要求。系列規(guī)范已于2019年6月發(fā)布。

六、大數(shù)據(jù)發(fā)展展望

黨的十九屆四中全會提出將數(shù)據(jù)與資本、土地、知識、技術(shù)和管理并列作為可參與分配的生產(chǎn)要素,這體現(xiàn)出數(shù)據(jù)在國民經(jīng)濟(jì)運行中變得越來越重要,數(shù)據(jù)對經(jīng)濟(jì)發(fā)展、社會生活和國家治理正在產(chǎn)生著根本性、全局性、革命性的影響。

技術(shù)方面,我們?nèi)匀惶幵凇皵?shù)據(jù)大爆發(fā)”的初期,隨著5G、工業(yè)互聯(lián)網(wǎng)的深入發(fā)展,將帶來更大的“數(shù)據(jù)洪流”,這就為大數(shù)據(jù)的存儲、分析、管理帶來更大的挑戰(zhàn),牽引大數(shù)據(jù)技術(shù)再上新的臺階。硬件與軟件的融合、數(shù)據(jù)與智能的融合將帶動大數(shù)據(jù)技術(shù)向異構(gòu)多模、超大容量、超低時延等方向拓展。

應(yīng)用方面,大數(shù)據(jù)行業(yè)應(yīng)用正在從消費端向生產(chǎn)端延伸,從感知型應(yīng)用向預(yù)測型、決策型應(yīng)用發(fā)展。當(dāng)前,互聯(lián)網(wǎng)行業(yè)已經(jīng)從“IT時代”全面進(jìn)入“DT時代”(Data?Technology)。未來幾年,隨著各地政務(wù)大數(shù)據(jù)平臺和大型企業(yè)數(shù)據(jù)中臺的建成,將促進(jìn)政務(wù)、民生與實體經(jīng)濟(jì)領(lǐng)域的大數(shù)據(jù)應(yīng)用再上新的臺階。

治理方面,隨著國家數(shù)據(jù)安全法律制度的不斷完善,各行業(yè)的數(shù)據(jù)治理也將深入推進(jìn)。數(shù)據(jù)的采集、使用、共享等環(huán)節(jié)的亂象得到遏制,數(shù)據(jù)的安全管理成為各行各業(yè)自覺遵守的底線,數(shù)據(jù)流通與應(yīng)用的合規(guī)性將大幅提升,健康、可持續(xù)的大數(shù)據(jù)發(fā)展環(huán)境逐步形成。

然而,中國大數(shù)據(jù)發(fā)展也同樣面臨著諸多問題。例如,大數(shù)據(jù)原創(chuàng)性的技術(shù)和產(chǎn)品尚不足;數(shù)據(jù)開放共享水平依然較低,跨部門、跨行業(yè)的數(shù)據(jù)流通仍不順暢,有價值的公共信息資源和商業(yè)數(shù)據(jù)沒有充分流動起來;數(shù)據(jù)安全管理仍然薄弱,個人信息保護(hù)面臨新威脅與新風(fēng)險。這就需要大數(shù)據(jù)從業(yè)者們在大數(shù)據(jù)理論研究、技術(shù)研發(fā)、行業(yè)應(yīng)用、安全保護(hù)等方面付出更多的努力。

新的時代,新的機(jī)遇。我們也看到,大數(shù)據(jù)與5G、人工智能、區(qū)塊鏈等新一代信息技術(shù)的融合發(fā)展日益緊密。特別是區(qū)塊鏈技術(shù),一方面區(qū)塊鏈可以在一定程度上解決數(shù)據(jù)確權(quán)難、數(shù)據(jù)孤島嚴(yán)重、數(shù)據(jù)壟斷等“先天病”,另一方面隱私計算技術(shù)等大數(shù)據(jù)技術(shù)也反過來促進(jìn)了區(qū)塊鏈技術(shù)的完善。在新一代信息技術(shù)的共同作用下,中國的數(shù)字經(jīng)濟(jì)正向著更加互信、共享、均衡的方向發(fā)展,數(shù)據(jù)的“生產(chǎn)關(guān)系”正在進(jìn)一步重塑。

參考文獻(xiàn)

[1]陳一:《我國大數(shù)據(jù)交易產(chǎn)權(quán)管理實踐及政策進(jìn)展研究》,《現(xiàn)代情報》,2019年第11期。

[2]黃璜、孫學(xué)智:《中國地方政府?dāng)?shù)據(jù)治理機(jī)構(gòu)的初步研究:現(xiàn)狀與模式》,《中國行政管理》,2018年第12期。

[3]劉鶴:《堅持和完善社會主義基本經(jīng)濟(jì)制度》,2019年。

[4]葉雅珍、劉國華、朱揚勇:《數(shù)據(jù)資產(chǎn)相關(guān)概念綜述》,《計算機(jī)科學(xué)》,2019年第11期。

(責(zé)任編輯:王藝璇)

*?執(zhí)筆人:閆樹?等。

BIG?DATA:?DEVELOPMENT?STATUS?AND?FUTURE?TRENDS

The?China?Academy?of?Information?and?Communications?Technology

Abstract:?At?present,?global?big?data?is?entering?a?period?of?accelerated?development,?and?the?technology?industry?and?application?innovation?continue?to?move?to?new?heights.?Big?data?enriches?the?supply?of?factors?through?digitalization,?expands?organizational?boundaries?through?networking,?and?improves?output?efficiency?through?intelligence.It?is?not?only?an?important?area?to?promote?the?construction?of?a?network?power,?but?also?a?strategic?support?for?accelerating?the?quality?change,?efficiency?change,?and?power?change?of?the?real?economy?in?the?new?era.?This?paper?focuses?on?recent?developments?and?trends?in?various?fields?of?big?data,?sorts?out?major?issues?and?looks?forward?to?the?future.In?terms?of?technology,?it?focused?on?the?latest?big?data?technologies?and?their?development?trends?in?the?past?two?years;in?terms?of?industry,?it?focused?on?the?development?of?China's?big?data?products;?in?terms?of?data?asset?management,?it?introduced?the?latest?developments?of?industry?data?asset?management?and?data?asset?management?tools,?and?focused?on?the?key?issues?of?data?assetization;?in?terms?of?security,?it?analyzed?the?security?issues?and?technical?tools?faced?by?big?data?from?multiple?perspectives.

Keywords:?Big?Data;?Data?Analysis;?Cloud?Computing

猜你喜歡
數(shù)據(jù)分析云計算大數(shù)據(jù)
新常態(tài)下集團(tuán)公司內(nèi)部審計工作研究
基于云計算的移動學(xué)習(xí)平臺的設(shè)計
淺析大數(shù)據(jù)時代對企業(yè)營銷模式的影響
實驗云:理論教學(xué)與實驗教學(xué)深度融合的助推器
云計算中的存儲虛擬化技術(shù)應(yīng)用
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究