李繼玲,李寶林,劉新蕊
(1.西北政法大學(xué) 商學(xué)院,陜西 西安 710122;2.西華師范大學(xué) 計(jì)算機(jī)學(xué)院,四川 南充 637009)
大數(shù)據(jù)對(duì)企業(yè)而言是亟待開發(fā)的寶貴資源,數(shù)據(jù)中所蘊(yùn)藏的無(wú)限信息金礦若以先進(jìn)的分析技術(shù)加以利用,將轉(zhuǎn)化為極具價(jià)值的商業(yè)洞察力,能夠幫助企業(yè)從中獲得可以利用的商業(yè)情報(bào),執(zhí)行實(shí)時(shí)風(fēng)險(xiǎn)管理,保證企業(yè)在關(guān)鍵市場(chǎng)的競(jìng)爭(zhēng)中贏得勝利.
近年業(yè)界對(duì)于大數(shù)據(jù)概念、應(yīng)用案例、應(yīng)用價(jià)值、技術(shù)體系等方面有較多研究探索.文獻(xiàn)[1]梳理了大數(shù)據(jù)的10 個(gè)重要概念,總結(jié)了大數(shù)據(jù)的典型商業(yè)應(yīng)用案例,指出大數(shù)據(jù)應(yīng)用給企業(yè)帶來(lái)了若干問題.文獻(xiàn)[2]認(rèn)為互聯(lián)網(wǎng)企業(yè)具有較好的信息化能力并擁有數(shù)據(jù)優(yōu)勢(shì);同時(shí)提出大數(shù)據(jù)規(guī)模化應(yīng)用面臨數(shù)據(jù)源不完整、數(shù)據(jù)安全和隱私問題.文獻(xiàn)[3]重點(diǎn)闡述了大數(shù)據(jù)應(yīng)用的技術(shù)系統(tǒng),涵蓋云計(jì)算及并行計(jì)算模型、數(shù)據(jù)庫(kù)、大數(shù)據(jù)獲取和分析技術(shù)等.文獻(xiàn)[4]闡述了大數(shù)據(jù)潛在的安全威脅,提出大數(shù)據(jù)安全風(fēng)險(xiǎn)來(lái)源于云計(jì)算服務(wù)商以及遠(yuǎn)程數(shù)據(jù)應(yīng)用者對(duì)未授權(quán)內(nèi)容的越權(quán)操作.文獻(xiàn)[5]分析了傳統(tǒng)產(chǎn)業(yè)大數(shù)據(jù)應(yīng)用的問題與發(fā)展環(huán)境,認(rèn)為作為國(guó)家經(jīng)濟(jì)基石的傳統(tǒng)產(chǎn)業(yè)仍基本游離在大數(shù)據(jù)應(yīng)用之外,急需從技術(shù)和商業(yè)模式上進(jìn)行探索和突破.
上述文獻(xiàn)主要聚焦于大數(shù)據(jù)本身的相關(guān)分析,有助于讀者了解業(yè)界大數(shù)據(jù)發(fā)展的總體狀態(tài)、大數(shù)據(jù)主要應(yīng)用場(chǎng)景和價(jià)值、行業(yè)應(yīng)用狀態(tài).但相關(guān)內(nèi)容較為分散,缺少企業(yè)信息生命周期維度對(duì)大數(shù)據(jù)應(yīng)用構(gòu)成要素的系統(tǒng)闡述,風(fēng)險(xiǎn)分析局限在數(shù)據(jù)安全方面.本文將結(jié)合企業(yè)信息生命周期的流程和角色,系統(tǒng)闡述企業(yè)大數(shù)據(jù)應(yīng)用平臺(tái)構(gòu)成要素,并從風(fēng)險(xiǎn)評(píng)估和識(shí)別的角度對(duì)大數(shù)據(jù)應(yīng)用風(fēng)險(xiǎn)進(jìn)行探討.
為了區(qū)分信息生命周期的不同階段,這里引入數(shù)據(jù)、信息和知識(shí)三個(gè)不同術(shù)語(yǔ).由于數(shù)據(jù)源的多樣性,原始數(shù)據(jù)(包括直接采集的數(shù)據(jù)或者從第三方合作伙伴集成的數(shù)據(jù))中包含了許多虛假數(shù)據(jù),或者格式錯(cuò)誤的無(wú)效的數(shù)據(jù),這些虛假數(shù)據(jù)和無(wú)效數(shù)據(jù)如果參與分析,會(huì)給分析結(jié)果引入誤差,甚至得出錯(cuò)誤分析結(jié)論.因而需要通過數(shù)據(jù)處理過濾掉這些虛假或無(wú)效數(shù)據(jù),這些經(jīng)過處理得到的有效數(shù)據(jù)稱之為信息.信息經(jīng)過大數(shù)據(jù)分析平臺(tái)分析后,得到的有規(guī)律、有因果關(guān)系分析結(jié)果和趨勢(shì),我們稱這些分析結(jié)果和趨勢(shì)為知識(shí).只有知識(shí)才能最終支撐企業(yè)進(jìn)行業(yè)務(wù)決策.
業(yè)務(wù)場(chǎng)景和需求是大數(shù)據(jù)應(yīng)用的源頭,企業(yè)的業(yè)務(wù)需求決定了所要選取的數(shù)據(jù)集.業(yè)務(wù)、數(shù)據(jù)、信息和知識(shí)的關(guān)系如圖1 所示.
圖1 業(yè)務(wù)、數(shù)據(jù)、信息、知識(shí)之間的關(guān)系Fig.1 The relationship among business, data, information and knowledge
CIO(Chef Information Officer)是企業(yè)信息系統(tǒng)的決策者,也是大數(shù)據(jù)平臺(tái)的建設(shè)和使用者,CIO 根據(jù)企業(yè)的總體商業(yè)策略,制定并落實(shí)對(duì)應(yīng)的信息系統(tǒng)策略.但傳統(tǒng)企業(yè)環(huán)境中,數(shù)據(jù)來(lái)源十分有限,同時(shí)缺少高效的數(shù)據(jù)處理和分析平臺(tái),使得數(shù)據(jù)無(wú)法有效發(fā)揮價(jià)值,CIO 在企業(yè)商業(yè)決策中只是支撐者的角色,無(wú)法真正參與到企業(yè)的商業(yè)決策中.
大數(shù)據(jù)時(shí)代進(jìn)一步催生了數(shù)據(jù)科學(xué)家的角色.?dāng)?shù)據(jù)科學(xué)家在CIO 的領(lǐng)導(dǎo)下,需要深入理解企業(yè)業(yè)務(wù)場(chǎng)景和需求,同時(shí)需要了解大數(shù)據(jù)平臺(tái)的技術(shù)能力,從而可以對(duì)業(yè)務(wù)進(jìn)行建模,確定有效數(shù)據(jù)源,并針對(duì)性的選取大數(shù)據(jù)技術(shù)平臺(tái)啟動(dòng)業(yè)務(wù)分析.海量數(shù)據(jù)經(jīng)過大數(shù)據(jù)平臺(tái)分析后形成的知識(shí)進(jìn)而作為企業(yè)商務(wù)決策的重要輸入.上述循環(huán)過程如圖2 所示.
圖2 企業(yè)大數(shù)據(jù)應(yīng)用的角色和工作流程Fig.2 The role and workflow of enterprise data applications
信息生命周期視角的企業(yè)大數(shù)據(jù)應(yīng)用構(gòu)成要素包括業(yè)務(wù)平臺(tái)、分析平臺(tái)、數(shù)據(jù)源和管理平臺(tái)四部分構(gòu)成,如圖3 所示.
大數(shù)據(jù)業(yè)務(wù)平臺(tái)是大數(shù)據(jù)應(yīng)用的源頭,因?yàn)闃I(yè)務(wù)場(chǎng)景決定了“我分析的目的是什么”的問題;同時(shí)也是大數(shù)據(jù)應(yīng)用的終點(diǎn),大數(shù)據(jù)平臺(tái)產(chǎn)生的知識(shí)需要作用于企業(yè)商務(wù)決策才能最終發(fā)揮價(jià)值.
大數(shù)據(jù)平臺(tái)的分析結(jié)果(即知識(shí))可以直接作為企業(yè)決策輸入,也可能進(jìn)一步作為企業(yè)已有BI(Business Intelligence)應(yīng)用系統(tǒng)輸入.知識(shí)如何進(jìn)一步應(yīng)用以產(chǎn)生最大商業(yè)價(jià)值,不同企業(yè)可以根據(jù)具體情況進(jìn)行具體選擇.新的商業(yè)模式也會(huì)在大數(shù)據(jù)應(yīng)用的過程產(chǎn)生.
圖3 企業(yè)大數(shù)據(jù)應(yīng)用平臺(tái)的構(gòu)成要素Fig.3 Elements of the enterprise big data application platform
分析平臺(tái)包括數(shù)據(jù)處理、數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)分析三個(gè)部分.業(yè)務(wù)建模決定了分析平臺(tái)的不同技術(shù)選擇.
2.2.1 數(shù)據(jù)處理
大數(shù)據(jù)時(shí)代產(chǎn)生數(shù)據(jù)的設(shè)備、媒介及渠道如此眾多,由此產(chǎn)生許許多多的大數(shù)據(jù)源.這些海量數(shù)據(jù)源中包含了許多無(wú)效數(shù)據(jù),如殘缺數(shù)據(jù)、錯(cuò)誤數(shù)據(jù)、重復(fù)數(shù)據(jù)等[6].企業(yè)首先需要根據(jù)自身的業(yè)務(wù)建模選擇相應(yīng)的數(shù)據(jù)源,然后利用ETL(提取、轉(zhuǎn)換、加載[7])、數(shù)據(jù)清洗等技術(shù)從相應(yīng)的數(shù)據(jù)源中抽取有效數(shù)據(jù).企業(yè)在采集、處理以及應(yīng)用這些大數(shù)據(jù)的過程中,積累了大量的客戶個(gè)人信息,為了不使企業(yè)在利用大數(shù)據(jù)時(shí)發(fā)生侵權(quán)行為,需要運(yùn)用技術(shù)手段對(duì)采集的數(shù)據(jù)去隱私,如用虛擬ID 代替真實(shí)姓名,為特定數(shù)據(jù)創(chuàng)建定制屏蔽等措施.
2.2.2 數(shù)據(jù)存儲(chǔ)
大數(shù)據(jù)的存儲(chǔ)需要大容量的存儲(chǔ)系統(tǒng),這里所說(shuō)的“大容量”通??蛇_(dá)到PB 級(jí)的數(shù)據(jù)規(guī)模,因此,海量數(shù)據(jù)存儲(chǔ)系統(tǒng)也一定要有相應(yīng)等級(jí)的擴(kuò)展能力才能匹配實(shí)時(shí)的海量數(shù)據(jù)存儲(chǔ).另外由于大數(shù)據(jù)類型的多樣性及流轉(zhuǎn)的實(shí)時(shí)性,大數(shù)據(jù)存儲(chǔ)需要異構(gòu)化、分級(jí)的存儲(chǔ)平臺(tái),從而滿足企業(yè)結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化等異構(gòu)數(shù)據(jù)的存儲(chǔ)需求,并能實(shí)時(shí)按照數(shù)據(jù)訪問的熱度分配不同類型的存儲(chǔ)介質(zhì)(如磁帶、普通磁盤、SSD、磁盤)以降低存儲(chǔ)成本.
2.2.3 數(shù)據(jù)分析
大數(shù)據(jù)分析是指對(duì)海量數(shù)據(jù)進(jìn)行分析,分析挖掘大數(shù)據(jù)中蘊(yùn)藏的有價(jià)值的知識(shí).企業(yè)需要根據(jù)自己特定的業(yè)務(wù)模型選擇對(duì)應(yīng)的大數(shù)據(jù)分析平臺(tái)、匹配的計(jì)算模型、計(jì)算算法,以及不同的分析工具.當(dāng)前大規(guī)模并行分析平臺(tái)可以選擇開源的Hadoop 平臺(tái),以及獨(dú)立第三方公司如Cloudera、EMC、Hortonworks 等提供的產(chǎn)品;計(jì)算模型有不同的分類,如批量計(jì)算模型、實(shí)時(shí)流處理模型;計(jì)算算法也有不同的種類,如分類算法、聚類算法、統(tǒng)計(jì)算法、關(guān)聯(lián)算法;不同領(lǐng)域有不同的分析工具,如日志分析工具、圖像處理分析工具等.
2.2.4 數(shù)據(jù)源
企業(yè)的數(shù)據(jù)源由兩部分組成:內(nèi)部數(shù)據(jù)源和外部數(shù)據(jù)源.企業(yè)內(nèi)部數(shù)據(jù)源來(lái)自于企業(yè)信息系統(tǒng),如ERP系統(tǒng)、合同管理系統(tǒng)等.企業(yè)外部的數(shù)據(jù)源來(lái)自于兩個(gè)方面,一方面來(lái)自于多種設(shè)備和媒介,如互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、物聯(lián)網(wǎng)、GPS、醫(yī)學(xué)影像、安全監(jiān)控、金融網(wǎng)、電信網(wǎng)等組成的復(fù)雜網(wǎng)絡(luò);另一方面來(lái)自于第三方數(shù)據(jù)集成,如淘寶平臺(tái)數(shù)據(jù)集成.
企業(yè)大數(shù)據(jù)應(yīng)用管理平臺(tái)主要包括三方面內(nèi)容,其一是數(shù)據(jù)安全管理,包括數(shù)據(jù)安全存儲(chǔ)、數(shù)據(jù)傳輸加密、授權(quán)訪問控制、隱私保護(hù)等;其二是隱私保護(hù),企業(yè)在應(yīng)用大數(shù)據(jù)時(shí)需要遵從相關(guān)管理和法律規(guī)定,如知情權(quán)、披露權(quán)及報(bào)備管理制度;最后是大數(shù)據(jù)復(fù)合型人才的培養(yǎng),企業(yè)需要培養(yǎng)既懂企業(yè)業(yè)務(wù)又懂得數(shù)據(jù)分析技術(shù)和法律知識(shí)的復(fù)合型人才,才能合理、高效、合法地把大數(shù)據(jù)分析結(jié)果應(yīng)用于企業(yè)商業(yè)中進(jìn)行智慧決策.
大數(shù)據(jù)管理是從業(yè)務(wù)平臺(tái)視角提出任務(wù)指引,在管理平臺(tái)的支撐協(xié)調(diào)下,依次從數(shù)據(jù)源遞進(jìn)到數(shù)據(jù)分析、數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)處理,完成大數(shù)據(jù)應(yīng)用的全流程,期間每一個(gè)環(huán)節(jié)的非完整、非客觀、非真實(shí)都會(huì)嚴(yán)重影大數(shù)據(jù)的應(yīng)用價(jià)值,亦即存在全流程的失真風(fēng)險(xiǎn),需要針對(duì)各環(huán)節(jié)來(lái)解析信息生命周期的不同管理風(fēng)險(xiǎn).
企業(yè)如何從海量數(shù)據(jù)中過濾有效數(shù)據(jù),并處理好不同數(shù)據(jù)源之間的復(fù)雜關(guān)系,是企業(yè)大數(shù)據(jù)應(yīng)用的巨大考驗(yàn).企業(yè)需要從源頭上防止不良數(shù)據(jù)對(duì)商業(yè)環(huán)境的侵蝕及其帶來(lái)的巨大的管理風(fēng)險(xiǎn).
企業(yè)大數(shù)據(jù)大部分來(lái)自于企業(yè)外部,這些數(shù)據(jù)魚龍混雜,包含了眾多殘缺數(shù)據(jù)、錯(cuò)誤數(shù)據(jù)和重復(fù)數(shù)據(jù).多年來(lái),企業(yè)一直在努力清理有缺陷的數(shù)據(jù)文件.另外,由于數(shù)據(jù)來(lái)源的多樣性、龐大性和復(fù)雜性特點(diǎn),數(shù)據(jù)之間的關(guān)系也日益復(fù)雜化,企業(yè)需要處理的數(shù)據(jù)不是簡(jiǎn)單的精確關(guān)系、因果關(guān)系,而是混雜性和相關(guān)關(guān)系.
大數(shù)據(jù)環(huán)境下需要存儲(chǔ)和分析挖掘的數(shù)據(jù)量龐大、復(fù)雜,并且很看重?cái)?shù)據(jù)處理的高效性和可用性.
企業(yè)傳統(tǒng)數(shù)據(jù)處理方法表現(xiàn)在:其一,傳統(tǒng)的數(shù)據(jù)采集來(lái)源單一,存儲(chǔ)和分析的數(shù)據(jù)量也相對(duì)較小,因而大多采用關(guān)系型數(shù)據(jù)庫(kù)和并行數(shù)據(jù)倉(cāng)庫(kù)處理.根據(jù)CAP 理論,傳統(tǒng)數(shù)據(jù)存儲(chǔ)方式難以保證其可用性和擴(kuò)展性.其二,傳統(tǒng)的數(shù)據(jù)處理方法是以處理器為中心,而大數(shù)據(jù)環(huán)境下,需要采取以數(shù)據(jù)為中心的模式,以減少數(shù)據(jù)移動(dòng)帶來(lái)的開銷.因此,傳統(tǒng)的數(shù)據(jù)處理方法,已經(jīng)不能適應(yīng)大數(shù)據(jù)的需求.
大數(shù)據(jù)環(huán)境下,企業(yè)需要新的技術(shù)來(lái)適應(yīng)大數(shù)據(jù)處理的量和處理速度,特別是對(duì)海量的結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)的混合處理.
傳統(tǒng)企業(yè)存儲(chǔ)規(guī)劃以GB 為單位,而我們正處于PB 級(jí)時(shí)代,且EB 級(jí)時(shí)代即將到來(lái).如此巨大的數(shù)據(jù)存儲(chǔ)給企業(yè)存儲(chǔ)容量及存儲(chǔ)技術(shù)帶來(lái)巨大風(fēng)險(xiǎn).
首先,企業(yè)存儲(chǔ)容量面臨巨大危機(jī).在2014年TechTarget 中國(guó)區(qū)采購(gòu)意向調(diào)查中,對(duì)企業(yè)全部介質(zhì)中存儲(chǔ)的數(shù)據(jù)量進(jìn)行了詢問.一半以上受訪企業(yè)表示,需要管理的數(shù)據(jù)總量在1 到100TB 之間,數(shù)據(jù)總量100 到200TB 之間的企業(yè)在兩成左右.由此可見,大數(shù)據(jù)對(duì)存儲(chǔ)容量的需求已經(jīng)遠(yuǎn)遠(yuǎn)超出企業(yè)現(xiàn)有的存儲(chǔ)能力.
其次,企業(yè)的存儲(chǔ)技術(shù)面臨極大挑戰(zhàn).據(jù)統(tǒng)計(jì)現(xiàn)在非結(jié)構(gòu)化數(shù)據(jù)占到數(shù)據(jù)總量的85%左右,而傳統(tǒng)的數(shù)據(jù)庫(kù)技術(shù)無(wú)法對(duì)這些數(shù)據(jù)進(jìn)行有效存儲(chǔ).從數(shù)據(jù)存儲(chǔ)特性看,包括備份、恢復(fù)、快照、遷移、復(fù)制、遠(yuǎn)程復(fù)制、重復(fù)數(shù)據(jù)刪除、歸檔、加密解密等諸多特性.上述每一項(xiàng)存儲(chǔ)特性都需要有新的技術(shù)、方法、技能和管理來(lái)解決.
企業(yè)如何在大數(shù)據(jù)人才普遍不足的情況下,基于業(yè)務(wù)需求合理選擇大數(shù)據(jù)平臺(tái)供應(yīng)商,也是企業(yè)面臨的重大挑戰(zhàn).企業(yè)選擇大數(shù)據(jù)平臺(tái)時(shí)首先應(yīng)該判斷什么是企業(yè)真正的業(yè)務(wù)需求,清楚地了解供應(yīng)商的產(chǎn)品是否能夠滿足這些需求;其次需要估量清楚內(nèi)部可用技能,數(shù)據(jù)將從哪里來(lái),分析行為需要多快完成,哪些內(nèi)容需要與新平臺(tái)整合;最后還要參考備選供應(yīng)商的能力、成功案例等,謹(jǐn)慎選擇供應(yīng)商.目前大數(shù)據(jù)分析平臺(tái)供應(yīng)商包括開源的Hadoop,以及獨(dú)立第三方公司如Cloudera、EMC、Hortonworks、IBM、華為等公司提供的不同產(chǎn)品.
數(shù)據(jù)是企業(yè)和客戶的核心機(jī)密,然而企業(yè)當(dāng)前數(shù)據(jù)安全管理的意識(shí)和手段普遍不足.對(duì)于終端由個(gè)人靈活掌控的今天,企業(yè)必須采取更完善的措施如加密信息存儲(chǔ)和傳輸、區(qū)分角色的訪問控制、嚴(yán)格的審計(jì)制度,從各個(gè)環(huán)節(jié)把關(guān)加強(qiáng)信息安全管理,實(shí)現(xiàn)信息生命周期的有效保護(hù),從根本上解決數(shù)據(jù)安全的問題.
另外,當(dāng)前部分企業(yè)的大數(shù)據(jù)收集和利用,已經(jīng)與互聯(lián)網(wǎng)用戶對(duì)于隱私問題的關(guān)注,以及政府監(jiān)管部門的政策形成了沖突[8].目前我國(guó)尚無(wú)專門的法律對(duì)個(gè)人信息數(shù)據(jù)的收集、使用、披露等行為進(jìn)行規(guī)范,立法分散,不成體系.企業(yè)必須關(guān)注并積極參與國(guó)家隱私方面的立法工作,避免大數(shù)據(jù)應(yīng)用違背國(guó)家法律法規(guī).
越來(lái)越多的企業(yè)管理者意識(shí)到了“大數(shù)據(jù)”時(shí)代的人才挑戰(zhàn)[9],比如,國(guó)內(nèi)現(xiàn)在懂得在Hadoop 上進(jìn)行開發(fā)的專業(yè)技術(shù)人員非常少,而一些金融行業(yè)的用戶雖然很想現(xiàn)在就部署大數(shù)據(jù)解決方案,但是苦于找不到既懂?dāng)?shù)據(jù)分析技術(shù),又懂得金融業(yè)務(wù)的專業(yè)人才.由此可見,企業(yè)要最大化利用大數(shù)據(jù)帶來(lái)的價(jià)值,需要既懂得相關(guān)大數(shù)據(jù)技術(shù),又熟悉企業(yè)業(yè)務(wù)的復(fù)合型人才,企業(yè)呼喚數(shù)據(jù)科學(xué)家.
企業(yè)更多注意到大數(shù)據(jù)應(yīng)用的重要性,但對(duì)大數(shù)據(jù)應(yīng)用的風(fēng)險(xiǎn)認(rèn)識(shí)還比較欠缺[10].企業(yè)需要系統(tǒng)理解數(shù)據(jù)源選擇、數(shù)據(jù)處理、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析平臺(tái)選擇、數(shù)據(jù)安全管理和隱私保護(hù),以及大數(shù)據(jù)復(fù)合型人才等六個(gè)方面的具體風(fēng)險(xiǎn),才能避免人云亦云,確保大數(shù)據(jù)價(jià)值的有效發(fā)揮.企業(yè)需要進(jìn)一步了解不同風(fēng)險(xiǎn)所帶來(lái)的危害,提前通過業(yè)務(wù)、技術(shù)、人才多方面積累進(jìn)行有效的風(fēng)險(xiǎn)防范控制,結(jié)合企業(yè)實(shí)際業(yè)務(wù)需求,全面評(píng)估大數(shù)據(jù)應(yīng)用帶來(lái)的潛在價(jià)值和可能的各種風(fēng)險(xiǎn),實(shí)事求是地開展大數(shù)據(jù)應(yīng)用實(shí)踐.
傳統(tǒng)企業(yè)中,各個(gè)業(yè)務(wù)體系彼此獨(dú)立;同時(shí)IT 部門在企業(yè)中屬于支撐角色,沒有參與到業(yè)務(wù)決策中,因而業(yè)務(wù)人才、IT 技術(shù)人才和法律人才只服務(wù)于對(duì)應(yīng)部門,人才結(jié)構(gòu)單一,缺少互動(dòng).大數(shù)據(jù)時(shí)代數(shù)據(jù)價(jià)值凸顯,業(yè)務(wù)決策離不開IT 部門的數(shù)據(jù)處理及分析,同時(shí)數(shù)據(jù)處理進(jìn)一步受到法律法規(guī)的約束,因而單一角色很難形成正確的決策.
因此,企業(yè)迫切需要培養(yǎng)精通業(yè)務(wù)、大數(shù)據(jù)平臺(tái)能力以及數(shù)據(jù)安全管理法律法規(guī)的大數(shù)據(jù)復(fù)合型人才,充分發(fā)揮數(shù)據(jù)價(jià)值,有效支撐業(yè)務(wù)決策,同時(shí)充分識(shí)別和規(guī)避風(fēng)險(xiǎn).
大數(shù)據(jù)時(shí)代,數(shù)據(jù)成為企業(yè)的核心資產(chǎn).但每個(gè)企業(yè)掌握的數(shù)據(jù)都不夠全面,數(shù)據(jù)孤島普遍存在.以政府部門為例,當(dāng)前公安、醫(yī)療、金融等領(lǐng)域還無(wú)法形成全國(guó)聯(lián)網(wǎng)共享,極大限制了數(shù)據(jù)價(jià)值的發(fā)揮.另外,各個(gè)企業(yè)的業(yè)務(wù)模型、數(shù)據(jù)模型沒有統(tǒng)一標(biāo)準(zhǔn),數(shù)據(jù)共享缺乏基礎(chǔ).大數(shù)據(jù)價(jià)值的發(fā)揮依托于數(shù)據(jù)的全面性,因而數(shù)據(jù)共享的程度決定了大數(shù)據(jù)能夠發(fā)揮的價(jià)值大小,長(zhǎng)遠(yuǎn)看數(shù)據(jù)共享是必要趨勢(shì).
考慮到當(dāng)前每個(gè)企業(yè)都不希望暴露自己的數(shù)據(jù)資產(chǎn),因而具體的共享模式可以逐步探索,可以先從知識(shí)共享開始,逐步推進(jìn)到信息共享和數(shù)據(jù)共享.考慮到數(shù)據(jù)共享的最終趨勢(shì),當(dāng)前建議盡早通過產(chǎn)業(yè)聯(lián)盟等方式,推動(dòng)同一行業(yè)數(shù)據(jù)模型的標(biāo)準(zhǔn)化,確保不同企業(yè)的數(shù)據(jù)描述語(yǔ)言具備共通性,為真正的數(shù)據(jù)共享及立法奠定基礎(chǔ).
大數(shù)據(jù)系統(tǒng)本身的安全性需要同時(shí)注意技術(shù)、管理制度和法律制度的不斷完善,防止信息被損壞、篡改、泄露或被竊,保護(hù)公民和國(guó)家的信息安全.
當(dāng)前要盡快制定“信息公開法”以適應(yīng)大數(shù)據(jù)時(shí)代的到來(lái).現(xiàn)在很多機(jī)構(gòu)和企業(yè)擁有大量客戶信息,應(yīng)當(dāng)既鼓勵(lì)面向群體、服務(wù)社會(huì)的數(shù)據(jù)挖掘,又要防止侵犯?jìng)€(gè)體隱私;既提倡數(shù)據(jù)共享,又要防止數(shù)據(jù)被濫用,達(dá)到“既保護(hù)數(shù)據(jù)安全,又不阻礙企業(yè)大數(shù)據(jù)應(yīng)用創(chuàng)新”的雙重目的,2012年底全國(guó)人大通過的加強(qiáng)網(wǎng)絡(luò)信息保護(hù)的決定是一個(gè)良好開始.
大數(shù)據(jù)是新一代信息技術(shù)的集中反映,是一個(gè)應(yīng)用驅(qū)動(dòng)性很強(qiáng)、具有無(wú)窮潛力和價(jià)值的新興產(chǎn)業(yè)領(lǐng)域.但目前其標(biāo)準(zhǔn)和產(chǎn)業(yè)格局尚未形成,因此企業(yè)一方面要重視大數(shù)據(jù)的開發(fā)利用,系統(tǒng)認(rèn)識(shí)大數(shù)據(jù)應(yīng)用的不同構(gòu)成要素;另一方面也要防范大數(shù)據(jù)帶來(lái)的風(fēng)險(xiǎn),只有這樣企業(yè)才能最大化利用大數(shù)據(jù)帶來(lái)的商業(yè)價(jià)值.
[1] 胡雄偉,張寶林,李抵飛.大數(shù)據(jù)研究與應(yīng)用綜述(上)[J].標(biāo)準(zhǔn)和信息化. 2013,(9):29 -34.
[2] 吳韶鴻.信息通信企業(yè)大數(shù)據(jù)應(yīng)用部署研究[J]. 電信網(wǎng)技術(shù). 2013,(7):18 -21.
[3] 竇萬(wàn)春.大數(shù)據(jù)應(yīng)用的技術(shù)體系及潛在問題[J]. 中興通信技術(shù). 2013,19(4):1 -15.
[4] 何廷潤(rùn).當(dāng)前大數(shù)據(jù)應(yīng)用發(fā)展的局限性分析[J]. 移動(dòng)通信. 2014,(13):29 -32.
[5] 閆 智,詹 靜.大數(shù)據(jù)應(yīng)用模式及安全風(fēng)險(xiǎn)分析[J]. 計(jì)算機(jī)與現(xiàn)代化. 2014,(8):58 -61.
[6] 李建中,劉顯敏.大數(shù)據(jù)的一個(gè)重要方面:數(shù)據(jù)可用性[J].計(jì)算機(jī)研究與發(fā)展,2013,50(6):1147 -1162.
[7] 劉 雷,杜鵬程,賀俊銘,等.大數(shù)據(jù)存儲(chǔ)技術(shù)[J].計(jì)算機(jī)軟件及應(yīng)用,2014,(7):18 -21.
[8] 孟小峰,慈 祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146 -169.
[9] 鄔賀銓.大數(shù)據(jù)時(shí)代的機(jī)遇與挑戰(zhàn)[J].求是,2013,(4):47 -49.
[10] BILL FRANKS.駕馭大數(shù)據(jù)[M].黃海譯,北京:人民郵電出版社.2013.