書名:大數(shù)據(jù)治理與安全:從理論到開源實踐
作者:劉馳,胡柏青,謝一,等
出版社:機(jī)械工業(yè)出版社
ISBN: 9787111579977
出版時間:2017年8月
定價:79元
在當(dāng)今的時代背景下,大數(shù)據(jù)已經(jīng)逐漸成為人們?nèi)粘U務(wù)摰臒狳c話題。大數(shù)據(jù)是伴隨互聯(lián)網(wǎng)與信息技術(shù)發(fā)展而產(chǎn)生的一類新興技術(shù),在各個行業(yè)的應(yīng)用均具有廣闊前景。但需要注意的是,在大數(shù)據(jù)應(yīng)用為人們提供便利的同時,在具體使用過程中也帶來不少安全問題。關(guān)于大數(shù)據(jù)治理以及安全技術(shù)的相關(guān)問題,已有學(xué)者從理論到開源實踐進(jìn)行了專門的分析和研究。
《大數(shù)據(jù)治理與安全:從理論到開源實踐》一書共7章,主要分為2個部分,分別是理論篇和實現(xiàn)篇,除介紹相關(guān)基礎(chǔ)理論以外,十分重視技術(shù)平臺的搭建與部署。書中對相關(guān)內(nèi)容的介紹本著“從簡單到復(fù)雜,逐步深化”的原則。對于涉及到的其他相關(guān)知識點和難點都給予了比較細(xì)致的解釋。該書作者結(jié)合一些實際的情境,分析相關(guān)方案的設(shè)計與實現(xiàn)過程,為一些學(xué)習(xí)者的實踐提供有效的參考。本書理論章節(jié)主要包含前2章,第1章介紹大數(shù)據(jù)治理技術(shù),包含基本概念、大數(shù)據(jù)治理的意義和重要價值,治理框架、治理的原則、范圍、實施和評估;第2章介紹大數(shù)據(jù)的安全、隱私保護(hù)以及審計技術(shù),具體內(nèi)容包含:大數(shù)據(jù)安全的意義和重要作用,面臨的問題與挑戰(zhàn),大數(shù)據(jù)安全防護(hù)技術(shù),大數(shù)據(jù)隱私保護(hù)的意義作用,面臨的問題和挑戰(zhàn),大數(shù)據(jù)審計的相關(guān)內(nèi)容概述。在開源實現(xiàn)篇當(dāng)中,包含其余5章,第3章闡述Apache Falcon技術(shù)的概況、發(fā)展近況、技術(shù)優(yōu)勢以及架構(gòu)和使用情況,同時涵蓋這一技術(shù)的場景設(shè)計和實現(xiàn)、性能與優(yōu)化分析;第4章介紹大數(shù)據(jù)治理當(dāng)中的Apache Atlas技術(shù),對該技術(shù)的整體發(fā)展情況、技術(shù)優(yōu)勢、架構(gòu)以及發(fā)展近況、配置和使用情況進(jìn)行闡述,在使用當(dāng)中具體介紹添加或者修改、配置Hive、配置Sqoop、配置Storm、配置Falcon等,同時也包含相關(guān)的場景設(shè)計、優(yōu)化和性能分析等;第5章介紹大數(shù)據(jù)安全當(dāng)中的Apache Ranger,對該技術(shù)的整體情況、發(fā)展史、概況、特點和作用、應(yīng)用場景、架構(gòu)和安裝布置等內(nèi)容進(jìn)行介紹,包含其功能配置和優(yōu)化、性能分析;第6章介紹大數(shù)據(jù)安全內(nèi)容當(dāng)中的Apache Sentry,具體分析其技術(shù)基本情況、發(fā)展歷程、技術(shù)優(yōu)勢和架構(gòu)、安裝配置等內(nèi)容;第7章介紹大數(shù)據(jù)安全當(dāng)中的Kerberos認(rèn)證內(nèi)容,同樣對該技術(shù)的基本概況、發(fā)展歷史、近況以及認(rèn)證流程、風(fēng)險缺陷和實際應(yīng)用舉例等內(nèi)容進(jìn)行分析。
作者認(rèn)為,在大數(shù)據(jù)日益快速發(fā)展的時代背景下,信息量呈現(xiàn)出快速的增長趨勢,數(shù)據(jù)價值得到更多人的關(guān)注和認(rèn)可。但是大數(shù)據(jù)在得到快速發(fā)展的過程中也帶來了不少的問題,比如怎樣對數(shù)據(jù)進(jìn)行管理,讓數(shù)據(jù)價值可以在安全的背景下實現(xiàn)最大化,這些問題還都沒有得到比較完美的答案。在不同的時間段當(dāng)中,結(jié)合業(yè)務(wù)需求的具體差異,數(shù)據(jù)也會呈現(xiàn)出差異化的價值。為了讓數(shù)據(jù)價值得到最大化實現(xiàn),互聯(lián)網(wǎng)數(shù)據(jù)之間的共享也是不可避免的。但是,因為不同的企業(yè)和部門之間是一種相互獨立的關(guān)系。在數(shù)據(jù)系統(tǒng)當(dāng)中,所采用的存儲結(jié)構(gòu)也會存在著十分明顯的差別,數(shù)據(jù)之間想要實現(xiàn)共享的目標(biāo)很難,因此也就導(dǎo)致出現(xiàn)了信息孤島的情況。互聯(lián)網(wǎng)擁有十分龐大的群體,不僅需要推動數(shù)據(jù)共享發(fā)展的進(jìn)程,同時還要確保數(shù)據(jù)和信息的安全性,讓用戶的隱私得到最大限度的保護(hù)。為了讓這些問題得到有效解決,大數(shù)據(jù)的安全性維護(hù)和治理內(nèi)容就成為了當(dāng)前工業(yè)領(lǐng)域和學(xué)術(shù)領(lǐng)域的研究熱點之一。大數(shù)據(jù)的治理目標(biāo)就是為了構(gòu)建起足夠統(tǒng)一和標(biāo)準(zhǔn)的平臺,從不同的數(shù)據(jù)體系當(dāng)中獲得相關(guān)的數(shù)據(jù)。作者認(rèn)為,在采用生命周期理論對數(shù)據(jù)進(jìn)行管理時,應(yīng)允許不同主體針對數(shù)據(jù)開展相關(guān)的操作,比如數(shù)據(jù)的審計、篩選或者數(shù)據(jù)遷移等,讓數(shù)據(jù)的價值可以得到更大程度的發(fā)揮。在數(shù)據(jù)業(yè)務(wù)流程處理的過程中,如果可以構(gòu)建起比較標(biāo)準(zhǔn)的平臺,可以針對用戶、地點以及IP地址的差異,針對元數(shù)據(jù)的差異設(shè)置具體的對應(yīng)權(quán)限,讓數(shù)據(jù)的安全性能得到切實有效的保障。
綜上,該書對大數(shù)據(jù)的治理和安全相關(guān)內(nèi)容進(jìn)行了深入分析,采用理論與實際應(yīng)用相結(jié)合的方式,讓讀者對于大數(shù)據(jù)的安全以及治理有更加全面和詳細(xì)的了解與認(rèn)識,也為今后實際應(yīng)用奠定堅實的基礎(chǔ)。