鄧文宏
【摘要】 大數(shù)據(jù)的發(fā)展與現(xiàn)代人們的生活息息相關(guān)。但是,目前大數(shù)據(jù)的收集、儲(chǔ)存、使用技術(shù)不夠完善,信息泄露侵犯用戶隱私,導(dǎo)致大數(shù)據(jù)使用過程存在較大風(fēng)險(xiǎn)。大數(shù)據(jù)安全與隱私保護(hù)這一課題還有許多問題亟待解決。文章主要探討大數(shù)據(jù)的基本情況,大數(shù)據(jù)發(fā)展中面臨的技術(shù)挑戰(zhàn),以及大數(shù)據(jù)安全與隱私保護(hù)的相關(guān)技術(shù)。
【關(guān)鍵詞】 大數(shù)據(jù) 信息安全 隱私保護(hù)
互聯(lián)網(wǎng)的蓬勃發(fā)展使得大數(shù)據(jù)迅猛增長,大數(shù)據(jù)已成為近年來的熱門話題。大數(shù)據(jù)的應(yīng)用甚為廣泛,無論是在學(xué)習(xí)、生活中的應(yīng)用,還是在醫(yī)療、交通上的應(yīng)用,都對(duì)我們的生活有很大幫助。但現(xiàn)階段,大數(shù)據(jù)的發(fā)展還處在不完善階段,在為我們帶來便利的同時(shí),它也帶來了很多負(fù)面影響,其中,信息安全與隱私保護(hù)是亟待解決的問題。如何擴(kuò)大它的益處,抑制它的弊端,成為我們必須研究的一個(gè)課題。
一、大數(shù)據(jù)綜合敘述
1.1大數(shù)據(jù)的含義
大數(shù)據(jù)又叫巨量數(shù)據(jù)集合,指用新的處理模式才可以處理的規(guī)模大并且復(fù)雜的數(shù)據(jù)。具有大規(guī)模、高速性、多樣性的特點(diǎn)。大數(shù)據(jù)一般來源于人、物、機(jī):來源于人的數(shù)據(jù)主要是人們?cè)谑褂没ヂ?lián)網(wǎng)時(shí)產(chǎn)生的文字、圖畫、視頻等信息數(shù)據(jù);來源于物的大數(shù)據(jù)主要是各類設(shè)備采集收集的數(shù)據(jù);來源于機(jī)的大數(shù)據(jù)主要是指計(jì)算機(jī)系統(tǒng)產(chǎn)生的數(shù)據(jù)?,F(xiàn)在,大數(shù)據(jù)已在多領(lǐng)域進(jìn)行應(yīng)用,它的意義不僅在于對(duì)大量數(shù)據(jù)的掌握,更在于如何處理大量信息,使大數(shù)據(jù)產(chǎn)生更大效益的技術(shù)。
1.2大數(shù)據(jù)的結(jié)構(gòu)特點(diǎn)
大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)庫相比較,大數(shù)據(jù)的信息量更大,分析查詢更為困難。大數(shù)據(jù)有五個(gè)特征:一是規(guī)模大,大數(shù)據(jù)信息量巨大,2015年已達(dá)到8ZB;二是大數(shù)據(jù)具有多樣性,數(shù)據(jù)種類多種多樣,例如文本、圖片、音頻、視頻等各種形式;三是大數(shù)據(jù)處理具有高速性,信息時(shí)代,人們對(duì)獲取信息的速度要求越來越高,大數(shù)據(jù)能使你一秒從眾多信息中獲取你想要的信息;四是大數(shù)據(jù)具有很大價(jià)值性,只要人們對(duì)其合理準(zhǔn)確應(yīng)用,就會(huì)得到很大的價(jià)值回報(bào);五是大數(shù)據(jù)具有雙面性,它是把雙刃劍,既能帶來巨大效益,又存在很多弊端和負(fù)面影響。
1.3大數(shù)據(jù)的應(yīng)用目標(biāo)
大數(shù)據(jù)在科學(xué)、商業(yè)、醫(yī)學(xué)等多個(gè)領(lǐng)域都有廣泛應(yīng)用,用途大不相同,但總結(jié)起來,其應(yīng)用目標(biāo)不外乎三種:(1)幫助人們認(rèn)識(shí)事物,并預(yù)測(cè)事物的發(fā)展,為人們采取措施提供依據(jù)。(2)通過大數(shù)據(jù),不僅可以掌握群體特征,還可以得知個(gè)體特征,方便對(duì)用戶進(jìn)行個(gè)性化服務(wù),以滿足個(gè)人需求。(3)在信息爆炸的時(shí)代,辨別信息真?zhèn)斡绕渲匾?,錯(cuò)誤信息的采用可能會(huì)導(dǎo)致嚴(yán)重后果。目前人們已經(jīng)采用大數(shù)據(jù)來辨別信息真假,通過大數(shù)據(jù)來過濾錯(cuò)誤信息,為人們篩選出可用的正確信息。
二、大數(shù)據(jù)目前面臨的挑戰(zhàn)
2.1個(gè)人隱私泄露,帶來信息安全隱患
若不能正確處理大數(shù)據(jù),就極有可能侵犯顧客隱私,導(dǎo)致個(gè)人隱私泄露。因需要保護(hù)的隱私內(nèi)容不同,隱私保護(hù)可分為位置隱私保護(hù)、標(biāo)識(shí)符匿名保護(hù)、連接關(guān)系匿名保護(hù)等。大數(shù)據(jù)的錯(cuò)誤應(yīng)用不僅會(huì)泄露個(gè)人隱私,還可以通過已有信息,對(duì)人的行為進(jìn)行預(yù)測(cè),能推測(cè)出用戶的隱私、興趣、喜好,甚至能準(zhǔn)確定位客戶位置。目前,大數(shù)據(jù)的管理監(jiān)督體系不完善,搜索和存儲(chǔ)技術(shù)有待發(fā)展,這使得大量隱私泄露,產(chǎn)生不可挽救的損失。
2.2大數(shù)據(jù)可信性有待考證,帶來決策失誤
如今大數(shù)據(jù)已引起熱議,一些人對(duì)其稱贊有加,并從預(yù)測(cè)性的分析中發(fā)現(xiàn)了海量的非結(jié)構(gòu)化數(shù)據(jù)是否完整,也有一些人稱大數(shù)據(jù)存在很多隱患,不易操控,無法帶來變革性成果,因此大數(shù)據(jù)的可信性還有待考證。大數(shù)據(jù)時(shí)代伴隨著信息泛濫,很多數(shù)據(jù)是沒有經(jīng)過考證的或虛假的,用戶很容易受到欺騙并盲目采用,這會(huì)導(dǎo)致事件結(jié)果產(chǎn)生嚴(yán)重誤差,影響事件的準(zhǔn)確性,造成嚴(yán)重?fù)p失或混亂。
2.3大數(shù)據(jù)隱私保護(hù)技術(shù)欠缺,使得大數(shù)據(jù)的弊端越來越明顯
信息時(shí)代,大數(shù)據(jù)的使用十分廣泛,但缺少相應(yīng)的監(jiān)督體系及有效的管理制度,信息真假難辨,可利用性低,相關(guān)技術(shù)不足,對(duì)信息缺乏保護(hù),這些都使得大數(shù)據(jù)的弊端越來越明顯。一些信息誤傳和隱私泄露,會(huì)威脅個(gè)人財(cái)產(chǎn)安全,甚至影響社會(huì)穩(wěn)定和發(fā)展[1]。
2.4數(shù)據(jù)庫的使用監(jiān)管有明顯的安全隱患
在互聯(lián)網(wǎng)上,用戶有時(shí)會(huì)被強(qiáng)制要求填寫大量個(gè)人信息,而用戶對(duì)信息的去處及使用途徑并不清楚。而有關(guān)企業(yè)或部門對(duì)采集到的信息缺乏管理,導(dǎo)致用戶信息泄露。大數(shù)據(jù)缺乏相關(guān)的問責(zé)和監(jiān)督機(jī)制。這些都導(dǎo)致數(shù)據(jù)庫的安全機(jī)制存在巨大缺陷。
三、大數(shù)據(jù)安全和隱私保護(hù)的關(guān)鍵技術(shù)
3.1大數(shù)據(jù)的發(fā)布匿名的保護(hù)技術(shù)
數(shù)據(jù)發(fā)布匿名保護(hù)技術(shù)是大數(shù)據(jù)安全及隱私保護(hù)的基本手段及關(guān)鍵技術(shù)。通過信息發(fā)布匿名躲避攻擊者的攻擊行為,從而避免個(gè)人隱私泄露。目前,這一技術(shù)正在使用并不斷發(fā)展與完善。
3.2信息溯源的技術(shù)
這種技術(shù)最早是應(yīng)用在數(shù)據(jù)庫范圍中,后來應(yīng)用到信息安全與隱私保護(hù)上。這種技術(shù)使數(shù)據(jù)可以很快追溯到信息來源,縮短用戶辨別真?zhèn)蔚臅r(shí)間,還可以幫助用戶檢驗(yàn)結(jié)果是否正確及確定數(shù)據(jù)運(yùn)算。信息溯源技術(shù)中采用最多和最基本的的方法是多位標(biāo)記法,記錄數(shù)據(jù)的計(jì)算方法(Why)和數(shù)據(jù)出處(Where)。數(shù)據(jù)溯源技術(shù)現(xiàn)在已取得巨大成就,在對(duì)云儲(chǔ)存場(chǎng)景應(yīng)用、文件溯源和恢復(fù)上做出重大貢獻(xiàn)。
3.3角色的挖掘技術(shù)
當(dāng)前使用最為廣泛的訪問控制模型便是基于角色的訪問控制(RBAC),角色訪問控制最早是用“自上而下”的模式,但是現(xiàn)在人們發(fā)現(xiàn)此種模式能夠更好的完成算法的編制,有利于角色的自動(dòng)提取和優(yōu)化,也就是“角色挖掘”。以整合和分配用戶角色的方式,控制管理用戶相關(guān)權(quán)限,并且自動(dòng)實(shí)現(xiàn)角色優(yōu)化和提取。角色挖掘技術(shù)不僅可以給用戶提供個(gè)性化服務(wù),同時(shí)還可以對(duì)一些用戶行為進(jìn)項(xiàng)監(jiān)控。這一技術(shù)的使用,使得大數(shù)據(jù)的發(fā)展更加安全,為人類謀得更多福利。但是目前想要大范圍的使用還需要解決數(shù)據(jù)集的動(dòng)態(tài)變更等問題[2]。
3.4實(shí)行身份認(rèn)證的技術(shù)
身份認(rèn)證就是在網(wǎng)絡(luò)中確認(rèn)操作人的身份。傳統(tǒng)的技術(shù)是通過認(rèn)證用戶口令或數(shù)字憑證等來進(jìn)行鑒別,但這存在很大弊端,不夠便捷,限制了認(rèn)證技術(shù)的廣泛應(yīng)用。而在此技術(shù)中加入大數(shù)據(jù)分析則很好的完善了它的不足。身份認(rèn)證技術(shù)通過分析和采集用戶行為來總結(jié)用戶的習(xí)慣和特點(diǎn)。這不僅可以通過對(duì)照這些結(jié)果對(duì)用戶身份進(jìn)行驗(yàn)證,還降低了黑客盜取信息的可能性,極大地促進(jìn)了大數(shù)據(jù)的發(fā)展,保護(hù)了用戶的個(gè)人隱私。
3.5其他技術(shù)
(1)建設(shè)隱私保護(hù)機(jī)構(gòu)。目前,很多發(fā)達(dá)國家都建立了較為完備的用于保護(hù)網(wǎng)絡(luò)隱私等各種隱私內(nèi)容的隱私保護(hù)機(jī)構(gòu)。這些機(jī)構(gòu)既有執(zhí)法功能,同時(shí)又進(jìn)行宣傳教育以及普及法律知識(shí)。而我國目前雖也有一些機(jī)構(gòu)負(fù)責(zé)保護(hù)隱私,但缺少專門機(jī)構(gòu)來保障和維護(hù)個(gè)人隱私,無法滿足大數(shù)據(jù)時(shí)代下,人們對(duì)個(gè)人隱私保護(hù)的要求。
(2)引導(dǎo)企業(yè)對(duì)隱私數(shù)據(jù)合理利用。強(qiáng)制性的禁止企業(yè)及相關(guān)組織利用客戶隱私數(shù)據(jù)反而會(huì)適得其反,不如合理引導(dǎo)企業(yè)對(duì)客戶隱私數(shù)據(jù)正確利用,這反而會(huì)更利于大數(shù)據(jù)安全和隱私保護(hù)。政府應(yīng)完善相關(guān)法律法規(guī),明確數(shù)據(jù)可使用范圍,劃分隱私安全等級(jí),允許在保障用戶隱私安全的基礎(chǔ)上適當(dāng)使用隱私數(shù)據(jù)來獲取一定利益,這既保證了客戶隱私安全又能促進(jìn)國家經(jīng)濟(jì)發(fā)展。
結(jié)語:大數(shù)據(jù)的飛速發(fā)展給我們帶來了許多便利,但它也存在大量安全問題。本文主要講述了大數(shù)據(jù)發(fā)展中面臨的一些重要問題,并探究了解決這些問題的相關(guān)技術(shù)和方法??偟膩碚f還應(yīng)對(duì)相關(guān)技術(shù)進(jìn)行進(jìn)一步研究,來促進(jìn)大數(shù)據(jù)發(fā)展,解決安全問題,保護(hù)個(gè)人隱私。相信在社會(huì)的不斷進(jìn)步中,這些問題都會(huì)得到很好的解決。
參 考 文 獻(xiàn)
[1] 戈悅迎 . 大數(shù)據(jù)時(shí)代信息安全與公民個(gè)人隱私保護(hù) [J]. 中國信息界 ,2014(01):21-23.
[2] 馮登國,張敏,李昊 . 大數(shù)據(jù)安全與隱私保護(hù) [J]. 計(jì)算機(jī)學(xué)報(bào) ,2014(01):34-42.