黃世榮
摘要:隨著信息技術的廣泛使用,各行業(yè)在近幾年所積累的數(shù)據(jù)成倍增長,對數(shù)據(jù)的分析與使用已經(jīng)成為了專門的學科領域。隨著大數(shù)據(jù)生成速度的不斷加快,數(shù)據(jù)量也不斷膨脹,給數(shù)據(jù)安全帶來更大風險。本文從大數(shù)據(jù)的定義出發(fā),探討大數(shù)據(jù)應用的本質特征并對大數(shù)據(jù)的風險進行簡要的探究。
關鍵詞:大數(shù)據(jù);應用模式;安全風險
中圖分類號: TP309 文獻標識碼:A 文章編號:1672-3791(2017)01(a)-0000-00
一、大數(shù)據(jù)的定義及應用特征
隨著數(shù)據(jù)數(shù)量的不斷增長,大數(shù)據(jù)的重要性日益得到了廣泛的認同。但是,目前對大數(shù)據(jù)的概念還有不同理解,人們似乎還認為大數(shù)據(jù)是個抽象的概念,從大數(shù)據(jù)的本質出發(fā),更深刻的理解大數(shù)據(jù)在社會經(jīng)濟等各方面的內涵,對于探討大數(shù)據(jù)的應用模式和安全風險控制具有重要意義。
1.大數(shù)據(jù)的基本定義
2011年,全球麥肯錫咨詢公司將大數(shù)據(jù)的根據(jù)形象的描述為下一個時代創(chuàng)新與生產(chǎn)力的最前沿。生動的指出了大數(shù)據(jù)是基于創(chuàng)新思想,超出了傳統(tǒng)數(shù)據(jù)庫范疇的,用來收集、存儲、管理和分析數(shù)據(jù)信息的方式。首先,大數(shù)據(jù)的數(shù)量是隨著時間的增長而不斷增長的。其次,不同層級的機構擁有和需要的數(shù)據(jù)集是不同的,當前通用的大數(shù)據(jù)計算單位是TB。第三,大數(shù)據(jù)從數(shù)量、速度和各類三個維度對大數(shù)據(jù)進行描述,從而也從這三個維度對大數(shù)據(jù)進行控制。因此,數(shù)據(jù)不斷龐大,擁有時效性和數(shù)據(jù)存在形式的多樣性,使大數(shù)據(jù)理論顛覆了傳統(tǒng)的數(shù)據(jù)庫理論,使信息技術站在了時代的最前沿。雖然學界對大數(shù)據(jù)的定義莫衷一是,數(shù)據(jù)的生成、采集、存儲、處理(分析)是大數(shù)據(jù)的基本要素。
2.大數(shù)據(jù)的主要應用特征
大數(shù)據(jù)的主要應用特征有以下幾方面:首先,大數(shù)據(jù)的數(shù)據(jù)量巨大,數(shù)據(jù)增長量通常以幾何級數(shù)的形式來進行計算。其次,數(shù)據(jù)類型繁多、原始類數(shù)據(jù)、多元型數(shù)據(jù)、函數(shù)數(shù)據(jù)等種類多樣。第三,數(shù)據(jù)處理速度不斷加快,隨著計算機技術的快速發(fā)展,數(shù)據(jù)運算和處理的能力越來越強,在數(shù)據(jù)分析中會為用戶提供大量有價值信息。通過對大數(shù)據(jù)的研究可以發(fā)現(xiàn),大數(shù)據(jù)可以用來進行趨勢推測,可以對個體數(shù)據(jù)進行剔除,可以用來對社會現(xiàn)象進行預測,也可以用來進行個性化的預測。大數(shù)據(jù)的應用范圍廣泛,數(shù)據(jù)處理能力越來越強,可以更長的時間和更廣的范圍為用戶提供依據(jù)。通過對大數(shù)據(jù)的分析,還能對真相進行有效辨識。
二、大數(shù)據(jù)的應用模式
大數(shù)據(jù)的應用模式建立在大數(shù)據(jù)的分析方式基礎之上,布隆過濾器、散列法、索引等方法都可以根據(jù)數(shù)據(jù)的規(guī)模,對數(shù)據(jù)進行有效的分析,從而為應用提供良好的基礎。大數(shù)據(jù)的應用有自身從不成熟到成熟的演變過程,最后廣泛的應用于社會經(jīng)濟的各個領域,從而為廣大用戶熟知和使用。
1.大數(shù)據(jù)的應用演化
大數(shù)據(jù)最初的應用是海量數(shù)據(jù)進行檢索的互聯(lián)網(wǎng)搜索平臺,在互聯(lián)網(wǎng)搜索平臺的助推下,大數(shù)據(jù)逐漸演出多種應用模式。首先,在商業(yè)系統(tǒng),最初是將企業(yè)的數(shù)據(jù)收集存儲到關系型數(shù)據(jù)庫系統(tǒng)中,以便于查詢和聯(lián)機處理。隨著互聯(lián)網(wǎng)用戶的增多,點擊商業(yè)網(wǎng)站用戶的信息日益增加,數(shù)據(jù)日志、用戶行為可在網(wǎng)站上獲取,從而為企業(yè)分析用戶提供了基本數(shù)據(jù)。其次,互聯(lián)網(wǎng)最初只用來傳遞電子郵件,在線社交的頻繁,視頻、圖片、音頻等不同結構類型的數(shù)據(jù)增加,使非結構化數(shù)據(jù)技術不斷成熟。第三,科學研究領域為了收集大量數(shù)據(jù),研究了數(shù)據(jù)分析、共享的平臺,使大數(shù)據(jù)廣泛應用成為可能。歷經(jīng)上述演化過程,根據(jù)數(shù)據(jù)的產(chǎn)生方式和結構特點,大數(shù)據(jù)主要應用在結構化數(shù)據(jù)、文本、WEB、多媒體、移動數(shù)據(jù)這6個領域里,并形成了相應的數(shù)據(jù)應用模式
2.大數(shù)據(jù)的主要應用模式
在科學的數(shù)據(jù)分析的基礎之上,大數(shù)據(jù)的應用主要有以下幾種模式:首先,租售數(shù)據(jù)的模式。通過廣泛的收集數(shù)據(jù),采用相關的數(shù)據(jù)分析技術,過濾到無關聯(lián)的數(shù)據(jù),保留時效性較強的數(shù)據(jù),定期為各行業(yè)提供數(shù)據(jù)服務的模式。有效而且龐大的數(shù)據(jù)庫是其它這種數(shù)據(jù)應用模式的基礎。其次,租售信息的模式。這種模式集中于某一行業(yè)或領域,廣泛收集行業(yè)有關數(shù)據(jù),再龐大數(shù)據(jù)處理能力的支持下,對數(shù)據(jù)進行有效整合,從而采集到對行業(yè)發(fā)展有價值的信息,向行業(yè)內企業(yè)出售信息來獲取回報的應用模式。第三,數(shù)字媒體的模式,主要利用新型網(wǎng)絡媒體,充分發(fā)揮新媒體傳遞信息速度快,可以實時進行傳遞、可進行有效互動的優(yōu)勢,對準特定的客戶群體,提供精準的快捷信息服務,同時能獲得有效的反饋信息。第四,空間運營模式。主要是為了搶占更多的數(shù)據(jù)資源,從而獲得數(shù)據(jù)資源的獨享性。第五,云計算服務。主要針對用戶的個性化需求,提供依托互聯(lián)網(wǎng)的動態(tài)虛擬化的信息資源,企業(yè)不再需要購買大量的設備設施,只需要向服務商交納相應用的使用費用即可。
三、大數(shù)據(jù)的安全風險控制
大數(shù)據(jù)的出現(xiàn)開戶了新的時代,使數(shù)據(jù)的價值變得日漸重要,也為數(shù)據(jù)的安全帶來的廣泛的擔憂。由于數(shù)據(jù)的規(guī)模更大、數(shù)據(jù)的各類更多,數(shù)據(jù)的結構也更加復雜,使維護數(shù)據(jù)安全的成本也隨之不斷提高,如何保證數(shù)據(jù)的安全轉移,如何控制數(shù)據(jù)不出現(xiàn)冗余的問題,都是數(shù)量安全需要研究的問題:
1.保持大數(shù)據(jù)的隱私
數(shù)據(jù)信息量的海量增加,數(shù)據(jù)處理的不斷開放,數(shù)據(jù)獲取渠道的增多,給數(shù)據(jù)隱私帶來了極大的挑戰(zhàn),面對大數(shù)據(jù)時代的互聯(lián)網(wǎng),數(shù)據(jù)隱私主要考慮兩方面的問題:首先,如何保護個人的隱私。數(shù)據(jù)信息采集技術越強,數(shù)據(jù)分析能力進步的越快,用戶就會在毫無察覺的情況下,將個人的興趣、愛好、特征等信息被潛在的獲取,用戶甚至對已經(jīng)被大數(shù)據(jù)分析出來的信息毫無察覺。其次,大數(shù)據(jù)獲得的信息未經(jīng)用戶的許可,就將信息隨意的傳輸和使用,在傳輸使用的過程中很可能存在著泄露的風險,如何保證大數(shù)據(jù)時代個人信息與隱私的安全,是大數(shù)據(jù)安全風險研究的首要命題。
2.保證大數(shù)據(jù)的質量
大數(shù)據(jù)的價值不僅源于龐大的數(shù)據(jù)量和快捷的速度,而且更來源于數(shù)據(jù)的質量。低質量的數(shù)據(jù)不僅浪費了互聯(lián)網(wǎng)資源,而且還無法被有效利用,甚至阻礙了大數(shù)據(jù)的發(fā)展。數(shù)據(jù)的質量與數(shù)據(jù)的生成、數(shù)據(jù)的采集、數(shù)據(jù)的傳統(tǒng)和存儲都有關系。數(shù)據(jù)的質量突出的表現(xiàn)為數(shù)據(jù)的精準性、完整性、冗余度和一致性,雖然學界致力于消除數(shù)據(jù)的冗余問題,加強數(shù)據(jù)的質量,還應當充分的考慮數(shù)據(jù)的自我修復和自我檢測的功能研發(fā)。
3.有效的安全機制
大數(shù)據(jù)種類的不斷豐富,給數(shù)據(jù)的安全帶來更大的風險,以往小規(guī)模加密的方法,不可能有效的在大數(shù)據(jù)時代應用。研究更高級別的密碼學方法,應當針對不同的數(shù)據(jù)結構和非結構數(shù)據(jù),采用不同的數(shù)據(jù)加密方法,從而更好的促進數(shù)據(jù)安全。同時,在當前大數(shù)據(jù)使用越來越廣泛今天,需要加強研發(fā)對數(shù)據(jù)的隔離措施,要建立對數(shù)據(jù)的可追溯機制,要使數(shù)據(jù)的可用性、可控性和完整性在高效的前提下都得到較好的保持。
4.大數(shù)據(jù)在安全領域的應用
保證大數(shù)據(jù)的安全,是信息技術研究的課題。同樣大數(shù)據(jù)也改革了信息技術,從而為信息安全技術發(fā)展帶來了革命,使信息安全技術走向了新的舞臺。例如,通過對入侵日志的分析,就可以發(fā)現(xiàn)潛在的安全漏洞,從而可以應對更高級別的安全威脅。通過對計算機病毒和漏洞的分析,就可以掌握某類型病毒或漏洞的特征,從而對更有效的應對這類威脅采用更好的方法。
結語:對于大數(shù)據(jù)應用模式的研究,應當從社會發(fā)展的實際需要做起,要根據(jù)實際情況,有效的整合云計算為代表的數(shù)據(jù)處理技術和存儲技術的研究,開發(fā)出更先進的應用模式,使大數(shù)據(jù)的深化歷程加快發(fā)展。通過對大數(shù)據(jù)風險的控制,可以更好的促進數(shù)據(jù)廣泛的應用于社會經(jīng)濟各個領域。
參考文獻:
[1]黃偉.基于SDS架構的多級DDoS防護機制[J].計算機工程與應用,2014,(05):26-27.
[2]馮永強,張良,馮怡,朱尚杰. 大數(shù)據(jù)應用的現(xiàn)狀與展望[J].信息化建設. 2015(12):118.