◆文俊峰
(中國移動通信集團山西有限公司 山西 030000)
當(dāng)前,社會上越來越多的行業(yè)已經(jīng)認識到大數(shù)據(jù)技術(shù)能夠為行業(yè)的發(fā)展帶來一定的便利性,并將大數(shù)據(jù)技術(shù)廣泛應(yīng)用到企業(yè)內(nèi)部工作上,提高企業(yè)的生產(chǎn)效率和發(fā)展速度。大數(shù)據(jù)技術(shù)在企業(yè)的深入應(yīng)用,使各個企業(yè)的網(wǎng)絡(luò)安全體系構(gòu)建工作被提上日程。全面地認識大數(shù)據(jù)技術(shù)的作用及對網(wǎng)絡(luò)安全進行防護是各個企業(yè)目前要考慮的重要問題。
(1)數(shù)據(jù)傳播速度加快
我國進入網(wǎng)絡(luò)信息時代后,網(wǎng)絡(luò)發(fā)展如火如荼,網(wǎng)絡(luò)信息數(shù)據(jù)飛快式增長。在如此大量的數(shù)據(jù)規(guī)模下,如果采用傳統(tǒng)的數(shù)據(jù)傳播方式,則會大大影響工作質(zhì)量和效率。運用新時期的大數(shù)據(jù)技術(shù)進行數(shù)據(jù)傳播,在提高了數(shù)據(jù)傳播速度的同時,還保障了所傳播數(shù)據(jù)的有效性和準(zhǔn)確性。
(2)提高網(wǎng)絡(luò)安全分析系統(tǒng)的準(zhǔn)確度
信息時代下,各種網(wǎng)絡(luò)平臺和信息媒介每時每刻都在進行大量的數(shù)據(jù)傳播,網(wǎng)絡(luò)用戶的信息數(shù)據(jù)面臨著隨時會被泄露的風(fēng)險,網(wǎng)絡(luò)用戶的個人信息日趨透明化,信息安全根本沒有辦法得到保障。在網(wǎng)絡(luò)安全分析系統(tǒng)中引進大數(shù)據(jù)技術(shù),在對數(shù)據(jù)進行分析時,可以以多種方式從不同的角度進行信息處理,提高網(wǎng)絡(luò)安全系統(tǒng)數(shù)據(jù)處理的準(zhǔn)確度[1]。
(3)延伸網(wǎng)絡(luò)安全分析系統(tǒng)的深度
過往的網(wǎng)絡(luò)安全分析系統(tǒng)在對大規(guī)模的流動信息數(shù)據(jù)進行分析時,一方面,無法保證所分析數(shù)據(jù)的準(zhǔn)確性,成本較高,另一方面,由于技術(shù)比較落后,面對大規(guī)模的信息數(shù)據(jù)時難免會有些力不從心。大數(shù)據(jù)技術(shù)可以延伸網(wǎng)絡(luò)安全系統(tǒng)的分析深度,以較低的成本和較高的效率在海量的數(shù)據(jù)中分析出有效的數(shù)據(jù),并且能夠更加全面深入地對數(shù)據(jù)進行價值挖掘。
(1)對信息數(shù)據(jù)進行收集
大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)安全分析中能夠?qū)π畔?shù)據(jù)進行離線收集,包括對信息數(shù)據(jù)進行提取、轉(zhuǎn)換、加載的全過程。同時也可以對數(shù)據(jù)進行實時收集,充分發(fā)揮Flume、Kafka 和Storm 三方面的功能,對信息數(shù)據(jù)進行采集、緩沖,最后進行便利的數(shù)據(jù)在線處理。此外,還可以運用Crawler 等進行數(shù)據(jù)互聯(lián)網(wǎng)收集。
(2)對信息數(shù)據(jù)進行存儲
網(wǎng)絡(luò)安全分析中應(yīng)用大數(shù)據(jù)技術(shù),可以對收集到的數(shù)據(jù)進行規(guī)模和類型劃分,在此基礎(chǔ)上選擇不同的存儲形式。針對原始數(shù)據(jù)信息,可以運用GBase、HBase 對數(shù)據(jù)進行存儲,針對需要實時迅速進行分析的數(shù)據(jù),可以運用Storm、Spark 計算方法,將信息數(shù)據(jù)以流式的形式存儲[2]。
(3)對信息數(shù)據(jù)進行全面分析
在網(wǎng)絡(luò)安全分析中應(yīng)用大數(shù)據(jù)技術(shù),不僅可以對信息數(shù)據(jù)進行深度挖掘和分析,還能夠?qū)Τ霈F(xiàn)的威脅網(wǎng)絡(luò)安全的風(fēng)險及漏洞進行檢查和恢復(fù),通過檢測到僵尸網(wǎng)絡(luò)中的源頭數(shù)據(jù)、擴大對數(shù)據(jù)的搜索區(qū)域、查找主機中存在的侵入風(fēng)險等功能,實現(xiàn)網(wǎng)絡(luò)安全防護。
(1)網(wǎng)絡(luò)安全平臺構(gòu)建的必要性
過往模式下的人工管理效率低下、對數(shù)據(jù)的整理不夠?qū)崟r、對數(shù)據(jù)的挖掘不夠全面,人工管理的一系列問題使人工管理的部分模式面臨淘汰和更新。在解決人工管理帶來的種種問題的要求上,需要提高管理的效率和實時性,通過建立網(wǎng)絡(luò)安全分析平臺來防范風(fēng)險,保障網(wǎng)絡(luò)設(shè)備的安全。網(wǎng)絡(luò)安全平臺構(gòu)建后,可以對平臺中安全防范軟件的信息數(shù)據(jù)進行提取分析,了解網(wǎng)絡(luò)安全現(xiàn)狀,因此,網(wǎng)絡(luò)安全平臺的構(gòu)建具有一定的重要性[3]。
(2)網(wǎng)絡(luò)安全平臺組成部分
網(wǎng)絡(luò)安全平臺的構(gòu)建主要包括數(shù)據(jù)采集層、數(shù)據(jù)處理層、數(shù)據(jù)分析層、數(shù)據(jù)訪問層、數(shù)據(jù)應(yīng)用層等五個方面。
(3)網(wǎng)絡(luò)安全平臺的技術(shù)支撐
在數(shù)據(jù)采集方面,網(wǎng)絡(luò)安全平臺主要是利用ETL、Flume、Kafka 和Storm 方法進行離線和實時數(shù)據(jù)采集,使數(shù)據(jù)收集更加規(guī)?;?、有效化和準(zhǔn)確化。在數(shù)據(jù)存儲方面,以64M 字節(jié)的數(shù)據(jù)塊作為基本存儲單元,使用HDFS 分布式文件系統(tǒng)對數(shù)據(jù)進行存儲。在數(shù)據(jù)分析方面,使用HiveQL 語言搜索非結(jié)構(gòu)化信息數(shù)據(jù),并使用Hive 工具對搜索到的信息進行整合和分析。同時,根據(jù)不同的數(shù)據(jù)需求特點進行分析插件定制,進一步做好數(shù)據(jù)分析工作[4]。
(1)改進數(shù)據(jù)采集技術(shù)
作為大數(shù)據(jù)技術(shù)在網(wǎng)絡(luò)安全分析中的首要應(yīng)用,數(shù)據(jù)采集是先導(dǎo)工作,只有在做好數(shù)據(jù)采集準(zhǔn)確化、真實化的基礎(chǔ)上,才能夠進行下一步的數(shù)據(jù)分析工作。數(shù)據(jù)采集的單純性已經(jīng)不能滿足于大數(shù)據(jù)技術(shù)未來的發(fā)展,因此,要改進數(shù)據(jù)采集技術(shù)。比如,在時代發(fā)展進程中總結(jié)出來的在日志采集系統(tǒng)中使用Flume 對安全數(shù)據(jù)進行采集的方法,和其他的數(shù)據(jù)采集方法進行比較,可以發(fā)現(xiàn)其速度更加快、容錯能力強的優(yōu)點;用Crawler4j 框架進行網(wǎng)絡(luò)數(shù)據(jù)采集時,可以大大提升速度和效率??偠灾瑪?shù)據(jù)采集技術(shù)的改進主要須落實在數(shù)據(jù)提取的速度、效率、準(zhǔn)確、安全、錯誤數(shù)據(jù)的篩選等幾個方面[5]。
(2)改進數(shù)據(jù)存儲技術(shù)
網(wǎng)絡(luò)信息平臺及媒介中越來越多的海量信息數(shù)據(jù),對數(shù)據(jù)存儲技術(shù)來說是一個嚴峻的考驗,大數(shù)據(jù)技術(shù)要考慮如何改進數(shù)據(jù)存儲技術(shù),具體可以從以下幾個方面進行改進:首先,要對收集到的信息數(shù)據(jù)采取加密手段,防止系統(tǒng)中的風(fēng)險因素造成信息數(shù)據(jù)的丟失,確保信息數(shù)據(jù)安全存儲。接下來,可以創(chuàng)建一個相對來說較大的臨時數(shù)據(jù)存儲系統(tǒng)。最后利用云存儲技術(shù),對信息數(shù)據(jù)進行大量的安全的存儲,規(guī)避了網(wǎng)絡(luò)的風(fēng)險因素。此外,要加快對網(wǎng)絡(luò)存儲手段的創(chuàng)新腳步,牢牢把握信息科技時代發(fā)展的方向和前沿,更好地進行數(shù)據(jù)存儲等工作[6]。
(3)保障信息數(shù)據(jù)的完整性
網(wǎng)絡(luò)中泛濫的危險信息和垃圾信息會對網(wǎng)絡(luò)平臺進行惡意攻擊,進而造成信息數(shù)據(jù)丟失,自身的失誤操作也是造成數(shù)據(jù)流失的一個主要原因。因此,對數(shù)據(jù)完整性的保障也是十分必要的。為了保障信息數(shù)據(jù)的完整性,可以從提升網(wǎng)絡(luò)安全平臺中的防火墻等級、運用先進的病毒入侵防范技術(shù)兩方面入手。然后運用身份認證等技術(shù)對數(shù)據(jù)進行加密,為數(shù)據(jù)提供一個安全的保障環(huán)境。
總而言之,隨著網(wǎng)絡(luò)信息技術(shù)的發(fā)展進程不斷加快,網(wǎng)絡(luò)環(huán)境也愈發(fā)復(fù)雜,在網(wǎng)絡(luò)安全分析中應(yīng)用大數(shù)據(jù)技術(shù),解決了數(shù)據(jù)收集、存儲、處理方面的一些原有問題,使數(shù)據(jù)的收集更加方便快捷,數(shù)據(jù)的傳輸速度更快、效率更高,數(shù)據(jù)的存儲更加安全完整,數(shù)據(jù)的分析工作也更加有深度有價值,在我國當(dāng)前的網(wǎng)絡(luò)安全體系的構(gòu)建中占據(jù)著重要的地位。