郭健
(山東省濱海公安局網(wǎng)安支隊 山東省東營市 257000)
隨著我國的信息科學技術(shù)不斷發(fā)展,網(wǎng)絡信息技術(shù)也得到了快速的普及,人們更多地關注網(wǎng)絡安全問題的重要性。網(wǎng)絡安全對于個人隱私有著直接的聯(lián)系,同時會對國家的機密信息形成影響,由于大數(shù)據(jù)技術(shù)的不斷成熟和發(fā)展,使得信息數(shù)量在不斷呈現(xiàn)爆炸式的增長,這在很大程度上加大了計算機網(wǎng)絡安全的管理難度,與此同時,這也對當前的網(wǎng)絡安全模式提出了更多的發(fā)展空間。只有不斷地加強對大數(shù)據(jù)的管理,才能更多地保證大數(shù)據(jù)網(wǎng)絡信息的安全穩(wěn)定發(fā)展。
在科學技術(shù)不斷發(fā)展的今天,各種IT 行業(yè)之間的構(gòu)架越來越復雜,由此延伸出更多的信息工具,無形中使得網(wǎng)絡數(shù)據(jù)相應的業(yè)務正在不斷的增多。在這個數(shù)據(jù)時代的背景下,網(wǎng)絡的運用過程中,復雜性在增加,傳統(tǒng)的網(wǎng)絡設備已經(jīng)不能滿足信息化技術(shù)發(fā)展的步伐,并且通過對網(wǎng)絡運行的安全性進行分析,這個過程能保留大量的網(wǎng)站信息,但是要花費很大的成本,因此,為了有效的提升網(wǎng)絡安全的有效性,可以借助云計算平臺進行相關數(shù)據(jù)的分析,獲取更多的數(shù)據(jù)包漏洞以及網(wǎng)絡信息的數(shù)據(jù)分析,然而,在這個數(shù)據(jù)的整理過程當中,包括了各種各樣的結(jié)構(gòu)。其中有非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù),這些數(shù)據(jù)是發(fā)展非常迅速的,相比較傳統(tǒng)的網(wǎng)絡數(shù)據(jù)而言,這種數(shù)據(jù)整理已經(jīng)不能滿足網(wǎng)絡安全的正常運行,為此,只有借助大數(shù)據(jù)技術(shù)對網(wǎng)絡安全信息開展分析工作[1]。
在這個網(wǎng)絡發(fā)展快速的階段,大數(shù)據(jù)技術(shù)呈現(xiàn)多樣化的特點,在以往的數(shù)據(jù)體系結(jié)構(gòu)下,對于大數(shù)據(jù)進行有效的處理,就當前的數(shù)據(jù)信息來看,大數(shù)據(jù)是一種新的資源。然而,通過技術(shù)角度進行大數(shù)據(jù)分析和處理。其中對于大數(shù)據(jù)技術(shù)的分析概念如下:大數(shù)據(jù)是通過對網(wǎng)絡信息的搜集和整理,再結(jié)合相應的數(shù)據(jù)處理技術(shù),展示出大數(shù)據(jù)獨特的技術(shù)和方法等[2]。
隨著互聯(lián)網(wǎng)的迅速發(fā)展,給人們提供了更多的生活便利,同時也給網(wǎng)絡安全分析帶來了更大的負擔,具體表現(xiàn)在以下兩方面:
(1)網(wǎng)絡安全需要處理的數(shù)據(jù)量在不斷地增多,并且數(shù)據(jù)的種類也呈現(xiàn)多種多樣的趨勢,這就需要結(jié)合多維分析法,才能產(chǎn)生更好的效果。
(2)隨著數(shù)據(jù)量的增加和傳輸速度的加快,要完成對數(shù)據(jù)的有效分析,就必須提高對信息采集的速度,這無疑增加了網(wǎng)絡安全分析的難度。
相比較傳統(tǒng)網(wǎng)絡安全分析系統(tǒng)而言,應用結(jié)構(gòu)化的數(shù)據(jù)庫,通過對數(shù)據(jù)儲存,這種方式使得網(wǎng)絡安全的運營成本增加,為了降低成本,通過對數(shù)據(jù)進行應對處理,降低數(shù)據(jù)的大小,提高儲存的容量,但是這種方式一般會導致數(shù)據(jù)在處理過程當中出現(xiàn)丟失的情況,并且長時間儲存信息也會造成數(shù)據(jù)的丟失,相比較傳統(tǒng)的網(wǎng)絡安全分析而言,在面對復雜的數(shù)據(jù)處理過程當中,不能充分的發(fā)揮好具體的作用,這種分析的速度和訪問的效率都滿足不了,當下的網(wǎng)絡發(fā)展的需求[3]。
相比較而言,大數(shù)據(jù)技術(shù)對于當今的網(wǎng)絡安全分析取得了較為明顯的效果:
(1)大數(shù)據(jù)技術(shù)能夠提升網(wǎng)絡安全分析的數(shù)據(jù)儲存量,對于復雜的非結(jié)構(gòu)化的數(shù)據(jù),大數(shù)據(jù)源能夠保證效率的前提下進行有效的分析,這就需要保證數(shù)據(jù)的完整性。
(2)在大數(shù)據(jù)技術(shù)的使用背景下,可以降低網(wǎng)絡安全分析的運營成本。在這過程當中,會使用分布式的數(shù)據(jù)庫,相比較傳統(tǒng)的機構(gòu)化的數(shù)據(jù)庫而言,它相對經(jīng)濟實惠,并且對于硬件的要求比較低,在低要求的設備中進行數(shù)據(jù)分析,也能保證平穩(wěn)運行,從而大大的降低網(wǎng)絡安全分析系統(tǒng)的成本。
(3)在大數(shù)據(jù)技術(shù)下,最為顯著的特點是能夠保證網(wǎng)絡安全分析系統(tǒng)的工作效率,在大數(shù)據(jù)技術(shù)下能夠完成對非結(jié)構(gòu)數(shù)據(jù)的儲存以及處理這種數(shù)據(jù)儲存以及訪問的速度是非??斓模沟孟到y(tǒng)數(shù)據(jù)分析處理要求較高。
(4)大數(shù)據(jù)技術(shù)運用到網(wǎng)絡安全分析之中,可以提升數(shù)據(jù)處理的速度和精確度。大數(shù)據(jù)技術(shù)能夠從多維度多層次,對數(shù)據(jù)進行分析,這樣提高網(wǎng)絡安全系統(tǒng)的數(shù)據(jù)處理有效性[4]。
就目前的發(fā)展情況來看,通過對日志的流量和數(shù)量進行處理。在進行數(shù)據(jù)信息的管理過程中,能將數(shù)據(jù)整合在一起,并且結(jié)合大數(shù)據(jù)的信息技術(shù)管理方式,能對數(shù)據(jù)進行分析和整理,一旦發(fā)生了數(shù)據(jù)存在隱患,那么就會采取預警,那么大數(shù)據(jù)技術(shù)就會根據(jù)安全隱患的層級進行有效的處理。在網(wǎng)絡安全分析的基礎上,使用大數(shù)據(jù)能減少網(wǎng)絡安全分析的時間,提升網(wǎng)絡安全的運營,通過傳統(tǒng)的被動防御方式轉(zhuǎn)化為主動防御的方式,大數(shù)據(jù)技術(shù)在網(wǎng)絡安全分析中的運用,具體包括了以下幾方面:
運用大數(shù)據(jù)技術(shù),通過Flume Scribe 等相關工具對網(wǎng)絡系統(tǒng)中所有數(shù)據(jù)進行分布式的采集,在每秒內(nèi)可以完成百兆以上的數(shù)據(jù)采集工作,特別是針對一些用戶的日志數(shù)據(jù)處理起著良好的作用,在此之外,可以利用傳統(tǒng)模式對數(shù)據(jù)信息進行采集,將全系統(tǒng)進行方位流量數(shù)據(jù)采集,比如通過大數(shù)據(jù)技術(shù)對門戶網(wǎng)站中每天產(chǎn)生的信息進行收集,采集甚至可以對指定網(wǎng)站的數(shù)據(jù)內(nèi)容以及媒體報道的信息進行采集,要想看什么信息及時搜索就能獲取,不少用戶在進行雙11 過程當中會進行淘寶搶購,這就是利用大數(shù)據(jù)技術(shù),每天自動采集網(wǎng)上的價格以及更新情況,甚至產(chǎn)品的說明圖片就能一目了然[5]。
對于信息儲存技術(shù)是使用HDFS 開展數(shù)據(jù)采集后的存儲,如果在一段時間內(nèi)文件數(shù)據(jù)過大,想要保證數(shù)據(jù)的處理,以及分析率在儲存過程當中可以使用。例如新聞媒體都要自動采集成千上萬個指定網(wǎng)站上的新聞內(nèi)容,并且對于這些內(nèi)容進行整理儲存。隨后,根據(jù)相關工作人員對這個區(qū)域的情況整合,按照專題編寫,當日的新聞內(nèi)容,每天發(fā)布的內(nèi)容要進行一定的儲存,才方便日后的總結(jié)和檢索,由于這種大數(shù)據(jù)技術(shù)用戶在該網(wǎng)站進行新聞信息查詢,可以輕松的進行操作[6]。
對于信息的檢索,可以采用Map Reduce 作為架構(gòu)形式,在這個環(huán)節(jié),通過進行檢索的方式,對內(nèi)容進行分析和歸類,大幅度提升信息的檢索能力,由此可見,大數(shù)據(jù)技術(shù)在信息檢索方面有著很大的推動作用,比如企業(yè)要想在開會之前尋找相關的內(nèi)容,作為參考,就可以利用大數(shù)據(jù)技術(shù)進行信息檢索,在這個過程當中,可以根據(jù)國內(nèi)外相應的檢索技術(shù)和參考文獻進行對比分析,從而尋找出競爭對手。與此同時,大數(shù)據(jù)技術(shù)能夠?qū)ν袠I(yè)的論壇信息進行收集整理,并且及時了解出消費者的潛在消費意識和需求,通過數(shù)據(jù)分析得出消費者的消費意向,通過準確的對網(wǎng)絡公共信息的采集和整理,甚至在這種大數(shù)據(jù)的檢索功能,挖掘出潛在客戶的一些信息和資料。
數(shù)據(jù)分析也是數(shù)據(jù)解析的一種,該技術(shù)利用HIVE 方法對數(shù)據(jù)進行展開分析,使用SQL 中HIVEQL 語言使HDFS 和HBASE 可以對不能構(gòu)成結(jié)構(gòu)式的數(shù)據(jù)進行檢索。此外,大數(shù)據(jù)技術(shù)下還能夠利用Mahout 達到以Hadoop 為前提的機械研究所有數(shù)據(jù)能夠進行深度挖掘與整理解析。例如,政府機關以及軍隊可以對信息進行實時跟蹤,了解國內(nèi)外的新聞數(shù)據(jù),并且通過這個數(shù)據(jù)整理出這個地方的政策法規(guī),以及經(jīng)濟產(chǎn)業(yè)的信息。通過利用大數(shù)據(jù)技術(shù)解決與因特網(wǎng)隔離重要部門對于因特網(wǎng)的信息問題進行實時的解決,針對政府網(wǎng)站的各地址,網(wǎng)站的信息進行采集和整理。
多元數(shù)據(jù)和多階段組合的關聯(lián)性分析是十分復雜,并且這個過程中確定好相應的采集任務,隨后,針對不同的目標數(shù)據(jù)進行整理,從而保證收集的數(shù)據(jù)有效性,針對不同的數(shù)據(jù)目標進行采集,通過配置更好的信息管理方式。對信息進行梯度分析辦法,從而達到與目標站點信息同步的方式,對于采集的結(jié)果完成數(shù)據(jù)重構(gòu)的方式,最后通過發(fā)布任務服務器的方式,將數(shù)據(jù)發(fā)布到應用平臺。大數(shù)據(jù)技術(shù)能夠不斷地增強數(shù)據(jù)的分析以及解析效率,及時發(fā)現(xiàn)解析的多元數(shù)據(jù),從而防止安全隱患,并阻止網(wǎng)絡攻擊產(chǎn)生。如果一個計算機存在安全隱患,甚至還有攻擊現(xiàn)象,通過大數(shù)據(jù)可以查看計算機系統(tǒng)中是否存在同樣相似的情況,這樣在最短的時間內(nèi)找到問題,產(chǎn)生的原因,并且采取相應的措施,保證所有的機械處于正常運行的狀態(tài)。例如,美國國家衛(wèi)生研究院的生物科技信息中心(NCBI)公布的大量基因相關數(shù)據(jù),這些數(shù)據(jù)的來源可以實時跟蹤、采集相關的國內(nèi)外科技信息與新聞,對科研數(shù)據(jù)在各個網(wǎng)站網(wǎng)頁中進行整合,再通過本地文本數(shù)據(jù)抽取最后整合出完整且有實際作用的最終數(shù)據(jù)。
隨著我國的信息技術(shù)不斷的發(fā)展和普及,大數(shù)據(jù)技術(shù)更多的參與到網(wǎng)絡平臺的建設之中,通過對網(wǎng)絡安全平臺的構(gòu)建,為用戶提供一個網(wǎng)絡安全使用環(huán)境。
(1)通過積極的構(gòu)建大數(shù)據(jù)技術(shù)安全平臺,首先要對大數(shù)據(jù)的儲存曾進行數(shù)據(jù)分析,通過積極的構(gòu)建平臺框架,針對數(shù)據(jù)采集進行分布式的收集信息,在這個過程中,通過運用信息管理的方式,對于信息用戶的方式能對安全信息和身份方式能更好地進行保密,使得信息進行永久的儲存。在大數(shù)據(jù)技術(shù)的背景下,可以使用結(jié)構(gòu)化的儲存模式,再利用相應的文件層,進行數(shù)據(jù)分布收集,提升用戶使用網(wǎng)絡的速度和效率。
(2)大數(shù)據(jù)平臺的建設,其中包含了信息儲存、信息采集以及信息解析的方式,那么相對于其他的信息儲存層而言,解析層的功能相對完善,有效把握信息的特征,對于出現(xiàn)網(wǎng)絡信息安全問題漏洞,能夠及時的進行解決。除此之外,大數(shù)據(jù)可以通過顯示層對數(shù)據(jù)進行更好的呈現(xiàn),通過利用多個維度的方式保證網(wǎng)絡安全,處于正常運行的狀態(tài)。
(3)通過數(shù)據(jù)的分析和挖掘,在網(wǎng)絡平臺的建設過程當中,主要是利用機械化的學習方式開展的,通過對試卷留的分析,能這樣系統(tǒng)數(shù)據(jù)作為事件類型進行分類,再進行關聯(lián)行的時間中,可以對試件進行分門別類,在針對海量信息的查詢中,找出網(wǎng)絡安全存在的各種問題。
(4)對于網(wǎng)絡安全平臺的安全性問題,這將直接影響到未來網(wǎng)絡的使用體驗,以及網(wǎng)絡發(fā)展空間。在網(wǎng)絡發(fā)展的過程當中,涉及到安全管理、密碼學、移動代碼指令、保護操作系統(tǒng)以及網(wǎng)絡安全管理等相應的內(nèi)容,通過將計算機和軟件結(jié)合在一起,在互聯(lián)網(wǎng)和內(nèi)部網(wǎng)絡建立一個安全運行的體系,這成為保護網(wǎng)絡安全運行的關鍵,從而避免非法入侵的事件發(fā)生。
總而言之,在當今大數(shù)據(jù)發(fā)展的背景下,網(wǎng)絡信息數(shù)據(jù)在不斷的普及,在這個過程中,人們的生活和工作更多地依賴與網(wǎng)絡體現(xiàn),因此,人們更多地關注網(wǎng)絡信息安全系統(tǒng)建設。在大數(shù)據(jù)系統(tǒng)中能更好地優(yōu)化配置,能夠為人們提供安全上網(wǎng)的環(huán)境,不管是信息的收集整理,甚至是最后信息呈現(xiàn)方式,數(shù)據(jù)的應用對所有的使用者言都有著不可比擬的作用。在這個平臺上為用戶提供海量信息,同時為其生活工作帶來更大的便利,只有不斷提升網(wǎng)絡安全的管理,增強網(wǎng)絡安全抵御能力,才能為用戶的使用解決后顧之憂。