李元圓*,王延龍
(天津中車機輛裝備有限公司,天津,300232)
大數(shù)據(jù)在不同領(lǐng)域和不同角度的定義各不相同,對于信息技術(shù)來說,大數(shù)據(jù)指的是使用傳統(tǒng)處理數(shù)據(jù)的應(yīng)用,或是當(dāng)前數(shù)據(jù)庫管理工具難以進行處理的復(fù)雜且數(shù)量巨大的數(shù)據(jù)集,這些多樣而海量的數(shù)據(jù)超出常規(guī)數(shù)據(jù)庫處理和分析的能力。大數(shù)據(jù)具有海量化、多樣化、復(fù)雜化、快速化以及價值密度低等諸多特點。
大數(shù)據(jù)不僅擁有海量化、多樣化、復(fù)雜化等特點,還有頻繁使用、多次訪問、生命周期長等特點,特別是引入數(shù)據(jù)合作商與云服務(wù)商后使得數(shù)據(jù)信息竊取與泄露的風(fēng)險增加,如果不能保證數(shù)據(jù)信息存儲的安全,那么用戶與企業(yè)可能會有極大的損失。
通常來說,快照、數(shù)據(jù)鏡像、RAID、異地備份等是較為常見的數(shù)據(jù)信息恢復(fù)和備份機制。伴隨數(shù)據(jù)量到達了PB等級,HADOOP成為當(dāng)前使用最多的大數(shù)據(jù)架構(gòu),HADOOP所具有的分布式系統(tǒng)HDFS能夠通過數(shù)據(jù)信息的恢復(fù)與備份機制來有效保護數(shù)據(jù)。HDFS把各個文件都分成數(shù)據(jù)塊來進行存儲,最后一個數(shù)據(jù)塊以外的其他數(shù)據(jù)塊具有相同的大小。全部文件數(shù)據(jù)塊都進行多次保存,提高了數(shù)據(jù)信息的容錯率,使得用戶能夠?qū)ξ募母北鞠禂?shù)與數(shù)據(jù)塊大小進行設(shè)置[1]??刂乒?jié)點管理著所有的復(fù)制數(shù)據(jù),數(shù)據(jù)節(jié)點定期向其發(fā)送證明自己正常工作的心跳信息與數(shù)據(jù)塊列表、硬盤、CPU等自身狀態(tài)。
VPN能夠使數(shù)據(jù)信息傳輸過程的安全得以保證,不過數(shù)據(jù)通過明文形式在系統(tǒng)中存儲時,對于外來入侵者的攻擊、修改與破壞就相對脆弱,將重要數(shù)據(jù)信息的存儲進行加密是十分必要的技術(shù)手段。一般來說,數(shù)據(jù)加密算法包括非對稱加密與對稱加密。非對稱加密算法包含RSA、ELGAMAL等,這些算法的解密與加密使用不同的密匙,一個私匙和一個公匙。對稱加密算法包含RC6、RC5、RC4、AES、DES等,這些算法的解密與加密使用相同的密匙。在具體使用過程中,通常把非對稱加密算法與對稱加密算法相結(jié)合,數(shù)據(jù)加密使用非對稱密匙算法,密匙分配使用對稱密匙加密算法,這種方法對大數(shù)據(jù)環(huán)境下海量數(shù)據(jù)的加密十分適合。
信息采集指的是對數(shù)據(jù)的匯集與采集環(huán)節(jié),其中主要的安全問題是匯集與采集過程中出現(xiàn)的傳輸安全問題,具體指數(shù)據(jù)信息的防止重放攻擊、真實性、完整性與機密性。當(dāng)前主要利用VPN(即虛擬專用網(wǎng))技術(shù)在管理節(jié)點與數(shù)據(jù)節(jié)點間設(shè)置 VPN來達到安全傳輸目的。VPN技術(shù)實現(xiàn)了配置管理技術(shù)、密碼技術(shù)、協(xié)議封裝技術(shù)以及隧道技術(shù)的有機結(jié)合,在目的端與源端間利用安全通道技術(shù)建立一個安全性高的數(shù)據(jù)通道,把待傳輸?shù)臄?shù)據(jù)信息進行協(xié)議封裝與加密處理,嵌入另一個協(xié)議報文中,然后像傳輸一般數(shù)據(jù)報文的方式在網(wǎng)上傳輸[2]。通過這樣的處理,使得通道里的嵌入信息只有目的端與源端的用戶才能處理及解釋,對其他用戶來說只是一種無實際意義的數(shù)據(jù)信息。
信息發(fā)布指的是深入分析和挖掘大數(shù)據(jù)后,將挖掘出的結(jié)果信息輸出到數(shù)據(jù)應(yīng)用實體的過程。在信息發(fā)布前應(yīng)使用相關(guān)的安全審計技術(shù)來仔細審查將要輸出的數(shù)據(jù),保證輸出數(shù)據(jù)具有不超限、無隱私、不泄密的特點。不過,任何安全審計技術(shù)都有一定的漏洞,因此,應(yīng)使用數(shù)字水印技術(shù)(即數(shù)據(jù)溯源機制)來確保信息發(fā)布后如果出現(xiàn)隱私泄露與機密泄露等信息安全問題可以第一時間找到產(chǎn)生問題的實體與環(huán)節(jié)。
信息溯源指的是定位并標(biāo)記大數(shù)據(jù)不同周期與環(huán)節(jié)的操作,當(dāng)出現(xiàn)信息安全問題后,能夠快速定位到發(fā)生問題的責(zé)任者與環(huán)節(jié),以便解決對應(yīng)的信息安全問題。數(shù)據(jù)溯源可采用數(shù)字水印技術(shù),這種技術(shù)能夠把部分數(shù)字水印等標(biāo)識信息嵌入到軟件、文檔、多媒體等數(shù)字載體,根據(jù)數(shù)據(jù)隱藏原理讓水印標(biāo)志對外不可見,不但不會對原數(shù)據(jù)信息造成損壞,還能夠?qū)?shù)據(jù)信息進行標(biāo)記。在發(fā)布數(shù)據(jù)信息的出口處構(gòu)建數(shù)字水印加載體系,在發(fā)布數(shù)據(jù)信息時,對于主要的數(shù)據(jù)信息,會給每個訪問者提供加載了唯一水印的數(shù)據(jù)。一旦出現(xiàn)隱私問題與機密泄露等情況時,能夠根據(jù)提取的水印快速確定泄露數(shù)據(jù)信息的源頭,從而盡快對其進行處理。
安全審計指的是將系統(tǒng)相關(guān)的部分或全部活動記錄下來的基礎(chǔ)上,對這些活動進行評估審查與分析處理,尋找潛在的安全隱患,計算、稽查和審核系統(tǒng)安全情況,查找導(dǎo)致安全事故的原因,從而進行妥善處理。當(dāng)前經(jīng)常使用的審計技術(shù)包括代理審計技術(shù)、網(wǎng)關(guān)審計技術(shù)、網(wǎng)絡(luò)監(jiān)聽審計技術(shù)、日志審計技術(shù)等。
信息挖掘指的是自動將隱藏在海量數(shù)據(jù)中的有用信息抽取出來的過程,也是大數(shù)據(jù)的應(yīng)用核心。信息挖掘?qū)崿F(xiàn)了空間數(shù)據(jù)分析、信息檢索、神經(jīng)網(wǎng)絡(luò)、模式識別、高性能運算、統(tǒng)計學(xué)、機器學(xué)習(xí)、人工智能以及數(shù)據(jù)庫等諸多領(lǐng)域的技術(shù)與理論。信息挖掘具有一定的專業(yè)性,這就決定了大部分持有大數(shù)據(jù)的相關(guān)機構(gòu)在信息挖掘方面是非專業(yè)的[3]。因此,挖掘大數(shù)據(jù)核心價值時會有第三方挖掘機構(gòu)加入,要想確保其在挖掘大數(shù)據(jù)時不竊取信息、不添加惡意程序,首先要做的就是認真數(shù)據(jù)挖掘方的身份信息。經(jīng)常使用的認證機制包括生物識別技術(shù)、動態(tài)口令、公共密匙PKI及KERBEROS認證機制等。其中,生物識別技術(shù)能通過虹膜、人臉、聲紋、指紋來對人類身份進行認證,且不需要記憶密碼;動態(tài)口令能在登陸客戶端時保證每次提交的認證信息都不相同,有效增強認證身份的安全性;公共密匙PKI是一種根據(jù)非對稱密碼技術(shù)提供相關(guān)安全服務(wù)的網(wǎng)絡(luò)安全設(shè)施,能將用戶標(biāo)識信息與公匙進行捆綁,確保在網(wǎng)上傳輸過程中的安全;KERBEROS指的是通過服務(wù)器第三方網(wǎng)絡(luò)協(xié)議對分布式網(wǎng)絡(luò)中接入用戶的身份信息進行認證的一種認證機制。
總而言之,基于大數(shù)據(jù)環(huán)境背景下確保信息系統(tǒng)安全是十分重要的。因此,在大數(shù)據(jù)環(huán)境背景下,企業(yè)應(yīng)通過信息存儲安全技術(shù)、信息采集安全技術(shù)、信息發(fā)布安全技術(shù)、信息挖掘安全技術(shù)等信息系統(tǒng)安全保障技術(shù)來確保信息系統(tǒng)安全,嚴(yán)格管控數(shù)據(jù)信息存儲、采集、發(fā)布、挖掘等環(huán)節(jié),推動信息系統(tǒng)的平穩(wěn)運行。
[1] 王社,張琪,李芙蓉.《安全防范系統(tǒng)》課程信息化教學(xué)設(shè)計與實踐——以“視頻監(jiān)控系統(tǒng)前端設(shè)備的安裝與調(diào)試”為例[J].課程教育研究,2018,(18):85-86.
[2] 常新功.系統(tǒng)與技術(shù):金融業(yè)安全發(fā)展選擇——金融危機后的十年:金融機構(gòu)風(fēng)險管理信息系統(tǒng)的建設(shè)歷程與啟示[J].當(dāng)代金融家,2018,(01):52-55.
[3] 何文海.基于山東高考報名信息系統(tǒng)泄露分析大數(shù)據(jù)視域下信息安全問題及保障措施[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2017,(11):93+95.
[4] 黃一洪.醫(yī)院信息系統(tǒng)的網(wǎng)絡(luò)安全與解決策略研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2018,(07):108+110.
[5] 閆衛(wèi)剛.基于微分博弈的礦業(yè)信息系統(tǒng)安全投資水平問題研究[J].煤炭經(jīng)濟研究,2018,(06):58-62.