彭 超,靳黎忠,李中文,邢 帥,張華龍
(太原清眾鑫科技有限公司,山西 太原 030006)
相較于傳統(tǒng)意義上的“資源”,數(shù)據(jù)資源更為靈活——數(shù)據(jù)的刪除和修改能夠在極短時(shí)間內(nèi)完成,并且數(shù)據(jù)的拷貝不需要任何成本[1]。近年來(lái),數(shù)據(jù)已經(jīng)深度融入社會(huì)生產(chǎn)生活的各個(gè)領(lǐng)域中,對(duì)社會(huì)的生產(chǎn)與運(yùn)作發(fā)揮著不可替代的作用,伴隨著人工智能產(chǎn)業(yè)的不斷發(fā)展,社會(huì)各領(lǐng)域?qū)?shù)據(jù)的需求量也大幅增加,諸如智慧醫(yī)療、智能家電、公共交通、現(xiàn)代化辦公、電商直播等產(chǎn)業(yè)都需要龐大的數(shù)據(jù)作為支撐,因此,保障數(shù)據(jù)安全對(duì)于數(shù)據(jù)的正常使用至關(guān)重要,一旦數(shù)據(jù)被竊取或者被篡改,將會(huì)帶來(lái)不可估量的損失。相較于傳統(tǒng)資源,數(shù)據(jù)的安全保障條件更為嚴(yán)苛,其潛在的威脅主要包括:
(1)外部攻擊。不法分子入侵?jǐn)?shù)據(jù)庫(kù)后進(jìn)行對(duì)數(shù)據(jù)的竊取、篡改和惡意刪除等操作。
(2)內(nèi)部攻擊。內(nèi)部工作人員有意或者無(wú)意的操作造成數(shù)據(jù)泄露和數(shù)據(jù)丟失。
(3)存儲(chǔ)介質(zhì)因素。存儲(chǔ)介質(zhì)損壞造成數(shù)據(jù)丟失,因物理因素(磁盤(pán)損壞)造成的數(shù)據(jù)丟失。
(4)非人為不可抗力因素。由于自然災(zāi)害等因素引起的關(guān)鍵數(shù)據(jù)丟失以及損失。
本文將從數(shù)據(jù)自產(chǎn)生到消亡的整個(gè)生命周期的角度,對(duì)數(shù)據(jù)的安全性進(jìn)行分析,詳細(xì)闡述各個(gè)階段的安全隱患和風(fēng)險(xiǎn)。
數(shù)據(jù)的整個(gè)生命周期流程如下。
(1)生產(chǎn)數(shù)據(jù):由設(shè)計(jì)人員生產(chǎn)出所需要的數(shù)據(jù)。
(2)存儲(chǔ)數(shù)據(jù):設(shè)計(jì)人員將產(chǎn)生的數(shù)據(jù)臨時(shí)存放在個(gè)人設(shè)備中。
(3)審核數(shù)據(jù):工作人員對(duì)存儲(chǔ)的數(shù)據(jù)查核。工作人員對(duì)數(shù)據(jù)的屬性、數(shù)據(jù)的內(nèi)容查核,確保供給的數(shù)據(jù)是有效數(shù)據(jù)。若審核通過(guò),數(shù)據(jù)被傳送至系統(tǒng)共享庫(kù)中;若審核不通過(guò),數(shù)據(jù)被返回給數(shù)據(jù)生產(chǎn)者繼續(xù)修改[2]。
(4)數(shù)據(jù)入庫(kù):數(shù)據(jù)由工作人員在審核后傳送進(jìn)共享數(shù)據(jù)庫(kù)中。各類(lèi)享有權(quán)限的職員均可對(duì)數(shù)據(jù)實(shí)施對(duì)應(yīng)的處理。
(5)數(shù)據(jù)應(yīng)用:擁有權(quán)限的工作人員能夠?qū)蚕頂?shù)據(jù)庫(kù)里的數(shù)據(jù)進(jìn)行處理。例如具備查詢(xún)權(quán)限可以對(duì)數(shù)據(jù)進(jìn)行讀取,具備修改權(quán)限可以對(duì)數(shù)據(jù)進(jìn)行修改。
(6)數(shù)據(jù)消亡:數(shù)據(jù)在經(jīng)歷完整的應(yīng)用周期后進(jìn)入消亡階段,數(shù)據(jù)庫(kù)對(duì)其進(jìn)行毀滅性刪除。
為保證數(shù)據(jù)的安全性,以上數(shù)據(jù)生命周期的各個(gè)階段都有著類(lèi)似的安全性需求,具體有身份認(rèn)證、訪(fǎng)問(wèn)控制、數(shù)據(jù)加密、數(shù)據(jù)信任、數(shù)據(jù)完整性保障等需求。身份認(rèn)證是保護(hù)數(shù)據(jù)安全的基礎(chǔ)需求,指對(duì)數(shù)據(jù)的操作方進(jìn)行身份的驗(yàn)證,保證對(duì)方的身份真實(shí)有效,身份認(rèn)證是訪(fǎng)問(wèn)控制的前提條件。訪(fǎng)問(wèn)控制是針對(duì)系統(tǒng)中主體對(duì)客體的訪(fǎng)問(wèn)進(jìn)行控制,以保證數(shù)據(jù)的安全。其中,主體是指改變數(shù)據(jù)流動(dòng)的主動(dòng)方,諸如用戶(hù)、應(yīng)用等;客體是指包含或者接收信息的被動(dòng)方,諸如文件、數(shù)據(jù)等。數(shù)據(jù)加密是指需要對(duì)數(shù)據(jù)進(jìn)行加密服務(wù),以防止數(shù)據(jù)發(fā)生泄漏,對(duì)于加密后的數(shù)據(jù),即使數(shù)據(jù)在傳輸過(guò)程中被竊取,竊取者也無(wú)法對(duì)其進(jìn)行解密,從而無(wú)法得到真實(shí)有效的數(shù)據(jù),保證了數(shù)據(jù)的機(jī)密性。數(shù)據(jù)信任是指要實(shí)現(xiàn)數(shù)據(jù)的不可否認(rèn)性,也就是數(shù)據(jù)的發(fā)送方不能在消息發(fā)出后對(duì)該條數(shù)據(jù)的發(fā)送進(jìn)行否認(rèn),數(shù)據(jù)的接收方不能在接收消息后對(duì)接收到的消息進(jìn)行否認(rèn)。數(shù)據(jù)的完整性需求是指數(shù)據(jù)在傳輸過(guò)程中不會(huì)被非授權(quán)地修改、刪除。
數(shù)據(jù)采集是指盡可能地收集目標(biāo)對(duì)象、設(shè)備、服務(wù)等數(shù)據(jù)產(chǎn)生方的數(shù)據(jù),傳輸匯總到相應(yīng)區(qū)域,為之后的數(shù)據(jù)挖掘分析提供基礎(chǔ)[3]。物聯(lián)網(wǎng)的發(fā)展將大數(shù)據(jù)推向了發(fā)展高潮,物聯(lián)網(wǎng)大部分是非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),采集的方式一般有報(bào)文和文件。目前,Python的爬蟲(chóng)是針對(duì)于Web獲取數(shù)據(jù)的主要方式,獲取到的數(shù)據(jù)可以被很好地利用。
近年來(lái),大數(shù)據(jù)已滲入社會(huì)的各個(gè)產(chǎn)業(yè)之中,當(dāng)下大數(shù)據(jù)通常存儲(chǔ)在大數(shù)據(jù)平臺(tái)之中,基于云存儲(chǔ)技術(shù),多節(jié)點(diǎn)、分布式地對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)。然而數(shù)據(jù)量的增大在給人們生活帶來(lái)便利的同時(shí),也增加了數(shù)據(jù)的安全隱患。大量數(shù)據(jù)的集中存儲(chǔ)增加了數(shù)據(jù)泄露及被篡改的風(fēng)險(xiǎn),因此如何確保數(shù)據(jù)在存儲(chǔ)過(guò)程中的安全一直是人們研究的熱點(diǎn)。
(1)數(shù)據(jù)加密。作為一種可靠的數(shù)據(jù)庫(kù)安全防護(hù)技術(shù),數(shù)據(jù)加密得到了快速的發(fā)展與廣泛應(yīng)用。網(wǎng)絡(luò)傳輸中的報(bào)文容易被捕獲與利用,對(duì)其加密是最重要的安全手段。數(shù)據(jù)加密的基本思路是通過(guò)一定的算法變動(dòng)原文的表現(xiàn)形式,以偽裝需要保障的重要信息,使得沒(méi)有權(quán)限的破壞者不能了解被保護(hù)信息的內(nèi)容。當(dāng)下,一直廣泛應(yīng)用的數(shù)據(jù)加密方法主要有:應(yīng)用系統(tǒng)加密、前置代理加密、后置代理加密、表空間加密、文件系統(tǒng)加密和磁盤(pán)加密[4]。
(2)硬件存儲(chǔ)安全。硬盤(pán)是存放數(shù)據(jù)的重要媒介,其中,固態(tài)硬盤(pán)由于沒(méi)有機(jī)械部件,而且主控和顆粒之間的信息傳遞效率非常高,固態(tài)硬盤(pán)的讀取速度可以達(dá)到機(jī)械硬盤(pán)的數(shù)倍,在實(shí)際應(yīng)用中具有良好的存儲(chǔ)性能。而可信固態(tài)硬盤(pán)是在固態(tài)硬盤(pán)的基礎(chǔ)上加入了安全機(jī)制,通過(guò)安全存儲(chǔ)接口與協(xié)議,嚴(yán)格控制用戶(hù)存取的數(shù)據(jù),保證了數(shù)據(jù)的機(jī)密性??尚殴虘B(tài)硬盤(pán)以其低延遲、吞吐量大、安全性高的綜合優(yōu)勢(shì),被廣泛應(yīng)用于機(jī)密數(shù)據(jù)的存儲(chǔ)。
數(shù)據(jù)傳輸?shù)陌踩允潜WC數(shù)據(jù)在傳輸過(guò)程中不被篡改、泄露或竊聽(tīng)等。數(shù)據(jù)加密技術(shù)經(jīng)常被用來(lái)保證數(shù)據(jù)傳輸過(guò)程中的安全性,數(shù)據(jù)加密算法能夠極大地提高數(shù)據(jù)的安全性,也是當(dāng)前最主流的防護(hù)措施之一。但是傳統(tǒng)的加密算法成本過(guò)高,操作復(fù)雜,在實(shí)際使用中,無(wú)法實(shí)現(xiàn)廣泛應(yīng)用。隨著技術(shù)水平的不斷提高,一些新興的加密算法能夠很好地應(yīng)對(duì)數(shù)據(jù)傳輸中所面臨的安全問(wèn)題,不過(guò)這些加密算法各有優(yōu)缺點(diǎn)。基于屬性的加密算法通過(guò)將私鑰與用戶(hù)的屬性相關(guān)聯(lián),實(shí)現(xiàn)了加密數(shù)據(jù)的細(xì)粒度訪(fǎng)問(wèn)控制,但該算法效率較低,無(wú)法應(yīng)用于海量數(shù)據(jù)存儲(chǔ);全同態(tài)加密算法在不解密數(shù)據(jù)的前提下,實(shí)現(xiàn)對(duì)加密數(shù)據(jù)的檢索等操作,它的缺點(diǎn)是對(duì)數(shù)據(jù)的處理效率也很低;可搜索加密技術(shù)能實(shí)現(xiàn)對(duì)密文數(shù)據(jù)的查詢(xún)以及排序,同時(shí)也存在支持的數(shù)據(jù)結(jié)構(gòu)類(lèi)型單一、時(shí)間消耗大、擴(kuò)展性差等缺點(diǎn)。
數(shù)據(jù)使用安全主要包括安全訪(fǎng)問(wèn)控制和數(shù)據(jù)共享安全兩部分。
(1)安全訪(fǎng)問(wèn)控制。訪(fǎng)問(wèn)控制是數(shù)據(jù)安全的重要一環(huán),它規(guī)定了誰(shuí)可以訪(fǎng)問(wèn)組織的信息資源誰(shuí)不可以訪(fǎng)問(wèn)。通過(guò)身份驗(yàn)證和授權(quán),訪(fǎng)問(wèn)控制系統(tǒng)可以確保用戶(hù)的真實(shí)資格,訪(fǎng)問(wèn)控制通過(guò)匹配多種登錄憑據(jù)以識(shí)別用戶(hù)。許多訪(fǎng)問(wèn)控制系統(tǒng)還包括多因素身份驗(yàn)證,多因素身份驗(yàn)證是一種需要使用多種身份驗(yàn)證方法來(lái)驗(yàn)證用戶(hù)身份的辦法[5]。
(2)數(shù)據(jù)共享安全。網(wǎng)絡(luò)犯罪威脅可能源于內(nèi)部人員的惡意攻擊,影響惡劣,情節(jié)嚴(yán)重,對(duì)于正常的用戶(hù)來(lái)說(shuō)也可能成為受害者。數(shù)據(jù)是否能夠在安全的環(huán)境中進(jìn)行有效共享,有針對(duì)性共享,如何防范內(nèi)部攻擊等都是值得高度重視的事情[6]。
數(shù)據(jù)匿名處理技術(shù)是一種為大眾所知的隱私保護(hù)手段,這種方法通過(guò)刪去敏感數(shù)據(jù)來(lái)保障用戶(hù)的隱私。但是這種方法需要把握好刪除的“度”,如果刪除過(guò)少,即匿名化不夠,攻擊者會(huì)有較大概率攻擊成功;如果刪除太多,數(shù)據(jù)集失去了大片的重要數(shù)據(jù),會(huì)使得數(shù)據(jù)失去了本身的意義[7]。
數(shù)據(jù)銷(xiāo)毀是通過(guò)建立一定機(jī)制將數(shù)據(jù)進(jìn)行永久性銷(xiāo)毀,防止有人惡意利用介質(zhì)進(jìn)行恢復(fù),使得機(jī)密文件數(shù)據(jù)丟失或被惡意利用。2015年,又有學(xué)者提出了一種基于時(shí)間戳屬性的數(shù)據(jù)自毀方案,對(duì)數(shù)據(jù)的存在時(shí)間加以限定,只有在允許的時(shí)間內(nèi),擁有密鑰的用戶(hù)可以對(duì)數(shù)據(jù)進(jìn)行操作,一旦過(guò)期,數(shù)據(jù)將自動(dòng)銷(xiāo)毀,任何人都無(wú)法讀取到原數(shù)據(jù)。
大數(shù)據(jù)應(yīng)用具有極高的商業(yè)價(jià)值和社會(huì)價(jià)值,妥善存儲(chǔ)和管理好大數(shù)據(jù)對(duì)于國(guó)家和社會(huì)都意義重大。要想發(fā)揮出大數(shù)據(jù)應(yīng)用的最大價(jià)值,需要針對(duì)具體的行業(yè)開(kāi)發(fā)出專(zhuān)門(mén)的對(duì)應(yīng)行業(yè)的大數(shù)據(jù)管理模式,這種模式保障了數(shù)據(jù)的科學(xué)高效應(yīng)用,并且可保障敏感數(shù)據(jù)的安全。
本文針對(duì)數(shù)據(jù)的各個(gè)生命周期進(jìn)行了安全性分析,總結(jié)出了各個(gè)階段的風(fēng)險(xiǎn)特征,闡明了數(shù)據(jù)各個(gè)周期的安全性情況,提出了相應(yīng)解決方法。總之,數(shù)據(jù)安全將是一個(gè)與數(shù)據(jù)長(zhǎng)期共存的棘手問(wèn)題,需要我們時(shí)刻保持警惕,不斷更新安全技術(shù),不斷強(qiáng)化安全意識(shí),才能確保數(shù)據(jù)安全。