中國(guó)人民銀行湘潭市中心支行 劉曼齊
加強(qiáng)大數(shù)據(jù)平臺(tái)數(shù)據(jù)安全體系建設(shè)有著重要意義,不僅能夠有效應(yīng)對(duì)平臺(tái)實(shí)際所面臨的安全風(fēng)險(xiǎn)問題,同時(shí)對(duì)于增強(qiáng)數(shù)據(jù)信息的安全性與可靠性有著積極的促進(jìn)作用。文章首先對(duì)推進(jìn)大數(shù)據(jù)平臺(tái)數(shù)據(jù)安全技術(shù)能力體系建設(shè)的重要意義進(jìn)行分析,接著探討大數(shù)據(jù)平臺(tái)的數(shù)據(jù)安全問題,并基于安全體系設(shè)計(jì)原則就大數(shù)據(jù)平臺(tái)數(shù)據(jù)安全技術(shù)能力體系建設(shè)提出幾點(diǎn)建議,以期為同類型工作提供一定的借鑒與參考。
在大數(shù)據(jù)等新技術(shù)應(yīng)用規(guī)模不斷增長(zhǎng)的同時(shí),數(shù)據(jù)安全問題愈發(fā)得到各方的重視,如何進(jìn)一步提高大數(shù)據(jù)平臺(tái)的數(shù)據(jù)安全管控水平成為業(yè)界重點(diǎn)關(guān)注的話題。由于大數(shù)據(jù)平臺(tái)中涉及到海量數(shù)據(jù)信息,在實(shí)際管理工作中存在較大難度,同時(shí)潛在的數(shù)據(jù)安全風(fēng)險(xiǎn)問題也會(huì)對(duì)大數(shù)據(jù)平臺(tái)的穩(wěn)定有序運(yùn)行造成嚴(yán)重的不利影響[1]。因此,下文將對(duì)大數(shù)據(jù)平臺(tái)的數(shù)據(jù)安全技術(shù)體系建設(shè)進(jìn)行研究和分析,以此為數(shù)據(jù)安全管控提供良好支持與保障。
從當(dāng)前階段的實(shí)際情況不難看出,大數(shù)據(jù)平臺(tái)的用戶逐漸增長(zhǎng),然而由于平臺(tái)中會(huì)涉及到海量數(shù)據(jù)信息,如果數(shù)據(jù)管理體系處于零散化、片面化狀態(tài),便無法為數(shù)據(jù)安全管控提供良好的支持與保障。因此,積極推進(jìn)大數(shù)據(jù)平臺(tái)的數(shù)據(jù)安全體系建設(shè)不僅是時(shí)代進(jìn)步發(fā)展背景下的必然要求,同時(shí)也是為了有效緩解現(xiàn)階段大數(shù)據(jù)平臺(tái)發(fā)展進(jìn)程中數(shù)據(jù)安全風(fēng)險(xiǎn)問題所引發(fā)的不利影響[2]。由此可見,加強(qiáng)數(shù)據(jù)安全技術(shù)能力體系建設(shè),不僅可以更好地滿足用戶對(duì)于大數(shù)據(jù)平臺(tái)的安全需求,同時(shí)對(duì)于提升數(shù)據(jù)信息的安全性和可靠性有著積極的促進(jìn)作用,進(jìn)而讓大數(shù)據(jù)平臺(tái)的重要價(jià)值和功能得到更加穩(wěn)定和充分的發(fā)揮。
(1)數(shù)據(jù)資產(chǎn)的梳理存在較大難度。與傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行比較而言,大數(shù)據(jù)平臺(tái)中所涉及到的非結(jié)構(gòu)化數(shù)據(jù),在對(duì)需要保護(hù)的敏感數(shù)據(jù)進(jìn)行搜集和識(shí)別上存在更高的困難程度[3]。例如,某企業(yè)在實(shí)際經(jīng)營(yíng)管理中所運(yùn)用的大數(shù)據(jù)平臺(tái),由于企業(yè)各部門的業(yè)務(wù)表現(xiàn)出相應(yīng)的獨(dú)立性,同時(shí)在不同部門間的業(yè)務(wù)上還存在一定的重疊內(nèi)容,導(dǎo)致部分員工無法對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行分類、分級(jí),并做出合理判斷。通常而言,采取人工鑒別方式,則實(shí)際所需要的勞動(dòng)量十分巨大。
(2)現(xiàn)階段有關(guān)大數(shù)據(jù)平臺(tái)安全基線的檢測(cè)通常需要較長(zhǎng)周期,在發(fā)現(xiàn)、驗(yàn)證大數(shù)據(jù)平臺(tái)本身安全漏洞上缺乏足夠的時(shí)效性[4]。此外,由于大數(shù)據(jù)平臺(tái)涉及到諸多節(jié)點(diǎn)和組件,如果單純憑借人工方式定期開展風(fēng)險(xiǎn)檢測(cè)以及安全評(píng)估活動(dòng),那么實(shí)際工作效率及質(zhì)量無法得到有效保障。
(3)從分布狀態(tài)上來看,大數(shù)據(jù)平臺(tái)中的敏感數(shù)據(jù)資產(chǎn)較為離散,無法就此建立具有針對(duì)性的數(shù)據(jù)安全管控機(jī)制。仍以某企業(yè)所運(yùn)用的大數(shù)據(jù)平臺(tái)為例,在各業(yè)務(wù)系統(tǒng)和存儲(chǔ)載體中客戶信息、經(jīng)營(yíng)數(shù)據(jù)等敏感數(shù)據(jù)處于游離的分布狀態(tài),此類數(shù)據(jù)信息不僅數(shù)量巨大,同時(shí)受到應(yīng)用場(chǎng)景的差異性,數(shù)據(jù)類別及形態(tài)也會(huì)發(fā)生變化[5]。在此條件下,便較為困難運(yùn)用傳統(tǒng)技術(shù)手段就大數(shù)據(jù)平臺(tái)中的客戶信息做出有效的識(shí)別、脫敏、溯源,在客戶信息操作行為審計(jì)上同樣存在較大難度。
對(duì)于大數(shù)據(jù)平臺(tái)數(shù)據(jù)安全技術(shù)能力體系建設(shè)而言,首先要切實(shí)把握全面性原則,要根據(jù)實(shí)際情況對(duì)大數(shù)據(jù)平臺(tái)安全建設(shè)的全生命周期予以考慮,不僅要關(guān)注局部的細(xì)節(jié)方面,同時(shí)要確保從整體上對(duì)整個(gè)建設(shè)流程進(jìn)行涵蓋。其次,將實(shí)用性原則寓于建設(shè)過程中,在推進(jìn)數(shù)據(jù)安全體系建設(shè)的過程中要最大限度上考慮大數(shù)據(jù)平臺(tái)的實(shí)際使用需求,以此在確保數(shù)據(jù)安全管控水平的基礎(chǔ)上讓大數(shù)據(jù)平臺(tái)能夠充分發(fā)揮自身的預(yù)期功能[6]。此外,在體系建設(shè)中要遵循平衡性原則,一方面要特別關(guān)注科學(xué)管理的重要作用,另一方面則是要保證技術(shù)得到有效運(yùn)用,從不同層面為數(shù)據(jù)信息的安全性與可靠性提供良好保障。不僅要確保內(nèi)部管理的科學(xué)性,也要保證對(duì)外的保護(hù)符合規(guī)范標(biāo)準(zhǔn)以及一系列的風(fēng)險(xiǎn)評(píng)估要求。
要結(jié)合大數(shù)據(jù)平臺(tái)的實(shí)際情況,針對(duì)其中一系列的基礎(chǔ)設(shè)施和應(yīng)用組件提出相應(yīng)的安全能力要求,通過科學(xué)有效的基礎(chǔ)安全配置,并施以合理化的技術(shù)管控手段,以此避免由于組件配置不當(dāng)或技術(shù)手段不足所引發(fā)安全風(fēng)險(xiǎn)問題[7]??筛鶕?jù)實(shí)際情況運(yùn)用如下兩點(diǎn)技術(shù)就大數(shù)據(jù)平臺(tái)開展基線檢測(cè)。
(1)多組件信息主動(dòng)探測(cè)技術(shù)。布設(shè)并發(fā)揮采集引擎的功能,以此對(duì)有關(guān)組件的信息內(nèi)容進(jìn)行收集,并將反饋信息傳遞至后臺(tái)做出比對(duì),以此確定有關(guān)組件的脆弱性信息。(2)超文本、XML標(biāo)記抽取技術(shù)。超文本標(biāo)記抽取主要通過端口、Http包頭、Banner信息、指紋信息等進(jìn)行實(shí)現(xiàn);發(fā)揮XML可擴(kuò)展語言的特性,就端口返回的XML做出特定抽取,以此得到有關(guān)大數(shù)據(jù)集群的信息內(nèi)容。
對(duì)于數(shù)據(jù)資產(chǎn)識(shí)別而言,主要有如下三個(gè)方面的內(nèi)容:數(shù)據(jù)資產(chǎn)識(shí)別、敏感數(shù)據(jù)發(fā)現(xiàn)、敏感數(shù)據(jù)識(shí)別規(guī)則等內(nèi)容。
(1)識(shí)別數(shù)據(jù)資產(chǎn)。按照相應(yīng)的識(shí)別規(guī)則,全量掃描大數(shù)據(jù)平臺(tái)中Hive、Hbase數(shù)據(jù),根據(jù)實(shí)際所得到的掃描結(jié)果建立有關(guān)敏感數(shù)據(jù)資產(chǎn)的全景視圖,如此一來,不僅能夠?yàn)閿?shù)據(jù)采集、存儲(chǔ)、分析使用等流程的制定提供便利指導(dǎo),同時(shí)對(duì)于數(shù)據(jù)共享使用也有著良好的支持作用。(2)發(fā)現(xiàn)敏感數(shù)據(jù)。可根據(jù)實(shí)際情況選用敏感數(shù)據(jù)掃描識(shí)別算法,以多模式模糊匹配的形式對(duì)敏感數(shù)據(jù)做出及時(shí)有效的識(shí)別[8]。(3)敏感數(shù)據(jù)識(shí)別規(guī)則。根據(jù)敏感數(shù)據(jù)特征,如關(guān)鍵詞、數(shù)據(jù)類型、長(zhǎng)度等一系列特征,通過多模式模糊匹配算法開展大規(guī)模的模糊匹配工作,以此提高匹配和識(shí)別效率。
要從整體上對(duì)大數(shù)據(jù)平臺(tái)數(shù)據(jù)安全體系做出系統(tǒng)設(shè)計(jì),以此為數(shù)據(jù)采集的安全性與可靠性提供良好保障。通常而言,在安全體系的整體建設(shè)過程中,需要對(duì)大數(shù)據(jù)網(wǎng)絡(luò)安全域做出合理劃分,即數(shù)據(jù)采集子域(針對(duì)內(nèi)部數(shù)據(jù)的采集、針對(duì)外部的數(shù)據(jù)采集)、數(shù)據(jù)計(jì)算存儲(chǔ)子域(針對(duì)不同分布列式的數(shù)據(jù)存儲(chǔ)、針對(duì)不同用戶信息和數(shù)據(jù)資料分類的存儲(chǔ)、數(shù)據(jù)信息分發(fā)過程、數(shù)據(jù)分布式計(jì)算等設(shè)備所在區(qū)域)、管理子域(前臺(tái)及后臺(tái)業(yè)務(wù)管理平臺(tái)、網(wǎng)絡(luò)實(shí)時(shí)監(jiān)控、數(shù)據(jù)安全審計(jì)設(shè)備所在區(qū)域)[9]。此外,要根據(jù)各子域以及各區(qū)域的實(shí)際情況,以VLAN劃分、強(qiáng)化防火墻部署等舉措提高安全防護(hù)力度,以此對(duì)大數(shù)據(jù)平臺(tái)中潛在的用戶差異性信息做出相應(yīng)的隔離與保護(hù)。
對(duì)于大數(shù)據(jù)平臺(tái)的數(shù)據(jù)存儲(chǔ)方式而言,主要涉及到分布式文件存儲(chǔ)、分布式數(shù)據(jù)庫(kù)存儲(chǔ)等兩種方式。然而從工作實(shí)踐中可以看出,兩種存儲(chǔ)方式所運(yùn)用的加解密技術(shù)有所不同。
此處以分布式文件存儲(chǔ)為例,其所運(yùn)用加解密技術(shù)的主要工作原理是針對(duì)存儲(chǔ)空間做出相應(yīng)的加解密管理,如果所存儲(chǔ)文件存在加密的儲(chǔ)存需求,大數(shù)據(jù)平臺(tái)則以自動(dòng)形式將其存儲(chǔ)至需要加密的區(qū)域。在此過程中,只有得到身份授權(quán)的用戶可以通過驗(yàn)證的方式對(duì)數(shù)據(jù)信息進(jìn)行訪問;如果并未得到身份認(rèn)證則無法對(duì)相關(guān)數(shù)據(jù)信息進(jìn)行讀取[10]。解密步驟如下:加密區(qū)域密鑰會(huì)保存在密鑰管理系統(tǒng)中,用戶如果在加密區(qū)域建立源文件或子文件時(shí),加密組件則會(huì)從KMS上申請(qǐng)密鑰,加密組件Proxy在得到信息密鑰后,向KMS提出申請(qǐng),對(duì)EDEK做出解密處理。
對(duì)Hadoop組件的Hive、Hbase進(jìn)行數(shù)據(jù)脫敏。結(jié)合語法特征將安全脫敏策略配置到數(shù)據(jù)流轉(zhuǎn)過程中,以此實(shí)現(xiàn)對(duì)于流量中的請(qǐng)求訪問語句的匹配識(shí)別和處理,在此方面需要對(duì)如下三點(diǎn)予以重點(diǎn)關(guān)注:(1)可以結(jié)合具體需求對(duì)不同敏感數(shù)據(jù)選用差異化的敏感數(shù)據(jù)脫敏算法;(2)確保脫敏算法添加或刪除的動(dòng)態(tài)性;(3)保護(hù)細(xì)粒度的敏感數(shù)據(jù),要結(jié)合用戶的查詢需求合理選用脫敏算法,以此確保在實(shí)現(xiàn)脫敏效果的基礎(chǔ)上不會(huì)對(duì)用戶的實(shí)際體驗(yàn)造成不利影響。
針對(duì)大數(shù)據(jù)平臺(tái)的身份信息做出有效管理,通過加密信息權(quán)限的方式為數(shù)據(jù)信息安全提供保障。在對(duì)平臺(tái)中用戶信息進(jìn)行訪問的過程中會(huì)留下相應(yīng)的印記,通過對(duì)此印記的分析,保證訪問記錄的安全性與可靠性。通常而言,訪問權(quán)限安全技術(shù)的實(shí)際操作過程主要有兩個(gè)方面:
(1)在訪問大數(shù)據(jù)平臺(tái)時(shí)需經(jīng)過訪問認(rèn)證,正確完成認(rèn)證后才可以順利進(jìn)入系統(tǒng),屬于當(dāng)前階段在網(wǎng)絡(luò)安全技術(shù)中較為常見的CA身份認(rèn)證技術(shù)。用戶在對(duì)大數(shù)據(jù)平臺(tái)安全系統(tǒng)進(jìn)行訪問前,需通過身份認(rèn)證系統(tǒng)完成認(rèn)證識(shí)別,接著經(jīng)過訪問監(jiān)控模塊,系統(tǒng)會(huì)結(jié)合用戶的實(shí)際身份以及具體授權(quán)情況給出相應(yīng)的反饋。從認(rèn)證方式上來看,通過密碼、數(shù)字證書、數(shù)字簽名、指紋虹膜等二者結(jié)合實(shí)現(xiàn)對(duì)用戶身份認(rèn)證的雙因子認(rèn)證方式,在現(xiàn)階段的實(shí)際應(yīng)用較為廣泛,這種身份認(rèn)證技術(shù)以口令形式開展權(quán)限管理和登錄活動(dòng),用戶通過雙因子認(rèn)證后便可以在大數(shù)據(jù)平臺(tái)中得到相關(guān)的數(shù)據(jù)信息內(nèi)容。
(2)發(fā)揮計(jì)算機(jī)網(wǎng)絡(luò)的媒介作用,通過對(duì)數(shù)據(jù)行為的審計(jì)分析,即對(duì)用戶訪問記錄和權(quán)限進(jìn)行分析,依托數(shù)據(jù)庫(kù)審計(jì)的方式開展實(shí)時(shí)的記錄活動(dòng),不僅可以有效提高操作行為的規(guī)范性以及審計(jì)工作的一致性,同時(shí)在數(shù)據(jù)庫(kù)信息面臨風(fēng)險(xiǎn)問題時(shí),數(shù)據(jù)庫(kù)信息系統(tǒng)會(huì)對(duì)此進(jìn)行告警,并及時(shí)分析和阻斷風(fēng)險(xiǎn)行為。此外,在綜合考慮多條件關(guān)聯(lián)的前提下運(yùn)用審計(jì)分析策略,可以對(duì)大數(shù)據(jù)日志做出更加直觀的展示,實(shí)際所展示出的內(nèi)容不僅包含行為主體身份和時(shí)間地點(diǎn),同時(shí)也包括采用哪種方式、做出哪些操作以及最終的操作結(jié)果等。通過4A統(tǒng)一安全管控平臺(tái)(“4A”主要是指為企業(yè)提供集中的賬號(hào)Account、認(rèn)證Authentication、授權(quán)Authorization、審計(jì)Audit管理技術(shù)支撐及配套流程,提升系統(tǒng)安全性和可管理能力)實(shí)現(xiàn)IT資源集中管理,可以促進(jìn)審計(jì)得到集中化管理和控制,大數(shù)據(jù)平臺(tái)審計(jì)的實(shí)時(shí)性以及可視性能夠得到進(jìn)一步保障。這種數(shù)據(jù)庫(kù)審計(jì)方法可以以內(nèi)部、外部相結(jié)合的方式更好地記錄數(shù)據(jù)庫(kù)網(wǎng)絡(luò)信息行為,信息資產(chǎn)的安全性與可靠性得到有效保障。如表1、表2所示,上述技術(shù)方法適用于用戶數(shù)據(jù)訪問認(rèn)證和審計(jì)分析。
表2 用戶數(shù)據(jù)行為審計(jì)分析機(jī)制架構(gòu)Tab.2 Architecture of user data behavior audit analysis mechanism
總之,大數(shù)據(jù)平臺(tái)發(fā)揮其價(jià)值和功能的同時(shí),其數(shù)據(jù)信息的安全風(fēng)險(xiǎn)問題應(yīng)受到重視。對(duì)此,在數(shù)據(jù)平臺(tái)的數(shù)據(jù)安全技術(shù)能力體系建設(shè)中,理清數(shù)據(jù)安全管控的流程與思路,做好大數(shù)據(jù)平臺(tái)基線檢測(cè)能力、數(shù)據(jù)資產(chǎn)識(shí)別、數(shù)據(jù)采集安全技術(shù)、數(shù)據(jù)存儲(chǔ)安全技術(shù)、大數(shù)據(jù)平臺(tái)脫敏、身份認(rèn)證與數(shù)據(jù)審計(jì)等非常必要。目前,上海已設(shè)立的數(shù)據(jù)交易所,是對(duì)數(shù)據(jù)安全可信交易生態(tài)建立做出的初步探索,但大數(shù)據(jù)的合規(guī)、數(shù)據(jù)運(yùn)維、數(shù)據(jù)確權(quán)、數(shù)據(jù)定價(jià)、商業(yè)模式等難題仍然亟待解決,加快數(shù)字化轉(zhuǎn)型,以大促使數(shù)字經(jīng)濟(jì)活力得到有效激發(fā)。