楊志雄
摘要:大數(shù)據(jù)本身的特征,使其在應用過程中容易出現(xiàn)安全問題,所以配合使用數(shù)據(jù)安全治理技術,實現(xiàn)精細化、規(guī)范化管理數(shù)據(jù)安全具有十分重要的意義。鑒于此,在簡單總結數(shù)據(jù)安全治理問題的基礎上,從數(shù)據(jù)安全治理基本原則、數(shù)據(jù)安全治理技術分類、數(shù)據(jù)安全治理技術架構、數(shù)據(jù)安全治理技術實際應用這四個方面入手,探討大數(shù)據(jù)應用示域下的數(shù)據(jù)安全治理技術。
關鍵詞:數(shù)據(jù)安全治理技術;大數(shù)據(jù);數(shù)據(jù)全生命周期
一、前言
如何避免大數(shù)據(jù)背景下存在的隱私泄露、數(shù)據(jù)偽造等安全風險,成為各行業(yè)領域重點關注的問題。本文結合數(shù)據(jù)安全治理技術,從數(shù)據(jù)全生命周期進行考慮,希望解決各環(huán)節(jié)存在的數(shù)據(jù)安全隱患,為用戶及其他使用者提供良好的數(shù)據(jù)使用環(huán)境。鑒于此,本文將結合以下方面進行分析和討論,希望可以最大限度地出在大數(shù)據(jù)應用視域下,如何更有效地進行數(shù)據(jù)安全治理工作。
二、數(shù)據(jù)安全治理現(xiàn)狀
由于大數(shù)據(jù)具有數(shù)據(jù)源多、系統(tǒng)接口多、數(shù)據(jù)量大、用戶多等特征,容易出現(xiàn)多種安全問題,具體問題主要集中表現(xiàn)為以下幾點:
第一,個人隱私或敏感信息被泄露。主要是指由于技術防護不到位、信息管理不善、遭受網(wǎng)絡攻擊等原因,出現(xiàn)本不應對外公開的內(nèi)部數(shù)據(jù)或敏感信息以非正式渠道對外共享和披露,或被泄露給不相干的個人或組織[1]。
第二,非授權數(shù)據(jù)訪問或濫用。主要是指用戶沒有權限進行數(shù)據(jù)的訪問和數(shù)據(jù)的獲取,即低權限用戶或從非授權接口獲取高權限標識數(shù)據(jù)、高級別數(shù)據(jù),也可能包括數(shù)據(jù)使用用途超出采集目的之外,向指定對象共享不必要數(shù)據(jù)。
第三,篡改或偽造數(shù)據(jù)。通常是指破壞數(shù)據(jù)的完整性,惡意改變數(shù)據(jù)內(nèi)容和格式,指數(shù)據(jù)失去應用價值,還可能是采集或使用虛假數(shù)據(jù),造成數(shù)據(jù)系統(tǒng)發(fā)生異常。
第四,數(shù)據(jù)污染。該問題主要是指低質(zhì)量數(shù)據(jù)或垃圾數(shù)據(jù)混入高質(zhì)量數(shù)據(jù),嚴重影響了數(shù)據(jù)的分析結果。例如,如果在數(shù)據(jù)挖掘、機器學習、人工智能等領域出現(xiàn)嚴重的數(shù)據(jù)污染問題,大概率會導致分析結果的極端化,從而降低科研工作的成效[2]。
需要注意數(shù)據(jù)的復雜性,因為數(shù)據(jù)可能會受到系統(tǒng)物理環(huán)境、數(shù)據(jù)承載系統(tǒng)以及系統(tǒng)安裝組件等相關因素的影響,從而出現(xiàn)嚴重的數(shù)據(jù)安全問題。
三、大數(shù)據(jù)應用視域下數(shù)據(jù)安全治理技術的探討
基于大數(shù)據(jù)應用視域,在分析討論數(shù)據(jù)安全治理技術的過程中,文章將其劃分為數(shù)據(jù)安全治理基本原則、數(shù)據(jù)安全治理技術分類、數(shù)據(jù)安全治理技術架構、數(shù)據(jù)安全技術實際應用這四個部分,并進行了細化討論,希望可以較為系統(tǒng)地明確數(shù)據(jù)安全治理技術的相關要點,保證數(shù)據(jù)使用過程中的安全性和可靠性,提高大數(shù)據(jù)應用視域下,數(shù)據(jù)的防篡改性和可共享性[3]。
(一)數(shù)據(jù)安全治理基本原則
1.經(jīng)濟性
保證數(shù)據(jù)安全使用,是數(shù)據(jù)安全治理技術的最主要目標,但在使用期間,杜絕發(fā)生“犧牲一切為安全”的現(xiàn)象,是充分考慮業(yè)務現(xiàn)實需求以及安全防護收益,即安全措施應用原則應以最經(jīng)濟為主,強調(diào)以最小的投入,收獲最安全的防護效果。
2.可操作性
各項安全治理活動的展開,需要遵循安全要求,對安全要求要強調(diào)有效落地,突出實用性,即在不影響系統(tǒng)業(yè)務正常運行狀態(tài)的前提下,具有良好的可操作性。
3.合規(guī)性
合規(guī)性是數(shù)據(jù)安全治理環(huán)節(jié)最核心的部分,強調(diào)以現(xiàn)行法律、法規(guī)、規(guī)章為依據(jù),判別數(shù)據(jù)安全治理活動是否依法合規(guī),如果相關數(shù)據(jù)安全保護要求符合法律規(guī)定,則以該要求為基準,實施后續(xù)的調(diào)整與改進。
4.完備性
完備性是指數(shù)據(jù)安全治理工作的展開,應形成治理閉環(huán),即治理工作需要包括全環(huán)節(jié)和全生命周期,這是因為數(shù)據(jù)以及數(shù)據(jù)承載的系統(tǒng)、系統(tǒng)權限、系統(tǒng)用戶以及數(shù)據(jù)應用環(huán)節(jié)出現(xiàn)的安全事件,都具有必要環(huán)節(jié)及生命周期[4]。
5.可問責性
數(shù)據(jù)安全治理工作開展前提,應突出安全責任的重要性,以嚴肅的問責機制為基礎,保證落實執(zhí)行數(shù)據(jù)安全治理工作。
6.可追溯性
該項原則強調(diào)各項數(shù)據(jù)安全治理工作,如安全事件追溯、人員操作追溯等,在后期都可以借助管理措施或技術手段實現(xiàn)追溯。
(二)數(shù)據(jù)安全治理技術分類
1.數(shù)據(jù)使用安全技術
數(shù)據(jù)安全在步入數(shù)據(jù)使用階段后,就處于全過程中最薄弱的環(huán)節(jié),為保證數(shù)據(jù)使用者在使用數(shù)據(jù)的過程中不直接接觸原始數(shù)據(jù),應采取同態(tài)加密法、聯(lián)邦學習法等有效的方法,才能確保數(shù)據(jù)使用價值得以發(fā)揮,其中,同態(tài)加密法相當于以密文為基礎,進一步增加加法運算步驟與乘法運算步驟。也就是說,在完成解密工作后,相關人員可以選擇在原文部位上,直接進行結果計算工作;聯(lián)邦學習法可以實現(xiàn)節(jié)點無需上傳數(shù)據(jù),即可完成節(jié)點數(shù)據(jù)學習的目標,有助于解決數(shù)據(jù)孤島問題。在此過程中,為了有效劃分數(shù)據(jù)類別與密級,需要通過數(shù)據(jù)分類分級操作實現(xiàn)差異化作業(yè)。
2.全過程監(jiān)管安全技術
全過程監(jiān)管安全技術強調(diào)要針對數(shù)據(jù)生命周期的所有過程,進行系統(tǒng)化的監(jiān)控與管理,同時,有必要配合高效溯源數(shù)據(jù)流轉(zhuǎn)過程,進一步實現(xiàn)驗證參與者行為的目標,希望通過這樣的方式,完善數(shù)據(jù)安全治理全局管理。但在此過程中,即在數(shù)據(jù)溯源環(huán)節(jié),為避免發(fā)生數(shù)據(jù)隱私泄露的問題,需要注意全面掌握系統(tǒng)數(shù)據(jù)操作、應用層數(shù)據(jù)操作歷史,并且要多角度掌控數(shù)據(jù)整個演變過程等。由此可見,在該過程中,可以借助區(qū)塊鏈技術,依托該技術去中心化特點,利用其分布式賬本,保證完成數(shù)據(jù)的傳輸與存儲。此外,區(qū)塊鏈技術還具有較強的防篡改性特征,所以,應用該技術不僅可以保證記錄內(nèi)容的可信度,還可以借助態(tài)勢,進一步感知并分析實際數(shù)據(jù)流動情況,從而保證完成數(shù)據(jù)預警工作[5]。
3.數(shù)據(jù)存儲與銷毀安全技術
第一,應用數(shù)據(jù)存儲技術,其主要目的是減少數(shù)據(jù)被竊取和被篡改的問題。通常情況下會對非常規(guī)訪問進行限制,然后配合使用存儲過程審計、密態(tài)操作方法,有針對性地提高數(shù)據(jù)的安全性。第二,合理運用相關技術手段。例如,應用數(shù)據(jù)分類分級、數(shù)據(jù)訪問控制、數(shù)據(jù)安全隔離等,確保借助相關技術實現(xiàn)差異化存儲數(shù)據(jù)的指導工作,從而提高數(shù)據(jù)訪問門檻的作用。第三,科學應用密文的形式,具體來說就是通過密態(tài)操作方法,高效率完成數(shù)據(jù)的存儲工作,從而減少發(fā)生越權訪問行為,提高數(shù)據(jù)使用的安全性。
(三)數(shù)據(jù)安全治理技術架構
結合前文分析,明確數(shù)據(jù)安全治理包括數(shù)據(jù)、事件、人員、系統(tǒng)等多個處理環(huán)節(jié),在不同環(huán)節(jié)需要應用不同的技術管控措施。其中,數(shù)據(jù)安全治理技術具體架構如圖1所示。
1.數(shù)據(jù)全生命周期安全治理
針對數(shù)據(jù),按照其全生命周期實現(xiàn)治理,需要明確全生命周期包括采集、傳輸、存儲、處理、使用、銷毀等多個環(huán)節(jié)。在這樣的情況下,本文認為有必要結合各環(huán)節(jié)技術管控措施,進行有效地分析和討論。第一,數(shù)據(jù)的采集。該階段,需要驗證數(shù)據(jù)來源是否合法,核對數(shù)據(jù)質(zhì)量是否合規(guī),同時需要根據(jù)級別判定規(guī)則,對數(shù)據(jù)項以及數(shù)據(jù)項集合設置標簽。第二,數(shù)據(jù)的傳輸。該過程應以保證數(shù)據(jù)不被竊取和篡改為核心,借助SFTP等相關加密協(xié)議,減少發(fā)生敏感信息泄露的問題。同時,在數(shù)據(jù)傳輸過程中,可以選用摘要算法保證數(shù)據(jù)的完整性。此外,如果數(shù)據(jù)傳輸過程包括導入導出過程,還需要對該過程涉及的提供者、接收者進行溯源管理。第三,數(shù)據(jù)的存儲。該過程強調(diào)分離存儲敏感數(shù)據(jù)和非敏感數(shù)據(jù);強調(diào)在不同分期存儲不同級別數(shù)據(jù)的時候,應配合使用SM4等一系列密碼技術加密存儲敏感數(shù)據(jù)。同時,針對存儲數(shù)據(jù),有必要定期實現(xiàn)全/增量備份和恢復測試。第四,數(shù)據(jù)的處理。在該過程中,有必要針對數(shù)據(jù)加工等一系列處理流程實現(xiàn)嚴格授權,即由特定個人完成相關操作。同時,對于處理過程中存在的敏感數(shù)據(jù)問題,我們認為,要想減少其發(fā)生信息泄露的情況,需要配合脫敏處理或標識化處理操作。一旦數(shù)據(jù)在完成加工處理后,出現(xiàn)了敏感性變化情況,還必須重置標簽,并針對數(shù)據(jù)級別進行合理標記。第五,數(shù)據(jù)的使用。該過程要采取授權管理的方式,設置嚴格的訪問權限和操作權限,即只有符合安全級別的用戶或角色,才能進行相關作業(yè)。并且,在數(shù)據(jù)共享和數(shù)據(jù)開放環(huán)節(jié),還需要針對數(shù)據(jù)實現(xiàn)脫敏處理,如果有必要,還需配合使用隱私計算等相關技術,針對數(shù)據(jù)實施可用不可見的開放與共享。第六,數(shù)據(jù)的銷毀。針對不再使用的數(shù)據(jù),應第一時間使用正規(guī)工具銷毀數(shù)據(jù)及數(shù)據(jù)副本,保證銷毀過程的有效性和安全性,減少出現(xiàn)敏感信息泄露、防止產(chǎn)生數(shù)據(jù)復現(xiàn)的問題。如果有必要,還需要配合使用物理銷毀手段,實現(xiàn)徹底地銷毀。
此外,在數(shù)據(jù)全生命周期應貫穿個人信息保護、數(shù)據(jù)分類分級、數(shù)據(jù)溯源監(jiān)測這三項工作,并保證三者的密不可分,環(huán)環(huán)相扣。
2.事件分析與處置
該過程有必要結合事件預警機制,并同步制定分級規(guī)則,然后有目的性地建立統(tǒng)一的監(jiān)測預警平臺。此外,在平臺內(nèi)部,需要涵蓋多項功能。例如,更為精準地概括系統(tǒng)狀態(tài)、網(wǎng)絡流量、操作日志、訪問日志等情況;建立統(tǒng)一的風險管控平臺,在該平臺內(nèi)部強調(diào)對風險進行計分、展示和控制;建立安全態(tài)勢分析平臺,平臺內(nèi)部需要囊括安全狀態(tài)展示、態(tài)勢感知、安全事件預測等多項功能,以上三個平臺可以進行統(tǒng)一化建設,能夠根據(jù)應急預案流程對監(jiān)測發(fā)現(xiàn)的安全事件展開應急處理。
3.人員安全管控
該環(huán)節(jié)主要是指統(tǒng)一認證和授權人員,依據(jù)安全級別、敏感屬性對人員可訪問的數(shù)據(jù)庫表和系統(tǒng)文件進行訪問關系映射,然后審計記錄其增、刪、改、查等操作行為,如果出現(xiàn)異地登錄或非授權訪問等違規(guī)操作行為,需要進行告警處理。
4.系統(tǒng)安全防護
通常情況下,在系統(tǒng)安全防護環(huán)節(jié),要求相關作業(yè)人員嚴格遵循網(wǎng)絡安全等級保護要求,做好系統(tǒng)用戶身份的鑒別工作,并控制其訪問權限。具體而言,就是通過應用開發(fā)接口管控工具等一系列解決措施,統(tǒng)一管控系統(tǒng)外連接口;利用集中審計平臺針對應用層、系統(tǒng)層、數(shù)據(jù)層所產(chǎn)生的日志,實現(xiàn)集中審計,并就上述層級存在的安全漏洞展開專項治理。
(四)數(shù)據(jù)安全技術實際應用
1.數(shù)據(jù)采集與存儲環(huán)節(jié)
一般情況下,在面對數(shù)據(jù)傳輸方面的安全問題時,我們認為可以利用VPN技術來解決??傮w來說,該技術手段能夠最大限度保證數(shù)據(jù)的真實性與機密性。在應用該技術手段的過程中,還可以配合使用隧道技術和密碼技術,基本上可以實現(xiàn)從數(shù)據(jù)源頭端和目的端入手,以虛擬化的數(shù)據(jù)傳輸專用通道,針對原圖數(shù)據(jù)進行加密封裝的目的。在完成上述作業(yè)流程后,可以選擇將數(shù)據(jù)嵌入到另一協(xié)議數(shù)據(jù)報文內(nèi)。這樣可以將其偽裝成普通的數(shù)據(jù)報文?,F(xiàn)階段,在分析常見的VPN技術時,了解到該技術應用協(xié)議基本涵蓋的內(nèi)容,包括SSL協(xié)議、lpsec協(xié)議這兩種。而該技術在應用過程中需要關注的應用要點為:首先,借助VPN通道,向目的端傳輸數(shù)據(jù),然后經(jīng)過數(shù)據(jù)解密保證存儲系統(tǒng)能夠存儲數(shù)據(jù)。在此過程中應注意文件存儲形式,可能會增加數(shù)據(jù)被攻擊現(xiàn)象,因此,針對以文件存儲形式的數(shù)據(jù)需要進行加密處理。比如,在綜合性考慮加密機制與數(shù)據(jù)類型后,可以配合使用靜態(tài)或動態(tài)的方式,完成數(shù)據(jù)存儲加密作業(yè)。其次,為避免發(fā)生事故,建議對數(shù)據(jù)存儲系統(tǒng)進行特殊關注,具體來說就是高度重視對應的數(shù)據(jù)備份工作、數(shù)據(jù)恢復工作。其目的是通過建立存儲數(shù)據(jù)的備份機制,進一步減少數(shù)據(jù)意外丟失的情況。甚至在發(fā)生數(shù)據(jù)意外丟失后,可以配合使用相關恢復裝置,達到完善原有數(shù)據(jù)的目的。同時,該系統(tǒng)應該具備支持數(shù)據(jù)鏡像的功能、異地備份的功能。只有保證該系統(tǒng)具備完善的相應功能,才能實現(xiàn)為數(shù)據(jù)確立容災備份的基本要求,才能配合使用恢復工作機制和HDFS備份,完成上述最終作業(yè)。
2.數(shù)據(jù)發(fā)布
通常情況下,在經(jīng)過一系列的數(shù)據(jù)分析與數(shù)據(jù)處理作業(yè)流程后,大數(shù)據(jù)會進入數(shù)據(jù)發(fā)布階段。而該階段的主要工作內(nèi)容涉及數(shù)據(jù)公開使用的環(huán)節(jié)。所以,在此基礎上保證數(shù)據(jù)的安全性與可靠性,具有十分重要的意義。特別是要針對數(shù)據(jù)進行完善的審核與分析工作,只有這樣才能最大限度保證數(shù)據(jù)在正式發(fā)布前得到強保密性的維護,同時,在數(shù)據(jù)發(fā)布全流程,數(shù)據(jù)安全治理工作主要涉及以下三個方面:首先是數(shù)據(jù)安全審計。此項數(shù)據(jù)安全治理工作,基本上是指相關技術人員經(jīng)過一系列詳細地審查與評估后,結合采集的安全大數(shù)據(jù),針對其中隱藏的安全隱患,實施全方位的探索。隨后,建議工作人員能夠合理化運用審核稽查的方式,有效尋找并處理事故產(chǎn)生的原因。但在實際操作環(huán)節(jié)仍需要注意的是,在數(shù)據(jù)發(fā)布的同時就應確定具體的安全審計方案。具體可以通過以下幾個例子進行舉證,如:為保證數(shù)據(jù)在發(fā)布環(huán)節(jié)的安全性,配合使用網(wǎng)絡監(jiān)聽審計技術、日志審計技術、網(wǎng)關審計技術等。其次是數(shù)據(jù)溯源。該過程主要是確保數(shù)據(jù)故障發(fā)生時,能夠及時定位相關責任人。具體需要使用反向查詢法或標注法,標記定位大數(shù)據(jù)應用周期,從而實現(xiàn)數(shù)據(jù)的溯源目標。最后,防范ATP攻擊。一般情況下,此種數(shù)據(jù)攻擊方式通常指的是攻擊者通過合理化應用互聯(lián)網(wǎng)等途徑,有針對性展開的一系列攻擊行為。同時,在多數(shù)情況下,攻擊者在攻擊過程中會選擇性竊取目標信息;也可能是先在內(nèi)部網(wǎng)絡駐留一段時間后,然后通過反復尋找,確定具體的攻擊機會。比如,在針對性檢測APT攻擊的時候,就需要結合其異常狀況進行分析。具體可以通過應用沙箱技術進行檢測,并且在完成檢測作業(yè)后,可以選擇以深層協(xié)議為基礎,借助全流量審計,有效識別異常情況。通過這樣的方式,基本上可以為下一步的攻擊溯源提供有力保障。
3.隱私保護
在數(shù)據(jù)使用的過程中,要特別關注對數(shù)據(jù)實施隱私保護,這表明數(shù)據(jù)使用環(huán)節(jié)有必要遵循法律要求,配合使用數(shù)據(jù)安全治理技術,第一時間去除隱私信息。而在這樣的前提下,我們選擇從隱私信息去除的角度入手,即結合使用數(shù)據(jù)脫敏、數(shù)據(jù)匿名化等操作方法和措施,在使用數(shù)據(jù)掩蔽工具后,盡可能保證其脫敏模塊符合脫敏需要。一般情況下,國內(nèi)最常使用的脫敏處理為SIMP-SDM。
4.數(shù)據(jù)分析
將數(shù)據(jù)安全治理技術應用于數(shù)據(jù)分析環(huán)節(jié),第一,需要在做好身份認證的同時,合理化確認和辨別用戶身份,然后以此為基礎,進一步認證機密數(shù)據(jù),掌握人體生物特征信息,搜集其他特定信息。第二,有必要深度控制用戶訪問權限。通常情況下,該步驟是保證數(shù)據(jù)安全的關鍵。而且在整個過程中,要求相關人員通過采取不同用戶控制策略,在高度遵循差異化原則基礎上,有選擇性地授予其對應的訪問級別。此外,如果涉及重要資源訪問,通常建議相關人員在制定嚴格的訪問控制策略的時候,能夠多角度配合使用強制訪問控制方式、綜合自主訪問控制方式、角色訪問控制方式。
四、結語
綜上所述,數(shù)據(jù)安全治理技術在大數(shù)據(jù)應用視域下具有十分重要的作用,能夠達到保證數(shù)據(jù)使用安全的目的。為了更好地落實數(shù)據(jù)安全治理工作,本文主要結合當前數(shù)據(jù)安全治理現(xiàn)狀,多維度進行數(shù)據(jù)安全治理原則的分析和討論,并以此為基礎,合理化探討多項內(nèi)容,具體而言,主要涉及數(shù)據(jù)安全治理技術分類、數(shù)據(jù)安全治理技術架構等,希望可以有針對性地解決數(shù)據(jù)全生命周期存在的各種問題,營造良好的大數(shù)據(jù)應用環(huán)境。
參考文獻
[1]賈若飛.大數(shù)據(jù)應用中數(shù)據(jù)安全治理技術研究[J].中國設備工程,2023(2):26-28.
[2]付蓉潔.大數(shù)據(jù)時代的數(shù)字化轉(zhuǎn)型 如何實現(xiàn)數(shù)據(jù)的安全使用[J].互聯(lián)網(wǎng)經(jīng)濟,2020(Z1):58-63.
[3]劉沛汐,李鑫,蘇偉光,等.大數(shù)據(jù)應用中的數(shù)據(jù)安全治理技術分析[J].網(wǎng)絡安全技術與應用,2022(12):43-45.
[4]許杰,張鋒軍,陳捷,等.面向大數(shù)據(jù)環(huán)境下的數(shù)據(jù)安全治理技術[J].通信技術,2021,54(12):2659-2665.
[5]邱勤,徐天妮,于樂,等.算力網(wǎng)絡安全架構與數(shù)據(jù)安全治理技術[J].信息安全研究,2022,8(4):340-350.
作者單位:嘉興市數(shù)獨橋科技有限公司