付維維
摘 要:隨著各地數(shù)據(jù)中心建設(shè)、云計算技術(shù)的發(fā)展,各數(shù)據(jù)中心協(xié)作日趨頻繁,異地多源數(shù)據(jù)共享成為必然趨勢。傳統(tǒng)的數(shù)據(jù)共享方式主要基于統(tǒng)一的數(shù)據(jù)中心,然而這種模式未能充分考慮各異地數(shù)據(jù)中心權(quán)限管控、安全性等因素,使得異地多源數(shù)據(jù)共享仍然困難重重。本文提出了一種基于總線結(jié)構(gòu)的異地多源數(shù)據(jù)共享應(yīng)用模型,各數(shù)據(jù)中心只需將共享交換的數(shù)據(jù)副本上傳至總線,通過統(tǒng)一的權(quán)限管控,以期為異地多源數(shù)據(jù)共享提供支持。相對傳統(tǒng)的數(shù)據(jù)共享模型,該模型靈活的權(quán)限管控既可以較好地保障數(shù)據(jù)安全又能防止利益沖突造成的信息壁壘,同時又可以大大降低共享的資金、人力和時間成本。
關(guān)鍵詞:異地多源數(shù)據(jù);總線結(jié)構(gòu);數(shù)據(jù)共享;數(shù)據(jù)副本;權(quán)限管控
Research on theApplication Modelof the Multi-Source Data Replica AuthorityControl
Abstract:With the development of data centers and the development of cloud computing technologies in various places, the cooperation of data centers has become more and more frequent, and multi-source data sharing in different places has become an inevitable trend.The traditional data sharing methodsare mainly based on a unified data center. However, these models fail to fully consider the control and security of data centers in different places, and other factors, making multi-source data sharing in different places still difficult.This paper proposed a multi-source data sharing application model based on bus structure. Each data center only needs to upload a copy of the shared exchange data to the bus, and through unified authority control, in order to provide support for multi-source data sharing in different places.Compared with the traditional data sharing model, the flexible privilege management of the model can better protect data security and prevent information barriers caused by conflicts of interest, and at the same time greatly reduce the shared capital, labor and time costs.
Key words:Different place Multi-Source Data;bus structure;data sharing;data replica;authority control
1 引言
隨著各地數(shù)據(jù)中心建設(shè)、云計算技術(shù)的發(fā)展,各數(shù)據(jù)中心的協(xié)作日趨頻繁,根據(jù)業(yè)務(wù)需求產(chǎn)生了大量的數(shù)據(jù)交換。然而隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、人工智能等新興技術(shù)的高速發(fā)展,各地數(shù)據(jù)中心的數(shù)據(jù)量激增,同時業(yè)務(wù)需求的多樣化導(dǎo)致各數(shù)據(jù)中心間數(shù)據(jù)交換需要大量的時間成本,因此異地多源數(shù)據(jù)共享成為一種必然趨勢。異地多源數(shù)據(jù)共享具有重要的作用和意義,一方面,它可以促進(jìn)異地數(shù)據(jù)中心數(shù)據(jù)管理的科學(xué)、高效,促使有效數(shù)據(jù)應(yīng)用的形成; 另一方面,它可以解決當(dāng)前異地數(shù)據(jù)中心多源數(shù)據(jù)共享存在的諸多問題。
當(dāng)前的異地數(shù)據(jù)中心多源數(shù)據(jù)共享主要面臨著三大難題: 其一,各數(shù)據(jù)中心形成信息壁壘。由于管理體制問題,各數(shù)據(jù)中心間相互獨立,形成信息壁壘。這使得數(shù)據(jù)中心存在重復(fù)建設(shè)的想象,嚴(yán)重浪費人力、物力、財力,同時也使得大量數(shù)據(jù)資源難以共享開發(fā),其真正價值難以得到充分發(fā)揮[1-2]。其二,各數(shù)據(jù)中心缺乏統(tǒng)一的標(biāo)準(zhǔn)體系。各數(shù)據(jù)中心的數(shù)據(jù)庫缺乏標(biāo)準(zhǔn)體系的支撐,數(shù)據(jù)格式、元數(shù)據(jù)標(biāo)準(zhǔn)不一致,采用的處理技術(shù)各不相同,數(shù)據(jù)接口也不互通,數(shù)據(jù)共享困難[3]。最后,缺乏統(tǒng)一的權(quán)限管控。各數(shù)據(jù)中心數(shù)據(jù)或多或少涉及公民隱私和業(yè)務(wù)秘密,如果在共享交換過程中缺乏統(tǒng)一的權(quán)限管控,將會帶來嚴(yán)重后果。
本文提出了一種基于總線結(jié)構(gòu)的異地多源數(shù)據(jù)共享應(yīng)用模型,該模型主要從共享的數(shù)據(jù)副本權(quán)限管控方面支撐實現(xiàn)異地多源數(shù)據(jù)的共享。相較傳統(tǒng)模型,該模型具有多數(shù)據(jù)中心互聯(lián)互通、權(quán)限自主管控、物理上分散、邏輯上統(tǒng)一等特點,既可以保障數(shù)據(jù)安全和各數(shù)據(jù)中心利益,又有利于異地多源數(shù)據(jù)共享的推進(jìn),同時還可以大大降低實施資金、人力和時間成本。
2 基于總線結(jié)構(gòu)的異地多源數(shù)據(jù)共享
當(dāng)前研究主要基于統(tǒng)一的數(shù)據(jù)中心實現(xiàn)數(shù)據(jù)共享,但各數(shù)據(jù)中心出于數(shù)據(jù)安全性的考慮,異地數(shù)據(jù)中心多源數(shù)據(jù)共享積極性不高,因此亟需提出一種新的共享方式??偩€結(jié)構(gòu)具有全員互聯(lián)互通、權(quán)限管控、物理上分散、邏輯上統(tǒng)一等特點,為解決上述異地多源數(shù)據(jù)共享的問題提供了很好的思路,因此本文基于總線結(jié)構(gòu)提出了一種新型的異地多源數(shù)據(jù)共享模型。
2.1 異地多源數(shù)據(jù)共享模型
基于總線結(jié)構(gòu)實現(xiàn)異地多源數(shù)據(jù)共享的基本思想是各數(shù)據(jù)中心基于統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)體系,將需要共享交換的數(shù)據(jù)副本通過標(biāo)準(zhǔn)化的接口上傳至服務(wù)總線,并通過統(tǒng)一的權(quán)限管控,識別用戶身份,控制訪問權(quán)限,實行三員分立,從而形成一種邏輯上統(tǒng)一、物理上分散的總線結(jié)構(gòu)。如圖1所示:邏輯上統(tǒng)一體現(xiàn)在異地數(shù)據(jù)中心基于統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)體系,通過統(tǒng)一的接口標(biāo)準(zhǔn)進(jìn)行數(shù)據(jù)副本交換共享,異地數(shù)據(jù)中心之間不再孤立,而是通過統(tǒng)一的標(biāo)準(zhǔn)體系聯(lián)系在一起,形成邏輯上統(tǒng)一的整體; 而物理上分散體現(xiàn)在異地多源數(shù)據(jù)只儲存在該數(shù)據(jù)中心的數(shù)據(jù)庫中,因此物理上各數(shù)據(jù)中心是分散的。綜上,基于總線結(jié)構(gòu)異地多源數(shù)據(jù)共享的核心是一套統(tǒng)一標(biāo)準(zhǔn)體系和統(tǒng)一的總線共享數(shù)據(jù)副本權(quán)限管理體系。
3 數(shù)據(jù)副本權(quán)限管控體系
3.1數(shù)據(jù)副本管理
數(shù)據(jù)副本管理(Copy Data Management,CDM):是從生產(chǎn)環(huán)境通過快照技術(shù)獲取有應(yīng)用一致性保證的數(shù)據(jù),在非生產(chǎn)存儲上生成“黃金副本”(Golden Image),這個“黃金副本”數(shù)據(jù)格式是原始的磁盤格式,可再虛擬化成多個副本直接掛載給服務(wù)器,分別用于備份恢復(fù)、容災(zāi)或開發(fā)測試[4]。在異地多源數(shù)據(jù)共享場景中,數(shù)據(jù)副本則主要用于數(shù)據(jù)的共享交換,根據(jù)業(yè)務(wù)需求,只需將共享的數(shù)據(jù)副本上傳至總線。此時,數(shù)據(jù)副本的權(quán)限管控顯得尤為重要,不僅需要有效滿足各共享數(shù)據(jù)業(yè)務(wù)需求,同時還要保證各數(shù)據(jù)源的安全,防止數(shù)據(jù)泄漏。
3.2權(quán)限管控體系
各異地數(shù)據(jù)中心的數(shù)據(jù)不可避免會涉及到大量的公眾隱私和業(yè)務(wù)秘密,對上傳至總線的數(shù)據(jù)副本需要實行嚴(yán)格的權(quán)限管控。包括三員分立管理、統(tǒng)一身份認(rèn)證、角色權(quán)限控制等。
3.2.1三員分立管理
總線服務(wù)采用基于角色的權(quán)限控制模型,禁止超級特權(quán)用戶,實現(xiàn)三員(系統(tǒng)管理員、審計管理員、安全管理員)分立管理。
異地多源數(shù)據(jù)共享平臺系統(tǒng)將數(shù)據(jù)副本資源與操作相結(jié)合形成相應(yīng)的授權(quán)策略,并將授權(quán)策略授權(quán)給角色,建立三種類型的角色;將角色分配給相應(yīng)的用戶,實現(xiàn)用戶對數(shù)據(jù)副本資源的權(quán)限控制與分配。對資源的操作分為管理和使用兩種方式,實現(xiàn)對系統(tǒng)資源管理和使用的權(quán)限分離。結(jié)合以上三類管理員的模式,將共享平臺系統(tǒng)的數(shù)據(jù)副本資源使用和管理進(jìn)行分離且三類管理員的行為進(jìn)行相互制約,如圖2所示。
安全管理員:負(fù)責(zé)對共享平臺系統(tǒng)中系統(tǒng)管理員的創(chuàng)建及資源權(quán)限的分配,安全管理員自身不具備對資源使用的權(quán)限;安全管理員對資源權(quán)限的分配是根據(jù)管理員的安全域進(jìn)行限制,安全管理員不能為自身分配權(quán)限。
系統(tǒng)管理員:由安全管理員創(chuàng)建、維護(hù),系統(tǒng)管理員只能對共享平臺系統(tǒng)的數(shù)據(jù)副本資源擁有使用的權(quán)限,不具備相應(yīng)的管理權(quán)限;其使用資源的權(quán)限范圍由安全管理員分配。
審計管理員:負(fù)責(zé)對系統(tǒng)安全管理員及系統(tǒng)管理員的行為進(jìn)行審計,并對共享平臺系統(tǒng)數(shù)據(jù)副本資源的運行狀態(tài)進(jìn)行監(jiān)控,不能使用共享平臺系統(tǒng)資源,也不能對共享平臺系統(tǒng)資源進(jìn)行分配和管理。
3.2.2統(tǒng)一身份認(rèn)證
本文選取依托身份認(rèn)證服務(wù)體系,采用身份認(rèn)證載體與用戶崗位綁定的方式進(jìn)行統(tǒng)一身份認(rèn)證,實現(xiàn)用戶依授權(quán)訪問,為安全事件的跟蹤審計提供依據(jù)。
1)用戶管理
由系統(tǒng)管理員統(tǒng)一生成用戶的身份標(biāo)識符,采用基于數(shù)字證書和USBKey進(jìn)行身份認(rèn)證并確保身份標(biāo)識符在系統(tǒng)生命周期中的唯一性;對系統(tǒng)內(nèi)的身份標(biāo)識符加強管理、維護(hù),確保身份標(biāo)識符列表不被非授權(quán)地訪問、修改或刪除;用戶標(biāo)識符與安全審計相關(guān)聯(lián),保證系統(tǒng)內(nèi)安全事件的可核查性。
2)用戶認(rèn)證
用戶登錄時采用用戶名/口令+數(shù)字證書的方式進(jìn)行,用戶登錄時,首先輸入系統(tǒng)用戶名及口令然后輸入數(shù)字證書保護(hù)密碼,然后由密碼設(shè)備校驗用戶的數(shù)字證書,如果通過,則用戶是合法用戶,否則認(rèn)證失敗,采用雙因子認(rèn)證提供系統(tǒng)的安全性。
3)日志審計
針對登錄異地多源數(shù)據(jù)共享平臺的用戶,建立跟蹤用戶在系統(tǒng)的共享數(shù)據(jù)副本操作行為,當(dāng)數(shù)據(jù)副本出現(xiàn)問題時可提供一個數(shù)據(jù)修改記錄的追溯手段。對證書用戶的訪問記錄進(jìn)行敏感訪問記錄,對證書用戶的業(yè)務(wù)操作進(jìn)行不可抵賴的日志記錄。對日志進(jìn)行制度性地審核,確保安全事件及時發(fā)現(xiàn)制止。
3.2.3角色權(quán)限控制
用戶權(quán)限管理的主要目的就是保證系統(tǒng)的安全,而在信息系統(tǒng)中,基于用戶行為對用戶訪問進(jìn)行控制是保證系統(tǒng)安全的主要措施之一[5]。當(dāng)前主要有3種訪問控制策略: 自主訪問控制( DAC: Discretionary Access Control )、強制訪問控制( MAC: Mandatory Access Control) 和基于角色的訪問控制( RBAC: Role-Based Access Control) 。
前兩種訪問控制方式在授權(quán)時需要對每對主體與客體制定訪問許可,當(dāng)主體和客體的數(shù)量非常大時,授權(quán)工作會很困難。而基于角色的訪問控制是將單個主體的權(quán)限轉(zhuǎn)換為角色的權(quán)限,通過給用戶分配不同的角色,達(dá)到賦予用戶不同權(quán)限的目的[6]。這種方式大大降低了系統(tǒng)的復(fù)雜度,同時體現(xiàn)了系統(tǒng)的組織結(jié)構(gòu),簡潔并具有靈活性。因此,本文選取該種方式對用戶進(jìn)行訪問控制。比如同一個數(shù)據(jù)副本,有的用戶可以查閱下載,有的用戶可以刪除修改,而有的用戶則不能做此操作。
4 結(jié)語
由于信息壁壘和安全性問題,各地數(shù)據(jù)中心大量的數(shù)據(jù)資源無法得到有效利用,為了更好地促進(jìn)信息化發(fā)展,異地多源數(shù)據(jù)共享是一個必然的趨勢。然而,傳統(tǒng)的數(shù)據(jù)共享大都基于統(tǒng)一的大數(shù)據(jù)中心實現(xiàn),這種方式主要存在三方面問題: 一是共享成本比較高,包括搭建共享平臺的資金成本和集成各數(shù)據(jù)中心的多源數(shù)據(jù)并標(biāo)準(zhǔn)化的時間和人力成本; 二是數(shù)據(jù)安全難以保障,共享平臺中龐大的數(shù)據(jù)量為數(shù)據(jù)安全保障工作帶來了很大困難;三是需要考慮數(shù)據(jù)一致性問題,需定期進(jìn)行數(shù)據(jù)維護(hù)。
為解決上述問題,本文提出了一種基于總線結(jié)構(gòu)的異地多源數(shù)據(jù)共享應(yīng)用模型,該模型的基本思想是: 各數(shù)據(jù)中心基于統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)體系通過標(biāo)準(zhǔn)化接口實現(xiàn)異地數(shù)據(jù)中心的互聯(lián)互通; 數(shù)據(jù)共享時,各數(shù)據(jù)中心只需將用于共享交換的數(shù)據(jù)副本上傳至服務(wù)總線,同時對總線上的數(shù)據(jù)副本進(jìn)行統(tǒng)一的權(quán)限管控,包三員分立管理、括統(tǒng)一身份認(rèn)證、角色訪問控制。相較傳統(tǒng)的大數(shù)據(jù)中心共享方式,該模型通過物理上分散、邏輯上統(tǒng)一的總線結(jié)構(gòu),既用較少的成本實現(xiàn)了各地數(shù)據(jù)中心的互聯(lián)互通,又通過數(shù)據(jù)副本權(quán)限管控很好地保障了各地數(shù)據(jù)中心的數(shù)據(jù)安全,此外還無需考慮數(shù)據(jù)一致性問題,大大減輕了數(shù)據(jù)維護(hù)工作,可行性更強。
參考文獻(xiàn)
[1] 董凌峰,李永忠. 基于云計算的政務(wù)數(shù)據(jù)信息共享平臺構(gòu)建研 究———以“數(shù)字福建”為例 [J]. 現(xiàn)代情報,2015,35 ( 10) : 76-81.
[2] 鄧念國. 政務(wù)大數(shù)據(jù)共享難題如何破解? [J]. 大數(shù)據(jù)時代,2017,( 3) : 22-25.
[3] 唐長樂,王春迎. 基于政務(wù)云數(shù)據(jù)中心的政府?dāng)?shù)據(jù)開放共享服 務(wù)集成平臺研究 [J]. 情報資料工作,2017,( 5) : 13-19.
[4]Pushan Rinnen,Garth Landers. Innovation Insight: Copy Data Management Accelerates Bimodal IT. Gartner.com, 2016.
[5] Ping N,Liao J,Wang C,et al. Web Information Recommenda- tion Based on User Behaviors [P]. Computer Science and Informa- tion Engineering,2009 WRI World Congress on,2009.
[6] 唐成華,陳新度,陳新. 管理信息系統(tǒng)中多用戶權(quán)限管理的 研究及實現(xiàn) [J]. 計算機應(yīng)用研究,2004,( 3) : 217-219.