李煥婷 馬勇 朱琳
摘 要:為了解決高校內(nèi)部零散知識收集問題,提供工作成果共享平臺,打通工作橫向交流通道,實現(xiàn)工作成果的沉淀、共享、協(xié)作,結(jié)合高校私有云計算背景,運用云存儲技術構(gòu)建一個輕量化的B/S架構(gòu)私有云盤系統(tǒng),提供存儲、安全、共享、權(quán)限管理、協(xié)同辦公的統(tǒng)一化學校數(shù)據(jù)管理中心。其中針對數(shù)據(jù)安全、流程審批、數(shù)據(jù)加密、高穩(wěn)定性等關鍵技術進行研究,從而實現(xiàn)增強數(shù)據(jù)的安全性與應用的便利度和系統(tǒng)的管控能力,提高數(shù)據(jù)的分發(fā)效率。
關鍵詞:私有云盤;高可用;安全加密;數(shù)據(jù)共享
Design,Key Technology Research and Implementation of
Private Cloud Disk System Based on Universities ?
Li Huant ing1 Ma Yong2 Zhu Lin2
(1.Office of Academic Affairs;
2.Network Information Center,Baotou Medical College,Baotou,Inner Mongolia 014040)
Abstract:In order to solve the collection problem of scattered knowledge in colleges and universities,a platform for sharing work achievements is provided,a horizontal communication channel is opened up,and the precipitation,sharing and collaboration of work achievements are realized.Combined with the background of private cloud computing in colleges and universities,a lightweight B/S architecture private cloud disk system is constructed by using cloud storage technology to provide a unified school data management center with storage,security,sharing,permission management and collaborative office.Among them,key technologies such as data security,process approval,data encryption and high stability are studied,so as to enhance data security,application convenience and system management and control ability,and improve data distribution efficiency.
Key words:private cloud disk;high availability;security encryption;data?sharing
近年來,高校存儲的非結(jié)構(gòu)化數(shù)據(jù)量愈發(fā)龐大,數(shù)據(jù)的格式與種類也越來越復雜,這些不同類型的辦公學習文檔大都還存儲在傳統(tǒng)的存儲載體上。由于這類存儲系統(tǒng)在底層技術方面缺乏對數(shù)據(jù)的安全保障,無法實時保護個人電腦終端的本地數(shù)據(jù),如若遇到故障,很難保護個人數(shù)據(jù)的安全。同時目前文件管理權(quán)限管控不夠細致,對所有人都可預覽,同時下載的權(quán)限拆分的不夠細,容易造成文件的遺失。在文件傳輸上無法滿足加密協(xié)議的傳輸方式,并且目前的傳統(tǒng)存儲系統(tǒng)缺少有效的數(shù)據(jù)備份與高可用能力,一旦服務器出現(xiàn)故障將影響整套系統(tǒng)的使用甚至造成數(shù)據(jù)丟失,對于高校來說是一個非常大的安全隱患,也是每一位信息化工作者都值得關注的問題。再有如果這些共享存儲服務器一旦用戶量大了很難保證穩(wěn)定,若出現(xiàn)容量瓶頸,其擴容的難度與成本都是信息化難題。由此應運而生的高校私有云盤系統(tǒng)為高校在教學辦公時的文件資料共享提供了一個高效、便捷、安全的解決途徑,促進了高校生態(tài)的良性發(fā)展。
1 系統(tǒng)總體架構(gòu)設計
云盤分為存儲系統(tǒng)和系統(tǒng)服務兩大部分,對外提供簡單易用的接口,最終用戶可以使用Web、windows、mac、iOS、Android客戶端來使用服務。存儲系統(tǒng)提供了高可用性以及安全的數(shù)據(jù)存儲體系結(jié)構(gòu)。系統(tǒng)服務為客戶端提供元數(shù)據(jù)服務、傳輸服務、權(quán)限管理服務、預覽的服務。[1]基于上述系統(tǒng)的體系架構(gòu)優(yōu)勢,云盤邏輯上文件個數(shù)和容量不存在上限,可以無限擴展,云盤的總體架構(gòu)如圖1所示。
1.1 系統(tǒng)邏輯架構(gòu)設計
數(shù)據(jù)層設計:塊數(shù)據(jù)管理:云盤在數(shù)據(jù)層采用分布式存儲集群,統(tǒng)一管理所有存儲落盤的塊數(shù)據(jù),并且同時橫向鋪設多個塊數(shù)據(jù)管理模塊,用于支持數(shù)據(jù)層高可用架構(gòu)。
云盤在數(shù)據(jù)層設置數(shù)據(jù)庫集群,保證數(shù)據(jù)庫一主兩從架構(gòu),并通過多個數(shù)據(jù)訪問服務模塊,連接底層分布式存儲集群。同時,數(shù)據(jù)庫集群和數(shù)據(jù)訪問服務都具備彈性擴展特性。
業(yè)務層設計:權(quán)限管理:云盤系統(tǒng)內(nèi)建立了完善的權(quán)限體系,共包含11種原子權(quán)限,管理員可將11種原子權(quán)限自由排列組合授予用戶。并且自系統(tǒng)中支持上下級團隊、上下級路徑權(quán)限的繼承以及反權(quán)限的授予。這整套權(quán)限體系得益于系統(tǒng)中權(quán)限管理模塊對權(quán)限控制和聯(lián)通。病毒查殺:云盤在系統(tǒng)內(nèi)接入殺毒模塊,并輔以強大的病毒庫,用于對每一個輸入系統(tǒng)的文件進行審查,防止病毒文件在云端的擴散。認證對接:適應于客戶的需求,云盤通過業(yè)務層的認證對接模塊實現(xiàn)與AD/LDAP等域控做標準用戶組織信息的導入和同步,也支持與統(tǒng)一認證平臺、OA或門戶等系統(tǒng)的SSO接入集成。
訪問層設計:負載均衡:云盤在訪問層部署HA負載均衡模塊,并通過keepalived監(jiān)控,在訪問層實現(xiàn)資源的負載均衡和分發(fā),應用訪問請求交由業(yè)務層對應模塊處理,數(shù)據(jù)請求交由數(shù)據(jù)中心處理。接口服務:云盤在訪問層開設完整的API接口,可支持通過接口覆蓋創(chuàng)建用戶、上傳、下載、新建、刪除等完整業(yè)務中的各功能場景的實現(xiàn)。
1.2 權(quán)限控制設計
云盤采用基于角色的訪問控制(Role-Based Access Control)權(quán)限模型。該模型支持三個著名的安全原則:最小權(quán)限原則,責任分離原則和數(shù)據(jù)抽象原則。[2]
(1)最小權(quán)限原則之所以被RBAC所支持,是因為RBAC可以將其角色配置成其完成任務所需要的最小的權(quán)限集。
(2)責任分離原則可以通過調(diào)用相互獨立互斥的角色來共同完成敏感的任務而體現(xiàn),比如要求一個計帳員和財務管理員共參與同一過賬。
(3)數(shù)據(jù)抽象可以通過權(quán)限的抽象來體現(xiàn),如財務操作用借款、存款等抽象,而不用操作系統(tǒng)提供的典型的讀、寫、執(zhí)行權(quán)限。
RBAC的關注點在于Role和User,Permission的關系。稱為User assignment(UA)和Permission assignment(PA).關系的左右兩邊都是Many-to-Many關系。就是user可以有多個role,role可以包括多個user。
為了兼顧RBAC權(quán)限模型的嚴謹性和用戶進行權(quán)限控制的易用性,云盤抽取了RBAC的關鍵概念結(jié)合用戶的典型場景構(gòu)成了獨具特色的權(quán)限控制體系。
1.3 系統(tǒng)安全策略設計
分層的邏輯架構(gòu),每層具有相對獨立的安全控制體系,可將安全風險控制在本層內(nèi):接入層通過https協(xié)議和用戶密碼身份驗證保證接入安全;業(yè)務層通過容器隔離、會話隔離、進程隔離保證多租戶間數(shù)據(jù)安全;數(shù)據(jù)層連接需要額外的基于用戶名密碼驗證,且賬戶體系獨立于業(yè)務系統(tǒng),保證數(shù)據(jù)訪問安全;元數(shù)據(jù)、實際數(shù)據(jù)塊分離的數(shù)據(jù)架構(gòu),單獨獲取元數(shù)據(jù)或數(shù)據(jù)塊都無法讀取完整數(shù)據(jù),且系統(tǒng)支持數(shù)據(jù)RC4加密,沒有密碼即使還原完整數(shù)據(jù)也無法解密。文件數(shù)據(jù)按照4M分塊,每塊冗余多份,保存在不同的數(shù)據(jù)中心,保證數(shù)據(jù)不會丟失。元數(shù)據(jù)高可用冗余,且每天定時備份,保證元數(shù)據(jù)完整性。業(yè)務上支持高強度用戶密碼策略,管理員可強制用戶使用高安全密碼,避免弱密碼風險。[3]
2 關鍵技術
2.1 掃描技術
全面超越主動防御及初級云安全等傳統(tǒng)方法,采用本地正常文件白名單快速匹配技術,配合強大的某可信云端體系,率先實現(xiàn)了安全性、檢出率與速度的完美結(jié)合。云查殺主要技術特點:
高效處理:提高用戶對木馬和病毒的防范能力。理想狀態(tài)下,一個盜號木馬從攻擊某臺電腦,到整個“云安全”(CloudSecurity)網(wǎng)絡對其擁有免疫、查殺能力,僅需幾秒的時間。
急速響應:對大量病毒樣本進行動態(tài)分類與共性特征分析;每天處理收到的5-10萬個新木馬病毒樣本;能夠?qū)崿F(xiàn)網(wǎng)民中毒、訪問掛馬網(wǎng)頁,都能在第一時間做出反應。
2.2 海量已知病毒識別技術
憑借在互聯(lián)網(wǎng)安全上多年的積累,擁有了近百億的樣本庫和主防日志,同時還擁有與各類惡意行為相關的漏洞、網(wǎng)址、域名等信息,某數(shù)據(jù)流檢測系統(tǒng)基于上述海量知識庫,實現(xiàn)了對大量的、已知的惡意程序的過濾。系統(tǒng)級別檢測引擎引入了解包技術、溢出檢測技術、基于PE結(jié)構(gòu)IAT的檢測算法。采用虛擬機技術進行脫殼解決加殼變換問題,同時采用更深的基于特定算法的匹配規(guī)則,比如:PE結(jié)構(gòu)相關的特征IAT、節(jié)名等方法用更少的特征檢測更多的已知病毒,同時具有對簡單免殺操作如修改部分程序的幾個字節(jié)或PE入口點等方法具有很好的未知查殺能力。[4]
2.3 家族自動聚類技術
根據(jù)已有樣本提取動態(tài)、靜態(tài)信息包括文件格式、字符串信息、殼、編譯器、版本、API等構(gòu)建每個樣本的向量,聚類包括采用兩兩比較向量相似的層次聚類以及快速聚類LSH算法。可以對一些已知家族的變種進行分類,對未知樣本進行新的聚類。K中心點方法聚類后,產(chǎn)生的中心點可以作為分類的快速比較的節(jié)點,如果新進的樣本與已有的任何中心點相似度超過一定的閾值,則判斷為已有的家族。LSH算法則是可以加速比較的過程。如圖2所示。
3 系統(tǒng)功能實現(xiàn)
3.1 校園高可用架構(gòu)部署
應用層高可用:在校園企業(yè)云盤結(jié)構(gòu)中,應用模塊承載著提供線上應用服務(例如文件下載、預覽、檢索等)的任務,因此我們?yōu)榱吮WC用戶線上功能使用不中斷,在多臺機器中對應各功能模塊部署了多個應用服務,并且多個應用服務之間是多主的關系,通過HA Proxy負載均衡。也就是說,任意一個應用服務在系統(tǒng)中都不存在單點,即使有一個服務模塊出現(xiàn)故障,也不影響線上服務的正常提供。
數(shù)據(jù)庫高可用部署:在校園企業(yè)云盤系統(tǒng)結(jié)構(gòu)中,數(shù)據(jù)庫使用MySQL數(shù)據(jù)庫,在數(shù)據(jù)庫高可用方面,我們考察了市面上各種MySQL高可用方案,并結(jié)合校園企業(yè)云盤的系統(tǒng)特點,選取了基于MySQL Galera Cluster開源方案為基礎,開發(fā)實現(xiàn)為校園專屬的多主數(shù)據(jù)庫集群架構(gòu)。實現(xiàn)真正的多主服務模式,即多個服務能同時被讀寫,不像Fabric Cluster那樣某些服務只能作備份用同步復制,不存在Slave lag。無延遲復制,不會產(chǎn)生類似“一主一從”或“雙主”方案中可能導致的數(shù)據(jù)丟失。自動擴展節(jié)點,同時具有讀和寫的擴展能力,不需手工復制數(shù)據(jù)庫到新的節(jié)點。對應用程序透明,應用程序不需作修改。更小的客戶端延遲。校園數(shù)據(jù)庫多主方案的邏輯架構(gòu)如下圖3所示。
應用服務經(jīng)過負載均衡向數(shù)據(jù)庫服務群組發(fā)起讀取或?qū)懭胝埱?,提交的每個事務都會通過wsrep API在Galera Replication中向所有服務器執(zhí)行,同時監(jiān)控管理模塊保證所有服務器都執(zhí)行成功,要不就所有都回滾,保證所有服務的數(shù)據(jù)一致性,而且所有服務器同步實時更新。[5]
3.2 數(shù)據(jù)流向?qū)崿F(xiàn)
用戶對云盤系統(tǒng)進行業(yè)務訪問及數(shù)據(jù)交互請求,數(shù)據(jù)流程及模塊間協(xié)作關系如下:首先由HA模塊進行資源的負載均衡及分發(fā);應用訪問請求交至Application模塊處理,Application將操作信息讀/寫至DB數(shù)據(jù)庫;數(shù)據(jù)交互請求交至Datacenter模塊處理,Datacenter將文件切片,按定義好的存儲方式將數(shù)據(jù)塊推送至cellagent模塊進行數(shù)據(jù)存儲處理,并將數(shù)據(jù)索引存入DB數(shù)據(jù)庫中。如圖4所示。[6]
3.3 私有云盤客戶端實現(xiàn)
校園企業(yè)云盤,使用簡單、直觀的方式管理不同部門、不同區(qū)域、不同項目的數(shù)據(jù)。同時,可以對其指定不同的訪問成員和權(quán)限。支持瀏覽器端多人實時協(xié)同編輯,支持常見office、wps文件同時寫入編輯,即時看到其他編輯者的編輯內(nèi)容更新;可以實現(xiàn)Web端本地編輯場景,用戶可以在瀏覽器直接調(diào)用本地應用程序進行編輯文件,省去了先下載再將文件上傳到云盤的過程。提供敏感信息識別模塊,包括正則表達式、文件指紋、文檔自學習、敏感信息定義及敏感信息規(guī)則等功能。實現(xiàn)基于文檔生成規(guī)則、文檔樣本的內(nèi)容識別,基于關鍵字、MD5及文件指紋等的敏感信息定義,以及自定義的敏感信息規(guī)則,自動匹配安全管控策略。開啟殺毒功能,用戶上傳的文件如果帶有病毒時,會自動向云盤管理員發(fā)送通知郵件。
4 結(jié)束語
目前,私有網(wǎng)盤系統(tǒng)已經(jīng)成為日益成熟的一種服務模式,可以為師生分配一定的存儲空間,無論何時何地,都可以實現(xiàn)數(shù)據(jù)的存儲和讀取,并且可以通過底層架構(gòu)和上層應用來共同控制數(shù)據(jù)的讀取,滿足師生對數(shù)據(jù)安全的需求,提高了安全性,為全校師生生活學習提供便捷服務。
參考文獻:
[1]鄧勁生,韓丹,胡慧俐.虛擬桌面環(huán)境雙向認證網(wǎng)盤設計與實現(xiàn)[J].華中科技大學學報(自然科學版),2016,44(11):92-96.
[2]胡昌平,查夢娟.基科研人員學術信息資源云存儲服務應用安全障礙分析與對策[J].情報理論與實踐,2020,1(43):20-22、26.
[3]張惠彬,劉詩蕾.失范與重構(gòu):網(wǎng)絡云盤的版權(quán)亂象與治理方案[J].電視研究,2018,6(343):40-42.
[4]胡渝蘋.文件秒傳系統(tǒng)在云存儲環(huán)境下的設計與實現(xiàn)[J].計算機應用與軟件,2016,4(33):329-333.
[5]李軍,勞鳳丹,鄒仁明.校園網(wǎng)云盤系統(tǒng)構(gòu)建研究[J].通信學報,2013,9(34):133-137.
[6]劉璐,張燦,張全新,李元章,譚毓安.一種網(wǎng)盤認證協(xié)議的分析與驗證[J].計算機應用,2017,37(S1):317-320、330.
(責任編輯 郭曉勇)