李愛勤 鮑凌云 馮曉娜
〔摘 要〕文章在介紹云存儲的相關(guān)概念及獨特優(yōu)勢的基礎(chǔ)上,將云存儲引入數(shù)字圖書館資源存儲中,構(gòu)建了從體系結(jié)構(gòu)、拓撲結(jié)構(gòu)及功能模塊三方面的數(shù)字圖書館資源云存儲方案,指出了云存儲在存儲安全及圖書館知識產(chǎn)權(quán)方面的缺陷。
〔關(guān)鍵詞〕數(shù)字圖書館;資源存儲;云存儲
DOI:10.3969/j.issn.1008-0821.2012.02.012
〔中圖分類號〕G250.76 〔文獻標識碼〕A 〔文章編號〕1008-0821(2012)02-0048-03
Cloud Storage Model Research of Digital Library ResourcesLi Aiqin Bao Lingyun Feng Xiaona
(Library,Shandong University of Technology,Zibo 255049,China)
〔Abstract〕On the basis of the introduction of related concepts and unique advantage of cloud storage,the article brought cloud storage into digital library resources storage,moreover,it established a system structure from the topology structure and function modules of the three aspects of the digital library resources and pointed out the defects of cloud storage in the secure storage and the library intellectual property rights.
〔Key words〕digital library;resources storage;cloud storage model
1 云存儲
1.1 云存儲概念與特征
云計算(Cloud Computing)作為IT產(chǎn)業(yè)繼個人計算機和因特網(wǎng)之后的第三次變革,在社會各界引起了軒然大波。而云計算的資源存儲即云存儲(Cloud Storage),它是通過集群應(yīng)用、網(wǎng)格技術(shù)或分布式文件系統(tǒng)等功能,將網(wǎng)絡(luò)中大量各種不同類型的存儲設(shè)備通過應(yīng)用軟件集合起來協(xié)同工作,共同對外提供數(shù)據(jù)存儲和業(yè)務(wù)訪問功能的一個系統(tǒng)[1]。
與以往存儲方式不同的是,云存儲中不僅僅是硬件的整合,更多的融合了網(wǎng)絡(luò)設(shè)備、存儲設(shè)備、服務(wù)器、應(yīng)用軟件、公用訪問接口、接入網(wǎng)和客戶端程序。通過結(jié)合應(yīng)用軟件與存儲設(shè)備,云存儲為用戶提供的不只是單純云端存儲設(shè)備的存儲服務(wù),而是整個云存儲系統(tǒng)帶給用戶的一種數(shù)據(jù)訪問服務(wù)[2]。此外,由于集成統(tǒng)一,云存儲更是具有其他存儲所不具有的的規(guī)模經(jīng)濟性、資源虛擬性、彈性收縮性、高安全性、高可靠性以及可根據(jù)自身需要即買即用的云存儲服務(wù)。
1.2 常見的云存儲服務(wù)
云存儲提倡的是利用云服務(wù)廠商的系統(tǒng)而不是本地系統(tǒng)來存儲資源,用戶則需要接入互聯(lián)網(wǎng),通過網(wǎng)絡(luò)來訪問存儲在云上的數(shù)據(jù)。目前,國內(nèi)外已經(jīng)有數(shù)百種不同的云存儲服務(wù),如專門面向特定環(huán)境、特定用戶的,專門存儲電子郵件或數(shù)字圖片的,專門負責(zé)存儲視頻、音頻文件的等等。目前較常見的一些云存儲服務(wù)有:
(1)電子郵件提供商,如Google的Hotmail和Yahoo!Mail,他們可以允許用戶在廠商服務(wù)器上存儲電子郵件消息。用戶只要接入互聯(lián)網(wǎng)就可以隨時隨地訪問自己的電子郵件。
(2)YouTube為用戶提供了在線的存儲服務(wù)器,方便用戶上傳視頻文件;而Flickr和Picasa,則是讓用戶通過創(chuàng)建自己的在線圖庫,任意上傳數(shù)字圖片。
(3)社交類網(wǎng)站,如Facebook和人人網(wǎng)、博客等則建立大型的服務(wù)器中心,方便其用戶將文字、圖片、視頻、音頻等各種數(shù)據(jù)存儲在云存儲廠商的服務(wù)器上。
(4)Amazon的ES3是一種可擴展、高速、低成本的基于Web的存儲服務(wù),可以為個人和企業(yè)用戶提供各種數(shù)據(jù)及應(yīng)用程序的在線備份和存檔。
(5)IBM的Smart Business Storage和MicroSoft的Windows Azure則是一種基于私有云技術(shù),為企業(yè)用戶提供應(yīng)用程序存儲支持的云存儲服務(wù)。
(6)金山的快盤,華為的DBANK數(shù)據(jù)銀行,也都做到了以用戶為中心,以企業(yè)服務(wù)器集群為基礎(chǔ),為用戶提供方便快捷的在線云存儲服務(wù)。
2 數(shù)字圖書館資源云存儲研究
2.1 數(shù)字圖書館資源云存儲體系結(jié)構(gòu)
云存儲的理念就是盡可能的整合資源,實現(xiàn)資源的共享利用。在利用各大高校圖書館原有資源的基礎(chǔ)上,整合搭建可以共享的云數(shù)字圖書館,能夠有效減少圖書館的硬件費用支出,最大程度上實現(xiàn)圖書館資源的有效利用。結(jié)合云存儲的結(jié)構(gòu)模型,本文構(gòu)建了針對數(shù)字圖書館應(yīng)用的數(shù)字資源云存儲體系結(jié)構(gòu),如圖1所示。
訪問層數(shù)字圖書館用戶各類存儲應(yīng)用統(tǒng)計訪問入口、用戶認證授權(quán)管理應(yīng)用層數(shù)字圖書館資源存儲平臺、數(shù)字圖書館各種Web服務(wù)基礎(chǔ)管理層集群系統(tǒng)、分布式文件系統(tǒng)、網(wǎng)絡(luò)計算CDN、P2P、重復(fù)數(shù)據(jù)刪除、數(shù)據(jù)壓縮數(shù)據(jù)加密、數(shù)據(jù)備份、數(shù)據(jù)容災(zāi)存儲層文件系統(tǒng)、數(shù)據(jù)庫、元數(shù)據(jù)集存儲設(shè)備、存儲虛擬化、存儲管理設(shè)備圖1 數(shù)字圖書館云存儲體系結(jié)構(gòu)
2012年2月第32卷第2期數(shù)字圖書館資源云存儲模型研究Feb.,2012Vol.32 No.2系統(tǒng)模型體系結(jié)構(gòu)共分4層,從底層依次是存儲層、基礎(chǔ)管理層、服務(wù)應(yīng)用層和訪問層[3]。
最底層是存儲層,也是數(shù)字圖書館云存儲體系的硬件層。該層為整個云存儲系統(tǒng)提供基本的網(wǎng)絡(luò)環(huán)境、物理存儲資源和邏輯存儲資源,包括存儲設(shè)備(磁盤陣列、光盤庫和磁帶庫、FC光纖通道存儲設(shè)備、NAS和iSCSI等IP存儲設(shè)備、SCSI或SAN、DAS等存儲設(shè)備)、存儲管理設(shè)備、數(shù)據(jù)邏輯存儲系統(tǒng)(文件系統(tǒng)、數(shù)據(jù)庫和元數(shù)據(jù)集)等。其中云存儲系統(tǒng)中的存儲設(shè)備大部分是現(xiàn)有的存儲設(shè)備通過網(wǎng)絡(luò)連接整合形成。而統(tǒng)一的存儲設(shè)備管理系統(tǒng),可以實現(xiàn)所整合存儲設(shè)備的邏輯虛擬化管理、多鏈路冗余管理,以及各種硬件設(shè)備的狀態(tài)實時監(jiān)控和故障維護。
第二層是基礎(chǔ)管理層,是數(shù)字圖書館云存儲體系的核心層。該層通過集群、分布式文件系統(tǒng)、網(wǎng)格計算等技術(shù),實現(xiàn)云存儲中的多個存儲設(shè)備間的協(xié)同工作,包括存儲監(jiān)控、調(diào)度、副本管理等,可以根據(jù)數(shù)字圖書館的需求在某個時刻對外提供同一種服務(wù),并提供更大更強更好的數(shù)據(jù)訪問性能,保證眾多用戶可以同時訪問使用數(shù)字圖書館資源。此外,該層還采用CDN內(nèi)容分發(fā)、數(shù)據(jù)加密技術(shù)保證云存儲中的數(shù)據(jù)不會被未授權(quán)的用戶所訪問,還利用數(shù)據(jù)備份和數(shù)據(jù)容災(zāi)技術(shù)保證數(shù)字圖書館云存儲系統(tǒng)中數(shù)據(jù)的自身安全和穩(wěn)定。
第三層是服務(wù)應(yīng)用層,為用戶提供了數(shù)字圖書館資源云存儲平臺和數(shù)字圖書館各類Web服務(wù),包括信息采集、加工、管理所需的存儲;信息的發(fā)布與服務(wù)所需的存儲以及容災(zāi)備份等所需的存儲。同時,數(shù)字圖書館中的業(yè)務(wù)管理、書目管理OPAC等,通過應(yīng)用層共享云端平臺,圖書館管理人員都可以更方便地訪問與管理。
最上層是訪問層。任何一個獲得授權(quán)的用戶,只要擁有能夠接入互聯(lián)網(wǎng)的終端設(shè)備,諸如PC、手機、移動多媒體等,就可以在任何時候任何地點通過應(yīng)用層的數(shù)字圖書館資源存儲平臺使用數(shù)字圖書館資源的云存儲服務(wù),滿足自己的信息需求。
2.2 數(shù)字圖書館資源云存儲模型
2.2.1 數(shù)字圖書館資源云存儲模型拓撲結(jié)構(gòu)
圖書館的職責(zé)就是為社會公眾提供他們所需要的知識服務(wù),數(shù)字圖書館的出現(xiàn)更是將圖書館的服務(wù)進一步提升。在構(gòu)建數(shù)字圖書館資源云存儲模型時,可以借鑒IT界著名的服務(wù)管理最佳實踐——ITIL(IT Infrastructure Library),ITIL最新版本三主要包含5個部分的流程:服務(wù)策略、服務(wù)設(shè)計、服務(wù)轉(zhuǎn)移、服務(wù)運營和持續(xù)服務(wù)改善[4]。根據(jù)實際需求,在構(gòu)建的云存儲模型系統(tǒng)中并沒有集成所有的ITIL流程,具體的系統(tǒng)拓撲結(jié)構(gòu)如圖2所示。
2.2.2 數(shù)字圖書館云存儲模型功能模塊
云存儲的核心就是應(yīng)用軟件與存儲設(shè)備相結(jié)合,通過應(yīng)用軟件來實現(xiàn)存儲設(shè)備向存儲服務(wù)的轉(zhuǎn)變。在構(gòu)建的數(shù)字圖書館云存儲系統(tǒng)中,圖書館所使用的云存儲不僅僅是單純的存儲設(shè)備的集合體,而是由眾多存儲設(shè)備集合帶來的數(shù)據(jù)訪問服務(wù)。從功能上劃分,可以將整個數(shù)字圖書館云存儲模型系統(tǒng)分成七大模塊:物理存儲設(shè)備和管理模塊,虛擬化存儲管理模塊,存儲網(wǎng)絡(luò)連接設(shè)備管理模塊,資源管理模塊,存儲管理模塊,備份管理模塊和㊣/O管理模塊[5]。
(1)物理存儲設(shè)備和管理模塊。利用該模塊可以對云存儲系統(tǒng)中所有的物理設(shè)備監(jiān)控,實時收集、管理各個設(shè)備的運行信息,保證云存儲系統(tǒng)中各設(shè)備能聯(lián)合起來協(xié)同工作,為數(shù)字圖書館工作的正常運行作保障。
(2)虛擬化存儲管理模塊。此模塊作為數(shù)字圖書館資源云存儲系統(tǒng)中的關(guān)鍵模塊,它在物理設(shè)備整合的基礎(chǔ)之上,對形成的巨大的邏輯資源池進行管理。
(3)存儲網(wǎng)絡(luò)連接設(shè)備管理模塊。利用該模塊,當整個云存儲系統(tǒng)中某個設(shè)備不能正常工作或遇到某個設(shè)備被集中訪問時,則可以及時地將任務(wù)轉(zhuǎn)移到其他設(shè)備,來保證云存儲服務(wù)的可靠。
(4)資源管理模塊。該模塊可以通過對所存儲的信息資源進行合理調(diào)配和規(guī)劃,根據(jù)用戶的訪問需求,自動地查找云存儲系統(tǒng)中的可用資源來及時響應(yīng)應(yīng)用程序需求。圖2 數(shù)字圖書館云存儲模型系統(tǒng)拓撲結(jié)構(gòu)
(5)存儲管理模塊。用戶向存儲管理模塊提供的應(yīng)用程序接口(API)提出數(shù)據(jù)訪問請求后,此模塊利用元數(shù)據(jù)目錄中的信息進行協(xié)議轉(zhuǎn)接,并將轉(zhuǎn)接后的數(shù)據(jù)訪問請求發(fā)向不同的存儲設(shè)備,利用虛擬化存儲實現(xiàn)對異構(gòu)存儲資源的統(tǒng)一訪問。
(6)備份管理模塊。云存儲系統(tǒng)中數(shù)據(jù)是被集中存儲在云數(shù)據(jù)中心,云數(shù)據(jù)中心的構(gòu)建又是集合了數(shù)量龐大的服務(wù)器、存儲設(shè)備等,設(shè)備的出故障率自然明顯提高。為了在某個或某些設(shè)備出現(xiàn)故障,而不影響圖書館數(shù)據(jù)的安全、可靠及服務(wù)的正常提供,云存儲提供中的備份管理模塊發(fā)揮了很大作用。
(7)㊣/O管理模塊。在云存儲中,動態(tài)存儲給數(shù)字圖書館帶來了解決途徑,通過㊣/O管理模塊,可以很好的分配圖書館存儲系統(tǒng)中的服務(wù)器資源,為用戶提供實時不間斷的服務(wù)。
3 結(jié)束語
隨著計算機性能的不斷提高和網(wǎng)絡(luò)通信技術(shù)的迅猛發(fā)展,應(yīng)用需求日益朝著高性能、大規(guī)模、多樣性、多功能的方向發(fā)展,要求將地理上分布的、異構(gòu)的各種高性能計算資源、存儲資源、數(shù)據(jù)資源和其他特殊資源通過高速網(wǎng)絡(luò)連接起來,實現(xiàn)高性能聯(lián)合計算,共同完成重大應(yīng)用問題。云計算和云存儲的提出,使得高性能運算、大范圍共享和低成本運營成為可能。
可以說,云計算與云存儲的出現(xiàn),不僅是IT界的又一個里程碑,也給圖書館界帶來新的發(fā)展活力,尤其是將會帶動互聯(lián)網(wǎng)下數(shù)字圖書館的新發(fā)展。利用云存儲來構(gòu)建數(shù)字圖書館的資源存儲系統(tǒng),可以實現(xiàn)近乎無限的系統(tǒng)容量擴展,便于集中式統(tǒng)一管理,能有效減少圖書館的成本支出,滿足眾多用戶并發(fā)訪問的實時響應(yīng)等。它能夠在資源分布較廣的范圍內(nèi)實現(xiàn)大范圍聯(lián)合為更多用戶提供服務(wù),真正消除數(shù)字圖書館的信息孤島,實現(xiàn)數(shù)字圖書館資源的共享,發(fā)揮數(shù)字圖書館知識寶藏的潛能。但是由于云存儲是通過硬件設(shè)備的共用以及虛擬存儲等技術(shù)來完成存儲,數(shù)據(jù)的安全性以及圖書館中資源的版權(quán)等問題還需要進一步探討。
參考文獻
[1]Anthony T etc.Cloud Computing:A Practical Approach[M].The McGraw-Hill Companies,Inc,2010:106-111.
[2]Mesnier M,Ganger G R,Riedel E.Object-based Storage:Pushing More Functionality into Storage[J].Potentials,IEEE,2005,24(2).
[3]劉文云,鮑凌云.“云”下的數(shù)字圖書館資源存儲研究[J].情報資料工作,2011,(2):51-54.
[4]余智敏.深圳圖書館的存儲技術(shù)的研究[D].武漢:武漢理工大學(xué),2006.
[5]鮑凌云.基于云計算的數(shù)字圖書館資源存儲研究[D].淄博:山東理工大學(xué),2011.