黃 燕
(西南政法大學(xué)圖書館,重慶 401120)
隨著計(jì)算機(jī)技術(shù)以及網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,各圖書館紛紛投入大量的經(jīng)費(fèi)進(jìn)行數(shù)字資源建設(shè),使得數(shù)據(jù)存儲(chǔ)成為各圖書館亟須解決的一大難題。云存儲(chǔ)的興起,可以有效解決數(shù)字圖書館數(shù)據(jù)存儲(chǔ)這一難題。
近年來(lái),隨著云計(jì)算[1]和軟件即服務(wù)(SaaS)[2]的誕生,云存儲(chǔ)成為信息存儲(chǔ)領(lǐng)域的一個(gè)研究熱點(diǎn)。與傳統(tǒng)存儲(chǔ)不同的是,云存儲(chǔ)不僅僅是一個(gè)硬件設(shè)備,它是由存儲(chǔ)設(shè)備、網(wǎng)絡(luò)設(shè)備、服務(wù)器、應(yīng)用軟件、公用訪問接口以及接入網(wǎng)等組成的一個(gè)系統(tǒng)。[3]云存儲(chǔ)是云計(jì)算技術(shù)的一個(gè)延伸,可以認(rèn)為它是一個(gè)配備了海量存儲(chǔ)空間的云計(jì)算系統(tǒng)。提供存儲(chǔ)服務(wù)是云存儲(chǔ)的主要功能,通過(guò)網(wǎng)絡(luò)將本地的數(shù)據(jù)存放到存儲(chǔ)服務(wù)提供商(SSP)提供的在線存儲(chǔ)空間,用戶不需要再花費(fèi)大量的人力、物力來(lái)建立自己的數(shù)據(jù)中心,只要向SSP進(jìn)行在線申請(qǐng),就可以得到存儲(chǔ)服務(wù)。這樣可以避免存儲(chǔ)平臺(tái)和數(shù)據(jù)的重復(fù)建設(shè)帶來(lái)的存儲(chǔ)空間的浪費(fèi)。
與傳統(tǒng)的存儲(chǔ)系統(tǒng)相比較,云存儲(chǔ)具有以下3個(gè)特點(diǎn):1)云存儲(chǔ)面對(duì)的是用戶需要的網(wǎng)上海量數(shù)據(jù)的存儲(chǔ)服務(wù),而傳統(tǒng)的存儲(chǔ)系統(tǒng)只是某一企業(yè)為了某一目的而搭建的具有高速計(jì)算能力、事務(wù)處理能力的數(shù)據(jù)中心;2)云存儲(chǔ)首先考慮的是數(shù)據(jù)的安全性、可靠性以及效率等問題,采用加密技術(shù)以及身份認(rèn)證等進(jìn)行數(shù)據(jù)保護(hù);3)云存儲(chǔ)不僅局限于提供對(duì)傳統(tǒng)文件的訪問,還可以提供對(duì)海量數(shù)據(jù)的管理與維護(hù)以及用戶的正常訪問等。
正是由于云存儲(chǔ)具有以上特點(diǎn),故云存儲(chǔ)的體系結(jié)構(gòu)可以分為以下4個(gè)層面,自底向上分別為:數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)管理層、應(yīng)用接口層和用戶訪問層。具體結(jié)構(gòu)如圖1所示。
圖1 云存儲(chǔ)體系結(jié)構(gòu)圖
(1)數(shù)據(jù)存儲(chǔ)層。這是云存儲(chǔ)最基礎(chǔ)的部分,是由FC光纖通道存儲(chǔ)設(shè)備、NAS和iSCSI等IP存儲(chǔ)設(shè)備或SCSI、SAS等DAS存儲(chǔ)設(shè)備云存儲(chǔ)組成的海量數(shù)據(jù)池。這些不同類型的存儲(chǔ)設(shè)備分散在不同的地方,云存儲(chǔ)運(yùn)用廣域網(wǎng)、互聯(lián)網(wǎng)、光纖等將其進(jìn)行物理連接,運(yùn)用存儲(chǔ)虛擬化技術(shù)實(shí)現(xiàn)不同型號(hào)的存儲(chǔ)設(shè)備的兼容,使其成為一個(gè)有機(jī)的整體,并通過(guò)統(tǒng)一的管理邏輯和接口實(shí)現(xiàn)存儲(chǔ)設(shè)備的集中管理、狀態(tài)監(jiān)控以及管理軟件的升級(jí)。
(2)數(shù)據(jù)管理層。它實(shí)現(xiàn)了底層的存儲(chǔ)設(shè)備與上層應(yīng)用的無(wú)縫連接,利用群集系統(tǒng)、分布式文件系統(tǒng)、網(wǎng)格計(jì)算等技術(shù)保證了各個(gè)存儲(chǔ)設(shè)備之間的有機(jī)協(xié)同工作,利用內(nèi)容發(fā)布、P2P實(shí)現(xiàn)數(shù)據(jù)的發(fā)布與傳輸,利用壓縮技術(shù)、數(shù)據(jù)比對(duì)技術(shù)對(duì)數(shù)據(jù)進(jìn)行刪減,利用加密、備份、容災(zāi)技術(shù)來(lái)保障數(shù)據(jù)的安全。
(3)應(yīng)用接口層。這是云存儲(chǔ)平臺(tái)中可以靈活擴(kuò)展并直接面向用戶的部分。根據(jù)用戶需求,可以開發(fā)出不同的應(yīng)用接口。用戶需求不同,應(yīng)用服務(wù)接口也就不同。
(4)用戶訪問層。它由廣大用戶組成,無(wú)論在任何地方,只需一臺(tái)能聯(lián)網(wǎng)的終端機(jī),任何一個(gè)授權(quán)用戶通過(guò)標(biāo)準(zhǔn)的應(yīng)用接口都可以登錄到云存儲(chǔ)平臺(tái),享受到云存儲(chǔ)提供的數(shù)據(jù)存儲(chǔ)服務(wù)。
云存儲(chǔ)技術(shù)是數(shù)據(jù)存儲(chǔ)領(lǐng)域的核心技術(shù)。圖書館是信息搜集、存儲(chǔ)和進(jìn)行知識(shí)服務(wù)的機(jī)構(gòu),圖書館的數(shù)據(jù)每年呈千萬(wàn)兆級(jí)的趨勢(shì)增長(zhǎng),由于缺乏專業(yè)的計(jì)算機(jī)人才對(duì)存儲(chǔ)系統(tǒng)進(jìn)行管理,嚴(yán)重影響了讀者方便、快捷地進(jìn)行信息資源的獲取。云存儲(chǔ)為圖書館帶來(lái)了數(shù)據(jù)存儲(chǔ)的新選擇,為圖書館開展業(yè)務(wù)工作提供了技術(shù)保障,為讀者順利獲取信息提供了穩(wěn)定的環(huán)境。主要表現(xiàn)在以下6個(gè)方面。
圖書館每年都要投入大量的資金進(jìn)行存儲(chǔ)設(shè)備的擴(kuò)容。擴(kuò)容的方式主要有2種,一種是直接在整列柜中添加磁盤。采用這種方式比較省錢,但是必須購(gòu)買與原有磁盤品牌、接口、型號(hào)等完全相同的磁盤。眾所周知,計(jì)算機(jī)硬件發(fā)展迅速,更新較快,一般兩三年后廠家就不再生產(chǎn)同一類型的硬件了,而且以前的存儲(chǔ)系統(tǒng)無(wú)論在傳輸速度以及接口方式上都已經(jīng)無(wú)法滿足數(shù)據(jù)存儲(chǔ)的需求,所以這種方式采用得并不多。另一種方式是購(gòu)買新的存儲(chǔ)系統(tǒng)。采用這種方式資金投入比較大,大多數(shù)圖書館很難承受。而云存儲(chǔ)系統(tǒng)對(duì)存儲(chǔ)設(shè)備、服務(wù)器設(shè)備、硬盤等產(chǎn)品的一致性并沒有要求,不同介質(zhì)、容量、廠牌、型號(hào)的硬盤,利用存儲(chǔ)虛擬化技術(shù)都可以一起協(xié)同工作,既可以實(shí)現(xiàn)原有硬件的利舊保護(hù)投入,又可以實(shí)現(xiàn)新技術(shù)、新設(shè)備的快速更新。
目前每一個(gè)數(shù)字圖書館都需要配備專門的計(jì)算機(jī)專業(yè)人才對(duì)服務(wù)器、存儲(chǔ)系統(tǒng)進(jìn)行日常管理和維護(hù),由此會(huì)產(chǎn)生一定的人員成本和技術(shù)成本。專業(yè)技術(shù)人員需要了解不同商家的不同存儲(chǔ)系統(tǒng)的使用情況,工作難度較大。在硬盤或是存儲(chǔ)服務(wù)器損壞時(shí),數(shù)據(jù)丟失的可能性也很大。而云存儲(chǔ)則沒有這些困擾,硬盤壞了不需要立即更換,數(shù)據(jù)會(huì)自動(dòng)遷移到別的硬盤,從而大大減輕了管理人員的工作負(fù)擔(dān),避免了由于數(shù)據(jù)丟失而造成的損失。
云存儲(chǔ)的用戶群體龐大,需要具有專業(yè)知識(shí)且經(jīng)驗(yàn)豐富的技術(shù)人員對(duì)存儲(chǔ)系統(tǒng)進(jìn)行管理與維護(hù),圖書館只需要提出自己的訪問數(shù)量、使用時(shí)限以及服務(wù)項(xiàng)目等情況,存儲(chǔ)提供商再根據(jù)服務(wù)項(xiàng)目進(jìn)行合理收費(fèi)。圖書館還可以根據(jù)資金承受能力隨時(shí)提出需求變換,真正做到“按需使用”。
云存儲(chǔ)可以近乎完美地避免“數(shù)據(jù)庫(kù)不能正常訪問”等問題的發(fā)生。云存儲(chǔ)是將文件和數(shù)據(jù)保存在不同的存儲(chǔ)節(jié)點(diǎn)上,它知道文件的存放的位置,當(dāng)發(fā)現(xiàn)某一文件不可訪問時(shí),系統(tǒng)會(huì)自動(dòng)將讀寫指令發(fā)送到另外一個(gè)服務(wù)器上的文件,使服務(wù)持續(xù)進(jìn)行。
圖書館之間可以達(dá)成協(xié)議,將數(shù)據(jù)都提供給同一個(gè)SSP進(jìn)行存儲(chǔ)與管理(也就是不同的圖書館將自己的數(shù)據(jù)放到同一個(gè)數(shù)據(jù)池中),SSP就會(huì)給協(xié)議內(nèi)的圖書館授權(quán),從而實(shí)現(xiàn)不同圖書館之間的數(shù)據(jù)共享。對(duì)于參加合作的圖書館來(lái)說(shuō),在云存儲(chǔ)系統(tǒng)中,通過(guò)云計(jì)算技術(shù),他們可以實(shí)時(shí)地獲得其他圖書館的資料,使用戶的信息需求獲得極大滿足。[4]
目前,許多圖書館都購(gòu)買了自己的存儲(chǔ)系統(tǒng)和相同的數(shù)字資源,這就造成了相同數(shù)據(jù)的重復(fù)存儲(chǔ)。云存儲(chǔ)通過(guò)光纖、廣域網(wǎng)將分布在各地的存儲(chǔ)設(shè)備連接起來(lái),通過(guò)存儲(chǔ)虛擬化技術(shù)進(jìn)行集中管理,當(dāng)不同的圖書館提供給SSP的數(shù)據(jù)重復(fù)時(shí),云存儲(chǔ)會(huì)通過(guò)數(shù)據(jù)管理層對(duì)重復(fù)數(shù)據(jù)進(jìn)行刪除。
毫無(wú)疑問,云存儲(chǔ)可以很好地解決圖書館存儲(chǔ)空間與日益增長(zhǎng)的數(shù)據(jù)量之間的矛盾,節(jié)省了圖書館的經(jīng)費(fèi)開支,為圖書館之間的信息共享起到推動(dòng)作用。但是,如果圖書館將全部數(shù)據(jù)都托付給SSP,也會(huì)在技術(shù)、版權(quán)保護(hù)等方面出現(xiàn)問題。
雖然在國(guó)外云存儲(chǔ)已經(jīng)有了很多成熟的案例,如由JISC資助的項(xiàng)目Fedorazon[5]解決了大規(guī)模倉(cāng)儲(chǔ)所面臨的數(shù)據(jù)量不斷增長(zhǎng)和復(fù)雜度不斷增加的問題;DuraSpace發(fā)起的 DuraCloud[6]擴(kuò)展了多個(gè)云存儲(chǔ)平臺(tái),并力圖解決在不同平臺(tái)間的數(shù)據(jù)遷移。而國(guó)內(nèi)云存儲(chǔ)技術(shù)發(fā)展比較遲緩,僅停滯于理論研究階段。國(guó)外的實(shí)踐表明,云存儲(chǔ)的訪問對(duì)網(wǎng)絡(luò)的傳輸速度要求很高,就目前的網(wǎng)絡(luò)環(huán)境而言,如果執(zhí)行大規(guī)模數(shù)據(jù)請(qǐng)求或數(shù)據(jù)恢復(fù)操作,云存儲(chǔ)是否可以提供足夠的訪問空間以及所有站點(diǎn)的中心設(shè)備的高速響應(yīng)是云存儲(chǔ)亟須解決的問題。在未來(lái),當(dāng)網(wǎng)絡(luò)環(huán)境得到優(yōu)化后,或許云存儲(chǔ)廠商可以提供一套組件,在完全本地化的系統(tǒng)上來(lái)模仿云地址,讓本地NAS網(wǎng)關(guān)設(shè)備繼續(xù)正常運(yùn)行而無(wú)需重新設(shè)置,數(shù)據(jù)傳輸將更加迅捷。如此一來(lái),即便是客戶的本地?cái)?shù)據(jù)發(fā)生了災(zāi)難性的損壞,云存儲(chǔ)廠商也可以將數(shù)據(jù)重新快速傳輸給客戶數(shù)據(jù)中心。
云存儲(chǔ)采用商業(yè)模式來(lái)運(yùn)作,用戶需要根據(jù)服務(wù)時(shí)間、服務(wù)內(nèi)容來(lái)付費(fèi)。孫衛(wèi)[7]分析了6種主要云存儲(chǔ)商類型,總結(jié)出3種商業(yè)模式:1)以商業(yè)銷售硬件、軟件幫助客戶建立云計(jì)算環(huán)境的商業(yè)產(chǎn)品模式,以IBM、SUN、微軟為典型代表;2)以互聯(lián)網(wǎng)運(yùn)營(yíng)商提供免費(fèi)服務(wù)獲得更多廣告的云的支撐模式,以谷歌、亞馬遜、微軟為代表;3)為有商業(yè)價(jià)值的傳統(tǒng)行業(yè)專門服務(wù)并收費(fèi)的云的支撐模式。眾所周知,圖書館是公益性的服務(wù)機(jī)構(gòu),商業(yè)模式的開展會(huì)受到一定的制約。如何在享受云存儲(chǔ)服務(wù)商提供服務(wù)的同時(shí),避免受到云存儲(chǔ)服務(wù)在價(jià)格方面的制約,是圖書館要解決的一個(gè)問題。
圖書館應(yīng)該有選擇性地將部分資源托管給SSP,在日常業(yè)務(wù)和管理環(huán)節(jié)中局部地應(yīng)用一些專業(yè)的云服務(wù)商提供的服務(wù)。[8]此種模式國(guó)外已開先河,如哥倫比亞區(qū)公共圖書館正在使用Amazon的EC2服務(wù)托管它們的網(wǎng)站,圖書館聯(lián)盟OhioLINK正在使用Amazon's Web Services托管一小部分它們的數(shù)字公共資源。國(guó)內(nèi)的圖書館聯(lián)盟應(yīng)號(hào)召成員館將有價(jià)值的、無(wú)版權(quán)糾紛的數(shù)字資源部分托管給SSP,在SSP提供的平臺(tái)上進(jìn)行數(shù)據(jù)共享,這樣每一個(gè)成員館都能做到用最小的投入獲得最大的收獲,充分實(shí)現(xiàn)利益最大化。
云存儲(chǔ)在很大程度上弱化了圖書館的數(shù)據(jù)庫(kù)維護(hù)、存儲(chǔ)系統(tǒng)維護(hù)等IT功能,也可以說(shuō)減小了數(shù)字資源管理人員的工作難度和強(qiáng)度。未來(lái)的圖書館應(yīng)利用云存儲(chǔ)的強(qiáng)大計(jì)算能力、海量存儲(chǔ)能力,考慮增強(qiáng)新的業(yè)務(wù)功能,尋求新的定位。特別是在數(shù)字資源的選擇、評(píng)價(jià)、分析、整合上,利用數(shù)據(jù)挖掘及知識(shí)發(fā)現(xiàn)工具,為用戶在云存儲(chǔ)的數(shù)據(jù)池中利用信息資源提供指導(dǎo)依據(jù)。
[1]Hayes B.Cloud Computing[J].Communications of the ACM,2008,51(7):9-11.
[2] Laplante P A,Zhang J,Voas J.What's in a Name?Distinguishing Between SaaS and SOA[J].IT Professional,2008,10(3):46—50.
[3]王慶波,金 涬,何 樂,等.虛擬化與云計(jì)算[M].北京:電子工業(yè)出版社,2009:10—20.
[4]永 先,欒旭倫,李森森.圖書館迎來(lái)“云”時(shí)代[J].高校圖書情報(bào)論壇,2009(3):59—62.
[5] Fedorazon[EB/OL].[2010-04-20].http://www.ukoln.ac.uk/repositories/digirep/index/Fedorazon.
[6]DuraCloud[EB/OL].[2010-04-20].http://www.duraspace.org/duracloud.Php.
[7]孫 衛(wèi).圖書館在云時(shí)代的思考[J].數(shù)字圖書館論壇,2009(6):35—41.
[8]圖書館云地圖:云計(jì)算和存儲(chǔ)指南[EB/OL].[2009-07-22].http://www.yeeya n.com/articIes/view/100748/58660.