翁建華
(浙江海洋學(xué)院圖書(shū)館,浙江 舟山 316004)
現(xiàn)代信息技術(shù)的高速發(fā)展,高校圖書(shū)館已從傳統(tǒng)的圖書(shū)館轉(zhuǎn)向了數(shù)字化圖書(shū)館,圖書(shū)館數(shù)據(jù)存儲(chǔ)正面臨著諸如空間、安全、訪問(wèn)速度和管理等問(wèn)題,數(shù)據(jù)存儲(chǔ)模式的更新是現(xiàn)代數(shù)字圖書(shū)館的必然趨勢(shì)。隨著Amazon、Google和IBM公司相繼推出云計(jì)算的概念,意味著IT業(yè)正式邁進(jìn)了“云時(shí)代”,“云”概念已迅速滲透到了各個(gè)商業(yè)領(lǐng)域,并給企業(yè)帶來(lái)了良好的經(jīng)濟(jì)效益。在這樣的環(huán)境下,作為信息資源中心的高校圖書(shū)館,利用云技術(shù)來(lái)解決數(shù)字資源存儲(chǔ)問(wèn)題,不失為一種嶄新的、較為理想的方法。
浙江海洋學(xué)院圖書(shū)館[1]近年來(lái)在數(shù)字化建設(shè)方面做了很大的努力,目前已擁有CNKI中國(guó)期刊全文數(shù)據(jù)庫(kù)、CNKI優(yōu)秀博碩士論文、中文科技期刊數(shù)據(jù)庫(kù)、萬(wàn)方數(shù)字資源、人大全文數(shù)據(jù)庫(kù)、國(guó)研網(wǎng)、讀秀學(xué)術(shù)搜索、超星電子圖書(shū)、Scopus文摘庫(kù)、EBSCOhost、SpringerLLink 電子刊、Springer電子書(shū)、World Scientific 電子書(shū)、NowPublishers、ProQuest學(xué)位論文庫(kù)、Encyclopedia of Ocean Sciences等30余種中外文數(shù)據(jù)庫(kù)鏡像。除了以上這些數(shù)字資源外,還有自建的海洋、水產(chǎn)特色數(shù)據(jù)庫(kù)。2005年,圖書(shū)館投入使用匯文文獻(xiàn)信息服務(wù)系統(tǒng),使傳統(tǒng)的業(yè)務(wù)數(shù)據(jù)數(shù)字化,同時(shí)隨書(shū)光盤的數(shù)量也在逐年遞增。目前,總存儲(chǔ)容量約達(dá)20個(gè)TB,每年以約3TB的速度擴(kuò)容,見(jiàn)表1。隨著學(xué)校的發(fā)展,圖書(shū)館數(shù)字資源的種類越來(lái)越多,數(shù)據(jù)量也越來(lái)越龐大,數(shù)據(jù)的介質(zhì)故障、病毒感染、黑客入侵、自然災(zāi)害以及人為過(guò)失等安全性問(wèn)題日益突顯,每年存儲(chǔ)設(shè)備的擴(kuò)容,也給圖書(shū)館造成了較大的經(jīng)濟(jì)壓力。因此,可靠有效的存儲(chǔ)環(huán)境才是高校圖書(shū)館數(shù)字資源長(zhǎng)期保存的基礎(chǔ)保障。
表1 浙江海洋學(xué)院圖書(shū)館數(shù)據(jù)存儲(chǔ)概況
圖書(shū)館數(shù)據(jù)存儲(chǔ)模式經(jīng)歷了幾代更新,從上世紀(jì)70年代初期的單一硬盤存儲(chǔ)和磁帶備份,80年代C/S模式的出現(xiàn)使得數(shù)據(jù)存儲(chǔ)分布化,到90年代后期的RIAD存儲(chǔ)技術(shù),20世紀(jì)末存儲(chǔ)技術(shù)的發(fā)展進(jìn)入“存儲(chǔ)網(wǎng)絡(luò)(Storage Network)”時(shí)代。目前主流存儲(chǔ)技術(shù)主要是外掛式存儲(chǔ)(如圖1所示),即DAS、NAS和 SAN。
圖1 主流網(wǎng)絡(luò)存儲(chǔ)
直連式存儲(chǔ),也可以稱作服務(wù)器附加存儲(chǔ),存儲(chǔ)介質(zhì)與服務(wù)器直接相連,其I/O請(qǐng)求直接發(fā)送到存儲(chǔ)設(shè)備,并且不帶有任何存儲(chǔ)操作系統(tǒng),具有低延遲、高帶寬和低成本的特點(diǎn)。但是DAS的優(yōu)點(diǎn)也成為其發(fā)展最大的瓶頸,數(shù)據(jù)的I/O讀寫(xiě)和存儲(chǔ)維護(hù)管理都需要依賴服務(wù)器上的操作系統(tǒng)才能進(jìn)行,諸如數(shù)據(jù)備份和恢復(fù)均要占用服務(wù)器一定的資源,因此用戶的日常數(shù)據(jù)備份需選擇業(yè)務(wù)系統(tǒng)不繁忙時(shí)進(jìn)行。顯然,對(duì)于7×24小時(shí)圖書(shū)館數(shù)字資源服務(wù)是不合適的。
網(wǎng)絡(luò)接入存儲(chǔ),采用TCP/IP、ATM及FDDI等網(wǎng)絡(luò)技術(shù),通過(guò)網(wǎng)絡(luò)交換機(jī)連接到服務(wù)器,作用類似于文件服務(wù)器,其系統(tǒng)結(jié)構(gòu)見(jiàn)圖2。NAS在LAN環(huán)境下,可以實(shí)現(xiàn)異構(gòu)平臺(tái)下的數(shù)據(jù)共享,如NT和UNIX平臺(tái)的數(shù)據(jù)共享,同時(shí)具有較好的可擴(kuò)展性。雖然NAS在存儲(chǔ)性能上比DAS有了很大的提高,但是NAS本身受限于網(wǎng)絡(luò)的帶寬,隨著數(shù)據(jù)存儲(chǔ)容量的增大,容易給網(wǎng)絡(luò)帶來(lái)數(shù)據(jù)服務(wù)和數(shù)據(jù)管理的雙重負(fù)擔(dān),并且NAS后期的擴(kuò)容成本較高。
圖2 NAS系統(tǒng)結(jié)構(gòu)
存儲(chǔ)區(qū)域網(wǎng)絡(luò)是一種高速專用網(wǎng)絡(luò),通過(guò)專用網(wǎng)絡(luò)設(shè)備(如光纖)提供服務(wù)器和數(shù)據(jù)存儲(chǔ)設(shè)備之間的連接。SAN經(jīng)過(guò)多年的發(fā)展,存儲(chǔ)帶寬已經(jīng)達(dá)到4Gbps,其系統(tǒng)結(jié)構(gòu)如圖3所示。SAN具有海量數(shù)據(jù)易共享性、配置的靈活性、設(shè)備互聯(lián)的高速可靠性等優(yōu)點(diǎn),但同樣存在著實(shí)施和管理成本過(guò)高的局限性。
圖3 SAN系統(tǒng)結(jié)構(gòu)
中國(guó)電子學(xué)會(huì)云計(jì)算專家委員會(huì)給云計(jì)算(Cloud Computing)作出了如下的定義:云計(jì)算是一種基于互聯(lián)網(wǎng)的、大眾參與的計(jì)算模式,其計(jì)算資源(計(jì)算能力、存儲(chǔ)能力、交互能力)是動(dòng)態(tài)、可伸縮且被虛擬化的,以服務(wù)的方式提供[2]。這種新型的計(jì)算資源組織、分配和使用模式有利于合理配置計(jì)算資源并提高其利用率,促進(jìn)節(jié)能減排,實(shí)現(xiàn)綠色計(jì)算。而云存儲(chǔ)是云計(jì)算概念延伸的產(chǎn)物,是指通過(guò)集群應(yīng)用、網(wǎng)格技術(shù)或分布式文件系統(tǒng)等功能,將網(wǎng)絡(luò)中大量各種不同類型的存儲(chǔ)設(shè)備通過(guò)應(yīng)用軟件集合起來(lái)協(xié)同工作,共同對(duì)外提供數(shù)據(jù)存儲(chǔ)和業(yè)務(wù)訪問(wèn)功能的一個(gè)系統(tǒng),其結(jié)構(gòu)模型見(jiàn)圖4[3]。EMC中國(guó)研發(fā)中心總經(jīng)理范承工博士認(rèn)為,應(yīng)該把云存儲(chǔ)看成一種服務(wù),云的概念就是通過(guò)服務(wù)的形式來(lái)滿足客戶需求[4]。
圖4 云存儲(chǔ)系統(tǒng)的結(jié)構(gòu)模型
綜觀國(guó)內(nèi)外云存儲(chǔ)的應(yīng)用情況,可謂“祥云一片”:2011年3月29日美國(guó)亞馬遜公司宣布推出數(shù)字內(nèi)容云存儲(chǔ)服務(wù);蘋(píng)果公司緊鑼密鼓地準(zhǔn)備推出同類服務(wù);2010年5月,Google發(fā)布了 Google Storage for Developers,2011年 5月,Google宣布完全開(kāi)放Storage存儲(chǔ);2010年7月,阿里巴巴集團(tuán)董事會(huì)主席馬云在“小網(wǎng)商大夢(mèng)想”網(wǎng)貨交易會(huì)論壇發(fā)表主題演講上透露,公司未來(lái)將加大在云計(jì)算、云存儲(chǔ)上的投入。顯然,云存儲(chǔ)給高校圖書(shū)館開(kāi)啟了存儲(chǔ)新紀(jì)元,從而讓圖書(shū)館在云時(shí)代中獲益。
4.2.1 數(shù)據(jù)存儲(chǔ)海量化
數(shù)字圖書(shū)館的數(shù)據(jù)每年以驚人的速度增長(zhǎng),特別各類學(xué)術(shù)數(shù)據(jù)庫(kù)需要不斷更新以供學(xué)校師生查閱和研究,傳統(tǒng)的存儲(chǔ)架構(gòu)因其擴(kuò)容性差已不能適應(yīng)海量數(shù)據(jù)的存儲(chǔ),圖書(shū)館有限的設(shè)備經(jīng)費(fèi)更不能去追求高端的存儲(chǔ)設(shè)備。云存儲(chǔ)采取并行擴(kuò)容的架構(gòu),可以實(shí)現(xiàn)存儲(chǔ)完全虛擬化,支持?jǐn)?shù)十PB級(jí)的容量及強(qiáng)大靈活的擴(kuò)展性,從而緩解了圖書(shū)館持續(xù)增長(zhǎng)的數(shù)據(jù)存儲(chǔ)壓力。
4.2.2 核心數(shù)據(jù)安全化
經(jīng)權(quán)威機(jī)構(gòu)分析,硬件問(wèn)題、系統(tǒng)問(wèn)題、人為錯(cuò)誤是引起數(shù)據(jù)丟失的3個(gè)主要原因。目前館內(nèi)的數(shù)據(jù)都放在本地服務(wù)器上,服務(wù)器的種類、型號(hào)、規(guī)則不一且分散存儲(chǔ),常有負(fù)載不均衡的現(xiàn)象,導(dǎo)致整體存儲(chǔ)效能和備份效率的瓶頸。如果說(shuō)商業(yè)的數(shù)字資源(比如CNKI鏡像數(shù)據(jù))因各種原因一旦丟失時(shí)還可以向數(shù)據(jù)商購(gòu)買的話,那么圖書(shū)館的原始業(yè)務(wù)數(shù)據(jù)一旦丟失,將無(wú)法再生,圖書(shū)館也就意味著從此“癱瘓”,后果不堪設(shè)想。因此圖書(shū)館核心數(shù)據(jù)的安全備份和遠(yuǎn)程容災(zāi)是刻不容緩的問(wèn)題。在云存儲(chǔ)模式下,通過(guò)集群應(yīng)用、網(wǎng)格計(jì)算或分布式文件系統(tǒng)等功能,將云中各種不同類型的存儲(chǔ)設(shè)備集中協(xié)同工作,有效確保海量數(shù)據(jù)的安全性。
4.2.3 設(shè)備耗能低碳化
云存儲(chǔ)模式被稱為“綠色的商業(yè)模式”,微軟一項(xiàng)新研究表明,擁有約100個(gè)用戶的小型商務(wù),如果將商務(wù)應(yīng)用從實(shí)地服務(wù)轉(zhuǎn)向云計(jì)算,將節(jié)約超過(guò)90%的凈能量和碳消耗[5]。圖書(shū)館每年要投入大量的資金來(lái)購(gòu)買存儲(chǔ)設(shè)備,是學(xué)校能耗量最大的部門之一。云存儲(chǔ)的虛擬化技術(shù)提高了硬件利用率,不僅在節(jié)能方面績(jī)效顯著,而且在管理上也極大為方便靈活,節(jié)省了圖書(shū)館的人力資源。
4.2.4 資源共享擴(kuò)大化
高校圖書(shū)館的數(shù)字資源的共享起步較晚,2010年底,浙江省高校數(shù)字圖書(shū)館(ZADL)正式開(kāi)通,標(biāo)志著在學(xué)術(shù)資源區(qū)域性共建共享方面邁向了第一步,但是館藏的雷同、數(shù)字資源的重復(fù)購(gòu)買和建設(shè)問(wèn)題依然嚴(yán)重。吉林醫(yī)藥學(xué)院圖書(shū)館的于秀芬教授在《基于云存儲(chǔ)架構(gòu)的隨書(shū)光盤鏡像服務(wù)器構(gòu)建探討》[6]一文中,首次對(duì)利用云存儲(chǔ)將現(xiàn)有的圖書(shū)館隨書(shū)光盤資源有機(jī)整合作了探討。云存儲(chǔ)將各種資源放入一個(gè)“云池”中,用集群存儲(chǔ)架構(gòu)對(duì)數(shù)據(jù)進(jìn)行集中存儲(chǔ)與調(diào)用,不同終端之間可以無(wú)障礙共享。顯然,這給圖書(shū)館資源共享范圍的進(jìn)一步擴(kuò)大提供了可能。
云存儲(chǔ)作為一種嶄新的技術(shù),已經(jīng)成為國(guó)內(nèi)外業(yè)界的新貴。《中國(guó)云存儲(chǔ)服務(wù)報(bào)告,China Cloud Storage Services Report》顯示,在未來(lái)的5年,中國(guó)云存儲(chǔ)服務(wù)市場(chǎng)的年復(fù)合增長(zhǎng)率將達(dá)到103%[7]。在Web2.0的驅(qū)動(dòng)下,圖書(shū)館的存儲(chǔ)模式也將面臨全新的變革,云存儲(chǔ)顯然是一種理想選擇。當(dāng)然,任何事物都是機(jī)遇和挑戰(zhàn)并存,圖書(shū)館應(yīng)根據(jù)自身存儲(chǔ)的特點(diǎn)和需求,量身定制,選擇合適的“云”。
[1] 浙江海洋學(xué)院圖書(shū)館門戶網(wǎng)站 [EB/OL].2011-02-05.[2010-09-11].http://61.153.216.111/tsg/html/tsggk/15.html.
[2] 中國(guó)電子學(xué)會(huì)云計(jì)算專家委員會(huì)網(wǎng)站[EB/OL].2011-02-05.[2010-05-28].http://www.ciecloud.org/.
[3] 看圖識(shí)云全面解析云存儲(chǔ)的網(wǎng)格架構(gòu).[EB/OL].2011-02-05.[2010-03-17].http://storage.it168.com/a2010/0316/861/000000861567_2.shtml.
[4] EMC范承工:“五大支柱”為云計(jì)算保駕護(hù)航.[EB/OL].2010-12-25.[2009-05-11].http://www.cnsoftnews.com/show_news.asp?newsid=5452.
[5] 硅谷動(dòng)力網(wǎng)站.[EB/OL].2010-12-25.[2010-11-06].http://www.enet.com.cn/cio/.
[6] 于秀芬,張?jiān)?基于云存儲(chǔ)架構(gòu)的隨書(shū)光盤鏡像服務(wù)器構(gòu)建探討.2001(2):72-75.
[7] Springboard:未來(lái)五年中國(guó)云存儲(chǔ)服務(wù)年均增長(zhǎng)103%.[EB/OL].2010-12-25.[2010-07-30].http://www.cbismb.com/articlehtml/20148700.htm.
[8] 陶蕾.“云”下的圖書(shū)館網(wǎng)絡(luò)存儲(chǔ)探討.圖書(shū)館學(xué)研究,2010(7):66-69.