沈 杰
(浙江中醫(yī)藥大學圖書館,浙江 杭州 310053)
以互聯(lián)網為基礎的信息技術的迅速發(fā)展,電子商務、社交網絡、移動通訊、遠程醫(yī)療以及網絡教育等都獲得了高速發(fā)展,人們對互聯(lián)網服務的依賴度大大增加,在這些服務交互過程中產生了大量的結構化和非結構化數據即大數據,這些數據涵蓋了與人類活動和社會發(fā)展息息相關的各個方面,自我形成了一個龐大的信息數據網絡。傳統(tǒng)圖書館以結構化數據為主要存儲形式,對結構化數據的采集、存儲、管理和分析具備較為完善的服務體系,但是現代圖書館如果缺少了對非結構化數據的采集、存儲、管理和分析,就無法滿足用戶即時信息的需求,難以開展個性化定制和具有針對性、即時性、有效性的信息推送服務。對于以傳遞有價信息服務為核心的圖書館,如果無法響應用戶即時信息的需求,也就無法發(fā)揮其最大價值,難以適應智慧化服務的未來發(fā)展要求。如何通過改變圖書館服務架構,適應時代需求,提高信息服務能力,是現代圖書館亟需解決的重要問題。筆者擬在大數據環(huán)境下,結合芝加哥公共圖書館發(fā)展現狀,分析構建“智慧云圖書館”要件,促進圖書館在新時代的創(chuàng)新發(fā)展。
芝加哥公共圖書館成立于1873年,現又名哈羅德·華盛頓圖書館,1991年9月開館時,人們稱之為“世界上最大的公共圖書館”,包括1個總館、兩個地區(qū)館和79個分館,這些分館平均分布在市區(qū)的各個地方,館藏圖書及各種資料10745608冊,包括參考咨詢、政府信息、歷史文獻閱覽、語言文學文獻閱覽、藝術文獻閱覽、文獻編目、兒童借閱以及成人圖書流通等部門;在圖書館四樓的借閱區(qū),大到各級別法律法規(guī)、規(guī)章制度、政府財政預算支出,小到每個政府雇員任一年度的納稅單、每一個剩余勞動力任一時期的工作申請表等信息都可以在這里找到,信息量之大、數據之完整,實屬少見。該館不僅承擔著圖書館的讀者服務功能,還具有博物館和美術館的展覽功能。但是,在該圖書館,工作人員非常少,從辦理入館卡到借還書,幾乎全部是計算機完成,加載有相應主體大量信息的條形碼經光電識別,快速自動完成,尤其是還書和借書,無人值守;向全社會免費開放的琴房,文物、美術展覽,甚至中小學生夏令營信息在手機或者平板電腦上可以即時查到;圖書館官網上有非常詳盡的數據信息供所有讀者查閱。對于讀者提出的任何有關圖書館業(yè)務服務,輕點鼠標,一覽無余,十分方便。此外,分館與主館之間的無縫連接大大方便了不同地方讀者獲得信息與信息互通。芝加哥公共圖書館非常有效地整合了傳統(tǒng)圖書館的結構性數據和信息時代的非常規(guī)信息數據,較好地滿足了信息化社會對圖書館服務的要求。
2011年美國麥肯錫公司全球研究所發(fā)布《大數據:下一個創(chuàng)新、競爭和生產率的前沿》,引起了全球關注[1]。事實上,在諸如物理學、生物學、環(huán)境生態(tài)學以及軍事、金融、通訊等領域,大數據雛形早已形成和被采用?;ヂ?lián)網信息的高速發(fā)展,尤其是云計算的出現,徹底激活了大數據所蘊藏的潛力[2],顛覆了傳統(tǒng)思維。
大數據是一種規(guī)模超過傳統(tǒng)數據庫的數據集合,可以表現在如獲取、存儲、管理、分析數據等,有四大特征:(1)數據規(guī)模大:數據量遠超傳統(tǒng)數據,并且以數字化的形式存儲在各種媒介上;(2)數據流轉快:不同行業(yè)對大數據有不同需求,只有讓數據流轉起來才能最大程度地發(fā)揮大數據的專業(yè)價值;(3)數據類型多:除了傳統(tǒng)的關系型數據庫中的結構化數據之外還有大量的半結構化和非結構化的數據,這些多類型的數據也對數據的處理能力提出了更高的要求;(4)價值密度低:價值密度的高低與數據總量的大小成反比,在對大數據分析時往往需要大量的樣本空間來提高分析結果的可靠性。如何通過強大的機器算法更迅速地完成數據的價值“提純”也成為目前大數據背景下亟待解決的難題[3-4]。
云計算是一種方便靈活的商業(yè)計算模型,它是根據需要,利用計算機來構建資源池,可以用最少的管理付出,迅速達到各種計算資源的高效配置和推出。云計算技術在管理上,能夠自動將分布式架構的計算資源集中到一起,靈活提供服務,用戶不需管理或控制底層的云基礎設施,包括網絡、服務器、操作系統(tǒng)、存儲等,使用戶能夠更加專注于自己的業(yè)務,既有利于提高工作效率、降低成本和技術創(chuàng)新,同時也提高了商業(yè)經營的敏捷性[5]。
智慧云服務是指由云計算技術架構支撐,對外提供的按需分配、可計量的IT服務,可用于替代用戶本地自建的IT服務,分為三個層次:基礎設施即服務、平臺即服務及軟件即服務[6]。智慧云服務能夠高效地整合網絡上分布式資源,并且以按需的方式有效地提供專業(yè)化服務,大大提高了資源的利用率,提升了平臺的服務質量。
在互聯(lián)網信息高速發(fā)展的今天,以大數據和云計算為基礎的研究和應用逐漸成熟。各行各業(yè)可以通過對其自身相關領域的海量數據進行分析,建立擬合數學模型,對未來的行業(yè)發(fā)展做出有效評估。大數據應用展現出的強大能量使用戶對數據的認識發(fā)生了根本的改變。人們更加傾向于從提供大數據分析的服務商獲取所需資源,逐步失去對傳統(tǒng)的提供信息服務的圖書館的依賴。在強大的大數據服務沖擊下,傳統(tǒng)圖書館由于其自身的諸多特性的限制,在多個層面均不可避免地受到了不同程度的影響。
在大數據時代,信息量呈爆炸性增長,2013年中國產生的數據總量超過8億TB,2倍于2012年,相當于2009年全球的數據總量。預計到2020年,中國產生的數據總量將是2013年的10倍,超過85億TB[7]?;ヂ?lián)網的快速發(fā)展使信息數據產生的成本越來越小,數據存在的方式多種多樣。在國內以BAT為代表的互聯(lián)網巨頭,在搜索、電商、社交等領域承載并處理著中國約50%的數據量[8]。圖書館作為以數據采集、加工、存儲和分析為主要職能的重要服務場所,存儲了大量的結構化資源,對傳統(tǒng)的結構化數據,如圖書、期刊、檔案等已經具有相對完善的處理機制。雖然隨著Web2.0在圖書館的應用,圖書館非結構化的數據也逐漸增多,但是相比于大數據,所處理的數據量就顯得十分有限。圖書館對于這些非結構化數據的采集、存儲將有著極強的挑戰(zhàn)性。這不僅有技術上的問題,也包含著大量的社會問題。這些問題的解決將有利于促進圖書館服務的轉型升級,向智慧圖書館轉變。
傳統(tǒng)圖書館館藏資源的類型多是一些結構化數據資源,主要包括期刊、圖書、檔案等,對數據資源的處理方式大都以分類編目為主。根據大數據的特點,除了結構化數據之外,更多的是以非結構化的形式存在,如微博、博客、HTML網頁、社交通訊信息、地理位置信息、上網瀏覽記錄等。這些不同類型數據數量大,來源廣泛,各種數據格式之間互不兼容,大大增加了數據處理的復雜度,使得對這些數據的分析和處理難度增大[9]。然而這些非結構化數據具有非常鮮明的特性,主體專指性強,價值高,如何利用這些基礎資源以協(xié)同解決其他領域存在的問題對于傳統(tǒng)圖書館的轉型發(fā)展十分重要。
對外提供具有明確導向性的信息服務是圖書館的核心價值所在。在傳統(tǒng)圖書館,人們往往注重對自身館藏資源的利用,服務對象較為片面,提供的信息內容時效性不強,信息量有限,信息表現形式比較單一等諸多不足[10]。隨著以云計算為技術支撐,能夠對大數據進行分析處理的云服務的出現,徹底超越了以傳統(tǒng)圖書館信息服務模型為代表的信息咨詢交互系統(tǒng)。在大數據環(huán)境下,用戶對信息的需求越來越廣泛和專業(yè)。普通用戶可以通過大數據搜索引擎迅速找到自己所需要的具體專業(yè)信息。任何公司或者企業(yè)都可以通過購買云服務,及時地對自己行業(yè)的發(fā)展或遇到的某一特定問題做出最佳決策,讓信息的時效性能夠得到充分發(fā)揮。大數據和云計算具有獨特的自身優(yōu)勢,潛藏著巨大的商業(yè)價值,而傳統(tǒng)圖書館由于其自身硬件和軟件的限制決定了它目前無法與大數據服務相比擬與匹配。在大數據的沖擊下,大量數據依賴性用戶紛紛從傳統(tǒng)的圖書館信息服務轉向到方便快捷、可靠性更高的大數據分析服務[11]。
服務始終是圖書館的歷史使命,利用大數據和云計算技術優(yōu)勢,能夠有效提高圖書館的服務水平和管理效率。面對大數據帶來的信息服務方式的變革,云圖書館的概念應運而生。云圖書館是云計算在圖書館中的應用,是促進圖書館學科轉型的重要內容,也是未來圖書館理論與技術體系發(fā)展的重要方向。因此,建設云圖書館也成為圖書館當下最重要的任務之一。
云圖書館是將云存儲的資源以按需的方式用數字的形式提供給用戶。數字化的資源能夠大大提高用戶與圖書館的交互能力,精確定位搜索資源,為用戶快速獲取所需信息提供保證,同時也提高了圖書館服務的效率和效能。由于行業(yè)特點,傳統(tǒng)圖書館儲藏著大量的紙質版圖書期刊資源,利用現代信息技術對館藏資源進行加工處理,使其轉變成數字化信息資源,是云圖書館資源建設最重要的部分。有許多功能強大的商業(yè)化軟件都能夠將傳統(tǒng)介質上的圖文轉化為數字信息,處理過程十分便捷。使用掃描儀對圖書進行掃描轉化成PDF文本格式,然后使用Adobe公司的Acrobat軟件將PDF文件轉化成可進行再加工的word或者excel文本文件,最后將所得到的編碼文件歸類到信息數據庫中,用戶便可以通過搜索引擎檢索到該數字文本資源[12]。事實上,圖書館制定資源數字化的標準規(guī)范,才是當下必須解決的技術難題。圖書館技術人員需要對館藏資源進行綜合分析,逐步確立應采用的數字編碼與內容標記標準。針對保存格式、瀏覽格式和預覽格式提出應該采用的數字內容格式標準,確立數字資源加工標準和程序的選擇原則,進而編制數字資源建設指南的基本操作規(guī)范[13]。通過對館藏資源數字化操作,不僅能大大擴展圖書館數字資源的形式和范圍,也為云圖書館的建立奠定大數據基礎。
由于其歷史地理原因,圖書館中的資源往往具有局限性和偏向性等特點,例如,高校圖書館中的館藏資源會由于其學校學科的優(yōu)劣具有較大的傾向性,強勢學科一般會占據大部分的資源空間。這種現象導致的結果就是學科之間的資源不對稱,使得弱勢學科的發(fā)展更加緩慢,不利于學校的綜合建設。而一些地方特色圖書館為了更加突出其自身特色,其收藏的資源基本上都只與其主題相關,例如,位于湖南省長沙市的抗日戰(zhàn)爭圖書館,收集的資料都是關于抗日戰(zhàn)爭的史料文獻。不可否認這些文史檔案都具有難以估量的歷史文化價值,潛在讀者可能分布在世界各地,但是地域局限性使其無法最大發(fā)揮其自身價值。唯有將所有分布式采集存儲的圖書館資源整合起來,建立云圖書館,才能夠不斷滿足信息化時代人們對信息資源的需求。首先,各圖書館需要明確資源整合的類型和范疇,對本館中的資源進行分類規(guī)整,確定符合自身發(fā)展規(guī)劃,深化與其他館的對接整合,取長補短,確保這些資源整合后的類型規(guī)范統(tǒng)一;其次,圖書館需要聯(lián)合制定數字化信息資源的服務標準,圖書館互相之間應該協(xié)調一致,總體規(guī)劃,使用統(tǒng)一服務平臺和規(guī)范化的服務框架,避免資源的重疊浪費,增強系統(tǒng)的權威性和可靠性[14-15]。與此同時,引入第三方監(jiān)督和審核體系,保證云圖書館服務質量,為用戶切實提供更加優(yōu)質的服務。
現代衛(wèi)星通訊技術發(fā)展十分迅速,移動網絡進入5G時代,超大容量的儲存功能和幾無死角的接收能力,給智慧云圖書館的構建提供了便利。大數據接入移動網絡,如虎添翼,形成了真正意義上的云數據鏈下的圖書館讀者點陣。讀者服務、信息發(fā)布、期刊源共享、國際前沿成果分享、國際無紙化虛擬交流等的實時完成成為可能。
傳統(tǒng)圖書館服務是人與人或人與書之間的交互,而以大數據為基礎的云圖書館則是人與計算機等智能網絡設備的交互。不論是圖書館工作人員還是圖書館服務對象更多的都是通過計算機和互聯(lián)網來獲取指定的信息內容。在大數據時代,大部分數據以分結構化的形式存在,圖書館在收集數據過程中會得到大量分散的、無序的、隨機的信息數據,將這些信息數據進行統(tǒng)計、重組、分類等處理將會給圖書館帶來巨大的挑戰(zhàn)。因此,針對大數據分析處理的專業(yè)人才隊伍培養(yǎng)是云圖書館建設的重中之重[9]。首先,圖書館應該有針對性地引進人才。圖書館在進行人才招聘時應更加注重有計算機、統(tǒng)計學、數學等交叉學科背景的復合型人才的引進。其次,深入挖掘圖書館員的潛力。圖書館領導可以將在編的圖書館工作人員進行分類,根據不同員工的背景和實際情況有針對性地進行培養(yǎng)[16]。同時,通過制定獎勵激勵機制調動圖書館員自我學習與服務的積極性。只有逐步提高圖書館服務人員對大數據的分析能力,才能夠滿足信息化時代的需求,才能夠給用戶提供更加優(yōu)質的服務。
雖然目前云計算在圖書館的應用還處于探索階段,但是隨著大數據和云計算技術的不斷成熟,大數據和云計算在圖書館領域的應用將會給圖書館的信息服務帶來翻天覆地的變化。以大數據和云計算為支撐的云圖書館將是未來圖書館發(fā)展的方向。同時,在圖書館轉型升級過程中,圖書館專業(yè)人員要緊跟時代潮流,加強大數據知識的學習,提高自身素質,只有這樣才能提高圖書館行業(yè)的整體服務水平,體現圖書館信息資源最優(yōu)的價值。