李桂貞
(南京工程學(xué)院圖書(shū)館,江蘇 南京 211167)
Web 2.0的發(fā)展推動(dòng)了圖書(shū)館2.0的產(chǎn)生,圖書(shū)館服務(wù)要以用戶為核心早已成為業(yè)界的共識(shí)。圖書(shū)館服務(wù)要實(shí)現(xiàn)良好的用戶體驗(yàn),應(yīng)將應(yīng)用的復(fù)雜性和使用的便利性進(jìn)行完美結(jié)合,這就需要一種新型服務(wù)計(jì)算模型——云計(jì)算,它將數(shù)據(jù)都放在服務(wù)器上,并在服務(wù)器進(jìn)行計(jì)算,計(jì)算完成后將結(jié)果傳遞到客戶端。而大數(shù)據(jù)則是云計(jì)算的對(duì)象,二者是靜與動(dòng)的關(guān)系,前者強(qiáng)調(diào)的是計(jì)算,后者是前者計(jì)算的對(duì)象,二者息息相關(guān)[1]。大數(shù)據(jù)時(shí)代的到來(lái)必然會(huì)強(qiáng)烈影響到圖書(shū)館的服務(wù),這種影響是雙向的,既是挑戰(zhàn)也是機(jī)遇。圖書(shū)館應(yīng)把握機(jī)遇,采取相應(yīng)措施創(chuàng)新圖書(shū)館服務(wù)。
云是網(wǎng)絡(luò)、互聯(lián)網(wǎng)的一種比喻說(shuō)法,目前對(duì)云計(jì)算并無(wú)統(tǒng)一定義,國(guó)內(nèi)較為廣泛接受的定義是著云臺(tái)給出的:云計(jì)算是通過(guò)網(wǎng)絡(luò)提供可伸縮的廉價(jià)的分布式計(jì)算能力。美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)定義:云計(jì)算是一種按使用量付費(fèi)的模式,這種模式提供可用的、便捷的、按需的網(wǎng)絡(luò)訪問(wèn),進(jìn)入可配置的計(jì)算資源共享池(資源包括網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)、應(yīng)用軟件、服務(wù)等),這些資源能夠被快速提供,只需投入很少的管理工作,或與服務(wù)供應(yīng)商進(jìn)行很少的交互。概括來(lái)說(shuō),云計(jì)算是進(jìn)行分布式處理、并列計(jì)算、網(wǎng)格設(shè)計(jì)、虛擬存取和海量數(shù)據(jù)處理的一種計(jì)算機(jī)工具。
云計(jì)算的特點(diǎn)主要有:①超大規(guī)模。亞馬遜、IBM、微軟和Yahoo等公司的“云”均擁有幾十萬(wàn)臺(tái)服務(wù)器,而Google云計(jì)算則擁有超過(guò)100萬(wàn)臺(tái)的服務(wù)器。②虛擬化。云計(jì)算支持用戶在任意位置使用各種終端獲取服務(wù),用戶只需要一臺(tái)筆記本或一個(gè)掌上電腦(Personal Digital Assistant,PDA),就可以通過(guò)網(wǎng)絡(luò)服務(wù)來(lái)獲取各種能力超強(qiáng)的服務(wù)。③高可靠性?!霸啤笔褂昧藬?shù)據(jù)多副本容錯(cuò)、計(jì)算節(jié)點(diǎn)同構(gòu)可互換等措施來(lái)保障服務(wù)的高可靠性,使用云計(jì)算比使用本地計(jì)算機(jī)更加可靠。④通用性。云計(jì)算不針對(duì)特定的應(yīng)用,在“云”的支撐下可以構(gòu)造出千變?nèi)f化的應(yīng)用,同一片“云”可以同時(shí)支撐不同的應(yīng)用運(yùn)行。⑤高可伸縮性?!霸啤钡囊?guī)??梢詣?dòng)態(tài)伸縮,滿足應(yīng)用和用戶規(guī)模增長(zhǎng)的需要。
目前對(duì)大數(shù)據(jù)還沒(méi)有標(biāo)準(zhǔn)的定義,通常認(rèn)為它是一種數(shù)據(jù)量很大、數(shù)據(jù)形式多樣的非結(jié)構(gòu)化數(shù)據(jù)。百度百科將其定義為:大數(shù)據(jù)通常用來(lái)形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫(kù)用于分析時(shí)會(huì)花費(fèi)過(guò)多時(shí)間和金錢(qián)。
一般來(lái)說(shuō),大數(shù)據(jù)具有以下特點(diǎn):①數(shù)據(jù)體量巨大。大數(shù)據(jù)遍布世界各個(gè)角落的電腦、傳感器和移動(dòng)設(shè)備,在線交易和社交網(wǎng)絡(luò)每時(shí)每刻也都在產(chǎn)生大量數(shù)據(jù)。②數(shù)據(jù)類型繁多。大數(shù)據(jù)類型多樣,可分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。相對(duì)于以往便于存儲(chǔ)的以文本為主的結(jié)構(gòu)化數(shù)據(jù),蘊(yùn)含著巨大商業(yè)價(jià)值和社會(huì)價(jià)值的非結(jié)構(gòu)化數(shù)據(jù)越來(lái)越多,目前已占數(shù)據(jù)總量的80%以上。③價(jià)值密度低。大數(shù)據(jù)的價(jià)值雖然巨大,價(jià)值密度卻很低,如何通過(guò)強(qiáng)大的機(jī)器算法更迅速地完成海量數(shù)據(jù)的價(jià)值“提純”成為目前大數(shù)據(jù)背景下亟待解決的難題。④處理速度快。對(duì)大數(shù)據(jù)快速處理,才能了解迅速變化的環(huán)境并作出反應(yīng),才能快速制定出合理準(zhǔn)確的應(yīng)對(duì)策略。大數(shù)據(jù)要求實(shí)時(shí)和分析,特別是1秒定律,這一點(diǎn)與傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。
大數(shù)據(jù)本身就是一個(gè)問(wèn)題集,云計(jì)算技術(shù)是目前解決大數(shù)據(jù)問(wèn)題集最有效的手段。云計(jì)算提供了基礎(chǔ)架構(gòu)平臺(tái),大數(shù)據(jù)應(yīng)用在這個(gè)平臺(tái)上運(yùn)行。目前公認(rèn)處理大數(shù)據(jù)集最有效手段的分布式處理,也是云計(jì)算思想的一種具體體現(xiàn)。
OCLC的Janifer Gatenby曾撰文指出:“對(duì)圖書(shū)館而言,重要的是擁有與控制他們的數(shù)據(jù)資源,自由共享、提供訪問(wèn)、曝光數(shù)據(jù),而擁有操作與管理這些數(shù)據(jù)的軟件則不那么重要[4]”。圖書(shū)館服務(wù)與技術(shù)的發(fā)展密不可分,圖書(shū)館也一直是利用先進(jìn)技術(shù)的先行者,總是會(huì)及時(shí)利用先進(jìn)技術(shù)來(lái)優(yōu)化服務(wù)。
圖書(shū)館始終以為用戶提供優(yōu)質(zhì)服務(wù)作為自己的目標(biāo),而開(kāi)展服務(wù)需要各種先進(jìn)技術(shù)的支持,云計(jì)算應(yīng)用于圖書(shū)館,不僅可以降低成本,提高效率,還可以實(shí)現(xiàn)真正的大數(shù)據(jù)的共建共享。云系統(tǒng)中有數(shù)以萬(wàn)計(jì)的大型存儲(chǔ)設(shè)備,可以容納海量數(shù)據(jù),并可以實(shí)現(xiàn)實(shí)時(shí)更新,為圖書(shū)館不斷增長(zhǎng)的數(shù)據(jù)資源提供可靠的技術(shù)支持。
大數(shù)據(jù)時(shí)代,圖書(shū)館與其他信息機(jī)構(gòu)之間不再是館藏資源、空間建筑、借閱服務(wù)等方面的競(jìng)爭(zhēng),擁有大數(shù)據(jù)總量以及對(duì)大數(shù)據(jù)的挖掘、收集、存儲(chǔ)、分析、處理等能力才是現(xiàn)時(shí)圖書(shū)館的核心競(jìng)爭(zhēng)力。同時(shí),對(duì)大數(shù)據(jù)的分析、處理和預(yù)測(cè)也影響著圖書(shū)館總體的發(fā)展。
大數(shù)據(jù)時(shí)代,大量的數(shù)據(jù)存儲(chǔ)在分布廣泛、不同地域、各種類型的服務(wù)器中,可以運(yùn)用云計(jì)算技術(shù),將大量的數(shù)據(jù)資源存于“云”中。當(dāng)用戶發(fā)出一個(gè)搜索或查詢請(qǐng)求時(shí),服務(wù)器通過(guò)運(yùn)算進(jìn)行信息交換,將結(jié)果返回給用戶。大數(shù)據(jù)時(shí)代,圖書(shū)館面臨著新舊數(shù)據(jù)平臺(tái)互通聯(lián)合、技術(shù)標(biāo)準(zhǔn)的統(tǒng)一、信息資源的安全等問(wèn)題,如果圖書(shū)館能將這些挑戰(zhàn)變成發(fā)展的機(jī)遇,解決這一系列問(wèn)題,未來(lái)圖書(shū)館將會(huì)以數(shù)據(jù)為紐帶,實(shí)現(xiàn)從物理圖書(shū)館向虛擬圖書(shū)館及智慧圖書(shū)館的飛躍。
經(jīng)過(guò)數(shù)字圖書(shū)館的多年建設(shè),圖書(shū)館擁有了大量結(jié)構(gòu)化數(shù)據(jù),如書(shū)目資源庫(kù)、機(jī)構(gòu)知識(shí)庫(kù)、語(yǔ)義化信息等數(shù)字化資源。這些資源總量很大,而且增長(zhǎng)速度也較快,是圖書(shū)館大數(shù)據(jù)的重要組成部分。但要提供更好的服務(wù),不能僅僅依靠這些結(jié)構(gòu)化數(shù)據(jù),還要依靠大量的非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),如用戶的檢索歷史、瀏覽歷史、閱讀習(xí)慣、興趣偏好等,而這些常常是圖書(shū)館所忽視的。伴隨著社交網(wǎng)絡(luò)、移動(dòng)圖書(shū)館、物聯(lián)網(wǎng)的興起,今后來(lái)自用戶的各種信息將越來(lái)越多,通過(guò)數(shù)據(jù)挖掘、數(shù)據(jù)分析等大數(shù)據(jù)技術(shù),可以在用戶使用圖書(shū)館服務(wù)的過(guò)程中收集其個(gè)人信息、地理位置、搜索歷史、搜索時(shí)間等信息數(shù)據(jù)。大數(shù)據(jù)是圖書(shū)館的核心資產(chǎn),圖書(shū)館應(yīng)該重視對(duì)用戶數(shù)據(jù)的收集工作,使其為我所用,以構(gòu)筑圖書(shū)館的核心競(jìng)爭(zhēng)力,更好地為用戶提供有用的信息[5]。
圖書(shū)館在構(gòu)建之前要進(jìn)行自我評(píng)估,明確如何構(gòu)建才能適合本館的發(fā)展戰(zhàn)略,并從成本和硬件資源等方面來(lái)考慮是遷移原有的計(jì)算平臺(tái)還是直接改造以實(shí)現(xiàn)云計(jì)算平臺(tái)的服務(wù)功能。在構(gòu)建云計(jì)算圖書(shū)館服務(wù)平臺(tái)時(shí),需要成立云計(jì)算實(shí)施團(tuán)隊(duì),團(tuán)隊(duì)里不僅應(yīng)包括技術(shù)人員,還應(yīng)包括相關(guān)管理人員,以保證云計(jì)算服務(wù)平臺(tái)的有序完成。云計(jì)算環(huán)境下,數(shù)字圖書(shū)館云服務(wù)模式主要分為基礎(chǔ)設(shè)施即服務(wù)(Infrastructure as a Service,Iaas)、平臺(tái)即服務(wù)(Platform as a Service,Paas)、軟件即服務(wù)(Software as a Service,SaaS)3種主要模式[6],圖書(shū)館要根據(jù)自身情況確定其服務(wù)模式,通過(guò)云計(jì)算服務(wù)平臺(tái)對(duì)外提供統(tǒng)一接口,實(shí)現(xiàn)數(shù)字圖書(shū)館的云服務(wù)。
長(zhǎng)期以來(lái),圖書(shū)館的信息資源建設(shè)偏重于文獻(xiàn)信息數(shù)據(jù)等結(jié)構(gòu)化數(shù)據(jù)的收集,而在大數(shù)據(jù)時(shí)代,除了要加強(qiáng)對(duì)多種文獻(xiàn)信息數(shù)據(jù)的收集外,還要對(duì)這些數(shù)據(jù)進(jìn)行挖掘、分析、整合,使之產(chǎn)生更多的價(jià)值,這才是圖書(shū)館的核心競(jìng)爭(zhēng)力所在。另一方面,圖書(shū)館要想提供更優(yōu)質(zhì)的服務(wù),目前所擁有的數(shù)據(jù)量還遠(yuǎn)遠(yuǎn)不夠,如今圖書(shū)館擁有以及可以直接利用的主要是文獻(xiàn)資源、數(shù)字資源、網(wǎng)絡(luò)資源等結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在很多圖書(shū)館已經(jīng)建設(shè)得較為完善。而很多半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),例如用戶信息行為數(shù)據(jù)等,是目前圖書(shū)館還無(wú)法進(jìn)行或暫時(shí)沒(méi)有建設(shè)的。圖書(shū)館必須對(duì)這類極具價(jià)值的數(shù)據(jù)進(jìn)行收集、分類、挖掘、分析,才能為圖書(shū)館服務(wù)提供必要的決策參考,以實(shí)現(xiàn)圖書(shū)館業(yè)務(wù)與服務(wù)的上游轉(zhuǎn)移。
信息時(shí)代,人們的日常信息行為日益頻繁,不管是生活還是工作、娛樂(lè)、社交,都無(wú)法避免地在多種多樣的信息系統(tǒng)中留下各種信息行為數(shù)據(jù)。將這些散落在多個(gè)系統(tǒng)間的數(shù)據(jù)進(jìn)行整合與分析,會(huì)再現(xiàn)一個(gè)社會(huì)個(gè)體的運(yùn)行軌跡和發(fā)展全景,這也就是大數(shù)據(jù)分析。目前,在素有“印度硅谷”之稱的印度班加羅爾已有超過(guò)100家以數(shù)據(jù)分析為主要業(yè)務(wù)的新型數(shù)據(jù)公司;2013年9月16日,大中華區(qū)IBM大數(shù)據(jù)分析競(jìng)爭(zhēng)力中心在四川綿陽(yáng)成立,旨在以大數(shù)據(jù)分析和科學(xué)管理企業(yè)智能戰(zhàn)略實(shí)施和自身轉(zhuǎn)型發(fā)展[7]。
大數(shù)據(jù)時(shí)代,圖書(shū)館之間以及與其他信息部門(mén)之間的競(jìng)爭(zhēng)越來(lái)越激烈,圖書(shū)館要想爭(zhēng)得一席之地,避免被邊緣化,必須要開(kāi)展大數(shù)據(jù)分析服務(wù)。一般來(lái)說(shuō),根據(jù)圖書(shū)館現(xiàn)有情況,目前可開(kāi)展下列兩種主要的大數(shù)據(jù)分析服務(wù)業(yè)務(wù)。一是對(duì)圖書(shū)館所需的大數(shù)據(jù)進(jìn)行分析。此類分析的對(duì)象是圖書(shū)館自身建設(shè)所產(chǎn)生的大數(shù)據(jù),如用戶的借閱習(xí)慣、檢索歷史、興趣愛(ài)好等,是一種對(duì)現(xiàn)有資源的分析與挖掘。二是對(duì)用戶所需的大數(shù)據(jù)進(jìn)行分析。這類分析業(yè)務(wù)與現(xiàn)在圖書(shū)館或其他咨詢公司為企事業(yè)單位等用戶群體所做的信息情報(bào)參考、競(jìng)爭(zhēng)情報(bào)分析等相似,但因其用戶特征的不同,仍是有很大的差異,比如在分析對(duì)象數(shù)據(jù)、分析手段、分析目的等方面都存在著差異,而進(jìn)行這類分析業(yè)務(wù)所需要的大數(shù)據(jù)本圖書(shū)館可能不會(huì)完全擁有,可以通過(guò)簽訂技術(shù)協(xié)議從其他渠道獲得,但也將面臨著知識(shí)產(chǎn)權(quán)、技術(shù)標(biāo)準(zhǔn)等問(wèn)題,如何解決此類服務(wù)的數(shù)據(jù)問(wèn)題是突破該瓶頸的關(guān)鍵。
信息時(shí)代,用戶在網(wǎng)絡(luò)上參與的信息行為每時(shí)每刻都在產(chǎn)生著大量的非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),如果能夠采集到這些數(shù)據(jù),就可以很好地滿足發(fā)現(xiàn)關(guān)聯(lián)規(guī)則、內(nèi)容分類和用戶聚類的需求,探索出定制Web日志的數(shù)據(jù)模型、過(guò)程及方法,從而提高個(gè)性化推薦的精度[8]。對(duì)于圖書(shū)館來(lái)說(shuō),需要挖掘大數(shù)據(jù)的價(jià)值來(lái)提高圖書(shū)館的業(yè)務(wù)能力,增強(qiáng)圖書(shū)館的競(jìng)爭(zhēng)力,但簡(jiǎn)單的定性、定量分析都不能發(fā)揮作用,需要運(yùn)用更先進(jìn)的技術(shù)工具。目前已開(kāi)發(fā)并應(yīng)用的大數(shù)據(jù)分析技術(shù)與工具有聚類分析、數(shù)據(jù)挖掘、網(wǎng)絡(luò)分析、可視化分析、數(shù)據(jù)融合與數(shù)據(jù)集成等。特別是聚類分析、可視化分析與數(shù)據(jù)挖掘技術(shù)在對(duì)圖書(shū)館數(shù)據(jù)的技術(shù)分析中起到了一定作用。但目前也僅僅是針對(duì)結(jié)構(gòu)化數(shù)據(jù)和有限數(shù)量的關(guān)鍵詞進(jìn)行聚類分析、共現(xiàn)分析等,并不能真正挖掘大量數(shù)據(jù)的存在與表現(xiàn)形態(tài),更不能通過(guò)分析去預(yù)測(cè)未來(lái)的可能發(fā)展趨勢(shì)。
2012年11月30日至12月1日,中國(guó)IT界技術(shù)盛會(huì)——Hadoop與大數(shù)據(jù)技術(shù)大會(huì)(HBTC 2012)在北京隆重舉辦。大會(huì)以“大數(shù)據(jù)共享與開(kāi)放技術(shù)”為主題,設(shè)定“Hadoop生態(tài)系統(tǒng)”“大數(shù)據(jù)行業(yè)應(yīng)用”“大數(shù)據(jù)共享平臺(tái)與應(yīng)用”“NoSQL與NewSQL”以及“大數(shù)據(jù)的技術(shù)挑戰(zhàn)與發(fā)展趨勢(shì)”5個(gè)分論壇。會(huì)上來(lái)自各領(lǐng)域的專家對(duì)大數(shù)據(jù)處理技術(shù)的應(yīng)用和實(shí)踐作了深入分享[9]。
服務(wù)是聯(lián)系圖書(shū)館資源與用戶的永恒紐帶,云計(jì)算將分布在Internet中圖書(shū)館的資源和服務(wù)整合成一個(gè)整體,形成了一個(gè)可控的自適應(yīng)新型服務(wù)體系,因此服務(wù)的時(shí)間、空間、方式等有了無(wú)限擴(kuò)大完善的可能。
云計(jì)算環(huán)境下,圖書(shū)館各項(xiàng)業(yè)務(wù)的智能化程度將達(dá)到一個(gè)新的水平。圖書(shū)館業(yè)務(wù)的智能化可以大大提高圖書(shū)館的服務(wù)水平,對(duì)圖書(shū)館與用戶都大有裨益。首先,對(duì)于服務(wù)主體——圖書(shū)館來(lái)說(shuō),圖書(shū)館對(duì)大數(shù)據(jù)進(jìn)行的收集、整理、分析以及處理工作都需要應(yīng)用各項(xiàng)智能化的先進(jìn)技術(shù),技術(shù)的智能化可能實(shí)現(xiàn)對(duì)海量信息數(shù)據(jù)的智能抓取、關(guān)鍵詞抽取等,從而節(jié)省大量的人力物力,節(jié)省下來(lái)的人力可以去研究圖書(shū)館服務(wù)建設(shè)的策略性問(wèn)題,物力則可以為更進(jìn)一步的智能化投入提供支持。其次,對(duì)于服務(wù)客體——用戶來(lái)說(shuō),圖書(shū)館可以利用大數(shù)據(jù)技術(shù)對(duì)用戶大量的非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)進(jìn)行挖掘與分析,為圖書(shū)館的智能化決策提供分析參考。同時(shí)圖書(shū)館提供的智能化服務(wù)——技術(shù)、工具、平臺(tái),將更加個(gè)性化,用戶會(huì)更方便、準(zhǔn)確地獲得自己所需要的圖形、音頻、視頻等信息,得到愉快的人性化服務(wù)體驗(yàn)。第三,對(duì)于圖書(shū)館服務(wù)中的知識(shí)流通來(lái)說(shuō),圖書(shū)館業(yè)務(wù)智能化程度的提高不但有利于知識(shí)從單個(gè)主體向多個(gè)主體流通與傳播,有利于隱性知識(shí)向顯性知識(shí)的轉(zhuǎn)變,也有利于知識(shí)的發(fā)現(xiàn)、挖掘與組織。
目前圖書(shū)館服務(wù)已經(jīng)與用戶實(shí)現(xiàn)一定程度的交互,但很多情況下還僅僅是一種線性交互。在大數(shù)據(jù)環(huán)境下,圖書(shū)館借助云計(jì)算提供一個(gè)統(tǒng)一的虛擬服務(wù)平臺(tái),用戶通過(guò)這一平臺(tái),可以自由調(diào)用圖書(shū)館、館員、資源、服務(wù)等一切圖書(shū)館元素;而館員也可以通過(guò)“云”進(jìn)行大數(shù)據(jù)分析,包括資源流向和用戶行為等,這樣即可實(shí)現(xiàn)服務(wù)的多向交互。通過(guò)交互,圖書(shū)館可以把眾多用戶的隱性知識(shí)顯性化,從而使個(gè)人知識(shí)轉(zhuǎn)化為群體知識(shí)。
傳統(tǒng)的圖書(shū)館服務(wù)平臺(tái)一般是面向用戶的服務(wù),云計(jì)算環(huán)境下的信息服務(wù)一方面當(dāng)然主要是面向用戶的服務(wù),如對(duì)用戶個(gè)人信息數(shù)據(jù)的挖掘與分析,服務(wù)信息數(shù)據(jù)的推拉等。同時(shí),云計(jì)算和大數(shù)據(jù)技術(shù)的應(yīng)用使得對(duì)圖書(shū)館管理者提供服務(wù)成為了可能,例如圖書(shū)館之間的數(shù)據(jù)交換、數(shù)據(jù)協(xié)作、MARC數(shù)據(jù)轉(zhuǎn)換、Wiki式書(shū)目編目、FRBR協(xié)作等,利用這些功能的API實(shí)現(xiàn)圖書(shū)館之間的聯(lián)合編目達(dá)到去中心化的書(shū)目信息共建共享。此外,對(duì)于信息資源提供商還可以提供注冊(cè)服務(wù)、新資源發(fā)布服務(wù)等[10]。
國(guó)內(nèi)外圖書(shū)館界經(jīng)過(guò)十幾年的研究與實(shí)踐,目前已形成了較為成熟系統(tǒng)的知識(shí)服務(wù)體系。而隨著大數(shù)據(jù)時(shí)代的到來(lái),圖書(shū)館知識(shí)服務(wù)將更具有針對(duì)性與鮮明性,服務(wù)的范圍和領(lǐng)域?qū)⒌玫礁蟮陌l(fā)展,其服務(wù)方式、途徑、模式等均將出現(xiàn)新的變化。
4.4.1 建立新型知識(shí)服務(wù)引擎
新型知識(shí)服務(wù)引擎包括資源及學(xué)術(shù)搜索引擎、資源及服務(wù)推薦引擎、知識(shí)服務(wù)社區(qū)實(shí)體(包括用戶及資源)、行為智能分析引擎、用戶知識(shí)需求預(yù)測(cè)引擎以及多維度信息資源獲取、組織、分析及決策引擎等。例如美國(guó)Hiptype公司利用大數(shù)據(jù)分析技術(shù)來(lái)分析電子書(shū)用戶閱讀習(xí)慣和喜好,這也是國(guó)內(nèi)外圖書(shū)情報(bào)領(lǐng)域首例利用大數(shù)據(jù)技術(shù)構(gòu)建知識(shí)服務(wù)社區(qū)實(shí)體(包括用戶及資源)行為智能分析引擎[11]。
技術(shù)引擎是圖書(shū)館信息服務(wù)的技術(shù)核心,如何利用云計(jì)算和大數(shù)據(jù)技術(shù)構(gòu)建圖書(shū)館的新型知識(shí)服務(wù)引擎,將會(huì)是未來(lái)幾年內(nèi)圖書(shū)情報(bào)領(lǐng)域信息技術(shù)研究的主要內(nèi)容。
4.4.2 新型咨詢服務(wù)模式——知識(shí)咨詢得到發(fā)展
大數(shù)據(jù)時(shí)代,圖書(shū)館要想在同行之間脫穎而出,獲得持續(xù)、長(zhǎng)足的發(fā)展,就不僅要在所擁有的信息資源的數(shù)量、種類、范圍等方面努力,還要在信息資源數(shù)據(jù)的分析和組織、信息服務(wù)的知識(shí)化等方面做出努力,形成具有創(chuàng)新力與競(jìng)爭(zhēng)力的服務(wù)和產(chǎn)品,判斷這些服務(wù)和產(chǎn)品的標(biāo)準(zhǔn)應(yīng)是其所含知識(shí)量的多少。因此基于內(nèi)容分析,與知識(shí)服務(wù)完美融合的知識(shí)咨詢服務(wù),必將成為圖書(shū)館在大數(shù)據(jù)時(shí)代的咨詢服務(wù)模式。知識(shí)咨詢除了具有傳統(tǒng)參考咨詢和信息咨詢的優(yōu)點(diǎn),還具有自身獨(dú)特的優(yōu)勢(shì),知識(shí)咨詢的服務(wù)過(guò)程滲透著數(shù)據(jù)挖掘與數(shù)據(jù)整合,它的服務(wù)方式更加周到,更加關(guān)注用戶的個(gè)性化需求,提供服務(wù)時(shí)結(jié)合用戶的專業(yè)背景,提供的服務(wù)知識(shí)化,旨在解決用戶的實(shí)際問(wèn)題,令用戶達(dá)到最大滿意度[12]。
云計(jì)算和大數(shù)據(jù)開(kāi)發(fā)前景廣闊,圖書(shū)館各個(gè)領(lǐng)域無(wú)不受其影響。圖書(shū)館作為技術(shù)敏感度極高的行業(yè)和機(jī)構(gòu),從業(yè)人員和技術(shù)人員應(yīng)該高度重視這一事業(yè)發(fā)展機(jī)遇,積極嘗試和思考解決云計(jì)算環(huán)境下圖書(shū)館服務(wù)創(chuàng)新和資源開(kāi)發(fā)中的大數(shù)據(jù)問(wèn)題,探索云環(huán)境下圖書(shū)館服務(wù)平臺(tái)的構(gòu)建及新的服務(wù)模式,這也是圖書(shū)館服務(wù)創(chuàng)新的關(guān)鍵所在。
[1]王晴.云計(jì)算大數(shù)據(jù)時(shí)代圖書(shū)館的挑戰(zhàn)與機(jī)遇——兼論公共圖書(shū)館的應(yīng)對(duì)策略[J].公共圖書(shū)館,2013(1):47-51.
[2]云計(jì)算[EB/OL].[2014-02-16].http://baike.baidu.com/view/1316082.htm.
[3]羅信.什么是“大數(shù)據(jù)”的真正含義[EB/OL].[2014-02-16].http://www.vsharing.com/k/vertical/2012-5/A658824.html.
[4]GATENBY J.The networked library service layer:sharing data for more effective management and co-operation[J].Ariadne,2008(56):8.
[5]王天泥.大數(shù)據(jù)視角下圖書(shū)館的發(fā)展對(duì)策[J].圖書(shū)館學(xué)刊,2013(3):42-44.
[6]馬曉亭,陳臣.面向云計(jì)算的數(shù)字圖書(shū)館高性能云服務(wù)平臺(tái)研究[J].圖書(shū)館理論與實(shí)踐,2013(5):73-76.
[7]大中華區(qū)IBM大數(shù)據(jù)分析競(jìng)爭(zhēng)力中心成立[EB/OL].[2014-02-18].http://digi.163.com/13/0918/12/99281GSV0 00163HED.html.
[8]韓翠峰.大數(shù)據(jù)時(shí)代圖書(shū)館的服務(wù)創(chuàng)新與發(fā)展[J].圖書(shū)館,2013(1):121-122.
[9]大數(shù)據(jù)共享與開(kāi)放技術(shù)從現(xiàn)在起航[EB/OL].[2014-02-18].http://www.docin.com/p-559010420.html.
[10]王長(zhǎng)全,艾雰?cè)?云計(jì)算環(huán)境下的數(shù)字圖書(shū)館信息資源整合與服務(wù)模式創(chuàng)新[J].圖書(shū)館工作與研究,2011(1):48-51.
[11]樊偉紅,等.圖書(shū)館需要怎樣的“大數(shù)據(jù)”[J].圖書(shū)館雜志,2012(11):63-68,77.
[12]曾德云.知識(shí)咨詢服務(wù)的特征、模式與提升策略[J].圖書(shū)館學(xué)刊,2013(7):94-96.