靳婕
(中國音樂學(xué)院圖書館,北京100101)
數(shù)字圖書館相比傳統(tǒng)圖書館的優(yōu)勢在于數(shù)字圖書館擁有更豐富的館藏資料,且以文本數(shù)據(jù)作為存儲方式,能夠滿足用戶數(shù)據(jù)檢索并獲取文本信息的需求。然而,大數(shù)據(jù)雖然給數(shù)字圖書館的發(fā)展帶來了新的機遇,卻也提出了新的挑戰(zhàn)。數(shù)字圖書館需要直面大數(shù)據(jù)帶來的挑戰(zhàn)與機遇,充分發(fā)揮出大數(shù)據(jù)的積極影響,以大數(shù)據(jù)技術(shù)增強數(shù)字圖書館的信息服務(wù)能力,同時提升其服務(wù)層次,從而有效推動數(shù)字圖書館的轉(zhuǎn)型發(fā)展,為知識型社會的建設(shè)提供助力。
將大數(shù)據(jù)技術(shù)應(yīng)用于數(shù)字圖書館中,需要購置大量軟硬件設(shè)施,同時要在大數(shù)據(jù)的管理、服務(wù)等方面大量投入資源,才能夠有效發(fā)揮出大數(shù)據(jù)對數(shù)字圖書館的積極影響。然而,圖書館并非盈利機構(gòu)而是服務(wù)性機構(gòu),其公益性特點決定了不可能以市場經(jīng)營作為資金的主要來源,而是要依賴當(dāng)?shù)卣膿芸睿@就導(dǎo)致圖書館的可用資金有限,難以籌集大量資金開展大數(shù)據(jù)的研發(fā)和建設(shè)工作。圖書館的資金一方面用于員工工資,另一方面則用于書籍訂購、整理歸檔等文獻采訪工作,能夠用于購置大數(shù)據(jù)相關(guān)的軟硬件設(shè)施的資金較少。作為一種社科類研究項目,大數(shù)據(jù)研究的資金缺口大,加上數(shù)字圖書館對于大數(shù)據(jù)的應(yīng)用尚未形成明確的標(biāo)準(zhǔn),導(dǎo)致圖書館在數(shù)字化建設(shè)的初步階段往往難以明確得出大數(shù)據(jù)所帶來的積極影響,給提高政府撥款帶來了一定困難。[1]
當(dāng)前我國數(shù)字圖書館在應(yīng)用大數(shù)據(jù)時通常采用直接采購或與企業(yè)協(xié)同開發(fā)的方式,獨立開發(fā)的大數(shù)據(jù)應(yīng)用項目較少,其根本原因在于數(shù)字圖書館的大數(shù)據(jù)研發(fā)需要大量高素質(zhì)人才的支持,但各行業(yè)普遍缺乏大數(shù)據(jù)高端人才,而數(shù)字圖書館與其他行業(yè)相比又缺乏足夠的競爭力,加劇了數(shù)字圖書館人才稀缺的問題。此外,很多圖書館對大數(shù)據(jù)的發(fā)展趨勢缺乏認知,不了解大數(shù)據(jù)的前沿發(fā)展動態(tài),制約了其思維和視野的發(fā)展。在與企業(yè)合作進行大數(shù)據(jù)應(yīng)用項目開發(fā)時,往往只是被動接受而沒有根據(jù)自身需求進行應(yīng)用項目建設(shè),使得企業(yè)對大數(shù)據(jù)應(yīng)用項目的開發(fā)參與力度不足,所開發(fā)出的應(yīng)用項目通常難以完全滿足數(shù)字圖書館的需求。
數(shù)字圖書館應(yīng)用大數(shù)據(jù)的主要目的在于要利用大數(shù)據(jù)的海量信息存儲和處理能力,增強圖書館對數(shù)字化文本資源的存儲和檢索水平。在大數(shù)據(jù)時代背景下,文本資源的數(shù)字化使得數(shù)字圖書館需要處理的資源愈發(fā)豐富和復(fù)雜,這些異構(gòu)分布的資源對數(shù)字圖書館的數(shù)據(jù)采集、處理能力提出了新的要求。[2]然而,即便數(shù)字圖書館建設(shè)了完善的大數(shù)據(jù)軟硬件設(shè)備,也會因工作人員數(shù)據(jù)處理能力或算法掌握能力等因素的影響,降低大數(shù)據(jù)采集處理的有效性。與此同時,在應(yīng)用大數(shù)據(jù)進行數(shù)據(jù)的采集處理時,需要關(guān)注兩點技術(shù)之外的問題。其一是數(shù)字圖書館需要與出版社等合作機構(gòu)進行協(xié)商,建立起完善的合作機制,確保文本數(shù)據(jù)資源的完整、有效;其二是要建立起用戶隱私保護和書籍的版權(quán)保護體系,確保數(shù)字圖書館的大數(shù)據(jù)建設(shè)不會引發(fā)法律糾紛。
大數(shù)據(jù)的發(fā)展使數(shù)字圖書館的進一步建設(shè)成為了可能,尤其是如云計算等技術(shù)的興起,為數(shù)字圖書館服務(wù)能力的提升提供了重要的推動作用。在大數(shù)據(jù)時代下,文本的數(shù)字化使得數(shù)字化資源愈發(fā)呈現(xiàn)出海量、異構(gòu)的特點,這些多元化的信息資源為數(shù)字圖書館提出新的要求,需要數(shù)字圖書館積極提升信息處理能力。而大數(shù)據(jù)技術(shù)所具備的信息存儲、分析和處理能力,能夠有效分析出信息數(shù)據(jù)之間存在的聯(lián)系,通過掌握規(guī)律來將問題定量化處理,能夠有效提升數(shù)字圖書館的館藏建設(shè)水平。如語義技術(shù)能夠通過分析數(shù)據(jù)間的語義關(guān)系,利用文本間的語義關(guān)系提升用戶獲取知識的能力;數(shù)據(jù)聚類技術(shù)能夠?qū)⒕哂心骋粚傩曰蛱卣鞯臄?shù)據(jù)進行聚攏,便于用戶的資源檢索;信息分析技術(shù)能夠通過對文本信息的分析,為用戶提供直觀的數(shù)據(jù)分析結(jié)果;檢索技術(shù)則能夠通過海量文本信息的檢索,在極短時間內(nèi)找出用戶所需的文本資源。利用大數(shù)據(jù)能夠?qū)鹘y(tǒng)的圖書館館藏模式帶來顛覆性的革新,有效提升數(shù)字圖書館的服務(wù)能力。
應(yīng)用大數(shù)據(jù)的信息處理能力,能夠在存儲海量文本資源的同時,在極短時間內(nèi)對海量信息資源的檢索,完成人力所無法完成的工作。將大數(shù)據(jù)應(yīng)用于數(shù)字圖書館建設(shè)的各個環(huán)節(jié),能夠通過確保海量文本資源直接為用戶所用,實現(xiàn)與用戶的無縫對接。同時,數(shù)字圖書館可以通過大數(shù)據(jù)分析建立檢測分析系統(tǒng),預(yù)測目標(biāo)用戶群的需求,從而提高對用戶的信息服務(wù)能力。[3]在大數(shù)據(jù)環(huán)境下,數(shù)字圖書館可以開展如下幾種產(chǎn)品或服務(wù)模式:其一,服務(wù)產(chǎn)品。數(shù)字圖書館能夠借助大數(shù)據(jù)存儲海量資源,為增強自身核心競爭力,需要提供豐富的服務(wù)產(chǎn)品,除了文獻和信息的檢索閱讀外,應(yīng)提供智庫等再生信息服務(wù)和知識科普等文化宣傳服務(wù);其二,分析產(chǎn)品。大數(shù)據(jù)時代往往更加缺乏解決問題的知識和信息處理的能力。數(shù)字圖書館可以通過大數(shù)據(jù)分析用戶行為,通過整理用戶所關(guān)注的領(lǐng)域和話題進行需求預(yù)測,并結(jié)合預(yù)測結(jié)果推送文本資源,增強數(shù)字圖書館館藏資源的利用率;其三,服務(wù)模式。數(shù)字圖書館本應(yīng)采取用戶自助式的服務(wù)模式,但在大數(shù)據(jù)環(huán)境下,用戶面臨著海量文獻資源往往很難找到真正想要的信息,這就需要數(shù)字圖書館將自助式服務(wù)轉(zhuǎn)變?yōu)橹鲃油扑]式服務(wù),根據(jù)對用戶需求的預(yù)測結(jié)果主動推薦文本,或根據(jù)時事熱點新聞進行重點推薦,增強數(shù)字圖書館的資源推薦水平。同時,數(shù)字圖書館應(yīng)開辦咨詢服務(wù),采取系統(tǒng)自動應(yīng)答、人工應(yīng)答和專家應(yīng)答三種方式,使數(shù)字圖書館能夠真正為用戶學(xué)習(xí)、工作、生活所用,充分發(fā)揮圖書館的社會教化功能。
在云計算、人工智能等技術(shù)的發(fā)展進程中,大數(shù)據(jù)已經(jīng)呈現(xiàn)出了全新的技術(shù)生態(tài),信息的存儲、處理、分析能力顯著上升,對各領(lǐng)域的轉(zhuǎn)型發(fā)展起到了重要的推動作用。如語音識別、文本分析等技術(shù)的發(fā)展,使得數(shù)字圖書館得以有效利用各種先進技術(shù),調(diào)整現(xiàn)有的服務(wù)業(yè)態(tài)。我國數(shù)字圖書館以滿足用戶知識需求為主要目標(biāo),通過大數(shù)據(jù)實現(xiàn)了文本資源的廣泛傳播,且作用于經(jīng)濟、文化等領(lǐng)域,使數(shù)字圖書館更大程度上發(fā)揮了公益服務(wù)和社會教化功能。在大數(shù)據(jù)環(huán)境下,圖書館需要構(gòu)建新的管理模式以實現(xiàn)用戶與文本資源之間的直接對接,在擴大文本資源的傳播范圍同時,增強文本資源的知識服務(wù)能力,有效推動圖書館的突破性發(fā)展。因此,在大數(shù)據(jù)時代,圖書館應(yīng)從以下幾個方面實現(xiàn)轉(zhuǎn)型升級:其一是打破資源框架。大數(shù)據(jù)時代,無論是數(shù)字圖書館存儲的文本資源,還是用戶所需求的信息資源都呈現(xiàn)出多元化的發(fā)展趨勢,對數(shù)字圖書館的資源采集、分析、管理和服務(wù)能力提出了新的要求。數(shù)字圖書館必須利用大數(shù)據(jù)技術(shù)建立數(shù)據(jù)框架,將文本和圖像信息納入到館藏之中,通過分析信息之間的語義關(guān)系建立信息組織框架,從而突破傳統(tǒng)圖書館的資源框架;其二是形成全方位的服務(wù)理念。數(shù)字圖書館應(yīng)結(jié)合大數(shù)據(jù)技術(shù)拓寬自身的服務(wù)范圍,一方面要將受眾面向全社會,充分發(fā)揮圖書館的社會教化功能,為學(xué)習(xí)型社會的建設(shè)提供助力。[4]另一方面則要提供全資源服務(wù),為用戶提供包括文獻圖像、視頻音頻、政策法規(guī)等多種形式的信息資源,以滿足用戶的多元需求。此外,數(shù)字圖書館需要調(diào)整自身的服務(wù)模式,通過信息推送、個性化服務(wù)等方式增強信息資源的輻射能力,全面開展數(shù)字圖書館業(yè)務(wù);其三是發(fā)展高端業(yè)務(wù)。數(shù)字圖書館應(yīng)以智庫作為建設(shè)目標(biāo),與各學(xué)科的前沿領(lǐng)域相結(jié)合,發(fā)揮其信息分析的能力為各學(xué)科的科研工作提供資源支持;其四是調(diào)整館員角色定位,數(shù)字圖書館館員應(yīng)對大數(shù)據(jù)有深刻理解,具有一定的數(shù)據(jù)分析能力,懂得大數(shù)據(jù)的應(yīng)用方法,利用各類軟件工具進行館藏資源的分析整理工作,并加強文獻數(shù)據(jù)庫的建設(shè),以發(fā)揮出大數(shù)據(jù)對數(shù)字圖書館的積極影響。
數(shù)字圖書館建設(shè)中應(yīng)用大數(shù)據(jù)技術(shù),需要建立大量高新的軟硬件設(shè)備,不僅要求數(shù)字圖書館加大資金投入力度,還對館員的專業(yè)能力提出了新的要求。與此同時,大數(shù)據(jù)的信息采集和處理本身難度較高,且涉及到如出版社、合作企業(yè)等機構(gòu),需要數(shù)字圖書館對文本資源的采集處理、知識產(chǎn)權(quán)等有更高的重視。大數(shù)據(jù)技術(shù)雖然會為數(shù)字圖書館帶來諸多挑戰(zhàn),但同時也帶來了新的發(fā)展機遇。在大數(shù)據(jù)時代,數(shù)字圖書館需要充分利用各類數(shù)字資源提升自身的資源建設(shè)水平,為更多用戶提供更為豐富的信息支持,同時大數(shù)據(jù)能夠提升數(shù)字圖書館的信息服務(wù)能力,使其開發(fā)新的產(chǎn)品或服務(wù)模式。此外,大數(shù)據(jù)能夠有效推動圖書館的轉(zhuǎn)型升級,使數(shù)字圖書館發(fā)展更多高端業(yè)務(wù)成為可能。