国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數(shù)據(jù)的圖書館數(shù)字資源重構(gòu)與融合研究

2016-05-14 11:23陳臣
現(xiàn)代情報(bào) 2016年8期
關(guān)鍵詞:數(shù)字資源數(shù)字圖書館大數(shù)據(jù)

陳臣

〔摘要〕數(shù)字圖書館已進(jìn)入大數(shù)據(jù)時(shí)代。大數(shù)據(jù)時(shí)代既給數(shù)字圖書館帶來了機(jī)遇,也給數(shù)字圖書館帶來了挑戰(zhàn),如何將零散分布、孤島存儲(chǔ)的圖書館數(shù)字資源融合成完整的“大數(shù)據(jù)”,從中提取出有用的信息,并最終轉(zhuǎn)化為知識(shí)和規(guī)則,對(duì)于提升數(shù)字圖書館的服務(wù)能力和競爭力十分重要。針對(duì)數(shù)字圖書館存在數(shù)據(jù)來源各異、數(shù)據(jù)存儲(chǔ)方式多樣、數(shù)據(jù)形式非結(jié)構(gòu)化等問題,本文對(duì)大數(shù)據(jù)時(shí)代圖書館數(shù)字資源的重構(gòu)與融合問題進(jìn)行了研究,提出了基于大數(shù)據(jù)的圖書館數(shù)字資源重構(gòu)與融合策略。該策略有助于對(duì)圖書館數(shù)字資源進(jìn)行整合,可促進(jìn)數(shù)字資源的共享,有助于加強(qiáng)數(shù)字資源、讀者、系統(tǒng)服務(wù)資源和個(gè)性化服務(wù)模式的融合,并最終提升數(shù)字圖書館的綜合服務(wù)能力。

〔關(guān)鍵詞〕大數(shù)據(jù);圖書館;數(shù)字圖書館;數(shù)字資源;重構(gòu)與融合

DOI:10.3969/j.issn.1008-0821.2016.08.002

〔中圖分類號(hào)〕G25076〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2016)08-0010-04

〔Abstract〕Digital library has entered the era of big data,when brings opportunities,it also brings challenges.How to integrate digital resource into whole big data from data and information that scattered distribution and fragmentary existence in digital library,extract valuable information from them,translate into useful knowledge and rule,which is important to enhance the service ability and competitiveness of digital library.In view of the issues concerning different data sources,diverse data storage and unstructured data existing in digital library,the paper conducted some research on the reconstruction and integration of digital resources of library In the era of big data,the strategy of digital resources reconstruction and fusion based on big data is put forward.The strategy is helpful for the integration of digital resources in digital libraries,and promoted the sharing of digital resources,and helped strengthen the contact of the digital resources,reader,system service resource,and Personalized service model,so as to enhance the competitiveness of the digital library,ultimately improve the comprehensive service ability of Digital Library.

〔Key words〕big data;library;digital library;digital resources;reconstruction and integration

隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)、云計(jì)算技術(shù)、傳感器網(wǎng)絡(luò)和閱讀終端制造技術(shù)在圖書館服務(wù)中的廣泛應(yīng)用,圖書館數(shù)據(jù)環(huán)境呈現(xiàn)出數(shù)據(jù)海量(Volume)、多樣化(Variety)、快速處理(Velocity)和高價(jià)值(Value)的大數(shù)據(jù)4V特性,圖書館已進(jìn)入大數(shù)據(jù)時(shí)代。大數(shù)據(jù)不僅為數(shù)字圖書館的數(shù)據(jù)安全管理、科學(xué)分析、價(jià)值融合和數(shù)據(jù)服務(wù)模式變革提供可靠的決策支持,而且其海量、高價(jià)值、低獲取成本和高共享特性的數(shù)字資源,已成為讀者知識(shí)獲取和對(duì)圖書館服務(wù)感知的主要載體,導(dǎo)致讀者對(duì)圖書館數(shù)字資源的依賴性隨著數(shù)字資源價(jià)值總量的快速增長而不斷加強(qiáng)。因此,如何科學(xué)采購數(shù)字資源、高效自建數(shù)字資源庫、與第三方合作開發(fā)共享資源和合理利用網(wǎng)絡(luò)免費(fèi)資源等,已成為關(guān)系圖書館服務(wù)能力建設(shè)和讀者閱讀滿意度的重要問題。圖書館界學(xué)者對(duì)圖書館數(shù)字資源的知識(shí)庫建設(shè)、知識(shí)傳播、服務(wù)推送、服務(wù)創(chuàng)新和資源質(zhì)量評(píng)估進(jìn)行了深入的研究。王小立認(rèn)為個(gè)人數(shù)字圖書館資源共享服務(wù)是未來圖書館發(fā)展的一個(gè)重要趨勢,其資源共享服務(wù)還面臨著隱私保護(hù)、知識(shí)產(chǎn)權(quán)等諸多問題[1];劉曉英認(rèn)為數(shù)字資源融合涉及的技術(shù)問題主要包括數(shù)據(jù)存儲(chǔ)容量問題、數(shù)據(jù)標(biāo)準(zhǔn)問題、數(shù)據(jù)安全問題、數(shù)據(jù)保存問題等;蘇新寧認(rèn)為應(yīng)從大數(shù)據(jù)的角度考慮數(shù)字圖書館的各類問題,把數(shù)字圖書館完全融入大數(shù)據(jù)之中,借助大數(shù)據(jù)技術(shù)解決數(shù)字圖書館有關(guān)問題[2];劉元珺認(rèn)為公共圖書館數(shù)字資源評(píng)估指標(biāo)具有關(guān)聯(lián)性、復(fù)雜性和動(dòng)態(tài)性,公共圖書館不能簡單地聚焦于個(gè)別指標(biāo)的達(dá)成[3]。曹寧認(rèn)為應(yīng)借助數(shù)字資源整合與優(yōu)化,完善數(shù)字資源服務(wù)體系的整體性與有序性,打造服務(wù)平臺(tái)與服務(wù)終端的兼容互通與共建共享[4]。劉慧認(rèn)為,應(yīng)該做到聯(lián)盟內(nèi)的數(shù)字資源聯(lián)合采購的工作,并做好分工,降低數(shù)字資源的重復(fù)率,做到共建共享工作[5]。

1大數(shù)據(jù)環(huán)境下圖書館數(shù)字資源管理的問題與挑戰(zhàn)

11大數(shù)據(jù)環(huán)境下圖書館數(shù)字資源的概念與特點(diǎn)

圖書館數(shù)字資源也稱電子資源,是指圖書館通過計(jì)算機(jī)技術(shù)、多媒體技術(shù)和通信傳輸技術(shù)等,將信息資源和知識(shí)相互融合而形成的數(shù)字表現(xiàn)形式,并通過互聯(lián)網(wǎng)等手段發(fā)布、處理、存取、傳播、收集和利用的數(shù)字信息資源的總和。圖書館數(shù)字資源通常有文字、圖片、聲音、視頻等多種存在類型,圖書館數(shù)字資源庫建設(shè)可采用購買第三方數(shù)字資源、自建數(shù)字資源庫和共享免費(fèi)的互聯(lián)網(wǎng)資源等方式。與傳統(tǒng)的紙質(zhì)印刷型文獻(xiàn)相比,圖書館數(shù)字資源庫具有信息海量、高價(jià)值密度、建設(shè)速度快和投資收益高等優(yōu)點(diǎn)。

大數(shù)據(jù)時(shí)代的到來,圖書館數(shù)字資源的結(jié)構(gòu)特點(diǎn)、組織方式和服務(wù)模式發(fā)生了巨大的變化。首先,圖書館數(shù)字資源呈現(xiàn)海量和多類型的特點(diǎn)。大數(shù)據(jù)時(shí)代,圖書館的數(shù)字資源除了傳統(tǒng)的電子刊物、電子圖書、音頻與視頻讀物、網(wǎng)絡(luò)OA(辦公自動(dòng)化)資源外,還包括圖書館數(shù)據(jù)中心系統(tǒng)參數(shù)與運(yùn)營數(shù)據(jù)、讀者個(gè)體特征與閱讀行為數(shù)據(jù)、傳感器網(wǎng)絡(luò)數(shù)據(jù)、視頻監(jiān)控?cái)?shù)據(jù)等,這些大數(shù)據(jù)資源具有海量(Volume)、多數(shù)據(jù)類型(Variety)、高價(jià)值(Value)和處理速度快(Velocity)的4V特點(diǎn)[6]。其次,大數(shù)據(jù)時(shí)代隨著圖書館計(jì)算機(jī)數(shù)據(jù)處理和存儲(chǔ)性能的快速增長,圖書館數(shù)字資源產(chǎn)生、發(fā)布、使用和消亡的生命周期大幅度減少,圖書館可通過對(duì)數(shù)據(jù)資源的價(jià)值二次挖掘、標(biāo)準(zhǔn)化處理和數(shù)據(jù)融合等操作,來提升數(shù)字資源的價(jià)值總量和使用時(shí)效性。第三,結(jié)合圖書館服務(wù)能力提升和讀者數(shù)字閱讀需求,將數(shù)字資源庫中不同的元數(shù)據(jù)描述統(tǒng)一組織起來形成資源的統(tǒng)一檢索,以及通過對(duì)元數(shù)據(jù)層數(shù)據(jù)標(biāo)準(zhǔn)的統(tǒng)一,來實(shí)現(xiàn)圖書館內(nèi)部數(shù)字資源知識(shí)的關(guān)聯(lián)、融合和二次增值,是大數(shù)據(jù)時(shí)代圖書館數(shù)字資源庫建設(shè)面臨的一個(gè)挑戰(zhàn)性問題。

12海量數(shù)字資源的長期存儲(chǔ)與可獲取需求

2015年9月23日,國家科技圖書文獻(xiàn)中心(NSTL)邀請(qǐng)國內(nèi)多個(gè)圖書館共同發(fā)起簽署《數(shù)字文獻(xiàn)資源長期保存共同聲明》發(fā)布會(huì)在京舉行。國家圖書館、中國科學(xué)院文獻(xiàn)情報(bào)中心、中國科學(xué)技術(shù)信息研究所、北京大學(xué)圖書館、清華大學(xué)圖書館等近60個(gè)文獻(xiàn)信息機(jī)構(gòu)的領(lǐng)導(dǎo)和代表出席了發(fā)布會(huì),集體簽署了《數(shù)字文獻(xiàn)資源長期保存共同聲明》,表現(xiàn)出我國圖書館界對(duì)數(shù)字文獻(xiàn)資源的國家長期保存具有強(qiáng)烈的愿望[7]。如何構(gòu)建科學(xué)、合理的數(shù)字文獻(xiàn)資源采購機(jī)制,實(shí)現(xiàn)我國數(shù)字文獻(xiàn)資源的本土長期保存和支持用戶長期可獲取,對(duì)于維護(hù)我國數(shù)字讀者的閱讀權(quán)益和國家信息安全具有重要意義。

隨著無線寬帶傳輸技術(shù)和終端制造技術(shù)的發(fā)展,讀者可通過移動(dòng)數(shù)字閱讀終端、手機(jī)、平板電腦和臺(tái)式電腦開展數(shù)字閱讀活動(dòng),數(shù)字閱讀模式多樣化在有效擺脫時(shí)間、地域和閱讀方式對(duì)讀者束縛的同時(shí),也導(dǎo)致圖書館服務(wù)數(shù)據(jù)、閱讀終端設(shè)備運(yùn)行數(shù)據(jù)、讀者閱讀關(guān)系數(shù)據(jù)和讀者行為數(shù)據(jù)激增,圖書館傳統(tǒng)的數(shù)據(jù)存儲(chǔ)模式已不能滿足海量大數(shù)據(jù)存儲(chǔ)和檢索的需求,因此,如何利用云計(jì)算技術(shù)構(gòu)建超大型元數(shù)據(jù)倉儲(chǔ),是圖書館實(shí)現(xiàn)數(shù)字資源統(tǒng)一聚合與一站式檢索應(yīng)關(guān)注的問題。此外,圖書館大數(shù)據(jù)主要包括用戶服務(wù)數(shù)據(jù)、系統(tǒng)管理與運(yùn)營數(shù)據(jù)、讀者閱讀關(guān)系與行為數(shù)據(jù)、視頻監(jiān)控?cái)?shù)據(jù)等,這些數(shù)據(jù)具有海量(Volume)、多數(shù)據(jù)類型(Variety)、高價(jià)值(Value)和處理速度快(Velocity)的4V特點(diǎn),其中半結(jié)構(gòu)與非結(jié)構(gòu)化數(shù)據(jù)占據(jù)大數(shù)據(jù)總量的85%以上,如何對(duì)多類型數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理和有效過濾數(shù)據(jù)噪聲,已成為關(guān)系圖書館大數(shù)據(jù)可用性和大數(shù)據(jù)決策有效性的關(guān)鍵。

13數(shù)字資源的融合管理、聚類和重組問題

(1)圖書館大數(shù)據(jù)資源具有數(shù)據(jù)海量、多類型、關(guān)系復(fù)雜和價(jià)值挖掘難度大的特點(diǎn),如何通過異構(gòu)數(shù)字資源的融合、聚類、重組和挖掘,清晰洞察大數(shù)據(jù)間的復(fù)雜關(guān)系和隱性知識(shí),準(zhǔn)確發(fā)現(xiàn)數(shù)字資源間的關(guān)聯(lián)關(guān)系(被引用、引用耦合、作者群相關(guān)性、文獻(xiàn)的使用等),是數(shù)字圖書館從傳統(tǒng)的信息檢索、分類、鏈接和推薦等服務(wù),向大數(shù)據(jù)時(shí)代讀者閱讀需求預(yù)測、個(gè)性化服務(wù)定制、知識(shí)服務(wù)推送、服務(wù)質(zhì)量智能評(píng)估與優(yōu)化等轉(zhuǎn)變的前提[8]。

(2)準(zhǔn)確、快速、實(shí)時(shí)和經(jīng)濟(jì)是大數(shù)據(jù)時(shí)代數(shù)字圖書館服務(wù)的4個(gè)關(guān)鍵要素。如何通過數(shù)字資源的融合管理、聚類和重組,并利用知識(shí)域可視化技術(shù)描述知識(shí)資源及其載體,全面挖掘、分析、構(gòu)建、繪制和顯示知識(shí)及它們之間的相互聯(lián)系,是支持圖書館將數(shù)字資源從傳統(tǒng)的數(shù)據(jù)層展示,向信息層、知識(shí)層深度揭示轉(zhuǎn)變的有效途徑。

(3)如何通過數(shù)字資源的融合管理、聚類和重組來消除數(shù)據(jù)孤島,實(shí)現(xiàn)大數(shù)據(jù)資源的集成、開放、共享和知識(shí)融合,是圖書館大數(shù)據(jù)關(guān)系精準(zhǔn)發(fā)現(xiàn)和價(jià)值二次挖掘有效的保證。圖書館數(shù)字資源的融合管理、聚類和重組過程,在重點(diǎn)關(guān)注歷史數(shù)據(jù)、實(shí)時(shí)數(shù)據(jù)、不同行業(yè)數(shù)據(jù)、不同空間、不同地域數(shù)據(jù)之間融合的同時(shí),還應(yīng)注重與不同服務(wù)平臺(tái)和不同服務(wù)模式的融合,才能增強(qiáng)數(shù)字資源融合、聚類和重組的安全性、可用性、經(jīng)濟(jì)性和可靠性。

14構(gòu)建新型圖書館數(shù)字資源采購聯(lián)盟體系的需求

大數(shù)據(jù)時(shí)代,構(gòu)建新型圖書館數(shù)字資源采購聯(lián)盟體系對(duì)降低我國圖書館數(shù)字資源采購費(fèi)用,提升我國數(shù)字資源管理安全性和本土長期存儲(chǔ)可用性具有重要的現(xiàn)實(shí)意義。CALIS(中國高等教育文獻(xiàn)保障系統(tǒng))是經(jīng)國務(wù)院批準(zhǔn)的我國高等教育“211工程”、“九五”、“十五”總體規(guī)劃中3個(gè)公共服務(wù)體系之一,通過建設(shè)以中國高等教育數(shù)字圖書館為核心的教育文獻(xiàn)聯(lián)合保障體系,實(shí)現(xiàn)了信息資源的共建、共知和共享,為中國的高等教育服務(wù)。從1997年至今,CALIS項(xiàng)目組共組織了近450場海外資源引進(jìn)活動(dòng),使各大高校教學(xué)科研人員在第一時(shí)間準(zhǔn)確地了解到國際前沿動(dòng)態(tài),跟蹤和把握國際科研的發(fā)展趨勢,不斷提升了教學(xué)和科研水平[9]。自2010年起,只有獲得中國有關(guān)部門批準(zhǔn)的圖書進(jìn)出口商才能協(xié)助組織國際采購數(shù)據(jù)庫的談判和簽約等相關(guān)工作,CALIS將不再承擔(dān)引進(jìn)資源集團(tuán)采購的組織工作,取而代之的是成立DRAA(中國高校圖書館數(shù)字資源采購聯(lián)盟),今后將以DRAA的名義采購海外數(shù)字資源[10]。

當(dāng)前,我國高校和科研機(jī)構(gòu)對(duì)國外數(shù)據(jù)庫的依賴性不斷增強(qiáng),2015年我國高校采購各類國外數(shù)據(jù)庫的費(fèi)用高達(dá)32億人民幣。從CALIS和DRAA多年的海外數(shù)據(jù)庫采購工作看,Wiley interScience、IEEE、EBSCO、ProQuest、Sciencedirect、INSPEC、SPRINGER等歐美數(shù)據(jù)庫供應(yīng)商在國際數(shù)據(jù)庫交易上長期把持著話語權(quán),雖然CALIS和DRAA聯(lián)盟采購費(fèi)用比單獨(dú)采購下降了25%~40%,但總費(fèi)用仍以年均15%的速度快速增長[11]。其次,所采購的資源在資源內(nèi)容和服務(wù)模式上相同,不同高校與科研機(jī)構(gòu)不能根據(jù)自身的實(shí)際需求在資源采購上進(jìn)行個(gè)性化定制。第三,采購方僅購買了海外數(shù)字資源某一時(shí)間段的使用權(quán),而無法將海外資源在我國本土進(jìn)行長期的存儲(chǔ)和使用。第四,如何構(gòu)建第三方的數(shù)據(jù)庫管理平臺(tái),實(shí)現(xiàn)海外資源的存儲(chǔ)、管理、查詢、分析、評(píng)估和優(yōu)化,以及在降低我國海外數(shù)據(jù)庫使用成本的前提下提升數(shù)據(jù)庫的安全性、可控性和可用性,也是構(gòu)建我國數(shù)字資源采購聯(lián)盟體系應(yīng)關(guān)注的重點(diǎn)問題。

2基于大數(shù)據(jù)的圖書館數(shù)字資源重構(gòu)與融合策略

21加強(qiáng)圖書館數(shù)字資源大數(shù)據(jù)庫的建設(shè)

首先,大數(shù)據(jù)時(shí)代,圖書館應(yīng)轉(zhuǎn)變傳統(tǒng)數(shù)字資源庫建設(shè)以圖書、期刊、專利、學(xué)位論文、報(bào)紙、行業(yè)標(biāo)準(zhǔn)規(guī)范、會(huì)議論文等為核心的思維,將政府報(bào)告數(shù)據(jù)、社會(huì)公共熱點(diǎn)信息、網(wǎng)絡(luò)信息、第三方共享信息和讀者行為數(shù)據(jù)等數(shù)字化,依據(jù)數(shù)據(jù)的類型、可用性存儲(chǔ)于圖書館的大數(shù)據(jù)庫之中,以此提升圖書館大數(shù)據(jù)庫資源的價(jià)值總量、可用性和數(shù)據(jù)相關(guān)性,確保大數(shù)據(jù)決策科學(xué)、可靠。其次,對(duì)大數(shù)據(jù)進(jìn)行關(guān)聯(lián)、挖掘、融合、分析和深度加工,是圖書館實(shí)現(xiàn)從大數(shù)據(jù)——語義關(guān)聯(lián)——知識(shí)發(fā)現(xiàn)——知識(shí)展示轉(zhuǎn)變的重要途徑[12]。圖書館通過對(duì)大數(shù)據(jù)、IT服務(wù)資源、圖書館員和知識(shí)的有機(jī)整合,可有效提升圖書館的服務(wù)組織效率和服務(wù)能力,實(shí)現(xiàn)服務(wù)投資收益率和大數(shù)據(jù)決策最優(yōu)化。第三,如何發(fā)現(xiàn)與構(gòu)建海量復(fù)雜大數(shù)據(jù)之間的相關(guān)性,是圖書館發(fā)現(xiàn)大數(shù)據(jù)中隱性知識(shí)和實(shí)現(xiàn)大數(shù)據(jù)價(jià)值二次增值的關(guān)鍵。圖書館應(yīng)借助語義技術(shù)充分挖掘文獻(xiàn)、作者、引用文章和內(nèi)部知識(shí)點(diǎn)之間的語義關(guān)系,為讀者提供智能、高效和個(gè)性化的知識(shí)服務(wù)。第四,滿足讀者閱讀需求和提升讀者知識(shí)獲取效率,是圖書館增強(qiáng)自身服務(wù)能力和保證QOS(服務(wù)質(zhì)量)應(yīng)重點(diǎn)關(guān)注的問題。圖書館大數(shù)據(jù)資源庫建設(shè)應(yīng)以讀者閱讀需求為中心,通過對(duì)讀者閱讀行為、閱讀關(guān)系、閱讀模式、閱讀終端參數(shù)等大數(shù)據(jù)的采集、存儲(chǔ)、分析和決策,保證讀者閱讀活動(dòng)相關(guān)大數(shù)據(jù)分析科學(xué)和閱讀需求預(yù)測精準(zhǔn),為圖書館資源庫建設(shè)及資源整合提供科學(xué)的參考與支持依據(jù)[13]。

22統(tǒng)一圖書館數(shù)字資源大數(shù)據(jù)整合、共享和使用的標(biāo)準(zhǔn)大數(shù)據(jù)時(shí)代,圖書館數(shù)字資源整合呈現(xiàn)出政府信息、文獻(xiàn)資源、社會(huì)熱點(diǎn)、網(wǎng)絡(luò)數(shù)據(jù)、讀者個(gè)體特征等海量數(shù)據(jù)相互融合的特點(diǎn),其用戶服務(wù)模式也從以文獻(xiàn)資源檢索服務(wù)為中心,向以綜合信息知識(shí)決策為中心轉(zhuǎn)變。因此,如何制定新的大數(shù)據(jù)資源整合標(biāo)準(zhǔn),是關(guān)系圖書館數(shù)字資源組織加工效率、語義相關(guān)性、組織架構(gòu)科學(xué)性和資源知識(shí)展現(xiàn)可讀性,以及從文獻(xiàn)資源中完全解析出知識(shí),關(guān)將眾多無關(guān)知識(shí)單元之間或與文獻(xiàn)間建立語義關(guān)聯(lián)的關(guān)鍵,也是圖書館發(fā)現(xiàn)知識(shí)和產(chǎn)生新的知識(shí)的重要途徑[14]。

首先,圖書館應(yīng)統(tǒng)一數(shù)字資源采集、組織、描述、分類、標(biāo)引、加工、描述、保存、管理、存儲(chǔ)、交換、檢索和服務(wù)的標(biāo)準(zhǔn),確保數(shù)字資源在編碼格式、著錄方式和數(shù)據(jù)格式上具有統(tǒng)一的標(biāo)準(zhǔn),并且不同圖書館的信息系統(tǒng)應(yīng)相互兼容和支持互操作,便于圖書館實(shí)現(xiàn)數(shù)字資源的跨平臺(tái)共享和互操作。其次,統(tǒng)一數(shù)字資源整合、重組和聚合的方式與技術(shù)標(biāo)準(zhǔn),是圖書館實(shí)現(xiàn)數(shù)字資源知識(shí)可識(shí)別、可讀取和可完全挖掘的前提。因此,應(yīng)通過圖書館聯(lián)盟實(shí)現(xiàn)數(shù)字資源管理的“統(tǒng)一平臺(tái)、統(tǒng)一標(biāo)準(zhǔn)、統(tǒng)一采集、統(tǒng)一整合、統(tǒng)一發(fā)布、統(tǒng)一共享、統(tǒng)一檢索和統(tǒng)一認(rèn)證”,保證數(shù)字資源在圖書館之間的無縫連接、完全共享和全面融合。第三,數(shù)字資源的數(shù)據(jù)庫管理、存儲(chǔ)模式、集成與共享方式、傳輸控制、安全保證、數(shù)據(jù)挖掘和資源使用等標(biāo)準(zhǔn),也是關(guān)系圖書館大數(shù)據(jù)資源可控、可用和經(jīng)濟(jì)的重要問題。圖書館聯(lián)盟在大數(shù)據(jù)采集、傳輸、管理和使用標(biāo)準(zhǔn)的制定中,應(yīng)加強(qiáng)數(shù)據(jù)聚類技術(shù)、信息分析技術(shù)和數(shù)據(jù)檢索技術(shù)的建設(shè),堅(jiān)持以提升讀者個(gè)性化閱讀需求發(fā)現(xiàn)和圖書館智能化服務(wù)定制能力為中心,確保數(shù)字資源知識(shí)發(fā)現(xiàn)與服務(wù)推送過程安全、高效、經(jīng)濟(jì)和可控。

23實(shí)現(xiàn)圖書館數(shù)字資源的統(tǒng)一發(fā)現(xiàn)與共享

利用云計(jì)算技術(shù)構(gòu)建我國圖書館聯(lián)盟超大型元數(shù)據(jù)私有云倉儲(chǔ)庫,是我國圖書館數(shù)字資源庫安全管理、經(jīng)濟(jì)建設(shè)、全面收集和高效使用的重要保證。在圖書館聯(lián)盟超大型元數(shù)據(jù)私有云倉儲(chǔ)庫建設(shè)中,首先應(yīng)注重?cái)?shù)字資源元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系的建設(shè),統(tǒng)一圖書館元數(shù)據(jù)采集模式和質(zhì)量控制的標(biāo)準(zhǔn),并通過建立科學(xué)的數(shù)據(jù)更新制度來保證元數(shù)據(jù)更新科學(xué)、高效、實(shí)時(shí)和可持續(xù)。同時(shí),圖書館借助互聯(lián)網(wǎng)對(duì)讀者的身份進(jìn)行認(rèn)證后,支持讀者訪問圖書館聯(lián)盟云數(shù)據(jù)中心來完成館藏?cái)?shù)字資源的統(tǒng)一查詢、檢索、發(fā)布和下載。

其次,數(shù)字圖書館服務(wù)模式從傳統(tǒng)的集成資源檢索與發(fā)現(xiàn)服務(wù),向海量數(shù)字資源元數(shù)據(jù)的預(yù)加工、融合、價(jià)值挖掘和知識(shí)推薦服務(wù)轉(zhuǎn)變,是大數(shù)據(jù)時(shí)代圖書館聯(lián)盟數(shù)字資源云倉儲(chǔ)庫服務(wù)模式變革的一個(gè)重要特征。為了保證云倉儲(chǔ)庫安全、高效、可用和可控,圖書館數(shù)字資源云倉儲(chǔ)庫建設(shè)應(yīng)堅(jiān)持統(tǒng)一數(shù)據(jù)庫、統(tǒng)一檢索入口、統(tǒng)一集成存儲(chǔ)和個(gè)性化服務(wù)定制的原則,實(shí)現(xiàn)館內(nèi)數(shù)字資源庫數(shù)據(jù)的全面整合、一站式檢索、相關(guān)性發(fā)現(xiàn)和精準(zhǔn)數(shù)據(jù)定位,支持讀者從元數(shù)據(jù)題錄層面完全揭示其隱匿的知識(shí)。

第三,當(dāng)前,世界上諸如谷歌、百度等一些具有較強(qiáng)科技實(shí)力的互聯(lián)網(wǎng)信息服務(wù)公司,創(chuàng)辦了谷歌學(xué)術(shù)、百度學(xué)術(shù)等免費(fèi)的統(tǒng)一資源發(fā)現(xiàn)服務(wù)欄目。這些公司具有強(qiáng)大的大數(shù)據(jù)計(jì)算、海量數(shù)據(jù)云存儲(chǔ)、海量資源的高度集成及深度加工、優(yōu)質(zhì)的數(shù)據(jù)檢索效果保障等能力,并擁有成熟的統(tǒng)計(jì)平臺(tái)及用戶行為分析技術(shù),這些互聯(lián)網(wǎng)信息服務(wù)公司通過與世界著名數(shù)據(jù)庫供應(yīng)商一對(duì)一的合作資源共享,采用OAI-PMH(元數(shù)據(jù)獲取協(xié)議)的元數(shù)據(jù)收割技術(shù)網(wǎng)絡(luò)攫取,以及充分發(fā)揮自身的搜索引擎技術(shù)優(yōu)勢,利用爬蟲對(duì)擬采集數(shù)據(jù)進(jìn)行發(fā)現(xiàn)、收錄、解析、加工和處理,具有數(shù)字資源發(fā)現(xiàn)精準(zhǔn)、高效、快速和免費(fèi)的特點(diǎn)[15]。因此,圖書館聯(lián)盟可通過與谷歌、百度等公司簽署戰(zhàn)略合作的方式,為圖書館數(shù)字資源庫建設(shè)、知識(shí)發(fā)現(xiàn)服務(wù)完善和學(xué)術(shù)評(píng)價(jià)體系的創(chuàng)新等方面提供服務(wù)支持。

24構(gòu)建基于大數(shù)據(jù)的圖書館數(shù)字資源長期保存體系2013年7月,根據(jù)我國科技部數(shù)字科技文獻(xiàn)資源長期保存工作安排,NSTL正式啟動(dòng)了我國數(shù)字科技文獻(xiàn)資源長期保存體系建設(shè),并于2014年在其成員單位部署建設(shè)了中國科學(xué)院文獻(xiàn)情報(bào)中心和中國科學(xué)技術(shù)信息研究所等兩個(gè)國家數(shù)字科技文獻(xiàn)資源長期保存示范系統(tǒng),建立了我國數(shù)字科技文獻(xiàn)資源長期保存的基本規(guī)范體系[16]。但在海外數(shù)字文獻(xiàn)資源的采購、存儲(chǔ)、管理和使用上,NSTL僅采購了海外著名數(shù)字資源庫的限時(shí)使用權(quán),這對(duì)我國的信息資源安全和海外數(shù)字資源可控性、可用性產(chǎn)生了較大不利影響,因此,如何獲取海外數(shù)據(jù)庫在我國的長期存檔權(quán)、處理權(quán)和服務(wù)權(quán),是我國圖書館聯(lián)盟面臨的一個(gè)嚴(yán)峻挑戰(zhàn)。

世界上許多發(fā)達(dá)國家已從國家信息安全戰(zhàn)略角度開始了E-first(數(shù)字資源優(yōu)先)或者E-only(數(shù)字資源惟一)的文獻(xiàn)資源體系長期保存系統(tǒng)建設(shè),比如荷蘭的國家圖書館已在本館存儲(chǔ)了世界主流出版社的數(shù)字科技期刊;德國建立了DFG國家保存中心體系;加拿大政府支持多倫多大學(xué)建立了國家數(shù)字資源長期保存系統(tǒng)。因此,我國圖書館界應(yīng)在國家相關(guān)部門的領(lǐng)導(dǎo)和支持下,在制定科學(xué)、高效、經(jīng)濟(jì)和可行的海外優(yōu)質(zhì)數(shù)字資源本土存儲(chǔ)與管理制度的同時(shí),明確圖書館聯(lián)盟各參與方的責(zé)任、義務(wù)和權(quán)利等,努力提升我國數(shù)字圖書館數(shù)據(jù)中心安全管理、數(shù)據(jù)存儲(chǔ)、遠(yuǎn)程傳輸和服務(wù)質(zhì)量保證的能力,才能確保海外資源在我國本土長期存儲(chǔ)、可用和可控。

3結(jié)束語

伴隨大數(shù)據(jù)時(shí)代的到來,數(shù)字圖書館的數(shù)字資源組織模式、內(nèi)容結(jié)構(gòu)和服務(wù)方法發(fā)生了深刻的變革,使圖書館擺脫了數(shù)據(jù)類型、時(shí)間、空間和閱讀模式對(duì)讀者閱讀需求的限制,并以大數(shù)據(jù)科學(xué)決策支持為依據(jù),精確地預(yù)測出讀者的閱讀需求、閱讀場景、閱讀社會(huì)關(guān)系和終端類型,可為讀者提供安全、高效、經(jīng)濟(jì)和個(gè)性化的數(shù)字閱讀推送服務(wù)。但是,隨著云計(jì)算技術(shù)、傳感器網(wǎng)絡(luò)技術(shù)、大數(shù)據(jù)技術(shù)和互聯(lián)網(wǎng)技術(shù)在圖書館服務(wù)中的廣泛應(yīng)用,數(shù)字圖書館大數(shù)據(jù)呈現(xiàn)出海量和總量指數(shù)增長的特征,其數(shù)字資源類型呈現(xiàn)多樣、復(fù)雜、難共享和價(jià)值挖掘困難的特點(diǎn)。因此,如何基于大數(shù)據(jù)技術(shù)實(shí)現(xiàn)數(shù)字資源的重構(gòu)與融合,對(duì)于全面挖掘圖書館數(shù)字資源隱匿知識(shí),實(shí)現(xiàn)數(shù)字閱讀服務(wù)高效、共享、經(jīng)濟(jì)和可控具有重要的意義。

因此,圖書館聯(lián)盟應(yīng)從大數(shù)據(jù)復(fù)雜環(huán)境特點(diǎn)、圖書館服務(wù)能力提升和讀者大數(shù)據(jù)閱讀需求出發(fā),規(guī)范圖書館數(shù)字資源的采集、存儲(chǔ)、傳輸和服務(wù)的標(biāo)準(zhǔn),統(tǒng)一構(gòu)建一個(gè)圖書館數(shù)字資源采購、管理、挖掘、重構(gòu)、整合和共享的大數(shù)據(jù)平臺(tái),不斷增強(qiáng)數(shù)字資源整合、價(jià)值發(fā)現(xiàn)、組織加工、分析檢索的廣度與深度,最終實(shí)現(xiàn)圖書館數(shù)字資源服務(wù)從傳統(tǒng)的被動(dòng)、等待和共性化服務(wù),向自動(dòng)預(yù)測、智能管理和個(gè)性化知識(shí)推送的服務(wù)模式轉(zhuǎn)變。此外,數(shù)字圖書館在數(shù)字資源的采集、存儲(chǔ)、共享和使用中,還應(yīng)從我國信息資源安全、讀者隱私保護(hù)和數(shù)字資源的可用性保證出發(fā),嚴(yán)格遵守我國信息安全的相關(guān)標(biāo)準(zhǔn)與法律法規(guī),才能為讀者提供安全、高效、經(jīng)濟(jì)和滿意的數(shù)字資源大數(shù)據(jù)閱讀服務(wù)。

參考文獻(xiàn)

[1]Wikipedia.Big data[EB/OL].http:∥cn.wikipedia.org/wiki/Bigdata,3014-11-02.

[2]張興旺,李晨暉,麥范金.變革中的大數(shù)據(jù)知識(shí)服務(wù):面向大數(shù)據(jù)的信息移動(dòng)推薦服務(wù)新模式[J].圖書與情報(bào),2013,(4):74-78.

[3]馬曉亭.基于用戶服務(wù)價(jià)值的圖書館大數(shù)據(jù)價(jià)值分析與服務(wù)質(zhì)量保證研究[J].圖書館,2014,(5):95-98.

[4]邵慧麗,張帆.基于知識(shí)發(fā)現(xiàn)數(shù)字圖書館知識(shí)服務(wù)研究[J].圖書館,2016,(2):70-73.

[5]曾子明,金鵬.基于用戶興趣變化的數(shù)字圖書館知識(shí)推薦服務(wù)研究[J].圖書館論壇,2016,(1):94-99.

[6]張曉林.機(jī)構(gòu)知識(shí)庫的發(fā)展趨勢與挑戰(zhàn)[J].現(xiàn)代圖書情報(bào)技術(shù),2014,(2):1-7.

[7]季淑娟,王曉麗.高校區(qū)域性聯(lián)合信息咨詢服務(wù)的系統(tǒng)架構(gòu)研究[J].大學(xué)圖書館學(xué)報(bào),2013,(3):74-79.

[8]劉成山,王潔良,秦春秀.一種基于對(duì)等云的數(shù)字圖書館架構(gòu)[J].情報(bào)理論與實(shí)踐,2013,(11):114-117.

[9]中華人民共和國文化部.圖書館數(shù)字資源統(tǒng)計(jì)規(guī)范(WH/T 47—2012)[S].北京:國家圖書館出版社,2013.

[10]李彬彬,劉昆雄.我國高校圖書館參考咨詢知識(shí)庫建設(shè)現(xiàn)狀調(diào)查與分析[J].圖書館建設(shè),2013,(4):36-40.

[11]王小立.百度“知道”知識(shí)傳播對(duì)個(gè)人數(shù)字圖書館資源共享的啟示[J].圖書館,2016,(2):83-87.

[12]李月琳,梁娜,齊雪.從交互維度到交互功能:構(gòu)建數(shù)字圖書館交互評(píng)估理論模型[J].中國圖書館學(xué)報(bào),2016,42(1):66-82.

[13]馬曉亭.大數(shù)據(jù)時(shí)代圖書館數(shù)據(jù)可用性:價(jià)值、挑戰(zhàn)和保障[J].圖書館理論與實(shí)踐,2014,(10):5-8.

[14]白廣思.數(shù)字圖書館大數(shù)據(jù)分類研究[J].圖書館學(xué)研究,2016,(3):53-58.

[15]張興旺,李晨暉.數(shù)字圖書館大數(shù)據(jù)知識(shí)服務(wù)體系協(xié)同設(shè)計(jì)研究[J].圖書與情報(bào),2015,(3):61-70.

[16]王錳,鄭建明,陳雅.大數(shù)據(jù)環(huán)境下數(shù)字圖書館的基本職能[J].情報(bào)資料工作,2015,(3):109-112.

(本文責(zé)任編輯:孫國雷)

猜你喜歡
數(shù)字資源數(shù)字圖書館大數(shù)據(jù)
評(píng)價(jià)高校圖書館數(shù)字資源綜合服務(wù)能力
枣庄市| 福建省| 西安市| 六盘水市| 开封县| 孝义市| 水富县| 泰州市| 子洲县| 北票市| 罗山县| 墨玉县| 江华| 北宁市| 濮阳市| 高州市| 曲麻莱县| 镇沅| 策勒县| 湟中县| 台湾省| 江口县| 红安县| 土默特右旗| 清丰县| 南乐县| 静海县| 泸溪县| 文安县| 苍梧县| 介休市| 临湘市| 保亭| 民县| 攀枝花市| 泽州县| 社旗县| 四会市| 长宁县| 蓝山县| 浠水县|