国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)在圖書館資源建設(shè)中的應(yīng)用

2018-10-24 08:49楊曉燕
卷宗 2018年19期
關(guān)鍵詞:數(shù)字圖書館大數(shù)據(jù)

摘 要:隨著物聯(lián)網(wǎng),云計(jì)算等信息技術(shù)的發(fā)展,數(shù)據(jù)爆炸式增長(zhǎng),大數(shù)據(jù)時(shí)代到來。大數(shù)據(jù)時(shí)代的到來,對(duì)數(shù)字圖書館的信息服務(wù)產(chǎn)生了巨大的影響。本文在圖書館進(jìn)行了大數(shù)據(jù)技術(shù)的應(yīng)用研究,著重論述了如何將大數(shù)據(jù)技術(shù)融入數(shù)字圖書館信息服務(wù)。

關(guān)鍵詞:大數(shù)據(jù) 數(shù)字圖書館 信息服務(wù)方式

基金項(xiàng)目:《基于大數(shù)據(jù)的民族地區(qū)文獻(xiàn)數(shù)據(jù)挖掘分析研究》,項(xiàng)目編號(hào):2017NDC131,級(jí)別:內(nèi)蒙古哲學(xué)社會(huì)科學(xué)規(guī)劃的青年項(xiàng)目

自2012年以來,大數(shù)據(jù)的概念受到了熱烈的反響,它甚至比物聯(lián)網(wǎng)和云計(jì)算還要熱。有大量跡象表明大數(shù)據(jù)時(shí)代即將到來。所謂大數(shù)據(jù),是指大數(shù)據(jù)集合,人們無法使用原有的技術(shù)來實(shí)現(xiàn)數(shù)據(jù)集的高效處理,可稱為大數(shù)據(jù)。如何有效地從大數(shù)據(jù)中挖掘有價(jià)值的信息是研究的重點(diǎn)。如何將大數(shù)據(jù)技術(shù)應(yīng)用于大數(shù)據(jù)時(shí)代的數(shù)據(jù)庫,為用戶提供更滿意的服務(wù)已成為圖書館面臨的首要問題。本文探討如何將大數(shù)據(jù)技術(shù)整合到數(shù)字圖書館信息服務(wù)中,為用戶提供更加滿意的個(gè)性化信息服務(wù)。

一、數(shù)字圖書館信息服務(wù)體系

1)數(shù)字圖書館信息服務(wù)的概述。什么是數(shù)字圖書館信息服務(wù)?數(shù)字圖書館信息服務(wù)是搜索,收集,組織,查詢和傳播信息和資源,以獲取各種所需信息,并生成各種多媒體資料,如數(shù)據(jù)庫,因特網(wǎng)和電子版本。信息收集和整合活動(dòng)中,用戶可以獲得兩篇或全部文獻(xiàn)。

2)數(shù)字圖書館信息服務(wù)的模式。數(shù)字圖書館主要將圖書館的圖書轉(zhuǎn)換為電子數(shù)據(jù)并提供圖書檢索服務(wù)?,F(xiàn)在,每個(gè)圖書館都可以建立一個(gè)圖書館。來自不同地區(qū)不同國家的圖書館可以共同建立圖書館。這兩種方法的實(shí)質(zhì)是通過數(shù)據(jù)集的信息共享來共享圖書館資源。針對(duì)以上兩種不同的數(shù)字圖書館建設(shè)和信息服務(wù)方式,數(shù)字圖書館管理模式可分為單一數(shù)字圖書館服務(wù)模式和多種數(shù)字圖書館聯(lián)合服務(wù)模式。

3)基于大數(shù)據(jù)的數(shù)字圖書館信息服務(wù)內(nèi)容。資源發(fā)現(xiàn)的目標(biāo)是找到更多滿足用戶需求的數(shù)字信息資源。在大數(shù)據(jù)環(huán)境下,通過大量技術(shù)提供用戶對(duì)海量數(shù)字資源滿意的數(shù)字信息資源。資源發(fā)現(xiàn)的內(nèi)容是圖書館信息資源和用戶信息資源的數(shù)字化收集。在大數(shù)據(jù)背景下,數(shù)字圖書館不僅可以提供單一的信息資源集合(包括文獻(xiàn)數(shù)字資源,圖書數(shù)字資源和視聽數(shù)字資源),還可以提供用戶信息資源(包括用戶行為信息資源用戶需要信息資源)。資源發(fā)現(xiàn)的方法根據(jù)發(fā)現(xiàn)的內(nèi)容而變化。用戶行為發(fā)現(xiàn)和用戶信息需求是信息資源發(fā)現(xiàn)的兩個(gè)主要方面。結(jié)果的差異是不同的。當(dāng)然,發(fā)現(xiàn)的模式是不一樣的。用戶的行為通過各種網(wǎng)站的注冊(cè)信息,雨用戶的實(shí)時(shí)通信以及各種在線問卷調(diào)查發(fā)現(xiàn)。對(duì)用戶信息需求的調(diào)查包括元數(shù)據(jù)存儲(chǔ)資源的發(fā)現(xiàn),基于用戶數(shù)據(jù)挖掘和分析的數(shù)字資源的發(fā)現(xiàn)以及基于大數(shù)據(jù)決策的信息資源的發(fā)現(xiàn)。這些是發(fā)現(xiàn)用戶信息的模式并被廣泛使用。

二、 基于大數(shù)據(jù)的數(shù)字圖書館信息存儲(chǔ)

在大數(shù)據(jù)時(shí)代,數(shù)字信息的容量呈指數(shù)級(jí)增長(zhǎng)。存儲(chǔ)的信息不再是簡(jiǎn)單書目等基本信息,而是文獻(xiàn)的一些內(nèi)部?jī)?nèi)容。數(shù)據(jù)量從MB增加到TB,甚至到PB的水平。對(duì)于數(shù)字圖書館如此龐大的數(shù)據(jù)量,如果能夠高效準(zhǔn)確地獲取必要的數(shù)據(jù)資源,數(shù)字圖書館在大數(shù)據(jù)時(shí)代就必須解決這個(gè)問題。目前,現(xiàn)有文件存儲(chǔ)系統(tǒng)的文件存儲(chǔ)方法和檢索方法尚未能適應(yīng)如此龐大的數(shù)據(jù)管理要求。同時(shí),在大數(shù)據(jù)時(shí)代,數(shù)字圖書館除了存儲(chǔ)圖書館藏書和資源信息外,還需要存儲(chǔ)大量的用戶個(gè)人行為信息以滿足用戶的特定需求。這也涉及數(shù)據(jù)結(jié)構(gòu)問題和大數(shù)據(jù)時(shí)代的數(shù)據(jù)。該結(jié)構(gòu)呈現(xiàn)出多維趨勢(shì),可分為結(jié)構(gòu)化數(shù)據(jù),半結(jié)構(gòu)化數(shù)據(jù)和不同結(jié)構(gòu)的非結(jié)構(gòu)化數(shù)據(jù)。如果解決了不同結(jié)構(gòu)數(shù)據(jù)的合理存儲(chǔ),融合,分析和處理,圖書館在大數(shù)據(jù)時(shí)代需要解決的一個(gè)亟待解決的問題。有相關(guān)技術(shù)可以解決上述問題,包括Map Reduce技術(shù),Hadoop技術(shù),No SQL和云計(jì)算。

基于大數(shù)據(jù)的數(shù)字圖書館信息資源組織。數(shù)字圖書館作為一個(gè)可復(fù)用提供檢索服務(wù)的龐大信息管理系統(tǒng),它是大規(guī)模、分布式、有組織的和具有資源共享的數(shù)據(jù)庫和知識(shí)庫的集合體。對(duì)于用戶而言,其并不關(guān)心數(shù)字圖書館中數(shù)字資源的具體存在形式,其只關(guān)心獲取的信息是否滿足自己的檢索需要。為了實(shí)現(xiàn)用戶需求和檢索結(jié)果匹配的精確性,就需要兩者之間具有某種“默契”。一致性匹配方式是在數(shù)字圖書館中,為了更好的為用戶提供信息服務(wù),就需要首先針對(duì)數(shù)字圖書館的館藏資源進(jìn)行科學(xué)準(zhǔn)確合理的描述和組織,進(jìn)而形成一致的、充分的、有效的、有序的和準(zhǔn)確的組織信息,并且為用戶提供可檢索和可操作的交互接口,最終實(shí)現(xiàn)對(duì)數(shù)字圖書館數(shù)字資源充分利用的效果。同時(shí)在大數(shù)據(jù)環(huán)境下,數(shù)字圖書館的信息資源表現(xiàn)為數(shù)量大、結(jié)構(gòu)形式多樣化和數(shù)據(jù)存儲(chǔ)分布化的特點(diǎn),在這種環(huán)境下,對(duì)數(shù)字圖書館的數(shù)字資源進(jìn)行一致化資源組織就尤為重要,大數(shù)據(jù)信息資源的組織流程圖。

三、基于大數(shù)據(jù)的數(shù)字圖書館的信息檢索

隨著大數(shù)據(jù)的出現(xiàn),數(shù)字圖書館主要為用戶提供圖書搜索服務(wù)。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)更新更快。如果這些更改的數(shù)據(jù)處理得很快,則會(huì)向用戶提供最新信息。檢索信息是基于大數(shù)據(jù)的數(shù)字圖書館信息檢索的難點(diǎn)和重點(diǎn)。

在大數(shù)據(jù)環(huán)境下,數(shù)字圖書館服務(wù)的核心是用戶,需要為用戶提供個(gè)性化的信息檢索服務(wù)。在大數(shù)據(jù)背景下,數(shù)字圖書館的檢索功能主要表現(xiàn)在以下幾個(gè)方面:。

1)個(gè)性化搜索。數(shù)字圖書館信息檢索基于對(duì)用戶信息收集的分析。用戶信息不僅包括用戶的個(gè)人信息,還包括用戶過去的行為信息。通過對(duì)用戶信息的數(shù)據(jù)挖掘,可以準(zhǔn)確定位用戶的實(shí)際信息需求,并且借助現(xiàn)有的信息推送技術(shù),用戶可以推送所需的信息。同時(shí),數(shù)字圖書館的搜索引擎應(yīng)具備一定的智能性。根據(jù)用戶輸入的搜索關(guān)鍵詞,通過智能分析,可以為用戶提供按關(guān)聯(lián)度排列的搜索結(jié)果,并在保證信息檢索準(zhǔn)確性的前提下改善信息。準(zhǔn)確率。

2)實(shí)時(shí)優(yōu)化需求。在大數(shù)據(jù)的背景下,數(shù)據(jù)以多維,海量化和其他特征呈現(xiàn),而數(shù)字圖書館必須提供高檢索率,而數(shù)字圖書館中的大量數(shù)據(jù)表示結(jié)構(gòu)包括結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),到今天為止,數(shù)字圖書館中的非結(jié)構(gòu)化數(shù)據(jù)的比例越來越大,大大提高了數(shù)據(jù)更新的速度。鑒于上述情況,圖書館應(yīng)根據(jù)用戶搜索要求和數(shù)據(jù)環(huán)境變化的變化,實(shí)時(shí)優(yōu)化搜索引擎。

3)移動(dòng)性需求。隨著信息技術(shù)的發(fā)展,用戶獲取信息的方式也呈現(xiàn)出多樣化的趨勢(shì)。用戶對(duì)數(shù)據(jù)采集的期望不受時(shí)間,空間和方法的限制。為了滿足用戶的實(shí)際需要,同時(shí)針對(duì)移動(dòng)智能終端的特點(diǎn),數(shù)字圖書館應(yīng)該能夠?yàn)橐苿?dòng)終端提供數(shù)據(jù)檢索服務(wù)。

4)智能化需求。在大數(shù)據(jù)時(shí)代,數(shù)字圖書館數(shù)據(jù)檢索服務(wù)需要能夠準(zhǔn)確定位實(shí)際的信息檢索需求,并能夠快速選擇信息檢索策略,并將檢索結(jié)果快速返回給用戶。這需要大數(shù)據(jù)時(shí)代。圖書館搜索引擎是智能的。首先,數(shù)字圖書館的搜索引擎應(yīng)該具備“機(jī)器學(xué)習(xí)”的智能功能。其次,搜索引擎應(yīng)該能夠通過“機(jī)器學(xué)習(xí)”過程為用戶提供多樣化的數(shù)據(jù)檢索服務(wù);最后,搜索引擎應(yīng)該有實(shí)時(shí)更新。。

4 結(jié)束語

近年來,隨著信息技術(shù)的飛速發(fā)展,數(shù)字圖書館的數(shù)據(jù)量急劇增加,數(shù)據(jù)的存儲(chǔ)成本和處理成本大大降低,數(shù)據(jù)挖掘技術(shù)迅速發(fā)展。面對(duì)這一現(xiàn)實(shí),如何正確面對(duì)信息時(shí)代的“熱門話題”不能簡(jiǎn)單地得到尊重,反而需要“安靜的思考”,準(zhǔn)確地分析其利弊。引入大數(shù)據(jù)不僅是一個(gè)巨大的機(jī)會(huì),它可能是一個(gè)巨大的挑戰(zhàn)??梢哉f,大數(shù)據(jù)時(shí)代極大地提高了人們對(duì)數(shù)據(jù)的控制能力,同時(shí)也為海量數(shù)據(jù)的處理提供了新的方法和策略。到目前為止,大數(shù)據(jù)淹沒了人們的日常生活。針對(duì)這一現(xiàn)實(shí),圖書館如何正確合理地利用大數(shù)據(jù)技術(shù)改變圖書館原有的信息服務(wù)模式,為用戶提供更好的信息檢索服務(wù),是圖書館未來的主要研究方向。

參考文獻(xiàn)

[1]李廣建,楊林.大數(shù)據(jù)視角下的情報(bào)研究與情報(bào)研究技術(shù)[J].圖書與情報(bào),2012(06):1-8.

[2]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報(bào),2012(05):37-40.

[3]楊海燕.大數(shù)據(jù)時(shí)代的圖書館服務(wù)淺析[J].圖書與情報(bào),2012(04):120-122.

作者簡(jiǎn)介

楊曉燕(1990-),女,漢族,內(nèi)蒙古包頭市人,內(nèi)蒙古農(nóng)業(yè)大學(xué)職業(yè)技術(shù)學(xué)院圖書館,碩士研究生,助理館員,研究方向:云計(jì)算與大數(shù)據(jù)分析、數(shù)據(jù)挖掘

猜你喜歡
數(shù)字圖書館大數(shù)據(jù)
淺析“互聯(lián)網(wǎng)+”時(shí)代的圖書館管理
大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路