国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

淺析“大數(shù)據(jù)”對圖書館管理的影響

2014-04-10 20:45:46
關(guān)鍵詞:數(shù)據(jù)量結(jié)構(gòu)化大數(shù)據(jù)

(商丘醫(yī)學(xué)高等專科學(xué)校,河南 商丘 476000)

淺析“大數(shù)據(jù)”對圖書館管理的影響

楊春玲

(商丘醫(yī)學(xué)高等??茖W(xué)校,河南商丘476000)

隨著大數(shù)據(jù)時代的來臨,社會中的各類數(shù)據(jù)正以極快的速度增長,圖書館也不可避免地面臨著大數(shù)據(jù)信息浪潮的沖擊。大數(shù)據(jù)對圖書管理的影響主要包括:復(fù)雜數(shù)據(jù)計算能力、數(shù)據(jù)分析由傳統(tǒng)向深度挖掘帶來的挑戰(zhàn)及大數(shù)據(jù)時代對圖書館基礎(chǔ)設(shè)施的要求。未來圖書管理需從探索數(shù)據(jù)分析技術(shù)與工具、重視基礎(chǔ)設(shè)施建設(shè)和數(shù)據(jù)收集、提高圖書管理的智能化程度等幾個方面發(fā)展。

大數(shù)據(jù);結(jié)構(gòu)化;非結(jié)構(gòu)化;圖書館

“大數(shù)據(jù)(big data)”是非?!皶r髦”的概念,在維克托·邁爾·舍恩伯格及肯尼斯·庫克耶編寫的《大數(shù)據(jù)時代》中大數(shù)據(jù)是指不用隨機分析法(抽樣調(diào)查)這樣的捷徑,而采用所有數(shù)據(jù)的方法[1]39。我們通常所講的大數(shù)據(jù)指的是所涉及的數(shù)據(jù)規(guī)模巨大到無法通過目前日常所用的數(shù)據(jù)分析工具,在短時間形成可利用的有價值的信息數(shù)據(jù)。

“大數(shù)據(jù)”源于全球知名咨詢公司麥肯錫,之后逐步出現(xiàn)在各類媒體。真正風(fēng)靡全球,成為時代“寵兒”是在近幾年。隨著智能手機、互聯(lián)網(wǎng)的普及和wifi等無線技術(shù)廣泛應(yīng)用,社會中的數(shù)據(jù)量程幾何級增長,而伴隨著“云時代”的來臨,海量數(shù)據(jù)的計算和分析成為可能。所以,諸如IBM、oracle、惠普、騰訊、百度等一大批國內(nèi)外企業(yè)加入了大數(shù)據(jù)研究應(yīng)用的行列,通過收購與大數(shù)據(jù)相關(guān)的軟硬技術(shù)實現(xiàn)大數(shù)據(jù)的技術(shù)整合,力求在以云計算為基礎(chǔ)的大數(shù)據(jù)時代取得更加有利的競爭地位和競爭優(yōu)勢。

圖書館所在的知識服務(wù)領(lǐng)域也被迅速卷入大數(shù)據(jù)的浪潮中。由于知識傳播與利用形式的不斷變化,各種新技術(shù)機制在知識創(chuàng)造、組織、傳播、和應(yīng)用中扮演著愈加重要的角色[2]。本文主要探討在大數(shù)據(jù)背景下大數(shù)據(jù)的基本特征、給圖書館管理帶來的影響及解決的主要方式等。

一、大數(shù)據(jù)的基本特征

IT界通常用4V(即Volume、Variety、Value、Velocity)來概括大數(shù)據(jù)的特征,擁有這四種基本特征的數(shù)據(jù)可稱之為大數(shù)據(jù)。

(一)數(shù)量巨大(Volume)

截至2012年,數(shù)據(jù)量已經(jīng)從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。國際數(shù)據(jù)公司(IDC)的研究結(jié)果表明,2008年全球產(chǎn)生的數(shù)據(jù)量為0.49ZB,2009年的數(shù)據(jù)量為0.8ZB,2010年增長為1.2ZB,2011年的數(shù)量更是高達(dá)1.82ZB,相當(dāng)于全球每人產(chǎn)生200GB以上的數(shù)據(jù)。而到2012年為止,人類生產(chǎn)的所有印刷材料的數(shù)據(jù)量是200PB,全人類歷史上說過的所有話的數(shù)據(jù)量大約是5EB。IBM的研究稱,整個人類文明所獲得的全部數(shù)據(jù)中,有90%是過去兩年內(nèi)產(chǎn)生的。而到了2020年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍[3]。

(二)類型繁多(Variety)

數(shù)據(jù)通常被分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。相對于傳統(tǒng)的以文本為主的結(jié)構(gòu)化數(shù)據(jù),網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置信息等半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)越來越多。同時,近幾年出現(xiàn)的微博、微信等可通過移動互聯(lián)設(shè)備使用的電子交往形式使數(shù)據(jù)量和數(shù)據(jù)種類更加復(fù)雜化。

(三)價值不高(Value)

價值密度的高低與數(shù)據(jù)總量的大小成反比。以社會中常見的監(jiān)控錄像為例,一天的監(jiān)控記錄,有用數(shù)據(jù)可能僅有一二秒。如何將已有的結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行整合、分析,挖掘出更多有價值的信息,并通過強大的計算能力迅速地完成數(shù)據(jù)的價值“提純”成為目前大數(shù)據(jù)背景下亟待解決的難題。

(四)要求高速處理(Velocity)

這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征。根據(jù)IDC的“數(shù)字宇宙”的報告,預(yù)計到2020年,全球數(shù)據(jù)使用量將達(dá)到35.2ZB。在如此海量的數(shù)據(jù)面前,處理數(shù)據(jù)的效率就是生命。

二、圖書館大數(shù)據(jù)的主要來源分析

根據(jù)大數(shù)據(jù)的基本特征,經(jīng)筆者分析,圖書館知識服務(wù)領(lǐng)域的未來大數(shù)據(jù)的來源主要有RFID射頻數(shù)據(jù)、傳感器數(shù)據(jù)、社交網(wǎng)絡(luò)和移動互聯(lián)數(shù)據(jù)等幾個方面。隨著圖書館數(shù)字技術(shù)的不斷提高,RFID將不斷推廣,這將是未來圖書館大數(shù)據(jù)的主要來源之一;由圖書館中的傳感器感知生成的數(shù)據(jù),長時間積累后也將產(chǎn)生巨大的數(shù)據(jù)量;社交網(wǎng)絡(luò)已廣泛應(yīng)用于社會各個方面,逐步成為人們交往的主要形式,其所產(chǎn)生的數(shù)據(jù)量遠(yuǎn)超以往任何一個信息傳播媒介,由其生成的數(shù)據(jù)量是不可估量的;移動互聯(lián)網(wǎng)及移動互聯(lián)技術(shù)的不斷完善,使得圖書館可以靈活獲取移動電子設(shè)備、人員、資源、用戶行為和需求等信息,并對這些信息進(jìn)行實時分析,從而幫助我們開展有效的智能輔助決策[4]32-45。

三、大數(shù)據(jù)對圖書館管理的影響和挑戰(zhàn)

(一)海量數(shù)據(jù)處理考驗圖書館計算能力

大數(shù)據(jù)時代背景下,各類數(shù)據(jù)量迅速增長,數(shù)據(jù)產(chǎn)生的方式、范圍發(fā)生前所未有的變化,人們在社會中的各類行為都產(chǎn)生了大量的信息數(shù)據(jù),信息數(shù)據(jù)的組成結(jié)構(gòu)、格式類型、存在形態(tài)等都更加復(fù)雜。圖書館要對上述復(fù)雜的數(shù)據(jù)進(jìn)行應(yīng)用、存儲,將具有很強的挑戰(zhàn)性,不僅僅涉及云計算、大數(shù)量級數(shù)據(jù)存儲等技術(shù)問題,還可能促發(fā)圖書館服務(wù)模式、資源建設(shè)模式、管理模式與發(fā)展模式的轉(zhuǎn)變。

(二)數(shù)據(jù)分析方式轉(zhuǎn)變帶來的挑戰(zhàn)

隨著圖書館信息化程度的提高,以互聯(lián)網(wǎng)信息搜索、查詢?yōu)榛A(chǔ)的知識服務(wù)逐漸被更多的圖書館所采用。但不管是簡單的信息服務(wù),還是結(jié)合了信息檢索、組織、分析等高級業(yè)務(wù)服務(wù),都可歸納為就數(shù)據(jù)而進(jìn)行的服務(wù)。大數(shù)據(jù)時代背景下要求圖書館不僅需要通過結(jié)構(gòu)化數(shù)據(jù)了解客戶需求,也需要大量的非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)去挖掘、預(yù)測和分析當(dāng)前和未來的用戶需求,社會大眾的需求也將隨著不斷變化的個性化的高滿意度服務(wù)出現(xiàn)而對圖書館的服務(wù)呈現(xiàn)出明確和迫切的需求。滿足用戶的需求,提供復(fù)雜數(shù)據(jù)的處理也將成為大數(shù)據(jù)時代圖書館的發(fā)展方向,如何處理好數(shù)據(jù)分析,將直接影響圖書館的生存與發(fā)展。

(三)大數(shù)據(jù)對圖書館基礎(chǔ)設(shè)施提出更高的要求

半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)的迅速增加,導(dǎo)致數(shù)據(jù)存儲、計算規(guī)模越來越大,其成本急劇上升。很多知識服務(wù)機構(gòu)出于成本的考慮將應(yīng)用由高端服務(wù)器轉(zhuǎn)向中低端硬件構(gòu)成的大規(guī)模計算機集群[5]166-171,從而對支持非結(jié)構(gòu)化數(shù)據(jù)存儲及分析的基礎(chǔ)設(shè)施提出了很高的要求。

四、大數(shù)據(jù)時代圖書館管理發(fā)展方向

(一)探索利用數(shù)據(jù)分析技術(shù)與工具

對圖書館來說,在大數(shù)據(jù)時代要想在激烈的市場份額競爭中爭得一席之地,避免邊緣化,開展必要的大數(shù)據(jù)分析服務(wù)顯得必不可少。圖書館開展的大數(shù)據(jù)分析服務(wù)業(yè)務(wù),主要可以有以下幾種:首先是圖書館自身建設(shè)所需的大數(shù)據(jù)分析。這類分析一般以圖書館的現(xiàn)有數(shù)據(jù)為對象進(jìn)行分析,如讀者的借閱方式、行為愛好等,是一種對現(xiàn)有資源的分析與挖掘;其次是客戶即讀者所需的大數(shù)據(jù)分析。這類分析業(yè)務(wù)類似于當(dāng)今圖書館為企業(yè)等客戶群體所做的信息情報參考、競爭情報分析,但也有著很大的區(qū)別,如對于分析對象數(shù)據(jù)的不同、分析手段的不同、分析目的不同等,這類分析業(yè)務(wù)所依靠的大量數(shù)據(jù)可能并非圖書館所擁有,從而成為限制該項業(yè)務(wù)發(fā)展的瓶頸,如何解決此類服務(wù)的數(shù)據(jù)問題是突破該瓶頸的關(guān)鍵。麥肯錫發(fā)布的《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個前沿領(lǐng)域》報告中首次提出了“大數(shù)據(jù)”的概念,對大數(shù)據(jù)的分析技術(shù)與工具進(jìn)行了列舉,如目前已為廣大圖書情報研究者所熟知的聚類分析、數(shù)據(jù)挖掘、網(wǎng)絡(luò)分析、可視化分析、數(shù)據(jù)融合與數(shù)據(jù)集成等,特別是聚類分析、可視化分析與數(shù)據(jù)挖掘技術(shù)。但這些現(xiàn)有的研究目前僅僅只是針對結(jié)構(gòu)化數(shù)據(jù)和有限數(shù)量的關(guān)鍵詞進(jìn)行聚類分析、共現(xiàn)分析等,并不能真正挖掘大量負(fù)責(zé)數(shù)據(jù)的存在與表現(xiàn)形態(tài),更不能通過這些分析去預(yù)測未來的可能發(fā)展趨勢。當(dāng)然,大量網(wǎng)絡(luò)社交等信息行為產(chǎn)生的大量非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)也讓許多學(xué)者開始思考去采集和利用這些信息,如蘇玉照等人[6]66-70就認(rèn)為如果能夠采集到Web日志的數(shù)據(jù),就能很好地滿足發(fā)現(xiàn)關(guān)聯(lián)規(guī)則、內(nèi)容分類和用戶聚類的需求,從而能提高個性化推薦的精度,進(jìn)而對定制Web日志的數(shù)據(jù)模型、過程及方法進(jìn)行探索。

(二)重視基礎(chǔ)設(shè)施建設(shè)

大數(shù)據(jù)時代,圖書館的核心競爭力不再僅是文獻(xiàn)數(shù)據(jù)信息的競爭,各類形式的海量數(shù)據(jù)以及對海量數(shù)據(jù)的分析、挖掘才是今后圖書館之間競爭的核心因素。因此,要跟上大數(shù)據(jù)的腳步,必須完善信息收集的基礎(chǔ)設(shè)施建設(shè),加強各類信息資源的收集將成為圖書館資源建設(shè)的大方向。圖書館首先要明白“數(shù)據(jù)即生命”,解決數(shù)據(jù)存儲問題。大數(shù)據(jù)時代對于圖書館的數(shù)據(jù)存儲量要求極高。早在2007年,沃爾瑪就通過對消費者的購物行為等非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析,創(chuàng)造了“啤酒與尿布”的經(jīng)典商業(yè)案例[7]127。這樣的經(jīng)典案例是通過對海量的多類型數(shù)據(jù)收集和分析得到的。因此,圖書館要掌握讀者用戶、館員乃至社會服務(wù)群體等的信息,既要有當(dāng)前通用的數(shù)據(jù)記錄中的個人身份、借閱記錄等結(jié)構(gòu)化數(shù)據(jù),還要有存儲信息行為、搜索方式、行為痕跡等非傳統(tǒng)數(shù)據(jù),這些都需要通過基礎(chǔ)設(shè)施的建設(shè)來支持。除此之外,圖書館還必須解決數(shù)據(jù)計算和數(shù)據(jù)分析問題。要積極利用“云計算”技術(shù),搭建圖書館的云計算平臺,解決圖書館自身海量數(shù)據(jù)的存儲及運算能力與大數(shù)據(jù)對存儲能力的高要求之間的矛盾。

(三)提高圖書館服務(wù)的智能化程度

大數(shù)據(jù)背景下的圖書館服務(wù)的智能化程度也將達(dá)到一個新的高度。圖書館應(yīng)用智能化技術(shù)進(jìn)行自動的高級、復(fù)雜的數(shù)據(jù)收集及處理工作,既能在一定程度上節(jié)省大量的人力物力,也能解決人工可能無法實現(xiàn)的工作需求,如對海量信息數(shù)據(jù)的智能抓取、關(guān)鍵詞抽取等,使得節(jié)省下來的大量人力去研究圖書館建設(shè)的策略與更進(jìn)一步的智能化投入。其次,從讀者來看,服務(wù)內(nèi)容、手段的智能化程度提高與智能化技術(shù)、工具、平臺的服務(wù)實踐,所需的圖片、視頻、文本等信息將能輕易獲取,個體的信息如社交信息、生活數(shù)據(jù)等大量的非結(jié)構(gòu)、半結(jié)構(gòu)化數(shù)據(jù)也都能為圖書館的智能化決策提供分析參考。再次,從智能化服務(wù)中的知識流通來看,圖書館服務(wù)智能化程度的提高不但有利于知識從單個主體擁有向多個主體擁有的流通與傳播,更利于隱性知識向顯性知識的轉(zhuǎn)變,也有利于知識的發(fā)現(xiàn)、挖掘與組織[8]81。

[1] 維克托·邁爾·舍爾維恩,肯尼斯·庫克耶 .大數(shù)據(jù)時代[M].杭州:浙江人民出版社,2013.

[2] College of Nursing:Curriculum Support.http://www.a(chǎn)hsl.a(chǎn)rizona.edu/curriculum/nursing/.2011-10-17(04).

[3] 百度百科http://baike.baidu.com/view/9424571.htm.

[4] 覃雄派,王會舉,杜小勇,等.大數(shù)據(jù)分析——RDBMS與MapReduce的競爭與共生[J].軟件學(xué)報,2012,23(1).

[5] 張興旺,李晨暉,秦曉珠.構(gòu)建于廉價計算機集群上的云存儲的研究與初步實現(xiàn)[J].情報雜志,2011,30(11).

[6] 蘇玉照,牛曉太,趙 妍.提高個性化推薦精度的定制Web日志方法[J].圖書與情報,2011(5).

[7] 高 勇.啤酒與尿布:神奇的購物籃分析[M].北京:清華大學(xué)出版社,2008.

[8] 韓翠峰.大數(shù)據(jù)時代圖書館的服務(wù)創(chuàng)新與發(fā)展[J].圖書館,2013(1).

[責(zé)任編輯袁培堯]

2014-05-08

楊春玲(1969- ),女,河南商丘人,商丘醫(yī)學(xué)??茖W(xué)校圖書館館員, 主要從事數(shù)據(jù)管理研究。

G251.4

:A

:1671-8127(2014)06-0119-02

猜你喜歡
數(shù)據(jù)量結(jié)構(gòu)化大數(shù)據(jù)
基于大數(shù)據(jù)量的初至層析成像算法優(yōu)化
促進(jìn)知識結(jié)構(gòu)化的主題式復(fù)習(xí)初探
計算Lyapunov指數(shù)的模糊C均值聚類小數(shù)據(jù)量法
高刷新率不容易顯示器需求與接口標(biāo)準(zhǔn)帶寬
結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
計算機教育(2020年5期)2020-07-24 08:53:00
寬帶信號采集與大數(shù)據(jù)量傳輸系統(tǒng)設(shè)計與研究
電子制作(2019年13期)2020-01-14 03:15:18
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
計算機工程(2015年8期)2015-07-03 12:20:35
基于軟信息的結(jié)構(gòu)化轉(zhuǎn)換
正定县| 休宁县| 东乡县| 花莲市| 汽车| 崇仁县| 峨边| 略阳县| 鸡西市| 甘谷县| 金门县| 伊通| 林口县| 九寨沟县| 隆尧县| 钟山县| 蕲春县| 屏东县| 临漳县| 潜山县| 鹿邑县| 肇庆市| 宣威市| 波密县| 霞浦县| 靖江市| 桓台县| 辽源市| 兴和县| 武城县| 英超| 汤阴县| 岗巴县| 和平县| 南和县| 全南县| 北流市| 额尔古纳市| 任丘市| 莫力| 陇南市|