国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)時代與大學(xué)圖書館服務(wù)

2016-06-29 03:14王銀艷
中國現(xiàn)代教育裝備 2016年11期
關(guān)鍵詞:大數(shù)據(jù)數(shù)據(jù)庫

唐 玲 王銀艷

荊楚理工學(xué)院圖書館 湖北荊門 448000

?

大數(shù)據(jù)時代與大學(xué)圖書館服務(wù)

唐 玲 王銀艷

荊楚理工學(xué)院圖書館 湖北荊門 448000

摘 要:通過對大數(shù)據(jù)的概念和特點的分析,概括了大數(shù)據(jù)形成的三個階段,說明了大學(xué)圖書館應(yīng)積極應(yīng)對大數(shù)據(jù)時代的到來,從而更好地利用大數(shù)據(jù)為大學(xué)圖書館服務(wù)。

關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)庫;大學(xué)圖書館服務(wù)

隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的不斷發(fā)展,各種智能設(shè)備,移動終端如個人電腦、ultramobile與手機(jī)終端的廣泛應(yīng)用,地球上每時每刻都在自動產(chǎn)生數(shù)以億萬計的數(shù)據(jù),這些數(shù)據(jù)超越了時空的限制,以結(jié)構(gòu)化、半結(jié)構(gòu)化、異構(gòu)化的形式存在這些海量的數(shù)據(jù)通過數(shù)據(jù)的集成、存取、分析,能為社會生活的方方面面提供有價值的情報,據(jù)此做出正確的判斷和決策,其準(zhǔn)確度達(dá)93%,正因為這樣,許多發(fā)達(dá)國家如美國、英國紛紛斥巨資對大數(shù)據(jù)進(jìn)行研究,美國率先將大數(shù)據(jù)上升到國家戰(zhàn)略高度,2012年3月29日奧巴馬政府在白宮網(wǎng)站發(fā)布了《大數(shù)據(jù)研究和發(fā)展倡議》,旨在提升利用大量復(fù)雜數(shù)據(jù)集合獲取知識和洞見的能力,并為此投入兩億美元以上的資金[1]。未來大數(shù)據(jù)將像黃金和石油一樣,成為人類發(fā)展的一種新資源被人們所重視,誰擁有了大數(shù)據(jù),誰就占領(lǐng)了信息服務(wù)的制高點,大數(shù)據(jù)時代必將成為繼信息技術(shù)革命之后第三次技術(shù)革命的浪潮,而每一次技術(shù)革命都給圖書館的發(fā)展帶來深刻的變化。

1 大數(shù)據(jù)的概念、形成及應(yīng)用

大數(shù)據(jù)單從字面上分析它是大規(guī)模的數(shù)據(jù)集,但它又不僅僅是一個簡單的數(shù)量概念[2]。維克多·邁爾·舍恩伯格在《大數(shù)據(jù)時代》一書中明確指出:大數(shù)據(jù)時代最大的轉(zhuǎn)變就是放棄對因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是只需知道“是什么”,而不需要知道“為什么”,它顛覆了人類以前的慣性思維。大數(shù)據(jù)的特點表現(xiàn)在四個方面:即4V說:Volume(規(guī)模性),Variety(多樣性)和Velocity(高速性)以及Value(價值性)。大數(shù)據(jù)的核心就是它的預(yù)測性。

1.1 從傳統(tǒng)數(shù)據(jù)庫到大數(shù)據(jù)

傳統(tǒng)的數(shù)據(jù)庫是先有模式,然后才有數(shù)據(jù),而且數(shù)據(jù)的形式是一種結(jié)構(gòu)性的,其特征是由元數(shù)據(jù)和對象數(shù)據(jù)構(gòu)成,用SQL語言進(jìn)行查詢,有固定的結(jié)構(gòu)和格式,便于整理,技術(shù)運用已經(jīng)非常成熟。通過二維表結(jié)構(gòu)來邏輯表達(dá)數(shù)據(jù),多產(chǎn)生于服務(wù)器或者個人電腦,設(shè)備相對固定,比如圖書館的數(shù)字資源,超星數(shù)字圖書館,維普數(shù)據(jù)庫等。而大數(shù)據(jù)是很多難以確定的、數(shù)量繁多,復(fù)雜的數(shù)據(jù),是以移動終端如手機(jī)、平板電腦,GPS等設(shè)備為代表的結(jié)構(gòu)性、半結(jié)構(gòu)性、異構(gòu)性的數(shù)據(jù),是在數(shù)據(jù)出現(xiàn)之后,再去找尋解決問題的模式,同時這種模式又是在不斷演進(jìn)地動態(tài)之中。數(shù)據(jù)庫里的數(shù)據(jù)通常以MB為基本單位,而大數(shù)據(jù)則常常以GB,甚至是TB,PB(1 GB=1 024 MB,1 PB=1 000 TB)為基本單位,其數(shù)據(jù)規(guī)模遠(yuǎn)遠(yuǎn)大于傳統(tǒng)數(shù)據(jù)庫,就好像一個池塘與大海的關(guān)系。在處理對象上,傳統(tǒng)數(shù)據(jù)庫是以數(shù)據(jù)為對象,而大數(shù)據(jù)是將數(shù)據(jù)作為一種資源來輔助解決諸多領(lǐng)域的問題,也就是人們常說的數(shù)據(jù)思維。數(shù)據(jù)不再是處理對象,而是將數(shù)據(jù)作為一種資源來協(xié)同解決諸多領(lǐng)域的問題,通過收集、整理和分析數(shù)據(jù)足跡,以便對社會各行各業(yè)的活動和決策進(jìn)行解釋、監(jiān)控、預(yù)測和規(guī)劃[3]。單個的數(shù)據(jù)可能發(fā)現(xiàn)不了事物的真實狀況,但很多個數(shù)據(jù)集串聯(lián)起來就能夠發(fā)現(xiàn)問題,從而解決問題,比如證監(jiān)會利用大數(shù)據(jù)發(fā)現(xiàn)股市老鼠倉的事件,比如企業(yè)利用大數(shù)據(jù)分析實現(xiàn)對采購和合理庫存量的管理,了解客戶的需求、掌握市場動向,避免因為盲目進(jìn)貨而導(dǎo)致的庫存帶來的損失。氣象部門通過多年的氣象資料和當(dāng)時當(dāng)?shù)卮髿馕锢頎顩r指導(dǎo)農(nóng)業(yè)生產(chǎn)和人們的出行。國家安全部門通過人們一些行為來分析判斷危害公共安全的隱患等等。

1.2 大數(shù)據(jù)的形成及應(yīng)用

人類歷史上沒有哪個時期像現(xiàn)在這樣如此迅速地產(chǎn)生海量的數(shù)據(jù)。移動互聯(lián)網(wǎng)的加速發(fā)展,使得地球上每時每刻產(chǎn)生數(shù)以億萬計的數(shù)據(jù),有資料顯示,1998年全球網(wǎng)民月平均使用流量是1 MB,2000年是10 MB,2003年是100 MB,2008年是1 GB,2014年是10 GB,全網(wǎng)流量累計達(dá)到1 EB(1 EB=10億GB)在2001年是一年,2004年是一個月,2007年是一周,2013年僅需一天。我國是世界上網(wǎng)民最多的國家,信息量呈爆炸式的增長,正在超出人們的想象爆發(fā),如何快速高效利用大數(shù)據(jù)為人類的各行各業(yè)服務(wù),就必須了解大數(shù)據(jù)形成的原因及背景,尋求解決大數(shù)據(jù)利用的模式和技術(shù)難題。大數(shù)據(jù)的產(chǎn)生及形成經(jīng)歷了三個階段:第一階段是以數(shù)據(jù)庫的管理形式的運營式系統(tǒng)階段,它將數(shù)據(jù)的管理變得簡單易行,數(shù)據(jù)的產(chǎn)生方式是被動的,比如醫(yī)院每個病人的病歷記載數(shù)據(jù),每個商店每條銷售記錄,每所學(xué)校每個學(xué)生的學(xué)業(yè)檔案等,都是通過人們記載而產(chǎn)生的數(shù)據(jù)。第二階段是互聯(lián)網(wǎng)的誕生,特別是Web2.0時代為標(biāo)志的主動創(chuàng)作型系統(tǒng)階段,人們通過微博、博客記錄著自己的隨想、隨行在互聯(lián)網(wǎng)上傳播,這種原創(chuàng)的、主動型的數(shù)據(jù)在網(wǎng)上源源不斷地產(chǎn)生,在移動網(wǎng)絡(luò)、智能手機(jī)等新型設(shè)備的出現(xiàn)之后,使得人們可以隨時隨地發(fā)表自己的意見。第三個階段是感知式的系統(tǒng)階段,這個階段是以智能傳感器、物聯(lián)網(wǎng)為代表的自動數(shù)據(jù)產(chǎn)生階段。遍布城市各個角落的攝像設(shè)備,對整個社會的運轉(zhuǎn)進(jìn)行監(jiān)控,這些設(shè)備產(chǎn)生的數(shù)據(jù)是自動的,人們在網(wǎng)絡(luò)瀏覽的足跡等,也是產(chǎn)生大數(shù)據(jù)的根本原因。也就是說大數(shù)據(jù)的產(chǎn)生經(jīng)歷了被動、主動和自動三個階段,這些被動、主動和自動的數(shù)據(jù)共同構(gòu)成了大數(shù)據(jù)的數(shù)據(jù)來源,其中自動式的數(shù)據(jù)才是大數(shù)據(jù)產(chǎn)生的根本原因。這種規(guī)模性和多樣性的數(shù)據(jù)又給技術(shù)的管理和應(yīng)用帶來挑戰(zhàn)和機(jī)遇。

2 大數(shù)據(jù)時代特點

在大數(shù)據(jù)時代,數(shù)據(jù)生成、存儲、分析、檢索、分享、消費共同構(gòu)成了大數(shù)據(jù)的生態(tài)系統(tǒng)[4]。任何公司和個人都不可能解決大數(shù)據(jù)運用的全部問題,因此數(shù)據(jù)的采集、分析、存儲、利用必然出現(xiàn)分工和協(xié)作。

2.1 大數(shù)據(jù)時代的分工協(xié)作

數(shù)據(jù)形成的每個過程都有不同的部門和機(jī)構(gòu)來完成。數(shù)據(jù)的采集是由無數(shù)的個人、傳感器和攝像頭主動或被動形成,這些數(shù)據(jù)又通過云計算平臺進(jìn)行存儲計算。數(shù)據(jù)中心通過PaaS(平臺即服務(wù))模式為數(shù)據(jù)服務(wù)商提供數(shù)據(jù)接口,而數(shù)據(jù)服務(wù)商組織專業(yè)的技術(shù)人員開發(fā)各種軟件,提供解決數(shù)據(jù)分析的服務(wù)模式,并通過云計算SaaS(軟件即服務(wù))模式為用戶提供服務(wù),企業(yè)和個人可以根據(jù)自己的需要定制各種服務(wù),獲得自己所需要的答案,而不必去問詢產(chǎn)生這種服務(wù)的各個過程。整個大數(shù)據(jù)的處理流程可以定義為在合適工具的輔導(dǎo)下,對廣泛異構(gòu)的數(shù)據(jù)源進(jìn)行抽取和集成,結(jié)果按照一定的標(biāo)準(zhǔn)統(tǒng)一存儲。利用合適的數(shù)據(jù)分析技術(shù)對存儲的數(shù)據(jù)進(jìn)行分析,從中提取有益的知識并利用恰當(dāng)?shù)姆绞饺缈梢暬夹g(shù)將結(jié)果展現(xiàn)給終端用戶。

2.2 數(shù)據(jù)交換和共享成為主流

數(shù)據(jù)的價值在于利用,而這種利用又不是孤立的,而是相互聯(lián)系形成一個龐大的網(wǎng)絡(luò)系統(tǒng)。孤立的數(shù)據(jù)價值必然是1+1<2,而聯(lián)通的數(shù)據(jù)價值一定是1+1>2[5],數(shù)據(jù)的交換和共享成為必然趨勢,任何個人和組織都不能將數(shù)據(jù)據(jù)為己有,而開放的數(shù)據(jù)意味著個人隱私的暴露,但這種損失顯然小于開放帶來的價值,因此許多國家紛紛制定了數(shù)據(jù)開放服務(wù)的規(guī)則和規(guī)定。美國規(guī)定政府必須向民眾開放數(shù)據(jù),并通過Data.gov網(wǎng)站向民眾提供數(shù)據(jù)服務(wù),英國除了規(guī)定向民眾開放數(shù)據(jù)外,還鼓勵“私人數(shù)據(jù)商業(yè)化”,將數(shù)據(jù)像商品和資源一樣出售。

2.3 專業(yè)化的數(shù)據(jù)服務(wù)公司不斷涌現(xiàn)

大數(shù)據(jù)的產(chǎn)生和發(fā)展是建立在互聯(lián)網(wǎng)和物聯(lián)網(wǎng)快速發(fā)展基礎(chǔ)上的,大數(shù)據(jù)催生出大量的創(chuàng)新產(chǎn)業(yè),相關(guān)機(jī)構(gòu)不斷涌現(xiàn)。以提供軟硬件服務(wù)的系統(tǒng)開發(fā)商,如英特爾、IBM公司,以硬件+數(shù)據(jù)+軟件提供整體服務(wù)供應(yīng)商,如IBM、微軟、惠普等大企業(yè),還有的數(shù)據(jù)服務(wù)企業(yè)以直接和間接的數(shù)據(jù)提供給企業(yè)或個人來獲取一定的商業(yè)價值,如國外的Facebook,Twitter等,目前,大數(shù)據(jù)的搜索服務(wù)、數(shù)據(jù)庫、服務(wù)器、數(shù)據(jù)存儲、數(shù)據(jù)挖掘等核心技術(shù)都被國外的IT巨頭所壟斷,我國的大數(shù)據(jù)布局遠(yuǎn)遠(yuǎn)落后于國外的大公司,目前主要以互聯(lián)網(wǎng)應(yīng)用服務(wù)為主,如阿里云、騰訊、百度等云計算平臺。

3 大數(shù)據(jù)時代大學(xué)圖書館的功能與作用

在如火如荼的大數(shù)據(jù)時代,人們總是想用最經(jīng)濟(jì)的方式獲取及時有價值的信息。具體來說,就是人們想在任何時候、任何地方都可以得到全面的、互動的、個性化的,有助于決策的信息服務(wù)。圖書館作為保存人類文化知識的地方,一直承擔(dān)著傳遞信息和知識的作用。在人類從IT到DT的時代,迅速調(diào)整自己的位置,順應(yīng)時代的發(fā)展,努力從人才培養(yǎng)、信息檢索、知識信息的搜集整理方面做好準(zhǔn)備,圖書館和圖書館管理人員理應(yīng)成為大數(shù)據(jù)時代人們獲取有用信息的重要場所和運用大數(shù)據(jù)的重要幫手,只有這樣才能讓圖書館立于不敗之地。下圖是武漢大學(xué)陳傳夫教授在2012年東莞圖書館年會上展示了大數(shù)據(jù)時代數(shù)字圖書館體系結(jié)構(gòu)圖,介紹了大數(shù)據(jù)對數(shù)字圖書館結(jié)構(gòu)的改變。

大數(shù)據(jù)時代數(shù)字圖書館體系結(jié)構(gòu)圖

3.1 大學(xué)圖書館建成全院信息資料庫

大數(shù)據(jù)時代分工協(xié)作的特點顯示,任何一個公司不可能完成所有數(shù)據(jù)存儲、分類、檢索、清洗、應(yīng)用技術(shù)等各項工作,因此高校圖書館要成為一所院校的信息集散地。高校圖書館一直都是為高校的教學(xué)和科研服務(wù),隨著互聯(lián)網(wǎng)的廣泛應(yīng)用,特別是移動互聯(lián)網(wǎng)和智能手機(jī)的出現(xiàn),人們對圖書館紙質(zhì)圖書的依賴性越來越小,從全國各高校圖書借閱率下降情況可以看出,隨著公共數(shù)據(jù)的開放程度越來越大,人們隨時隨地的可以從互聯(lián)網(wǎng)上下載閱讀,能夠不受時間地點的限制,就能夠方便地獲取知識。但這并不能說圖書館就此消亡,圖書館也有自己的專業(yè)優(yōu)勢,可以在情報信息收集、整理、檢索上下功夫,成為數(shù)據(jù)專家的得力助手,建立本地化數(shù)據(jù),這是別的單位和個人無法取代的,一方面廣泛采集本學(xué)院在科研實驗中的各種數(shù)據(jù)加以保存,這是科學(xué)研究的最寶貴的第一手資料。另一方面收集全院所有學(xué)生的個人信息,包括專業(yè)設(shè)置、學(xué)業(yè)狀況、就業(yè)意向,作為人才儲備庫加以保存,為社會對人才的需求提供可靠的數(shù)據(jù),將學(xué)校與社會對接,通過數(shù)據(jù)的相互交換達(dá)到人才培養(yǎng)的優(yōu)化組合,這也是大數(shù)據(jù)的專業(yè)分工所賦予的責(zé)任和義務(wù)。

3.2 培訓(xùn)數(shù)據(jù)整理和保管人員,成為咨詢能手

一直以來,圖書館的服務(wù)都是以提供一種結(jié)構(gòu)化的數(shù)據(jù)為主,比如圖書館書目數(shù)據(jù)的查詢、參考咨詢服務(wù)、圖書文獻(xiàn)的深加工以及各種科研課題的定題服務(wù)等,但在大數(shù)據(jù)時代,數(shù)據(jù)的產(chǎn)生是一個動態(tài)的過程,這就為圖書館的服務(wù)提供了挑戰(zhàn)和機(jī)遇,人們處于源源不斷的數(shù)據(jù)流之中,如何幫助人們獲取準(zhǔn)確的信息,即“是什么”,而不是“為什么”,就是目前國外提出的數(shù)據(jù)策管課題之一,即數(shù)據(jù)的保存和監(jiān)管,是一項有策劃和策略的管理,是對系統(tǒng)數(shù)字進(jìn)行選擇、保存、維護(hù)和歸檔等一系列管理活動[6]。早在2008年Uribe和Macdonald就提出數(shù)據(jù)監(jiān)管將得益于圖書館員傳統(tǒng)的索引、編目和其他信息組織技術(shù)。而Lyon在2007年所提出的大學(xué)圖書館員或?qū)W科館員是承擔(dān)數(shù)據(jù)監(jiān)護(hù)任務(wù)的理想人選的觀點也得到了業(yè)內(nèi)廣泛的認(rèn)同,而現(xiàn)有大多數(shù)圖書館管理人員顯然不具備這方面的能力,需要大力培訓(xùn)這方面的管理和運用人才,圖書館人就必須在大數(shù)據(jù)時代早做準(zhǔn)備,在國外,許多大學(xué)開設(shè)了相應(yīng)的管理與培訓(xùn)課程。在國內(nèi)有條件的大學(xué)也在從事這方面的教學(xué)和培訓(xùn)工作,只有這樣我們才能在大數(shù)據(jù)時代變革中不至于驚慌失措,無所適從。

3.3 為讀者進(jìn)行準(zhǔn)確的信息推送和提供個性化的服務(wù)

大數(shù)據(jù)應(yīng)重點關(guān)注讀者個性化閱讀需求,為讀者提供具有較高精細(xì)度和精確度的個性化服務(wù)[7]。為讀者進(jìn)行精準(zhǔn)的信息推送和個性化的服務(wù),就必須先了解讀者的閱讀行為,明確用戶的閱讀需求和閱讀習(xí)慣。圖書館可以通過大數(shù)據(jù)中讀者瀏覽足跡,例如瀏覽的網(wǎng)頁和查閱的資料等各類行為,可以細(xì)化到一篇文章、一個詞,將讀者的微行為匯集到數(shù)據(jù)庫,然后根據(jù)不同人群的興趣愛好分層次的準(zhǔn)確推送,還可以根據(jù)大數(shù)據(jù)匯制讀者閱讀興趣愛好圖,預(yù)測讀者閱讀需求表,從而為信息資源建設(shè)提供準(zhǔn)確而可靠的依據(jù),最終達(dá)到真正意義上為讀者的需求服務(wù),大大提高圖書館的社會效益。

隨著大數(shù)據(jù)信息時代的到來,圖書館也迎來了大服務(wù)時代的到來,圖書館人必須緊跟時代的步伐,全面掌握了解大數(shù)據(jù)基本技術(shù)和原理,努力提高自己的專業(yè)能力和水平,樹立以讀者個性化服務(wù)和用戶滿意度核心價值觀,真正意義上實現(xiàn)以人為本的圖書館服務(wù)理念。

參考文獻(xiàn)

[1]王忠.美國推動大數(shù)據(jù)技術(shù)發(fā)展的戰(zhàn)略價值及啟示[J].中國發(fā)展觀察,2012(6):44-45.

[2]李廣建,楊林.大數(shù)據(jù)視角下的情報研究與情報研究技術(shù)[J].圖書與情報,2012(6):1-8.

[3]孟小鋒,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計算機(jī)研究與發(fā)展,2013,50(1):146-169.

[4]薛紅吉.發(fā)展大數(shù)據(jù)產(chǎn)業(yè):我國能否搶占先機(jī)?[EB/OL].[2013-03-26].http://www.china-cloud.com/plus/view.php?aid=17842.

[5]鐘輝新.大數(shù)據(jù)時代信息服務(wù)的發(fā)展走向以及高校圖書館應(yīng)對策略[EB/OL].http://www.cnki.net?1994-2014china Academic Journal Electronic Publishing House.All rights reserved.

[6]張曉林,張冬榮.機(jī)構(gòu)知識庫內(nèi)容保存與傳播的權(quán)利管理[J/ OL].中國圖書館學(xué)報,2013-04-26.

[7]馬曉亭.大數(shù)據(jù)時代圖書館數(shù)據(jù)可用性:價值、挑戰(zhàn)和保障[J].圖書館理論與實踐,2014(10):5-8.

The Big Data and University Library Services

Tang Ling, Wang Yinyan
Jingchu University of Technology, Jingmen, 448000, China

Abstract:This article generalizes the three periods of formation of big data through analysing comceptions and characteristic of it, which illustrates university libraries should reply the coming of big data actively to make better use of big data to serve university libraries.

Key words:big data; database; university library services

收稿日期:2015-12-24

作者簡介:唐玲,本科,館員。

猜你喜歡
大數(shù)據(jù)數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫