關(guān)鍵詞:大數(shù)據(jù);圖書館;云計(jì)算;數(shù)據(jù)挖掘;知識(shí)服務(wù)
摘要:文章闡述了大數(shù)據(jù)內(nèi)涵和特征,分析了大數(shù)據(jù)對(duì)圖書館事業(yè)及其構(gòu)成要素的影響,探討了圖書館如何通過(guò)資源、技術(shù)及人才建設(shè),重構(gòu)大數(shù)據(jù)時(shí)代圖書館知識(shí)咨詢服務(wù)模式。
中圖分類號(hào):G250文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-1588(2014)09-0122-03
作者簡(jiǎn)介:夏燕(1971-),江蘇城市職業(yè)學(xué)院圖書館館員。1大數(shù)據(jù)及其特征
據(jù)國(guó)際數(shù)據(jù)資訊公司(Global Pulse)估測(cè),全球數(shù)據(jù)數(shù)量以每年50%的速度增長(zhǎng),這既包括數(shù)據(jù)流的增長(zhǎng),也包括數(shù)據(jù)種類的增多。據(jù)統(tǒng)計(jì),全球企業(yè)和消費(fèi)者2010年在硬盤、PC和筆記本等設(shè)備上存儲(chǔ)了超過(guò)13EB的新數(shù)據(jù),而1EB數(shù)據(jù)就相當(dāng)于美國(guó)國(guó)會(huì)圖書館中存儲(chǔ)數(shù)據(jù)的4,000多倍。2012年,全球的數(shù)據(jù)總量為2.7ZB(1ZB相當(dāng)于10萬(wàn)億億字節(jié))。預(yù)計(jì)到2020年,全球產(chǎn)生的數(shù)據(jù)將超過(guò)35ZB。數(shù)據(jù)容量增長(zhǎng)的速度已大大超過(guò)原有軟硬件技術(shù)的承受能力,傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)已難以有效處理這些數(shù)據(jù),人類確已邁入大數(shù)據(jù)時(shí)代。
大數(shù)據(jù)的應(yīng)用十分廣泛,不僅能創(chuàng)造新型產(chǎn)業(yè)業(yè)態(tài),也能產(chǎn)生巨大的經(jīng)濟(jì)和社會(huì)價(jià)值。麥肯錫研究報(bào)告認(rèn)為,大數(shù)據(jù)每年可為美國(guó)醫(yī)療健康業(yè)和歐洲發(fā)達(dá)經(jīng)濟(jì)體政府分別節(jié)省3,000億美元和2,500億歐元的開支。利用個(gè)人位置信息有可能創(chuàng)造出1,000億美元的消費(fèi)者剩余。通過(guò)大數(shù)據(jù)分析,企業(yè)可以發(fā)現(xiàn)新客戶群體,確定最優(yōu)供應(yīng)商,不斷推出創(chuàng)新產(chǎn)品。如淘寶網(wǎng)利用其掌握的第一手用戶數(shù)據(jù)推出“淘寶魔方”服務(wù),通過(guò)后臺(tái)數(shù)據(jù),挖掘用戶評(píng)論、瀏覽量、收藏量,進(jìn)而預(yù)測(cè)商家或商品的銷售趨勢(shì)。利用大數(shù)據(jù)分析,科研人員可開展醫(yī)療健康、石油勘探和環(huán)境治理等方面的研究。如生物醫(yī)學(xué)研究領(lǐng)域就是大數(shù)據(jù)的先行者。以人類基因組計(jì)劃為例,2008年人類基因組計(jì)劃生產(chǎn)數(shù)據(jù)1萬(wàn)億堿基對(duì),2009年該數(shù)據(jù)量又翻了一番。美國(guó)國(guó)家醫(yī)學(xué)圖書館基于科學(xué)數(shù)據(jù)建立了超級(jí)計(jì)算和數(shù)據(jù)處理Entrez平臺(tái),支持基礎(chǔ)科學(xué)和應(yīng)用科學(xué)的知識(shí)發(fā)現(xiàn)和數(shù)據(jù)關(guān)聯(lián)以及分析基礎(chǔ)上的模擬仿真研究。
何謂“大數(shù)據(jù)(Big Data)”?麥肯錫全球研究院(McKinsey Global Institute)在其報(bào)告《大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)前沿》中是這樣定義的:所謂大數(shù)據(jù),是指大小超過(guò)了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具的抓取、存儲(chǔ)、管理和分析能力的數(shù)據(jù)群。大數(shù)據(jù)之“大”,不僅指數(shù)據(jù)的規(guī)模巨大,還包括數(shù)據(jù)的來(lái)源和類型復(fù)雜多樣,大數(shù)據(jù)因而又被定義為“大數(shù)據(jù)=海量數(shù)據(jù)+復(fù)雜類型的數(shù)據(jù)”。
大數(shù)據(jù)的特征被概括為“4V”,即大量化(Volume)、多樣化(Variety)、快速化(Velocity)和價(jià)值化(Value):①大量化。是指數(shù)據(jù)量從TB級(jí)躍升至PB級(jí)甚至更高,原有的集中處理和集中計(jì)算技術(shù)已難以適應(yīng)。②多樣化。是指大數(shù)據(jù)不僅包含結(jié)構(gòu)化的數(shù)據(jù),還包括網(wǎng)絡(luò)日志、微博、郵件、圖片、音頻和視頻等半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)。③快速化。是指數(shù)據(jù)實(shí)時(shí)生成,更新快,數(shù)據(jù)存儲(chǔ)、傳輸和處理的速度也非常快,要求對(duì)數(shù)據(jù)實(shí)行交互式、實(shí)時(shí)或準(zhǔn)實(shí)時(shí)的預(yù)判性分析。④價(jià)值化。盡管大數(shù)據(jù)價(jià)值密度低,但基于龐大數(shù)據(jù)的分析和計(jì)算,可以產(chǎn)生巨大的財(cái)富和價(jià)值,正因?yàn)槿绱?,大?shù)據(jù)被視為一種能形成競(jìng)爭(zhēng)力的新型資產(chǎn)。
2大數(shù)據(jù)帶給圖書館的影響和挑戰(zhàn)
2.1對(duì)圖書館內(nèi)部實(shí)體要素的沖擊
2.1.1資源建設(shè)方面。大數(shù)據(jù)時(shí)代,通過(guò)電子商務(wù)、社交網(wǎng)絡(luò)產(chǎn)生的,記錄人們生產(chǎn)、生活行為的數(shù)據(jù),大都是半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)已占數(shù)據(jù)總量的80%以上。對(duì)這些非結(jié)構(gòu)化數(shù)據(jù)的全面收集就有可能深入分析和了解用戶偏好,真正實(shí)現(xiàn)精準(zhǔn)和個(gè)性化服務(wù)。近年來(lái),圖書館因數(shù)據(jù)收集意識(shí)不強(qiáng)、對(duì)于數(shù)據(jù)在決策當(dāng)中的重要性認(rèn)識(shí)不夠等原因,目前圖書館對(duì)非結(jié)構(gòu)化數(shù)據(jù)資源的采集和建庫(kù)還幾乎處于空白。圖書館連本系統(tǒng)用戶信息行為產(chǎn)生的大數(shù)據(jù)資源采集尚未提上議事日程,更不用說(shuō)對(duì)社交網(wǎng)絡(luò)、企業(yè)大數(shù)據(jù)的收集了,圖書館因而很難融入用戶群體的細(xì)節(jié)服務(wù)。此外,由于大數(shù)據(jù)時(shí)代科研范式和學(xué)術(shù)信息交流方式發(fā)生了變化,E-science環(huán)境下的科學(xué)研究越來(lái)越表現(xiàn)出數(shù)據(jù)驅(qū)動(dòng)的特征,科學(xué)數(shù)據(jù)資源將成為圖書館數(shù)字資源的重要組成部分。目前,世界各國(guó)都在積極建設(shè)數(shù)字化、網(wǎng)絡(luò)化的科學(xué)數(shù)據(jù)平臺(tái),如美國(guó)國(guó)家醫(yī)學(xué)圖書館生物醫(yī)學(xué)領(lǐng)域的NCBI、生物多樣性領(lǐng)域的BHL等。存儲(chǔ)在各類數(shù)據(jù)庫(kù)和文檔系統(tǒng)中的科學(xué)數(shù)據(jù)以及以業(yè)界標(biāo)準(zhǔn)化關(guān)系數(shù)據(jù)庫(kù)所產(chǎn)生的元數(shù)據(jù)體系,將構(gòu)成一種新型的、分布式的和整合式的數(shù)字圖書館。因此,在西方國(guó)家特別是在美國(guó),研究型圖書館普遍設(shè)置了“數(shù)據(jù)監(jiān)護(hù)(Data Curation)”相關(guān)崗位,一些圖書館還成立專門的“研究數(shù)據(jù)管理服務(wù)工作組(RIDMSG)”,為科研提供特色化、前沿化的數(shù)據(jù)服務(wù)。而國(guó)內(nèi)圖書館尚未發(fā)現(xiàn)針對(duì)科學(xué)數(shù)據(jù)的采集和平臺(tái)建設(shè),更談不上特色服務(wù)了。
夏燕:大數(shù)據(jù)時(shí)代圖書館面臨的挑戰(zhàn)與對(duì)策夏燕:大數(shù)據(jù)時(shí)代圖書館面臨的挑戰(zhàn)與對(duì)策2.1.2技術(shù)及基礎(chǔ)設(shè)施層面。基于大數(shù)據(jù)的數(shù)據(jù)抽取和集成、數(shù)據(jù)分析及數(shù)據(jù)解釋,需要全新的大數(shù)據(jù)處理框架和關(guān)鍵技術(shù),傳統(tǒng)SQL數(shù)據(jù)庫(kù)理論和技術(shù)已無(wú)能為力。近年來(lái),盡管一些專業(yè)數(shù)據(jù)公司開發(fā)了Hadoop云計(jì)算開源工具及MapReduce等分布式并行計(jì)算模型,但一方面這些技術(shù)工具本身在可擴(kuò)展性、性能、容錯(cuò)性、支持異構(gòu)環(huán)境及兼容性等方面需要進(jìn)一步完善;另一方面,從數(shù)據(jù)集成、數(shù)據(jù)分析到數(shù)據(jù)可視化,大數(shù)據(jù)管理和利用的復(fù)雜程度遠(yuǎn)超出傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)。而圖書館行業(yè)絕大部分從業(yè)者都不是數(shù)據(jù)分析專家,大數(shù)據(jù)管理系統(tǒng)的易用性問(wèn)題將會(huì)在相當(dāng)長(zhǎng)一段時(shí)間內(nèi)困擾圖書館界,復(fù)雜的大數(shù)據(jù)技術(shù)及分析工具制約了圖書館從大數(shù)據(jù)獲取知識(shí)的能力。大數(shù)據(jù)環(huán)境下,計(jì)算機(jī)存儲(chǔ)及計(jì)算規(guī)模迅速增加,出于降低成本的考慮,越來(lái)越多的知識(shí)服務(wù)機(jī)構(gòu)將應(yīng)用由高端服務(wù)器轉(zhuǎn)向中低端硬件構(gòu)成的大規(guī)模計(jì)算機(jī)集群,因而要求計(jì)算機(jī)及服務(wù)器集群擁有海量、超大規(guī)模的數(shù)據(jù)存取與計(jì)算能力,網(wǎng)絡(luò)設(shè)備能快速將分塊的大數(shù)據(jù)集復(fù)制到集群服務(wù)器節(jié)點(diǎn)進(jìn)行處理,軟硬件條件能支撐保護(hù)高度分布式和數(shù)據(jù)的可信應(yīng)用體系。這些都對(duì)圖書館支持非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)及分析的軟硬件條件提出了新的要求。endprint
2.1.3人力資源建設(shè)方面。大數(shù)據(jù)的應(yīng)用是技術(shù)難度極高的集成應(yīng)用,如需要集成技術(shù)(軟件和系統(tǒng)等),數(shù)學(xué)(統(tǒng)計(jì)、建模和算法等)、商業(yè)分析(具體業(yè)務(wù)領(lǐng)域的相關(guān)知識(shí))和可視化(語(yǔ)言和圖表等)等多個(gè)學(xué)科領(lǐng)域的技術(shù)成果。美國(guó)國(guó)家科學(xué)理事會(huì)NSB在其發(fā)表的《長(zhǎng)期保存的數(shù)字?jǐn)?shù)據(jù)集合:支持21世紀(jì)的研究與教育》報(bào)告中,將圖書館學(xué)家與信息學(xué)家、計(jì)算機(jī)科學(xué)家、數(shù)據(jù)庫(kù)和軟件工程師或程序員、數(shù)據(jù)管理者等對(duì)科學(xué)數(shù)據(jù)資源的成功管理起著關(guān)鍵作用的人們并列稱為數(shù)據(jù)科學(xué)家。美國(guó)研究圖書館協(xié)會(huì)也已提出,研究數(shù)據(jù)管理將成為下一代圖書館員的能力之一。有專家粗略估計(jì),我國(guó)大數(shù)據(jù)分析專業(yè)人才缺口達(dá)100萬(wàn)人。圖書館數(shù)據(jù)管理人才就更為稀缺。目前,圖書館現(xiàn)有分析人員只能對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單的報(bào)表和描述性分析,可承擔(dān)數(shù)據(jù)分析和數(shù)據(jù)挖掘的“數(shù)據(jù)館員”可謂鳳毛麟角。培養(yǎng)大數(shù)據(jù)分析和管理人才,是圖書館面對(duì)的最為緊迫的難題。
2.2對(duì)圖書館知識(shí)服務(wù)模式的影響
圖書館與科學(xué)研究、科技創(chuàng)新及知識(shí)服務(wù)關(guān)系非常密切。作為嵌入式協(xié)作化知識(shí)創(chuàng)新環(huán)境,圖書館具備科技創(chuàng)新所需要的知識(shí)服務(wù)能力、科研數(shù)據(jù)管理和基于知識(shí)協(xié)作的交互協(xié)調(diào)創(chuàng)新能力。伴隨著信息手段及知識(shí)組織方式的不斷進(jìn)步,圖書館核心業(yè)務(wù)由參考咨詢向信息咨詢?cè)傧蛑R(shí)咨詢演進(jìn)的趨勢(shì)十分明顯。大數(shù)據(jù)則為圖書館知識(shí)咨詢服務(wù)帶來(lái)了豐富的數(shù)據(jù)資源、專業(yè)的數(shù)據(jù)分析技術(shù)及與專業(yè)知識(shí)服務(wù)機(jī)構(gòu)合作的機(jī)會(huì)。通過(guò)大數(shù)據(jù)分析可了解用戶、行為、意愿、業(yè)務(wù)需求、知識(shí)應(yīng)用能力及知識(shí)服務(wù)需求等需要什么,更可以利用數(shù)據(jù)對(duì)用戶的科研創(chuàng)新合作過(guò)程及合作交互型知識(shí)服務(wù)過(guò)程將要發(fā)生什么進(jìn)行分析和預(yù)測(cè)??梢钥隙ǖ氖牵跀?shù)據(jù)的處理、組織、分析與挖掘的用戶信息行為分析與內(nèi)容分析,與知識(shí)服務(wù)完美融合的知識(shí)咨詢服務(wù),必將成為圖書館在大數(shù)據(jù)時(shí)代的咨詢服務(wù)模式。
2.3對(duì)圖書館整體生存地位的挑戰(zhàn)
大數(shù)據(jù)不光影響圖書館事業(yè)內(nèi)部各構(gòu)成要素,從圖書館整個(gè)生存環(huán)境來(lái)看,由于大數(shù)據(jù)來(lái)勢(shì)洶涌,其商業(yè)價(jià)值和戰(zhàn)略資源前景受到政府、企業(yè)及知識(shí)服務(wù)機(jī)構(gòu)的高度關(guān)注。在大數(shù)據(jù)時(shí)代,誰(shuí)能有效地壟斷數(shù)據(jù),誰(shuí)就有可能成為世界的霸主。近年來(lái),IT巨頭紛紛投入巨資涉足大數(shù)據(jù)開發(fā)和應(yīng)用領(lǐng)域。2006年,Microsoft以1.1億美元購(gòu)買了大數(shù)據(jù)公司Farecast。2008年,Google以7億美元購(gòu)買了為Farecast提供數(shù)據(jù)的ITA Software公司。而圖書館在資金、技術(shù)和人才等方面顯然無(wú)法與大數(shù)據(jù)商業(yè)公司相比,這些專業(yè)公司對(duì)圖書館的部分業(yè)務(wù)甚至核心業(yè)務(wù)顯然構(gòu)成了巨大挑戰(zhàn)。
以“語(yǔ)義網(wǎng)”(Semantic Web)為例,它實(shí)際上就是“數(shù)據(jù)網(wǎng)”,是一個(gè)全球的數(shù)據(jù)庫(kù)網(wǎng),在這個(gè)數(shù)據(jù)庫(kù)網(wǎng)中,計(jì)算機(jī)能自動(dòng)為用戶搜尋、檢索和集成網(wǎng)上的信息,而不再需要搜索引擎。大數(shù)據(jù)時(shí)代正在催生的這個(gè)最大的技術(shù)變革,就是要重新構(gòu)造互聯(lián)網(wǎng),打造下一代互聯(lián)網(wǎng)。眾所周知,現(xiàn)有互聯(lián)網(wǎng)搜索引擎已引起對(duì)圖書館的價(jià)值質(zhì)疑、貢獻(xiàn)邊緣化、技術(shù)落后、人員不適應(yīng)未來(lái)等多重危機(jī),甚至導(dǎo)致了圖書館是否消亡的爭(zhēng)論,將來(lái)以語(yǔ)義網(wǎng)為代表的基于大數(shù)據(jù)的知識(shí)發(fā)現(xiàn)平臺(tái)一旦開發(fā)成功,將給圖書館帶來(lái)更為嚴(yán)峻的影響和挑戰(zhàn)。
3大數(shù)據(jù)時(shí)代圖書館的應(yīng)對(duì)之策
3.1重視用戶信息行為數(shù)據(jù)及科學(xué)數(shù)據(jù)資源的建設(shè)
大數(shù)據(jù)時(shí)代的圖書館服務(wù)所需的數(shù)據(jù)既包括當(dāng)前圖書館正在建設(shè)的文獻(xiàn)資源、數(shù)字資源、網(wǎng)絡(luò)資源,也包括圖書館內(nèi)外海量的非結(jié)構(gòu)化數(shù)據(jù),其主要來(lái)源有RFID射頻數(shù)據(jù)、傳感器數(shù)據(jù)、社交網(wǎng)絡(luò)交互數(shù)據(jù)及移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù),具體如網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息、交易信息等數(shù)據(jù)資源。圖書館當(dāng)務(wù)之急應(yīng)對(duì)本領(lǐng)域用戶信息行為產(chǎn)生的大量數(shù)據(jù),如讀者查詢書目產(chǎn)生的OPAC日志、讀者借還書產(chǎn)生的流通日志、讀者對(duì)于數(shù)據(jù)庫(kù)的瀏覽和檢索歷史,及基于手機(jī)、平板電腦等移動(dòng)設(shè)備而產(chǎn)生的讀者個(gè)人信息、地理位置、瀏覽信息等加以收集并納入館藏。
此外,圖書館特別是研究型圖書館應(yīng)收集從宏觀到微觀,從自然到社會(huì)的觀察、感知、計(jì)算、仿真、模擬、傳播等設(shè)施和活動(dòng)中產(chǎn)生的科學(xué)數(shù)據(jù),加快建立融數(shù)據(jù)和文獻(xiàn)于一體的新型數(shù)字圖書館,形成數(shù)據(jù)與信息融合的互操作架構(gòu),以形成圖書館獨(dú)具特色的科學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施平臺(tái)。
3.2引進(jìn)大數(shù)據(jù)處理平臺(tái)及分析工具
云計(jì)算已是較為成熟的大數(shù)據(jù)基礎(chǔ)平臺(tái)和關(guān)鍵技術(shù),目前最為流行的開源云計(jì)算處理框架Hadoop 及基于Hadoop的HDFS和MapReduce等關(guān)鍵服務(wù),可提供關(guān)聯(lián)規(guī)則學(xué)習(xí)、預(yù)測(cè)建模分析,被廣泛應(yīng)用于推薦系統(tǒng)、商業(yè)智能、決策支持等領(lǐng)域。這些大數(shù)據(jù)處理框架平臺(tái)可與原有關(guān)系型數(shù)據(jù)庫(kù)部署在一起,有效組裝和整合新舊數(shù)據(jù)集合,能夠?qū)崿F(xiàn)對(duì)結(jié)構(gòu)化和復(fù)雜數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)的獲取、存儲(chǔ)、組織、分析及決策。
Hadoop在圖書館已得到初步的應(yīng)用,如Nutch搜索引擎中的分布式搜索、索引等。圖書館應(yīng)針對(duì)資源構(gòu)建方式、大數(shù)據(jù)處理需求及技術(shù)條件,充分運(yùn)用云計(jì)算環(huán)境中存儲(chǔ)、計(jì)算及網(wǎng)絡(luò)等資源的分布式網(wǎng)絡(luò)化服務(wù)的資源組合能力,重新定義和開發(fā)圖書館用戶信息行為數(shù)據(jù)的獲取、存儲(chǔ)、組織和分析系統(tǒng)和工具,將數(shù)據(jù)挖掘工具嵌入圖書館需要數(shù)據(jù)分析的業(yè)務(wù)環(huán)境,解決圖書館的大數(shù)據(jù)應(yīng)用難題。
3.3開展基于大數(shù)據(jù)的知識(shí)增值服務(wù)
圖書館開展的大數(shù)據(jù)知識(shí)增值服務(wù),主要包括以下幾種: 首先是圖書館自身建設(shè)所需的大數(shù)據(jù)分析。這類分析一般以圖書館本系統(tǒng)信息服務(wù)過(guò)程中所產(chǎn)生的大量非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)為對(duì)象進(jìn)行分析,了解讀者信息行為正在發(fā)生什么,預(yù)測(cè)和分析將會(huì)發(fā)生什么,為圖書館個(gè)性化、人性化服務(wù)提供先覺價(jià)值和智慧服務(wù)。其次是嵌入式知識(shí)服務(wù)。圖書館應(yīng)利用大數(shù)據(jù)特別是科學(xué)數(shù)據(jù)基礎(chǔ)平臺(tái),提供以智力、知識(shí)、工具的應(yīng)用為特征的深度知識(shí)服務(wù),將知識(shí)咨詢服務(wù)嵌入管理、學(xué)科、科研及知識(shí)創(chuàng)新過(guò)程之中,促進(jìn)學(xué)習(xí)、科研和知識(shí)轉(zhuǎn)化與圖書館服務(wù)的深度融合。此外,圖書館還可利用常規(guī)及深度數(shù)據(jù)分析,為客戶提供科技創(chuàng)新能力智能評(píng)價(jià)、知識(shí)服務(wù)競(jìng)爭(zhēng)力分析、知識(shí)創(chuàng)新預(yù)測(cè)性分析、服務(wù)態(tài)勢(shì)綜述等高附加值服務(wù)。
3.4強(qiáng)化數(shù)據(jù)館員的培養(yǎng)和使用
大數(shù)據(jù)人才包括數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師和首席數(shù)據(jù)執(zhí)行官(CDO)等,他們需要具備信息技術(shù)、自然語(yǔ)言理解、機(jī)器學(xué)習(xí)、數(shù)學(xué)算法、統(tǒng)計(jì)學(xué)等多方面的專業(yè)技能。這些數(shù)據(jù)管理和分析人才可通過(guò)合作或委托培訓(xùn)的方式進(jìn)行培養(yǎng)。2013年,北京航空航天大學(xué)計(jì)算機(jī)學(xué)院、軟件學(xué)院和淘寶、百度、騰訊等企業(yè)合作,聯(lián)合開辦了國(guó)內(nèi)第一個(gè)大數(shù)據(jù)專業(yè)的工程碩士班。這種聯(lián)合式的大數(shù)據(jù)人才教育模式,為圖書館的大數(shù)據(jù)人才培養(yǎng)途徑提供了捷徑與借鑒。
4結(jié)語(yǔ)
正如Google的首席經(jīng)濟(jì)學(xué)家Hal Varian所說(shuō),數(shù)據(jù)是廣泛可用的,所缺乏的是從中提取出知識(shí)的能力。數(shù)據(jù)收集的根本目的是根據(jù)需求從數(shù)據(jù)中提取有用的知識(shí),并將其應(yīng)用到具體的領(lǐng)域之中。在大數(shù)據(jù)時(shí)代,從大量的數(shù)據(jù)中分析其潛在的價(jià)值將成為圖書館的一大主要業(yè)務(wù),而提供這些業(yè)務(wù)的水平將決定著圖書館的發(fā)展水平和方向。
參考文獻(xiàn):
[1]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報(bào),2012(5):37-40.
[2]郭曉科.大數(shù)據(jù)[M].北京:清華大學(xué)出版社,2013.
[3]劉明,李娜.大數(shù)據(jù)趨勢(shì)與專業(yè)圖書館[J].中華醫(yī)學(xué)圖書情報(bào)雜志,2013(2):1-6.
[4]但彬.大數(shù)據(jù)=海量數(shù)據(jù)+復(fù)雜類型的數(shù)據(jù)[EB/OL].[2013-10-07]. http://www.d1net.com/cc/factary/88831.html.
[5]張興旺.圖書館大數(shù)據(jù)體系構(gòu)建的學(xué)術(shù)環(huán)境和戰(zhàn)略思考[J].情報(bào)資料工作,2013(2):12-17.
[6]樊偉紅等.圖書館需要怎樣的“大數(shù)據(jù)”[J].圖書館雜志,2012(11):63-77.
[7]朱靜薇,李紅艷.大數(shù)據(jù)時(shí)代下圖書館的挑戰(zhàn)及其應(yīng)對(duì)策略[J].現(xiàn)代情報(bào),2013(5):9-13.
(編校:崔萌)endprint