摘 要:大數(shù)據(jù)是近兩年IT界最為流行的關(guān)鍵詞,但對(duì)大數(shù)據(jù)的內(nèi)涵與認(rèn)識(shí)各大IT廠商、研究機(jī)構(gòu)與科學(xué)家都有著不同的見(jiàn)解。在大數(shù)據(jù)時(shí)代,圖書(shū)館將在數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)挖掘、數(shù)據(jù)分析等方面面臨著巨大的挑戰(zhàn)與考驗(yàn),復(fù)雜數(shù)據(jù)的處理也將成為大數(shù)據(jù)時(shí)代圖書(shū)館發(fā)展的主旋律,通過(guò)大量的非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)去尋找隱藏在數(shù)據(jù)背后的世界,進(jìn)而為圖書(shū)館服務(wù)的模式、未來(lái)發(fā)展趨勢(shì)提供分析與預(yù)測(cè)將成為大數(shù)據(jù)時(shí)代圖書(shū)館的一大主要服務(wù)內(nèi)容。
關(guān)鍵詞:大數(shù)據(jù) 非結(jié)構(gòu)化數(shù)據(jù) 半結(jié)構(gòu)化數(shù)據(jù) 數(shù)據(jù)處理 圖書(shū)館服務(wù) 數(shù)據(jù)挖掘
中圖分類(lèi)號(hào): G250.76文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1003-6938(2012)05-0037-04
“大數(shù)據(jù)”(Big data)是繼Web2.0和云計(jì)算之后近兩年媒體最關(guān)注的一個(gè)詞,并正在引起了信息科技領(lǐng)域越來(lái)越多的關(guān)注與投身熱潮,美國(guó)政府于今年3月29日撥款2億美元推出的“大數(shù)據(jù)的研究和發(fā)展計(jì)劃”[1]更是將大數(shù)據(jù)提升到了全球性戰(zhàn)略發(fā)展的高度。其實(shí),IBM、EMC、甲骨文、Microsoft等IT巨頭幾乎都已投入到了大數(shù)據(jù)的軟硬件技術(shù)整合、大數(shù)據(jù)信息處理的技術(shù)供應(yīng)研究開(kāi)發(fā)之中,力求在新一輪的信息競(jìng)爭(zhēng)環(huán)境中占據(jù)主動(dòng),并搶得戰(zhàn)略先機(jī)與技術(shù)制高點(diǎn)。這些迅速發(fā)展的業(yè)界變化,也吸引了學(xué)者的關(guān)注,且因現(xiàn)有數(shù)據(jù)中心技術(shù)無(wú)法滿(mǎn)足大數(shù)據(jù)需求而可能引發(fā)的IT架構(gòu)重構(gòu)等發(fā)展態(tài)勢(shì)使得大數(shù)據(jù)有演化成為一個(gè)新型學(xué)科的趨勢(shì)。中國(guó)工程院院士、中科院計(jì)算技術(shù)研究所首席科學(xué)家李國(guó)杰就指出大數(shù)據(jù)將成為信息科技的新關(guān)注點(diǎn),并形成新型交叉學(xué)科:網(wǎng)絡(luò)數(shù)據(jù)科學(xué)[2]。同時(shí),當(dāng)前知識(shí)社會(huì)中的知識(shí)信息服務(wù)中心——圖書(shū)館因信息技術(shù)的在圖書(shū)館組織建設(shè)中的知識(shí)服務(wù)、知識(shí)創(chuàng)造、知識(shí)組織及知識(shí)存儲(chǔ)等方面有著廣泛的應(yīng)用,使得社會(huì)對(duì)圖書(shū)館的知識(shí)服務(wù)要求更為苛刻,潛在的知識(shí)挖掘、知識(shí)評(píng)價(jià)、數(shù)據(jù)分析等增值服務(wù)需求已經(jīng)開(kāi)始顯現(xiàn)或已經(jīng)訴諸表達(dá)于讀者的日常行為之中。利用大數(shù)據(jù)技術(shù)去挖掘、識(shí)別、組織與分析隱含在讀者行為中的結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)信息,尋找他們的隱性訴求進(jìn)而改進(jìn)圖書(shū)館的服務(wù),達(dá)到圖書(shū)館資源、服務(wù)與讀者需求的雙向理想控制已成為大數(shù)據(jù)時(shí)代圖書(shū)館提高服務(wù)體系的組織水平、推動(dòng)行業(yè)發(fā)展與制度建設(shè)的捷徑之一。本文在對(duì)大數(shù)據(jù)概述與內(nèi)涵認(rèn)識(shí)的基礎(chǔ)上,重點(diǎn)對(duì)大數(shù)據(jù)帶給圖書(shū)館的影響與挑戰(zhàn)進(jìn)行了分析。
1 認(rèn)識(shí)大數(shù)據(jù)
1.1 大數(shù)據(jù)概述
2011年5月,全球知名咨詢(xún)公司麥肯錫(Mckinsey and Company)發(fā)布了《大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)前沿領(lǐng)域》[3]報(bào)告,首次提出了“大數(shù)據(jù)”的概念,并在報(bào)告中指出“數(shù)據(jù)已經(jīng)滲透到每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,逐漸成為重要的生產(chǎn)因素;而人們對(duì)于海量數(shù)據(jù)的運(yùn)用將預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)”。之后,《紐約時(shí)報(bào)》[4]、《華爾街日?qǐng)?bào)》[5]等對(duì)大數(shù)據(jù)進(jìn)行了專(zhuān)欄封面介紹,但是隨著大數(shù)據(jù)在發(fā)展的初期不被業(yè)界普遍了解與易從“Big data”字面引申的概念臆想,使得對(duì)于大數(shù)據(jù)的概念、內(nèi)涵等存在著多種的定義與理解。如從字面理解,大數(shù)據(jù)易于被認(rèn)為就是海量的數(shù)據(jù)。IT廠商、研究機(jī)構(gòu)、維基百科和數(shù)據(jù)科學(xué)家等提出的概念并不一致,截至目前并未形成統(tǒng)一的定義。但通過(guò)分析不同概念發(fā)現(xiàn),各個(gè)定義盡管在具體的表達(dá)中對(duì)大數(shù)據(jù)的范圍、內(nèi)涵等描述不一,但存在一個(gè)共識(shí),即:大數(shù)據(jù)不是對(duì)數(shù)據(jù)量大小的定量描述,而是一種在種類(lèi)繁多、數(shù)量龐大的多樣數(shù)據(jù)中進(jìn)行的快速信息獲取。
1.2 大數(shù)據(jù)的內(nèi)涵與認(rèn)識(shí)
盡管大數(shù)據(jù)在提出以后吸引了業(yè)界的大量眼球,對(duì)其的研究也蜂擁而上,但在查閱信息的同時(shí)也發(fā)現(xiàn)目前大家對(duì)大數(shù)據(jù)還并未做到真正的了解,對(duì)其的內(nèi)涵與理解存在偏差?;谶@種現(xiàn)狀,筆者認(rèn)為有必要對(duì)如下業(yè)界還未明確的問(wèn)題進(jìn)行列舉與分析。
首先,大數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的總和。據(jù)DCCI互聯(lián)網(wǎng)數(shù)據(jù)中心在2012年7月26日舉辦的“Adworld2012互動(dòng)營(yíng)銷(xiāo)世界”上給出的數(shù)據(jù)[6]顯示:2010年,全球數(shù)據(jù)量已達(dá)1.2ZB(1ZB=1024EB,1EB相當(dāng)于10億GB),到2020年將暴增30倍達(dá)35ZB; 2011年,全球被創(chuàng)建和復(fù)制數(shù)據(jù)總量為1.8ZB;2013年,我們生成這樣規(guī)模的信息量只需10分鐘……。而在如此龐大的數(shù)據(jù)中,只有10%的數(shù)據(jù)是存儲(chǔ)在數(shù)據(jù)庫(kù)中的結(jié)構(gòu)化數(shù)據(jù),其余的則是由郵件、視頻、微博、帖子、頁(yè)面點(diǎn)擊等產(chǎn)生的大量的半結(jié)構(gòu)化數(shù)據(jù) 非結(jié)構(gòu)化數(shù)據(jù)[7]。而在我們的日常生活中,智能設(shè)備、物聯(lián)網(wǎng)、社交網(wǎng)站等產(chǎn)生的半結(jié)構(gòu)化數(shù)據(jù)、非機(jī)構(gòu)化數(shù)據(jù)量更是遠(yuǎn)遠(yuǎn)大于在學(xué)習(xí)、工作中產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù)。如何處理這些占據(jù)了主要份額的半結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)也因此成為大數(shù)據(jù)的主要業(yè)務(wù)與內(nèi)容,進(jìn)而給數(shù)據(jù)分析與挖掘產(chǎn)業(yè)帶來(lái)了更多的機(jī)會(huì)。也正是存在著這樣的巨大市場(chǎng)驅(qū)動(dòng)力,催生了大量的以信息抽取、轉(zhuǎn)換和加載(ETL)及挖掘分析、數(shù)據(jù)營(yíng)銷(xiāo)為主要業(yè)務(wù)的新型企業(yè)。
其次,大數(shù)據(jù)的“大”意義具有多樣性。IBM認(rèn)為大數(shù)據(jù)具有“3V”特點(diǎn)[8],即種類(lèi)(Variety)多、速度(Velocity)快、容量(Volume)大。但以IDC為代表的業(yè)界認(rèn)為滿(mǎn)足“4V”(Variety、Velocity、Volume、value,即種類(lèi)多、流量大、容量大、價(jià)值高)指標(biāo)的數(shù)據(jù)才可稱(chēng)為大數(shù)據(jù)[9]。但無(wú)論是“3V”還是“4V”,其本質(zhì)都是對(duì)大數(shù)據(jù)中的“大”的理解與闡釋。NetApp也很好的解釋了大數(shù)據(jù)的“大”的含義,認(rèn)為大數(shù)據(jù)應(yīng)包括A、B、C三大要素:即分析(Analytic)、帶寬(Bandwidth)和內(nèi)容(Content)[10]。具體來(lái)說(shuō)就是:大分析(Big Analytics)指通過(guò)對(duì)巨大的數(shù)據(jù)集進(jìn)行實(shí)時(shí)分析后能帶來(lái)新的業(yè)務(wù)模式,并進(jìn)行客戶(hù)服務(wù),能實(shí)現(xiàn)更好結(jié)果,以至幫助用戶(hù)獲得洞見(jiàn);高帶寬(Big Bandwidth)指能高速的處理關(guān)鍵數(shù)據(jù),以支持快速有效地消化和處理大型數(shù)據(jù)集,幫助用戶(hù)走得更快;大內(nèi)容(Big Content)一方面指大數(shù)據(jù)既指結(jié)構(gòu)化數(shù)據(jù),也指半結(jié)構(gòu)化數(shù)據(jù)與非機(jī)構(gòu)化數(shù)據(jù),另一方面則是指對(duì)數(shù)據(jù)的存儲(chǔ)擴(kuò)展要求極高,并要求能輕松實(shí)現(xiàn)數(shù)據(jù)的恢復(fù)、備份、復(fù)制與安全管理,以去支持可管理的信息內(nèi)容存儲(chǔ)庫(kù)而不只是存放過(guò)久的數(shù)據(jù),并且能夠跨越不同的大陸板塊而不丟失任何信息[11]。
再次,大數(shù)據(jù)的“數(shù)據(jù)”不是數(shù)據(jù)存儲(chǔ),而是數(shù)據(jù)獲取與數(shù)據(jù)應(yīng)用。隨著信息時(shí)代的發(fā)展,人們創(chuàng)造和生產(chǎn)的信息數(shù)據(jù)越來(lái)越多,云計(jì)算的出現(xiàn)也是使得信息數(shù)據(jù)的存儲(chǔ)、計(jì)算并不成為信息數(shù)據(jù)存儲(chǔ)的障礙,但大數(shù)據(jù)的數(shù)據(jù)不是存儲(chǔ)在云端等存儲(chǔ)媒介的數(shù)據(jù),因?yàn)榇鎯?chǔ)的數(shù)據(jù)并不具備價(jià)值,而大數(shù)據(jù)的數(shù)據(jù)是進(jìn)行高速獲取和應(yīng)用的數(shù)據(jù),如對(duì)商業(yè)客戶(hù)行為習(xí)慣的分析、市場(chǎng)發(fā)展趨勢(shì)的預(yù)測(cè)等。而正是嶄新的大數(shù)據(jù)時(shí)代對(duì)大數(shù)據(jù)的大量分析與應(yīng)用使得該領(lǐng)域缺乏足夠的人力支持,據(jù)麥肯錫全球研究所去年的調(diào)查報(bào)告顯示,目前美國(guó)需要14萬(wàn)到19萬(wàn)名以上具備“深度分析”專(zhuān)長(zhǎng)的研究人員,而對(duì)具備數(shù)據(jù)知識(shí)的經(jīng)理的需求超過(guò)了150萬(wàn)[12]。
2 大數(shù)據(jù)帶給圖書(shū)館的影響與挑戰(zhàn)
大數(shù)據(jù)時(shí)代的到來(lái)改變了傳統(tǒng)的IT架構(gòu)與數(shù)據(jù)存儲(chǔ)、利用機(jī)構(gòu),也將對(duì)作為社會(huì)中儲(chǔ)存信息知識(shí)、提供信息服務(wù)的信息中心的圖書(shū)館形成沖擊與挑戰(zhàn)。因此,深刻理解大數(shù)據(jù)的內(nèi)涵,聯(lián)系圖書(shū)館的發(fā)展及其現(xiàn)階段數(shù)據(jù)儲(chǔ)存、分析、挖掘的發(fā)展?fàn)顩r及大數(shù)據(jù)時(shí)代圖書(shū)館用戶(hù)對(duì)信息資源的利用需求,對(duì)大數(shù)據(jù)帶給信息服務(wù)業(yè)的影響與挑戰(zhàn)進(jìn)行大膽的假設(shè)分析與小心論證將顯得非常必要。這種分析與論證也將使得圖書(shū)館在大數(shù)據(jù)時(shí)代真正來(lái)臨時(shí)將有充足的應(yīng)對(duì)準(zhǔn)備與發(fā)展對(duì)策。
2.1 復(fù)雜數(shù)據(jù)的處理將成為大數(shù)據(jù)時(shí)代圖書(shū)館的發(fā)展旋律
社會(huì)信息化進(jìn)程的加快,使得信息的重要性日益顯現(xiàn),信息、能源與材料也被譽(yù)為是現(xiàn)代社會(huì)發(fā)展的三大支柱之一。提高民眾的信息獲取能力、保障信息獲取公平、優(yōu)化信息獲取環(huán)境、推動(dòng)信息社會(huì)的發(fā)展也因此成為了一個(gè)國(guó)家、地區(qū)政府的主要職責(zé)之一,1993年美國(guó)政府宣布實(shí)施的“國(guó)家信息基礎(chǔ)設(shè)施”計(jì)劃[13](National Information Infrastructure,也稱(chēng)“信息高速公路”計(jì)劃)就是美國(guó)政府在互聯(lián)網(wǎng)時(shí)代來(lái)臨之前發(fā)動(dòng)的一場(chǎng)信息革命,盡管其旨在于如美國(guó)副總統(tǒng)戈?duì)査f(shuō)的完成美國(guó)從工業(yè)時(shí)代向信息時(shí)代的過(guò)渡,開(kāi)發(fā)更大的潛在市場(chǎng),但計(jì)劃對(duì)于民眾信息素養(yǎng)的提高與信息社會(huì)的發(fā)展推動(dòng)作用均毋庸置疑。我國(guó)近年來(lái)發(fā)布的一系列信息政策、法規(guī)、技術(shù)標(biāo)準(zhǔn)、規(guī)范以及《國(guó)家信息化“九五”規(guī)劃和2010年遠(yuǎn)景目標(biāo)(綱要)》等也均是我國(guó)推進(jìn)國(guó)民經(jīng)濟(jì)信息化的保障建設(shè)。在政府主導(dǎo)、社會(huì)重視的氛圍中,圖書(shū)館也發(fā)揮了該有的作用,門(mén)戶(hù)網(wǎng)站、特色數(shù)據(jù)庫(kù)、數(shù)字圖書(shū)館建設(shè)也是風(fēng)起云涌,截至目前,我國(guó)的圖書(shū)館均基本實(shí)現(xiàn)了信息化建設(shè)[14],但具體分析不管是國(guó)內(nèi)外的國(guó)家計(jì)劃還是圖書(shū)館的信息化發(fā)展,其所包括的信息數(shù)據(jù)建設(shè)都還主要是數(shù)據(jù)庫(kù)、XML等同類(lèi)型、不能再細(xì)分的單一數(shù)據(jù),即都是結(jié)構(gòu)化數(shù)據(jù)。但隨著大數(shù)據(jù)時(shí)代相關(guān)業(yè)界對(duì)大數(shù)據(jù)的重視及應(yīng)用,大數(shù)據(jù)的特性與優(yōu)勢(shì)將在日常的生活中將凸顯出其巨大的優(yōu)越性,民眾的需求也將隨著這些人性化、個(gè)性化的高滿(mǎn)意度服務(wù)出現(xiàn)而對(duì)圖書(shū)館的服務(wù)呈現(xiàn)出明確和迫切的需求,適應(yīng)社會(huì)的發(fā)展,滿(mǎn)足用戶(hù)的需求,提供復(fù)雜數(shù)據(jù)的處理也將成為大數(shù)據(jù)時(shí)代圖書(shū)館的發(fā)展旋律。
2.2 迅猛增長(zhǎng)的復(fù)雜海量數(shù)據(jù)將為圖書(shū)館的數(shù)據(jù)存貯能力提出挑戰(zhàn)
信息環(huán)境下,信息產(chǎn)生的成本快速下降,產(chǎn)生的方式也多種多樣,存在于社會(huì)空間中的信息數(shù)據(jù)量迅猛增長(zhǎng),但大數(shù)據(jù)時(shí)代更是會(huì)促使數(shù)據(jù)產(chǎn)生的范圍、方式、途徑發(fā)生翻天覆地的變化,人們的一舉一動(dòng)、一言一行、行為規(guī)律等都將產(chǎn)生出大量的半結(jié)構(gòu)化、非結(jié)構(gòu)化信息數(shù)據(jù),信息數(shù)據(jù)的組成結(jié)構(gòu)、類(lèi)型格式、存在形態(tài)等都愈加復(fù)雜。圖書(shū)館對(duì)這些復(fù)雜的數(shù)據(jù)進(jìn)行的應(yīng)用、存儲(chǔ)將有著極強(qiáng)的挑戰(zhàn)性,其不僅有技術(shù)問(wèn)題,也還包括社會(huì)問(wèn)題,當(dāng)然在解決這些挑戰(zhàn)、問(wèn)題的過(guò)程中,可能會(huì)促發(fā)圖書(shū)館服務(wù)模式、資源建設(shè)模式、管理模式與發(fā)展模式的轉(zhuǎn)變,但要順利的完成以上模式的轉(zhuǎn)變與完成,兩大難題則須予以解決:首先,云計(jì)算的出現(xiàn)使得海量數(shù)據(jù)的存儲(chǔ)與運(yùn)算得到了解決,但其自身存在的安全等問(wèn)題依然不能讓用戶(hù)完全放心和信任[15],而圖書(shū)館自身海量數(shù)據(jù)的存儲(chǔ)及運(yùn)算能力與大數(shù)據(jù)對(duì)存儲(chǔ)能力的高要求之間的矛盾如何去解決將直接決定著圖書(shū)館在大數(shù)據(jù)時(shí)代能擁有什么質(zhì)量、多少數(shù)量的負(fù)責(zé)數(shù)據(jù);其次,數(shù)據(jù)即業(yè)務(wù),大數(shù)據(jù)對(duì)于圖書(shū)館的數(shù)據(jù)存儲(chǔ)范圍有著極高的要求。早在2007年,沃爾瑪就通過(guò)對(duì)消費(fèi)者的購(gòu)物行為等非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析,創(chuàng)造了“啤酒與尿布”的經(jīng)典商業(yè)案例[16]。但這樣的經(jīng)典案例是通過(guò)對(duì)海量的多類(lèi)型數(shù)據(jù)進(jìn)行分析而得到的,因此圖書(shū)館要在大數(shù)據(jù)時(shí)代掌握讀者用戶(hù)、館員乃至社會(huì)服務(wù)群體等的信息,則對(duì)其的數(shù)據(jù)描述中應(yīng)既要有當(dāng)前通用的數(shù)據(jù)記錄中的個(gè)人身份、借閱記錄等結(jié)構(gòu)化數(shù)據(jù)外,還更需要大量的存儲(chǔ)信息行為、搜索方式、行為痕跡等半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)。
2.3 傳統(tǒng)的信息服務(wù)將面臨以復(fù)雜數(shù)據(jù)為對(duì)象、以深度挖掘?yàn)橐蟾邩?biāo)準(zhǔn)挑戰(zhàn)
圖書(shū)館信息化程度的提高,使得信息服務(wù)成為了當(dāng)前圖書(shū)館服務(wù)的主要內(nèi)容之一,知識(shí)社會(huì)的到來(lái)也使得以互聯(lián)網(wǎng)信息搜索、查詢(xún)?yōu)榛A(chǔ)的知識(shí)信息服務(wù)逐漸被更多的圖書(shū)館所吸納與實(shí)踐,也成為了現(xiàn)代圖書(shū)館服務(wù)體系中不可或缺的一大版圖。但不管是簡(jiǎn)單的信息服務(wù)還是結(jié)合了信息檢索、組織、分析等高級(jí)業(yè)務(wù)素養(yǎng)去完成的知識(shí)服務(wù),都只是可歸納為是就數(shù)據(jù)而進(jìn)行的服務(wù),盡管也有了Web2.0等互動(dòng)技術(shù)的推動(dòng)后圖書(shū)館服務(wù)的個(gè)性化、人性化服務(wù)有了顯著提高,但交互性程度并不高,個(gè)性化、人性化服務(wù)也只是簡(jiǎn)單的以用戶(hù)的結(jié)構(gòu)化數(shù)據(jù),如根據(jù)服務(wù)訴求、專(zhuān)業(yè)特長(zhǎng)等數(shù)據(jù),去完成一定程度上的差異化服務(wù)。但大數(shù)據(jù)則要求圖書(shū)館不僅需要通過(guò)結(jié)構(gòu)化數(shù)據(jù)了解現(xiàn)在客戶(hù)需要什么服務(wù),也更需要利用大量的非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)對(duì)圖書(shū)館—用戶(hù)的服務(wù)關(guān)系中去挖掘正在發(fā)生什么、預(yù)測(cè)和分析將來(lái)會(huì)發(fā)生什么,以便圖書(shū)館找到更好的服務(wù)營(yíng)銷(xiāo)模式與應(yīng)對(duì)未知的危機(jī)及挑戰(zhàn)。
4 結(jié)語(yǔ)
大數(shù)據(jù)的出現(xiàn),將改變我們對(duì)數(shù)據(jù)的看法與認(rèn)識(shí),數(shù)據(jù)的存在不僅有價(jià)值,大數(shù)據(jù)更是將其能轉(zhuǎn)化為有意義,人們將透過(guò)大數(shù)據(jù)而找到隱藏在大量數(shù)據(jù)背后的世界,然而大數(shù)據(jù)的應(yīng)用是技術(shù)難度極高的集成應(yīng)用,如需要集成人工智能、商業(yè)智能、數(shù)學(xué)算法、自然語(yǔ)言理解、信息技術(shù)等多個(gè)跨學(xué)科領(lǐng)域的技術(shù)成果。圖書(shū)館作為社會(huì)信息服務(wù)的中心,在面臨這些較高的技術(shù)和管理風(fēng)險(xiǎn)的同時(shí),還面臨著內(nèi)外部環(huán)境的挑戰(zhàn)與競(jìng)爭(zhēng),對(duì)內(nèi)方面,除上述存在的主要挑戰(zhàn)之外,基礎(chǔ)設(shè)施、人力資源、運(yùn)行經(jīng)費(fèi)、管理體制都會(huì)是不得不面對(duì)的挑戰(zhàn)因素;對(duì)外方面,IT廠商與信息服務(wù)機(jī)構(gòu)的大數(shù)據(jù)研究、應(yīng)用已捷足先登,圖書(shū)館在大數(shù)據(jù)的服務(wù)競(jìng)爭(zhēng)中已落后于他們一步,盡管圖書(shū)館有資源的優(yōu)勢(shì),但圖書(shū)館在技術(shù)等方面的劣勢(shì)也將限制圖書(shū)館難以追趕上,如何避免邊緣化,將是圖書(shū)館不得不考慮的一大問(wèn)題。
參考文獻(xiàn):
[1]Big Data is a Big Deal.http://www.whitehouse.gov/blog/2012/03/29/big-data-big-deal.
[2]李國(guó)杰院士:大數(shù)據(jù)成為信息科技新關(guān)注點(diǎn)[EB/OL].[2012-06-02].http://www.cas.cn/xw/zjsd/201206/t20120
627_3605350.shtml.
[3]Big data: The next frontier for innovation, competition, and productivity. http://www.mckinsey.com/Insights/MGI/Research/Technology_and_Innovation/Big_data_The_next
_frontier_for_innovation.
[4]The New York Times. The Age of Big Data[EB/OL].[2012-05-23].http://www.nytimes.com/2012/02/12/sunday-review/big-datas-impact-in-the-world.html?pagewanted=all.
[5]The Wall Street Journal. Big-Data Success Stories: Splunk[EB/OL].[2012-07-19]. http://blogs.wsj.com/ven
turecapital/2011/10/21/big -data-success-stories-splunk/.
[6]Adworld2012互動(dòng)營(yíng)銷(xiāo)世界[EB/OL].[2012-09-10].
http://www.adworld.org.cn/index2012.html.
[7]海量數(shù)據(jù)爆發(fā) 大數(shù)據(jù)時(shí)代來(lái)臨的五個(gè)轉(zhuǎn)變[EB/OL].[2012-08-01]. http://labs.chinamobile.com/news/76217.
[8]MapR and Informatica Combine to Conquer Volume, Variety and Velocity of Big Data[EB/OL].[2012-07-21].
http://www.dbta.com/Articles/Editorial/News-Flashes/-MapR-and-Informatica-Join-Forces-to-Tackle-Volume-Variety-and-Velocity-of-Big-Data-81231.aspx.
[9]IBM公司在大數(shù)據(jù)領(lǐng)域占有先機(jī)[EB/OL].[2012-08-01]. http://it.hilizi.com/server/275232/372589013274b.shtml.
[10]NetApp .Big Data Solutions for Government[EB/OL].[2012-08-01]. http://www.netapp.com/us/solutions/industry/government/bigdata.html
[11]涂蘭敬.專(zhuān)家觀點(diǎn):“大數(shù)據(jù)”與“海量數(shù)據(jù)”的區(qū)別[J].網(wǎng)絡(luò)與信息,2011,(12):37-38.
[12]數(shù)據(jù)分析人才短缺問(wèn)題成當(dāng)前CIO必須面對(duì)的[EB/OL].[2012-08-01].http://cio.ctocio.com.cn/316/12322
816.shtml.
[13]United States Patent Trademark Office.Intellectual Property and the National Information InfrastructureThe Report of the Working Group on Intellectual Property Rights [EB/OL].[2012-08-01]. http://www.uspto.gov/web/offices/com/doc/ipnii/.
[14]郭向東,陳軍. 甘肅省市縣圖書(shū)館信息化現(xiàn)狀調(diào)研與分析 [J].圖書(shū)與情報(bào),2010,(3):83-87.
[15]黎春蘭,鄧仲華.信息資源視角下云計(jì)算面臨的挑戰(zhàn)[J].圖書(shū)與情報(bào),2011,(3):23-28.
[16]高勇.啤酒與尿布:神奇的購(gòu)物籃分析[M].北京:清華大學(xué)出版社,2008.
作者簡(jiǎn)介:韓翠峰(1978-),女,蘭州商學(xué)院圖書(shū)館館員。