關(guān)鍵詞:小數(shù)據(jù);圖書館;精準(zhǔn)服務(wù);述評
摘 要:小數(shù)據(jù)分析有利于提高圖書館個(gè)性化服務(wù)的精準(zhǔn)度,但受觀念、知識、行動、經(jīng)驗(yàn)等方面的制約,圖書館應(yīng)用小數(shù)據(jù)還存在諸多問題。文章對有關(guān)小數(shù)據(jù)的研究成果進(jìn)行了統(tǒng)計(jì)分析,介紹了國內(nèi)外的研究現(xiàn)狀,探究了小數(shù)據(jù)研究和應(yīng)用的困境,提出了圖書館基于小數(shù)據(jù)開展精準(zhǔn)服務(wù)的策略。
中圖分類號:G251.6文獻(xiàn)標(biāo)識碼:A文章編號:1003-1588(2019)12-0103-04
1 數(shù)據(jù)統(tǒng)計(jì)與分析
1.1 中國知網(wǎng)相關(guān)研究數(shù)據(jù)
筆者在中國知網(wǎng)以圖書館和小數(shù)據(jù)為檢索詞,設(shè)置發(fā)文時(shí)間段為2015—2018年,共檢索到相關(guān)研究論文29篇,具體內(nèi)容如表1所示。
首先,從研究數(shù)量和發(fā)表刊物級別加以分析。本次檢索到的全部研究成果數(shù)據(jù)僅有29條,其中發(fā)表在核心期刊的有16篇,且論文作者比較集中。由此可見,關(guān)于該課題的研究數(shù)量極為有限,學(xué)界對該課題的關(guān)注度還不夠。但是,約55%的論文發(fā)表在核心期刊,在一定程度上肯定了該課題研究的學(xué)術(shù)價(jià)值和現(xiàn)實(shí)意義。其次,從研究主題加以分析。基于小數(shù)據(jù)的圖書館精準(zhǔn)服務(wù)研究的重點(diǎn)問題包括:如何提升服務(wù)質(zhì)量;如何科學(xué)采集、管理小數(shù)據(jù);如何利用小數(shù)據(jù)準(zhǔn)確發(fā)現(xiàn)和預(yù)測讀者的興趣和需求,實(shí)現(xiàn)精準(zhǔn)服務(wù);如何利用小數(shù)據(jù)進(jìn)行學(xué)科服務(wù)、科研服務(wù)、創(chuàng)客教育等服務(wù)創(chuàng)新等。再次,從研究視角和宗旨加以分析。該課題的研究以圖書館個(gè)性化精準(zhǔn)服務(wù)為目標(biāo),旨在提升服務(wù)質(zhì)量和水平;以讀者興趣發(fā)現(xiàn)與預(yù)測為目標(biāo),通過采集、管理和分析小數(shù)據(jù)了解讀者使用圖書館資源的態(tài)勢、把握讀者的閱讀興趣;以大數(shù)據(jù)與小數(shù)據(jù)的融合為基本方略,利用小數(shù)據(jù)分析個(gè)案,大數(shù)據(jù)把控全局,通過大、小數(shù)據(jù)的融合,整合資源,為讀者提供個(gè)性化精準(zhǔn)服務(wù),為圖書館建設(shè)提供科學(xué)的決策依據(jù)。
1.2 愛思唯爾、施普林格等數(shù)據(jù)庫相關(guān)研究數(shù)據(jù)
筆者在愛思唯爾數(shù)據(jù)庫中進(jìn)行檢索,檢索步驟為在“Year(s)”中輸入“2014—2018”,在“Title,abstract or keywords”中輸入“small data”,共檢索到43,514條數(shù)據(jù),這些研究數(shù)據(jù)的類型分布情況如表2所示。
筆者還在施普林格數(shù)據(jù)庫中進(jìn)行了檢索,檢索步驟為在“with the exact phrase”中輸入“small data”,在起止時(shí)間欄中輸入“2014”至“2018”,共檢索到5,802條數(shù)據(jù),這些研究數(shù)據(jù)的學(xué)科分布情況如表3所示。
從表2、表3可以看出:其一,近年來,關(guān)于小數(shù)據(jù)的研究保持穩(wěn)定增長態(tài)勢。其二,研究成果形式主要是學(xué)術(shù)論文(科研論文、文獻(xiàn)綜述等)、會議論文(會議紀(jì)要、會議報(bào)告等)、圖書章節(jié)、短篇報(bào)道等。其三,小數(shù)據(jù)研究主要分布于計(jì)算機(jī)科學(xué)、工程學(xué)、數(shù)學(xué)、生命科學(xué)、醫(yī)療與公共健康、物理學(xué)、地球科學(xué)等領(lǐng)域。這些數(shù)據(jù)凸顯了小數(shù)據(jù)研究的巨大潛力和廣闊前景,同時(shí)也反映出圖書館學(xué)領(lǐng)域內(nèi)的小數(shù)據(jù)研究還比較薄弱,尚需大力挖掘。
2 研究進(jìn)展
2.1 國外研究動態(tài)
較早關(guān)注小數(shù)據(jù)重要性的是美國康奈爾大學(xué)計(jì)算機(jī)科學(xué)教授Estrin Deborah,他從醫(yī)學(xué)角度提出小數(shù)據(jù)源于個(gè)體的活動軌跡,通過提取和分析個(gè)體的活動軌跡能為患者創(chuàng)建個(gè)人健康畫像,從而為及時(shí)發(fā)現(xiàn)和預(yù)測健康問題提供重要的決策參考。隨后,關(guān)于小數(shù)據(jù)的研究在諸多學(xué)科領(lǐng)域迅速蔓延開來,其理論內(nèi)涵及應(yīng)用實(shí)踐也得到不斷豐富和拓展。在圖書館服務(wù)實(shí)踐中,小數(shù)據(jù)和大數(shù)據(jù)各有所長。大數(shù)據(jù)的核心價(jià)值在于宏觀分析和總體控制,即對關(guān)系到圖書館發(fā)展規(guī)劃、圖書館服務(wù)模式選擇、讀者閱讀需求研判、用戶管理等問題進(jìn)行宏觀分析和決策參考;而小數(shù)據(jù)的核心價(jià)值在于微觀分析和個(gè)別管理,即在讀者許可的范圍內(nèi)利用監(jiān)測技術(shù)、傳感器網(wǎng)絡(luò)技術(shù)等實(shí)時(shí)追蹤、采集、存儲、分析讀者個(gè)體的物理位置信息、社交活動、閱讀行為、網(wǎng)絡(luò)瀏覽痕跡等“數(shù)據(jù)面包屑”,為圖書館做出正確判斷和準(zhǔn)確預(yù)測提供有價(jià)值的參考。因此,圖書館在決策過程中加強(qiáng)小數(shù)據(jù)與大數(shù)據(jù)應(yīng)用的結(jié)合和共享,把小數(shù)據(jù)作為大數(shù)據(jù)的重要補(bǔ)充,能有效提高大數(shù)據(jù)決策的效率和精確度。
2.2 國內(nèi)研究動態(tài)
國內(nèi)研究者通常把小數(shù)據(jù)看作是針對個(gè)體用戶的全方位、多層次行為模式和情景感知的全部數(shù)據(jù)集合[1],進(jìn)而把圖書館小數(shù)據(jù)看作是以讀者為中心的高價(jià)值、多類型、數(shù)量有限和即時(shí)更新的數(shù)據(jù)集[2],陳臣則進(jìn)一步根據(jù)小數(shù)據(jù)的價(jià)值總量、密度、可靠性和可用性將其劃分為讀者個(gè)體特征數(shù)據(jù)、讀者行為監(jiān)控?cái)?shù)據(jù)、第三方共享數(shù)據(jù)和外圍社會化數(shù)據(jù)四個(gè)層次[3]。概言之,學(xué)界對圖書館小數(shù)據(jù)的研究主要聚焦在小數(shù)據(jù)的采集、管理和應(yīng)用三個(gè)方面。
2.2.1 小數(shù)據(jù)的采集。李志芳等認(rèn)為,圖書館小數(shù)據(jù)的采集內(nèi)容包括用戶在使用圖書館過程中產(chǎn)生的一切與思維和行為相關(guān)的數(shù)據(jù),即包括與實(shí)際行為相關(guān)的物理行為數(shù)據(jù)、與思維相關(guān)的認(rèn)知行為數(shù)據(jù)及用戶行為間的關(guān)聯(lián)數(shù)據(jù)等[4]。也有學(xué)者認(rèn)為,采集內(nèi)容不僅包括用戶的基本特征數(shù)據(jù)和圖書館活動數(shù)據(jù),還包括社交活動數(shù)據(jù)和第三方開放數(shù)據(jù)等[5]。圖書館可通過用戶表達(dá)和行為感知兩種方式采集用戶數(shù)據(jù)[6],如:圖書館可借助個(gè)人移動終端、可穿戴設(shè)備、圖書館信息設(shè)備、社會信息服務(wù)設(shè)備等進(jìn)行采集,也可通過相關(guān)軟件獲取用戶地理位置信息的小數(shù)據(jù),生成用戶旅游地理位置的熱圖等[7]。
2.2.2 小數(shù)據(jù)的管理。從小數(shù)據(jù)分析、決策流程看,圖書館需要對采集的小數(shù)據(jù)進(jìn)行存儲、預(yù)處理及發(fā)現(xiàn)與預(yù)測讀者需求等。對小數(shù)據(jù)的存儲,較可靠又可行的做法是采用SQL與NoSQL融合的方式,即傳統(tǒng)數(shù)據(jù)庫技術(shù)與大數(shù)據(jù)技術(shù)相結(jié)合的形式[8],該方式可發(fā)揮二者的優(yōu)勢,對小數(shù)據(jù)進(jìn)行有效存儲。小數(shù)據(jù)預(yù)處理方法通常有以下三種:一是小數(shù)據(jù)標(biāo)準(zhǔn)化——采用統(tǒng)一的數(shù)據(jù)管理模式、數(shù)據(jù)結(jié)構(gòu)及設(shè)備接口,提升小數(shù)據(jù)的規(guī)范性。二是過濾噪聲信號——提升信噪比,剔除干擾數(shù)據(jù),保證小數(shù)據(jù)的精確性。三是小數(shù)據(jù)清洗——補(bǔ)充殘缺數(shù)據(jù),糾正錯(cuò)誤數(shù)據(jù),刪除重復(fù)數(shù)據(jù)及無效數(shù)據(jù),保障小數(shù)據(jù)的有效性[9]。圖書館還要對預(yù)處理后的小數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)和預(yù)測讀者需求,進(jìn)而提高個(gè)性化服務(wù)的精準(zhǔn)性。為此,有些學(xué)者專門設(shè)計(jì)了“讀者興趣發(fā)現(xiàn)模型”,如:劉慶麟設(shè)計(jì)了以標(biāo)準(zhǔn)標(biāo)簽理論為工具對讀者閱讀興趣進(jìn)行實(shí)時(shí)更新的模型[10],陳臣設(shè)計(jì)了讀者閱讀興趣的發(fā)現(xiàn)與個(gè)性化服務(wù)定制系統(tǒng)等[11]。
2.2.3 小數(shù)據(jù)的應(yīng)用。圖書館采集、存儲、處理小數(shù)據(jù)是為了準(zhǔn)確發(fā)現(xiàn)和預(yù)測讀者的真實(shí)需求,其最終目標(biāo)是將館藏紙本、電子資源及數(shù)據(jù)、信息、知識資源與讀者需求相匹配,為讀者提供個(gè)性化精準(zhǔn)服務(wù)。圖書館實(shí)現(xiàn)該目標(biāo)的總框架是基于大數(shù)據(jù)配置資源,基于小數(shù)據(jù)提供服務(wù)[12],即利用大數(shù)據(jù)檢索、獲取、整合有用資源,利用小數(shù)據(jù)發(fā)現(xiàn)、預(yù)測讀者需求,并以此為基礎(chǔ)優(yōu)化配置館藏所有資源,為讀者提供精準(zhǔn)服務(wù)。為了實(shí)現(xiàn)該目標(biāo),一些學(xué)者提出了以下措施:構(gòu)建完善的知識資源自動控制識別系統(tǒng);構(gòu)建讀者自我發(fā)現(xiàn)和自我管理平臺[13];構(gòu)建以讀者為中心的開放、平等和個(gè)性化的服務(wù)體系;構(gòu)建基于小數(shù)據(jù)的CRM系統(tǒng),與讀者建立忠誠的客戶關(guān)系體系[14];構(gòu)建一站式檢索服務(wù)平臺[15];利用小數(shù)據(jù)優(yōu)化電子文獻(xiàn)選購、讀者群體分析、信息咨詢等服務(wù)工作[16]等。
3 研究困境及突破
3.1 研究困境
小數(shù)據(jù)研究在圖書館界的應(yīng)用難有突破,關(guān)鍵在于觀念、知識、行動、經(jīng)驗(yàn)等方面存在著諸多障礙和局限:一是觀念障礙。圖書館引入新技術(shù)會產(chǎn)生兩種相反的效應(yīng):新技術(shù)的利用會給那些因循守舊、固步自封及學(xué)習(xí)能力弱的館員帶來壓力,致使其身心俱疲,加劇職業(yè)倦怠;而新技術(shù)的利用也會給那些善于學(xué)習(xí)、勇于開拓進(jìn)取、敢于突破自我的館員帶來機(jī)遇,激發(fā)其工作熱情,增強(qiáng)其職業(yè)情感。圖書館應(yīng)用小數(shù)據(jù)也面臨這一問題,如果視小數(shù)據(jù)為壓力,就容易滋生懷疑、恐懼、焦慮等消極心理和負(fù)面情緒,進(jìn)而影響制度設(shè)計(jì)和實(shí)踐行動。二是知識局限。計(jì)算機(jī)技術(shù)、物聯(lián)網(wǎng)技術(shù)的發(fā)展及移動終端、可穿戴設(shè)備等的普及,推動了人類活動與信息空間、物理空間的深度融合和無縫銜接,進(jìn)而使以讀者為中心的小數(shù)據(jù)的產(chǎn)生成為可能,小數(shù)據(jù)研究也在很大程度上依賴于圖書館利用先進(jìn)技術(shù)實(shí)現(xiàn)數(shù)據(jù)的挖掘、采集、管理和應(yīng)用,但廣大圖書館服務(wù)的踐行者——圖書館員和從事圖書館學(xué)研究的科研人員似乎還不具備對小數(shù)據(jù)開展研究的相關(guān)技術(shù)和知識。三是行動障礙。小數(shù)據(jù)專注于用戶的個(gè)性化,而圖書館服務(wù)則面向全體讀者,更關(guān)注共性、普遍性,雖然小數(shù)據(jù)具有一定的代表性,但圖書館要將它放大并應(yīng)用于服務(wù)全體讀者則缺乏嚴(yán)謹(jǐn)性。如:圖書館在圖書采選的過程中不僅要考慮個(gè)別讀者的需求,還要考慮館藏情況、專業(yè)設(shè)置與發(fā)展情況、其他讀者的需求情況等。因此,如何利用小數(shù)據(jù)將個(gè)性化服務(wù)與普遍性服務(wù)相協(xié)同,如何將讀者個(gè)體小數(shù)據(jù)與圖書館大數(shù)據(jù)相銜接,這些問題是圖書館在實(shí)踐中面臨的切實(shí)困難,亟待加以解決。四是經(jīng)驗(yàn)局限??v觀國內(nèi)外相關(guān)研究和實(shí)踐的現(xiàn)狀,雖然小數(shù)據(jù)研究在其他一些領(lǐng)域碩果累累,但在圖書館服務(wù)方面還沒有形成成熟的理論和可普遍推廣的模式,許多研究要么停留在“研究”階段,要么仍處于一種“建模”狀態(tài),尚未付諸實(shí)踐,因此,理論的不成熟和實(shí)踐的滯后阻礙了小數(shù)據(jù)在圖書館界的應(yīng)用。
3.2 突破上述困境的策略
3.2.1 平臺開發(fā)與建設(shè)。以智慧服務(wù)為核心的智慧圖書館正在成為未來圖書館發(fā)展的新趨勢,智慧圖書館建設(shè)離不開集信息檢索、資源導(dǎo)航、參考咨詢、開放存取、應(yīng)用下載等服務(wù)于一體的智能平臺,基于小數(shù)據(jù)的個(gè)性化精準(zhǔn)服務(wù)也需要這種智能平臺,圖書館只有利用這種平臺,才能有效實(shí)現(xiàn)數(shù)據(jù)采集、管理和應(yīng)用等諸多功能。因此,如何將小數(shù)據(jù)管理平臺嵌入或融入智慧圖書館的智能平臺,是一個(gè)值得圖書館深入探究的問題。
3.2.2 小數(shù)據(jù)的采集、管理和應(yīng)用。小數(shù)據(jù)能否有效提高圖書館的服務(wù)質(zhì)量取決于三個(gè)因素:采集、管理和應(yīng)用。首先,雖然學(xué)界對如何采集小數(shù)據(jù)提出了許多設(shè)想,但由于小數(shù)據(jù)包含了諸多個(gè)體的所有活動信息,這些設(shè)想是否能保證采集數(shù)據(jù)的全面性、真實(shí)性、可靠性則有待商榷。其次,活的個(gè)體使關(guān)于該個(gè)體的小數(shù)據(jù)處于實(shí)時(shí)更新中,對這些實(shí)時(shí)更新、靈活多變的信息進(jìn)行標(biāo)準(zhǔn)化、降噪及清洗,使其在動態(tài)變化中保持一種相對穩(wěn)定的可用狀態(tài),這個(gè)過程充滿了許多不確定性。再次,小數(shù)據(jù)應(yīng)用的最終目的是發(fā)現(xiàn)和預(yù)測讀者需求,并為讀者提供精準(zhǔn)服務(wù),但圖書館在利用小數(shù)據(jù)的過程中也存在一些疑慮,如:如何保護(hù)讀者隱私不受侵犯,確保圖書館提供的推介、推送等服務(wù)與讀者真實(shí)需求相吻合,做到個(gè)性化服務(wù)的“適度”,避免引起讀者反感,獲取讀者的實(shí)際需求,及時(shí)調(diào)整和優(yōu)化服務(wù)內(nèi)容等。
3.2.3 小數(shù)據(jù)與大數(shù)據(jù)的融合。小數(shù)據(jù)聚焦于對每個(gè)讀者的個(gè)別、具體的認(rèn)知,關(guān)注的是特殊性、個(gè)體性;而大數(shù)據(jù)聚焦于對所有讀者的整體、共同的認(rèn)知。此外,大數(shù)據(jù)還囊括了一切關(guān)乎圖書館建設(shè)和發(fā)展的數(shù)據(jù)信息,如館藏資源情況、館員情況、館舍情況、圖書館管理制度實(shí)施情況、圖書館與館外組織的協(xié)同情況等,因此,大數(shù)據(jù)關(guān)注的是普遍性、全局性。小數(shù)據(jù)與大數(shù)據(jù)的融合是圖書館提高服務(wù)精準(zhǔn)度和決策有效性的重要途徑,一方面,圖書館可運(yùn)用小數(shù)據(jù)發(fā)現(xiàn)和預(yù)測讀者的真實(shí)需求;另一方面,圖書館可運(yùn)用大數(shù)據(jù)挖掘和整合與讀者需求相匹配的資源信息,通過小數(shù)據(jù)與大數(shù)據(jù)之間的融合與聯(lián)動,推動供需平衡,實(shí)現(xiàn)精準(zhǔn)服務(wù)。但是,究竟如何實(shí)現(xiàn)小數(shù)據(jù)與大數(shù)據(jù)的融合與聯(lián)動還需要圖書館開展進(jìn)一步探索和研究。
3.2.4 圖書館基于小數(shù)據(jù)的個(gè)性化精準(zhǔn)服務(wù)模式與方法。雖然已有部分學(xué)者探討和設(shè)計(jì)了一些模式和路徑,但畢竟還只是理論,理論推向?qū)嵺`還需要滿足特定的主客觀條件。因此,圖書館應(yīng)從自身實(shí)際出發(fā),以科學(xué)理論為指導(dǎo),加強(qiáng)理論與實(shí)踐的結(jié)合,推動模式建構(gòu)和服務(wù)創(chuàng)新,并在實(shí)踐中不斷摸索、調(diào)整及推廣。
3.2.5 轉(zhuǎn)變館員觀念、提升館員技能的措施與手段?;谛?shù)據(jù)的圖書館精準(zhǔn)服務(wù)歸根結(jié)底還是人(館員)對人(讀者)的服務(wù),小數(shù)據(jù)不過是工具和中介物。在數(shù)據(jù)挖掘、人工智能、虛擬現(xiàn)實(shí)等新技術(shù)不斷發(fā)展的大環(huán)境下,圖書館應(yīng)轉(zhuǎn)變服務(wù)理念,提升服務(wù)技能,滿足讀者的多元化需求。一方面,圖書館要構(gòu)建完善的制度,指引和敦促館員轉(zhuǎn)變觀念,提升他們的服務(wù)技能;另一方面,館員要理性判斷形勢,主動提高自身的綜合素質(zhì)和服務(wù)能力。
參考文獻(xiàn):
[1] 李立睿,鄧仲華.“互聯(lián)網(wǎng)+”背景下科研用戶的小數(shù)據(jù)融合研究[J].圖書情報(bào)工作,2016(3):58-63.
[2][14] 馬曉亭,陳臣.基于可信小數(shù)據(jù)的圖書館個(gè)性化服務(wù)研究[J].圖書情報(bào)工作,2015(4):70-75.
[3] 陳臣.基于小數(shù)據(jù)決策支持的圖書館個(gè)性化服務(wù)[J].圖書與情報(bào),2015(1):82-86.
[4] 李志芳.“互聯(lián)網(wǎng)+”驅(qū)動下圖書館用戶的小數(shù)據(jù)行為研究[J].圖書館理論與實(shí)踐,2017(9):108-112.
[5][9] 王欣,張冬梅.大數(shù)據(jù)環(huán)境下基于高校讀者小數(shù)據(jù)的圖書館個(gè)性化智能服務(wù)研究[J].情報(bào)理論與實(shí)踐,2018(2):132-137.
[6] 陳廉芳.大數(shù)據(jù)環(huán)境下圖書館用戶小數(shù)據(jù)的采集、分析與應(yīng)用[J].國家圖書館學(xué)刊,2016(3):69-74.
[7][8] 楊曉剛,姜毅,張璡,等.基于大數(shù)據(jù)技術(shù)的用戶小數(shù)據(jù)管理[J].情報(bào)理論與實(shí)踐,2018(3):29-33.
[10][13] 劉慶麟.基于小數(shù)據(jù)的圖書館精準(zhǔn)服務(wù)研究[J].圖書館工作與研究,2017(5):45-50.
[11] 陳臣.圖書館小數(shù)據(jù)讀者個(gè)性化興趣預(yù)測與發(fā)現(xiàn)模型的構(gòu)建[J].圖書館論壇,2017(5):98-105.
[12] 牛勇.圖書館精準(zhǔn)服務(wù)研究[J].圖書館學(xué)研究,2016(5):50-52.
[15] 于麗娟.大數(shù)據(jù)背景下高校圖書館小數(shù)據(jù)服務(wù)平臺的搭建[J].四川圖書館學(xué)報(bào),2017(4):22-25.
[16] 王昊.基于小數(shù)據(jù)的圖書館個(gè)性化服務(wù)研究[J].圖書館學(xué)刊,2016(6):102-104.
(編校:孫新梅)
收稿日期:2019-11-06
作者簡介:陶海柱(1979— ),中原工學(xué)院圖書館館員。