王 木炎
(貴州省圖書館,貴州 貴陽 550003)
在大數(shù)據(jù)時代,用戶每天使用互聯(lián)網(wǎng)辦公、社交、信息檢索、發(fā)送郵件、學習等行為會使互聯(lián)網(wǎng)虛擬空間充斥著大量的用戶行為數(shù)據(jù),這些用戶數(shù)據(jù)匯聚成為互聯(lián)網(wǎng)虛擬空間的大數(shù)據(jù)資源,并成為各個互聯(lián)網(wǎng)公司分析用戶行為、掌握用戶行為偏好的重要資源。伴隨著社交媒體、移動網(wǎng)絡大數(shù)據(jù)規(guī)模的擴大,越來越多的學者對用戶大規(guī)模數(shù)據(jù)挖掘并提供個性化推薦服務進行了深入研究,用戶畫像作為個性化推薦的重要工具,被廣泛應用于各類移動電商,幫助互聯(lián)網(wǎng)企業(yè)精準預測用戶行為、定位用戶個性化需求。用戶畫像是指使用爬蟲程序?qū)τ脩舻纳暇W(wǎng)軌跡、日志記錄、瀏覽記錄、社交媒體信息、電商交易記錄進行數(shù)據(jù)爬取,對用戶的教育背景、年齡構(gòu)成、個性化偏好、興趣習慣、學歷層次等個體信息進行搜集,結(jié)合算法工具建立反映用戶全部行為動態(tài)與個性化特征的信息標簽[1]。在大數(shù)據(jù)時代,圖書館有效應用數(shù)據(jù)挖掘技術對用戶個體信息數(shù)據(jù)全面搜集,能勾勒出反映用戶興趣與個性化行為偏好的信息標簽,針對用戶個性化特征開展閱讀推廣服務,有效提升閱讀推廣服務效能。
在圖情領域,用戶畫像是圖書館借助大數(shù)據(jù)技術、數(shù)據(jù)挖掘工具、信息采集工具針對用戶使用網(wǎng)絡的日志記錄、信息瀏覽記錄及上網(wǎng)行為動態(tài)信息實現(xiàn)科學挖掘并進行有效信息標注的信息集合,能對用戶的個性化需求進行深度挖掘,針對用戶個性化行為有效預測,并將具有不同興趣習慣、行為偏好的用戶進行特定分群,對特定用戶進行科學標注,智能區(qū)分不同的用戶群,進而實現(xiàn)圖書館信息資源與用戶個性化需求的精準對接。圖書館每年都會舉辦大量的閱讀推廣活動,這些活動的規(guī)模有大有小,在內(nèi)容、主題上也存在著極大的差異,但仍然不能滿足讀者日益多樣化的閱讀服務需求。針對讀者的個性化需求,圖書館可使用數(shù)據(jù)挖掘技術、算法工具對讀者在圖書館使用過程中產(chǎn)生的各類行為數(shù)據(jù)、信息數(shù)據(jù)、網(wǎng)頁記錄、日志記錄有效搜集、清洗、篩選、標注,建立用戶畫像,對讀者的個性化閱讀需求科學預測,精準匹配閱讀資源,讓用戶的個性化閱讀需求及時得到滿足[1]。如大連市圖書館依托自身龐大的館藏資源數(shù)據(jù)與用戶行為數(shù)據(jù),引入大數(shù)據(jù)算法工具構(gòu)建用戶畫像,針對用戶潛在的閱讀需求有效預測,讀者綁定身份證件就能進入“我的圖書館”品讀圖書館智能推薦的書籍。
數(shù)據(jù)采集是圖書館用戶畫像構(gòu)建的基礎工作,數(shù)據(jù)規(guī)模越大、采集效率越高,用戶畫像的清晰度也就越高,圖書館對用戶行為動態(tài)、興趣偏好、興趣習慣掌握得越充分,越能有效對用戶的個性化需求進行預測。用戶畫像數(shù)據(jù)分為靜態(tài)數(shù)據(jù)、動態(tài)數(shù)據(jù)兩部分。靜態(tài)數(shù)據(jù)包括用戶的籍貫、年齡、社會閱歷、教育背景、職業(yè)、住址、工作單位等信息;動態(tài)數(shù)據(jù)是描述用戶社會屬性與個性化特征的數(shù)據(jù)信息,包括用戶的閱讀興趣、特長愛好等顯性信息,也包含用戶網(wǎng)絡瀏覽記錄、網(wǎng)絡日志、社交動態(tài)、網(wǎng)絡瀏覽內(nèi)容等隱性信息[2]。因此,圖書館可以使用爬蟲工具、算法工具對用戶身份卡、圖書館登記資料、線上注冊信息、社交媒體記錄、網(wǎng)站瀏覽下載記錄、移動服務終端使用記錄等數(shù)據(jù)進行采集,保障用戶畫像構(gòu)建具有充足的數(shù)據(jù)。
用戶的網(wǎng)絡使用行為具有很大的隨機性,在使用圖書館門戶網(wǎng)站、移動終端、社交媒體過程中會產(chǎn)生大量行為動態(tài)數(shù)據(jù),為保障用戶畫像具有較高的清晰度,需要對用戶網(wǎng)絡使用過程產(chǎn)生的每一條數(shù)據(jù)進行分析與挖掘。圖書館借助日志挖掘工具與大數(shù)據(jù)技術對具有相同語義特征、結(jié)構(gòu)特征的數(shù)據(jù)聚類歸納,過濾掉與用戶個性化偏好、興趣特征無關的冗余數(shù)據(jù),篩選出反映用戶興趣習慣的數(shù)據(jù),提高數(shù)據(jù)集成度。在數(shù)據(jù)搜集過程中,要針對讀者管理系統(tǒng)、知識發(fā)現(xiàn)系統(tǒng)、文獻資源檢索系統(tǒng)、移動服務平臺、門戶網(wǎng)站中直接反映用戶行為動態(tài)的數(shù)據(jù)信息,包括用戶社會屬性、社交互動、網(wǎng)絡行為、網(wǎng)站登錄、資源下載、點贊、收藏、分享等,充分利用爬蟲工具與大數(shù)據(jù)算法工具進行深度挖掘,并按照關聯(lián)規(guī)則、語義規(guī)則清洗、篩選、分類,進行格式轉(zhuǎn)換,轉(zhuǎn)化成為可識別、可利用的數(shù)據(jù)庫文件,進行統(tǒng)一存儲與利用[3]。
用戶畫像是反映用戶行為動態(tài)、興趣偏好的標簽化數(shù)據(jù)集合,分為用戶屬性特征畫像和用戶行為特征畫像兩類。圖書館構(gòu)建用戶畫像需要針對各個用戶管理平臺、門戶網(wǎng)站、移動客戶端中的用戶屬性數(shù)據(jù)、用戶行為數(shù)據(jù)進行采集,并進行語義化標注,建立反映用戶屬性特征、行為特征的數(shù)據(jù)文本,并對數(shù)據(jù)文本進行標注,進而勾勒出用戶畫像。用戶屬性特征畫像的構(gòu)建需要對包括用戶屬性的信息,如年齡、姓名、職業(yè)、工作單位、學歷、教育背景等數(shù)據(jù)進行采集;用戶行為特征畫像構(gòu)建需要搜集包括用戶互聯(lián)網(wǎng)檢索、查詢、標注、下載、互動、轉(zhuǎn)發(fā)等行為動態(tài)數(shù)據(jù)[4]。用戶在使用圖書館過程中,不僅包括網(wǎng)絡行為動態(tài)數(shù)據(jù),也包括實際行為動態(tài)數(shù)據(jù),如用戶的圖書借閱、圖書查詢、期刊訂閱等,這些實際行為數(shù)據(jù)更能反映用戶的習慣偏好與閱讀興趣,更能為圖書館預測用戶個性化閱讀需求、借閱行為提供參考。
智慧閱讀推廣服務是一項系統(tǒng)性的工作,需要兼顧用戶識別、閱讀服務、閱讀推廣的各個環(huán)節(jié)。這就要求圖書館在運用用戶畫像開展智慧閱讀推廣服務中,要基于用戶畫像做好用戶群體的劃分,對每個用戶的個性化閱讀需求精準定位,不能以無差別批量化方式向用戶推廣閱讀資源,需要以讀者為中心,保障讀者的服務體驗。實踐證明,具有較高用戶黏性的知識類產(chǎn)品往往具備特定的用戶群,如豆瓣是定位于文藝青年的知識分享工具,有較高的用戶體驗度;知乎是定位于特定索引話題的知識推薦工具,它通過大數(shù)據(jù)技術對用戶群特定知識需求進行語義關聯(lián),根據(jù)用戶的興趣偏好勾勒用戶畫像,建立面向用戶群的個性化標簽,為用戶智能推薦知識資源[5]。
圖書館應全面加強以用戶興趣特征作為分類工具的智能推薦工具的建立,從面向用戶個性化推薦服務的閱讀資源數(shù)量與覆蓋面著手,打造滿足用戶全時域、全場景的智能閱讀推廣服務平臺。此外,圖書館需要以用戶的個性化閱讀體驗為核心,充分借助用戶畫像和智能算法工具打通智慧閱讀推廣服務中的各個環(huán)節(jié),打造適用于多種閱讀場景的智慧閱讀推廣服務機制。圖書館根據(jù)用戶興趣特征實現(xiàn)閱讀資源個性化推薦,不僅保障了閱讀資源的流動性,也促進了閱讀推廣服務的持續(xù)性,提升了用戶閱讀推廣服務體驗。
在圖書館智慧閱讀推廣服務中,圖書館使用大數(shù)據(jù)算法與智能推薦工具能針對用戶行為偏好建立閱讀推廣服務平臺,并借助5G網(wǎng)絡與AR工具針對用戶個性化閱讀需求建立沉浸式閱讀場景,能有效提升用戶的閱讀體驗。在人工智能時代,讀者迫切需要沉浸式閱讀場景進行深度學習,傳統(tǒng)的數(shù)字化閱讀推薦方式主要是圖書館員根據(jù)讀者意見以新書推薦、讀書論壇、線上競答、名家論壇等活動開展閱讀推廣服務,具有一定局限性,不能兼顧每一位讀者的個性化需求。依托用戶畫像塑造沉浸式閱讀場景,根據(jù)讀者的個性化需求使用可穿戴設備、VR/AR工具為讀者智能推薦閱讀資源,可以對用戶的需求信息精準把握,為用戶量身定制沉浸式閱讀推廣服務方案,使讀者能在沉浸式閱讀場景中快速檢索、精準查新、深度閱讀,獲得良好的閱讀服務體驗。
基于用戶畫像的圖書館智慧閱讀推廣服務模式構(gòu)建需要從技術模塊、資源模塊、推廣模塊、服務模塊4個維度入手,建立起完善的智慧閱讀推廣服務模式,為用戶提供個性化閱讀推廣服務。
基于用戶畫像的圖書館智慧閱讀推廣服務模式技術要素包括大數(shù)據(jù)技術、傳感器技術、智能分析工具、個性化推薦算法等。用戶畫像在用戶行為動態(tài)特征、社交屬性特征分析方面具有一定的優(yōu)勢,能根據(jù)用戶的個性化閱讀需求智能推薦閱讀資源。公共圖書館需要根據(jù)不同類型的用戶群,全面運用大數(shù)據(jù)技術、傳感器技術對用戶不同場景中的信息數(shù)據(jù)進行采集,并使用大數(shù)據(jù)技術篩選出高價值的用戶信息,及時對用戶畫像修訂補充,發(fā)揮出技術優(yōu)勢,使用智能分析工具標注用戶的個性化需求特征,依靠智能推薦算法為用戶推薦符合其個性化閱讀偏好的數(shù)字化資源,保障用戶的智慧閱讀服務體驗[6]。
資源模塊是圖書館智慧閱讀推廣服務的重要組成部分?;谟脩舢嬒駥?shù)字文獻資源智能分類,將符合不同用戶個性化需求的文獻資源分別存儲到不同的資源數(shù)據(jù)庫,可滿足不同用戶群的閱讀需求。用戶畫像進一步提升了數(shù)字文獻資源的利用率,使用戶的個性化需求與閱讀資源更能精準匹配,用戶借助智能推薦工具也能更便捷地獲取數(shù)字閱讀資源,更能在碎片化時間進行閱讀。因此,圖書館需要基于用戶畫像建設個性化數(shù)字文獻資源數(shù)據(jù)庫,更新數(shù)字資源種類,豐富數(shù)字資源內(nèi)容,為用戶提供更加便捷的個性化資源推薦服務。
推廣模塊是基于用戶畫像的圖書館智慧閱讀推廣服務時應用的社交媒體、數(shù)字平臺、門戶網(wǎng)站。數(shù)字化的閱讀推廣服務包括新書推薦、知識推送等?;谟脩舢嬒竦闹腔坶喿x推廣服務呈現(xiàn)出個性化、共享化的特點,圖書館根據(jù)用戶畫像可以使用智能算法工具依托微信公眾平臺、官方微博、微信小程序、抖音、今日頭條等社交媒體面向用戶個性化推薦,并基于用戶閱讀偏好制定閱讀服務方案,最大程度上滿足用戶的個性化需求。
服務模塊主要面向用戶提供沉浸式閱讀服務、個性化推薦服務,由于當前圖書館進行數(shù)字化轉(zhuǎn)型致力于為用戶提供深層次、共享化的閱讀服務場景,以構(gòu)建沉浸式、情景式、交互式的閱讀空間為目標,因此,圖書館基于用戶畫像的智慧閱讀推廣服務中需要以用戶為中心,為用戶提供深層交互學習的閱讀服務。這也就要求圖書館基于用戶畫像使用VR/AR技術在服務端口輸出情景化信息,讓用戶通過可穿戴設備、虛擬現(xiàn)實眼鏡隨時隨地進入虛擬閱讀場景深度學習。
人工智能時代,圖書館借助大數(shù)據(jù)技術多元化搜集用戶信息數(shù)據(jù)可構(gòu)建出反映用戶行為特征與興趣偏好的用戶畫像。用戶畫像依托算法工具、智能分析工具、人工智能技術可根據(jù)用戶的個性化需求智能推薦數(shù)字閱讀資源,并借助VR/AR技術為用戶構(gòu)建沉浸式閱讀場景,滿足用戶深度學習、深度共享的需求。在智慧閱讀推廣服務中,還需要智能感知用戶的行為動態(tài),精準把握用戶的閱讀需求,借助社交媒體、數(shù)字平臺精準進行數(shù)字資源推薦,使用戶閱讀服務需求得到有效滿足。