国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)環(huán)境下基于用戶畫像的學(xué)術(shù)文獻(xiàn)推薦系統(tǒng)研究

2019-02-06 03:56劉相金王夢(mèng)菊
河南圖書館學(xué)刊 2019年12期
關(guān)鍵詞:用戶畫像大數(shù)據(jù)環(huán)境

劉相金 王夢(mèng)菊

關(guān)鍵詞:大數(shù)據(jù)環(huán)境;用戶畫像;學(xué)術(shù)文獻(xiàn)推薦系統(tǒng)

摘 要:文章在闡述用戶畫像概念的基礎(chǔ)上,從技術(shù)工具、數(shù)據(jù)模塊、學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫、學(xué)術(shù)文獻(xiàn)推薦模塊等角度總結(jié)了基于用戶畫像學(xué)術(shù)文獻(xiàn)推薦系統(tǒng)的構(gòu)建方式,以期為用戶推送符合其需求的學(xué)術(shù)文獻(xiàn)。

中圖分類號(hào):G250文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-1588(2019)12-0113-03

隨著社會(huì)發(fā)展進(jìn)入大數(shù)據(jù)時(shí)代,信息數(shù)據(jù)越來越多,讀者的需求也越來越多元化。面對(duì)這種趨勢(shì),圖書館應(yīng)使用大數(shù)據(jù)技術(shù)針對(duì)用戶的多元需求進(jìn)行分析、定位及精準(zhǔn)預(yù)測(cè),在精準(zhǔn)判定用戶個(gè)性化學(xué)術(shù)文獻(xiàn)需求的基礎(chǔ)上,使用新型技術(shù)創(chuàng)新圖書館服務(wù)模式,使學(xué)術(shù)文獻(xiàn)服務(wù)與用戶需求精準(zhǔn)契合。在用戶感知層面,大多數(shù)圖書館習(xí)慣以調(diào)研的方式獲取用戶需求,甚至根據(jù)經(jīng)驗(yàn)主觀判定用戶需求,造成對(duì)讀者需求定位不準(zhǔn),學(xué)術(shù)服務(wù)精準(zhǔn)性較差。伴隨大數(shù)據(jù)技術(shù)的發(fā)展,圖書館應(yīng)使用數(shù)據(jù)分析技術(shù)、數(shù)據(jù)挖掘技術(shù)根據(jù)用戶的網(wǎng)絡(luò)行為軌跡及有關(guān)數(shù)據(jù)記錄獲取用戶數(shù)據(jù),精準(zhǔn)定位用戶需求,以便為用戶提供更有效的個(gè)性化服務(wù)[1]。同時(shí),圖書館館藏資源的增加尤其是多種數(shù)據(jù)資源的聚合,使用戶利用圖書館查找符合自身個(gè)性化需求的資源越來越困難。用戶畫像作為大數(shù)據(jù)時(shí)代實(shí)現(xiàn)用戶需求挖掘及行為偏好識(shí)別的新型技術(shù)體系,可以使圖書館根據(jù)用戶行為偏好及個(gè)性化需求提供學(xué)術(shù)文獻(xiàn),使學(xué)術(shù)文獻(xiàn)推薦服務(wù)更加精準(zhǔn)。因此,構(gòu)建基于用戶畫像模型的學(xué)術(shù)文獻(xiàn)推薦系統(tǒng),可以對(duì)用戶行為偏好及個(gè)性化需求進(jìn)行深度挖掘,從而實(shí)現(xiàn)圖書館館藏資源與用戶需求的精準(zhǔn)匹配。

1 用戶畫像概述

1.1 用戶畫像的含義

用戶畫像是指在大數(shù)據(jù)環(huán)境中對(duì)用戶行為偏好和個(gè)性化需求進(jìn)行分析和預(yù)測(cè)的一種技術(shù)機(jī)制,主要借助爬蟲數(shù)據(jù)對(duì)用戶瀏覽網(wǎng)頁及進(jìn)行互聯(lián)網(wǎng)交互行為時(shí)產(chǎn)生的運(yùn)動(dòng)軌跡、網(wǎng)站瀏覽日志記錄進(jìn)行爬取搜集,以實(shí)現(xiàn)用戶行為偏好數(shù)據(jù)的深度挖掘、提取、分析。用戶畫像實(shí)現(xiàn)的基礎(chǔ)是對(duì)用戶需求、個(gè)性、習(xí)慣的精準(zhǔn)識(shí)別,核心機(jī)制是為可識(shí)別的用戶偏好數(shù)據(jù)、行為數(shù)據(jù)貼“標(biāo)簽”,使面向用戶的虛擬數(shù)據(jù)、個(gè)性化信息有據(jù)可依。綜合來看,用戶畫像關(guān)注的焦點(diǎn)是用戶的行為、個(gè)性,并將用戶的社會(huì)屬性、背景、經(jīng)歷、行為與服務(wù)預(yù)期關(guān)聯(lián)起來[2]。

1.2 用戶畫像在圖書館的應(yīng)用

用戶畫像應(yīng)用的重要目的是精準(zhǔn)刻畫用戶的行為偏好及個(gè)性化特點(diǎn),分析用戶的個(gè)性化需求,為圖書館實(shí)現(xiàn)精準(zhǔn)的學(xué)術(shù)文獻(xiàn)推薦以及對(duì)用戶身份進(jìn)行精準(zhǔn)識(shí)別提供技術(shù)支持。用戶畫像在圖書館學(xué)術(shù)文獻(xiàn)推薦領(lǐng)域的主要作用包括:①精準(zhǔn)分析用戶群,挖掘潛在用戶,預(yù)測(cè)潛在用戶需求并進(jìn)行學(xué)術(shù)文獻(xiàn)精準(zhǔn)推薦。②根據(jù)用戶的資源獲取習(xí)慣、個(gè)性化資源需求、行為偏好分析用戶可能產(chǎn)生的學(xué)術(shù)資源需求,分析學(xué)術(shù)資源的重點(diǎn)內(nèi)容、應(yīng)用趨向,為定制學(xué)術(shù)資源提供參考數(shù)據(jù)。③根據(jù)用戶學(xué)術(shù)文獻(xiàn)獲取行為、興趣習(xí)慣、行為偏好面向用戶精準(zhǔn)推薦學(xué)術(shù)文獻(xiàn),使用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)某一時(shí)間段內(nèi)用戶需求的具體描述,考察資源利用效果,評(píng)價(jià)學(xué)術(shù)文獻(xiàn)推薦效果。

2 圖書館用戶畫像模型構(gòu)建

2.1 圖書館用戶畫像數(shù)據(jù)源

圖書館構(gòu)建用戶畫像模型是指根據(jù)用戶使用網(wǎng)絡(luò)系統(tǒng)、數(shù)字圖書館、智慧圖書館產(chǎn)生的行為數(shù)據(jù)、運(yùn)動(dòng)軌跡對(duì)用戶行為偏好高度還原,采集的數(shù)據(jù)都與用戶行為有關(guān)。在圖書館服務(wù)中,用戶畫像數(shù)據(jù)處于多重系統(tǒng)網(wǎng)絡(luò)中,各類數(shù)據(jù)相互獨(dú)立,缺乏關(guān)聯(lián)[3]。在構(gòu)建用戶畫像模型前,先要根據(jù)用戶信息、行為數(shù)據(jù)對(duì)用戶行為偏好進(jìn)行初步刻畫,建立簡易的用戶畫像,后期通過抓取用戶大量的行為軌跡及網(wǎng)絡(luò)日志數(shù)據(jù)進(jìn)行畫像完善,并建立完善的標(biāo)簽系統(tǒng)。用戶畫像使用的用戶數(shù)據(jù)可分為直接數(shù)據(jù)和關(guān)聯(lián)數(shù)據(jù)。直接數(shù)據(jù)包括用戶年齡、學(xué)歷、性別、家庭、專業(yè)等基礎(chǔ)信息;關(guān)聯(lián)數(shù)據(jù)包括用戶的行為動(dòng)態(tài)、心理活動(dòng)、情緒變化、閱讀方式、知識(shí)獲取程度、網(wǎng)絡(luò)數(shù)據(jù)、網(wǎng)站瀏覽軌跡等數(shù)據(jù)。

2.2 用戶畫像模型

圖書館可以借助大數(shù)據(jù)系統(tǒng)進(jìn)行數(shù)據(jù)分析與挖掘,并利用數(shù)據(jù)標(biāo)簽進(jìn)行標(biāo)記,然后根據(jù)用戶特征建立標(biāo)簽系統(tǒng),再依托標(biāo)簽系統(tǒng)精準(zhǔn)定位個(gè)體用戶及用戶群,從而建立描述用戶個(gè)性化需求、個(gè)性特征及行為偏好的畫像(見圖1)。

首先,圖書館要對(duì)用戶使用圖書館過程中產(chǎn)生的各類數(shù)據(jù)進(jìn)行融合和分析,如:使用爬蟲工具、文本挖掘技術(shù)等對(duì)圖書館信息門戶網(wǎng)站、圖書館線上信息服務(wù)系統(tǒng)、移動(dòng)服務(wù)終端、線上知識(shí)庫系統(tǒng)、信息處理系統(tǒng)、用戶訪問模塊中的各類數(shù)據(jù)進(jìn)行抓取,然后按照一定的數(shù)據(jù)獲取規(guī)則及篩選標(biāo)準(zhǔn)對(duì)用戶的基本信息及使用圖書館系統(tǒng)產(chǎn)生的各類行為數(shù)據(jù)進(jìn)行整合歸類,形成結(jié)構(gòu)化的數(shù)據(jù)信息,再對(duì)獲取的大數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換等預(yù)處理,并進(jìn)行深度聚類、結(jié)構(gòu)化處理、深度挖掘,最后建成完整的分析機(jī)制[4]。其次,要建立完善的用戶標(biāo)簽體系。用戶畫像標(biāo)簽是建立用戶畫像模型的核心步驟,是大數(shù)據(jù)環(huán)境下對(duì)用戶基礎(chǔ)數(shù)據(jù)、行為數(shù)據(jù)進(jìn)行數(shù)字化抽象統(tǒng)計(jì)分析的信息,能有效反映出用戶的特征和行為偏好。建立多種標(biāo)簽對(duì)關(guān)鍵數(shù)據(jù)進(jìn)行標(biāo)記,能更直觀地反映出用戶的行為偏好特征。再次,根據(jù)個(gè)體用戶及用戶群的需求偏好及特征向量,依靠用戶畫像建立反映個(gè)體用戶及用戶群的服務(wù)預(yù)測(cè)機(jī)制,即依靠清晰的畫像描述反映個(gè)體用戶與用戶群的需求變化,再根據(jù)用戶這種需求變化趨勢(shì)向用戶主動(dòng)推送學(xué)術(shù)文獻(xiàn)。值得注意的是,在圖書館學(xué)術(shù)服務(wù)中,用戶的興趣、行為偏好并不是固定的,而是會(huì)伴隨用戶的教育背景、職業(yè)經(jīng)歷發(fā)生變化,這就需要圖書館根據(jù)用戶的興趣、行為偏好及時(shí)優(yōu)化與調(diào)整用戶畫像。

3 大數(shù)據(jù)環(huán)境下基于用戶畫像的學(xué)術(shù)文獻(xiàn)推薦系統(tǒng)構(gòu)建

通過對(duì)用戶基本信息和行為數(shù)據(jù)的搜集、提取、分析、挖掘建立起反映用戶行為偏好、個(gè)性化特征的畫像模型,可以實(shí)現(xiàn)資源的精準(zhǔn)匹配、個(gè)性化推薦及需求的科學(xué)預(yù)測(cè)。基于此,基于用戶畫像的學(xué)術(shù)文獻(xiàn)推薦系統(tǒng)可由技術(shù)工具、數(shù)據(jù)模塊、用戶畫像模型及學(xué)術(shù)文獻(xiàn)資源推薦模塊組成(見圖2)。

3.1 技術(shù)工具

圖書館構(gòu)建基于用戶畫像的學(xué)術(shù)文獻(xiàn)推薦系統(tǒng)會(huì)應(yīng)用到一系列的技術(shù)工具。圖書館先要對(duì)用戶使用圖書館系統(tǒng)產(chǎn)生的底層數(shù)據(jù)進(jìn)行搜集分析,將數(shù)據(jù)轉(zhuǎn)變成可供系統(tǒng)識(shí)別與運(yùn)用的特征向量,并增加相關(guān)的特征標(biāo)簽,使基于用戶基礎(chǔ)信息與行為數(shù)據(jù)的畫像更加豐富。對(duì)于初次使用系統(tǒng)的新用戶,系統(tǒng)雖然無法準(zhǔn)確判斷用戶的行為、興趣偏好,但可以根據(jù)用戶的注冊(cè)信息將反映用戶動(dòng)態(tài)變化的數(shù)據(jù)組合成不同的數(shù)據(jù)集,使多種數(shù)據(jù)集中的元素盡可能地反映用戶的特征與行為偏好,然后使用大數(shù)據(jù)技術(shù)對(duì)用戶可能產(chǎn)生的需求進(jìn)行精準(zhǔn)預(yù)測(cè),以實(shí)現(xiàn)用戶需求的智能識(shí)別及學(xué)術(shù)文獻(xiàn)的精準(zhǔn)推薦。

3.2 數(shù)據(jù)模塊

基于用戶畫像的學(xué)術(shù)文獻(xiàn)推薦系統(tǒng)構(gòu)建需要在底層建立數(shù)據(jù)搜集模塊,也就是針對(duì)用戶使用圖書館時(shí)產(chǎn)生的基礎(chǔ)數(shù)據(jù)、行為數(shù)據(jù)及使用各類終端、瀏覽網(wǎng)站產(chǎn)生的網(wǎng)絡(luò)軌跡進(jìn)行搜集,并使用爬蟲工具精準(zhǔn)獲取各類數(shù)據(jù),然后依靠大數(shù)據(jù)分析系統(tǒng)將各類數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理,從中提取反映用戶行為偏好、個(gè)人特征的個(gè)體或用戶群的數(shù)據(jù)信息,實(shí)現(xiàn)用戶學(xué)術(shù)文獻(xiàn)需求的精準(zhǔn)判斷。數(shù)據(jù)模塊要具備篩選過濾功能,在爬蟲工具爬取用戶各類信息的時(shí)候,能智能過濾各種無效信息,智能攔截惡意點(diǎn)擊與含有病毒的

數(shù)據(jù)流,并能構(gòu)建智能防火墻抵擋病毒攻擊,保障用戶數(shù)據(jù)安全。同時(shí),數(shù)據(jù)模塊要與數(shù)據(jù)庫關(guān)聯(lián),將反映用戶特征、行為偏好的結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫中,并以有效的數(shù)據(jù)化標(biāo)簽進(jìn)行標(biāo)記,同時(shí),將反映用戶行為特征向量的數(shù)據(jù)存儲(chǔ)到單獨(dú)的數(shù)據(jù)庫中,以便于智能識(shí)別用戶身份。

3.3 學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫

在大數(shù)據(jù)環(huán)境下,圖書館基于用戶畫像為用戶推薦學(xué)術(shù)文獻(xiàn),先要建立學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫對(duì)各類館藏學(xué)術(shù)文獻(xiàn)進(jìn)行數(shù)字化分類存儲(chǔ),為學(xué)術(shù)文獻(xiàn)推薦服務(wù)提供保障。充足的學(xué)術(shù)文獻(xiàn)資源是學(xué)術(shù)文獻(xiàn)推薦的基礎(chǔ),圖書館應(yīng)使用數(shù)字化技術(shù)對(duì)館藏實(shí)體學(xué)術(shù)文獻(xiàn)進(jìn)行數(shù)字化處理,并依照?qǐng)D書分類標(biāo)準(zhǔn)將其存儲(chǔ)到不同的館藏?cái)?shù)據(jù)庫中。數(shù)字化的學(xué)術(shù)文獻(xiàn)資源不僅有利于共享傳遞,還能節(jié)約館藏成本,便于用戶高效獲取。

3.4 學(xué)術(shù)文獻(xiàn)推薦模塊

學(xué)術(shù)文獻(xiàn)推薦是在用戶行為數(shù)據(jù)搜集、用戶畫像勾勒完成后實(shí)現(xiàn)的,是指依靠圖書館構(gòu)建的用戶畫像模型預(yù)測(cè)用戶的需求偏好及未來可能產(chǎn)生的學(xué)術(shù)文獻(xiàn)需求為用戶推薦學(xué)術(shù)文獻(xiàn)。為了提高推薦的精準(zhǔn)性,圖書館要依靠標(biāo)簽系統(tǒng)對(duì)用戶數(shù)據(jù)做標(biāo)記,再根據(jù)標(biāo)記的用戶數(shù)據(jù)分析個(gè)體用戶以及用戶群的行為偏好,將具有相似需求的群體用戶、個(gè)體用戶與學(xué)術(shù)資源進(jìn)行匹配,并根據(jù)匹配程度反饋推送結(jié)果。由于不同個(gè)體用戶的需求不同,并且這種需求隨著時(shí)間的推移處在動(dòng)態(tài)變化中,為了更高效地滿足用戶需求,學(xué)術(shù)文獻(xiàn)推薦模塊需設(shè)置個(gè)體用戶推薦窗口、用戶群推薦窗口兩個(gè)部分,針對(duì)用戶個(gè)體和用戶群分別推薦學(xué)術(shù)文獻(xiàn)。為應(yīng)對(duì)用戶的興趣轉(zhuǎn)移和需求變化,學(xué)術(shù)文獻(xiàn)推薦模塊要設(shè)置用戶需求變化預(yù)測(cè)機(jī)制和興趣轉(zhuǎn)移預(yù)測(cè)機(jī)制,對(duì)用戶興趣需求變化進(jìn)行精準(zhǔn)預(yù)測(cè),只有掌握用戶的動(dòng)態(tài)變化才能實(shí)現(xiàn)學(xué)術(shù)文獻(xiàn)的精準(zhǔn)推薦。

4 結(jié)語

大數(shù)據(jù)環(huán)境下基于用戶畫像的學(xué)術(shù)文獻(xiàn)推薦系統(tǒng)研究給圖書館學(xué)術(shù)服務(wù)、資源推薦帶來了新的突破?;谟脩舢嬒駥?duì)用戶行為偏好、需求變化進(jìn)行的定位與預(yù)測(cè),能從多個(gè)維度實(shí)現(xiàn)用戶需求的動(dòng)態(tài)掌握,最終實(shí)現(xiàn)學(xué)術(shù)文獻(xiàn)的精準(zhǔn)推薦。

參考文獻(xiàn):

[1] 袁軍.大數(shù)據(jù)環(huán)境下用戶畫像在高校圖書館的應(yīng)用研究[J].圖書館研究與工作,2019(6):22-26.

[2] 梁榮賢.基于用戶畫像的圖書館精準(zhǔn)信息服務(wù)研究[J].圖書館工作與研究,2019(4):65-69.

[3] 陳丹,羅燁,吳智勤.基于大數(shù)據(jù)挖掘和用戶畫像的高校圖書館個(gè)性化服務(wù)研究[J].圖書館研究與工作,2019(4):50-53,59.

[4] 李雅.基于讀者用戶畫像的高校圖書館精準(zhǔn)化服務(wù)研究[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2018(12):108-111.

(編校:周雪芹)

收稿日期:2019-11-05

作者簡介:劉相金(1964— ),山東大學(xué)圖書館副教授;王夢(mèng)菊(1964— ),山東大學(xué)圖書館副研究館員,系本文通訊作者。

猜你喜歡
用戶畫像大數(shù)據(jù)環(huán)境
貝葉斯網(wǎng)絡(luò)在用戶畫像構(gòu)建中的研究
把聲音的魅力發(fā)揮到極致
移動(dòng)用戶畫像構(gòu)建研究
基于大數(shù)據(jù)環(huán)境的新聞編輯理念變革創(chuàng)新機(jī)制
基于微博的大數(shù)據(jù)用戶畫像與精準(zhǔn)營銷
移動(dòng)互聯(lián)網(wǎng)下手機(jī)用戶使用行為特征的研究
邯郸县| 若羌县| 汉沽区| 高雄市| 镇平县| 浮山县| 肥城市| 伽师县| 呼伦贝尔市| 灵台县| 滦南县| 桐城市| 齐河县| 当阳市| 雷州市| 蓝田县| 新和县| 疏附县| 盈江县| 九龙坡区| 宜州市| 莆田市| 太仓市| 松江区| 定西市| 永嘉县| 宜君县| 蒙城县| 革吉县| 松滋市| 平乡县| 富平县| 舒兰市| 分宜县| 德钦县| 巍山| 林甸县| 沭阳县| 海盐县| 西华县| 炎陵县|