吳加琪
〔摘 要〕[目的/意義]現(xiàn)代社會已進入大數(shù)據(jù)時代,基于用戶畫像的智能信息服務(wù)深刻地改變了人們的生活,對圖書館領(lǐng)域產(chǎn)生了重要影響,研究用戶畫像對社會的發(fā)展具有重要作用。[方法/過程]以CNKI中國學(xué)術(shù)文獻網(wǎng)絡(luò)出版總庫中的用戶畫像文獻作為研究對象,使用CiteSpace繪制可視化知識圖譜,進行關(guān)鍵詞分析,揭示我國用戶畫像研究的時間分布、學(xué)科領(lǐng)域、主題演變和研究熱點問題。[結(jié)果/結(jié)論]我國用戶畫像研究劃分為初始階段、起步階段和發(fā)展階段,從2015年開始快速發(fā)展,但基礎(chǔ)理論研究較少,研究成果尚未形成體系;用戶畫像研究文獻從最初的計算機和電子商務(wù)等學(xué)科領(lǐng)域逐漸向管理學(xué)、經(jīng)濟學(xué)、人文社科領(lǐng)域發(fā)展,呈現(xiàn)出明顯的跨學(xué)科特征;大數(shù)據(jù)構(gòu)成了用戶畫像研究的數(shù)據(jù)基礎(chǔ),隨著計算機和信息網(wǎng)絡(luò)技術(shù)的發(fā)展,用戶畫像研究和實踐應(yīng)用不斷發(fā)展,圖書情報與數(shù)字圖書館是用戶畫像研究的重要領(lǐng)域;研究熱點包括基礎(chǔ)理論、核心技術(shù)、實踐應(yīng)用和基礎(chǔ)數(shù)據(jù)四方面內(nèi)容。
〔關(guān)鍵詞〕用戶畫像;知識圖譜;知識網(wǎng)絡(luò);熱點領(lǐng)域;文獻計量
DOI:10.3969/j.issn.1008-0821.2018.08.018
〔中圖分類號〕G252.0 〔文獻標識碼〕A 〔文章編號〕1008-0821(2018)08-0130-06
〔Abstract〕[Purpose/Significance]The modern society has entered the era of big data.Intelligent information services based on user portraits have profoundly changed peoples lives.Studying portraits of users plays an important role in the development of society.[Method/Process]Using the user portrait literature in the CNKI Chinese academic literature web publishing library as the research object,CiteSpace was used to draw the visual knowledge map and keyword analysis,revealing the time distribution,subject areas,and theme evolution of the user portrait study in China.[Result/Conclusion]The study of user portraits in China has developed rapidly since 2015,but the research results have not yet formed a system;the user portrait study literature has gradually moved from the initial computer and e-commerce fields to management,economics,humanities and social sciences.The development showed an obvious interdisciplinary character;big data constitutes the data foundation for the study of user portraits.With the development of computer and information network technologies,the study of user portraits and the practice and application in various industries were continuously developing.Library Information and Digital Library were important area for user portrait studies;research hotspots included basic theory,core technology,practical application,and basic data.
〔Key words〕user portrait;knowledge graph;knowledge network;hotspots;bibliometric
1999年,Alan Cooper在《Why High-tech Products Drive us Crazy and How to Restore the Sanity》一書中提出了用戶畫像Persona的概念,用戶畫像Persona是現(xiàn)實生活中真實用戶的虛擬代表,它是建立在一系列真實可用的數(shù)據(jù)上的目標用戶模型[1],在國內(nèi),鄭寶鑫[2]在2010年正式使用用戶畫像一詞。近年來,基于用戶畫像的智能信息服務(wù)在眾多領(lǐng)域得到了廣泛應(yīng)用,圖書館也逐漸融入到了用戶畫像的發(fā)展浪潮中,曾建勛[3]認為,數(shù)字圖書館服務(wù)必須統(tǒng)一認證和管理用戶,把握并跟蹤用戶需求變化,基于用戶應(yīng)用場景,將用戶資源與知識創(chuàng)造相結(jié)合,形成用戶畫像與作者/專家畫像的有效結(jié)合,在用戶的知識創(chuàng)造過程中強化精準服務(wù)。雖然圖書館領(lǐng)域?qū)τ脩舢嬒竦难芯拷陙砜焖僭鲩L,但總體而言,仍滯后于社會其他行業(yè),對用戶畫像的知識前沿和熱點領(lǐng)域進行分析可以促使圖書館學(xué)用戶畫像的理論研究與圖書館工作實踐緊跟社會前沿,不斷提升自身服務(wù)能力。
1 數(shù)據(jù)來源與研究方法
本研究選取CNKI中的中國學(xué)術(shù)文獻網(wǎng)絡(luò)出版總庫作為數(shù)據(jù)來源,以“用戶畫像”為主題詞進行檢索,檢索時間為2018年3月18日,得到檢索結(jié)果252條。經(jīng)過數(shù)據(jù)的去重、勘誤、篩選等數(shù)據(jù)清洗后,保留237條文獻,以此作為基礎(chǔ)數(shù)據(jù)。考慮到數(shù)據(jù)的全面性、相關(guān)性要求,選取用戶分析、用戶數(shù)據(jù)、用戶行為、用戶、畫像作為檢索詞以主題、篇名、關(guān)鍵詞等進行搜索條件組合,進一步檢索用戶畫像的研究文獻,經(jīng)過清洗后,得到有效數(shù)據(jù)99條,上述共336篇文獻構(gòu)成本文統(tǒng)計分析的最終數(shù)據(jù)。
文獻計量法可以對學(xué)科領(lǐng)域研究文獻各個方面和整體進行定量化研究,揭示其發(fā)展規(guī)律[4]。知識圖譜將應(yīng)用數(shù)學(xué)、圖形學(xué)、信息可視化技術(shù)、信息科學(xué)等學(xué)科的理論與方法與計量學(xué)引文分析、共現(xiàn)分析等方法結(jié)合,利用可視化的圖譜形象地展示學(xué)科的核心結(jié)構(gòu)、發(fā)展歷史、前沿領(lǐng)域以及整體知識架構(gòu)。本文利用CiteSpace5.2.R2對研究文獻建立知識圖譜,對國內(nèi)用戶畫像的時間分布、學(xué)科領(lǐng)域、主題演變和研究熱點問題等進行分析,根據(jù)統(tǒng)計樣本將分析時間設(shè)置為2006-2018年,主題詞來源為關(guān)鍵詞,閾值設(shè)置為50。
2 結(jié)果分析
2.1 時間分布
通過統(tǒng)計分析發(fā)現(xiàn),國內(nèi)最早在論文中明確提出用戶畫像的是2010年發(fā)表的《基于用戶畫像、信令挖掘技術(shù)的手機游戲產(chǎn)品推廣》一文,文中提出了基于用戶畫像技術(shù)結(jié)合信令挖掘技術(shù)的手機游戲產(chǎn)品推廣新思路,實施精確營銷[2]。在圖書館學(xué)領(lǐng)域?qū)τ脩舢嬒襁M行研究的最早論文是2014年發(fā)表在《圖書館學(xué)刊》上的《基于大數(shù)據(jù)的圖書館信息營銷策略》,文章認為基于大數(shù)據(jù)的圖書館信息精確營銷需要加強用戶信息需求分析,通過提取用戶的年齡、性別、學(xué)歷、職業(yè)身份、興趣愛好、閱讀習慣等關(guān)鍵數(shù)據(jù),對用戶行為需求畫像,實現(xiàn)館藏資源與用戶訴求的精確匹配[5]。在圖1所示的用戶畫像研究成果中,數(shù)量自2006年以來呈整體上升的趨勢。在圖書館領(lǐng)域,與用戶畫像相關(guān)的研究自2014年開始,在2017年數(shù)量大幅增長,這說明了圖書館界對用戶畫像的研究開展較遲,隨著社會各界對用戶畫像研究深入,圖書館開始重視并積極參與用戶畫像的理論和實踐。
用戶畫像研究可劃分為3個階段:初始階段(2006-2009年),該階段關(guān)于用戶畫像的研究文獻數(shù)量較為穩(wěn)定,主要關(guān)注用戶行為分析的方法和手段,建立以用戶為中心的服務(wù),以及關(guān)聯(lián)規(guī)則、數(shù)據(jù)挖掘、用戶模型建立等技術(shù)的應(yīng)用,在此階段,部分學(xué)者嘗試提出了“犯罪畫像”[6]、“客戶畫像”[7]的概念。起步階段(2010-2014年),在此階段研究文獻的數(shù)量逐步增長,2010年,鄭寶鑫等在論文中首次使用了用戶畫像一詞,2010年2月9日,谷歌發(fā)布一款名為Google Buzz的新產(chǎn)品,可自動跟隨用戶所有聯(lián)系人的活動情況,根據(jù)用戶習慣,向用戶推薦更符合要求的其他網(wǎng)絡(luò)服務(wù)和信息[8]。在此背景下,學(xué)者開始正式使用用戶畫像一詞,同時在手機游戲、網(wǎng)絡(luò)視頻、社交媒體以及移動互聯(lián)等領(lǐng)域?qū)τ脩舢嬒竦漠a(chǎn)品設(shè)計進行了探索。發(fā)展階段(2015年-),2015年9月,國務(wù)院印發(fā)《促進大數(shù)據(jù)發(fā)展行動綱要》,系統(tǒng)部署大數(shù)據(jù)發(fā)展工作,《綱要》明確提出要推動大數(shù)據(jù)發(fā)展和應(yīng)用,打造精準治理、多方協(xié)作的社會治理新模式,構(gòu)建以人為本、惠及全民的民生服務(wù)新體系[9],隨之,社會各領(lǐng)域?qū)τ脩舢嬒竦睦碚撗芯亢蛯嵺`工作的探索進入了全新的發(fā)展階段。在此階段,人們主要關(guān)注在大數(shù)據(jù)、移動互聯(lián)網(wǎng)的背景下如何加強用戶的數(shù)據(jù)分析,以開展個性化的精準服務(wù)。部分圖書館也開始在工作中引入用戶畫像的理念和方法以提升服務(wù)質(zhì)量。如天津圖書館通過對ALEPH、微信、網(wǎng)站、一碼通等系統(tǒng)中的數(shù)據(jù)進行串聯(lián),利用借閱數(shù)據(jù)、檢索數(shù)據(jù)、閱覽數(shù)據(jù)等分析出用戶行為數(shù)據(jù),以此為基礎(chǔ)建立用戶畫像[10]。尹相權(quán)等[11]基于用戶畫像技術(shù)對北京師范大學(xué)圖書館研究間系統(tǒng)日志數(shù)據(jù),對數(shù)據(jù)進行多維度行為建模,探索影響用戶行為的主要因素。
2.2 學(xué)科領(lǐng)域
為分析用戶畫像的學(xué)科特征,本文借助CNKI數(shù)據(jù)庫的學(xué)科分類功能,對本文選取的文獻進行統(tǒng)計研究,結(jié)果顯示用戶畫像的研究成果共來自于53個學(xué)科領(lǐng)域,具有較強的跨學(xué)科特征。相關(guān)文獻數(shù)量較高的學(xué)科領(lǐng)域如圖2所示,在CNKI學(xué)科統(tǒng)計過程中單一的研究成果可能只屬于一個學(xué)科,也可能同屬于不同的學(xué)科,所以在本文中用戶畫像文獻數(shù)量最多的計算機軟件及計算機應(yīng)用領(lǐng)域的論文也會同時屬于其他學(xué)科。計算機軟件及計算機應(yīng)用、企業(yè)經(jīng)濟、貿(mào)易經(jīng)濟是用戶畫像研究最為集中的學(xué)科領(lǐng)域,其次信息經(jīng)濟與郵政經(jīng)濟、互聯(lián)網(wǎng)技術(shù)、電信技術(shù)、圖書情報與數(shù)字圖書館、工業(yè)經(jīng)濟、新聞與傳媒、金融等領(lǐng)域的研究成果也較為豐富,電力工業(yè)、工業(yè)通用技術(shù)及設(shè)備、自動化技術(shù)也有相關(guān)的研究成果。統(tǒng)計數(shù)據(jù)還顯示,用戶畫像最初應(yīng)用于計算機和電子商務(wù)領(lǐng)域的產(chǎn)品設(shè)計、優(yōu)化、個性化服務(wù)等方面。隨著大數(shù)據(jù)技術(shù)的深入研究和應(yīng)用,企業(yè)的專注點日益聚焦于怎樣利用大數(shù)據(jù)來為精準營銷而服務(wù)。與此相對應(yīng),用戶畫像研究文獻從最初的計算機和電子商務(wù)領(lǐng)域等學(xué)科領(lǐng)域逐漸向管理學(xué)、經(jīng)濟學(xué)、人文社科領(lǐng)域發(fā)展,呈現(xiàn)出明顯的跨學(xué)科特征。圖書情報部門是重要的信息服務(wù)部門,信息技術(shù)及用戶服務(wù)與其有著密切相關(guān)性,用戶畫像的發(fā)展推動了圖書情報領(lǐng)域的變革,也成為用戶畫像的主要研究領(lǐng)域。部分學(xué)者意識到數(shù)字圖書館服務(wù)必須把握并跟蹤用戶需求變化,基于用戶應(yīng)用場景,將用戶資源與知識創(chuàng)造相結(jié)合,形成用戶畫像與作者/專家畫像的有效結(jié)合,重新理解用戶、細分用戶,從多維度認識用戶的自然屬性、社交屬性、興趣屬性和能力屬性,在用戶的知識創(chuàng)造過程中強化精準服務(wù)[3]。
對文獻信息的來源期刊進行統(tǒng)計,結(jié)果顯示期刊論文共來自于128種期刊。其中載文量3篇及以上的共8種期刊,這些期刊分屬于計算機軟件及計算機應(yīng)用、圖書情報與數(shù)字圖書館、新聞與傳媒、教育學(xué)4個學(xué)科領(lǐng)域,結(jié)果如圖3所示。統(tǒng)計結(jié)果顯示計算機技術(shù)及應(yīng)用、電信技術(shù)是用戶畫像的基礎(chǔ)知識領(lǐng)域,圖書情報、教育、廣播電視領(lǐng)域是近年來用戶畫像研究的主要熱點。
2.3 主題變遷
關(guān)鍵詞是文獻內(nèi)容的精煉表述,共詞分析是對關(guān)鍵詞共現(xiàn)現(xiàn)象進行研究的一種重要方法,利用共詞方法可以揭示相關(guān)領(lǐng)域的研究熱點,橫向和縱向分析領(lǐng)域?qū)W科的發(fā)展過程、特點以及領(lǐng)域或?qū)W科之間的關(guān)系,反映某個專業(yè)的科學(xué)研究水平及其發(fā)展歷史的動態(tài)和靜態(tài)結(jié)構(gòu)[12]。通過對文章關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)的分析,可以呈現(xiàn)出某一研究領(lǐng)域的研究范圍、確立研究內(nèi)容與方法,以及構(gòu)建領(lǐng)域內(nèi)學(xué)術(shù)生態(tài)系統(tǒng)[13]。
2.3.1 高頻關(guān)鍵詞
在本研究中,CiteSpace的時間切片為1年,選擇關(guān)鍵詞為節(jié)點類型,選擇cosine為連線強度,以此呈現(xiàn)用戶畫像研究結(jié)果,數(shù)據(jù)分析結(jié)果如圖4所示,圖中連線的粗細反映了共現(xiàn)頻次的多少,節(jié)點的大小顯示其中心度。同時,通過對相關(guān)文獻的關(guān)鍵詞進行統(tǒng)計分析,列出了該領(lǐng)域研究詞頻在3次及以上的關(guān)鍵詞及中心度(見表1),結(jié)果顯示詞頻在3次及以上的高頻關(guān)鍵詞共有24個,這表明畫像領(lǐng)域相關(guān)的研究主題較為廣泛,體現(xiàn)了典型的跨學(xué)科特征。
在高頻關(guān)鍵詞中,除了“用戶畫像”、“用戶”、“畫像”具有自我指向性的關(guān)鍵詞外,具有明顯中心度的關(guān)鍵詞還包括“大數(shù)據(jù)”、“精準營銷”、“推薦系統(tǒng)”、“支持向量機”、“移動互聯(lián)網(wǎng)”等,這些關(guān)鍵詞反映了用戶畫像研究的3個重要研究和應(yīng)用領(lǐng)域,即數(shù)據(jù)基礎(chǔ)層面、核心技術(shù)層面和實際應(yīng)用層面?!按髷?shù)據(jù)”、“用戶分析”、“用戶行為”、“標簽”反映了用戶畫像研究涉及的數(shù)據(jù)領(lǐng)域,“主題模型”、“協(xié)同過濾”、“隨機森林”、“大數(shù)據(jù)技術(shù)”、“矩陣分解”等揭示了用戶畫像研究的主要技術(shù),“精準營銷”、“推薦系統(tǒng)”、“移動互聯(lián)網(wǎng)”、“圖書館”、“微博”、“社交網(wǎng)絡(luò)”等關(guān)鍵詞描述了用戶畫像的實踐應(yīng)用領(lǐng)域。
2.3.2 主題演變
為進一步分析用戶畫像研究的主題演變發(fā)展過程,本文通過高頻關(guān)鍵詞共現(xiàn)時區(qū)圖顯示2006-2018年主題的年度進展(見圖5)。通過共現(xiàn)時區(qū)圖可知,用戶畫像的研究是伴隨著計算機技術(shù)和信息網(wǎng)絡(luò)技術(shù)的發(fā)展而不斷深入,2009年之前,用戶畫像研究出現(xiàn)的高頻關(guān)鍵詞是“用戶需求”以及“信息構(gòu)建”,處于初始階段的用戶研究僅圍繞
用戶畫像相關(guān)的籠統(tǒng)性主題開展。在2010-2014年期間,用戶畫像研究主題快速增長,出現(xiàn)了對用戶畫像的概念、核心技術(shù)的深入研究,出現(xiàn)了“用戶畫像”、“大數(shù)據(jù)”、“精準營銷”、“數(shù)據(jù)挖掘”等關(guān)鍵詞,同時人們開始對相關(guān)技術(shù)的研究,如“多點接觸挖掘”、“自助分析系統(tǒng)”、“數(shù)據(jù)建?!钡?,在此期間學(xué)者們還對用戶畫像在圖書館、微博、移動互聯(lián)網(wǎng)等領(lǐng)域的應(yīng)用開展了初期研究。近年來(2015-2018年)用戶畫像研究廣度和深度進一步拓展,用戶畫像的具體應(yīng)用的研究更為細化,包括圖書館用戶推薦系統(tǒng)、讀者臉譜繪制、資源推薦、電子商務(wù)、社交網(wǎng)絡(luò)、互聯(lián)網(wǎng)金融、智能車輛共享等。隨著用戶畫像技術(shù)的廣泛使用,用戶個人數(shù)據(jù)的合理使用及隱私保護等問題也引起社會的關(guān)注。
從上述關(guān)鍵詞演變過程可以看出用戶畫像研究的演化路徑:以用戶為中心的工作理念促使了人們對用戶數(shù)據(jù)的關(guān)注,用戶相關(guān)的大數(shù)據(jù)構(gòu)成了用戶畫像研究的數(shù)據(jù)基礎(chǔ),隨著計算機和信息網(wǎng)絡(luò)技術(shù)的發(fā)展,用戶畫像的研究和在各行業(yè)實踐應(yīng)用不斷發(fā)展,圖書情報與數(shù)字圖書館是用戶畫像研究的重要領(lǐng)域,圖書情報部門在開展知識服務(wù)工作過程推動了用戶畫像的發(fā)展,用戶畫像的理論和實踐應(yīng)用的進步又促進了圖書情報部門知識服務(wù)的理論和實踐的創(chuàng)新。
3 研究熱點
在CiteSpace中以關(guān)鍵詞作為聚類標識,選擇LLR對數(shù)似然率作為標簽詞,對每個聚類內(nèi)的相關(guān)文獻進行統(tǒng)計分析,可以發(fā)現(xiàn)用戶畫像領(lǐng)域的熱點問題,受文章篇幅所限,本文僅對前四大聚類的熱點問題進行分析,各聚類的具體情況如表2所示。
3.1 基礎(chǔ)理論
用戶畫像是一個近年來興起的概念,其學(xué)科的性質(zhì)定位、內(nèi)涵與外延、理論與方法等基本問題的研究和認識尚未形成共識,因此成為相關(guān)領(lǐng)域的研究焦點。楊潔[14]對用戶畫像的發(fā)展軌跡進行了回顧,同時對其的定義、構(gòu)建、算法和應(yīng)用進行了闡述,認為用戶畫像是隨著網(wǎng)絡(luò)和信息技術(shù)的發(fā)展,人們將數(shù)據(jù)作為技術(shù)用于企業(yè)服務(wù)的背景下產(chǎn)生的學(xué)科,同時基于多源用戶數(shù)據(jù)建立了面向企業(yè)營銷的全景用戶畫像。對用戶畫像的定義主要分為兩類,一是從廣義與抽象的角度反映了用戶信息全貌的一個標簽集合;二是從用途角度和狹義的角度出發(fā),認為用戶畫像是勾畫、連接和應(yīng)用的一個實體,反映了用戶畫像在現(xiàn)實中的存在形式[15]。用戶數(shù)據(jù)具有隱性、時空動態(tài)性的特點,用戶畫像策略的關(guān)鍵在于數(shù)據(jù)的準確性和多維性[16]。用戶畫像需要收集和分析用戶的個人數(shù)據(jù),涉及用戶隱私數(shù)據(jù)的保護問題,在加強基本理論研究的同時,部分學(xué)者對其進行了反思,提出通過改進算法、有效掌握系統(tǒng)內(nèi)核環(huán)境、政府相關(guān)管理部門應(yīng)完善相關(guān)法律以及制定互聯(lián)網(wǎng)個人隱私管理政策以保護用戶隱私安全[17]。
計算機網(wǎng)絡(luò)技術(shù)應(yīng)用及知識服務(wù)是圖書館領(lǐng)域重要的特征,這也決定了用戶畫像的理論及其應(yīng)用與圖書館具有密切的關(guān)聯(lián),然而從理論層面研究用戶畫像與圖書館及圖書館學(xué)相關(guān)問題的成果較少,王慶等[18]認為,用戶畫像的用戶行為及需求分析與圖書館資源精準推薦在本質(zhì)上相契合,用戶畫像為圖書館的精準營銷、資源服務(wù)推薦、科學(xué)決策等提供應(yīng)用基礎(chǔ)。王順箐[19]指出,用戶畫像是基于本體的個體畫像,是通過網(wǎng)絡(luò)拓撲結(jié)構(gòu)和傳播影響力來發(fā)現(xiàn)和定位這些獨特而重要的個體,圖書館在分析讀者個體閱讀見解的影響力時,可以從網(wǎng)絡(luò)拓撲和傳播影響力兩方面進行量化分析,推測出閱讀領(lǐng)域的推薦熱點。隨著用戶畫像理論研究與實踐應(yīng)用的開展,圖書館與用戶畫像的基本理論以及協(xié)同發(fā)展問題將引起人們更多的關(guān)注。
3.2 核心技術(shù)
用戶畫像的建立涉及相關(guān)技術(shù)的應(yīng)用,標簽體系、模型提取和關(guān)鍵算法是用戶畫像過程中最為重要的技術(shù)。一是標簽體系,標簽是用戶特征的符號表示,用戶畫像即用戶信息標簽化,用戶畫像的核心工作是為用戶打標簽,標簽體系應(yīng)當具有原始數(shù)據(jù)層、事實層、特征偏好層和模型預(yù)測層的層級結(jié)構(gòu)[20],同時學(xué)者還對用戶標簽的結(jié)構(gòu)、應(yīng)用場景、基本構(gòu)成和建立方法[15],標簽中的拆分、去重、低交叉率[21]等進行了研究。二是模型提取,創(chuàng)建用戶畫像的過程即提取用戶興趣模型的過程,由于構(gòu)建用戶畫像的目的不同,研究者們提出了諸多用戶畫像模型及其構(gòu)建方法,如數(shù)據(jù)統(tǒng)計分析方法的用戶模型、基于加權(quán)關(guān)鍵字的用戶向量空間模型、基于主題模型的用戶畫像提取、基于本體(Ontology)的用戶模型、基于神經(jīng)網(wǎng)絡(luò)的用戶模型等[22],王慶福[23]基于貝葉斯網(wǎng)絡(luò)構(gòu)建用戶興趣模型,在此基礎(chǔ)上建立了用戶畫像。在圖書館領(lǐng)域,胡媛等[24]基于讀者信息建立圖書館知識社區(qū)關(guān)聯(lián)模型,為數(shù)字圖書館知識的讀者用戶提供個性化推送服務(wù)。三是關(guān)鍵算法,用戶畫像的構(gòu)建需要算法的支持,包括知識工程(Knowledge Engineering)、機器學(xué)習(Mechine Learning)、支持向量機(SVM)、TF-IDF的相似度計算、綜合相似度計算和用戶聚類分析等成為人們研究的重點[25]。韓梅花等[26]通過TF-IDF相似度計算、聚類分析和機器學(xué)習等算法,建立基于用戶畫像的讀者抑郁癥的閱讀療法模式。
3.3 實踐應(yīng)用
用戶畫像可以對用戶進行定性與定量的描述,通過抽象和概括用戶的性質(zhì),對用戶數(shù)據(jù)進行統(tǒng)計分析與計算的基礎(chǔ)上實現(xiàn)對核心用戶價值的挖掘,因此用戶畫像在眾多領(lǐng)域和行業(yè)已經(jīng)廣泛應(yīng)用。在本文的文獻成果中,用戶畫像早期應(yīng)用于手機游戲的開發(fā)、運營和推廣領(lǐng)域,通過用戶畫像對手機套餐進行畫像統(tǒng)計,鎖定目標用戶群,進行游戲產(chǎn)品營銷[2]。隨著大數(shù)據(jù)技術(shù)的發(fā)展,人們通過用戶畫像將用戶數(shù)據(jù)轉(zhuǎn)化為商業(yè)價值,包括電商在內(nèi)的眾多行業(yè)引入了用戶畫像的理念,實現(xiàn)對核心用戶價值的挖掘,開展產(chǎn)品的精準營銷和個性化服務(wù),學(xué)者們還對用戶畫像在服裝企業(yè)[27]、電子商務(wù)[28]、電信服務(wù)[29]、金融[30]等領(lǐng)域的應(yīng)用進行了研究。近年來,社會公共部門也開始重視用戶畫像在包括新聞資訊[31]、就醫(yī)[32]、出行[33]、文化服務(wù)等領(lǐng)域的應(yīng)用。
圖書館領(lǐng)域的研究成果更為廣泛,在包括智慧閱讀推薦[19]、知識發(fā)現(xiàn)系統(tǒng)[34]、知識社區(qū)用戶畫像構(gòu)建[24]、資源推薦[18]等主題開展用戶畫像的應(yīng)用進行了探討,劉速[10]還以天津圖書館為例,從數(shù)據(jù)來源、數(shù)據(jù)采集、信息識別、模型搭建等方面對用戶畫像的構(gòu)建進行詳細闡述,提出具體的可視化統(tǒng)計描述、多維度交叉分析、用戶關(guān)系圖譜等用戶畫像建構(gòu)方法。
3.4 基礎(chǔ)數(shù)據(jù)研究
用戶畫像需要準確的用戶數(shù)據(jù)作為支撐,用戶數(shù)據(jù)也成為用戶畫像的重要研究內(nèi)容,用戶數(shù)據(jù)全面性和準確性是人們關(guān)注的焦點。從時間的角度,用戶數(shù)據(jù)可分為靜態(tài)信息和動態(tài)信息[35],靜態(tài)信息主要包括用戶的基礎(chǔ)數(shù)據(jù),如性別、年齡、職業(yè)等,這部分信息相對穩(wěn)定,但用戶行為數(shù)據(jù)隨著時間會不斷增加和變化,因此用戶畫像可分為用戶靜態(tài)畫像和動態(tài)畫像[25],從空間的角度,用戶畫像包括3種數(shù)據(jù),一是系統(tǒng)中可以取得的信息;二是通過計算或統(tǒng)計獲得的數(shù)據(jù);三是通過網(wǎng)絡(luò)采集相關(guān)信息進行相關(guān)數(shù)據(jù)信息的補充[14]。此外,人們還從行業(yè)特點及具體的畫像需求出發(fā),將用戶畫像數(shù)據(jù)劃分為用戶自身數(shù)據(jù)、用戶商品數(shù)據(jù)及渠道數(shù)據(jù),顯性數(shù)據(jù)和隱性數(shù)據(jù)等。
圖書館界在對用戶畫像的研究過程中,一些學(xué)者從行業(yè)特點出發(fā),對用戶畫像數(shù)據(jù)進行了研究,如曾建勛提出構(gòu)建用戶畫像應(yīng)加強服務(wù)環(huán)境數(shù)據(jù)、用戶行為數(shù)據(jù)、信息獲取數(shù)據(jù)等用戶日志數(shù)據(jù)收集,既包括性別、年齡、城市、學(xué)歷、職稱、職業(yè)等靜態(tài)信息數(shù)據(jù),又包括注冊、搜索、瀏覽、點擊、跳轉(zhuǎn)、訂單、下載、評價等動態(tài)用戶行為信息數(shù)據(jù)[3]。胡媛等認為,數(shù)字圖書館社區(qū)中讀者動靜數(shù)據(jù)構(gòu)成繪制用戶畫像的微觀層面,通過分析抽象出標簽,可以形成用戶宏觀畫像[24]。
4 結(jié) 語
大數(shù)據(jù)環(huán)境下,精準服務(wù)是各行業(yè)工作的重要特點,用戶畫像是一門新興的跨學(xué)科研究領(lǐng)域,對社會各領(lǐng)域帶來了深刻的影響。知識服務(wù)是圖書館重要工作內(nèi)容,雖然近年來人們對圖書館發(fā)展與用戶畫像的融合進行了研究,但與其他行業(yè)部門相比,無論是圖書館學(xué)與用戶畫像的基礎(chǔ)理論及圖書館實踐應(yīng)用都相對落后。用戶畫像是大數(shù)據(jù)時代精準服務(wù)的重要工具,圖書館擁有巨量的讀者用戶群和龐大的數(shù)據(jù),引入用戶畫像可以促使圖書館真正了解用戶,為用戶提供全方位、人性化、個性化的定向優(yōu)質(zhì)服務(wù),我國圖書館界應(yīng)重新審視服務(wù)系統(tǒng),以更開放的視角,進一步深入開展用戶畫像的理論研究與實踐探索。
參考文獻
[1]Cooper A.The Inmates are Running the Asylum:[Why High-tech Products Drive us Crazy and How to Restore the Sanity][M].Indianapolis,IN,USA:Sams,2004.
[2]鄭寶鑫.基于用戶畫像、信令挖掘技術(shù)的手機游戲產(chǎn)品推廣[A].廣東省通信學(xué)會.廣東通信2010青年論壇優(yōu)秀論文集[C].廣東省通信學(xué)會,2010:4.
[3]曾建勛.精準服務(wù)需要用戶畫像[J].數(shù)字圖書館論壇,2017,(12):1.
[4]柯平,宮平.數(shù)字人文研究演化路徑與熱點領(lǐng)域分析[J].中國圖書館學(xué)報,2016,42(6):13-30.
[5]李業(yè)根.基于大數(shù)據(jù)的圖書館信息營銷策略[J].圖書館學(xué)刊,2014,36(10):7-9.
[6]魏士靖,張基溫,耿汝年.基于犯罪畫像的計算機取證分析方法研究[J].微計算機信息,2006,(4):237-239.
[7]王莉.基于數(shù)據(jù)挖掘技術(shù)的品牌客戶畫像管理初探[J].移動通信,2008,32(23):77-82.
[8]Google Buzz[EB/OL].https://baike.baidu.com/item/Google%20Buzz/8379694?fr=Aladdin,2018-03-31.
[9]大數(shù)據(jù)[EB/OL].https://baike.baidu.com/item/%E5%A4%A7%E6%95%B0%E6%8D%AE/1356941?fr=Aladdin,2018-03-31.
[10]劉速.淺議數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)中的用戶畫像——以天津圖書館為例[J].圖書館理論與實踐,2017,(6):103-106.
[11]尹相權(quán),李書寧,弓建華.基于系統(tǒng)日志的高校圖書館研究間用戶利用行為分析[J].現(xiàn)代情報,2018,38(1):115-120.
[12]魏瑞斌.社會網(wǎng)絡(luò)分析在關(guān)鍵詞網(wǎng)絡(luò)分析中的實證研究[J].情報雜志,2009,28(9):46-49.
[13]周晨.國際數(shù)字人文研究特征與知識結(jié)構(gòu)[J].圖書館論壇,2017,37(4):1-8.
[14]楊潔.面向企業(yè)營銷的全景用戶畫像與模型預(yù)測[D].杭州:浙江大學(xué),2017.
[15]李映坤.大數(shù)據(jù)背景下用戶畫像的統(tǒng)計方法實踐研究[D].北京:首都經(jīng)濟貿(mào)易大學(xué),2016.
[16]董莉莉.剖析大數(shù)據(jù)時代下用戶畫像及媒介策略[J].傳媒,2016,(2):82-83.
[17]張琦,施方玲.基于供應(yīng)鏈網(wǎng)絡(luò)信息的大數(shù)據(jù)精準營銷在電商領(lǐng)域的應(yīng)用[J].物流技術(shù),2017,36(9):32-36.
[18]王慶,趙發(fā)珍.基于“用戶畫像”的圖書館資源推薦模式設(shè)計與分析[J].現(xiàn)代情報,2018,38(3):105-109,137.
[19]王順箐.以用戶畫像構(gòu)建智慧閱讀推薦系統(tǒng)[J].圖書館學(xué)研究,2018,(4):92-96.
[20]楊雙亮.用戶畫像在內(nèi)容推送的研究與應(yīng)用[D].北京:北方工業(yè)大學(xué),2017.
[21]付關(guān)友,朱征宇.個性化服務(wù)中基于行為分析的用戶興趣建模[J].計算機工程與科學(xué),2005,27(12):76-78.
[22]王丹.基于主題模型的用戶畫像提取算法研究[D].北京:北京工業(yè)大學(xué),2016.
[23]王慶福.貝葉斯網(wǎng)絡(luò)在用戶興趣模型構(gòu)建中的研究[J].無線互聯(lián)科技,2016,(12):101-102.
[24]胡媛,毛寧.基于用戶畫像的數(shù)字圖書館知識社區(qū)用戶模型構(gòu)建[J].圖書館理論與實踐,2017,(4):82-85,97.
[25]王冬羽.基于移動互聯(lián)網(wǎng)行為分析的用戶畫像系統(tǒng)設(shè)計[D].成都:成都理工大學(xué),2017.
[26]韓梅花,趙景秀.基于“用戶畫像”的閱讀療法模式研究——以抑郁癥為例[J].大學(xué)圖書館學(xué)報,2017,35(6):105-110.
[27]劉海,盧慧,阮金花,等.基于“用戶畫像”挖掘的精準營銷細分模型研究[J].絲綢,2015,52(12):37-42.
[28]劉蓓琳,張琪.基于購買決策過程的電子商務(wù)用戶畫像應(yīng)用研究[J].商業(yè)經(jīng)濟研究,2017,(24):49-51.
[29]裴國才.基于用戶畫像的電信精準營銷模型研究[J].信息通信,2017,(12):240-241,243.
[30]王瑩.翼勛金融王暉:用大數(shù)據(jù)為用戶畫像[N].第一財經(jīng)日報,2015-12-15,(A08).
[31]代晨旭,周熙晨.一種基于內(nèi)容的新聞推薦系統(tǒng)實例[J].電腦知識與技術(shù),2015,(9):36-38.
[32]王智囊.基于用戶畫像的醫(yī)療信息精準推薦的研究[D].成都:電子科技大學(xué).2016,(3):1-68.
[33]李連偉.河北智慧氣象為用戶“畫像”[N].中國氣象報,2017-05-09,(2).
[34]張鈞.基于用戶畫像的圖書館知識發(fā)現(xiàn)服務(wù)研究[J].圖書與情報,2017,(6):60-63.
[35]曾鴻,吳蘇倪.基于微博的大數(shù)據(jù)用戶畫像與精準營銷[J].現(xiàn)代經(jīng)濟信息,2016,(16):306-308.
(責任編輯:陳 媛)