国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Citespace的用戶畫像知識圖譜研究

2022-04-29 19:43:34梁嘉欣何安迪彭梓航
計算機(jī)應(yīng)用文摘 2022年12期
關(guān)鍵詞:時間跨度畫像數(shù)據(jù)挖掘

梁嘉欣 何安迪 彭梓航

關(guān)鍵詞 知識圖譜 用戶畫像

1引言

近年來,已有大量對用戶畫像的相關(guān)研究,而這些研究幾乎是定性分析文獻(xiàn)獲得的成果。面對浩瀚的文獻(xiàn)海洋,定性分析會導(dǎo)致分析結(jié)果過于主觀和片面。本文以CNKI 中國學(xué)術(shù)文獻(xiàn)庫有關(guān)用戶畫像的文獻(xiàn)為研究對象,運用CiteSpace 可視化軟件,對2015~2020 年的用戶畫像研究成果進(jìn)行分析,旨在總結(jié)出用戶畫像領(lǐng)域的研究熱點和不足,以及未來用戶畫像領(lǐng)域的發(fā)展趨勢和發(fā)展空間,為后續(xù)的研究工作提供參考。

2數(shù)據(jù)來源與研究方法

(1)數(shù)據(jù)來源

本文選取中國知網(wǎng)CNKI 中的學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)出版總庫作為數(shù)據(jù)來源,以“用戶畫像”為主題詞進(jìn)行檢索(檢索時間為2020 年8 月4 日),以2015 年1 月1 日為時間起點至檢索時間共得到檢索結(jié)果1557 條。經(jīng)過查重、勘誤、篩選等數(shù)據(jù)處理后,保留1500 條文獻(xiàn),導(dǎo)出純文本格式文件作為本文統(tǒng)計分析的最終數(shù)據(jù)。

(2)研究方法

本文應(yīng)用CiteSpace5.7.R1 軟件對2015~2020 年用戶畫像的時間分布、學(xué)科領(lǐng)域、研究機(jī)構(gòu)、研究熱點和主題演變等進(jìn)行分析,根據(jù)所選統(tǒng)計樣本將分析時間設(shè)置為2015~2020 年,年代切分為1,選擇標(biāo)準(zhǔn)為TOP N 和g?index,閾值設(shè)置分別為50、25。

3結(jié)果分析

3.1總體情況

(1)時間分布

用戶畫像領(lǐng)域發(fā)文量自2015 年呈現(xiàn)迅速上升趨勢,2018~2019 年發(fā)文量呈現(xiàn)較大幅度的提升趨勢。在精準(zhǔn)營銷領(lǐng)域,與用戶畫像相關(guān)的研究已經(jīng)于2015年開始,直到2017 年發(fā)文量呈現(xiàn)大量增長態(tài)勢,此現(xiàn)象說明精準(zhǔn)營銷研究者對用戶畫像的研究開展略遲,隨社會各界和企業(yè)組織對用戶畫像研究開始重視,施行精準(zhǔn)營銷策略的企業(yè)也開始積極參與用戶畫像的理論實踐。

(2)學(xué)科領(lǐng)域

基于CNKI 數(shù)據(jù)庫的學(xué)科分類分布功能,及本文所選對應(yīng)領(lǐng)域的部分文獻(xiàn)進(jìn)行統(tǒng)計分析,結(jié)果顯示:用戶畫像研究成果共來自53 個學(xué)科領(lǐng)域,具備很強(qiáng)的跨學(xué)科特征。計算機(jī)、圖書情報檔案、工商管理和新聞傳播是用戶畫像研究中最為集中的學(xué)科領(lǐng)域,商業(yè)經(jīng)濟(jì)、通信經(jīng)濟(jì)、工業(yè)經(jīng)濟(jì)、金融和控制工程等學(xué)科領(lǐng)域的研究成果也頗為豐碩,教育、信息通信、通信技術(shù)和法學(xué)等學(xué)科領(lǐng)域也有一定的研究成果。統(tǒng)計還顯示,計算機(jī)、新聞傳播、金融、教育、法學(xué)和電器工程等學(xué)科領(lǐng)域均有研究成果,具有較強(qiáng)的跨學(xué)科特性。

3.2研究機(jī)構(gòu)及論文作者的類別

通過研究論文作者及研究機(jī)構(gòu)的構(gòu)成和關(guān)系,可以大概探尋某研究主題研究力量的構(gòu)成以及研究基地和研究團(tuán)隊的組成情況。

(1)研究機(jī)構(gòu)選擇機(jī)構(gòu)作為節(jié)點類型,使用聚類視角進(jìn)行布局,經(jīng)適當(dāng)?shù)墓?jié)點調(diào)整后繪制出研究機(jī)構(gòu)知識圖譜。通過對研究機(jī)構(gòu)合作網(wǎng)絡(luò)圖譜和其他相關(guān)后臺數(shù)據(jù)的分析發(fā)現(xiàn),用戶畫像的研究機(jī)構(gòu)主要有高等院校和公司組織(集團(tuán))兩大類。從研究機(jī)構(gòu)知識圖譜反映的信息發(fā)現(xiàn),主要研究機(jī)構(gòu)有吉林大學(xué)、燕山大學(xué)、江蘇理工學(xué)院、華中師范大學(xué)、武漢大學(xué),部分機(jī)構(gòu)間還建立了合作關(guān)系。

(2)論文作者通過對CiteSpace 繪制的論文作者圖譜和其他相關(guān)后臺數(shù)據(jù)的分析后發(fā)現(xiàn),教授、高校教師、公司組織(集團(tuán))研究者、碩士與博士研究生等是用戶畫像的主要研究者。其中,教授和高校教師組成的研究團(tuán)隊是用戶畫像研究的核心力量。各高校教師和教授主要以大數(shù)據(jù)為基礎(chǔ),對用戶畫像進(jìn)行探索和研究,研究者的研究層次和規(guī)范性處于高水平,但研究的持續(xù)性仍有待進(jìn)一步提升。

總體上,用戶畫像研究以高等院校和公司組織為主要研究基地,由高校教師、教授、碩士與博士研究生和公司組織的研究者構(gòu)成研究群體,在高校核心作者的引領(lǐng)下,形成了深層次且有代表性的研究成果。

3.3研究的關(guān)鍵詞

通過對關(guān)鍵詞進(jìn)行統(tǒng)計分析,得出“用戶畫像”“大數(shù)據(jù)”“精準(zhǔn)營銷”“數(shù)據(jù)挖掘”“推薦系統(tǒng)”“用戶體驗”“圖書館”“個性化推薦”“機(jī)器學(xué)習(xí)”和“深度學(xué)習(xí)”等是研究文獻(xiàn)突出的關(guān)鍵詞,反映用戶畫像研究主要應(yīng)用和服務(wù)于大數(shù)據(jù)、精準(zhǔn)營銷、數(shù)據(jù)挖掘和推薦系統(tǒng)等工程。

3.4特征

用戶畫像研究文獻(xiàn)共被引聚類圖譜共包含400個節(jié)點,933 條連線,網(wǎng)絡(luò)密度為0.0117,并形成了10個聚類,依次為聚類#0 大數(shù)據(jù)(big data)、聚類#1 推薦系統(tǒng)( recommended)、聚類# 2 用戶畫像( useportrait)、聚類#3 用戶體驗(user experience)、聚類#4數(shù)據(jù)挖掘(data mining)、聚類#5 圖書館(library)、聚類#6 隨機(jī)森林( random forest)、聚類# 7 人工智能(artificial intelligence)、聚類#8K?means 聚類(K?meansclustering)、聚類#9 今日頭條(Toutiao)、聚類#10 內(nèi)容運營(content operation)。將2015~2020 年的1500 篇有關(guān)用戶畫像的文獻(xiàn)進(jìn)行文獻(xiàn)共被引的時間線視角圖譜分析,得到這10個聚類的具體研究內(nèi)容和時間跨度。聚類#0 大數(shù)據(jù)(big data)的時間跨度為2015~2020 年,其主要關(guān)注的是在大數(shù)據(jù)環(huán)境下,基于大數(shù)據(jù)技術(shù)和大數(shù)據(jù)分析的用戶畫像研究,如劉穎針對數(shù)字圖書館用戶畫像模型建構(gòu)工作中的用戶數(shù)據(jù)分類效果較差的問題,提出了基于大數(shù)據(jù)技術(shù)的數(shù)字圖書館用戶畫像模型建構(gòu)策略,并通過實驗結(jié)果說明了該大數(shù)據(jù)技術(shù)能夠有效解決分類效果差的問題[1] ; 聚類# 1 推薦系統(tǒng)(recommended)的時間跨度為2015~2020 年,其關(guān)注的主要是精準(zhǔn)營銷、精準(zhǔn)推薦等問題,如在趙巖所做的基于用戶畫像的精準(zhǔn)營銷研究中,發(fā)現(xiàn)將用戶畫像運用于數(shù)字圖書館,可以更為精確地為客戶推薦閱讀資源,以提高用戶的閱讀體驗,從而讓閱讀推廣工作朝著更好的方向發(fā)展[2] ; 聚類#3 用戶體驗( userexperience)的時間跨度為2015~2020 年,此聚類主要研究的是提升服務(wù)質(zhì)量的問題,用戶體驗是在大數(shù)據(jù)時代的各行業(yè)之間的一大競爭優(yōu)勢,也是最不可控的一個“變量”,但是用戶畫像技術(shù)的應(yīng)用能很好地控制這個“變量”,提升用戶體驗,帶領(lǐng)行業(yè)走向更高質(zhì)量的發(fā)展;聚類#4 數(shù)據(jù)挖掘(data mining)的時間跨度為2015~2020 年,此聚類主要關(guān)注的是應(yīng)用數(shù)據(jù)挖掘技術(shù)在龐大的數(shù)據(jù)庫中挖掘出具有價值的數(shù)據(jù)信息,從而勾勒出用戶的數(shù)據(jù)面貌,構(gòu)建一個更為精準(zhǔn)的用戶畫像系統(tǒng)。比如,唐慧祥等人基于海量淘寶用戶行為特征數(shù)據(jù)利用Weka、R 數(shù)據(jù)挖掘軟件,使用K?Means聚類算法為解決淘寶平臺存在的用戶定位不精確等營銷問題提出了合理化的建議[3] ;聚類#5 圖書館(library)的時間跨度為2015~2020 年;聚類#6 隨機(jī)森林(random forest)的時間跨度為2016~2020 年,和其他算法相比,隨機(jī)森林在大量數(shù)據(jù)中的表現(xiàn)是較為良好的,但是其在噪聲大的分類或回歸問題上會過擬的問題已經(jīng)得到了證實,因此將其運用到用戶畫像系統(tǒng)的構(gòu)建上會因為干擾的存在而使系統(tǒng)的性能大大下降;聚類#7 人工智能(artificial intelligence)的時間跨度為2015~2020 年,面對龐大的用戶數(shù)據(jù),用戶畫像的出現(xiàn)無疑是人工智能時代的一大熱點,相對于之前的語音識別技術(shù)和圖片識別技術(shù),用戶畫像的出現(xiàn)能幫助企業(yè)和商家在龐大的數(shù)據(jù)庫中篩選出有用的數(shù)據(jù),最終做到精準(zhǔn)推薦和精準(zhǔn)營銷;聚類#8K?means 聚類(K?means clustering)的時間跨度為2016~2020 年,K?means 算法因其能夠遵循一定的準(zhǔn)則將需要找到一定關(guān)聯(lián)性的事物進(jìn)行分類的功能,現(xiàn)許多領(lǐng)域都會運用到K?means 聚類算法。將此算法與用戶畫像技術(shù)結(jié)合起來研究的文獻(xiàn)數(shù)量同樣不少。但是,經(jīng)典k?means 算法存在在多視角聚類中容易陷入局部最優(yōu)的缺陷[3] ;聚類#9 今日頭條(Toutiao) 的時間跨度為2015~2020,“今日頭條” 是一款成功的推薦引擎產(chǎn)品,也是在國內(nèi)互聯(lián)網(wǎng)中成長最快的產(chǎn)品,有關(guān)數(shù)據(jù)顯示,截至2019 年12 月,頭條號賬號總數(shù)超過了180萬,平均每天發(fā)布60 萬條內(nèi)容。由于實時更新的用戶數(shù)據(jù),使得其基于用戶畫像的個性化推薦系統(tǒng)具備很強(qiáng)的時效性特點[4] ;聚類#10 內(nèi)容運營(contentoperation)的研究跨度為2017~2019 年?;诋?dāng)下的新媒體環(huán)境,重要的不僅僅是內(nèi)容質(zhì)量本身,內(nèi)容營銷的渠道也一樣需要受到重視。

4結(jié)論與展望

(1)結(jié)論

第一,近五年用戶畫像領(lǐng)域發(fā)文量呈現(xiàn)迅速上升趨勢,學(xué)科背景豐富,具有跨學(xué)科特性。研究文獻(xiàn)涉及學(xué)科寬泛,多出現(xiàn)學(xué)科交叉的情況,其中計算機(jī)學(xué)科領(lǐng)域較常見。

第二,國內(nèi)用戶畫像研究力量主要有高等院校和公司組織兩大類,院校之間、院校與公司之間存在合作研究的情況。以燕山大學(xué)和吉林大學(xué)等高校的研究者為核心研究力量,引領(lǐng)國內(nèi)公司組織,發(fā)表了深層次且有代表性的研究成果。

第三,用戶畫像研究主要圍繞“用戶畫像”“大數(shù)據(jù)”“精準(zhǔn)營銷”“數(shù)據(jù)挖掘”和“推薦系統(tǒng)”等主題展開。研究基于用戶畫像研究中數(shù)據(jù)基礎(chǔ)層面、核心技術(shù)層面和實際應(yīng)用層面,主要應(yīng)用和服務(wù)于大數(shù)據(jù)、精準(zhǔn)營銷、數(shù)據(jù)挖掘和推薦系統(tǒng)等工程。

(2)展望

第一,用戶畫像研究領(lǐng)域以及應(yīng)用領(lǐng)域的拓展。用戶畫像具有較強(qiáng)的跨學(xué)科性和學(xué)科交叉性的特征,所以在未來可以拓展出更多的研究領(lǐng)域。

第二,構(gòu)建維度向多元化發(fā)展。如今,用戶畫像對于大量的非顯性信息存在難以獲取、研究不夠深入的問題。此外,對于用戶一天中隨著時間動態(tài)變化的數(shù)據(jù)信息存在難以區(qū)別分析的問題。由此可以看出,用戶畫像的構(gòu)建維度不夠多元化,如何通過相關(guān)技術(shù)挖掘分析出實時變化的用戶數(shù)據(jù)的規(guī)律,構(gòu)建起更具真實性的用戶畫像是往后用戶畫像研究的一大趨勢。

第三,更注重對用戶隱私的保護(hù)。在如今這個互聯(lián)網(wǎng)時代,數(shù)據(jù)量相較于以往多得多,所以隱私保護(hù)顯得更加困難。因此,在用戶畫像研究領(lǐng)域,我們更應(yīng)該注重隱私保護(hù)問題。

第四,創(chuàng)建出更精準(zhǔn)的用戶畫像系統(tǒng)。人工智能的發(fā)展預(yù)示著相關(guān)技術(shù)的升級和突破,而更加先進(jìn)的技術(shù)將構(gòu)建出一個更能滿足企業(yè)需求的用戶畫像系統(tǒng)。

猜你喜歡
時間跨度畫像數(shù)據(jù)挖掘
威猛的畫像
如虎
——黃胄畫貓賀歲展
中華書畫家(2022年4期)2022-04-21 09:31:06
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
“00后”畫像
畫像
電視劇《父母愛情》受歡迎的原因探析
淺談回顧性成就報道的創(chuàng)作思路
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
傳感器網(wǎng)絡(luò)分簇時間跨度優(yōu)化聚類算法
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
苏州市| 武邑县| 砚山县| 琼中| 葵青区| 陇西县| 盐边县| 黄山市| 门源| 丰城市| 定日县| 板桥市| 白城市| 息烽县| 榆中县| 商都县| 平度市| 陆川县| 来凤县| 武川县| 柞水县| 波密县| 朝阳市| 新干县| 肥东县| 长海县| 临泽县| 宁化县| 定西市| 阳谷县| 桃园市| 仙居县| 高台县| 长汀县| 巩留县| 邵东县| 泽普县| 海城市| 涡阳县| 临江市| 永修县|