国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于標(biāo)簽與短評(píng)數(shù)據(jù)的用戶標(biāo)注行為特征分析

2023-11-15 08:24:46邰楊芳王紫瓊劉慧芳李迎娟
情報(bào)工程 2023年4期
關(guān)鍵詞:星級(jí)社會(huì)化標(biāo)簽

邰楊芳 王紫瓊 劉慧芳 李迎娟

山西醫(yī)科大學(xué)管理學(xué)院 太原 030001

引言

用戶標(biāo)注行為是指互聯(lián)網(wǎng)用戶對(duì)網(wǎng)絡(luò)信息資源添加標(biāo)簽、發(fā)表評(píng)論、打分和進(jìn)行等級(jí)評(píng)定等過程[1]。在可向用戶提供標(biāo)注功能的網(wǎng)站或網(wǎng)絡(luò)信息資源管理系統(tǒng)中,不同的用戶可以對(duì)同一資源進(jìn)行標(biāo)注,并且標(biāo)注行為的結(jié)果向系統(tǒng)中其他用戶開放。隨著參與資源標(biāo)注活動(dòng)的系統(tǒng)用戶數(shù)量的不斷增加,標(biāo)注所形成的標(biāo)簽、評(píng)論和等級(jí)評(píng)價(jià)結(jié)果反映了網(wǎng)絡(luò)大眾對(duì)網(wǎng)絡(luò)信息資源或服務(wù)的共同理解或一致評(píng)價(jià),這便使用戶的標(biāo)注行為具有了社會(huì)性。因而,網(wǎng)絡(luò)用戶的標(biāo)注行為也被稱為社會(huì)化標(biāo)注行為,具有社會(huì)化標(biāo)注功能的網(wǎng)站系統(tǒng)也被稱為社會(huì)化標(biāo)注系統(tǒng)。

從用戶的角度來看,對(duì)所分享和關(guān)注的信息資源打標(biāo)簽或發(fā)表評(píng)論等標(biāo)注行為,是對(duì)資源的內(nèi)容、形式等特征的揭示和個(gè)人觀點(diǎn)、看法等的表達(dá),這一過程實(shí)現(xiàn)了網(wǎng)絡(luò)信息資源的有序化和用戶的自我表達(dá),為今后對(duì)信息資源的查找利用和其他用戶發(fā)現(xiàn)該資源提供了便利和有益參考。從社會(huì)化標(biāo)注系統(tǒng)的角度,用戶的標(biāo)注行為數(shù)據(jù)可反映用戶的興趣偏好、標(biāo)注行為規(guī)律及用戶對(duì)系統(tǒng)功能和服務(wù)(包括所提供的信息資源)的態(tài)度、評(píng)價(jià)和意見等,為系統(tǒng)功能和服務(wù)的優(yōu)化以吸引更多的用戶訪問和使用該資源平臺(tái)提供有價(jià)值的信息。因此,對(duì)社會(huì)化標(biāo)注系統(tǒng)中用戶標(biāo)注行為的研究一直是網(wǎng)絡(luò)環(huán)境中用戶信息行為研究的重要內(nèi)容。本文以豆瓣讀書平臺(tái)的健康類圖書資源的標(biāo)簽、短評(píng)和用戶對(duì)評(píng)論文本的點(diǎn)贊支持等標(biāo)注行為數(shù)據(jù)為分析對(duì)象,挖掘用戶的標(biāo)注行為規(guī)律,為社會(huì)化標(biāo)注系統(tǒng)的有效管理和系統(tǒng)功能優(yōu)化提供參考。

1 用戶標(biāo)注行為研究現(xiàn)狀

通過文獻(xiàn)調(diào)研發(fā)現(xiàn),目前關(guān)于網(wǎng)絡(luò)用戶標(biāo)注行為的研究,主要包括兩大類:基于標(biāo)簽的用戶標(biāo)注行為分析和基于評(píng)論的用戶標(biāo)注行為分析。

1.1 基于標(biāo)簽的用戶標(biāo)注行為研究

基于標(biāo)簽的用戶標(biāo)注行為分析以用戶為資源添加的標(biāo)簽為數(shù)據(jù)對(duì)象分析、推斷用戶的標(biāo)注行為特征或規(guī)律并加以應(yīng)用。主要內(nèi)容包括:通過標(biāo)簽的類別或功能分析用戶的標(biāo)注動(dòng)機(jī)[2,3];分析用戶對(duì)標(biāo)簽的使用特征(如所用標(biāo)簽的數(shù)量、標(biāo)注頻次和標(biāo)簽重用等)并據(jù)此探討當(dāng)所標(biāo)注的資源類型、個(gè)人背景信息甚至使用的社會(huì)化標(biāo)注系統(tǒng)不同時(shí),用戶標(biāo)簽標(biāo)注行為的差異及影響因素[4-6];基于標(biāo)簽的內(nèi)容和形式特征挖掘用戶的興趣偏好和標(biāo)簽的選擇偏好等信息,據(jù)此探討面向用戶的個(gè)性化服務(wù)問題[7,8]。包括向用戶推薦標(biāo)注某資源時(shí)可選用的標(biāo)簽、推薦符合其興趣偏好的資源、推薦同趣好友,基于用戶標(biāo)注行為特點(diǎn)進(jìn)行系統(tǒng)功能的優(yōu)化和發(fā)起相關(guān)活動(dòng)以吸引更多用戶和增加用戶粘性等。

1.2 基于評(píng)論的用戶標(biāo)注行為研究

通過用戶的評(píng)論信息可了解用戶對(duì)所獲得的資源和服務(wù)等的關(guān)注焦點(diǎn)、評(píng)價(jià)和滿意度等,因此用戶的評(píng)論信息和評(píng)論行為的價(jià)值也受到業(yè)界和學(xué)界的關(guān)注。在信息資源管理領(lǐng)域,研究者除了關(guān)注用戶評(píng)論所反映的資源屬性特征之外,用戶對(duì)資源批注評(píng)論文本、對(duì)已有評(píng)論表示支持或反對(duì)等的評(píng)論行為也成為值得關(guān)注的有價(jià)值信息。相關(guān)的評(píng)論行為研究主要包括:對(duì)用戶發(fā)表、回復(fù)、點(diǎn)贊評(píng)論數(shù)據(jù)的統(tǒng)計(jì)分析,反映用戶評(píng)論行為的活躍度并揭示用戶間的互動(dòng)行為特征[9,10];基于評(píng)論文本的內(nèi)容特征發(fā)現(xiàn)用戶的興趣偏好、進(jìn)行個(gè)性化推薦服務(wù)[11,12];基于評(píng)論文本的形式特征(詞匯量、段落數(shù)、文本長度)、情感特征、資源的星級(jí)評(píng)分及評(píng)論者的個(gè)人特征等信息探究影響用戶關(guān)于評(píng)論的感知有用性的主要因素[13,14];也有少部分學(xué)者關(guān)注用戶評(píng)論行為之間的關(guān)系。如,馬松岳等[15]通過分析豆瓣電影版塊中電影的評(píng)論文本情感值與用戶對(duì)電影標(biāo)注的星級(jí)評(píng)分二者之間的量化關(guān)系,發(fā)現(xiàn)用戶評(píng)論評(píng)價(jià)與打分評(píng)價(jià)行為之間具有一致性。

1.3 研究述評(píng)

已有關(guān)于社會(huì)化標(biāo)注系統(tǒng)的用戶標(biāo)注行為的研究普遍將用戶為資源標(biāo)注的標(biāo)簽和對(duì)資源進(jìn)行的評(píng)論作為兩項(xiàng)獨(dú)立的數(shù)據(jù)進(jìn)行問題的探討;在評(píng)論行為方面,少量涉及評(píng)論行為之間關(guān)系的研究還處于初步嘗試階段,僅涉及兩個(gè)變量之間的相關(guān)性分析。對(duì)社會(huì)化標(biāo)注系統(tǒng)中網(wǎng)絡(luò)用戶標(biāo)注行為信息的分析和利用有限。

充分利用社會(huì)化標(biāo)注系統(tǒng)中的用戶標(biāo)注行為信息,全面了解用戶的標(biāo)注行為特點(diǎn)及內(nèi)在規(guī)律,有利于社會(huì)化標(biāo)注系統(tǒng)對(duì)系統(tǒng)中資源的更有效管理和為用戶提供更為滿意的資源和服務(wù)。為此,本文在界定社會(huì)化標(biāo)注系統(tǒng)中用戶標(biāo)注行為及類型的基礎(chǔ)上,基于用戶為資源標(biāo)注標(biāo)簽和進(jìn)行評(píng)論的多類型標(biāo)注行為數(shù)據(jù),挖掘用戶的標(biāo)注行為特征及規(guī)律,并在此基礎(chǔ)上提出社會(huì)化標(biāo)注系統(tǒng)功能及服務(wù)的優(yōu)化建議。

2 社會(huì)化標(biāo)注行為及其類型

社會(huì)化標(biāo)注行為是指用戶與社會(huì)化標(biāo)注系統(tǒng)資源進(jìn)行交互的具體操作[16]。隨著Web2.0技術(shù)的深入應(yīng)用和社會(huì)化標(biāo)注系統(tǒng)功能的不斷發(fā)展和完善,用戶的標(biāo)注行為的外延也在不斷發(fā)展。根據(jù)當(dāng)前社會(huì)化標(biāo)注系統(tǒng)中用戶與信息資源的互動(dòng)關(guān)系,用戶為資源標(biāo)注標(biāo)簽、為資源添加評(píng)論、對(duì)資源的評(píng)分或星級(jí)評(píng)定以及對(duì)其他用戶關(guān)于資源的評(píng)論所進(jìn)行的點(diǎn)贊支持或有用性投票行為均屬于標(biāo)注行為的范疇。按照標(biāo)注行為形成的標(biāo)注結(jié)果,本文將其分為用戶的標(biāo)簽行為和評(píng)論行為。

2.1 標(biāo)簽行為

標(biāo)簽行為即是用戶在網(wǎng)絡(luò)環(huán)境中根據(jù)自己的認(rèn)知選擇系統(tǒng)中的已有標(biāo)簽或自定義的標(biāo)簽標(biāo)識(shí)資源的過程。標(biāo)簽行為是社會(huì)化標(biāo)注系統(tǒng)用戶最基本和最主要標(biāo)注行為,其本質(zhì)及出發(fā)點(diǎn)是為了實(shí)現(xiàn)大眾參與的對(duì)海量網(wǎng)絡(luò)信息資源的有效組織。通過為資源添加的標(biāo)簽,網(wǎng)絡(luò)用戶不僅可以在個(gè)人信息空間內(nèi)組織、管理、檢索信息資源,還可以方便、快捷地獲得與自己使用的標(biāo)簽相同的其他被標(biāo)注資源和標(biāo)注資源的用戶,在促進(jìn)知識(shí)分享的同時(shí),也拓展了用戶之間溝通交流的渠道。

2.2 評(píng)論行為

評(píng)論行為是指用戶在閱讀資源后表達(dá)有關(guān)資源的內(nèi)容、形式或閱讀收獲或閱讀目標(biāo)達(dá)成情況等信息的過程。社會(huì)化標(biāo)注系統(tǒng)中用戶的評(píng)論行為主要體現(xiàn)為用戶對(duì)感興趣的資源進(jìn)行文本評(píng)論,還包括對(duì)資源進(jìn)行打分(星級(jí)評(píng)分)、對(duì)他人評(píng)論文本內(nèi)容的“有用性”感知(選擇其他用戶的評(píng)論對(duì)自己是否“有用”)。在“豆瓣讀書”系統(tǒng)中,用戶可對(duì)感興趣的圖書資源發(fā)表350 字以內(nèi)的短評(píng);以星級(jí)評(píng)分的形式對(duì)圖書資源進(jìn)行評(píng)價(jià),一星到五星分別代表很差、較差、還行、推薦和力薦;還可通過“有用”按鈕對(duì)短評(píng)文本進(jìn)行標(biāo)注,“有用”的個(gè)數(shù)也叫短評(píng)支持度,是指支持該評(píng)論的用戶數(shù),個(gè)數(shù)越多說明該短評(píng)文本的信息內(nèi)容越有參考價(jià)值。

無論是用戶的標(biāo)簽行為還是評(píng)論行為,二者都是用戶的內(nèi)容生成和內(nèi)容共享行為,其標(biāo)注行為的結(jié)果是為社會(huì)化標(biāo)注系統(tǒng)貢獻(xiàn)了用戶智慧、表達(dá)了用戶的觀點(diǎn)和態(tài)度、生成大量用戶行為數(shù)據(jù),這些都成為社會(huì)化標(biāo)注系統(tǒng)中極具價(jià)值的信息。本文研究用戶的標(biāo)注行為數(shù)據(jù),旨在挖掘用戶的標(biāo)注行為特點(diǎn)及規(guī)律,為社會(huì)化標(biāo)注系統(tǒng)的持續(xù)良性發(fā)展提供優(yōu)化參考。

3 研究設(shè)計(jì)

整合標(biāo)簽與評(píng)論數(shù)據(jù)的社會(huì)化標(biāo)注系統(tǒng)用戶標(biāo)注行為特征分析框架如圖1 所示,整體研究內(nèi)容包含數(shù)據(jù)收集與預(yù)處理、用戶標(biāo)簽行為分析,用戶評(píng)論行為分析三個(gè)模塊。

圖1 用戶標(biāo)注行為特征研究框架

3.1 數(shù)據(jù)收集與預(yù)處理

采用自主編寫的Python 代碼,爬取豆瓣讀書“健康”類目下所有圖書的標(biāo)注信息,共采集兩類數(shù)據(jù)文本。第一類是標(biāo)簽數(shù)據(jù)集,具體數(shù)據(jù)項(xiàng)包括:圖書名、ISBN、圖書的URL、用戶標(biāo)簽;第二類是短評(píng)數(shù)據(jù)集,具體數(shù)據(jù)項(xiàng)包括:用戶名、短評(píng)時(shí)間、短評(píng)內(nèi)容、星級(jí)評(píng)分、短評(píng)支持度。數(shù)據(jù)采集時(shí)間為2021 年11 月25 日。

對(duì)獲取的原始數(shù)據(jù)集進(jìn)行清洗。首先,統(tǒng)計(jì)每本圖書標(biāo)簽數(shù)及短評(píng)文本數(shù),發(fā)現(xiàn)圖書標(biāo)簽數(shù)平均為8 個(gè),且標(biāo)簽數(shù)大于8 的圖書其短評(píng)數(shù)均大于100,因此,為避免數(shù)據(jù)稀疏性問題,本文篩選標(biāo)簽數(shù)大于8 且用戶評(píng)論數(shù)大于100 的圖書,共計(jì)127 本作數(shù)據(jù)源。其次,針對(duì)127 本圖書的標(biāo)簽和短評(píng)數(shù)據(jù),刪除無意義字符,進(jìn)行將繁體轉(zhuǎn)為簡(jiǎn)體、縮寫轉(zhuǎn)為全稱、同義詞合并等處理,共計(jì)1013 個(gè)標(biāo)簽,21968條短評(píng)文本。

3.2 用戶標(biāo)簽行為分析

本文從標(biāo)簽長度和標(biāo)簽詞性這兩個(gè)特征對(duì)豆瓣健康類圖書標(biāo)簽的用戶標(biāo)注行為進(jìn)行分析。

標(biāo)簽長度指用戶所使用標(biāo)簽的字符個(gè)數(shù),是一個(gè)比較常用的表征用戶標(biāo)注行為的量化指標(biāo)[6]。為了方便計(jì)算,在對(duì)標(biāo)簽長度進(jìn)行統(tǒng)計(jì)時(shí)將1 個(gè)漢字/英文字母記為1 個(gè)字符,用Len()函數(shù)統(tǒng)計(jì)所有標(biāo)簽的長度。

詞性標(biāo)注是指對(duì)文本數(shù)據(jù)中每個(gè)詞的詞性進(jìn)行標(biāo)注的過程,是自然語言處理的重要技術(shù)。本文借助Python 中的Spacy 中文版對(duì)標(biāo)簽進(jìn)行詞性標(biāo)注;其次,為提高詞性標(biāo)注準(zhǔn)確率,將標(biāo)簽中包含的部分詞組數(shù)據(jù)放入用戶自定義詞典。

3.3 用戶評(píng)論行為分析

對(duì)豆瓣健康類圖書的用戶評(píng)論行為分析包括評(píng)論文本的情感傾向性分析以及用戶評(píng)論行為的相關(guān)性分析。

3.3.1 用戶評(píng)論文本的情感分析

文本的情感分析,也稱為情感傾向性分析,是從文本中發(fā)現(xiàn)或挖掘人們對(duì)于某種事物、產(chǎn)品或服務(wù)所表達(dá)出的情感、意見或情緒[17]。百度AI 情感傾向性分析是基于大規(guī)模數(shù)據(jù)和深度學(xué)習(xí)訓(xùn)練,自動(dòng)學(xué)習(xí)深層次的語義及語序特征的過程,其具備較強(qiáng)的泛化能力和高精確度,在汽車、餐飲、酒店等領(lǐng)域的情感傾向性分析準(zhǔn)確率達(dá)95%以上[18]。因此,本文借助百度AI 中的情感傾向分析技術(shù)挖掘用戶關(guān)于圖書資源的態(tài)度和感受。采用Python 自編語言,通過百度自然語言處理情感分析接口(AipNlp)對(duì)預(yù)處理后的短評(píng)文本數(shù)據(jù)進(jìn)行情感傾向性分析。該接口反饋的結(jié)果為json 格式的數(shù)據(jù)。其中包含屬于積極情感的概率(positive_prob),屬于消極情感的概率(negative_prob),分類的置信度(confidence)和情感極性分類結(jié)果(sentiment:0 為負(fù)向,1 為中性,2 為正向)。為方便分析,本文以短評(píng)文本屬于積極情感的概率表示文本的情感傾向值來進(jìn)行后續(xù)相關(guān)性分析。

3.3.2 用戶評(píng)論行為的相關(guān)性分析

評(píng)論行為的相關(guān)性分析,是在將用戶的評(píng)論行為結(jié)果量化之后分析行為變量兩兩之間的相關(guān)性,即分析用戶對(duì)資源的文本評(píng)論行為、星級(jí)評(píng)分行為和對(duì)資源的有用性感知行為之間的相關(guān)性。其中,用戶對(duì)資源的文本評(píng)論行為用評(píng)論文本的情感值表示,對(duì)資源的星級(jí)評(píng)分行為用星級(jí)賦值表示(一星到五星的分值分別設(shè)置為1、2、3、4、5),對(duì)評(píng)論有用性感知行為采用該短評(píng)的支持用戶數(shù)(支持度)表示。為消除三類數(shù)據(jù)在數(shù)量級(jí)上存在的差異,在相關(guān)性分析之前首先采用Z-Score 法對(duì)其進(jìn)行標(biāo)準(zhǔn)化處理,然后采用SPSS26.0 對(duì)經(jīng)標(biāo)準(zhǔn)化處理后的數(shù)據(jù)進(jìn)行相關(guān)性分析。最后,從單本圖書和整體圖書兩個(gè)層面對(duì)用戶評(píng)論行為進(jìn)行討論。通常情況下:相關(guān)系數(shù)r 在0.8~1.0 為極強(qiáng)相關(guān),0.6~0.8 為強(qiáng)相關(guān),0.4~0.6 為中等程度相關(guān),0.2~0.4 為弱相關(guān),0.0~0.2 為極弱相關(guān)或無相關(guān)。

4 數(shù)據(jù)分析結(jié)果

4.1 用戶標(biāo)簽行為特征

4.1.1 標(biāo)簽長度統(tǒng)計(jì)分析

對(duì)健康類圖書的標(biāo)簽長度統(tǒng)計(jì)分析(表1)發(fā)現(xiàn),用戶使用標(biāo)簽的長度整體分布在1~7 個(gè)字符之間,其中,主要集中在2~5 個(gè)字符之間,標(biāo)簽個(gè)數(shù)累計(jì)占比98.82%。同時(shí),對(duì)標(biāo)簽數(shù)據(jù)進(jìn)行人工觀察發(fā)現(xiàn),6~7 個(gè)字符長度的標(biāo)簽數(shù)據(jù)描述的多為人名和書名。該統(tǒng)計(jì)結(jié)果在一定程度上反映出用戶標(biāo)注行為符合最小用力法則,即用戶更傾向于使用較短字符長度的詞語對(duì)健康類圖書資源進(jìn)行標(biāo)簽標(biāo)注。

表1 標(biāo)簽長度統(tǒng)計(jì)分析結(jié)果

4.1.2 標(biāo)簽詞性統(tǒng)計(jì)分析

統(tǒng)計(jì)每種詞性的標(biāo)簽個(gè)數(shù)及占比情況如表2所示。用戶主要使用名詞、動(dòng)詞、形容詞這三種詞性的標(biāo)簽對(duì)健康類圖書資源進(jìn)行標(biāo)注。其中,名詞占比最大,占總標(biāo)簽個(gè)數(shù)的67.23%,動(dòng)詞次之,形容詞最少,僅占總標(biāo)簽個(gè)數(shù)的2.07%。結(jié)合標(biāo)簽內(nèi)容可知,用戶偏向用名詞描述圖書資源中的主題內(nèi)容(睡眠、食品、藥物、基因等)、學(xué)科領(lǐng)域(營養(yǎng)學(xué)、心理學(xué)、醫(yī)學(xué)、中醫(yī)、生物學(xué)、社會(huì)學(xué)等)、國家(美國、日本、中國、德國等)、研究對(duì)象(兒童、女性等)、作者(徐文兵、武志紅、于娟等);用戶偏向用動(dòng)詞詞性描述圖書主題內(nèi)容(減肥、跑步、育兒)等信息,使用形容詞詞性標(biāo)簽描述用戶對(duì)圖書的評(píng)價(jià)信息,比如,用戶會(huì)用“好書”“值得一讀”等標(biāo)簽來表示對(duì)圖書資源的認(rèn)可。

表2 標(biāo)簽詞性統(tǒng)計(jì)分析結(jié)果

4.2 用戶評(píng)論行為特征

4.2.1 評(píng)論文本的情感類別統(tǒng)計(jì)

統(tǒng)計(jì)所有短評(píng)文本的情感類別,結(jié)果見表3。整體來看,用戶關(guān)于健康類圖書的評(píng)價(jià)及看法持積極態(tài)度,表明豆瓣圖書較大程度上滿足了用戶的健康知識(shí)閱讀需求。

表3 短評(píng)文本的情感類別統(tǒng)計(jì)

4.2.2 用戶評(píng)論行為的相關(guān)性

(1)單本圖書的用戶評(píng)論行為相關(guān)性

首先,本文以圖書《最好的抉擇》為例進(jìn)行用戶評(píng)論行為的相關(guān)分析,結(jié)果如表4;其次,統(tǒng)計(jì)127 本健康類圖書的用戶評(píng)論行為的顯著性結(jié)果(表5)與相關(guān)性強(qiáng)弱結(jié)果(表6)。

表4 《最好的抉擇》相關(guān)分析結(jié)果

表5 127 本圖書相關(guān)分析顯著性統(tǒng)計(jì)結(jié)果

表6 相關(guān)性強(qiáng)弱分級(jí)統(tǒng)計(jì)結(jié)果

《最好的抉擇》短評(píng)數(shù)據(jù)的情感值與星級(jí)評(píng)分在0.01 水平上顯著相關(guān),且表現(xiàn)為弱正相關(guān);情感值與支持度在0.01 水平上顯著相關(guān),且表現(xiàn)為極弱正相關(guān);星級(jí)評(píng)分與支持度在0.05 水平上顯著相關(guān),也表現(xiàn)為極弱正相關(guān)。

表5 和表6 顯示,96.85%健康類圖書的短評(píng)文本情感值與星級(jí)評(píng)分在0.05 水平上顯著相關(guān),其中,92.68%的圖書數(shù)據(jù)表現(xiàn)為弱正相關(guān)與中等程度正相關(guān),4.88%的健康類圖書資源表現(xiàn)為極弱正相關(guān),特別地,有3 本圖書數(shù)據(jù)表現(xiàn)為強(qiáng)正相關(guān),說明用戶對(duì)圖書的評(píng)價(jià)和看法與打出的星級(jí)評(píng)分具有一致性,兩者都能較好地揭示用戶對(duì)圖書內(nèi)容的觀點(diǎn)看法與態(tài)度傾向。然而,僅有15 本圖書資源的情感值與支持度在0.05 水平上顯著相關(guān)、26 本圖書的星級(jí)評(píng)分與支持度顯著相關(guān),且部分圖書資源的短評(píng)文本情感值與支持度、星級(jí)評(píng)分與支持度存在負(fù)相關(guān)的情況。

(2)整體圖書的用戶評(píng)論行為相關(guān)性

對(duì)健康類圖書的全部短評(píng)數(shù)據(jù)整體進(jìn)行相關(guān)分析,結(jié)果如表7,短評(píng)文本的情感值、圖書資源星級(jí)評(píng)分與短評(píng)支持度兩兩變量之間在0.01 水平上顯著相關(guān),其中,情感值與星級(jí)評(píng)分呈弱正相關(guān),再次表明用戶關(guān)于健康類圖書發(fā)表評(píng)論的情感態(tài)度與打出的星級(jí)評(píng)分具有一致性;星級(jí)評(píng)分與支持度呈極弱正相關(guān),情感值與支持度呈極弱負(fù)相關(guān)。

表7 整體圖書相關(guān)分析結(jié)果

5 結(jié)論與建議

5.1 社會(huì)化標(biāo)注系統(tǒng)中用戶標(biāo)注行為規(guī)律及特點(diǎn)

(1)用戶在標(biāo)簽詞的選用上呈現(xiàn)出一定的用詞規(guī)律和詞性偏好。

首先,在用標(biāo)簽標(biāo)注資源時(shí),用戶傾向使用字符長度為2~5 的標(biāo)簽對(duì)健康類圖書信息進(jìn)行標(biāo)注。在表達(dá)文獻(xiàn)內(nèi)容特征的主題檢索語言中,關(guān)鍵詞屬于非受控的主題檢索語言,其一般也為2~5 個(gè)字符長度。同時(shí),標(biāo)簽和關(guān)鍵詞也都屬于自然語言的范疇。這說明,用戶選擇標(biāo)簽標(biāo)注資源與選擇關(guān)鍵詞表達(dá)文獻(xiàn)資源主題相似。

其次,在選擇標(biāo)簽時(shí),用戶偏向使用名詞、動(dòng)詞、形容詞這三種詞性標(biāo)注健康類圖書資源。名詞和動(dòng)詞標(biāo)簽主要用于信息資源進(jìn)行主題分類、組織以實(shí)現(xiàn)網(wǎng)絡(luò)空間中資源的有序化目的,方便自己今后對(duì)這些資源的查找和利用。同時(shí),也為他人對(duì)信息資源的獲取提供了便利。形容詞標(biāo)簽主要用于表達(dá)用戶對(duì)資源內(nèi)容的評(píng)價(jià)和用戶自身感受,這類標(biāo)簽在對(duì)資源有一定分類作用的同時(shí),可為他人提供資源選擇時(shí)的參考價(jià)值,利他性更強(qiáng)一些。

(2)用戶對(duì)信息資源的文本評(píng)論、星級(jí)評(píng)分和有用感知行為都具有評(píng)價(jià)資源的作用,并且它們之間具有一定關(guān)聯(lián)性。

在文本評(píng)論模塊,用戶關(guān)于資源的評(píng)論總會(huì)呈現(xiàn)出一定的情感傾向,這可能是由于模塊的評(píng)論功能本身的引導(dǎo),使用戶主動(dòng)愿意將對(duì)資源的內(nèi)容、質(zhì)量、感受等方面的內(nèi)容表達(dá)出來并給予評(píng)價(jià)。豆瓣讀書用戶對(duì)其中的健康類圖書的評(píng)價(jià)整體持積極態(tài)度,對(duì)該類圖書的認(rèn)同度較高。星級(jí)評(píng)分是用戶對(duì)于圖書資源最直觀的評(píng)價(jià),通過用戶對(duì)評(píng)論文本的有用性感知,可以篩選出更具有可信度的圖書評(píng)論。

從單本圖書來看,用戶評(píng)論文本的情感值與對(duì)資源的星級(jí)評(píng)分結(jié)果之間都呈現(xiàn)正向相關(guān)性,兩者都能較好地揭示用戶對(duì)圖書內(nèi)容的觀點(diǎn)看法與態(tài)度,一致反映用戶對(duì)圖書的評(píng)價(jià);資源的星級(jí)評(píng)分與獲得的評(píng)論有用性感知得分之間的相關(guān)性方面,部分圖書資源的內(nèi)容質(zhì)量較差時(shí),用戶對(duì)圖書內(nèi)容的不認(rèn)同或消極情緒會(huì)引起其他用戶的共鳴。即,星級(jí)評(píng)分較低的圖書資源,其評(píng)論文本內(nèi)容對(duì)于他人的有用性較高,進(jìn)一步起到區(qū)分出該圖書資源的作用。從整體圖書而言,圖書的星級(jí)評(píng)分越高,其評(píng)論文本內(nèi)容越可能獲得較高的認(rèn)同度;評(píng)論文本的負(fù)向情感傾向越明顯,該評(píng)論文本越有較高的機(jī)會(huì)得到他人的共鳴。

5.2 基于用戶標(biāo)注行為的社會(huì)化標(biāo)注系統(tǒng)優(yōu)化建議

在“以人為中心”的web2.0 環(huán)境中,人是最重要的因素。用戶的體驗(yàn)決定了用戶在網(wǎng)絡(luò)系統(tǒng)平臺(tái)中行為的持續(xù)性和創(chuàng)造性,是激發(fā)平臺(tái)生命力的最重要源泉。用戶是社會(huì)化標(biāo)注系統(tǒng)中資源的消費(fèi)者和生產(chǎn)者,是信息資源的管理者和評(píng)價(jià)者,也是大眾智慧的創(chuàng)造者,源源不斷地創(chuàng)造數(shù)據(jù)、知識(shí)及其他價(jià)值。社會(huì)化標(biāo)注系統(tǒng)只有不斷地完善其功能和服務(wù),滿足用戶需求并為其提供良好的上網(wǎng)體驗(yàn),才能得到持續(xù)發(fā)展?;谟脩魳?biāo)注行為特點(diǎn)及規(guī)律的社會(huì)化標(biāo)注系統(tǒng)優(yōu)化建議如下:

(1)完善標(biāo)簽推薦功能,向用戶推薦符合其使用偏好和更準(zhǔn)確的標(biāo)簽。標(biāo)簽推薦功能使資源的標(biāo)注更簡(jiǎn)單易行,吸引用戶參與到信息資源組織中,另一方面通過為用戶提供優(yōu)先標(biāo)簽,可為資源標(biāo)注質(zhì)量提供一定保障。社會(huì)化標(biāo)注系統(tǒng)在為用戶推薦長度、詞性符合用戶標(biāo)注習(xí)慣的高頻標(biāo)簽的同時(shí),也可基于用戶標(biāo)簽與關(guān)鍵詞具有較高相似性的特點(diǎn),將資源標(biāo)題、圖書簡(jiǎn)介及用戶評(píng)論文本進(jìn)行詞語切分,提取出具有代表性的關(guān)鍵詞作為候選標(biāo)簽推薦給用戶。

(2)重視有價(jià)值評(píng)價(jià)信息的篩選,向用戶提供優(yōu)質(zhì)資源。鑒于評(píng)論文本的情感傾向與對(duì)資源的星級(jí)評(píng)分正相關(guān),篩選平均星級(jí)評(píng)分較高的圖書資源使其在用戶檢索結(jié)果中排名靠前或在資源導(dǎo)航主題標(biāo)簽下位于資源列表靠前的位置。同時(shí),將那些用戶評(píng)論有用性感知值高的評(píng)論置于該圖書資源評(píng)論列表的前列,或者設(shè)置“加精”標(biāo)識(shí)以示醒目。從而,起到引導(dǎo)用戶選用優(yōu)質(zhì)資源和監(jiān)督淘汰劣質(zhì)資源的作用。

(3)提高資源質(zhì)量、建立激勵(lì)機(jī)制,吸引和鼓勵(lì)用戶參與網(wǎng)絡(luò)信息資源的組織與利用。全面、準(zhǔn)確、及時(shí)、高質(zhì)量的信息資源是影響用戶對(duì)社會(huì)化標(biāo)注平臺(tái)粘性的最重要因素,社會(huì)化標(biāo)注系統(tǒng)平臺(tái)應(yīng)加大信息資源開發(fā)與共享力度,以優(yōu)質(zhì)資源吸引用戶;同時(shí),可建立會(huì)員等級(jí)制度,對(duì)積極共享、標(biāo)注及評(píng)論資源、互動(dòng)頻率高等類型的活躍用戶建立等級(jí),不同等級(jí)的用戶賦予不同的權(quán)限或資源獎(jiǎng)勵(lì)。激發(fā)用戶參與社會(huì)化標(biāo)注系統(tǒng)中信息資源組織與利用活動(dòng)的積極性。

本文突破單一類型數(shù)據(jù)的局限,以豆瓣讀書中健康類話題下的圖書標(biāo)簽和評(píng)論數(shù)據(jù)為研究對(duì)象,分析用戶的標(biāo)簽行為和評(píng)論行為特征,并探討各評(píng)論行為之間的關(guān)系,從用戶標(biāo)注行為的視角對(duì)社會(huì)化標(biāo)注系統(tǒng)平臺(tái)提高用戶體驗(yàn)提出相關(guān)建議。本研究不足之處在于,一是僅以健康類目下的圖書數(shù)據(jù)為研究對(duì)象,研究的范圍和納入的數(shù)據(jù)量有限;二是僅從標(biāo)注行為的角度分析了標(biāo)簽和評(píng)論數(shù)據(jù)。事實(shí)上,用戶的部分標(biāo)簽和評(píng)論文本內(nèi)容也包含用戶的行為特征信息。因此后續(xù)的研究應(yīng)考慮擴(kuò)大標(biāo)簽的類別范圍,獲取更大規(guī)模的數(shù)據(jù),并進(jìn)一步考慮將標(biāo)簽和評(píng)論的語義內(nèi)容作為用戶標(biāo)注行為研究的一個(gè)重要維度,提高研究結(jié)果的可信性和普適性的同時(shí),深入挖掘用戶標(biāo)注行為特征。

猜你喜歡
星級(jí)社會(huì)化標(biāo)簽
牽手校外,堅(jiān)持少先隊(duì)社會(huì)化
行政權(quán)社會(huì)化之生成動(dòng)因闡釋
“星級(jí)聯(lián)創(chuàng)”促進(jìn)星光黨建的創(chuàng)新實(shí)踐
大指揮官 2.0T四驅(qū)臻享版
世界汽車(2019年2期)2019-03-01 09:00:08
唐DM 智聯(lián)創(chuàng)享型
世界汽車(2019年2期)2019-03-01 09:00:08
無懼標(biāo)簽 Alfa Romeo Giulia 200HP
車迷(2018年11期)2018-08-30 03:20:32
不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
海峽姐妹(2018年3期)2018-05-09 08:21:02
標(biāo)簽化傷害了誰
高校學(xué)生體育組織社會(huì)化及路徑分析
體育科技(2016年2期)2016-02-28 17:06:14
公共文化服務(wù)亟須推進(jìn)社會(huì)化
柳州市| 乌拉特前旗| 新巴尔虎右旗| 黔东| 玛曲县| 高要市| 定襄县| 临海市| 措美县| 桐庐县| 鲁甸县| 湖南省| 漾濞| 四平市| 栾川县| 山阳县| 仲巴县| 基隆市| 榆社县| 北京市| 磴口县| 长武县| 南昌县| 大石桥市| 贵德县| 金乡县| 余姚市| 蒙山县| 海林市| 开阳县| 望都县| 灌阳县| 宁蒗| 辽中县| 米易县| 石嘴山市| 西充县| 乌兰浩特市| 平度市| 永州市| 庄浪县|