摘要:從知識交流視角出發(fā),圍繞在線視頻社區(qū)中的結(jié)構(gòu)化評論功能,測量視頻社區(qū)中的知識交流效果,為促進視頻社區(qū)高質(zhì)量知識交流提供有效參考。選取代表性在線視頻社區(qū)嗶哩嗶哩,采集其中的視頻、評論及行為數(shù)據(jù),利用主題聚類、相關(guān)性分析等方法,測量結(jié)構(gòu)化評論與一般評論在知識交流方面的效果,同時分析行為屬性數(shù)據(jù)、視頻文本數(shù)據(jù)及評論文本數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系。相較于一般評論,結(jié)構(gòu)化評論的數(shù)量與視頻播放量關(guān)聯(lián)不大,更多取決于視頻內(nèi)容質(zhì)量和用戶的知識交流意愿。此外,結(jié)構(gòu)化評論在提升知識交流深度方面具有優(yōu)勢,尤其對擁有特定觀眾群體的小眾視頻效果顯著。因此,結(jié)構(gòu)化評論功能具備增強在線視頻社區(qū)知識交流的能力。
關(guān)鍵詞:結(jié)構(gòu)化評論;在線視頻社區(qū);知識交流;評論挖掘;嗶哩嗶哩
中圖分類號:G350.7 DOI:10.3772/j.issn.1673-2286.2024.10.005
引文格式:舒科慧,過其橋,田園,等. 在線視頻社區(qū)知識交流效果比較測度研究:以嗶哩嗶哩網(wǎng)站的結(jié)構(gòu)化評論功能為參照[J]. 數(shù)字圖書館論壇,2024,20(10):42-52.
*本研究得到國家自然科學(xué)基金項目“基于可解釋機器學(xué)習(xí)的科學(xué)知識角色轉(zhuǎn)變預(yù)測研究”(編號:72304108)、中央高?;緲I(yè)務(wù)費項目“基于技術(shù)要素深度語義理解的創(chuàng)新路徑識別及引導(dǎo)策略研究”(編號:CCNU24ZZ140)資助。
作為社交網(wǎng)絡(luò)的重要組成部分,在線視頻社區(qū)中豐富的視頻內(nèi)容和熱烈的討論氛圍極大促進了信息交流,社區(qū)功能的持續(xù)更新為信息交流帶來了更加多元的選擇空間和創(chuàng)作動力。通過社區(qū)成員分享、討論和傳播的具有精煉性、專業(yè)性和便捷性的內(nèi)容是在線視頻社區(qū)的重要知識形態(tài)[1],知識交流是信息交流的一種具備特殊使用和交換價值的形式,其交流效果受到多種因素的影響,這些因素可能存在組合效應(yīng)[2]。因此,在線視頻社區(qū)中知識交流效果影響因素的發(fā)現(xiàn)、測度及評價是社交網(wǎng)絡(luò)研究的重要方向之一。
評論功能是在線社區(qū)保持用戶參與的重要形式,評論內(nèi)容往往被視為知識交流的有效信息來源[3]。一般評論通常只包含自由文本或簡單表情,而嗶哩嗶哩網(wǎng)站的筆記功能(以下稱為結(jié)構(gòu)化評論)允許用戶根據(jù)網(wǎng)站提供的格式進行評論文本的規(guī)范化編輯,編輯內(nèi)容不僅包括文本,還包括圖片和時間戳等,這不僅便于用戶的自我保存和分享,也使得知識的呈現(xiàn)更為生動、內(nèi)容更為嚴(yán)謹(jǐn)。本研究采集并統(tǒng)計嗶哩嗶哩網(wǎng)站中2021年5月—2024年2月30余位主要視頻創(chuàng)作者[4]的視頻評論數(shù)據(jù),發(fā)現(xiàn)自2022年10月起,結(jié)構(gòu)化評論的發(fā)布數(shù)量增長迅速,2023年2月—2024年2月每月數(shù)量維持在5 000~7 000條,每月占比維持在4%~5%,且未來有望繼續(xù)增長。這表明結(jié)構(gòu)化評論提供了一種新的知識組織方式,能夠擴大評論所含的信息量,對用戶積極參與知識交流產(chǎn)生了重要影響。因此,本研究從以下兩個問題切入:①與一般評論形式相比,結(jié)構(gòu)化評論的形式是否更能促進在線視頻社區(qū)的知識交流?②結(jié)構(gòu)化評論和一般評論在知識內(nèi)容之間的關(guān)聯(lián)、主題的分布及演變關(guān)系上是否存在差異?
本研究以在線視頻社區(qū)嗶哩嗶哩的結(jié)構(gòu)化評論功能為參照,對結(jié)構(gòu)化評論和一般評論的知識交流效果進行比較測度,通過分析并解讀實驗結(jié)果,探討知識交流的影響因素,并提出相應(yīng)優(yōu)化策略,為實現(xiàn)在線視頻社區(qū)的高質(zhì)量知識交流提供有效參考。
1 文獻回顧
知識交流是知識主體借助某種符號系統(tǒng),圍繞知識開展的一系列活動[5]。在線社區(qū)中的知識交流則表現(xiàn)為有價值的知識內(nèi)容與知識主體的資源通過一定渠道相互作用并鞏固的過程[6]。知識交流效果是知識交流過程中達到預(yù)期目標(biāo)或產(chǎn)生正面影響的效果[7],目前知識交流效果測度有多種實現(xiàn)方式。如以用戶主觀報告(訪談、問卷)為參考標(biāo)準(zhǔn),引入內(nèi)容質(zhì)量[8]、用戶體驗[9]、用戶交互[10]等客觀要素進行建模,驗證或創(chuàng)建有解釋力的理論和模型;又如基于用戶行為數(shù)據(jù),提取平臺流量、訪問量、用戶數(shù)量、用戶評論等指標(biāo),衡量知識交流效果。前者難以從客觀角度捕捉交流的細(xì)節(jié)[11],后者又會導(dǎo)致結(jié)果的復(fù)雜性與不一致性。
對知識交流效果進行測度需要選擇合適的指標(biāo)與方法[12]。對相關(guān)研究進行梳理后發(fā)現(xiàn),多數(shù)研究集中在內(nèi)容和用戶兩個方面:前者從知識內(nèi)容(主要是文本)挖掘出發(fā),提取文本、形成特征、創(chuàng)建指標(biāo),這些指標(biāo)主要包括(知識的)權(quán)威性、可信度[13-14]、相似性[15]、類別[16]、及時性[17]、交互性及娛樂性[18]等,通過基于語料的質(zhì)性分析[19-20]、主題聚類分析、情感分析[21-23]等多種自然語言處理方法可以有效地對文本內(nèi)容進行挖掘;后者從用戶行為挖掘出發(fā),首先進行屬性建模,而后進行指標(biāo)創(chuàng)建,這些指標(biāo)主要包括交互行為[24]、自我效能[25]、情感信任[26]、歸屬感[27]、報酬激勵[28]、社區(qū)地位[29]、隱私披露[30]和行為關(guān)系[31]等,借助相關(guān)性分析或回歸分析[32-34]等統(tǒng)計工具,可以將指標(biāo)量化,從而測度知識交流效果。
可對以上兩類研究中的指標(biāo)與方法進行選擇性融合,形成多維度指標(biāo)體系,從而豐富知識交流效果測度依據(jù)。相較于其他類型社區(qū),在線視頻社區(qū)鼓勵用戶生成內(nèi)容,且用戶往往對特定內(nèi)容有濃厚興趣,其交流方式的即時性和互動性強。因此,在指標(biāo)選取上,選擇內(nèi)容的相似性、內(nèi)容的交互性以及用戶的交互行為3類指標(biāo)來共同表征知識交流效果。其中,內(nèi)容的相似性與交互性和在線視頻社區(qū)中的評論回復(fù)機制相契合。相似性反映了知識交流的一致性和準(zhǔn)確性,衡量用戶接收和理解知識的程度;交互性反映了知識交流的活躍度和深度,衡量用戶傳播和擴散知識的效果。用戶的交互行為包括評論、點贊、收藏等,這些行為指標(biāo)直接反映了用戶在知識交流過程中的參與度和積極性。在測度方法上,采用融合了統(tǒng)計分析、行為屬性分析、文本相似度分析以及主題聚類分析的綜合分析方法開展實證研究,對在線視頻社區(qū)中的知識交流效果進行比較測度。
2 研究設(shè)計與方法
2.1 研究設(shè)計
基于在線視頻社區(qū)的真實數(shù)據(jù),根據(jù)兩個研究問題設(shè)計實驗,解析實驗結(jié)果,并回答相應(yīng)問題,具體研究框架設(shè)計如圖1所示。
首先從視頻網(wǎng)站中獲取不同分區(qū)的視頻和評論數(shù)據(jù),采用描述性統(tǒng)計分析法,利用視頻發(fā)布總數(shù)、評論總數(shù)和評論回復(fù)總數(shù)等直觀反映不同視頻分區(qū)下知識交流的整體效果。其次,針對問題一,采用行為屬性分析,通過對行為屬性數(shù)據(jù)的比較測度,探究兩種評論形式中用戶行為的差異;針對問題二,通過對內(nèi)容相似性和互動性的分析,挖掘視頻文本數(shù)據(jù)與評論文本數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系。最后,將評論文本數(shù)據(jù)劃分為結(jié)構(gòu)化評論、一般評論、結(jié)構(gòu)化評論回復(fù)和一般評論回復(fù)4類,通過主題聚類橫向和縱向比較各種評論類型,分析兩種評論形式下知識的關(guān)聯(lián)、分布及演變。
2.2 研究方法
2.2.1 行為屬性分析
感知價值理論認(rèn)為,知識主體在知識交流過程中的行為會受到感知價值的正向影響,包括用戶有目的地選擇、分析、評價、接受和利用知識的過程[35]。在線視頻社區(qū)用戶的播放、點贊、投幣、收藏、評論等行為屬性體現(xiàn)了用戶對視頻知識內(nèi)容不同程度的感知[36]。在線視頻社區(qū)情境中,播放量是視頻受歡迎程度的最直觀表現(xiàn);彈幕量代表用戶的知識交流意愿;點贊量代表用戶對視頻內(nèi)容價值的認(rèn)可程度;投幣量代表用戶對視頻內(nèi)容價值的更深層次的認(rèn)可程度,這是由于嗶哩嗶哩中“硬幣”有使用限制,用戶通常只能對少量視頻投幣;收藏量代表用戶未來的知識交流意愿,而非即時交流意愿;評論量包括結(jié)構(gòu)化評論與一般評論的發(fā)布數(shù)量。通過對行為屬性數(shù)據(jù)的量化分析,可以得到屬性的相關(guān)性權(quán)重及排序,便于檢驗其影響因素。
2.2.2 文本相似度分析
主題關(guān)聯(lián)是知識局部動態(tài)和演化趨勢分析的前提,可以揭示主題發(fā)展和主題間交互作用的知識交流特征[37]。由于主題之間存在一定的語義關(guān)聯(lián),能以詞向量的形式量化語義距離,可以通過文本主題相似度分析推導(dǎo)文本之間的關(guān)聯(lián)關(guān)系[38]。
若兩個文本集合存在先后關(guān)系,相似度較高則表明文本內(nèi)容間存在較多重疊,后者是前者知識內(nèi)容的延伸,知識交流呈現(xiàn)出一定的集中性和延續(xù)性的特征;反之則表明文本內(nèi)容間差異較大,后者是前者知識內(nèi)容的擴散,知識交流呈現(xiàn)出一定的分散性和間斷性。
2.2.3 主題聚類分析
主題聚類通過生成概率模型從文本集合中梳理潛藏主題[39]。傳統(tǒng)的機器學(xué)習(xí)方法以LDA[40]及其變體為代表,雖然在主題聚類中已經(jīng)可以提供具有意義的結(jié)果,但模型的表征能力有限,對于文本背后的語義、結(jié)構(gòu)、序列和上下文理解不足,這在短文本處理中表現(xiàn)得更為突出[41],而BERTopic模型能有效彌補這些缺陷[42]。如圖2所示,BERTopic是一種無監(jiān)督模型,對原始文本進行預(yù)處理后,通過BERT預(yù)訓(xùn)練模型實現(xiàn)文本嵌入生成,經(jīng)過UMAP算法降維[43]和HDBSCAN算法聚類[44]得到數(shù)個主題簇,并使用C-TF-IDF算法評估各主題詞重要程度,最終生成相應(yīng)的主題關(guān)鍵詞集合。
3 實驗過程與結(jié)果分析
3.1 數(shù)據(jù)獲取和預(yù)處理
在線視頻社區(qū)嗶哩嗶哩月均活躍用戶數(shù)達2.72億人次,形成了圍繞用戶、創(chuàng)作者和內(nèi)容的高質(zhì)量社區(qū)生態(tài)系統(tǒng)[45],因此以該網(wǎng)站為研究對象。如圖3所示,首先,確定其知識類視頻在網(wǎng)站中的具體分區(qū)類別為科技、美食、汽車、生活、游戲、知識、資訊、動物圈和其他[1];隨后,為保證視頻和評論發(fā)布的數(shù)量規(guī)模,并涵蓋視頻熱度較高的時間段,按照分區(qū)設(shè)定篩選條件,爬取2024年1月30日發(fā)布的視頻在一周內(nèi)的視頻數(shù)據(jù),并進行清洗、去重和分詞,將其分為行為屬性數(shù)據(jù)、視頻文本數(shù)據(jù)和評論文本數(shù)據(jù);最后,形成2 045組視頻記錄。
3.2 描述性統(tǒng)計分析
通過描述性統(tǒng)計方法分析結(jié)構(gòu)化評論的整體規(guī)律。首先,以9個小類分區(qū)視頻和評論的平均數(shù)量為劃分依據(jù),對9個小類分區(qū)進行分類:若視頻發(fā)布總數(shù)大于215個或評論總數(shù)大于9 870條,則將該小類劃分為大眾視頻(游戲類除外,雖然評論總數(shù)達到要求,但視頻發(fā)布總數(shù)過低);反之則劃分到小眾視頻中,最終形成2個大類分區(qū)和9個小類分區(qū),進而比較不同視頻分區(qū)的知識交流情況。如表1所示,大眾視頻(美食、知識、動物圈、資訊和生活類視頻)占視頻發(fā)布總數(shù)的88.61%,其評論占評論總數(shù)的73.04%,其評論回復(fù)占評論回復(fù)總數(shù)的74.62%,這說明大眾視頻對用戶具有較高的吸引力,反映了用戶普遍的知識交流需求;小眾視頻(汽車、科技和游戲類視頻)共占視頻發(fā)布總數(shù)的6.41%,其評論占評論總數(shù)的22.47%,其評論回復(fù)占評論回復(fù)總數(shù)的22.65%,說明小眾視頻的用戶互動性強、更具參與度,小眾視頻反映了特定用戶的知識交流情況。從評論數(shù)與評論回復(fù)數(shù)占比的差值來看,評論回復(fù)數(shù)總體上多于評論本身,但在不同的視頻分區(qū)中存在差異,如美食、動物圈、生活、科技和游戲分區(qū)的評論數(shù)多于評論回復(fù)數(shù)。
表2描述了結(jié)構(gòu)化評論在總評論中的占比,以及結(jié)構(gòu)化評論回復(fù)在總評論回復(fù)中的占比情況??梢钥闯?,目前結(jié)構(gòu)化評論在各視頻分區(qū)中的占比較少,但針對結(jié)構(gòu)化評論的回復(fù)則較多。從結(jié)構(gòu)化評論與其回復(fù)占比的差值來看,除動物圈(0.25%)和資訊(0.20%)兩個分區(qū)外,結(jié)構(gòu)化評論占比均小于其回復(fù)的占比,說明結(jié)構(gòu)化評論一定程度上激發(fā)了用戶的評論意愿,具體體現(xiàn)在評論回復(fù)的參與度上。在有效的知識交流過程中,知識主體較高的參與度有助于形成活躍的互動氛圍,形成良性的知識循環(huán),從而提升知識交流的深度與廣度。
3.3 行為屬性分析
為測度用戶的交互行為指標(biāo),對結(jié)構(gòu)化評論與一般評論的數(shù)量與行為屬性數(shù)據(jù)進行斯皮爾曼相關(guān)性分析。在視頻樣本中篩選出具有結(jié)構(gòu)化評論的468個視頻,依次統(tǒng)計各視頻的播放量、彈幕量、點贊量、投幣量、收藏量、結(jié)構(gòu)化評論數(shù)量和一般評論數(shù)量7種屬性,斯皮爾曼相關(guān)性計算結(jié)果如表3所示。
整體上看,結(jié)構(gòu)化評論數(shù)量與行為屬性數(shù)據(jù)的相關(guān)性排序為投幣量(0.652)、彈幕量(0.635)、點贊量(0.611)、播放量(0.603)和收藏量(0.582);一般評論數(shù)量與行為屬性數(shù)據(jù)的相關(guān)性排序為播放量(0.843)、彈幕量(0.828)、點贊量(0.822)、投幣量(0.794)和收藏量(0.750),均在0.01級別(雙尾)相關(guān)性顯著。通過比較相關(guān)系數(shù),可以看出一般評論數(shù)量與行為屬性數(shù)據(jù)的相關(guān)性總體上大于結(jié)構(gòu)化評論,說明其對用戶行為的影響強于結(jié)構(gòu)化評論,原因可能是結(jié)構(gòu)化評論數(shù)量和占比較低。
具體到與各個行為屬性的相關(guān)性,兩類評論與不同行為屬性的關(guān)聯(lián)揭示了知識交流效果在不同層面的特點。投幣量(0.652)與結(jié)構(gòu)化評論數(shù)量最為相關(guān),說明內(nèi)容價值受到用戶高度認(rèn)可的視頻普遍有更高的結(jié)構(gòu)化評論數(shù)量,反映出用戶在認(rèn)可知識內(nèi)容價值時,更傾向于選擇便于表達明確主題和觀點的結(jié)構(gòu)化評論,進而增強信息價值,提高知識交流的專業(yè)性和深度。播放量(0.843)則與一般評論數(shù)量最為相關(guān),說明更受歡迎的視頻普遍有更多的一般評論,而非結(jié)構(gòu)化評論,這表明一般評論相對而言更隨意與普遍,用戶傾向于選擇便于情感表達與簡單互動的功能。
3.4 文本相似度分析
通過文本相似度分析探究視頻內(nèi)容與用戶評論的關(guān)聯(lián)。首先將篩選數(shù)據(jù)集中的評論文本數(shù)據(jù)分為結(jié)構(gòu)化評論、一般評論、結(jié)構(gòu)化評論回復(fù)和一般評論回復(fù)4類,通過BERTopic模型生成文本向量表示后,利用式(1)與式(2)按分區(qū)依次計算視頻文本數(shù)據(jù)與4類評論文本的相似度,結(jié)果如圖4所示。
科技、汽車和游戲區(qū)的評論文本與視頻文本數(shù)據(jù)的4類文本相似度平均值排名前3,分別是0.410、0.396和0.390??萍?、汽車和游戲均屬于小眾視頻,這說明隨著結(jié)構(gòu)化評論功能的加入,小眾視頻的評論內(nèi)容與視頻內(nèi)容更為貼近,可以看作視頻知識內(nèi)容的延伸。這種高度相似性側(cè)面表現(xiàn)出該類分區(qū)中的知識交流呈現(xiàn)集中性和延續(xù)性的特點,即用戶在小眾視頻中的交流更聚焦于原始知識內(nèi)容本身。
除游戲區(qū)外,結(jié)構(gòu)化評論文本與視頻文本數(shù)據(jù)的相似度高于一般評論,且游戲區(qū)中兩者數(shù)值十分接近。這說明結(jié)構(gòu)化評論對視頻知識交流的促進作用強于一般評論,通過提供更具針對性和深度的內(nèi)容,在一定程度上彌補了一般評論分散性和間斷性的不足。而結(jié)構(gòu)化評論回復(fù)和一般評論回復(fù)與視頻文本數(shù)據(jù)的相似度與視頻分區(qū)更相關(guān),這說明結(jié)構(gòu)化評論對視頻知識交流的影響主要體現(xiàn)在評論本身,而非評論回復(fù)。這可能是由于結(jié)構(gòu)化評論回復(fù)在形式上受到限制,與一般評論類似,只能使用自由文本和簡單表情,難以繼承結(jié)構(gòu)化評論的優(yōu)勢。
科技、游戲和汽車區(qū)中,結(jié)構(gòu)化評論回復(fù)相似度與結(jié)構(gòu)化評論相似度差值的絕對值排名前3,分別是0.063、0.053、0.048,說明評論文本呈主題集中或發(fā)散趨勢的可能性同時存在,且在小眾視頻中該趨勢更為明顯。而除資訊區(qū)外,一般評論回復(fù)與視頻文本數(shù)據(jù)的相似度均高于一般評論,說明雖然一般評論與視頻內(nèi)容的關(guān)聯(lián)性較弱,但其評論回復(fù)與視頻內(nèi)容的關(guān)聯(lián)性增強,一般評論回復(fù)有利于縮小一般評論在知識表征方面與結(jié)構(gòu)化評論的差距。
3.5 主題聚類分析
通過BERTopic進行主題聚類,從評論文本的主題分布及演變的角度探究其對知識交流的影響。將評論文本劃分為結(jié)構(gòu)化評論文本、一般評論文本、結(jié)構(gòu)化評論回復(fù)文本和一般評論回復(fù)文本4類。考慮到數(shù)據(jù)集規(guī)模不同,選取4類評論文本中頻次排名前16的主題,并按照分區(qū)主題總占比降序排列,從而直觀展現(xiàn)各視頻分區(qū)的主題分布情況,以及各類評論文本主題的分區(qū)占比排名,如表4~表5所示。
3.5.1 結(jié)構(gòu)化評論及其回復(fù)的主題聚類分析
結(jié)構(gòu)化評論的主題涵蓋了全部的9個視頻分區(qū),其回復(fù)的主題也涵蓋了8個分區(qū),說明結(jié)構(gòu)化評論的高頻主題的分區(qū)覆蓋率高。相較于結(jié)構(gòu)化評論,其評論回復(fù)在知識和游戲兩個視頻分區(qū)的占比相對增加,而在生活分區(qū)的占比相對減少,這一變化可能反映了用戶在參與結(jié)構(gòu)化評論回復(fù)時,更傾向于深入探討特定領(lǐng)域的專業(yè)知識。從主題內(nèi)容的深度和具體化程度來看,知識分區(qū)主題從較為寬泛的事件解析、文學(xué)作品和視頻剪輯深化為自我價值、股市行情和交友關(guān)系;游戲分區(qū)主題從較為寬泛的游戲攻略具化為角色強度、版本環(huán)境和角色培養(yǎng)。這種主題具體化的知識交流有助于用戶對細(xì)分領(lǐng)域的選擇。上述數(shù)據(jù)表明,結(jié)構(gòu)化評論雖然在一定程度上可以維持知識交流規(guī)模,但側(cè)重于促進小眾視頻主題內(nèi)容的具體化和專業(yè)化,而非大眾視頻主題,這種趨勢可能是由結(jié)構(gòu)化評論鼓勵針對性和深入知識交流的效果決定的。
3.5.2 一般評論及其回復(fù)的主題聚類分析
一般評論的主題涵蓋了8個視頻分區(qū),其回復(fù)的主題涵蓋了7個分區(qū),說明一般評論的高頻主題的分區(qū)覆蓋率相對結(jié)構(gòu)化評論較低。相較于一般評論,其評論回復(fù)在美食和生活兩個視頻分區(qū)中的占比有所提升,而科技分區(qū)的占比排序有所下降。在一般評論的知識交流過程中,用戶更傾向于參與日常生活和美食等大眾話題的討論,而不是科技等可能需要特定知識的領(lǐng)域。從主題內(nèi)容的深度和具體化程度來看,美食分區(qū)主題從壽司起源變?yōu)槊朗沉侠砗臀魇娇觳?;生活分區(qū)主題從住房問題、家用電器和旅行攻略變?yōu)閷W(xué)習(xí)生活、旅行攻略和春節(jié)生活。盡管美食和生活主題占比有所提高,但主題內(nèi)容的寬泛性沒有明顯變化。上述數(shù)據(jù)表明,一般評論雖然可以保持或擴大知識交流規(guī)模,但更傾向于圍繞大眾視頻主題展開,而非小眾視頻主題,這可能是因為一般評論通常更加隨意,它們更多地反映用戶的即時感受和淺層次的意見,而非深入的專業(yè)知識。
3.5.3 結(jié)構(gòu)化評論與一般評論的比較分析
通過計算兩兩主題間的余弦相似度,得到4個子數(shù)據(jù)集主題的共60個相似度矩陣,按主題數(shù)升序依次計算其平均相似度,可以得到評論文本內(nèi)容的集中或分散趨勢,如圖5所示。
結(jié)構(gòu)化評論的主題相似度遠(yuǎn)低于一般評論,且變動更明顯。但隨著主題數(shù)增加,二者的相似度將趨于一致。這說明結(jié)構(gòu)化評論便于激發(fā)知識交流中的思考與創(chuàng)新,使得知識交流的發(fā)散效果更明顯,容易產(chǎn)生新的知識內(nèi)容;而一般評論中知識交流的集中程度更高,需要通過更多的評論數(shù)達到類似結(jié)構(gòu)化評論的效果。對于評論回復(fù),兩者主題相似度均呈現(xiàn)出先增長后平穩(wěn)的趨勢,但結(jié)構(gòu)化評論回復(fù)的變動相對明顯,且隨著主題數(shù)增加,其相似度低于一般評論回復(fù)。這說明結(jié)構(gòu)化評論對知識交流效果的影響主要體現(xiàn)在評論本身,而非評論回復(fù),結(jié)構(gòu)化評論回復(fù)可能因為形式上的限制未能繼承原評論的優(yōu)勢。
結(jié)構(gòu)化評論回復(fù)與評論本身的主題相似度間有一定差值。這說明隨著評論回復(fù)增加,結(jié)構(gòu)化評論可以促進知識內(nèi)容的發(fā)散,豐富知識交流的主題,這是因為回復(fù)中的新觀點和討論進一步拓展了原評論的討論范圍。而一般評論回復(fù)與評論本身的主題相似度差值更大,說明相較于結(jié)構(gòu)化評論,一般評論本身對知識交流的影響較小,但可以通過評論回復(fù)的數(shù)量優(yōu)勢縮小差距,進而覆蓋更多的話題和角度,豐富知識交流的主題。
4 結(jié)語
本研究通過統(tǒng)計分析、行為屬性分析、文本相似度分析以及主題聚類分析的綜合分析方法,對在線視頻社區(qū)結(jié)構(gòu)化評論和一般評論的知識交流效果進行測度,揭示了其中的規(guī)律。研究認(rèn)為,結(jié)構(gòu)化評論對于在線視頻社區(qū)的知識交流發(fā)揮了重要作用。從在線視頻社區(qū)中知識交流主體的角度出發(fā),為充分發(fā)揮結(jié)構(gòu)化評論的優(yōu)勢,本研究提出以下建議:首先,在線視頻社區(qū)須完善結(jié)構(gòu)化評論功能,優(yōu)化結(jié)構(gòu)化評論在評論區(qū)中的排序機制,進而提升用戶的感知價值,促進用戶發(fā)布結(jié)構(gòu)化評論,擴大其對知識交流的影響力;其次,視頻創(chuàng)作者須注重粉絲經(jīng)營,積極打造專業(yè)形象,重視對知識質(zhì)量的打磨,獲得用戶對視頻內(nèi)容價值的高度認(rèn)可;最后,用戶須重視結(jié)構(gòu)化評論發(fā)布在知識交流中的積極作用,合理利用文本編輯功能和圖片插入等特色功能,豐富評論內(nèi)容表現(xiàn)形式。
本研究仍存在一些局限和不足之處:①主要以行為屬性數(shù)據(jù)、視頻文本數(shù)據(jù)和評論文本數(shù)據(jù)3類客觀數(shù)據(jù)為數(shù)據(jù)來源,并未分析視頻本身和結(jié)構(gòu)化評論的圖片部分,未來可結(jié)合兩者進行深入分析;②評論挖掘方法以主題聚類為主,對于文本風(fēng)格、情感表現(xiàn)等其他特征的分析相對欠缺,未來可以進一步提升內(nèi)容分析深度,進而挖掘更深層次的知識交流規(guī)律。
參考文獻
[1] 王春剛,張許歌,王儉. 在線健康社區(qū)與短視頻融合的微知識共享模式研究[J]. 情報科學(xué),2023,41(6):79-83,93.
[2] 張瑞,胡麗娜,黃煒. 虛擬學(xué)術(shù)社區(qū)知識交流多智能體仿真演化研究[J]. 現(xiàn)代情報,2023,43(10):16-26.
[3] KIM A J,JOHNSON K K P. Power of consumers using social media:examining the influences of brand-related user- generated content on Facebook[J]. Computers in Human Behavior,2016,58:98-108.
[4] BILIBILI POWER UP 2023 百大UP主盛典[EB/OL]. [2024-06-16]. https://www.bilibili.com/BPU2023#/stage2.
[5] 宓浩,劉迅,黃純元. 圖書館學(xué)原理[M]. 上海:華東師范大學(xué)出版社,1988.
[6] SHAN W,QIAO T,ZHANG M L. Getting more resources for better performance:the effect of user-owned resources on the value of user-generated content[J]. Technological Forecasting and Social Change,2020,161:120318.
[7] 楊瑞仙,黃書瑞,于政杰. 基于三階段DEA模型的學(xué)術(shù)虛擬社區(qū)知識交流效率評價研究[J]. 情報學(xué)報,2021,40(3):256-266.
[8] JIN X L,YIN M J,ZHOU Z Y,et al. The differential effects of trusting beliefs on social media users’ willingness to adopt and share health knowledge[J]. Information Processing Management,2021,58(1):102413.
[9] ULLAH A,ZHANG Q Y,AHMED M. The influence of intellectual property rights protection on contribution efforts of participants in online crowdsourcing contests[J]. Computers in Human Behavior,2021,123:106869.
[10] GUAN T,WANG L,JIN J H,et al. Knowledge contribution behavior in online Q A communities:an empirical investigation[J]. Computers in Human Behavior,2018,81:137-147.
[11] 程豪杰,張寧,袁勤儉. 學(xué)術(shù)虛擬社區(qū)知識交流的研究進展[J].現(xiàn)代情報,2018,38(5):158-163.
[12] 王瑞,李思豫,袁勤儉. 學(xué)術(shù)社交網(wǎng)絡(luò)用戶特征對知識交流效果的影響:以南京大學(xué)ResearchGate用戶為例[J]. 圖書情報知識,2020,37(4):97-105,132.
[13] JIN J H,YAN X B,LI Y J,et al. How users adopt healthcare information:an empirical study of an online Q A community[J]. International Journal of Medical Informatics,2016,86:91-103.
[14] 李月琳,王姍姍,阮妹. 跨源健康信息搜尋的動機、信息源選擇及行為路徑[J]. 情報學(xué)報,2021,40(1):77-87.
[15] XIONG J,F(xiàn)ENG X D,TANG Z W. Understanding user-to-user interaction on government microblogs:an exponential random graph model with the homophily and emotional effect[J]. Information Processing Management,2020,57(4):102229.
[16] 袁毅,楊莉. 問答社區(qū)用戶生成資源行為及影響因素分析:以百度知道為例[J]. 圖書情報工作,2017,61(22):20-26.
[17] 袁勤儉,毛春蕾. 學(xué)術(shù)虛擬社區(qū)特征對知識交流效果影響的研究[J]. 現(xiàn)代情報,2021,41(6):3-12.
[18] 鄧勝利,管弦. 基于問答平臺的用戶健康信息獲取意愿影響因素研究[J]. 情報科學(xué),2016,34(11):53-59.
[19] 王若佳,張璐,王繼民. 基于扎根理論的在線問診用戶滿意度影響因素研究[J]. 情報理論與實踐,2019,42(10):117-123.
[20] 周陽,譚春輝,朱宸良,等. 基于扎根理論的虛擬學(xué)術(shù)社區(qū)用戶參與行為研究:以小木蟲為例[J]. 情報科學(xué),2022,40(1):176-183.
[21] XU X,WANG X Q,LI Y B,et al. Business intelligence in online customer textual reviews:understanding consumer perceptions and influential factors[J]. International Journal of Information Management,2017,37(6):673-683.
[22] 熊回香,向瀛泓,孟璇,等. 在線健康社區(qū)中基于用戶評論挖掘的醫(yī)生服務(wù)評價研究[J/OL]. 情報科學(xué):1-19[2024-06-16]. https://kns.cnki.net/kcms/detail/22.1264. G2.20240126.1758.004.html.
[23] 葉艷,吳鵬,周知,等. 基于LDA-BiLSTM模型的在線醫(yī)療服務(wù)質(zhì)量識別研究[J]. 情報理論與實踐,2022,45(8):178-183,168.
[24] RYAN R M,DECI E L. Brick by brick:the origins,development,and future of self-determination theory[J]. Advances in Motivation Science,2019,6:111-156.
[25] ZHANG Y,ZHANG M L,LUO N,et al. Understanding the formation mechanism of high-quality knowledge in social question and answer communities:a knowledge cocreation perspective[J]. International Journal of Information Management,2019,48:72-84.
[26] 王子喜,杜榮. 人際信任和自我效能對虛擬社區(qū)知識共享和參與水平的影響研究[J]. 情報理論與實踐,2011,34(10):71-74,92.
[27] SAURA J R,PALACIOS-MARQUéS D,RIBEIROSORIANO D. Exploring the boundaries of open innovation:evidence from social media mining[J]. Technovation,2023,119:102447.
[28] ZHAO C Y,ZHU Q H. Effects of extrinsic and intrinsic motivation on participation in crowdsourcing contest:a perspective of self-determination theory[J]. Online Information Review,2014,38(7):896-917.
[29] DONG L F,HUANG L Q,HOU J H,et al. Continuous content contribution in virtual community:the role of status-standing on motivational mechanisms[J]. Decision Support Systems,2020,132:113283.
[30] PU J C,CHEN Y,QIU L F,et al. Does identity disclosure help or hurt user content generation?social presence,inhibition,and displacement effects[J]. Information Systems Research, 2020,31(2):297-322.
[31] 陳小卉,胡平,馬宇彤. 問答社區(qū)知識傳播者網(wǎng)絡(luò)聲望、行動相似度與知識傳播效果[J]. 管理學(xué)報,2021,18(5):741-750.
[32] YANG M C,REN Y Q,ADOMAVICIUS G. Understanding user-generated content and customer engagement on Facebook business pages[J]. Information Systems Research,2019,30(3):839-855.
[33] 韓璽,蔣佩瑤,韓文婷,等. 醫(yī)生在線評價信息特征的影響因素研究:社會資本和社會交換理論的視角[J]. 信息資源管理學(xué)報,2023,13(1):78-90.
[34] 沓鈺淇,傅虹橋. 網(wǎng)絡(luò)口碑對患者就醫(yī)選擇的影響:基于在線醫(yī)生評論的實證研究[J]. 管理評論,2021,33(11):185-198.
[35] 宋雪雁,王萍. 用戶信息行為研究述評[J]. 情報科學(xué),2010,28(4):625-629,636.
[36] YE L L. User perceived value and continued participation in barrage video[C]//Proceedings of the International Conference on Education,Economics and Information Management(ICEEIM 2019). Paris:Atlantis Press,2020:150-153.
[37] 黃菡,王曉光,何靜,等. 基于矩陣相似度的主題演化路徑判別研究[J]. 情報學(xué)報,2023,42(11):1265-1275.
[38] 張瑞,何祿鑫,楊艷妮. 考慮語義距離的領(lǐng)域科學(xué)知識主題關(guān)聯(lián)與演化研究[J]. 情報雜志,2022,41(10):121-129.
[39] 黃佳佳,李鵬偉,彭敏,等. 基于深度學(xué)習(xí)的主題模型研究[J].計算機學(xué)報,2020,43(5):827-855.
[40] BLEI D M,NG A Y,JORDAN M I. Latent Dirichlet allocation[J]. Journal of Machine Learning Research,2003,3(4/5):993-1022.
[41] EGGER R,YU J. A topic modeling comparison between LDA,NMF,Top2Vec,and BERTopic to demystify twitter posts[J]. Frontiers in Sociology,2022,7:886498.
[42] GROOTENDORST M. BERTopic:neural topic modeling with a class-based TF-IDF procedure[EB/OL]. [2024-06-16]. https:// arxiv.org/abs/2203.05794.
[43] MCINNES L,HEALY J,MELVILLE J. UMAP:uniform manifold approximation and projection for dimension reduction[EB/OL]. [2024-06-16]. https://arxiv.org/ abs/1802.03426.
[44] MCINNES L,HEALY J,ASTELS S. HDBSCAN:hierarchical density based clustering[J]. The Journal of Open Source Software,2017,2(11):205.
[45] 關(guān)于我們-嗶哩嗶哩[EB/OL]. [2024-06-16]. https://www. bilibili.com/blackboard/aboutUs. html.
作者簡介
舒科慧,男,碩士研究生,研究方向:信息組織與信息檢索,E-mail:rhodonite_shu@mails.ccnu.edu.cn。
過其橋,男,碩士研究生,研究方向:信息組織與信息檢索。
田園,女,碩士研究生,研究方向:信息組織與信息檢索。
程秀峰,男,博士,教授,碩士生導(dǎo)師,研究方向:信息組織與信息檢索。
楊金慶,男,博士,特任副教授,研究方向:信息組織與信息檢索。
Comparative Measurement of Knowledge Exchange Effects in Online Video Communities: Referring to the Structured Comment Function of Bilibili
SHU KeHui GUO QiQiao TIAN Yuan CHENG XiuFeng YANG JinQing
(School of Information Management, Central China Normal University, Wuhan 430079, P. R. China)
Abstract: From the perspective of knowledge exchange, this study focuses on the structured comment function within online video communities to assess the effectiveness of knowledge exchange, aiming to provide valuable insights for promoting high-quality knowledge exchange in these communities. By collecting data on videos, comments, and user behavior from a representative online video community, Bilibili, and employing methods such as topic clustering and correlation analysis, the research evaluates the impact of structured comments versus general comments in the knowledge exchange process. Furthermore, the study examines the interconnections between behavioral attribute data, video content data, and comment text data. The findings suggest that the quantity of structured comments is not strongly correlated with video playback numbers but is more influenced by the quality of video content and users’ willingness to engage in knowledge exchange. Additionally, structured comments show a greater ability to enhance the depth of knowledge exchange, particularly for niche videos with a dedicated audience. Therefore, the structured comment function is demonstrated to have the potential to reinforce knowledge exchange in online video communities.
Keywords: Structured Comment; Online Video Community; Knowledge Exchange; Comment Mining; Bilibili
(責(zé)任編輯:管清瀠)