曾子濟 鮑磊 閆瑾
摘要:B站作為當下最受年輕用戶歡迎的智媒平臺,吸引了大量的年輕人。B站評論是用戶對視頻不同態(tài)度的集合,如何廣泛收集意見,觀察用戶情況,并針對實際情況優(yōu)化對青少年的教育方法,早已成為青少年研究領域的熱點。本文進行了基于B站用戶評論的相關研究。通過對評論進行數(shù)據(jù)預處理,并構建神經網絡對評論的情感傾向做出預測,獲取了基于B站指定視頻集合的用戶情感傾向,并探究了B站用戶評論分析在輿情監(jiān)控、教育領域的應用前景。
關鍵詞:智慧媒體;青少年;教育;情感分析
0.引言
智慧媒體[1]是以互聯(lián)網為基礎,智能提供符合用戶需求內容和服務的一種新型傳播媒體。智慧媒體對青少年的影響主要有積極方面和消極方面:
已有研究表明,智慧媒體的使用可以幫助個體形成積極的自我概念、促進人際交流、獲得社會支持。
但是,智慧媒體使用也會帶來一系列負面影響,可能會導致睡眠障礙、外貌焦慮和身材焦慮等后果。
《2020年度全國未成年人互聯(lián)網使用情況的調研報告》[2]顯示,2020年,我國未成年互聯(lián)網普及率為94.9%,比2019年提升1.8個百分點。說明隨著數(shù)字時代發(fā)展,孩子們首次觸網的年齡越來越小,互聯(lián)網對青少年群體的影響也受到社會各方的廣泛關注。
1.研究方法
1.1數(shù)據(jù)源的選取
克勞銳在《2020上半年短視頻內容發(fā)展盤點報告》提到,過去三年,B 站新增用戶平均年齡為21歲,18-35歲用戶占比達到78%。為了更好地研究智媒對當代青少年產生的影響,本文選取B站作為數(shù)據(jù)來源。
1.2數(shù)據(jù)特點
經過研究發(fā)現(xiàn),B站用戶評論具有以下特征:
(1)文字稀疏性。通常B站評論文本由詞語和短句構成,文字稀疏。
(2)實時性。B站信息的傳播具有很強的實時性,用戶評論更是如此。
(3)交互性。用戶的轉發(fā)、評論等行為表明了B站具有很強的互動性。
1.3數(shù)據(jù)獲取方法
本文通過計算機爬蟲對評論進行獲取。該方法優(yōu)勢在于能自動化運行。
1.4模型構建
1.4.1語料預處理
在收集到B站評論文本之后,去除掉其中的噪聲和無用數(shù)據(jù),然后對B站文本進行文本預處理,將評論文本切分成單獨的詞語。
文本預處理之后,計算機無法識別預處理得到的詞語。需要利用數(shù)學模型將這些無規(guī)則的文本轉換成結構化的表示,以便計算機讀取和識別。
1.4.2模型訓練
LSTM[3],是一種特殊的 RNN,能夠學習長期依賴性,在許多問題上表現(xiàn)非常出色。
本文選取LSTM來對評論數(shù)據(jù)進行預測,首先需要對標注好的數(shù)據(jù)訓練詞向量,通過引入模型,指定訓練數(shù)據(jù)、詞向量維度、最小詞頻和迭代輪次進行訓練,得到訓練好的詞向量。然后定義神經網絡,設置網絡超參數(shù)來對網絡進行訓練。
2.結果與討論
2.1數(shù)據(jù)說明
本文對針對2022年4月16日的B站熱門視頻(共十部)進行評論爬取,爬取視頻的相關信息如表2-1所示。
2.2結果
針對爬取到的評論數(shù)據(jù),本文首先對評論進行分詞和向量化,實驗數(shù)據(jù)預處理后進行實驗,實驗結果如表2-2所示。
模型的各項評價指標如表2-3所示。
從結果來看,本文構造的情感詞典和情感值計算方法是理想的。
2.3討論
隨著數(shù)據(jù)時代非結構化數(shù)據(jù)的暴增,從中獲取有價值的信息將成為日后研究的主流,同時也具有極大的應用價值,如:
1)網絡輿情監(jiān)控。通過對用戶評論的情感分析,可以生成網民對同一事件不同的態(tài)度和觀點,獲得對一個事件的整體性觀點和看法。
2)為教育決策提供依據(jù)。大數(shù)據(jù)時代,數(shù)據(jù)已成為決策的支撐力量,教育部門可以針對分析結果制定相應的政策,提高教育水平。
在大數(shù)據(jù)時代,數(shù)據(jù)將會成為創(chuàng)造力和效益的代表,合理利用數(shù)據(jù),未來將會創(chuàng)造無限可能。
3.結論與展望
本文結合機器學習和計算機爬蟲技術對智慧媒體用戶評論進行分析,驗證了模型的有效性。在大數(shù)據(jù)時代,結合大數(shù)據(jù)收集和機器學習算法對海量數(shù)據(jù)進行處理并從中提取價值必將是未來趨勢,這一方向也值得我們投入大量精力進行研究。
參考文獻:
[1]王越,徐天晟.不同智媒平臺的青少年模式差異研究綜述[J].科技視界,2020,(16):260-261.
[2]2020年度全國未成年人互聯(lián)網使用情況的調研報告(解讀稿)[J].中國共青團,2021(15):13-14.
[3]Graves, Alex.(2012). Long Short-Term Memory.10.1007/978-3-642-24797-2_4.
本文章為國家社會科學基金項目《數(shù)據(jù)賦能的智慧媒體對青少年行為模式變化影響的研究》(項目編號:19BXW120)支持的研究所取得的階段性成果。