国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于LSTM的B站用戶情感分析

2022-07-01 23:29:16曾子濟鮑磊閆瑾
江蘇廣播電視報·新教育 2022年14期
關鍵詞:情感分析青少年教育

曾子濟 鮑磊 閆瑾

摘要:B站作為當下最受年輕用戶歡迎的智媒平臺,吸引了大量的年輕人。B站評論是用戶對視頻不同態(tài)度的集合,如何廣泛收集意見,觀察用戶情況,并針對實際情況優(yōu)化對青少年的教育方法,早已成為青少年研究領域的熱點。本文進行了基于B站用戶評論的相關研究。通過對評論進行數(shù)據(jù)預處理,并構建神經網絡對評論的情感傾向做出預測,獲取了基于B站指定視頻集合的用戶情感傾向,并探究了B站用戶評論分析在輿情監(jiān)控、教育領域的應用前景。

關鍵詞:智慧媒體;青少年;教育;情感分析

0.引言

智慧媒體[1]是以互聯(lián)網為基礎,智能提供符合用戶需求內容和服務的一種新型傳播媒體。智慧媒體對青少年的影響主要有積極方面和消極方面:

已有研究表明,智慧媒體的使用可以幫助個體形成積極的自我概念、促進人際交流、獲得社會支持。

但是,智慧媒體使用也會帶來一系列負面影響,可能會導致睡眠障礙、外貌焦慮和身材焦慮等后果。

《2020年度全國未成年人互聯(lián)網使用情況的調研報告》[2]顯示,2020年,我國未成年互聯(lián)網普及率為94.9%,比2019年提升1.8個百分點。說明隨著數(shù)字時代發(fā)展,孩子們首次觸網的年齡越來越小,互聯(lián)網對青少年群體的影響也受到社會各方的廣泛關注。

1.研究方法

1.1數(shù)據(jù)源的選取

克勞銳在《2020上半年短視頻內容發(fā)展盤點報告》提到,過去三年,B 站新增用戶平均年齡為21歲,18-35歲用戶占比達到78%。為了更好地研究智媒對當代青少年產生的影響,本文選取B站作為數(shù)據(jù)來源。

1.2數(shù)據(jù)特點

經過研究發(fā)現(xiàn),B站用戶評論具有以下特征:

(1)文字稀疏性。通常B站評論文本由詞語和短句構成,文字稀疏。

(2)實時性。B站信息的傳播具有很強的實時性,用戶評論更是如此。

(3)交互性。用戶的轉發(fā)、評論等行為表明了B站具有很強的互動性。

1.3數(shù)據(jù)獲取方法

本文通過計算機爬蟲對評論進行獲取。該方法優(yōu)勢在于能自動化運行。

1.4模型構建

1.4.1語料預處理

在收集到B站評論文本之后,去除掉其中的噪聲和無用數(shù)據(jù),然后對B站文本進行文本預處理,將評論文本切分成單獨的詞語。

文本預處理之后,計算機無法識別預處理得到的詞語。需要利用數(shù)學模型將這些無規(guī)則的文本轉換成結構化的表示,以便計算機讀取和識別。

1.4.2模型訓練

LSTM[3],是一種特殊的 RNN,能夠學習長期依賴性,在許多問題上表現(xiàn)非常出色。

本文選取LSTM來對評論數(shù)據(jù)進行預測,首先需要對標注好的數(shù)據(jù)訓練詞向量,通過引入模型,指定訓練數(shù)據(jù)、詞向量維度、最小詞頻和迭代輪次進行訓練,得到訓練好的詞向量。然后定義神經網絡,設置網絡超參數(shù)來對網絡進行訓練。

2.結果與討論

2.1數(shù)據(jù)說明

本文對針對2022年4月16日的B站熱門視頻(共十部)進行評論爬取,爬取視頻的相關信息如表2-1所示。

2.2結果

針對爬取到的評論數(shù)據(jù),本文首先對評論進行分詞和向量化,實驗數(shù)據(jù)預處理后進行實驗,實驗結果如表2-2所示。

模型的各項評價指標如表2-3所示。

從結果來看,本文構造的情感詞典和情感值計算方法是理想的。

2.3討論

隨著數(shù)據(jù)時代非結構化數(shù)據(jù)的暴增,從中獲取有價值的信息將成為日后研究的主流,同時也具有極大的應用價值,如:

1)網絡輿情監(jiān)控。通過對用戶評論的情感分析,可以生成網民對同一事件不同的態(tài)度和觀點,獲得對一個事件的整體性觀點和看法。

2)為教育決策提供依據(jù)。大數(shù)據(jù)時代,數(shù)據(jù)已成為決策的支撐力量,教育部門可以針對分析結果制定相應的政策,提高教育水平。

在大數(shù)據(jù)時代,數(shù)據(jù)將會成為創(chuàng)造力和效益的代表,合理利用數(shù)據(jù),未來將會創(chuàng)造無限可能。

3.結論與展望

本文結合機器學習和計算機爬蟲技術對智慧媒體用戶評論進行分析,驗證了模型的有效性。在大數(shù)據(jù)時代,結合大數(shù)據(jù)收集和機器學習算法對海量數(shù)據(jù)進行處理并從中提取價值必將是未來趨勢,這一方向也值得我們投入大量精力進行研究。

參考文獻:

[1]王越,徐天晟.不同智媒平臺的青少年模式差異研究綜述[J].科技視界,2020,(16):260-261.

[2]2020年度全國未成年人互聯(lián)網使用情況的調研報告(解讀稿)[J].中國共青團,2021(15):13-14.

[3]Graves, Alex.(2012). Long Short-Term Memory.10.1007/978-3-642-24797-2_4.

本文章為國家社會科學基金項目《數(shù)據(jù)賦能的智慧媒體對青少年行為模式變化影響的研究》(項目編號:19BXW120)支持的研究所取得的階段性成果。

猜你喜歡
情感分析青少年教育
國外教育奇趣
華人時刊(2022年13期)2022-10-27 08:55:52
題解教育『三問』
當代陜西(2022年4期)2022-04-19 12:08:52
青少年發(fā)明家
教育有道——關于閩派教育的一點思考
辦好人民滿意的首都教育
基于SVM的產品評論情感分析系統(tǒng)的設計與實現(xiàn)
基于詞典與機器學習的中文微博情感分析
在線評論情感屬性的動態(tài)變化
預測(2016年5期)2016-12-26 17:16:57
文本觀點挖掘和情感分析的研究
激勵青少年放飛心中夢
中國火炬(2014年4期)2014-07-24 14:22:19
称多县| 宁城县| 安岳县| 门头沟区| 东辽县| 景宁| 松滋市| 通州区| 宜黄县| 乐都县| 松溪县| 资兴市| 七台河市| 岳池县| 普兰店市| 剑阁县| 昆明市| 仪陇县| 应城市| 永春县| 宜丰县| 慈利县| 内乡县| 军事| 汕头市| 河东区| 海阳市| 金昌市| 松溪县| 鹤庆县| 民县| 板桥市| 克什克腾旗| 英吉沙县| 宁安市| 岳阳市| 景谷| 阿勒泰市| 民乐县| 白银市| 鲁甸县|