国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于YouTube數(shù)據(jù)的美國主流媒體涉華報道研究

2023-12-22 13:52:24沙吉亮
東北亞外語論壇 2023年8期
關(guān)鍵詞:分析方法文本情感

沙吉亮

大連外國語大學(xué) 大 連 116041 中 國

一、引言

當(dāng)今世界正經(jīng)歷“百年未有之大變局”,中國的經(jīng)濟(jì)實(shí)力、政治實(shí)力不斷上升。以往以西方世界為主導(dǎo)的全球治理格局式微,全球技術(shù)權(quán)力格局和信息傳播秩序都正在產(chǎn)生結(jié)構(gòu)性的變化。而以美國為首的部分西方國家,憑借處于全球傳播秩序高點(diǎn)的優(yōu)勢,對中國的崛起進(jìn)行一定的打壓,宣揚(yáng)“中國威脅論”“中國傲慢論”等論調(diào),一些西方媒體更是成為政治統(tǒng)治的工具,成為迎合某些政治集團(tuán)的工具,發(fā)表一系列不符的丑化中國的報道,美國前總統(tǒng)特朗普曾多次指責(zé)CNN發(fā)布新聞為“fake news”(虛假新聞)。普通國外觀眾由于缺少對中國的現(xiàn)實(shí)認(rèn)知條件,往往易受到不實(shí)信息的影響,進(jìn)而影響他們對中國的認(rèn)識。

新聞媒體已經(jīng)成為新聞報道的媒介化傳播是輸出意識形態(tài)的有力載體(曾潤喜楊喜喜,2017:99)和塑造形象的重要手段(趙永剛,2017;錢毓芳 董穎穎,2020)。YouTube視頻網(wǎng)站作為全球最大的網(wǎng)絡(luò)視頻分享網(wǎng)站,每天的訪問量超過10億人次(騰訊科技網(wǎng),2009),美國的主流媒體也陸續(xù)在YouTube平臺開通了媒體頻道。而以往針對Youtube數(shù)據(jù)的研究,多是從“走出去”的角度出發(fā),如李勇等(2021)采用雙路徑模型和媒介傳播效果框架學(xué)來分析李子柒爆火的深層原因,英穎和孟群(2022)對中國網(wǎng)紅在YouTube的跨文化傳播的討論。鮮有分析YouTube頻道上國外媒體的涉華態(tài)度。本研究旨在Python進(jìn)行數(shù)據(jù)挖掘和文本分析,對美國多家媒體發(fā)表的涉華報道視頻數(shù)據(jù)進(jìn)行爬取分析,識別文本情感傾向,并對報道標(biāo)題數(shù)據(jù)、報道與評論情感占比、詞頻統(tǒng)計進(jìn)行可視化分析,力求結(jié)果更加清晰、簡潔、可信。

二、研究設(shè)計

1. 研究問題:

本研究將回答以下三個方面的問題:

(1)YouTube美媒對華關(guān)注度如何?研究中的各家媒體對中國的相關(guān)報道持什么態(tài)度?

(2)這些視頻的受眾群體對這些媒體的涉華報道持何種態(tài)度?

(3)美國媒體的涉華報道集中在哪些領(lǐng)域?這些媒體在YouTube上構(gòu)建了一個怎樣的中國形象?

2. 理論框架

隨著全球化趨勢的發(fā)展,形象建構(gòu)不再是某個單一因素作用的產(chǎn)物,而是具有復(fù)雜性、多重性和歷時演變性(劉鼎甲,2021)。本研究主要依托批評話語分析理論,批評話語分析理論關(guān)注話語與意識形態(tài)、社會以及話語與控制和權(quán)力之間的辯證關(guān)系?!笆且环N致力于語言、權(quán)力和意識形態(tài)之間關(guān)系的研究框架”(邵斌 回之明,2014:28),在于“揭露意識形態(tài)對話語的影響,話語對意識形態(tài)的反作用,以及兩者是如何源于社會結(jié)構(gòu)和權(quán)勢關(guān)系,又是如何為之服務(wù)的”(丁建新 廖益清, 2001:305)。Fairclough(1989)將社會學(xué)與文化和系統(tǒng)功能語法結(jié)合,作為分析的基礎(chǔ);Wodak(2001)采用話語歷史分析方法分析話語。新聞媒體因其具有主導(dǎo)輿論,操縱人們的意識形態(tài)的特征而備受關(guān)注(胡開寶 張晨夏,2019)。

3. 研究方法與步驟

(1)文本收集

本文通過python編程技術(shù)調(diào)用selenium工具,selenium是一個Web的自動化測試工具,可以直接調(diào)用瀏覽器,接收指令,讓瀏覽器自動加載頁面,獲取需要的數(shù)據(jù)。筆者對YouTube網(wǎng)站中訂閱數(shù)最多的美國五大主流媒體——CNN NEWS、ABC NEWS、Fox NEWS、NBC NEWS、CBS NEWS頻道最近發(fā)布的5000條(截至2022年5月8日,五家媒體共計25000條)視頻信息內(nèi)容進(jìn)行爬取,獲取報道內(nèi)容、視頻鏈接、觀眾評論等數(shù)據(jù)。將報道視頻標(biāo)題中含有“China”或”Chinese”關(guān)鍵字的報道標(biāo)記為涉華報道。

(2)情感分析

文本情感分析即對帶有情感色彩的主觀性文本進(jìn)行分析、處理、歸納和推理的過程。如今,隨著計算機(jī)技術(shù)的發(fā)展,借助計算機(jī)技術(shù)手段實(shí)現(xiàn)對特定文本的情感傾向進(jìn)行分析已經(jīng)成為主流。目前的情感分析方法主要包括基于情感詞典的情感分析方法、基于機(jī)器學(xué)習(xí)的情感分析方法和基于深度學(xué)習(xí)的情感分析方法。

多數(shù)的基于情感詞典的情感分析方法,其一般原理是由人工先驗(yàn)知識,對單個的詞條進(jìn)行賦值,構(gòu)建一個標(biāo)準(zhǔn)化的情感詞典。當(dāng)進(jìn)行情感分析時,文本首先進(jìn)行分詞處理,每個詞條標(biāo)記為詞典的情感值,通過特定的公式對這些情感值進(jìn)行計算,最后得出結(jié)果?;诓煌难芯啃枰瓤蓪η楦袃A向的劃分值進(jìn)行修訂,也可以劃分為更多種類的情感傾向,如NRC詞典劃分為生氣、恐懼、希望、信任、驚奇、悲傷、高興和反感八種情感(Nielsen,2011)。常見的情感詞典有AFINN、NRC、Bing等。

基于機(jī)器學(xué)習(xí)的情感分析方法本質(zhì)上是一個有監(jiān)督的分類問題。這種方法需要將訓(xùn)練語料進(jìn)行人工標(biāo)記(如在二分類情感中我們應(yīng)將語料標(biāo)記為積極和消極兩個類型),語料也需分為訓(xùn)練集和測試集兩部分,接著采取特征提取方法并對特征降維處理,基于特定算法的分類器形成模型,最后通過對測試集內(nèi)數(shù)據(jù)的調(diào)用來驗(yàn)證其模型的準(zhǔn)確性。采取不同的特征提取方法或分類器算法,其效果也存在差異。常見的機(jī)器學(xué)習(xí)分類模型有SVM(支持向量機(jī))、Bayes(貝葉斯)等。

深度學(xué)習(xí)可以說是機(jī)器學(xué)習(xí)的子類,基于深度學(xué)習(xí)的情感分析方法與機(jī)器學(xué)習(xí)的主要差異表現(xiàn)在機(jī)器學(xué)習(xí)需要有人工的特征提取過程,而深度學(xué)習(xí)可以借助深度神經(jīng)網(wǎng)絡(luò)自動實(shí)現(xiàn);此外深度學(xué)習(xí)基于更多訓(xùn)練數(shù)據(jù)其模型的表現(xiàn)也會更加出色?;诰矸e神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和基于長短期神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)等的深度學(xué)習(xí)模型在文本情感分析方面都得到了廣泛的應(yīng)用。

深度學(xué)習(xí)方法往往需要大量訓(xùn)練數(shù)據(jù)集才能得到比較完美的模型,此處筆者選用了自然語言處理中的TextBlob庫工具。TextBlob是一個用Python編寫的開源的英文文本處理庫,它可以用來執(zhí)行詞性標(biāo)注、情感分析、文本翻譯等自然語言處理任務(wù),在測試數(shù)據(jù)下準(zhǔn)確率達(dá)75%(Solar,2018)。TextBlob工具的情感分析方法本質(zhì)上也是一種基于情感詞典的情感分析方法,其工作原理是將字典查找與內(nèi)置算法相結(jié)合,TextBlob庫的詞典文檔對每個具有情感特征的單詞進(jìn)行了賦值(對于相同單詞的不同詞性,分別給予賦值,在計算時取平均值),但基于不同的排列順序,內(nèi)置算法有時會進(jìn)行詞性標(biāo)注的進(jìn)一步轉(zhuǎn)換,計算結(jié)果受副詞的緊湊度、形容詞和名詞的極性等多種因素影響會被置于不同的算法處理。

在情感分析TextBlob在自然語言處理中的情感分析方面主要可以計算語料的三個指標(biāo)——polarity(極性)、subjectivity(客觀性)、intensity(緊湊度)。筆者此處人為將情感分析中將情感分析得分大于0,標(biāo)記為正向情感,小于0標(biāo)記為負(fù)向情感,得分為0標(biāo)記為中性;主客觀性分析中將主客觀性評分大于等于0.5標(biāo)記為主觀性評價,小于0.5標(biāo)記為客觀性評價。

表一 TextBlob主要指標(biāo)

三、結(jié)果與分析

1. 美媒的涉華報道情況

如表二所示,截至2022年5月8日,在YouTube平臺上擁有最多粉絲的五家媒體——CNN NEWS(1380萬訂閱)、ABC NEWS(1300萬訂閱)、Fox NEWS(945萬訂閱)、NBC NEWS(673萬訂閱)、CBS NEWS(436萬訂閱)中,最近發(fā)布的5000篇YouTube視頻中,F(xiàn)ox NEWS的涉華報道最多,達(dá)89篇,ABC NEWS最少只有35篇??偟膩碚f,美國媒體在YouTube頻道發(fā)布的視頻內(nèi)容以美國國內(nèi)事件為主,涉華報道的比例都不足各媒體報道總量2%,可見美國媒體在YouTube頻道上對華關(guān)注度高不高。

表二 各媒體涉華報道數(shù)

2. 華報道情感傾向

數(shù)據(jù)分析整理發(fā)現(xiàn),這五家媒體的涉華報道標(biāo)題的情感傾向性都是以中性為主,主客觀性都以客觀為主,這是由于新聞標(biāo)題多簡練直接,含有明顯情感傾向的情感詞和主觀性的程度副詞較少的原因;如表三所示,CBS NEWS發(fā)表的涉華報道正向性標(biāo)題百分比相比其他媒體最高,達(dá)31.08%;CNN NEWS發(fā)表的涉華報道標(biāo)題相比其他媒體負(fù)向性占比最高,達(dá)23.21%;Fox NEWS所發(fā)的主觀性報道同比占比最高。

表三 各媒體涉華報道情感分析

圖一 各媒體涉華報道情感傾向

3. 觀眾評論

筆者將研究的涉華報道標(biāo)題符合TextBlob評定為“中性”且“客觀”的報道,作為研究觀眾評論情感傾向的對象,對每條涉華報道的熱門評論進(jìn)行爬取(即點(diǎn)贊數(shù)最多的100條評論,若評論不足100則取所有數(shù)據(jù),放棄評論數(shù)小于20的視頻)。計算每家媒體的觀眾評論情感傾向,人工剔除無效數(shù)據(jù)(空評論,含有鏈接的廣告評論等)獲取符合標(biāo)準(zhǔn)的報道數(shù)據(jù)——CNN NEWS,33條視頻,含有3299條評論數(shù)據(jù);ABC NEWS,23條視頻,含有2047條評論數(shù)據(jù);Fox NEWS,58條視頻,含有5723條評論數(shù)據(jù);NBC NEWS,25條視頻,含有1675條評論數(shù)據(jù);CBS NEWS,34條視頻,含有2541條評論數(shù)據(jù)。

對每條評論利用TextBlob工具進(jìn)行情感分析,計算出同媒體發(fā)布的每條視頻下評論的各情感傾向占比,進(jìn)行平均值計算后得出同媒體的評論情感傾向。

表四 觀眾評論情感分析

美媒報道視頻中,各家媒體的負(fù)向評論占比都顯著低于正向與中性評論,從一定程度上說明了五家媒體觀眾對媒體所報道內(nèi)容,總體上是持有中性或正向的態(tài)度的,認(rèn)為所報道的內(nèi)容較大程度上是可信的。CNN NEWS和Fox NEWS的正向情感評論占比高于中性與負(fù)向,可以反映出這兩家媒體的觀眾最為認(rèn)可其媒體報道內(nèi)容,CNN NEWS的正向情感評論占比最高,更是達(dá)到達(dá)47.92%。而ABC NEWS、NBC NEWS、CBS NEWS的中性評論在三種情感傾向的占比最高,相比之下,這三家媒體觀眾的發(fā)言更加趨于“冷靜”。筆者運(yùn)用方差分析并事后比較驗(yàn)證五家媒體評論文本數(shù)據(jù)中的正向評論比例是否存在顯著差異,見表五,表六。

表五 ANOVA 正向比例

表六 Multiple Comparisons 正向比例LSD

注:p<0.05

方差分析表顯示,F(xiàn)值為13.281。P值小于0.05。不同媒體的涉華視頻觀眾評論具有顯著差異。事后比較結(jié)果顯示,ABC NEWS、CBS NEWS和NBC NEWS在正向評論上不存在顯著差異;CNN NEWS與其他媒體均存在顯著差異;Fox NEWS與其他媒體在正向評論上均也存在顯著差異。而根據(jù)美國媒體政治立場測評網(wǎng)站Ad Fontes Media(https://adfontesmedia.com/)的數(shù)據(jù),CNN NEWS和Fox NEWS分別擁有較強(qiáng)的左派立場和右派立場,而ABC NEWS、NBC NEWS、CBS NEWS的政治立場則較為溫和,趨于中間派系?;诖宋覀兛梢哉J(rèn)為具有明顯政治傾向的媒體所發(fā)布的涉華報道視頻其觀眾認(rèn)可度更高。

4. 美媒報道標(biāo)題

新聞標(biāo)題具有精煉直接的行文風(fēng)格,與傳統(tǒng)的長篇文本有很大的不同,匯集成語料庫后,篇幅小,關(guān)鍵詞詞頻高。若進(jìn)行傳統(tǒng)的語料庫搭配詞分析,搭配詞設(shè)置間距過小難以反映標(biāo)題特征,設(shè)置過大則會出現(xiàn)詞匯重復(fù)計算的情況。因此筆者以標(biāo)題高頻詞分析(剔除“China”“Chinese”兩詞和一般停用),來反映報道標(biāo)題情況。

表七 涉華報道高頻詞

基于這些高頻詞,我們可以直觀發(fā)現(xiàn),美媒的涉華報道以政治報道為主,其他領(lǐng)域(體育,娛樂等)占比較小。其中,CNN NEWS的涉華報道高頻詞全部集中于政治領(lǐng)域。

四、結(jié)論

本研究運(yùn)用數(shù)據(jù)挖掘、文本分析的方法調(diào)查了美國五大主流媒體在YouTube視頻分享網(wǎng)站上所進(jìn)行的中國相關(guān)報道。研究發(fā)現(xiàn):美國媒體YouTube頻道主要視頻內(nèi)容仍以美國國內(nèi)事務(wù)為主,在YouTube平臺上這些媒體并不是十分關(guān)注,發(fā)表的涉華視頻內(nèi)容不及總量的2%。

本研究發(fā)現(xiàn),涉華報道評論情感趨向與媒體的政治立場存在顯著關(guān)系。具有顯著政治立場的媒體,其受眾群體對媒體報道的接受認(rèn)可程度更高;CNN NEWS作為美國典型的左派媒體,其用戶認(rèn)可度最高,涉華報道視頻正向評論達(dá)47.92%,顯著高于33.26%的中性評論占比與18.82%的負(fù)向評論占比。右派媒體Fox NEWS的用戶認(rèn)可程度也處于較高水平,涉華報道視頻評論正向評論平均占比43.22%,高于中性評論占比與負(fù)向評論占比;而立場較為溫和的“中間派”媒體ABC NEWS、CBS NEWS、NBC NEWS的涉華視頻評論中,都以“中性”評論為主流。

研究發(fā)現(xiàn),五家媒體的涉華報答都以政治性報道為主,其中以CNN NEWS為最盛,加之其高度的用戶認(rèn)可度,給中國的海外形象傳播帶來了極大的阻力。

鑒于以上研究發(fā)現(xiàn),筆者認(rèn)為在高度信息化的今天,我國應(yīng)更加加強(qiáng)國家話語權(quán)建設(shè)、使一批有影響力的中國媒體在世界舞臺上發(fā)聲。我國為維護(hù)自身網(wǎng)絡(luò)信息主權(quán)與構(gòu)建和諧的輿論環(huán)境,建立網(wǎng)絡(luò)防護(hù)墻,因此美媒Y(jié)ouTube平臺的受眾以西方或英語世界世界人群為主。在對外宣傳上,我們應(yīng)以客觀真實(shí)的報道展現(xiàn)我國的真實(shí)姿態(tài),盡可能減少西方民眾受單一價值取向媒體虛假報道所造成的對中國認(rèn)知形象的負(fù)面偏差,提升我國國際形象。

猜你喜歡
分析方法文本情感
基于EMD的MEMS陀螺儀隨機(jī)漂移分析方法
如何在情感中自我成長,保持獨(dú)立
一種角接觸球軸承靜特性分析方法
失落的情感
北極光(2019年12期)2020-01-18 06:22:10
情感
在808DA上文本顯示的改善
中國設(shè)立PSSA的可行性及其分析方法
中國航海(2019年2期)2019-07-24 08:26:40
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
如何在情感中自我成長,保持獨(dú)立
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
高邑县| 方山县| 二手房| 五寨县| 灵宝市| 梅州市| 合川市| 潮安县| 麻城市| 自治县| 运城市| 昆山市| 阿勒泰市| 辽中县| 栖霞市| 广东省| 长垣县| 嘉祥县| 满洲里市| 繁昌县| 新乐市| 吴堡县| 平湖市| 尉犁县| 蓬安县| 寿阳县| 益阳市| 隆林| 南昌市| 乌什县| 建瓯市| 山丹县| 鹿泉市| 长乐市| 雅安市| 宁强县| 秦皇岛市| 永年县| 吴旗县| 商丘市| 漳浦县|