張寧 李華 李培植 沈洪洲 袁勤儉
摘?要:[目的/意義]新型冠狀病毒肺炎的爆發(fā)作為近期的一件重大突發(fā)公共衛(wèi)生事件,引發(fā)了公眾在社會(huì)化問答平臺(tái)上的激烈討論。[方法/過程]本研究采用Python獲取知乎平臺(tái)上與新型冠狀病毒肺炎話題相關(guān)的文本內(nèi)容,運(yùn)用多維尺度分析、內(nèi)容分析和情緒分析等方法,揭示公眾所關(guān)心的疫情主題內(nèi)容,分析不同時(shí)期公眾關(guān)注點(diǎn)的轉(zhuǎn)移情況以及回答文本中的情緒極性。[結(jié)果/結(jié)論]研究結(jié)果表明公眾關(guān)心的主題集中在兩個(gè)維度的6個(gè)類別上;公眾的關(guān)注內(nèi)容主要集中在“疫情動(dòng)態(tài)關(guān)注”和“防控與疫情傳播”兩方面,其中第一階段主要關(guān)注國內(nèi)地區(qū),而第二階段關(guān)注重心轉(zhuǎn)移到國外地區(qū);兩階段的回答中情緒極性均以中立為主,積極情緒的問答占比最低,第二階段相比第一階段的變化表明公眾情緒的整體走向積極?;谘芯拷Y(jié)果,針對(duì)互聯(lián)網(wǎng)公眾的信息關(guān)注和社會(huì)情緒變化,向有關(guān)部門提供參考和建議,進(jìn)而豐富了突發(fā)公共衛(wèi)生事件背景下的輿情相關(guān)研究。
關(guān)鍵詞:突發(fā)公共衛(wèi)生事件;多維尺度分析;內(nèi)容分析;公眾反應(yīng);情緒極性;新冠肺炎
DOI:10.3969/j.issn.1008-0821.2021.02.008
〔中圖分類號(hào)〕G252.0?〔文獻(xiàn)標(biāo)識(shí)碼〕A?〔文章編號(hào)〕1008-0821(2021)02-0078-11
Abstract:[Purpose/Significance]The outbreak of the COVID-19,as a major public health emergency in the recent past,has sparked intense public discussion on the social question and answer platform.[Method/Process]This study used Python to obtain text content related to the topic of COVID-19 on the platform,using multi-dimensional scale analysis,content analysis and sentiment analysis to reveal the epidemic theme content of public concern and analyze the shift of public attention in different periods and emotional polarity in the answer text.[Results/Conclusions]The results showed that the topics of public concern were concentrated in 6 categories in two dimensions.The public's concerns were mainly concentrated in two aspects:“dynamic attention to epidemic situation”and“prevention control & epidemic transmission”,of which the focus of the first stage was mainly on domestic areas,while the focus of the second phase was shifted to foreign areas.The polarity of sentiment in the answers of the two phases was mainly neutral,and the proportion of positive emotions was the lowest.The changes in the second phase compared to the first phase indicated that the overall public sentiment was positive.Based on the results of the research,we provided references and suggestions to the relevant departments for the Internet public response and social mood changes,thereby enriching the research on the Internet public response in the context of public health emergencies.
Key words:public health emergencies;multidimensional scale analysis;content analysis;public response;emotional polarity;COVID-19
新型冠狀病毒肺炎這一重大突發(fā)公共衛(wèi)生事件的爆發(fā)引起了廣大公眾的關(guān)注,并在社會(huì)化問答平臺(tái)上展開激烈討論。公眾不僅能通過社會(huì)化問答平臺(tái)獲取健康信息,還能在平臺(tái)上獲取情感支持和共鳴。因此,社會(huì)化問答平臺(tái)為研究提供了大量與健康信息相關(guān)的內(nèi)容,諸多學(xué)者從內(nèi)容主題、答案偏好等方面進(jìn)行了廣泛研究[1-2],為相關(guān)部門提出有針對(duì)性的應(yīng)對(duì)措施提供了理論基礎(chǔ)。此外,內(nèi)容中包含的情感也是重要的研究要素,尤其在突發(fā)公共衛(wèi)生事件中,情緒在平臺(tái)用戶中的迅速傳播和交互影響會(huì)產(chǎn)生諸多影響,而相關(guān)部門針對(duì)公眾反應(yīng),及時(shí)安撫公眾不良情緒,可以有效避免社會(huì)恐慌,據(jù)此,安璐等[3]以魏則西事件為例探究了相關(guān)利益人在突發(fā)公共衛(wèi)生事件中不同時(shí)期的情感變化和強(qiáng)度,并分析了情感在主要相關(guān)利益人間的傳播路徑,為相關(guān)部門采取有效的情緒引導(dǎo)措施提供了參考。
綜上,國外研究人員主要從用戶和主題分類、信息質(zhì)量評(píng)估及影響因素、信息行為及其影響因素幾方面來展開將社會(huì)化問答平臺(tái)與健康結(jié)合的研究,較為全面且數(shù)量較多;而國內(nèi)僅對(duì)健康信息用戶的行為進(jìn)行了初步探究,缺乏健康話題主題分析方面的研究。本研究以知乎平臺(tái)為研究對(duì)象,剖析突發(fā)事件中互聯(lián)網(wǎng)公眾關(guān)注的話題主題,同時(shí)分析了公眾所發(fā)表言論中的情緒極性,以便掌握其關(guān)注焦點(diǎn)和社會(huì)情緒走向。研究結(jié)論有助于相關(guān)部門針對(duì)公眾的信息訴求給出相應(yīng)的應(yīng)對(duì)措施,以期實(shí)現(xiàn)突發(fā)事件的輿論風(fēng)險(xiǎn)點(diǎn)識(shí)別,并對(duì)相關(guān)部門有效安撫公眾情緒產(chǎn)生一定的啟示作用。
2?研究設(shè)計(jì)
本研究以知乎平臺(tái)上與新型冠狀病毒肺炎相關(guān)的話題內(nèi)容為研究對(duì)象,研究的主要內(nèi)容如下:①爬取知乎平臺(tái)上與新型冠狀病毒肺炎相關(guān)的問答條目;②分析不同階段知乎上發(fā)布的問題數(shù)量和關(guān)注點(diǎn)的變化情況;③闡釋并可視化呈現(xiàn)話題的主題;④分析不同階段問題答案中的情緒極性。
2.1?研究方法
多維尺度分析是一種可視化分析工具。國外研究人員將其與突發(fā)公共衛(wèi)生事件相結(jié)合,對(duì)相關(guān)話題的主題或術(shù)語進(jìn)行可視化呈現(xiàn)。如Cai H等[22]利用多維尺度分析對(duì)雅虎問答上用戶使用的糖尿病術(shù)語進(jìn)行可視化聚類分析;此外,Zhang J等[1]還利用多維尺度分析揭示了雅虎問答上與寨卡病毒相關(guān)話題的主題;Qiang X L等[34]利用多維尺度分析對(duì)包括新型冠狀病毒在內(nèi)的人類冠狀病毒模式進(jìn)行聚類。國內(nèi)目前主要將多維尺度分析用于研究現(xiàn)狀的可視化呈現(xiàn),將其與突發(fā)公共衛(wèi)生事件結(jié)合的相關(guān)研究較少,多維尺度分析是用來揭示話題主題的一個(gè)合適的分析工具,因此本研究主要采用多維尺度分析方法研究疫情期間社會(huì)化問答平臺(tái)中的公眾反應(yīng)。
2.2?數(shù)據(jù)來源
選取知乎問答網(wǎng)站作為研究對(duì)象,因?yàn)橹跏菄鴥?nèi)最為廣泛使用的社會(huì)化問答平臺(tái),截至2018年11月底,其注冊(cè)用戶達(dá)到2.2億人,同比增長102%,生產(chǎn)出了約3 000萬個(gè)問題和1.3億個(gè)回答[35]。
對(duì)知乎上與新型冠狀病毒肺炎相關(guān)的話題進(jìn)行瀏覽和篩選后,最終選擇問題質(zhì)量相對(duì)較好的“新型冠狀病毒”“新型冠狀病毒肺炎”和“疫情影響”3個(gè)話題,利用Python爬取問答條目,爬取內(nèi)容包括提問者ID、問題、提問時(shí)間、回答者ID、回答內(nèi)容和回答時(shí)間。爬取數(shù)據(jù)的起始時(shí)間為3個(gè)話題下第一個(gè)相關(guān)問題提出的時(shí)間,即2020年1月20日,截止時(shí)間為爬取數(shù)據(jù)的當(dāng)天,即2020年3月9日,共計(jì)230個(gè)問題,剔除2個(gè)重復(fù)問題,最后保留228個(gè)問題。需要注意的是,一些問題中包含兩個(gè)分屬不同類別的問句,編碼細(xì)節(jié)將在內(nèi)容分析部分提供。
2.3?數(shù)據(jù)處理
首先,按照公眾關(guān)注的國內(nèi)外疫情爆發(fā)的不同時(shí)間階段,將數(shù)據(jù)分為兩個(gè)階段。其次,分別對(duì)兩個(gè)階段的問題進(jìn)行處理:第一,由研究人員對(duì)兩個(gè)階段的問題進(jìn)行編碼;第二,將編碼后得到的兩階段問題文本進(jìn)行分詞和去停用詞處理。由于一些特殊的詞匯切分后會(huì)導(dǎo)致其失去原本的含義,所以在分詞處理過程中使用自定義詞典以保留特殊詞匯的含義,例如:“鉆石公主號(hào)”“新冠核酸檢測”“密切接觸者”等,采用哈工大的停用詞表去除停用詞;第三,對(duì)兩個(gè)階段的關(guān)鍵詞文本進(jìn)行人工再處理,去除對(duì)主題分析沒有作用的詞語,并將含義明顯相同的詞語進(jìn)行合并,例如“戴”和“佩戴”,“例”和“人/名”等;第四,將關(guān)鍵詞文本進(jìn)行處理得到共現(xiàn)矩陣,并將其轉(zhuǎn)換為相異矩陣。最后,將相異矩陣作多維尺度分析的輸入矩陣,得到的多維尺度分析圖將在下一部分呈現(xiàn)。
3?結(jié)果分析
3.1?內(nèi)容分析
為了對(duì)主題進(jìn)行更好的可視化呈現(xiàn),由兩位研究人員對(duì)兩個(gè)階段的問題進(jìn)行編碼。首先,研究人員逐一分析原始問題和處理得到的關(guān)鍵詞,概括出初始類別,然后將屬于同一類別的問題做好標(biāo)記,其中一些原始問題包含兩個(gè)問句,且兩個(gè)問句分屬不同類別,這時(shí)將其作為兩個(gè)文本單元同時(shí)放入兩個(gè)類別中;其次,逐一分析完后發(fā)現(xiàn)所有問題大致可歸為6類,并為其確定類別名,分別是“冠狀病毒知識(shí)”(L1)、“疫情動(dòng)態(tài)關(guān)注”(L2)、“藥物研發(fā)與治療”(L3)、“疫情影響對(duì)象”(L4)、“防控與疫情傳播”(L5)、“公眾觀點(diǎn)與態(tài)度”(L6);最后,再對(duì)確定好的類別進(jìn)行總結(jié),發(fā)現(xiàn)前3個(gè)類別為1個(gè)維度,后3個(gè)類別為1個(gè)維度,總共概括為2個(gè)維度,即“新冠病毒的相關(guān)信息”(W1)和“新冠病毒的社會(huì)影響”(W2)。問題編碼示例如表1所示。為了確保編碼的可信度,兩位編碼人員進(jìn)行獨(dú)立編碼,并對(duì)結(jié)果不一致的問題進(jìn)行協(xié)商,盡管最終仍有幾個(gè)問題的類別難以統(tǒng)一,但編碼信度值在95%以上。此外,為了確保編碼員自身編碼的一致性,時(shí)隔1周后研究人員進(jìn)行二次獨(dú)立編碼,信度值均在97%以上,表明編碼效果較好。
3.2?基于時(shí)間的問題數(shù)量變化分析
2020年1月20日是3個(gè)話題下首次出現(xiàn)相關(guān)問題的時(shí)間點(diǎn),恰好也是國內(nèi)疫情已經(jīng)廣泛引起公眾關(guān)注的時(shí)間點(diǎn),而2020年2月15日,國內(nèi)疫情開始緩和,而國外疫情隨著“鉆石公主號(hào)”郵輪乘客確診病例驟增,且多國開始出現(xiàn)病例逐漸爆發(fā),故將數(shù)據(jù)按照這兩個(gè)時(shí)間點(diǎn)分為兩個(gè)階段,各階段起止時(shí)間及問題數(shù)如表2所示。第二階段各維度的問題數(shù)總和之所以超過總問題數(shù),是由于有5個(gè)問題條目中包含兩個(gè)問句,且兩個(gè)問句分屬不同維度,因此將這5個(gè)問題同時(shí)放入兩個(gè)維度中。
第一階段問題數(shù)變化趨勢如圖1所示。該階段問題數(shù)的幾個(gè)較大峰值分別出現(xiàn)在1月23日、1月28日、1月31日、2月8日和2月13日,回顧疫情發(fā)生事件的時(shí)間線,發(fā)現(xiàn)這幾個(gè)峰值出現(xiàn)的當(dāng)天都有相對(duì)較多或有重要事件發(fā)生。選取峰值最大的兩天具體討論,1月23日主要有武漢疫情防控指揮部發(fā)布1號(hào)通告、武漢封城、三地啟動(dòng)重大突發(fā)公共衛(wèi)生事件一級(jí)響應(yīng)、火神山醫(yī)院開建、五地確診首例病例、河北出現(xiàn)湖北省以外首例死亡病例等9項(xiàng)重要事件;1月28日主要有習(xí)近平總書記會(huì)見世衛(wèi)總干事譚德塞,政府針對(duì)防控物資、疫情救治和哄抬物價(jià)等社會(huì)現(xiàn)象作出的4項(xiàng)舉措,全國累計(jì)確診病例超過非典、中國醫(yī)學(xué)科學(xué)院稱蝙蝠是病毒起源、鐘南山預(yù)測疫情高峰、新型冠狀病毒mRNA疫苗研發(fā)立項(xiàng)等7項(xiàng)疫情消息,援鄂醫(yī)療隊(duì)、捐款等3項(xiàng)疫情防控事件,以及世衛(wèi)稱新冠病毒疫情對(duì)全球構(gòu)成高風(fēng)險(xiǎn)和赴中國了解疫情兩項(xiàng)標(biāo)志性事件,這一天共有16項(xiàng)牽動(dòng)民眾心弦的事件或消息,當(dāng)天的問題數(shù)也是這一階段中最多的。
第二階段問題數(shù)變化趨勢如圖2所示。該階段問題數(shù)的幾個(gè)較大峰值分別出現(xiàn)在2月25日、2月28日、3月4日、3月6日和3月8日,回顧疫情發(fā)生事件的時(shí)間線,發(fā)現(xiàn)這幾個(gè)峰值出現(xiàn)的當(dāng)天也發(fā)生了相對(duì)較多的重要事件。具體討論峰值中最大的兩天,2月28日發(fā)生的重要事件或重要消息歸納起來主要有:政府針對(duì)開學(xué)、山東監(jiān)獄事件等采取的4項(xiàng)舉措,世衛(wèi)上調(diào)風(fēng)險(xiǎn)級(jí)別、患者寵物狗的檢驗(yàn)結(jié)果、韓國和意大利感染情況及“鉆石公主號(hào)”等7項(xiàng)疫情消息,方艙醫(yī)院、疫情上升趨勢已得到遏制、累計(jì)治愈首超現(xiàn)有確診病例數(shù)、樂觀估計(jì)4月底可摘口罩等7項(xiàng)正向消息,這一天共有18項(xiàng)重要消息,其中世衛(wèi)上調(diào)風(fēng)險(xiǎn)級(jí)別和全國累計(jì)治愈首超確診是標(biāo)志性事件。3月6日,習(xí)近平發(fā)表重要講話、預(yù)計(jì)快遞恢復(fù)時(shí)間兩項(xiàng)政府行動(dòng),醫(yī)務(wù)人員無感染報(bào)告、31省新增降至兩位數(shù)、藥物與疫苗等6項(xiàng)正向消息,以及世衛(wèi)表示寵物犬與病毒傳播無密切關(guān)聯(lián)、全球感染狀況等6項(xiàng)疫情消息,這一天共有14項(xiàng)重要消息。
綜上所述,兩個(gè)階段中問題數(shù)峰值的當(dāng)天都發(fā)生了較多的重大事件。第一階段問題數(shù)變化起伏較大,與第一階段相比,第二階段變化相對(duì)平穩(wěn)。
3.3?多維尺度分析
將各階段各維度的相異矩陣作為輸入矩陣,進(jìn)行多維尺度分析。
第一階段維度1(新冠病毒的相關(guān)信息)的可視化分析如圖3所示。該分析的擬合度指標(biāo)值:Stress=0.18160,RSQ=0.84571,表明擬合效果較好。圖中紅色節(jié)點(diǎn)為該階段維度1中的類別1(冠狀病毒知識(shí)),這一類別主要是與冠狀病毒本身相關(guān)的問題,例如“新型冠狀病毒是SARS的變異體嗎?”,是人們對(duì)新冠病毒的來源及病毒特征等方面的關(guān)注;橘色節(jié)點(diǎn)為該階段維度1中的類別2(疫情動(dòng)態(tài)關(guān)注),是人們對(duì)病毒感染及相關(guān)狀況的關(guān)心,其典型問題如“新型冠狀病毒真實(shí)感染人數(shù)和死亡人數(shù)是多少,請(qǐng)用數(shù)據(jù)說明?”;綠色節(jié)點(diǎn)為維度1中的類別3(藥物研發(fā)與治療),該類別是人們對(duì)藥物研發(fā)與病例治療狀況的關(guān)心,典型問題如“如何看待四川媒體報(bào)道四川省醫(yī)院團(tuán)隊(duì)‘研究發(fā)現(xiàn)克力芝有可能應(yīng)用于治療新型冠狀病毒?”。各類別包含的主題詞如表3所示。
圖中各顏色節(jié)點(diǎn)的數(shù)量便是其對(duì)應(yīng)類別受關(guān)注程度的直觀呈現(xiàn)?!耙咔閯?dòng)態(tài)關(guān)注”和“藥物研發(fā)與治療”的節(jié)點(diǎn)很多,而“冠狀病毒知識(shí)”的節(jié)點(diǎn)較少。由于病毒感染的趨勢迅猛,人們對(duì)感染狀況十分關(guān)心,而藥物研發(fā)與病患的治療狀況是控制疫情的主要指標(biāo),因此也備受關(guān)注。此外,從主題詞可看出,這一階段人們對(duì)疫情的關(guān)心主要集中在國內(nèi)地區(qū),這可能很大程度上是由于這個(gè)時(shí)間段是國內(nèi)疫情爆發(fā)較嚴(yán)重的時(shí)期。
第一階段維度2(新冠病毒的社會(huì)影響)的可視化分析如圖4所示。該分析的擬合度指標(biāo)值Stress=0.20867,RSQ=0.75950,表明擬合效果一般。圖中黃色節(jié)點(diǎn)為該階段維度2中的類別4(疫情影響對(duì)象),這類問題是關(guān)于疫情對(duì)哪些方面造成了什么影響,例如學(xué)生關(guān)心因?yàn)橐咔楹螘r(shí)能開學(xué)?考試會(huì)不會(huì)受到影響?上班族關(guān)心什么時(shí)候開始上班?上班形式是什么等;藍(lán)色節(jié)點(diǎn)為維度2中的類別5(防控與疫情傳播),主要是人們對(duì)病毒傳染的控制措施的關(guān)心,例如應(yīng)該如何消毒?戴什么口罩能有效防止病毒傳染等;紫色節(jié)點(diǎn)是維度2中的類別6(公眾觀點(diǎn)與態(tài)度),這類問題主要是人們對(duì)他人如何看待疫情期間發(fā)生的社會(huì)事件的關(guān)注,例如“如何看待現(xiàn)階段疫情如此嚴(yán)重,農(nóng)村一老人去世,家屬依然要求所有親戚不管是不是在村里的都要來參加葬禮?”。各類別包含的主題詞如表3所示。
該階段類別1(冠狀病毒知識(shí))和類別6(公眾觀點(diǎn)與態(tài)度)的節(jié)點(diǎn)數(shù)較少,其中一種解釋是由于這兩個(gè)類別的問題數(shù)相對(duì)較少,很多能反映主題的詞語詞頻低于2,因此沒有發(fā)生共現(xiàn)現(xiàn)象而被排除在分析范疇外。此外,這兩個(gè)類別與其他類別的界限不是很明確,這可能部分是由于問題中的主題詞與其他類別中的主題詞有重疊。例如:“病毒存活失活滅活死亡到底是什么意思?”(屬于維度1的類別1)與“面對(duì)新病毒,疫苗研制究竟需要多久?”(屬于維度1的類別3),兩個(gè)問題屬于不同的類別,但卻有共同的主題詞“病毒”。
如表3所示,第一階段維度1中主題詞共42個(gè),占該階段主題詞的44.7%,其中類別1有7個(gè),類別2有21個(gè),類別3有14個(gè),分別占維度1主題詞的16.7%、50%和33.3%;維度2中主題詞共52個(gè),占該階段主題詞的55.3%,其中類別4有18個(gè),類別5有26個(gè),類別6有8個(gè),分別占維度2主題詞的34.6%、50%和15.4%。由此可見,在第一階段期間,維度1中人們更關(guān)心“疫情動(dòng)態(tài)”方面的問題,維度2中人們更關(guān)注病毒的“防控與傳播”,該現(xiàn)象的其中一個(gè)現(xiàn)實(shí)解釋為該階段病毒感染趨勢迅猛,恐慌情緒驅(qū)使人們關(guān)注病毒的傳播狀況,而防控傳播與疫情得到控制密切相關(guān),因此也備受關(guān)注。
第二階段維度1的可視化分析如圖5所示。該分析的擬合度指標(biāo)值:Stress=0.13617,RSQ=0.88790,表明擬合效果較好。圖中紅色節(jié)點(diǎn)為該階段維度1的類別1(冠狀病毒知識(shí)),橘色節(jié)點(diǎn)為類別2(疫情動(dòng)態(tài)關(guān)注),綠色節(jié)點(diǎn)為類別3(藥物研發(fā)與治療)。該階段人們對(duì)疫情動(dòng)態(tài)的關(guān)心主要集中在海外地區(qū),這是由于這一階段正值國外疫情爆發(fā)時(shí)期。各類別包含的主題詞如表4所示。
第二階段維度2的可視化分析如圖6所示。該分析的擬合度指標(biāo)值:Stress=0.17212,RSQ=0.83840,表明擬合效果較好。圖中黃色節(jié)點(diǎn)為該階段維度2的類別4(疫情影響對(duì)象),藍(lán)色節(jié)點(diǎn)為類別5(防控與疫情傳播),紫色節(jié)點(diǎn)為類別6(公眾觀點(diǎn)與態(tài)度)。每個(gè)類別包含的主題詞情況如表4所示。
由表4可知,第二階段維度1的主題詞共32個(gè),占該階段主題詞的46.4%,其中類別1有3個(gè),類別2有20個(gè),類別3有9個(gè),分別占維度1主題詞的9.4%、62.5%和28.1%;維度2的主題詞共37個(gè),占該階段主題詞的53.6%,類別4有6個(gè),類別5有26個(gè),類別6有5個(gè),分別占維度2主題詞的16.2%、70.3%和13.5%。由此可見,在第二階段期間,維度1中人們同樣更關(guān)注疫情動(dòng)態(tài),而對(duì)冠狀病毒知識(shí)的關(guān)注占比降得更低了,該現(xiàn)象的現(xiàn)實(shí)解釋之一可能是人們?cè)谝咔楸l(fā)的初期已經(jīng)初步了解了病毒的來源及特征等信息,因此,這一階段其關(guān)注程度就隨之降低;維度2中人們?nèi)匀桓P(guān)注防控與疫情傳播。此外,由于該階段是國外疫情開始爆發(fā)的時(shí)期,人們對(duì)疫情影響對(duì)象的關(guān)注重心發(fā)生轉(zhuǎn)移,即從第一階段疫情對(duì)國內(nèi)生活和社會(huì)的影響轉(zhuǎn)移到多國爆發(fā)疫情對(duì)世界經(jīng)濟(jì)和社會(huì)等方面的影響。
如上文所述,互聯(lián)網(wǎng)公眾關(guān)注的主題主要集中在6個(gè)類別上,即“冠狀病毒知識(shí)”“疫情動(dòng)態(tài)關(guān)注”“藥物研發(fā)與治療”“疫情影響對(duì)象”“防控與疫情傳播”以及“公眾看法與態(tài)度”。其中,最受關(guān)注的是“疫情動(dòng)態(tài)關(guān)注”和“防控與疫情傳播”兩個(gè)類別,但在疫情爆發(fā)的不同時(shí)期,公眾對(duì)疫區(qū)的關(guān)注重心隨之轉(zhuǎn)移,且對(duì)影響對(duì)象的關(guān)注點(diǎn)也在轉(zhuǎn)移。
3.4?情緒分析
現(xiàn)實(shí)社會(huì)中的許多問題都與情感和情緒有關(guān),社會(huì)情感安全也是輿情治理的重要因素。利用基于情感詞典的情緒分析工具對(duì)與問題相對(duì)應(yīng)的回答進(jìn)行情緒分析。該工具根據(jù)文本中的情感詞確定得分正負(fù),程度副詞確定權(quán)值,若有感嘆號(hào)或問號(hào)等重要標(biāo)點(diǎn)則加上其對(duì)應(yīng)的分值,以“[正面分值,負(fù)
面分值]”這樣的數(shù)組形式存儲(chǔ)文本的情緒得分,然后通過比較正面和負(fù)面得分值大小獲得情緒傾向,最后再由研究人員逐一檢查,將得分離群值更改后進(jìn)行統(tǒng)計(jì)。情緒得分值中,1代表積極情緒,-1代表消極情緒,0代表中立。與第一階段的134個(gè)問題相對(duì)應(yīng)的回答共344條,與第二階段的94個(gè)問題相對(duì)應(yīng)的回答共243條。兩階段的情緒傾向頻次分布如圖7所示。
如圖7所示,第一階段的回答條目中,中立情緒出現(xiàn)的頻次最多,消極情緒次之,積極情緒、消極情緒和中立情緒的回答分別占18.3%、35.2%和46.5%;第二階段中,同樣是中立情緒頻次最多,消極情緒次之,積極情緒、消極情緒和中立情緒的回答分別占17.3%、33.3%和49.4%。其主要原因可能是公眾關(guān)心的如何防范及疫情狀況等主要問題的回答大都是客觀回答或數(shù)據(jù),因此,情緒以中立為主。
第一階段和第二階段的回答中,情緒極性的分布大致相同??傮w而言,兩個(gè)階段的回答文本中,積極情緒都是出現(xiàn)頻次最低的,這體現(xiàn)了公眾在重大突發(fā)公共事件中的真實(shí)反應(yīng),即積極情緒較為低迷。第二階段積極情緒回答的占比降低1%,消極情緒回答的占比降低1.9%,而中立回答的占比提升2.9%,消極情緒回答的占比降低幅度比積極情緒回答的占比的降低幅度稍大,同時(shí)中立回答的占比在提高,這表明公眾情緒的整體走向積極。
4?討論與展望
4.1?結(jié)?論
本研究將多種方法用于分析知乎平臺(tái)上與新型冠狀病毒肺炎相關(guān)話題的主題內(nèi)容及情緒極性。利用Python獲取問答文本數(shù)據(jù),運(yùn)用多維尺度分析對(duì)公眾關(guān)心的主題進(jìn)行可視化呈現(xiàn),使用基于情感詞典的情緒分析工具對(duì)回答文本進(jìn)行情緒分析。研究結(jié)果表明,公眾關(guān)注主題方面,知乎平臺(tái)上與新型冠狀病毒肺炎相關(guān)的3個(gè)話題下,人們關(guān)心的主題集中在“冠狀病毒知識(shí)”“疫情動(dòng)態(tài)關(guān)注”“藥物研發(fā)與治療”“疫情影響對(duì)象”“防控與疫情傳播”“公眾觀點(diǎn)與態(tài)度”這6個(gè)類別上。兩個(gè)階段中公眾均更加關(guān)注“疫情動(dòng)態(tài)和防控傳播”,但第一階段的關(guān)注重心為國內(nèi)地區(qū),隨著疫情時(shí)期的變化,第二階段關(guān)注重心轉(zhuǎn)移到國外地區(qū)上。此外,值得注意的是第二階段人們對(duì)疫情影響對(duì)象的關(guān)注點(diǎn)也發(fā)生了轉(zhuǎn)移。兩階段相比之下,第二階段公眾對(duì)“冠狀病毒知識(shí)”的關(guān)注降低,這可能是由于在第一階段公眾已經(jīng)初步掌握了該方面的信息;而對(duì)“疫情動(dòng)態(tài)關(guān)注”和“防控與疫情傳播”的關(guān)注占比上升,其原因可能是雖然第二階段國內(nèi)疫情稍緩和,但國外疫情卻開始大爆發(fā)。問題數(shù)分布方面,問題數(shù)峰值當(dāng)天均發(fā)生了較多的熱點(diǎn)事件或發(fā)布了重要消息;與第一階段相比,第二階段的問題數(shù)變化趨勢相對(duì)平穩(wěn)。公眾發(fā)表言論中的情緒極性方面,第一階段和第二階段的情緒分布大致相同,中立情緒出現(xiàn)頻次最多,消極情緒次之,積極情緒第三,這表明公眾的積極情緒相對(duì)低迷,第二階段相比第一階段的變化表明,公眾的情緒整體走向積極,該結(jié)論與Worrall A等[29]對(duì)新浪微博上公眾情緒變化趨勢的研究結(jié)論一致。
此外,研究發(fā)現(xiàn)公眾不僅僅對(duì)疫情、病毒、癥狀及治療等感興趣,還對(duì)社會(huì)生活、疫情期間其他用戶對(duì)發(fā)生的消極社會(huì)事件的觀點(diǎn)態(tài)度等感興趣。關(guān)鍵詞的聚類體現(xiàn)了其間的關(guān)聯(lián)關(guān)系,進(jìn)而反映了同類用戶在信息需求方面的相似性,這種關(guān)聯(lián)關(guān)系可以作為豐富醫(yī)學(xué)詞庫條目的依據(jù),還可以幫助完善此類分類系統(tǒng)。
4.2?啟示與建議
該研究從理論層面上看,將多維尺度分析方法用于研究社會(huì)化問答平臺(tái)上突發(fā)公共衛(wèi)生事件中公眾關(guān)心的主題,豐富了國內(nèi)外的相關(guān)研究,其發(fā)現(xiàn)的術(shù)語、關(guān)系和模式也可以豐富現(xiàn)有與新冠病毒肺炎相關(guān)的醫(yī)學(xué)同義詞典、主題詞和分類系統(tǒng)。該研究方法對(duì)今后突發(fā)公共衛(wèi)生事件背景下社會(huì)化問答平臺(tái)的內(nèi)容主題分析有一定的啟示,能夠?yàn)樯鐣?huì)化媒體做好突發(fā)公共衛(wèi)生事件中的輿論引導(dǎo)提高理論高度。從實(shí)踐層面上看,研究結(jié)果有助于決策部門掌握互聯(lián)網(wǎng)公眾的關(guān)注內(nèi)容、關(guān)注點(diǎn)的轉(zhuǎn)移情況以及內(nèi)容中包含的情緒走向,以便部門做出具有針對(duì)性的專業(yè)解答與回應(yīng),重視情緒監(jiān)測與情緒的反饋?zhàn)饔?,建立社?huì)公眾情感安全系統(tǒng),緩解公眾的焦慮和恐慌情緒。
針對(duì)上述研究結(jié)論,本研究為突發(fā)公共衛(wèi)生事件的相關(guān)部門提出以下建議:第一,對(duì)疫情相關(guān)信息的公布可采取多元化的渠道,尤其是抖音、快手等新興起的短視頻App,但對(duì)其信息質(zhì)量應(yīng)嚴(yán)格把控;第二,相關(guān)部門可及時(shí)向公眾公布防控病毒感染的小知識(shí),并對(duì)一些所謂“偏方”的謠言及時(shí)采取辟謠行動(dòng),例如“吃大蒜可有效抑制新冠病毒”“多喝燙水,因?yàn)椴《灸鼙桓邷貧⑺馈钡?第三,公眾在疫情迅猛爆發(fā)時(shí)期對(duì)疫情影響對(duì)象的關(guān)注,一定程度上反映了人們的緊張和擔(dān)憂內(nèi)容,相關(guān)部門可以針對(duì)人們的關(guān)注點(diǎn),多渠道宣傳政府的相關(guān)舉措以緩解人們的擔(dān)憂;第四,可倡導(dǎo)公眾關(guān)注國家正規(guī)新聞媒體發(fā)布的真實(shí)信息,不聽信謠言,積極傳播正向情緒,還可以開設(shè)一些緩解心理焦慮的公開視頻課程,以緩解公眾的緊張情緒;此外,可根據(jù)關(guān)鍵詞間的關(guān)聯(lián)關(guān)系來豐富百度等搜索引擎的檢索詞條,增強(qiáng)其內(nèi)部性能,以便用戶在輸入1個(gè)或多個(gè)檢索詞時(shí),搜索引擎能夠提供其他的相關(guān)檢索詞。
4.3?局限與展望
首先,本研究僅分析了知乎問答平臺(tái)上3個(gè)相關(guān)話題下2020年1月20日至3月9日的問答數(shù)據(jù),導(dǎo)致有的類別的問題數(shù)量不足,從而將一些能夠反映相關(guān)主題的詞語排除在分析范圍外,未來可以對(duì)其他平臺(tái)的數(shù)據(jù)進(jìn)行分析,同時(shí)擴(kuò)大研究樣本量,以期更全面地反映公眾關(guān)注的主題。其次,由于在問題文本處理的過程中涉及關(guān)鍵詞的人工再處理和人工編碼處理,因此具有一定的主觀性,未來可以探究新的處理方式以降低主觀性偏差。再次,由于是利用基于情感詞典的工具對(duì)回答文本進(jìn)行情緒分析,其局限在于只能通過文字表達(dá)判斷其感情,而忽視了語境因素,因此會(huì)產(chǎn)生一定的偏差,未來在情緒分析前可先進(jìn)行語料訓(xùn)練,以期提高類似文本情緒分析的準(zhǔn)確率;此外,未來還可進(jìn)一步探究回答中的情緒對(duì)用戶采納該問答的影響。最后,本研究的數(shù)據(jù)樣本僅涉及了問答內(nèi)容,并未包含用戶信息,后續(xù)可將用戶信息納入研究范圍中,研究不同特征的用戶在關(guān)注主題上的差異。
參考文獻(xiàn)
[1]Zhang J,Chen Y,Zhao Y,et al.Public Health and Social Media:A Study of Zika Virus-related Posts on YahooAnswers[J].Journal of the Association for Information Science and Technology,2020,71(3):282-299.
[2]Bae B J,Yi Y J,Cheung C.What Answers Do Questioners Want on Social Q & A?User Preferences of Answers About STDs[J].Internet Research,2017,27(5):1104-1121.
[3]安璐,歐孟花.突發(fā)公共衛(wèi)生事件利益相關(guān)者的社會(huì)網(wǎng)絡(luò)情感圖譜研究[J].圖書情報(bào)工作,2017,61(20):120-130.
[4]中華人民共和國中央人民政府.習(xí)近平:在中央政治局常委會(huì)會(huì)議研究應(yīng)對(duì)新型冠狀病毒肺炎疫情工作時(shí)的講話[EB/OL].http://www.gov.cn/xinwen/2020-02/15/content_5479271.htm,2020-02-15.
[5]Oh S.The Characteristics and Motivations of Health Answerers for Sharing Information,Knowledge,and Experiences in Online Environments[J].Journal of the American Society for Information Science & Technology,2012,63(3):543-557.
[6]Mcinnes C J,Hornmoen H.‘Add Twitter and Stir:The Use of Twitter By Public Authorities in Norway and UK During the 2014-15 Ebola Outbreak[J].Observatorio,2018,12(2):23-46.
[7]Yi Y J.Sexual Health Information-seeking Behavior on a Social Media Site:Predictors of Best Answer Selection[J].Online Information Review,2018,42(6):880-897.
[8]Westbrook L,Zhang Y.Questioning Strangers About Critical Medical Decisions:“What Happens if You Have Sex Between the HPV Shots?”[J].Information Research,2015,20(2):1-12.
[9]Ji Z,Zhang Y,Xu J,et al.Comparing Cancer Information Needs for Consumers in the US and China[J].Studies in Health Technology and Informatics,2017:126-130.
[10]Alasmari A,Zhou L.How Multimorbid Health Information Consumers Interact in an Online Community Q&A Platform[J].International Journal of Medical Informatics,2019,131:1-5.
[11]Chung J E.Retweeting in Health Promotion:Analysis of Tweets About Breast Cancer Awareness Month[J].Computers in Human Behavior,2017:112-119.
[12]Paskuda M,Lewkowicz M.Anonymity Interacting with Participation on a Q&A Site[J].Ai & Society,2017,32(3):369-381.
[13]鄧勝利,管弦.基于問答平臺(tái)的用戶健康信息獲取意愿影響因素研究[J].情報(bào)科學(xué),2016,34(11):53-59.
[14]于申.在線知識(shí)問答用戶付費(fèi)意愿影響因素研究[D].武漢:武漢大學(xué),2017.
[15]陸泉,劉婷,鄧勝利.基于社會(huì)資本理論的社交問答用戶健康信息行為研究[J].圖書情報(bào)工作,2019,63(17):118-127.
[16]Robillard J M,Whiteley L,Johnson T W,et al.Utilizing Social Media to Study Information-Seeking and Ethical Issues in Gene Therapy[J].Journal of Medical Internet Research,2013,15(3):1-7.
[17]Ohigashi A,Ahmed S,Afzal A R,et al.Breast Cancer Information Communicated on a Public Online Platform:An Analysis of‘Yahoo!Answer Japan[J].Journal of Primary Health care,2017,9(2):167-172.
[18]Kim S,Pinkerton T,Ganesh N,et al.Assessment of H1N1 Questions and Answers Posted on the Web[J].American Journal of Infection Control,2012,40(3):211-217.
[19]Sharon A J,Yomtov E,Baramtsabari A,et al.Vaccine Information Seeking on Social Q&A Services[J].Vaccine,2020,38(12):2691-2699.
[20]Zhang J,Zhao Y,Dimitroff A,et al.A Study on Health Care Consumers'?Diabetes Term Usage Across Identified Categories[C]//Aslib Journal of Information Management,2014,66(4):443-463.
[21]Oh S,Zhang Y,Park M S,et al.Cancer Information Seeking in Social Question and Answer Services.Identifying Health-related Topics in Cancer Questions on Yahoo!Answers[J].Information Research,2016,21(3):1-8.
[22]Cai H,Li Z,Yan C,et al.A Shallow Neural Network Based Short Text Classifier for Medical Community Question Answering System[C]//IEEE International Conference on Cyber Technology in Automation Control and Intelligent Systems,2018:1537-1541.
[23]Paul M J,Dredze M.Discovering Health Topics in Social Media Using Topic Models[J].PLOS ONE,2014,9(8):1-11.
[24]Byrd K,Mansurov A,Baysal O.Mining Twitter Data for Influenza Detection and Surveillance[C]//International Workshop on Software Engineering in Healthcare Systems.ACM,2016:43-49.
[25]Ji X,Chun S A,Geller J,et al.Monitoring Public Health Concerns Using Twitter Sentiment Classifications[C]//IEEE International Conference on Healthcare Informatics,2013:335-344.
[26]Zhao Y X,Cheng S X,Yu X Y,et al.Chinese Public's Attention to the COVID-19 Epidemic on Social Media:Observational Descriptive Study[J].Journal Of Medical Internet Research,2020,22(5):1-8.
[27]Chu S K,Huang H,Wong W N,et al.Quality and Clarity of Health Information on Q&A Sites[J].Library & Information Science Research,2018:237-244.
[28]Oh S,Worrall A.Health Answer Quality Evaluation By Librarians,Nurses,and Users in Social Q&A[J].Library & Information Science Research,2013,35(4):288-298.
[29]Worrall A,Oh S.The Place of Health Information and Socio-emotional Support in Social Questioning and Answering[J].Information Research,2013,18(3):1-26.
[30]Bae B J,Yi Y J.Identification and Comparison of the Persuasive Elements Present in“Best Answers”to STD-Related Questions on Social Q&A Sites:Yahoo!Answers(United States)Versus Knowledge-iN(South Korea)[J].International Journal of Communication,2019,13:2516-2534.
[31]Lee J L,Decamp M,Dredze M,et al.What are Health-related Users Tweeting?A Qualitative Content Analysis of Health-related Users and Their Messages on Twitter[J].Journal of Medical Internet Research,2014,16(10):1-9.
[32]Karahan ,Yürekli A,zcmert R,et al.Who Tweets About Diabetic Foot on Twitter and Which Tweets Are More Attractive?[J].International Journal Of Lower Extremity Wounds,2020,19(3):251-254.
[33]Zhang Z,Bors G.“Less is more”:Mining Useful features from Twitter User Profiles for Twitter User Classification in the Public Health Domain[J].Online Information Review,2019,44(1):213-237.
[34]Qiang X L,Xu P,F(xiàn)ang G,et al.Using the Spike Protein Feature to Predict Infection Risk and Monitor the Evolutionary Dynamic of Coronavirus[J].Infectious Diseases of Poverty,2020,9(1):1-8.
[35]華爾街見聞.知乎官宣用戶數(shù)突破2.2億同比增長102%?商業(yè)化或加速[EB/OL].https://baijiahao.baidu.com/s?id=1619 733215962241212&wfr=spider&for=pc,2018-12-13.
(責(zé)任編輯:孫國雷)