李淑平
(中央民族大學(xué) 少數(shù)民族語言文學(xué)系,北京 100081)
面向網(wǎng)絡(luò)輿情監(jiān)測(cè)的新聞主題分類實(shí)證分析
李淑平
(中央民族大學(xué) 少數(shù)民族語言文學(xué)系,北京 100081)
本文采用由面到點(diǎn)、逐步聚焦的方法探討了面向網(wǎng)絡(luò)輿情監(jiān)測(cè)的新聞主題分類、網(wǎng)民的關(guān)注焦點(diǎn)和網(wǎng)民對(duì)事件的情感傾向問題,對(duì)這些問題的研究對(duì)網(wǎng)絡(luò)輿情管理將產(chǎn)生積極作用。
網(wǎng)絡(luò)輿情;主題分類;關(guān)注焦點(diǎn);情感傾向
隨著信息化時(shí)代的到來,網(wǎng)絡(luò)上出現(xiàn)了海量的信息,各種重大新聞、熱點(diǎn)事件等在網(wǎng)絡(luò)上迅速傳播,而由新聞事件所引發(fā)的網(wǎng)絡(luò)輿情也隨之大量涌現(xiàn),網(wǎng)絡(luò)輿情已經(jīng)成為國(guó)家了解社會(huì)輿情的重要渠道。網(wǎng)絡(luò)輿情多數(shù)情況下是在某一新聞事件的觸發(fā)下產(chǎn)生的,對(duì)網(wǎng)絡(luò)輿情進(jìn)行分析研判,首先需要對(duì)引發(fā)輿情的新聞事件構(gòu)建科學(xué)的分類體系。
目前,關(guān)于網(wǎng)絡(luò)輿情主題分類的研究成果并不多,按分類的領(lǐng)域可將其分為兩類。一是面向通用領(lǐng)域的網(wǎng)絡(luò)輿情主題分類。這類成果是面向整體網(wǎng)絡(luò)輿情的主題分類,如丁兆云[1]在其文中將輿情主題分為了三級(jí)指標(biāo),其中,一級(jí)指標(biāo)有五類,分別是公共安全、自然災(zāi)害、公共衛(wèi)生、重大事故、重大活動(dòng)。在一級(jí)指標(biāo)下又進(jìn)一步細(xì)分為二級(jí)、三級(jí)指標(biāo),如公共安全又分為社會(huì)安全和經(jīng)濟(jì)安全兩類;在社會(huì)安全下又細(xì)分為恐怖襲擊、軍事斗爭(zhēng)、民族宗教事件三類。再如,楊永軍[2]在其文中將輿情主題分為國(guó)際和國(guó)內(nèi)兩大類。國(guó)際又分為政經(jīng)、文化、軍事、反恐、公共、自然和其他領(lǐng)域幾個(gè)方面;國(guó)內(nèi)又分為公權(quán)力、政治與社會(huì)問題、公共領(lǐng)域、私權(quán)利幾個(gè)方面,且每個(gè)類別下又有更具體的分類。還有,李雯靜等[3]在其文中提到了兩個(gè)參考體系,分別是美國(guó)“聯(lián)邦政府組織架構(gòu)”中的業(yè)務(wù)參考模型BRM(Business Reference Model)和我國(guó)TRS政府信息公開目錄服務(wù)平臺(tái)中參考分類體系中的主題分類。此外,戴媛等[4]在文中將輿情信息分為了14大類,分別是社會(huì)經(jīng)濟(jì)、政府管理、自然災(zāi)害、公共衛(wèi)生、重大事故災(zāi)害、社會(huì)公共安全、教育、醫(yī)療、三農(nóng)、交通、和諧社會(huì)、重大活動(dòng)、勞動(dòng)就業(yè)、社會(huì)保障類,并下設(shè)有更詳細(xì)的二級(jí)類目。二是面向特定領(lǐng)域的網(wǎng)絡(luò)輿情主題分類。有些學(xué)者根據(jù)某一領(lǐng)域網(wǎng)絡(luò)輿情研究的需要,針對(duì)特定領(lǐng)域?qū)W(wǎng)絡(luò)輿情進(jìn)行主題分類。如鄧尚民等[5]在其文中將高校網(wǎng)絡(luò)輿情分為7類,分別是時(shí)事政治、社會(huì)民生、高校內(nèi)部管理、高校安全、大學(xué)生權(quán)益、高校聲譽(yù)和學(xué)生心理健康。再如,陸瑞[6]在其文中將水利工程領(lǐng)域分為工程論證與規(guī)劃、工程建設(shè)與管理、工程效益、工程評(píng)價(jià)、工程文化五個(gè)方面。此外,談國(guó)新等[7]在其文中將突發(fā)公共事件輿情信息分為生存危機(jī)、公共安全、分配差距、腐敗現(xiàn)象、時(shí)政、法治6大類。
目前關(guān)于網(wǎng)絡(luò)輿情主題分類的研究主要存在以下兩個(gè)問題:一是參考標(biāo)準(zhǔn)少。研究成果大多數(shù)是根據(jù)作者的主觀經(jīng)驗(yàn)對(duì)網(wǎng)絡(luò)輿情進(jìn)行主題分類,而較少參考相應(yīng)的國(guó)家標(biāo)準(zhǔn)等,各家自成一言、差別較大,帶來了主題分類的主觀性。二是缺少實(shí)證方法。在構(gòu)建網(wǎng)絡(luò)輿情主題分類體系的過程中,缺少依據(jù)客觀語料和客觀數(shù)據(jù)的實(shí)證方法,影響了網(wǎng)絡(luò)輿情主題分類的實(shí)用性和針對(duì)性。
(一)主題分類的原則
針對(duì)目前網(wǎng)絡(luò)輿情主題分類研究中的不足,本文認(rèn)為面向網(wǎng)絡(luò)輿情監(jiān)測(cè)的新聞主題分類需要遵循以下原則:
1.科學(xué)性和權(quán)威性。面向網(wǎng)絡(luò)輿情監(jiān)測(cè)的新聞主題分類體系是對(duì)新聞事件科學(xué)分類的依據(jù),因此,分類體系必須具有科學(xué)性和權(quán)威性。
2.針對(duì)性和實(shí)用性。面向網(wǎng)絡(luò)輿情監(jiān)測(cè)的新聞主題分類是為網(wǎng)絡(luò)輿情監(jiān)測(cè)服務(wù)的,因此,構(gòu)建的分類體系不需要過于全面和翔實(shí),關(guān)鍵是要能夠反映網(wǎng)絡(luò)輿情監(jiān)測(cè)的重點(diǎn)領(lǐng)域和網(wǎng)民關(guān)注的焦點(diǎn)問題,主題分類體系要具有針對(duì)性和實(shí)用性。
(二)主題分類的方法
依據(jù)以上提出的分類原則,本文參考了我國(guó)的政務(wù)信息資源目錄體系[8]和中文新聞信息分類的國(guó)家標(biāo)準(zhǔn),[9]將這兩個(gè)分類體系進(jìn)行綜合比較發(fā)現(xiàn),這兩個(gè)分類體系大的類目基本一致,但中文新聞信息分類的類目更為全面。因此,本文的一級(jí)類目主要參考了中文新聞信息分類的一級(jí)類目,共24類,分別是政治、法律、司法、對(duì)外關(guān)系、國(guó)際關(guān)系、軍事、社會(huì)、勞動(dòng)、災(zāi)難、事故、經(jīng)濟(jì)、財(cái)政、金融、基本建設(shè)、建筑業(yè)、房地產(chǎn)、農(nóng)業(yè)、農(nóng)村、礦業(yè)、工業(yè)、能源、水務(wù)、水利、電子信息產(chǎn)業(yè)、通運(yùn)輸、郵政、物流、商業(yè)、外貿(mào)、海關(guān)、服務(wù)業(yè)、旅游業(yè)、環(huán)境、氣象、教育、科學(xué)技術(shù)、文化、休閑娛樂、文學(xué)、藝術(shù)、傳媒、醫(yī)藥、衛(wèi)生、體育。但由于中文新聞信息分類的二級(jí)、三級(jí)類目,過于全面和詳細(xì),且針對(duì)性不強(qiáng),因此,其并不適合面向網(wǎng)絡(luò)輿情監(jiān)測(cè)的新聞主題分類。新聞主題分類在進(jìn)一步構(gòu)建下級(jí)類目的過程中,需要遵循針對(duì)性和實(shí)用性的原則,體現(xiàn)網(wǎng)民重點(diǎn)關(guān)注的領(lǐng)域和焦點(diǎn)問題,通過由面到點(diǎn)、逐步聚焦的方法構(gòu)建分類體系。
由以上分析可知,要進(jìn)一步構(gòu)建主題分類的下級(jí)類目,首先需要挖掘網(wǎng)民重點(diǎn)關(guān)注的領(lǐng)域和焦點(diǎn)問題。本文采用實(shí)證的方法以實(shí)際的語料和客觀數(shù)據(jù)對(duì)這一問題進(jìn)行了深入分析。
(一)語料來源
本文所用語料為從數(shù)據(jù)堂網(wǎng)站下載的49000篇新聞?wù)Z料,其中每一篇語料都有網(wǎng)民對(duì)該事件的情感反應(yīng)投票數(shù)據(jù),包括投票總數(shù)和8類情緒的投票比例。如新聞事件“如此惡警!省道時(shí)速破百撞死夜大生”,網(wǎng)民投票數(shù)為15956。其中,網(wǎng)民認(rèn)為實(shí)用的投票數(shù)為1%;感人的投票數(shù)為0%;開心的投票數(shù)為1%;超扯的投票數(shù)為5%;無聊的投票數(shù)為0%;害怕的投票數(shù)為0%;難過的投票數(shù)為5%;火大的投票數(shù)為88%。
(二)語料處理
本文首先使用python語言編寫程序,將49000篇新聞?wù)Z料的新聞標(biāo)題、投票數(shù)和8類情緒的投票比例數(shù)據(jù)從文本中抽取出來,然后將抽取的信息、數(shù)據(jù)在excel表格中根據(jù)投票數(shù)由高到低的順序進(jìn)行排序,并將排名前50位的新聞,根據(jù)中文新聞信息分類的一級(jí)類目進(jìn)行了類別標(biāo)注。
(三)新聞?wù)Z料類別的統(tǒng)計(jì)分析
通過對(duì)語料類別的統(tǒng)計(jì)分析,我們發(fā)現(xiàn)新聞事件的類別主要集中在政治,法律、司法,社會(huì)、勞動(dòng)和災(zāi)難事故四個(gè)類目中。政治類新聞?dòng)?0個(gè),法律、司法類新聞?dòng)?1個(gè),社會(huì)、勞動(dòng)類新聞?dòng)?2個(gè),災(zāi)難事故類新聞?dòng)?個(gè)。按類別數(shù)由多到少的順序是社會(huì)、勞動(dòng)〉法律、司法〉政治〉災(zāi)難事故。因此,從網(wǎng)絡(luò)輿情監(jiān)測(cè)的角度來說,這些領(lǐng)域應(yīng)該是重點(diǎn)關(guān)注的領(lǐng)域。
(四)網(wǎng)民關(guān)注焦點(diǎn)分析
為了進(jìn)一步聚焦網(wǎng)民的關(guān)注點(diǎn),我們通過對(duì)新聞內(nèi)容的分析,對(duì)以上新聞事件數(shù)量最多的四個(gè)領(lǐng)域進(jìn)行了更深入的分析。
1.政治領(lǐng)域。在政治領(lǐng)域,網(wǎng)民關(guān)注的焦點(diǎn)有: (1)關(guān)于政府、領(lǐng)導(dǎo)人等的負(fù)面新聞,如政府無能、官員腐敗等問題。(2)關(guān)于政府、領(lǐng)導(dǎo)人等的正面新聞,如領(lǐng)導(dǎo)人廉潔自律,政績(jī)卓著等事跡。(3)和民眾切身利益相關(guān)的問題,如社會(huì)保障、社會(huì)分配不公等問題。
2.法律、司法領(lǐng)域。在法律、司法領(lǐng)域網(wǎng)民關(guān)注的焦點(diǎn)有:(1)違背倫理道德的犯罪問題。(2)貪污、腐敗類犯罪問題。(3)犯罪手段特別殘忍的問題,如傷害未成年人的犯罪等。(4)存在爭(zhēng)議的問題,如是否廢除死刑的問題等。
3.社會(huì)、勞動(dòng)領(lǐng)域。在社會(huì)、勞動(dòng)領(lǐng)域網(wǎng)民關(guān)注的焦點(diǎn)有:(1)正面社會(huì)行為,如保護(hù)弱勢(shì)群體、救助行為、勵(lì)志事跡等。(2)反面社會(huì)行為,如以貌取人、不孝、婚外情等社會(huì)不良行為。(3)勞動(dòng)者權(quán)益問題,如損害員工利益等行為。(4)離奇事件,生活中一些不合常理的事件往往可以滿足民眾的獵奇心理,因此也常常引起民眾的極大關(guān)注,如“雞報(bào)恩”等離奇事件。
4.災(zāi)難事故類。在災(zāi)難事故類中網(wǎng)民關(guān)注的焦點(diǎn)有:
(1)災(zāi)難事故中的正面行為,如“市長(zhǎng)車禍現(xiàn)場(chǎng)搬車救人”“白衣天使車禍現(xiàn)場(chǎng)救人”等。(2)災(zāi)難事故中的反面行為,如“警察超速撞死夜大生”“撞女童還踹人”等。(3)世界末日危機(jī),這類特殊的災(zāi)難因關(guān)系著全人類的安危,容易引起民眾的極大恐慌而成為關(guān)注的焦點(diǎn)。如“世界末日將于本世紀(jì)降臨,人類將遭毀滅”等新聞。(4)災(zāi)難后果嚴(yán)重的事件。災(zāi)難后果嚴(yán)重的事件容易引起民眾的憐憫、同情與恐慌,因此,災(zāi)難事故的后果越嚴(yán)重,網(wǎng)民的關(guān)注度往往就會(huì)越高。
(五)新聞事件性質(zhì)和網(wǎng)民情感傾向分析
為了進(jìn)一步分析網(wǎng)民的行為和情感傾向特征,本文對(duì)新聞事件的性質(zhì)進(jìn)行了統(tǒng)計(jì)分析,發(fā)現(xiàn)負(fù)面的事件有26個(gè),正面的事件有11個(gè),中性的事件有13個(gè),網(wǎng)民關(guān)注的負(fù)面事件數(shù)量最多,占了52%的比例,這說明負(fù)面事件更容易引起網(wǎng)民的關(guān)注。因此,在網(wǎng)絡(luò)輿情監(jiān)測(cè)中相關(guān)人員應(yīng)更加重視各領(lǐng)域的負(fù)面事件。而通過對(duì)網(wǎng)民情感投票的分析,我們發(fā)現(xiàn),對(duì)于正面的新聞事件,網(wǎng)民的投票大多數(shù)是“感動(dòng)”或“開心”;對(duì)于負(fù)面的新聞事件,網(wǎng)民的投票大多數(shù)是“火大”;而對(duì)于比較離奇的事件,網(wǎng)民的投票大多數(shù)是“超扯”,其情感傾向和事件的性質(zhì)呈正相關(guān)關(guān)系,一般情況下網(wǎng)民支持、欽佩正義的行為而痛恨、鄙視違法犯罪或社會(huì)不良行為;而對(duì)于離奇的事件,大多數(shù)網(wǎng)民也抱著理性的態(tài)度,沒有表現(xiàn)出明顯的情感傾向;從感情強(qiáng)度和危害程度上來說,負(fù)面事件和負(fù)面情緒應(yīng)是網(wǎng)絡(luò)輿情監(jiān)測(cè)的重點(diǎn)。
本文通過對(duì)49000篇標(biāo)注新聞?wù)Z料的處理分析,通過由面到點(diǎn)、逐步聚焦的方法總結(jié)了網(wǎng)民關(guān)注的四大領(lǐng)域。并且,本文分析了各領(lǐng)域內(nèi)網(wǎng)民關(guān)注的焦點(diǎn)問題和網(wǎng)民的情感傾向問題,初步總結(jié)出一些規(guī)律性的特點(diǎn)和認(rèn)識(shí),對(duì)于構(gòu)建面向網(wǎng)絡(luò)輿情監(jiān)測(cè)的主題分類,把握網(wǎng)絡(luò)輿情中的重點(diǎn)、關(guān)鍵點(diǎn),及時(shí)了解輿情動(dòng)向都會(huì)產(chǎn)生積極的作用。但本文分析的數(shù)據(jù)規(guī)模較小,研究結(jié)論還需進(jìn)一步完善和驗(yàn)證,筆者今后將在更大規(guī)模數(shù)據(jù)的基礎(chǔ)上總結(jié)更一般、全面的結(jié)論。
[1] 丁兆云.互聯(lián)網(wǎng)多維層次式輿情指數(shù)若干計(jì)算方法的研究與實(shí)現(xiàn)[D].國(guó)防科學(xué)技術(shù)大學(xué),2008.
[2] 楊永軍.社會(huì)輿情監(jiān)測(cè)與預(yù)警的指標(biāo)體系研究[J].現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào)),2014(09):63-71.
[3] 李雯靜,許鑫,陳正權(quán).網(wǎng)絡(luò)輿情指標(biāo)體系設(shè)計(jì)與分析[J].情報(bào)科學(xué),2009(07):986-991.
[4] 戴媛,郝曉偉,郭巖,余智華.我國(guó)網(wǎng)絡(luò)輿情安全評(píng)估指標(biāo)體系的構(gòu)建研究[J].信息網(wǎng)絡(luò)安全,2010(04):12-15.
[5] 鄧尚民,董亞倩.基于AHP的高校網(wǎng)絡(luò)輿情安全評(píng)估指標(biāo)體系構(gòu)建研究[J].情報(bào)雜志,2012(08):31-36.
[6] 陸瑞.水利工程輿情分析模型及指標(biāo)體系設(shè)計(jì)[D].華中科技大學(xué),2011.
[7] 談國(guó)新,方一.突發(fā)公共事件網(wǎng)絡(luò)輿情監(jiān)測(cè)指標(biāo)體系研究[J].華中師范大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2010(03):66-70.
[8] GB/T 21063.4-2007,政務(wù)信息資源目錄體系(第4部分,政務(wù)信息資源分類)[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2008:7-27.
[9] GB/T 20093-2013,中文新聞信息分類與代碼[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2014:7.
G206
A
1674-8883(2016)23-0026-02
本論文為中央民族大學(xué)一流大學(xué)一流學(xué)科經(jīng)費(fèi)資助
李淑平(1980—),中央民族大學(xué)博士在讀,研究方向:計(jì)算語言學(xué)。