高慧
摘要:由于網(wǎng)絡(luò)輿情多維動(dòng)態(tài)實(shí)際分類中,分類結(jié)果與實(shí)際情況存在一定誤差,比值比(odds ratio,OR值)較小,為此提出基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情多維動(dòng)態(tài)分類研究。通過(guò)對(duì)網(wǎng)絡(luò)輿情概念、網(wǎng)絡(luò)輿情特點(diǎn)等進(jìn)行分析,構(gòu)建網(wǎng)絡(luò)輿情多維動(dòng)態(tài)分類指標(biāo)體系、基于大數(shù)據(jù)的事件類型多維度指標(biāo)聚類分析、網(wǎng)絡(luò)輿情數(shù)據(jù)分類判別,提出一種全新的分類方法。通過(guò)對(duì)比實(shí)驗(yàn)證明,該分類方法OR值明顯增加,說(shuō)明網(wǎng)絡(luò)輿情多維動(dòng)態(tài)分類結(jié)果與實(shí)際情況更接近,分類更加精確。
關(guān)鍵詞:大數(shù)據(jù);網(wǎng)絡(luò)輿情;多維;動(dòng)態(tài)分類
中圖分類號(hào):D523? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)14-0015-03
當(dāng)前網(wǎng)絡(luò)技術(shù)的快速發(fā)展,使得網(wǎng)絡(luò)環(huán)境逐漸開(kāi)放,隨著網(wǎng)民數(shù)量的快速增加,產(chǎn)生了一系列由于網(wǎng)民廣泛參與和傳播造成的重大社會(huì)影響事件發(fā)生[1]。一旦突發(fā)事件上傳到網(wǎng)絡(luò)當(dāng)中,極易引發(fā)網(wǎng)民的輿論熱潮。網(wǎng)絡(luò)媒體是自報(bào)紙、廣播、電視之后出現(xiàn)的第四媒體。網(wǎng)絡(luò)已經(jīng)成為反映人類社會(huì)輿情的主要載體[2]。只有在充分把握好事件發(fā)生時(shí)的本體特性和引發(fā)輿論特征之間的關(guān)系,才能夠在輿論發(fā)生及其后續(xù)產(chǎn)生的輿情波動(dòng)方向進(jìn)行更精準(zhǔn)的分析。因此,對(duì)于網(wǎng)絡(luò)輿情的準(zhǔn)確識(shí)別和分類,可以有助于為網(wǎng)絡(luò)恐怖主義的預(yù)防和控制提供實(shí)踐指導(dǎo)?;诖?,本文結(jié)合大數(shù)據(jù)技術(shù),開(kāi)展對(duì)網(wǎng)絡(luò)輿情多維動(dòng)態(tài)分類研究。
1 網(wǎng)絡(luò)輿情分析
1.1 網(wǎng)絡(luò)輿情概念
網(wǎng)絡(luò)輿情可以看作是,在各類事件發(fā)生后,通過(guò)互聯(lián)網(wǎng)形式的傳播,使得群眾對(duì)此次事件的所有認(rèn)知、態(tài)度等言論的集合[3]。在網(wǎng)絡(luò)輿情爆發(fā)的初級(jí)階段,由于發(fā)布言論者的身份在網(wǎng)絡(luò)中是隱蔽的,因此網(wǎng)絡(luò)平臺(tái)在發(fā)帖的過(guò)程中缺乏對(duì)內(nèi)容的合理監(jiān)督,網(wǎng)絡(luò)平臺(tái)成為網(wǎng)民發(fā)泄情緒、溝通交流的空間環(huán)境[4]。在現(xiàn)實(shí)生活當(dāng)中,人們可以通過(guò)網(wǎng)絡(luò)與他人進(jìn)行溝通和交流,因此在網(wǎng)絡(luò)環(huán)境中,極易出現(xiàn)各類不同的言論內(nèi)容。這些信息會(huì)在網(wǎng)民集聚的互聯(lián)網(wǎng)絡(luò)中得到迅速地傳播,從而使新的網(wǎng)民在群體效應(yīng)下,加入傳播輿情的隊(duì)伍當(dāng)中,從而使輿情的影響范圍進(jìn)一步擴(kuò)大,不僅在極大程度上影響著社會(huì)平穩(wěn)發(fā)展的秩序,同時(shí)還會(huì)增加網(wǎng)絡(luò)管理部門對(duì)網(wǎng)絡(luò)輿情處理難度。
1.2 網(wǎng)絡(luò)輿情特點(diǎn)
結(jié)合可視化分析軟件,將網(wǎng)絡(luò)中進(jìn)行傳播的關(guān)鍵詞匯,屏蔽詞頻為10以下的內(nèi)容,得到如圖1所示的網(wǎng)絡(luò)輿論關(guān)鍵詞可視化圖譜示意圖。
當(dāng)前網(wǎng)絡(luò)輿情的特點(diǎn)可從圖1中六個(gè)角度分析。圖中A區(qū)域主要從信息學(xué)的角度對(duì)網(wǎng)絡(luò)輿情當(dāng)前發(fā)展過(guò)程中的潛伏期、擴(kuò)散期和消退期進(jìn)行分析;圖中B區(qū)域從新聞傳播學(xué)角度,對(duì)網(wǎng)絡(luò)輿情的特征度進(jìn)行打分并分析;C區(qū)域是從心理學(xué)角度出發(fā);D區(qū)域是從政治學(xué)角度分析;E區(qū)域是從社會(huì)學(xué)角度出發(fā);F區(qū)域是從計(jì)算機(jī)角度出發(fā)。通過(guò)六種不同角度,得出網(wǎng)絡(luò)輿論具備多元性、自由性、交互性、偏差性和突發(fā)性等特點(diǎn)[5-6]。
2 基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情多維動(dòng)態(tài)分類方法
2.1 構(gòu)建網(wǎng)絡(luò)輿情多維動(dòng)態(tài)分類指標(biāo)體系
本文根據(jù)網(wǎng)絡(luò)輿情的自身特點(diǎn)以及具體變化規(guī)律,遵循公正性的原則,從事件發(fā)生類型和輿情特征兩個(gè)維度上,確定網(wǎng)絡(luò)輿情多維動(dòng)態(tài)分類指標(biāo)[7]。結(jié)合k-means聚類分析軟件,將事件發(fā)生類型分為以下三種:常態(tài)特征指標(biāo)中包含的不同主體其行為準(zhǔn)則與社會(huì)容忍度均不相同;事件客體是具有一定知名度或一定社會(huì)地位的人群,在社會(huì)當(dāng)中具備更高的關(guān)注度;異常特征是在常態(tài)特征的基礎(chǔ)上,與同類型事件相比具備的特征點(diǎn);網(wǎng)絡(luò)信息特征主要用于描述網(wǎng)絡(luò)輿情在爆發(fā)時(shí)所處的環(huán)境特征。
將輿情特征分為以下兩種:信息敘述形式特征主要用于描述網(wǎng)絡(luò)輿情的質(zhì)量指標(biāo);信息傳播方式特征主要用于衡量網(wǎng)絡(luò)輿情在傳播過(guò)程中的具體規(guī)模和爆發(fā)速度。
2.2 基于大數(shù)據(jù)的事件類型多維度指標(biāo)聚類分析
將上述各項(xiàng)指標(biāo)量化作為觀測(cè)值,并進(jìn)行聚類分析得到聚類統(tǒng)計(jì)量。假設(shè)當(dāng)前共有x個(gè)網(wǎng)絡(luò)輿情案例,結(jié)合大數(shù)據(jù)技術(shù),采用SPSS2.0版進(jìn)行聚類計(jì)算。首先,將所有涉及的x個(gè)網(wǎng)絡(luò)輿情案例分析出其對(duì)應(yīng)的特征值[8]。其次,每項(xiàng)特征值分別進(jìn)行量化,利用k-means對(duì)所有網(wǎng)絡(luò)輿情案例進(jìn)程列表進(jìn)行合并,最終以譜系圖形式輸出。將各個(gè)指標(biāo)按照不同的特征值進(jìn)行分類,對(duì)事件類型多維度指標(biāo)聚類可利用如下公式表達(dá):
[δ(l)=p(l)p(m+χn)/p(a)]? ? ? ? ? ? ? ? ? (1)
公式(1)中,[δ(l)]為多維度指標(biāo)相度,l的取值范圍為l=1,2,3,...,x ;[p(a)]為多維度指標(biāo)的聚類系數(shù);[p(l)]為網(wǎng)絡(luò)輿情中待分類的多維度指標(biāo)個(gè)數(shù);[p(m+χn)]為相關(guān)指標(biāo)個(gè)數(shù)。解讀輸出結(jié)果,合并相關(guān)性大的屬性,根據(jù)特征值確定譜系圖的分類距離,得到最終的分類方案[9]。
2.3 網(wǎng)絡(luò)輿情數(shù)據(jù)分類判別
在完成對(duì)事件類型多維度指標(biāo)聚類分析后,還需要將所有網(wǎng)絡(luò)輿情案例的事件類型特征進(jìn)行量化處理,并以每個(gè)案例具備的不同屬性作為觀測(cè)數(shù)值判別分析的統(tǒng)計(jì)量。具體操作步驟為:首先,對(duì)特征值進(jìn)行量化處理,并將量化結(jié)果存儲(chǔ)在案例庫(kù)當(dāng)中。其次,將案例庫(kù)當(dāng)中的案例按照上述聚類方式進(jìn)行分類,對(duì)分類結(jié)果依次按照A、B、C、D等命名,將實(shí)施案例的組別設(shè)置為“3”,即3組為空白變量組,采用分析—計(jì)算—判別的方式,將其他分組變量的組別分別送入相應(yīng)位置,并點(diǎn)擊定義范圍,填入從1到最大的分組數(shù)[10]。再次,將變量全部放入到獨(dú)立分組框當(dāng)中,將實(shí)施案例的特征值選入選擇變量,并單擊分類。利用網(wǎng)絡(luò)輿情案例及數(shù)據(jù)處理摘要表,查看有效處理的案例內(nèi)容;利用特征值表,查看描述分類方案中具體指標(biāo)的判別力;利用判別系數(shù)表,查看用于分析的判別系數(shù);利用分類圖,查看描述聚類結(jié)果。
3 實(shí)驗(yàn)驗(yàn)證分析
3.1 實(shí)驗(yàn)條件
實(shí)驗(yàn)隨機(jī)選取中華網(wǎng)輿情案例庫(kù)中的10個(gè)輿情案例為實(shí)驗(yàn)對(duì)象,利用此次設(shè)計(jì)方法與傳統(tǒng)方法對(duì)該10個(gè)輿情案例進(jìn)行多維動(dòng)態(tài)分類。首先根據(jù)表一對(duì)各個(gè)輿情的主體、客體、時(shí)間類型進(jìn)行劃分;然后對(duì)輿情的多項(xiàng)指標(biāo)進(jìn)行聚類分析,設(shè)置輿情案例特征值,將特征值輸入到spss,并利用公式(1)計(jì)算多維指標(biāo)相度,表1為輿情案例特征值及多維指標(biāo)相度值。
根據(jù)表1內(nèi)容為各個(gè)輿情案例數(shù)據(jù)判別分析,得到最終的分析結(jié)果。比較分析結(jié)果與實(shí)際值,利用GJIF軟件計(jì)算出OR值,OR值大于1,則說(shuō)明分析結(jié)果與實(shí)際情況相符,OR值小于1,則說(shuō)明分析結(jié)果與實(shí)際情況不符。將OR值作為實(shí)驗(yàn)結(jié)果,對(duì)兩種分析方法對(duì)比。
3.2 實(shí)驗(yàn)結(jié)果解讀
實(shí)驗(yàn)根據(jù)OR值結(jié)算結(jié)果,對(duì)兩種方法進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果如表2所示。
從上表可以看出,此次設(shè)計(jì)方法OR值均大于1,平均值為1.624,而傳統(tǒng)方法OR值平均值為0.681,十個(gè)網(wǎng)絡(luò)輿情多維動(dòng)態(tài)分析,僅有兩個(gè)案例分析結(jié)果與實(shí)際相符,因此實(shí)驗(yàn)證明了此次設(shè)計(jì)的基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情多維動(dòng)態(tài)分析在準(zhǔn)確性方面優(yōu)于傳統(tǒng)方法。
4 結(jié)束語(yǔ)
本文結(jié)合大數(shù)據(jù)技術(shù),設(shè)計(jì)了一套新的網(wǎng)絡(luò)輿情多維動(dòng)態(tài)分類方法,并通過(guò)實(shí)驗(yàn)驗(yàn)證了該分類方法具有良好的可行性和適用性,有助于實(shí)現(xiàn)復(fù)雜的網(wǎng)絡(luò)輿情問(wèn)題數(shù)字化,為網(wǎng)絡(luò)輿情分析提供有利數(shù)據(jù)依據(jù)。但是此次研究尚且存在一些不足之處,從網(wǎng)絡(luò)輿情發(fā)展的潛伏規(guī)律來(lái)看,建立的指標(biāo)體系不夠全面,在該方面還有待完善。
參考文獻(xiàn):
[1] 張京坤,王怡怡.基于Spark的均值漂移算法在網(wǎng)絡(luò)輿情聚類中的應(yīng)用[J].軟件導(dǎo)刊,2020,19(9):190-195.
[2] 王晰巍,邢云菲,韋雅楠,等.大數(shù)據(jù)驅(qū)動(dòng)的社交網(wǎng)絡(luò)輿情用戶情感主題分類模型構(gòu)建研究——以“移民”主題為例[J].信息資源管理學(xué)報(bào),2020,10(1):29-38,48.
[3] 胡欣杰,路川,齊斌.基于SOM神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情信息分類模型[J].兵器裝備工程學(xué)報(bào),2019,40(3):108-111.
[4] 賈隆嘉,張邦佐.高校網(wǎng)絡(luò)輿情安全中主題分類方法研究——以新浪微博數(shù)據(jù)為例[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2018,2(7):55-62.
[5] 杜少波.基于Hadoop平臺(tái)的并行kNN網(wǎng)絡(luò)輿情分類算法[J].電視技術(shù),2018,42(3):58-62.
[6] 穆亭鈺.媒介融合與網(wǎng)絡(luò)輿情的多維生成——基于“視覺(jué)中國(guó)”事件的樣本考察[J].視聽(tīng),2020(6):185-187.
[7] 夏立新,陳健瑤,余華娟.基于事理圖譜的多維特征網(wǎng)絡(luò)輿情事件可視化摘要生成研究[J].情報(bào)理論與實(shí)踐,2020,43(10):157-164.
[8] 陳思詩(shī).新冠肺炎疫情公共危機(jī)事件網(wǎng)絡(luò)輿情治理的多維審視[J].西部學(xué)刊,2020(9):131-133.
[9] 畢宏音.網(wǎng)絡(luò)輿情的基本共識(shí)及其動(dòng)態(tài)規(guī)律再認(rèn)識(shí):多維視角考察[J].重慶社會(huì)科學(xué),2019(1):6-16.
[10] 連芷萱,蘭月新,夏一雪,等.面向大數(shù)據(jù)的網(wǎng)絡(luò)輿情多維動(dòng)態(tài)分類與預(yù)測(cè)模型研究[J].情報(bào)雜志,2018,37(5):123-133,140.
【通聯(lián)編輯:張薇】