喻國明+馬思源
輿論是“社會的皮膚”,是反映社會形勢的晴雨表。而輿情分析是根據(jù)特定需要,針對社會輿論問題對于相關(guān)數(shù)據(jù)進(jìn)行深層次的思維加工和分析研究,得到相關(guān)結(jié)論的過程。網(wǎng)絡(luò)是當(dāng)下社會輿論的主要載體之一,在互聯(lián)網(wǎng)時(shí)代,尤其是移動互聯(lián)網(wǎng)時(shí)代,大數(shù)據(jù)及大數(shù)據(jù)分析技術(shù)為輿情分析和研判提供了全新的資源、方法與范式。
從總體上說,現(xiàn)階段網(wǎng)絡(luò)輿情分析的基本框架為:信息采集、熱點(diǎn)發(fā)現(xiàn)、熱點(diǎn)評估與熱點(diǎn)跟蹤和分析處理(見圖1)。
由于網(wǎng)絡(luò)輿情數(shù)據(jù)存在著海量、多維度等特點(diǎn),輿情數(shù)據(jù)的深度價(jià)值挖掘一直是這一領(lǐng)域發(fā)展的瓶頸之一。近年來,人工智能技術(shù)的興起與實(shí)用化,為我們借助于人工智能實(shí)現(xiàn)網(wǎng)絡(luò)輿情分析的自動化、智能化、精準(zhǔn)化提供了新的手段和路徑。為此,一些研究者也做出有益的探索,如使用小波分析分解輿論發(fā)展過程,再利用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行建模預(yù)測輿論走向;使用神經(jīng)網(wǎng)絡(luò)仿真模擬輿論發(fā)展過程;使用灰度預(yù)測和模式識別預(yù)測輿論走勢等。
本文試圖在梳理輿情研究的現(xiàn)狀與特點(diǎn)的前提下,探討在現(xiàn)有技術(shù)條件下,網(wǎng)絡(luò)輿情分析的實(shí)踐范式存在的缺陷與不足,而人工智能技術(shù)可以為網(wǎng)絡(luò)輿情分析帶來哪些有應(yīng)用前景的改變。
人工智能提升網(wǎng)絡(luò)輿情分析能力的環(huán)節(jié)
現(xiàn)階段網(wǎng)絡(luò)輿情分析的不足可以主要?dú)w結(jié)為“人機(jī)不協(xié)調(diào)”的問題。在應(yīng)當(dāng)使用機(jī)器進(jìn)行學(xué)習(xí)和處理的權(quán)重配比、走勢預(yù)測、情感分析、效果檢查上,現(xiàn)實(shí)應(yīng)用顯得機(jī)械、淺層次;而在應(yīng)當(dāng)使用人工進(jìn)行分析的特征維度劃分、對策建議提供上,現(xiàn)實(shí)應(yīng)用又顯得粗糙、重復(fù),且機(jī)器對人的輔助不夠有力,分工協(xié)同的模式還不成熟。
得益于數(shù)理算法和計(jì)算機(jī)科學(xué)的發(fā)展,人工智能時(shí)代的機(jī)器學(xué)習(xí)能力日益增強(qiáng),這為網(wǎng)絡(luò)輿情分析領(lǐng)域?qū)崿F(xiàn)自動化、精準(zhǔn)化、智能化創(chuàng)造了新的契機(jī),而實(shí)現(xiàn)新要求的關(guān)鍵點(diǎn)在于切實(shí)實(shí)現(xiàn)網(wǎng)絡(luò)輿情分析領(lǐng)域中的人機(jī)互動與雙向協(xié)同。
1.數(shù)據(jù)預(yù)處理環(huán)節(jié):特征的人工識別與機(jī)器匹配的協(xié)同。
在互聯(lián)網(wǎng)的社交網(wǎng)絡(luò)中充斥著非結(jié)構(gòu)、半結(jié)構(gòu)數(shù)據(jù),數(shù)據(jù)庫需要為這些數(shù)據(jù)提供合適的存儲標(biāo)簽,方便分類和調(diào)用。在數(shù)據(jù)特征分類上,人的作用至關(guān)重要。完全依賴無監(jiān)督的學(xué)習(xí),不僅需要大量數(shù)據(jù)擬合,而且速度慢、容易產(chǎn)生偏差。因此,在最初的特征分類中,可以由人工盡量設(shè)計(jì)較細(xì)的分類,此后通過信息增益等算法,經(jīng)歷半監(jiān)督式機(jī)器學(xué)習(xí)的訓(xùn)練,在分類環(huán)節(jié)可以去除影響力較小的部分,留下影響力較大的部分,在機(jī)器能力支撐下建立合理的特征維度數(shù)量,并賦予權(quán)重。這種特征的構(gòu)建方式更能體現(xiàn)輿情信息的原貌,對現(xiàn)實(shí)的解釋力更強(qiáng)。
2.熱點(diǎn)發(fā)現(xiàn)環(huán)節(jié):話題預(yù)測的機(jī)器提示與人工選擇的協(xié)同。
人工智能是建立在數(shù)理模型和計(jì)算機(jī)支持上的一種應(yīng)用,其內(nèi)核依賴因果邏輯和概率統(tǒng)計(jì)。即使人工智能可以自動探索不同事物之間的關(guān)聯(lián),它判斷是非的方式只能是:第一,A能推導(dǎo)出B,或不能。第二,根據(jù)以往經(jīng)驗(yàn),某事件有多大的概率會發(fā)生。所以,想讓人工智能做出正確的判斷,要么存在必然的因果邏輯,要么有足夠的案例用以輔助統(tǒng)計(jì)。
然而,現(xiàn)實(shí)生活中有許多事物并不真正按照因果邏輯運(yùn)行。很多情況下,人工智能需要依靠概率預(yù)測事物的走向,但又不是任何事情都有足夠的先例可供學(xué)習(xí)。
對輿論的預(yù)測很難按照因果邏輯執(zhí)行,想做到準(zhǔn)確預(yù)測只能先依靠足夠多的、已完結(jié)的輿論話題作為機(jī)器學(xué)習(xí)的對象,尋找它們概率上的特征。憑借之前的這些經(jīng)驗(yàn),將有可能產(chǎn)生重大影響的輿論在萌芽期識別出來,并設(shè)計(jì)回應(yīng)辦法。即便如此,機(jī)器也不可能完全精準(zhǔn)地預(yù)測輿論,在一定范圍內(nèi)的預(yù)測建議中,需要人的智慧進(jìn)行分析判斷,找出真正存在進(jìn)一步發(fā)酵可能的輿論。同時(shí),這樣的人工選擇行為需要完整的記錄,作為機(jī)器進(jìn)一步學(xué)習(xí)的訓(xùn)練集,以供下一次輿論預(yù)測參考。這種人機(jī)互動的模式可以提升機(jī)器學(xué)習(xí)的能力,使人工智能逐步達(dá)到更高水平,更加智能地為人提供輔助。
3.對策分析環(huán)節(jié):專家?guī)斓慕?jīng)驗(yàn)及其量化。
技術(shù)領(lǐng)域公認(rèn),操縱機(jī)器進(jìn)行情感分析,比事實(shí)分析要困難得多。機(jī)器可以通過分詞法、訓(xùn)練集的反復(fù)訓(xùn)練學(xué)會分析句子成分、找到陳說的事實(shí),但對于微妙情感的辨析、反諷修辭的運(yùn)用,機(jī)器極難進(jìn)行判斷。鑒于此,在對輿論進(jìn)行整理、分析和預(yù)測的過程中,人工智能對于事實(shí)的理解能力可以提升到與人類比肩的程度,但對于輿論的情感判斷,機(jī)器恐怕很難達(dá)到人類的理解高度。
在互聯(lián)網(wǎng)時(shí)代,情感是一種十分重要的邏輯,許多互聯(lián)網(wǎng)事件的發(fā)酵、擴(kuò)散,背后都有情感訴求的影子,有時(shí)情感訴求甚至超出理智訴求,成為左右輿論極其重要的一個(gè)因素。因此,在輿情分析的對策環(huán)節(jié)中,梳理的事實(shí)可以由機(jī)器提供,但對策建議始終要依賴專家的經(jīng)驗(yàn)。當(dāng)然,對專家?guī)熘械慕?jīng)驗(yàn)予以量化,可以為類似輿情再出現(xiàn)時(shí)提供輔助建議,逐漸使機(jī)器的智慧能為人類提供更高水平的咨詢意義上的幫助,乃至應(yīng)對一些常見的、并不新穎的輿情危機(jī)——而這類輿情危機(jī)通常占危機(jī)發(fā)生總量的80%以上。
人工智能條件下的網(wǎng)絡(luò)輿情分析新范式
人機(jī)互動是人工智能應(yīng)用于網(wǎng)絡(luò)輿情分析的重要邏輯,結(jié)合現(xiàn)有網(wǎng)絡(luò)輿情分析模式與流程,以及每一環(huán)節(jié)的技術(shù)支持情況,我們提出人工智能技術(shù)支撐下的網(wǎng)絡(luò)輿情分析的新范式。即遵循從現(xiàn)實(shí)問題,到量化建模,再到探索結(jié)論的基本方向,并在每一詳細(xì)環(huán)節(jié)中遵循人機(jī)互動與協(xié)同的原則,對人工智能技術(shù)加以有效應(yīng)用(見圖2)。
應(yīng)該說,人工智能的實(shí)現(xiàn),得益于科學(xué)界量化整個(gè)世界的嘗試??茖W(xué)界試圖構(gòu)建模型來表達(dá)紛繁復(fù)雜的客觀世界,并得到了許多成就。這些成就在一定程度上鼓勵(lì)了“計(jì)算主義”哲學(xué)的發(fā)展,信奉計(jì)算主義的人認(rèn)為世界在極大程度上是可以被量化的,因此,人工智能才能夠比我們想象的更接近人類。顯然,這種信仰并不代表真理,相反,有更多的學(xué)者質(zhì)疑,我們的世界中不能量化的問題遠(yuǎn)遠(yuǎn)多于可以量化的問題?,F(xiàn)代經(jīng)濟(jì)學(xué)、社會學(xué)、政治學(xué)的一些研究也表明,不同于自然法則,在人為世界中,人的復(fù)雜程度遠(yuǎn)超過人類自己的想象和技術(shù)可以完全把握的能力。
因而,唯有人和機(jī)器相互促進(jìn),人的創(chuàng)造力才能被釋放,而非被科技所奴役。人類憑借本身的經(jīng)驗(yàn)、判斷和天賦提出新的理論,解決問題的框架,而人工智能強(qiáng)大的數(shù)據(jù)處理能力和邏輯演繹能力可以為這些新穎的想法提供驗(yàn)證、修正或否定。人機(jī)互動的視角不僅對人工智能條件下的輿情分析具有啟示作用,對所有社會科學(xué)而言,人機(jī)互動也可以成為普遍遵循的解決問題的模式。
參考文獻(xiàn)
1.夏火松、甄化春:《大數(shù)據(jù)環(huán)境下輿情分析與決策支持研究文獻(xiàn)綜述》,《情報(bào)》,2015年第2期,第1-6頁、21頁。
2.舒予、張黎俐:《基于小波分析與人工神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情預(yù)測》, 《情報(bào)科學(xué)》,2016年第4期,第40-47頁。
3.何炎祥、劉健博、孫松濤:《基于神經(jīng)網(wǎng)絡(luò)的微博輿情預(yù)測方法》,《華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版)》,2016年第9期,第47-52頁。
4.杜智濤、謝新洲:《利用灰色預(yù)測與模式識別方法構(gòu)建網(wǎng)絡(luò)輿情預(yù)測與預(yù)警模型》,《圖書館情報(bào)工作》,2013年第8期,第27-33頁。
5.李清敏、張華平:《面向話題的中文微博觀點(diǎn)傾向性分析研究》,《科學(xué)技術(shù)與工程》,2014年第12期,第227-231頁。
6.李英樂、于洪濤、劉力雄:《基于SVM 的微博轉(zhuǎn)發(fā)規(guī)模預(yù)測方法》, 《計(jì)算機(jī)應(yīng)用研究》,2013年第9期,第2594-2597頁。
7.彭蘭:《萬物皆媒——新一輪技術(shù)驅(qū)動的泛媒化趨勢》,《編輯之友》,2016年第3期,第5-10頁。
8.李建會:《走向計(jì)算主義》,《自然辯證法通訊》,2003年第3期,第31-36頁。