詹 騫 趙冰潔
伴隨新型冠狀病毒的爆發(fā),一場(chǎng)聲勢(shì)浩大的“信疫”(infodemic)也幾近同時(shí)席卷全球,根據(jù)世界衛(wèi)生組織的定義,“信疫”是指“信息過(guò)多——有些準(zhǔn)確而有些不準(zhǔn)確——這使得人們?cè)谛枰獣r(shí)難以找到可信賴的來(lái)源和可靠的指南”①。該詞的誕生可以追溯至嚴(yán)重急性呼吸系統(tǒng)綜合癥(SARS)疫情爆發(fā)時(shí)期,大量真假混雜信息使公眾陷入集體焦慮,而真相“失聲”對(duì)政治經(jīng)濟(jì)領(lǐng)域造成的危害于當(dāng)時(shí)已然顯露。如今面對(duì)情形更加嚴(yán)峻的新冠肺炎疫情,諸多真?zhèn)文娴男畔⒃诟黝惼脚_(tái)上的快速擴(kuò)散強(qiáng)化了人們的焦慮情緒,也加重了“信疫”的規(guī)模與危害。
追究此次“信疫”爆發(fā)的根源,新冠肺炎疫情自身的嚴(yán)重性無(wú)疑是其中推動(dòng)力之一,但最重要的還是整個(gè)社會(huì)的傳播格局早已今非昔比。②傳統(tǒng)媒體的影響力在一定程度上減弱,而相對(duì)疏于監(jiān)管審查的各類社交媒體平臺(tái)成為主流,多元發(fā)聲路徑造成的信息混雜以及不斷被建構(gòu)的信息過(guò)濾泡等都在加劇信息識(shí)別的難度。社交媒體在流量為王的逐利性傳播邏輯引導(dǎo)下,大量推薦娛樂(lè)化、淺表化的內(nèi)容,用戶感官長(zhǎng)期接觸淺層次的信息刺激,導(dǎo)致其對(duì)部分主流嚴(yán)肅內(nèi)容和公共議題的認(rèn)知和理解能力缺乏。③由是,整體信息環(huán)境的理性客觀被弱化,虛假信息進(jìn)而泛濫。
根據(jù)一項(xiàng)基于2006年至2017年間Twitter上約12.6萬(wàn)個(gè)經(jīng)過(guò)驗(yàn)證的信息的研究,各個(gè)類別的虛假信息都有著較真實(shí)信息明顯更快的傳播力與更深的影響力。④而在諸類信息中,相對(duì)于財(cái)經(jīng)信息、科技信息、體育信息等,健康信息是大眾的剛性需求⑤,公眾對(duì)健康議題關(guān)注度的不斷提升促發(fā)了此類信息在網(wǎng)絡(luò)上的產(chǎn)生與傳播。相較于真實(shí)信息,健康類虛假信息借助其更高的情感性⑥、更強(qiáng)的煽動(dòng)性和匹配度⑦,往往會(huì)有更大的傳播影響力和更嚴(yán)重的破壞力,亟待治理。但海量的信息治理已并非簡(jiǎn)單人力監(jiān)管與審查所能解決,技術(shù)的底層參與是必不可少的治理手段。這也正是此次研究的出發(fā)點(diǎn),以跨學(xué)科的視野對(duì)虛假信息的算法設(shè)計(jì)與算法治理效果進(jìn)行探索,試圖從微觀層面觀察算法治理的功效進(jìn)而探討以此為核心開(kāi)展協(xié)同治理的可能性。
數(shù)字技術(shù)的弊端在當(dāng)下不斷顯露,虛假信息、數(shù)據(jù)安全、隱私泄露等成為全球各國(guó)共同關(guān)注的問(wèn)題,數(shù)字治理(digital governance)即是針對(duì)這一情形提出的共識(shí)性方案,其治理主體由政府、市民和企業(yè)構(gòu)成。⑧在企業(yè)層面,對(duì)虛假信息的人工監(jiān)管是一種有效手段,但同時(shí)更高效的方案,即算法治理(algorithmic governance)逐漸成為數(shù)字治理體系中具有核心地位和決定意義的子體系。⑨
當(dāng)前的算法治理以社交平臺(tái)為中心劃分為內(nèi)部與外部?jī)煞N邏輯,分別指向虛假信息進(jìn)入傳播之前和進(jìn)入流通之后的治理邏輯。在內(nèi)部算法治理方面,由于社交平臺(tái)算法對(duì)流量的追求,信息生成后并不會(huì)立刻進(jìn)入快速傳播階段,而是會(huì)進(jìn)入冷啟動(dòng)階段,隨后依據(jù)內(nèi)容的反饋情況來(lái)決定是否予以進(jìn)一步大量推薦。在此過(guò)程中,算法便可盡早對(duì)內(nèi)容的真實(shí)性進(jìn)行識(shí)別。目前采用的相關(guān)措施包括識(shí)別虛假信息中的高頻關(guān)鍵詞、通過(guò)機(jī)器學(xué)習(xí)模擬信息可能帶來(lái)的情緒進(jìn)而分析識(shí)別等,或是在此過(guò)程中針對(duì)被檢測(cè)到的虛假信息的信源進(jìn)行“降權(quán)”處理,以提升早期檢測(cè)的識(shí)別效率。對(duì)于已經(jīng)進(jìn)入傳播階段的虛假信息,則需要借助外部算法進(jìn)行治理,也即本研究希望去探索的,針對(duì)信息文本本身構(gòu)建模型來(lái)識(shí)別虛假信息,之后才有可能進(jìn)入更加精準(zhǔn)的人工再次甄別與辟謠環(huán)節(jié),提高信息鑒別的效率。
虛假信息的算法識(shí)別包括基于機(jī)器學(xué)習(xí)的檢測(cè)和基于深度學(xué)習(xí)的檢測(cè)。機(jī)器學(xué)習(xí)方法的局限十分明顯,人工設(shè)計(jì)的信息分類特征既耗費(fèi)精力,又難以做到全面覆蓋,普適性也較弱,隨后發(fā)展出來(lái)的基于深度學(xué)習(xí)的檢測(cè)方法則能夠較好地解決上述問(wèn)題。這類方法以人工神經(jīng)網(wǎng)絡(luò)(artificial neural network)為代表,算法能夠通過(guò)給定的數(shù)據(jù)集來(lái)自行學(xué)習(xí),尋找其中各類特征與條件,信息檢測(cè)的準(zhǔn)確率以及速率都得到了提升。
當(dāng)下,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)擁有了相對(duì)成熟的自主學(xué)習(xí)能力,基于其上的各類模型有著不同的學(xué)習(xí)特點(diǎn)和適用范圍,在諸多領(lǐng)域都取得了良好的表現(xiàn)。在自然語(yǔ)言處理領(lǐng)域運(yùn)用較為廣泛的為循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN),其中加入了序列的相關(guān)屬性,實(shí)現(xiàn)了信息在不同神經(jīng)網(wǎng)絡(luò)單元中的保存與傳遞。最先將這一模型引入虛假信息識(shí)別的是馬(Ma)等人的研究,其得到了虛假信息上下文隨時(shí)間變化的特征,提升了信息識(shí)別的速率,也開(kāi)創(chuàng)了循環(huán)神經(jīng)網(wǎng)絡(luò)在這一領(lǐng)域的應(yīng)用。然而由于循環(huán)神經(jīng)網(wǎng)絡(luò)自身算法的缺點(diǎn),其在實(shí)踐中并不能夠很好地處理較長(zhǎng)序列的數(shù)據(jù),作為一種特殊循環(huán)神經(jīng)網(wǎng)絡(luò),長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory network,LSTM)則成功克服了這一缺點(diǎn),成為當(dāng)前常用的人工神經(jīng)網(wǎng)絡(luò)之一。高玉君等人對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)、長(zhǎng)短期記憶網(wǎng)絡(luò)以及其他人工神經(jīng)網(wǎng)絡(luò)的虛假信息識(shí)別效果進(jìn)行了對(duì)比研究與評(píng)估,發(fā)現(xiàn)相較于其他的神經(jīng)網(wǎng)絡(luò),長(zhǎng)短期記憶網(wǎng)絡(luò)有著更高的準(zhǔn)確率與更低的損失率,取得了較好的檢測(cè)結(jié)果。鑒于此,本研究在長(zhǎng)短期記憶網(wǎng)絡(luò)基礎(chǔ)之上來(lái)構(gòu)建虛假信息的識(shí)別模型。
虛假信息識(shí)別與治理的相關(guān)研究目前并不局限于單一學(xué)科,而是成為很多學(xué)科共同的研究指向,既有的研究既呈現(xiàn)出不同學(xué)科自身的特點(diǎn),又形成了觀點(diǎn)的交融與互構(gòu)。
在以政府為主導(dǎo)的虛假信息監(jiān)管和治理中,有情報(bào)學(xué)領(lǐng)域的三方博弈模型和計(jì)算機(jī)領(lǐng)域的微博虛假信息提前把關(guān)模型。在以個(gè)體為核心的虛假信息判別與感知中,信息管理學(xué)領(lǐng)域的研究者關(guān)注人口學(xué)特征對(duì)健康類虛假信息的識(shí)別。心理學(xué)的研究學(xué)者則指出即便虛假信息被識(shí)別并更正,受眾的判斷過(guò)程中還依然存在對(duì)其的部分依賴,需要對(duì)正確信息重復(fù)更多的次數(shù)來(lái)進(jìn)行糾偏。在一般性的治理策略層面,圖書(shū)館學(xué)領(lǐng)域的學(xué)者提出要調(diào)動(dòng)社會(huì)教育職能,開(kāi)展跨行業(yè)式的協(xié)作治理。新聞傳播學(xué)和法學(xué)領(lǐng)域的學(xué)者認(rèn)為推進(jìn)立法、強(qiáng)化監(jiān)控過(guò)濾、及時(shí)回應(yīng)公眾需求是必由的治理途徑。正是受到這些多元研究視野的啟發(fā),本研究站在新聞傳播學(xué)的視野之下,通過(guò)智能科學(xué)的算法模擬來(lái)探討虛假信息治理的有效模式。
為探索更加適用于識(shí)別虛假信息的算法,此次研究選取真實(shí)傳播環(huán)境中的健康類虛假信息和健康類真實(shí)信息作為訓(xùn)練與測(cè)試的數(shù)據(jù)樣本。在具體文本來(lái)源的選擇上,虛假信息選取微信上的“騰訊較真平臺(tái)”小程序和“微信辟謠助手”小程序中的健康類信息,真實(shí)信息則選取丁香醫(yī)生科普欄目文章。
“微信辟謠助手”小程序共有包括人民網(wǎng)、科普中國(guó)、果殼等在內(nèi)788所辟謠機(jī)構(gòu)加入,目前一共辟謠了8644篇謠傳文章;“騰訊較真辟謠”作為騰訊新聞旗下的事實(shí)查證平臺(tái),其在2021年全年共發(fā)布辟謠文章3189篇,為累計(jì)超過(guò)3.1億人次提供了辟謠科普。這兩個(gè)辟謠平臺(tái)的相關(guān)內(nèi)容均為在現(xiàn)實(shí)中傳播的虛假信息,經(jīng)過(guò)對(duì)所有內(nèi)容的逐一梳理,從中共收集2000條健康類虛假信息作為研究樣本。
為了不造成信息的同質(zhì)化,健康類真實(shí)信息從丁香醫(yī)生網(wǎng)站獲取。該網(wǎng)站成立于2000年,是國(guó)內(nèi)最大的專業(yè)醫(yī)生社區(qū),也是騰訊辟謠平臺(tái)的最早合作機(jī)構(gòu)之一。本研究采集的丁香醫(yī)生網(wǎng)站上的健康科普信息,包括“傳染病”“職業(yè)病”“急救”等多個(gè)類別。為使真實(shí)信息和虛假信息數(shù)量保持一致,以時(shí)間倒序的方式收集2000條信息作為研究樣本。
將2000條虛假信息和2000條真實(shí)信息分別整合入兩個(gè)文檔中,先去除空格、段落符號(hào)等干擾信息,再將其以句為單位進(jìn)行分行處理,使其轉(zhuǎn)變?yōu)楦谒惴▽W(xué)習(xí)的形式,最終得到包含8972句虛假信息與8464句真實(shí)信息的數(shù)據(jù)集。
百度的開(kāi)源人工神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)平臺(tái)飛槳(PaddlePaddle)于2016年8月正式開(kāi)放源代碼,這是中國(guó)首個(gè)開(kāi)源開(kāi)放的深度學(xué)習(xí)框架,其中包含諸多已有算法,可減少基礎(chǔ)搭建的工作成本。故此次采用Paddle Fluid API編程并搭建一個(gè)長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)用以檢測(cè)識(shí)別虛假信息,搭建過(guò)程主要可以分為數(shù)據(jù)預(yù)處理、配置網(wǎng)絡(luò)、模型訓(xùn)練以及模型評(píng)估四個(gè)部分(如圖1所示)。
圖1 人工神經(jīng)網(wǎng)絡(luò)算法流程
數(shù)據(jù)預(yù)處理階段,主要是對(duì)上文提及的8972句虛假信息與8464句真實(shí)信息數(shù)據(jù)進(jìn)行轉(zhuǎn)化,具體的流程如圖2所示。先將收集完成的數(shù)據(jù)進(jìn)行解壓,分別放置在虛假信息與真實(shí)信息文件夾。而后對(duì)這些數(shù)據(jù)進(jìn)行初步的標(biāo)記處理,在已有數(shù)據(jù)集語(yǔ)句的句首添加標(biāo)簽進(jìn)行區(qū)分,其中虛假信息添加0,真實(shí)信息添加1。然后采用google公司提供的Word2Vec工具將上述句子轉(zhuǎn)換成算法可以識(shí)別的詞向量,匯總得到數(shù)據(jù)詞典。此外,根據(jù)此次模型的需要,將所有的真實(shí)信息與虛假信息數(shù)據(jù)按照4∶1的配比劃分為訓(xùn)練集(train_set)和驗(yàn)證集(eval_set),即7178句虛假信息和6771句真實(shí)信息進(jìn)入訓(xùn)練集,1794句虛假信息和1693句真實(shí)信息進(jìn)入驗(yàn)證集。
圖2 數(shù)據(jù)預(yù)處理流程
模型訓(xùn)練部分是在模型各個(gè)參數(shù)初始化后,使用訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練并不斷修正模型。最后的模型評(píng)估部分則是將測(cè)試的數(shù)據(jù)集輸入上述模型,求出其對(duì)應(yīng)的損失值(cost)和準(zhǔn)確率(acc),以此判斷此次構(gòu)建模型的有效性。
在實(shí)際數(shù)據(jù)測(cè)量前,先對(duì)此次虛假信息判別算法的相關(guān)參數(shù)進(jìn)行設(shè)定,其中共包括True(T)、False(F)、True positive(TP)、True negative(TN)這四個(gè)類別。T為正確樣本個(gè)數(shù);F為錯(cuò)誤樣本個(gè)數(shù);TP為被正確地劃分為正例的個(gè)數(shù),即實(shí)際為真實(shí)信息且被算法劃分為真實(shí)信息的樣本數(shù);TN為被正確地劃分為負(fù)例的個(gè)數(shù),即實(shí)際為虛假信息且被算法劃分為虛假信息的樣本數(shù)。
為更準(zhǔn)確評(píng)估此次構(gòu)建的算法模型,選取準(zhǔn)確率(acc)和損失值(cost)兩個(gè)指標(biāo)進(jìn)行測(cè)量。其中準(zhǔn)確率主要測(cè)量被正確判別出真實(shí)信息或虛假信息的語(yǔ)句占總樣本的百分比,是直接通過(guò)上文提及的TP與TN和較T與F和之比得出。
損失值則是通過(guò)對(duì)比模型預(yù)測(cè)結(jié)果與真實(shí)數(shù)據(jù)的標(biāo)簽得出,能夠表征模型對(duì)輸入信息判斷的不確定性降低的程度。其中yi表示樣本i的標(biāo)簽,0代表虛假信息,1代表真實(shí)信息。pi表示正確預(yù)測(cè)的概率,1-pi表示預(yù)測(cè)錯(cuò)誤的概率。Cost則是表征神經(jīng)網(wǎng)絡(luò)算法優(yōu)劣的重要數(shù)值,該數(shù)值越小表明模型效果越好。
為保證得到的模型具有較好的效用,其需具備較高的準(zhǔn)確率(acc)以及較低的損失值(cost)。針對(duì)這兩個(gè)評(píng)價(jià)指標(biāo),在不斷增加的迭代次數(shù)(iter)中對(duì)這兩個(gè)值進(jìn)行觀測(cè)。模型對(duì)訓(xùn)練集的13949條語(yǔ)句進(jìn)行了超過(guò)13萬(wàn)次的學(xué)習(xí)與訓(xùn)練,由圖3看出損失值cost不斷減小并最終達(dá)到0.1左右,而與此同時(shí),準(zhǔn)確率也在不斷提升,并最終能夠維持在0.98。兩個(gè)評(píng)價(jià)指標(biāo)均表現(xiàn)良好,展示了此模型能夠在訓(xùn)練集上對(duì)信息的真實(shí)性進(jìn)行準(zhǔn)確識(shí)別,達(dá)到了理想的效果。
圖3 訓(xùn)練集運(yùn)行結(jié)果
模型采用同樣的方法來(lái)檢測(cè)測(cè)試集中的3487條語(yǔ)句,伴隨訓(xùn)練次數(shù)不斷增加至14萬(wàn),通過(guò)圖4可以看出模型的損失值cost能夠穩(wěn)定在0.3上下,而準(zhǔn)確率acc能夠達(dá)到0.9左右,表明各項(xiàng)指標(biāo)均已達(dá)到較好的效果,且模型并未發(fā)生過(guò)擬合現(xiàn)象。這表明所構(gòu)建的長(zhǎng)短期記憶網(wǎng)絡(luò)模型通過(guò)“自我學(xué)習(xí)”習(xí)得了健康類虛假信息和真實(shí)信息的差異,并在給出的信息環(huán)境中能夠進(jìn)行較為準(zhǔn)確的進(jìn)行信息識(shí)別,尋找出虛假信息。
圖4 測(cè)試集運(yùn)行結(jié)果
本研究是一項(xiàng)跨學(xué)科的探索性研究,通過(guò)切實(shí)的算法實(shí)踐來(lái)考量外部算法治理的建構(gòu)過(guò)程與實(shí)際成效。人工神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建與完善建立在大量現(xiàn)實(shí)數(shù)據(jù)基礎(chǔ)之上,準(zhǔn)確、清晰的海量數(shù)據(jù)被投進(jìn)算法,通過(guò)不斷的深度學(xué)習(xí)與迭代,訓(xùn)練出算法的“自主意識(shí)”和對(duì)信息真假的判別標(biāo)準(zhǔn),一定程度上達(dá)成了對(duì)人類思維的有效模擬,同時(shí)還跨越了人類腦力的計(jì)算極限。健康類虛假信息和其他類別的虛假信息一樣,常常具有調(diào)動(dòng)情緒的特征,但總體上的語(yǔ)言表達(dá)是直接而非間接、明確而非隱晦,便于人工神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí);但對(duì)于語(yǔ)言中出現(xiàn)的隱喻、反諷、雙關(guān)等修辭現(xiàn)象,現(xiàn)有算法還缺乏靈活處理的能力,算法自身還有突破空間。
本研究提出的虛假信息識(shí)別模式是典型的文本識(shí)別模式,是通過(guò)對(duì)語(yǔ)句的信息特征來(lái)進(jìn)行判別,專注于文本自身,受互聯(lián)網(wǎng)復(fù)雜傳播環(huán)境的影響較弱。但這一類模式需要建立在大量的已有數(shù)據(jù)訓(xùn)練的基礎(chǔ)上,在實(shí)際的應(yīng)用中,使得其所能識(shí)別的虛假信息多局限在與已有虛假數(shù)據(jù)類似的信息中,對(duì)新型虛假信息的鑒別能力較弱。同時(shí),一些經(jīng)過(guò)人為特殊處理的虛假信息也較難識(shí)別,如采用諧音、符號(hào)隔開(kāi)等方式調(diào)整后的文本。
除了以上的局限性外,算法自身的“黑箱”、算法公正偏差等爭(zhēng)議及其可能帶來(lái)的技術(shù)異化問(wèn)題也成為亟待解決的新難點(diǎn)。算法“黑箱”是普遍存在的一個(gè)現(xiàn)象,尤其在深度學(xué)習(xí)領(lǐng)域,算法的中間層數(shù)據(jù)均是由其自身對(duì)既有數(shù)據(jù)的學(xué)習(xí)提煉得到,人工并不能夠探知,這也就使得其具體的計(jì)算過(guò)程難以被人工干預(yù),具有較高的不可控性。此外,公正偏差也是算法的關(guān)鍵問(wèn)題之一,算法這種基于大量數(shù)據(jù)的程序被給予了太高的理性期望,但其背后的設(shè)計(jì)研發(fā)人員也有個(gè)人的喜惡或利益傾向,有時(shí)難免會(huì)被代入算法之中。帶有偏見(jiàn)的算法一旦被廣泛應(yīng)用,其中的不公正性被放大,就有可能造成不可逆的后果。
鑒于上述算法治理的局限性,以政府、平臺(tái)、媒體等多方參與者為主體構(gòu)建協(xié)同治理模式是更加可行的路徑。其間,政府是處于主導(dǎo)地位的政策制定與管理者,把握引導(dǎo)整體的傳播環(huán)境走向。逐利的資本與平臺(tái)往往用算法充當(dāng)誘餌制造信息亂象,或者以行業(yè)機(jī)密為由造成算法黑箱,政府在此間可以作為利益無(wú)關(guān)方進(jìn)行獨(dú)立的監(jiān)控、協(xié)調(diào)與平衡。針對(duì)部分已經(jīng)產(chǎn)生較為嚴(yán)重社會(huì)影響的虛假信息輿情事件,也需要政府進(jìn)行及時(shí)的調(diào)節(jié)管控,必要時(shí)采取相應(yīng)的法律手段。但政府的監(jiān)管與協(xié)調(diào)往往是事后參與,過(guò)程控制能力相對(duì)有限。
平臺(tái)內(nèi)部有紛繁復(fù)雜的各類數(shù)據(jù)與算法,若要對(duì)其進(jìn)行全面且細(xì)致的把控,必然需要引入前端技術(shù)人才,這對(duì)于政府而言無(wú)疑是巨大的負(fù)擔(dān),因而建立政府與平臺(tái)以及平臺(tái)之間的關(guān)聯(lián)規(guī)范機(jī)制更加可行。平臺(tái)自身可對(duì)算法進(jìn)行更加嚴(yán)格的審核,同時(shí)不斷完善虛假信息識(shí)別的方案及用戶的反饋機(jī)制,以此優(yōu)化平臺(tái)的參與環(huán)境。平臺(tái)之間建立合作關(guān)系,通過(guò)相互監(jiān)督、源碼開(kāi)放等方法構(gòu)建更高效的虛假信息識(shí)別體系。此外,平臺(tái)并非中立的存在,往往存在著媒體的偏向性和意識(shí)形態(tài)屬性。這也就意味著在對(duì)平臺(tái)適當(dāng)放權(quán)、由其主導(dǎo)算法治理的同時(shí),政府要完善對(duì)平臺(tái)問(wèn)責(zé)的相關(guān)規(guī)范與立法,進(jìn)行協(xié)調(diào)與監(jiān)督。
根據(jù)愛(ài)德曼國(guó)際公關(guān)公司與清華大學(xué)國(guó)家形象傳播研究中心聯(lián)合發(fā)布的《2022年愛(ài)德曼信任度調(diào)查中國(guó)報(bào)告》可知,和其他國(guó)家相比,中國(guó)的受訪者對(duì)媒體的信任度非常高。這充分說(shuō)明了我國(guó)媒體具有巨大的信息價(jià)值影響力。在虛假信息的治理中,媒體把控好內(nèi)容的編輯與審核,保證自身內(nèi)容的客觀性與真實(shí)性。對(duì)于已經(jīng)傳播并證實(shí)的虛假信息,媒體借助平臺(tái)及時(shí)辟謠,盡早消除或減弱虛假信息帶來(lái)的惡劣影響。自媒體環(huán)境下,用戶也對(duì)虛假信息的再生產(chǎn)及擴(kuò)散有著重要的影響,尤其是信息涉入度高、鑒別能力較低且存在主觀傾向的用戶更難識(shí)別虛假信息,且容易進(jìn)一步傳播。用戶如果能提升對(duì)信息的鑒別能力,建立信息傳播的責(zé)任意識(shí),就能有效減少極端情緒或虛假信息的傳播。
“信疫”時(shí)代虛假信息的傳播范圍以及危害程度都在不斷加深,其治理過(guò)程需要多主體的共同參與。以平臺(tái)算法為底層核心,形成虛假信息識(shí)別的常態(tài)化、過(guò)程化機(jī)制;政府平衡各平臺(tái)間的利益關(guān)系,并監(jiān)管由此所導(dǎo)致的算法黑箱問(wèn)題;媒體則需在保證自身生產(chǎn)與傳播客觀準(zhǔn)確信息的基礎(chǔ)上,盡可能削弱已傳播的虛假信息帶來(lái)的影響,多方參與構(gòu)建兼具穩(wěn)固性和彈性的協(xié)同治理路徑,不斷凈化和改善實(shí)現(xiàn)信息傳播空間。
算法作為一種技術(shù)中介,深刻植入當(dāng)下的社會(huì)生活,聯(lián)結(jié)人的身體與外物,形成人的認(rèn)知與意識(shí),讓人們存在于物質(zhì)實(shí)在與虛擬實(shí)在之中。技術(shù)作為一種非中立的存在物,不同的技術(shù)以不同的方式構(gòu)造環(huán)境。算法既可以用來(lái)制造并擴(kuò)散虛假信息,同時(shí)也能夠用于有組織的大規(guī)模的信息監(jiān)督和虛假信息識(shí)別。不論是前者還是后者,算法的內(nèi)容生產(chǎn)與結(jié)果產(chǎn)出都依據(jù)“原始數(shù)據(jù)輸入—機(jī)器處理數(shù)據(jù)—得到最終數(shù)據(jù)”的鏈路來(lái)運(yùn)行。算法能夠主動(dòng)進(jìn)行海量學(xué)習(xí)、反饋與重構(gòu),正如本研究所呈現(xiàn)的,一個(gè)小型算法經(jīng)過(guò)了十多萬(wàn)次的迭代后獲得穩(wěn)定,確立了自身的判別標(biāo)準(zhǔn),而這一過(guò)程既是人通過(guò)代碼編寫(xiě)賦予給算法獨(dú)特的計(jì)算能動(dòng)性,同時(shí)也正是人被算法所取代的部分。就像普通用戶看不到算法在何處運(yùn)行一樣,算法的設(shè)計(jì)者也無(wú)法完全掌控算法的具體學(xué)習(xí)過(guò)程,如科學(xué)家在圍觀阿爾法狗的圍棋對(duì)弈時(shí),不知道程序的盲點(diǎn)和拐點(diǎn)會(huì)在何時(shí)出現(xiàn)。
算法作為一種解決問(wèn)題的手段而存在,一直進(jìn)行著循環(huán)的進(jìn)化:為解決老問(wèn)題采用新技術(shù),新技術(shù)又引起新問(wèn)題,新問(wèn)題的解決又要訴諸更新的技術(shù)。算法治理文字形態(tài)的虛假信息時(shí),專注于自然語(yǔ)言識(shí)別;當(dāng)虛假信息演進(jìn)到視頻深度合成時(shí),算法的專注點(diǎn)轉(zhuǎn)向?yàn)閳D像的分類與復(fù)原。算法處理的數(shù)據(jù)也從連續(xù)、有標(biāo)簽的數(shù)據(jù)向空間化、無(wú)標(biāo)簽的復(fù)雜數(shù)據(jù)轉(zhuǎn)變。算法的開(kāi)發(fā)者經(jīng)由技術(shù)選擇不斷擴(kuò)張技術(shù)的適用范圍,技術(shù)也在不斷的迭代中構(gòu)建出獨(dú)特的發(fā)展邏輯與路徑。在人與技術(shù)共存共生的格局下,虛假信息的生產(chǎn)與治理也形成了獨(dú)有的算法張力,算法既是虛假信息的治理之矛,以智能化的方式抓取其特征;同時(shí)也是虛假信息的隱蔽之盾,使之獲取了偽裝的技術(shù)力量。如“深度偽造”也要使用以循環(huán)神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)為代表的人工神經(jīng)網(wǎng)絡(luò)模型來(lái)實(shí)現(xiàn),這就構(gòu)成了虛假信息生產(chǎn)與識(shí)別的技術(shù)性競(jìng)爭(zhēng)。算法在不同目標(biāo)的競(jìng)爭(zhēng)中被多方爭(zhēng)奪,進(jìn)而也在不斷實(shí)現(xiàn)技術(shù)的自我超越。
很多知名科技公司推出了開(kāi)放技術(shù)平臺(tái),算法的易得性降低了技術(shù)應(yīng)用的門檻,也降低了虛假信息生產(chǎn)的物質(zhì)成本?;谏虡I(yè)目的、政治目的乃至個(gè)人情感目的入場(chǎng)的多元主體均能充分利用算法參與信息生產(chǎn),加之主體間的利益博弈,造成了虛假信息形態(tài)與類別的紛繁多樣和整體信息環(huán)境的日益復(fù)雜。虛假信息生產(chǎn)主體的多元化和治理主體的多元化遙相呼應(yīng),在某些語(yǔ)境下部分主體甚至具有同一性,共同構(gòu)成了交錯(cuò)變動(dòng)的多元網(wǎng)絡(luò)關(guān)系,而算法始終是其中重要的行動(dòng)力量。作為主體的人在不斷挖掘基于數(shù)據(jù)的算法智慧,同時(shí)也在錘煉?cǎi){馭技術(shù)的智慧,而算法則為人設(shè)定技術(shù)使用的閾值和邊界,為人的數(shù)字治理框定范圍。
(本文感謝中國(guó)傳媒大學(xué)數(shù)據(jù)科學(xué)與智能媒體學(xué)院趙薇副教授的技術(shù)指導(dǎo)。)
注釋:
① World Health Organization.NovelCoronavirus(2019-nCoV)SituationReport-13.https://www.who.int/docs/default-source/coronaviruse/situation-reports/20200202-sitrep-13-ncov-v3.pdf?sfvrsn=195f4010_6.2020-02-02.
② 方興東、谷瀟、徐忠良:《“信疫”的根源、規(guī)律及治理對(duì)策——新技術(shù)背景下國(guó)際信息傳播秩序的失控與重建》,《新聞與寫(xiě)作》,2020年第6期,第35-44頁(yè)。
③ 馬玉寧:《情感與規(guī)制:社交媒體虛假信息的傳播動(dòng)因和治理路徑》,《中國(guó)編輯》,2022年第4期,第51-56頁(yè)。
④ Vosoughi S,Roy D.TheSpreadofTrueandFalseNewsOnline.Science,vol.359,no.6380,2018.pp.1146-1151.
⑤⑦ 曾祥敏、王孜:《健康傳播中的虛假信息擴(kuò)散機(jī)制與網(wǎng)絡(luò)治理研究》,《現(xiàn)代傳播》,2019年第6期,第34-40頁(yè)。
⑥ Zheng X,Wu S,Nie D.OnlineHealthMisinformationandCorrectiveMessagesinChina:AComparisonofMessageFeatures.Communication Studies,vol.72,no.3,2021.pp.474-489.
⑧ 鐘祥銘、方興東:《數(shù)字治理的概念辨析與內(nèi)涵演進(jìn)》,《未來(lái)傳播》,2021年第5期,第10-20頁(yè)。
⑨ 張吉豫:《構(gòu)建多元共治的算法治理體系》,《法律科學(xué)》(西北政法大學(xué)學(xué)報(bào)),2022年第1期,第115-123頁(yè)。
現(xiàn)代傳播-中國(guó)傳媒大學(xué)學(xué)報(bào)2022年8期