国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

算法模型推薦對(duì)新聞?wù)鎸?shí)的消解與建構(gòu)

2023-08-07 23:14
關(guān)鍵詞:算法模型

段 鵬

(中國(guó)傳媒大學(xué),北京 100020)

一、 問(wèn)題的提出

算法是技術(shù)神話(huà)嗎?回答這一問(wèn)題首先需辨明,算法是否是絕對(duì)中立且準(zhǔn)確無(wú)誤的。算法是由人設(shè)計(jì)的,算法的決策系統(tǒng)也是如此,以網(wǎng)絡(luò)管理為例,算法需自動(dòng)區(qū)分仇恨言論、虛假信息或恐怖主義宣傳與新聞等,所有這些系統(tǒng)都使用價(jià)值判斷來(lái)得出結(jié)果。因此為了執(zhí)行任務(wù),算法需要“知道”要區(qū)別對(duì)待哪些數(shù)據(jù)包。此類(lèi)定義總是由人類(lèi)設(shè)計(jì)者出于某些意圖制定,顯然此類(lèi)定義并不能被限定為是中立的,同時(shí)基于它們的算法也不是中立的。算法要么直接由人類(lèi)設(shè)計(jì),如果是自學(xué),則在人類(lèi)控制和設(shè)計(jì)過(guò)程的基礎(chǔ)上發(fā)展它們的邏輯。它們既不是“客觀的”也不是“中立的”,而是人類(lèi)深思熟慮和權(quán)力斗爭(zhēng)的結(jié)果。之后,算法將所有輸入都置于同一組指令之下,對(duì)所有數(shù)據(jù)對(duì)象無(wú)差別運(yùn)行,且沒(méi)有任何自己的意圖,因此對(duì)于其“神話(huà)”的解讀,僅能在數(shù)據(jù)采集、模型設(shè)計(jì)、價(jià)值判斷等內(nèi)容以外加以探討。

2020年10月與2021年10月和12月,歐盟網(wǎng)絡(luò)與信息安全局(ENISA)分別發(fā)布了《人工智能網(wǎng)絡(luò)安全威脅圖譜》(ArtificialIntelligenceCybersecurityChallenges:ThreatLandscapeforArtificialIntelligence)、《ENISA威脅圖譜2021》(ENISAThreatLandscape2021)、《安全機(jī)器學(xué)習(xí)算法》(SecuringMachineLearningAlgorithms)等報(bào)告,這些報(bào)告以海量數(shù)據(jù)資料為依托,旨在提升歐盟在人工智能領(lǐng)域的網(wǎng)絡(luò)安全性。以人工智能、算法等技術(shù)為土壤的假新聞首次進(jìn)入ENISA的威脅圖譜,虛假信息甚至在一些網(wǎng)站中成為了能夠攫取利潤(rùn)的網(wǎng)絡(luò)服務(wù)模式(Disinformation as a service, Daas)。ENISA稱(chēng),數(shù)字技術(shù)和社交媒體使用頻次的不斷增加顛覆了人們一直以來(lái)獲取新聞資訊的方式。(1)ENISA Threat Landscape 2021, https://www.enisa.europa.eu/publications/enisa-threat-landscape-2021, May 27, 2022.社交平臺(tái)不同于傳統(tǒng)媒體形式,其“把關(guān)人”不再?lài)?yán)苛,“過(guò)濾器”缺乏核查,任何一次虛假新聞的生產(chǎn)和傳播都可能引起重大輿論事件,而恰是以算法為代表的新興模式為此類(lèi)現(xiàn)象提供了技術(shù)基礎(chǔ)。

算法作為信息技術(shù)、數(shù)學(xué)模型、媒體后臺(tái)等交叉領(lǐng)域的“復(fù)合體”,一直以來(lái)存在于各類(lèi)“運(yùn)行”的內(nèi)在邏輯中。從本體論角度出發(fā),算法早已不能被簡(jiǎn)單定義為基于數(shù)據(jù)經(jīng)驗(yàn)的推導(dǎo)模型,其暗含的對(duì)現(xiàn)實(shí)社會(huì)的控制力、滲透力,使其成為“技術(shù)無(wú)意識(shí)”(Technological Unconscious)的構(gòu)成部分。社會(huì)的結(jié)構(gòu)在一定意義上被算法支持,而其運(yùn)行邏輯往往僅被其設(shè)計(jì)者管窺,以技術(shù)黑箱形式存在。之所以說(shuō)設(shè)計(jì)者也僅能夠“管窺”,是出于對(duì)機(jī)器學(xué)習(xí)內(nèi)容片面性的考量,文中也將對(duì)這一點(diǎn)加以詳述。當(dāng)下,算法的運(yùn)行不僅表達(dá)著代碼的數(shù)學(xué)語(yǔ)言,也嵌入了不同意識(shí)形態(tài)、國(guó)家力量、身份背景的博弈邏輯,甚至包含著設(shè)計(jì)者自身潛在的喜好和偏向。以算法為技術(shù)基礎(chǔ)的算法新聞不僅影響著傳統(tǒng)新聞生產(chǎn)機(jī)制,也在智能媒體傳播的宏觀大背景下對(duì)人與社會(huì)產(chǎn)生著潛移默化的影響。大至國(guó)際傳播領(lǐng)域,傳統(tǒng)意義上不同主體間的霸權(quán)與反霸權(quán)行為正在以算法的形式被改寫(xiě)和重釋,這引發(fā)了不同國(guó)家和地區(qū)對(duì)算法及網(wǎng)絡(luò)安全問(wèn)題的重視;小至日常生活,社交平臺(tái)算法錨定、迎合、形塑人們的“個(gè)性化喜好”。

在媒介智能化及全球化大背景下,一些由算法虛假新聞引起的社交平臺(tái)輿論事件造成的影響極有可能從微小的IP地址所在地蔓延至全球,刨除由于客觀信息傳播誤差等原因造成的虛假新聞,惡意的數(shù)據(jù)收集、釣魚(yú)鏈接、信息誹謗等事件通過(guò)算法這一技術(shù)雙刃劍撼動(dòng)著國(guó)際局勢(shì),如在全球性事件新冠肺炎疫情發(fā)生前期,大量的海外網(wǎng)站以算法為驅(qū)動(dòng),在沒(méi)有事實(shí)根據(jù)的情況下捏造新聞消息,對(duì)中國(guó)加以污名化。再如俄烏沖突前后,以美國(guó)為代表的西方國(guó)家利用自身智能化媒體技術(shù)優(yōu)勢(shì),在全球范圍內(nèi)借由社交媒體掀起的對(duì)俄譴責(zé),無(wú)不將新聞傳播領(lǐng)域中的算法新聞問(wèn)題推至選擇“左”還是“右”的倫理兩難境地,其中最為顯性的則是算法新聞的新聞?wù)鎸?shí)問(wèn)題。區(qū)別于傳統(tǒng)新聞生產(chǎn),算法的介入使得新聞產(chǎn)品在“技術(shù)價(jià)值無(wú)涉”的大觀點(diǎn)下似乎帶有天然的真實(shí)和客觀屬性,然而從現(xiàn)實(shí)來(lái)看,算法假新聞已成為不能回避的問(wèn)題。算法新聞的勃興為何挑戰(zhàn)了新聞專(zhuān)業(yè)主義及新聞?wù)鎸?shí)問(wèn)題?本文對(duì)這一問(wèn)題的回答將追溯至算法數(shù)學(xué)模型本身所具有的數(shù)學(xué)缺陷,試圖在算法新聞應(yīng)用之便以外剖析技術(shù)內(nèi)隱之惡。

二、 算法新聞與新聞?wù)鎸?shí)

首先需對(duì)算法新聞概念加以溯源和澄清。算法新聞(Algorithm News)是運(yùn)用智能算法工具自動(dòng)生產(chǎn)新聞并實(shí)現(xiàn)運(yùn)營(yíng)的過(guò)程、方法或系統(tǒng),包括信息采集、儲(chǔ)存、寫(xiě)作、編輯、展示、數(shù)據(jù)分析及營(yíng)銷(xiāo)等的自動(dòng)化實(shí)現(xiàn)。(2)於春: 《算法、權(quán)力與治理: 智能時(shí)代美國(guó)新聞自由與民主政治的反思》,《當(dāng)代世界與社會(huì)主義》2022年第3期,第117—122頁(yè)。算法新聞不應(yīng)單單被理解為一項(xiàng)技術(shù)、一種類(lèi)型或一個(gè)對(duì)象的指稱(chēng),相反,算法新聞是新聞?lì)I(lǐng)域內(nèi)以算法模型為內(nèi)核的系列技術(shù)程序。有研究者將算法新聞定義為利用算法在無(wú)人干預(yù)情況下自動(dòng)生成(automatically generate)新聞消息的過(guò)程,側(cè)重于強(qiáng)調(diào)算法協(xié)助下新聞生產(chǎn)的自動(dòng)化(automatically)。此類(lèi)理解往往與生產(chǎn)概念緊密結(jié)合,同時(shí)對(duì)算法新聞范圍的認(rèn)定根據(jù)不同主體和側(cè)重點(diǎn)包含了“機(jī)器(人)新聞”(Robot Journalism)、“自動(dòng)化新聞”(Automated News)、“數(shù)據(jù)驅(qū)動(dòng)新聞”(Data-Driven Journalism)、“計(jì)算新聞”(Computational Journalism)等模式,更聚焦在對(duì)算法新聞技術(shù)層面的探討。

從社會(huì)空間生產(chǎn)角度出發(fā)解剖算法新聞,算法新聞的生產(chǎn)被認(rèn)為包括了人工設(shè)計(jì)模型自動(dòng)生產(chǎn)新聞的機(jī)器人算法新聞,傳統(tǒng)媒體新聞內(nèi)容產(chǎn)品及自媒體生成內(nèi)容,根據(jù)新聞要素、地理特征、人口學(xué)特征、個(gè)性化特征實(shí)現(xiàn)的新聞算法的分發(fā)。(3)郭潔: 《算法新聞的空間視角研究》,《青年記者》2021年第14期,第22—23頁(yè)。在此類(lèi)認(rèn)識(shí)視角下,算法新聞實(shí)際上將人、企業(yè)、社會(huì)在網(wǎng)絡(luò)社會(huì)空間的物質(zhì)或精神生產(chǎn)力納入了自身的生產(chǎn)機(jī)制,也包括了用戶(hù)接受新聞產(chǎn)品后對(duì)新聞產(chǎn)品的指導(dǎo)反饋過(guò)程。同時(shí),也有學(xué)者從更廣義和全面的視角出發(fā),置算法新聞?dòng)谏鐣?huì)的應(yīng)用和輻射層面,將其定義為“大數(shù)據(jù)、算法與社會(huì)科學(xué)的結(jié)合模型”,也同時(shí)強(qiáng)調(diào)了算法新聞模式下人力的“缺席”“在場(chǎng)”及新聞問(wèn)責(zé)的重要性。新聞生產(chǎn)原本是一項(xiàng)完全“人為”的工作,而在算法新聞問(wèn)世后,技術(shù)與人的勞動(dòng)分工問(wèn)題也在學(xué)界和業(yè)界范圍被廣泛討論,其中不乏對(duì)新聞生產(chǎn)自動(dòng)化倫理問(wèn)題的批判聲音。

新聞?wù)鎸?shí)可以稱(chēng)作是新聞業(yè)的“元問(wèn)題”(Meta-Question)之一,一直以來(lái),新聞?wù)鎸?shí)被認(rèn)為是新聞從業(yè)人員工作實(shí)踐的核心原則、要求、底線(xiàn)。就本質(zhì)而言,新聞?wù)鎸?shí)要求新聞報(bào)道與客觀事實(shí)具有一致性。20世紀(jì)90年代,鄭保衛(wèi)認(rèn)為新聞?wù)鎸?shí)性就是新聞報(bào)道對(duì)客觀發(fā)生的事實(shí)如實(shí)進(jìn)行報(bào)道和反映,這一說(shuō)法體現(xiàn)著傳統(tǒng)新聞生產(chǎn)領(lǐng)域中學(xué)界對(duì)于新聞?wù)鎸?shí)的大體看法。對(duì)于事實(shí)和報(bào)道“一致性”的追求更多傾向于一種“結(jié)果真實(shí)”,新聞?dòng)浾咦鳛樾侣勑畔⒌耐诰蛘吆蛡鬟f者也承擔(dān)了信息核查的責(zé)任,這也關(guān)乎新聞媒體權(quán)威性和相應(yīng)的公眾信任問(wèn)題??梢哉f(shuō),從新聞?wù)鎸?shí)絕對(duì)論視角出發(fā),新聞?wù)鎸?shí)被認(rèn)為是與所報(bào)道對(duì)象完全符合或存在同一性,但基于現(xiàn)實(shí)考量,“絕對(duì)真實(shí)”往往很難實(shí)現(xiàn),這也引發(fā)了學(xué)界對(duì)新聞?wù)鎸?shí)絕對(duì)論的詬病。從新聞?wù)鎸?shí)認(rèn)識(shí)論視角出發(fā),并不存在完全符合客觀情況的新聞?wù)鎸?shí),新聞?wù)鎸?shí)僅被認(rèn)為是經(jīng)過(guò)新聞生產(chǎn)者主觀判斷后認(rèn)定的事實(shí)。反觀當(dāng)前數(shù)字技術(shù)背景下的新聞業(yè),以算法新聞為例,新聞實(shí)踐活動(dòng)的核心主體不再僅是記者,它也被多樣化的技術(shù)主體從不同角度介入,因而對(duì)新聞?wù)鎸?shí)的要求出現(xiàn)了一定的“過(guò)程真實(shí)”轉(zhuǎn)向。新聞?wù)鎸?shí)這一傳統(tǒng)媒體時(shí)代的道德要求與職業(yè)準(zhǔn)則在數(shù)字時(shí)代又遇到了新問(wèn)題,在迅速變化的媒介生態(tài)中,新聞的角色也正發(fā)生相應(yīng)的變動(dòng),“新聞?wù)鎸?shí)”這一合法性根基也受到動(dòng)搖。(4)白紅義、王嘉怡: 《數(shù)字時(shí)代新聞?wù)鎸?shí)的消解與觀念重構(gòu)》,《新聞與寫(xiě)作》2022年第7期,第14—25頁(yè)。對(duì)于公眾而言,新聞報(bào)道中的“事實(shí)”大多時(shí)候與自己有著空間間隔,因而需要新聞?dòng)浾咔巴F(xiàn)場(chǎng)并與事實(shí)直接接觸。從源頭挖掘、被加工和查證的信息體現(xiàn)了新聞的真實(shí)性,并且最后成為被公眾消化的新聞產(chǎn)品。而算法新聞的出現(xiàn)改寫(xiě)著這一機(jī)制,一方面,生產(chǎn)主體從“人”轉(zhuǎn)向“機(jī)(由人設(shè)定的模型)”;另一方面,算法新聞的信源是載有海量信息的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)。從一般邏輯出發(fā),這樣的轉(zhuǎn)變似乎能夠使得新聞以更加中立、客觀、真實(shí)的方式被呈現(xiàn)和傳播,然而事實(shí)并非如此。由此,本文從算法新聞的核心技術(shù)基礎(chǔ)算法出發(fā),剖析導(dǎo)致算法新聞?wù)鎸?shí)性存疑的部分弊端源頭。

三、 算法弊端探源

誠(chéng)然,算法作為“技術(shù)之技術(shù)”賦能社會(huì)生活的方方面面,在大多數(shù)情況下,其以數(shù)學(xué)模型為核心、以技術(shù)為手段為人類(lèi)的發(fā)展提供了極大的便利。本文無(wú)意對(duì)其積極的能力架構(gòu)或技術(shù)功能進(jìn)一步闡釋,也并非全然批判地對(duì)技術(shù)加以批駁抗拒,相反,本文試圖側(cè)重于通過(guò)解剖算法的架構(gòu)邏輯,把握其在數(shù)理層面的先天缺陷,并據(jù)此談及當(dāng)前算法新聞在生產(chǎn)機(jī)制中所先天具有的缺陷。

簡(jiǎn)單化而言,算法實(shí)際上可以看作設(shè)計(jì)者計(jì)算機(jī)語(yǔ)言交流下的機(jī)器學(xué)習(xí)和基于學(xué)習(xí)的機(jī)器判斷,其本質(zhì)實(shí)為一種數(shù)學(xué)模型。模型的邏輯隱晦不明,或者說(shuō)只有設(shè)計(jì)者掌握著其運(yùn)行的大體路線(xiàn),卻不能百分百確定不會(huì)有偶然性事件或數(shù)據(jù)歧視和謬誤發(fā)生,而諸如歧視、錯(cuò)誤、有害事件的后果卻由“被運(yùn)行”了算法的用戶(hù)承擔(dān),更多時(shí)候這種有害后果是用戶(hù)甚至不曾察覺(jué)的隱性侵害。為了在非計(jì)算機(jī)專(zhuān)業(yè)背景下進(jìn)一步闡明侵害發(fā)生的路徑,本文從較為直接的數(shù)學(xué)與常識(shí)視角出發(fā),對(duì)算法中最可能對(duì)客觀性造成侵害的三段流程加以解釋:

(一) 數(shù)據(jù)搜集: 盲點(diǎn)處的謬誤及片面性強(qiáng)化

算法的實(shí)質(zhì)即為模型,而模型的要義則是簡(jiǎn)化一切事件與問(wèn)題。以我國(guó)經(jīng)典體育運(yùn)動(dòng)乒乓球?yàn)槔?熟練的球手在攻防過(guò)程中往往會(huì)預(yù)判對(duì)手的來(lái)球方向并以適當(dāng)力度的反作用力將球擊回對(duì)方臺(tái)面,教練往往也會(huì)在制定策略時(shí),通過(guò)觀看賽事回放的方式觀察對(duì)手的運(yùn)球軌跡,并基于此作出己方在賽場(chǎng)上的戰(zhàn)術(shù)應(yīng)對(duì)。事實(shí)上,尋找對(duì)手賽事回放、大量觀察對(duì)手運(yùn)球軌跡,可以類(lèi)比為算法模型建立的前提——機(jī)器數(shù)據(jù)挖掘與機(jī)器數(shù)據(jù)學(xué)習(xí),而基于個(gè)人判斷擊球則類(lèi)似于算法模型推導(dǎo)出建議并被接納。這一類(lèi)比一定程度上有助于我們更清晰地勾勒算法本質(zhì)并為其祛魅,也正如段首所言: 算法模型是對(duì)一切事件和問(wèn)題的簡(jiǎn)化。然而,人類(lèi)社會(huì)萬(wàn)千事件皆具細(xì)微差別,模型是否能識(shí)別、定義一切事件,而不遺漏對(duì)社會(huì)細(xì)微方面的考量呢?

《美國(guó)新聞》(U.S.News)(5)后更名為《美國(guó)新聞與世界報(bào)道》(U.S. News &World Report)。雜志在1983年開(kāi)展了一個(gè)教育評(píng)估項(xiàng)目: 為全美1 800所大學(xué)及學(xué)院進(jìn)行“優(yōu)秀度”排名,大學(xué)質(zhì)量的排名將為即將進(jìn)入大學(xué)的年輕人提供數(shù)據(jù)參考。為了形成一個(gè)評(píng)估“優(yōu)秀度”的模型,《美國(guó)新聞》的編輯根據(jù)自己的直覺(jué)判斷向各個(gè)大學(xué)發(fā)送了評(píng)估問(wèn)卷,然而編輯僅挑選了一些看似與大學(xué)“優(yōu)秀度”相關(guān)的變量,如高中生SAT成績(jī)、學(xué)校的師生比例、畢業(yè)校友捐款比例等,但諸如學(xué)生在學(xué)習(xí)過(guò)程中的獲得感、幸福度、終身學(xué)習(xí)能力、社交能力等評(píng)估因素均未得到考量,編輯們較為主觀的評(píng)估變量被數(shù)學(xué)模型包裝,共同推導(dǎo)出了1988年的全美大學(xué)優(yōu)秀度排名。盡管大多讀者對(duì)這一排名表示認(rèn)可,然而雜志社仍然收到了海量的投訴和批駁,被指控評(píng)判因素有失客觀性。

值得注意的是,未能考慮到細(xì)微方面的算法模型推導(dǎo)出了大學(xué)優(yōu)秀度排名,這一排名影響著年輕人的擇校選擇,排名靠后的大學(xué)少有人選擇,更不利于大學(xué)的數(shù)據(jù)表現(xiàn),從而造成了一定意義上的“惡性數(shù)據(jù)循環(huán)”。由此可見(jiàn),由于設(shè)計(jì)者的數(shù)據(jù)盲點(diǎn),算法有時(shí)會(huì)片面地證明自己的內(nèi)置邏輯和輸出結(jié)果是合理的,并不斷在運(yùn)行過(guò)程中自我鞏固、自我發(fā)展,卻侵蝕了相關(guān)方的特定利益。

(二) 數(shù)據(jù)歧視: 被技術(shù)包裝的偏見(jiàn)與博弈

如果說(shuō)《美國(guó)新聞》的編輯在制定評(píng)估因素時(shí)只是受到了個(gè)人社會(huì)生活背景、知識(shí)學(xué)歷等細(xì)微因素影響,其算法僅僅包裝了模型設(shè)計(jì)者的認(rèn)知,那么對(duì)于如種族主義者、資本集團(tuán)等有著鮮明結(jié)果導(dǎo)向和站位立場(chǎng)的設(shè)計(jì)者而言,算法則是包裝人類(lèi)偏見(jiàn)與資本博弈的技術(shù)外衣。就個(gè)人層面而言,種族主義類(lèi)似于存在于種族主義者認(rèn)知中的算法模型,一切與不同種族人群相關(guān)的缺陷、片面、虛假數(shù)據(jù)都會(huì)被種族主義者納入認(rèn)知,并推導(dǎo)出一個(gè)二元對(duì)立的種族認(rèn)知結(jié)論。而一旦個(gè)人層面的這一認(rèn)知模型被置于現(xiàn)實(shí)的算法技術(shù)中,被應(yīng)用于具體的社會(huì)方面,則必定會(huì)造成對(duì)部分人群的傷害。以種族主義為代表的算法模型實(shí)為最欠缺考量的模型,它被隨機(jī)的數(shù)據(jù)采集和假性相關(guān)所驅(qū)動(dòng),被制度不公平強(qiáng)化,又被證實(shí)性偏見(jiàn)進(jìn)一步劣化。(6)凱西·奧尼爾: 《算法霸權(quán): 數(shù)學(xué)殺傷性武器的威脅》,馬青玲譯,北京: 中信出版社,2018年,第12頁(yè)。

以利益為核心的資本博弈也被算法模型所包裝。依然以淺顯的日常生活案例為切入點(diǎn),當(dāng)有心人觀察到,商場(chǎng)門(mén)口的抓娃娃機(jī)每投幣n次就會(huì)出現(xiàn)故障,娃娃會(huì)比較容易掉落,那么一個(gè)簡(jiǎn)單的獲利模型就生成了。金融工程師正是通過(guò)海量的數(shù)據(jù)建立算法模型以預(yù)測(cè)如“娃娃掉落”一般的反常式獲利,貨幣、債券、股票以及國(guó)際市場(chǎng)中數(shù)以萬(wàn)億計(jì)的美元或黃金正是在算法模型的推演下進(jìn)入了特定群體的賬戶(hù)。

需要從另一個(gè)社會(huì)層面反思的是,進(jìn)入資本家賬戶(hù)的資金并不僅僅是屏幕界面上的簡(jiǎn)單數(shù)字,2008年金融危機(jī)爆發(fā)時(shí)華爾街的對(duì)沖基金投資人將其稱(chēng)為“傻瓜基金”,指的就是那些來(lái)自“傻瓜”民眾的錢(qián)。民眾真如其所說(shuō)一般是“傻瓜”嗎?事實(shí)上這一粗暴的形容,恰是對(duì)民眾將會(huì)被不透明算法模型欺騙的隱喻,由于不清楚黑箱的資本操作邏輯,民眾的血汗錢(qián)被卷入資本家、機(jī)構(gòu)等多主體的利益博弈中。

(三) 模型弊端:“偶然”變量引發(fā)的意義坍塌

關(guān)于算法的第三個(gè)先天缺陷,正如上文所舉的乒乓球軌跡數(shù)據(jù)學(xué)習(xí)案例,一般情況下教練和球手憑借認(rèn)知中已有的模型判斷來(lái)球方向并基于經(jīng)驗(yàn)加以應(yīng)對(duì),然而在一些情況下,對(duì)手來(lái)球可能是前推、加轉(zhuǎn)、側(cè)轉(zhuǎn)的弧旋球,繼續(xù)沿用模型中的應(yīng)對(duì)模式反而會(huì)使球走向錯(cuò)誤方向?qū)е率Х?這便是模型中的“偶然”變量。(7)在概率論和統(tǒng)計(jì)學(xué)中,偶然變量指的是“值取決于隨機(jī)現(xiàn)象的結(jié)果的非獨(dú)立變量”。更直接地說(shuō),算法模型在“房間出現(xiàn)大于n濃度的煙霧就觸發(fā)火警鈴聲”的單一變量邏輯中更為直接有效,而面對(duì)可能出現(xiàn)偶然變量的事件則可能出現(xiàn)意義的坍塌。

除卻偶然性,人類(lèi)本身所具有的個(gè)體差異性、成長(zhǎng)性等特殊現(xiàn)象也并非算法模型能夠絕對(duì)概括的。正如如果缺少精密數(shù)據(jù)的實(shí)時(shí)更新,遠(yuǎn)在外地的祖父祖母并不能在下一次見(jiàn)面時(shí)準(zhǔn)確地掌握孫輩的飲食口味,而即使時(shí)刻掌握著實(shí)時(shí)反饋的個(gè)性化數(shù)據(jù),一位母親也并不能百分百確定精準(zhǔn)地烹飪出滿(mǎn)足子女特定時(shí)刻味覺(jué)需求的美食。這也正是算法模型所具有的運(yùn)行弊端,即變量考量的片面性以及變量自身的變動(dòng)性可能導(dǎo)致結(jié)果出現(xiàn)誤差。

四、 模型缺陷的延伸

從上述三段可能出現(xiàn)錯(cuò)誤或侵害的流程來(lái)看,算法數(shù)學(xué)模型其實(shí)在生成前(制作者的前期設(shè)計(jì)和數(shù)據(jù)搜集)、生成時(shí)(機(jī)器學(xué)習(xí)和模型判斷)、運(yùn)行后(現(xiàn)實(shí)社會(huì)對(duì)算法的運(yùn)用)皆存在一定程度上較難避免的先天缺陷。另一方面,在人類(lèi)主觀認(rèn)知的參與下算法模型難以保證自身是價(jià)值無(wú)涉的,這就意味著在數(shù)學(xué)模型的協(xié)助下,不同設(shè)計(jì)者的主觀認(rèn)知從意識(shí)層面走向了現(xiàn)實(shí)世界,并在算法推導(dǎo)結(jié)果的作用下產(chǎn)生了實(shí)際的現(xiàn)實(shí)影響。對(duì)算法本身缺陷性的探討并非對(duì)技術(shù)本身的孤立批判,事實(shí)上,技術(shù)腳本中的缺陷基因在一定程度上延伸至了算法的應(yīng)用領(lǐng)域,新聞傳播實(shí)踐中算法的應(yīng)用也體現(xiàn)了上述三段流程的媒介演繹和侵害變體,也由此在一定程度上消解著新聞?wù)鎸?shí)。從算法新聞技術(shù)本體出發(fā),它是如何繼承了算法這一模式本身的缺陷并影響新聞的真實(shí)呈現(xiàn)的?為了探尋問(wèn)題的答案,需拆解算法新聞生產(chǎn)流程:

(一) 數(shù)據(jù)采集及處理: 模型盲點(diǎn)再現(xiàn)

算法新聞運(yùn)行與傳統(tǒng)新聞生產(chǎn)的前提實(shí)際上是類(lèi)似的,兩者均需獲取材料以生產(chǎn)內(nèi)容。傳統(tǒng)的新聞生產(chǎn)中,新聞采集需要相關(guān)人員前往新聞發(fā)生地或相關(guān)主體所在地采集所需信息,而在算法新聞運(yùn)行中這一流程則體現(xiàn)為核心數(shù)據(jù)抓取及相關(guān)數(shù)據(jù)挖掘。算法新聞運(yùn)行的技術(shù)基礎(chǔ)在于對(duì)大數(shù)據(jù)中新聞信息的抓取與計(jì)算分析,而大數(shù)據(jù)本身是通過(guò)匯集存儲(chǔ)在數(shù)據(jù)庫(kù)里的每一個(gè)數(shù)據(jù)生成的。(8)董天策、何旭: 《算法新聞的倫理審視》,《新聞界》2019年第1期,第27—33頁(yè)。理想狀態(tài)下,數(shù)據(jù)庫(kù)應(yīng)當(dāng)是一個(gè)能夠?yàn)樗惴ㄐ侣劦倪\(yùn)行提供全面、客觀數(shù)據(jù)信息的完美“糧倉(cāng)”。

從新聞專(zhuān)業(yè)主義角度和對(duì)新聞?wù)鎸?shí)的考量出發(fā),“糧倉(cāng)”的內(nèi)容物至少需保證兩個(gè)前提,即客觀性和基本價(jià)值原則,而這正與算法新聞數(shù)據(jù)搜集產(chǎn)生一定程度上的相悖。出于材料豐富性和全面性的考量,設(shè)計(jì)者往往設(shè)定模型挖掘海量數(shù)據(jù)。區(qū)別于傳統(tǒng)調(diào)查性新聞使用的抽樣方法,海量數(shù)據(jù)往往給人以“全面真實(shí)”的樣本假象。事實(shí)上,算法新聞運(yùn)行過(guò)程中的海量數(shù)據(jù)基礎(chǔ)導(dǎo)致了兩大問(wèn)題: 其一是數(shù)據(jù)信度核查難度大,其二是隱私數(shù)據(jù)的挖掘引發(fā)的倫理問(wèn)題。

首先,新聞機(jī)構(gòu)在利用算法生產(chǎn)新聞時(shí)往往是從第三方數(shù)據(jù)庫(kù)購(gòu)買(mǎi)接入數(shù)據(jù)的使用資質(zhì),而第三方數(shù)據(jù)庫(kù)的數(shù)據(jù)獲取則有其自身不透明的數(shù)據(jù)來(lái)源和獲取方式,且不談數(shù)據(jù)源是否真實(shí)可靠,單是經(jīng)過(guò)了中間介質(zhì)傳輸和交易往來(lái)的數(shù)據(jù)就已使其可信度下降。另一方面,從模型架構(gòu)和算法技術(shù)層面而言,正如前文所述《美國(guó)新聞》在為全美大學(xué)進(jìn)行“優(yōu)秀度”排名時(shí)遇到的問(wèn)題一樣,模型抓取數(shù)據(jù)的選擇依然是由人決定的,而人的片面性及對(duì)數(shù)據(jù)的觀照盲點(diǎn)無(wú)法被算法自動(dòng)糾正。

當(dāng)前,簡(jiǎn)單的機(jī)器人寫(xiě)作僅能夠處理結(jié)構(gòu)化數(shù)據(jù),如中國(guó)地震網(wǎng)在預(yù)測(cè)到地震信息后立刻發(fā)出新聞消息,再如國(guó)內(nèi)很多寫(xiě)作機(jī)器人均可以流暢生產(chǎn)財(cái)經(jīng)和體育新聞,并自動(dòng)對(duì)數(shù)據(jù)內(nèi)容進(jìn)行糾錯(cuò)。然而對(duì)于涉及深度報(bào)道、新聞核查的內(nèi)容,算法卻不具備強(qiáng)大的自動(dòng)糾錯(cuò)能力。而一旦未被糾錯(cuò)的虛假信息被算法加工,再經(jīng)由媒介演繹、傳播、再釋,則將導(dǎo)致盲點(diǎn)謬誤的社會(huì)性強(qiáng)化。

其次,在社交媒體賬號(hào)及內(nèi)容逐漸占據(jù)媒體內(nèi)容市場(chǎng)的今天,算法抓取的新聞數(shù)據(jù)或多或少將與個(gè)人隱私重疊交織。邊沁(Bentham)在18世紀(jì)提出圓形監(jiān)獄(panopticon)的理論概念,即全景式、敞視式的監(jiān)獄。(9)Michel Foucault, Discipline and Punish: The Birth of the Prison, New York: Vintage Books, 2012.在邊沁的論述中,圓形監(jiān)獄類(lèi)似于一個(gè)中心有可向外看的瞭望塔、四周由環(huán)形建筑構(gòu)成的空間單位,環(huán)形建筑實(shí)為容納不同類(lèi)別個(gè)體的囚房,囚徒之間由于囚房的隔斷具有一種橫向的“不可見(jiàn)性”,但處在瞭望塔內(nèi)的監(jiān)督者卻能夠借助環(huán)形建筑外側(cè)投入的光線(xiàn),清楚地注視著每一間囚房?jī)?nèi)的個(gè)體。

邊沁提出的敞視式建筑結(jié)構(gòu)與算法新聞的數(shù)據(jù)挖掘機(jī)制存在一定程度的耦合: 瞭望塔與算法技術(shù)均可被理解為邊沁視域下“可見(jiàn)”但“無(wú)法確知”的權(quán)力。在算法新聞生產(chǎn)過(guò)程中,技術(shù)不斷試圖觸碰、透視個(gè)體數(shù)據(jù),個(gè)體用戶(hù)制造的諸如性別、年齡、當(dāng)前位置、偏好設(shè)置、消費(fèi)能力等數(shù)據(jù)均被觀看,而自身卻如同環(huán)形囚房?jī)?nèi)的囚徒無(wú)法橫向觀看,遑論縱向透視算法權(quán)力。而算法新聞在挖掘數(shù)據(jù)時(shí)則等同于置身瞭望塔,能夠觀看一切,卻并未給外界觀看自己的機(jī)會(huì)。

(二) 新聞生產(chǎn)及消費(fèi): 技術(shù)與人的“導(dǎo)向共謀”

在特定的動(dòng)機(jī)和不同利益目標(biāo)的驅(qū)使下,算法技術(shù)、贊助方、技術(shù)人員、報(bào)道機(jī)構(gòu)等算法新聞相關(guān)主體在一定程度上共同引導(dǎo)了新聞導(dǎo)向,實(shí)現(xiàn)了人與技術(shù)的“導(dǎo)向共謀”。“共謀”的最為重要的促成因素是參與主體有著特定的動(dòng)機(jī)追求,或?yàn)榧榷ǖ睦媲Х桨儆?jì)地制造、引導(dǎo)輿論,或?yàn)閵蕵?lè)消遣,或?yàn)橹圃燹Z動(dòng)效應(yīng),或?yàn)檎T導(dǎo)人們的消費(fèi)行為。(10)匡文波: 《人工智能時(shí)代假新聞的“共謀”及其規(guī)避路徑》,《上海師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)》2019年第48卷第4期,第104—112頁(yè)。

眾多共謀之下的算法新聞中,假新聞是煽動(dòng)社會(huì)情緒最為直接、成本最低的形式。事實(shí)上,假新聞長(zhǎng)期以來(lái)一直被利益集團(tuán)用來(lái)左右社會(huì)輿論。在數(shù)學(xué)科學(xué)家諾亞(Noah Giansiracusa)看來(lái),諸如算法新聞等新技術(shù)和新媒體的興起,將信息博弈的風(fēng)險(xiǎn)推至人類(lèi)社會(huì)有史以來(lái)最高的臨界水平。海量數(shù)據(jù)新聞?dòng)绊懴?現(xiàn)實(shí)世界與網(wǎng)絡(luò)世界的邊界正在被不斷消解,以算法為代表的技術(shù)平臺(tái)創(chuàng)造了“技術(shù)的軍備競(jìng)賽”(a technological arms race),將假新聞的出現(xiàn)頻率、傳播速度、影響范圍推至高點(diǎn)。

人工智能和機(jī)器學(xué)習(xí)的進(jìn)步導(dǎo)致先進(jìn)的數(shù)字篡改媒體類(lèi)型的出現(xiàn),算法在大量的數(shù)據(jù)訓(xùn)練下也逐漸具備了篡改、操縱音頻、視頻、圖像、文本的技術(shù)路徑,即所謂的“深度造假”(Deepfake)。一些惡意生成的算法新聞中,主人公甚至以視頻形式表現(xiàn)了其本人從未做過(guò)的事情,而這項(xiàng)“業(yè)務(wù)”的技術(shù)門(mén)檻并不高,甚至往往以模型服務(wù)形式出現(xiàn)。比利時(shí)的一名社會(huì)民主黨派人士2018年5月在推特和臉書(shū)上發(fā)布了一段一分鐘的美國(guó)前總統(tǒng)特朗普(Donald Trump)講話(huà)的英語(yǔ)視頻,配有荷蘭語(yǔ)字幕。這段視頻的造假技術(shù)較為粗劣,主要是對(duì)特朗普的諷刺式二次創(chuàng)作,然而社交平臺(tái)用戶(hù)對(duì)于此視頻的海量調(diào)侃和評(píng)論使很多用戶(hù)以為這是真實(shí)的新聞視頻。而在2021年3月,緬甸一家軍方運(yùn)營(yíng)的電視臺(tái)播放了一段一名被拘留的前地區(qū)首席部長(zhǎng)公開(kāi)認(rèn)罪的錄像。錄像中部長(zhǎng)談及自己曾向昂山素季(Aung San Suu Kyi)行賄,并對(duì)政變的一些細(xì)節(jié)加以描述。這段視頻被軍方作為有罪證據(jù)公之于眾,但隨即招致了大量的駁斥聲音——由于聲音和視覺(jué)效果與一般視頻存在差異,人們認(rèn)為這是由算法深度造假的煽動(dòng)性新聞。

深度造假部分地構(gòu)成了算法制造假新聞的證據(jù),另一方面,算法推薦也為假新聞的靶向傳播制造了通路。社交平臺(tái)推特(Twitter)在成立初期僅僅為新注冊(cè)用戶(hù)推薦可關(guān)注博主,而自2016年起推特就開(kāi)始了平臺(tái)的內(nèi)容推薦。首先,推特通過(guò)創(chuàng)建機(jī)器學(xué)習(xí)算法來(lái)決定哪些內(nèi)容能夠更好地“提升用戶(hù)體驗(yàn)”,個(gè)人用戶(hù)的關(guān)注列表、閱讀過(guò)的推文都將成為平臺(tái)算法學(xué)習(xí)的內(nèi)容。這一算法學(xué)習(xí)步驟看似無(wú)害,但當(dāng)算法決定向用戶(hù)推薦何種內(nèi)容時(shí),盲點(diǎn)、模型等技術(shù)的天然謬誤就可能被無(wú)限放大。社交媒體算法通常被設(shè)計(jì)成能夠最大限度提高用戶(hù)參與度的模型,因此如果一個(gè)有害的陰謀論,比如“2020年大選被操縱”等內(nèi)容有可能引發(fā)大量用戶(hù)參與討論,那么算法將挖掘這一內(nèi)容點(diǎn)并向大眾傳播更多錯(cuò)誤信息,而這一模式不僅適用于推特,也適用于臉書(shū)的新聞動(dòng)態(tài),以及社交媒體上的任何其他排名和推薦算法。(11)Noah Giansiracusa, How Algorithms Create and Prevent Fake News: Exploring the Impacts of Social Media, Deepfakes, GPT-3, and More, New York: Apress, 2021, p.76.算法治理按照社會(huì)行動(dòng)網(wǎng)絡(luò)中的最有效、最便捷、最穩(wěn)定的原則安排了最佳的行動(dòng)圖繪(Profifiling),(12)藍(lán)江: 《生命檔案化、算法治理和流眾——數(shù)字時(shí)代的生命政治》,《探索與爭(zhēng)鳴》2020年第9期,第105—114頁(yè)。而手握智能手機(jī)與媒介社會(huì)溝通的人們?cè)诩夹g(shù)腳本的演繹下,會(huì)認(rèn)為一切內(nèi)容都是自己的選擇。

如上所述,在當(dāng)前的傳播環(huán)境下,新聞報(bào)道的素材、主體和傳播渠道正快速地向隱于事實(shí)背后的數(shù)據(jù)、傳感器、物聯(lián)網(wǎng)和采用了算法推送技術(shù)的互聯(lián)網(wǎng)平臺(tái)轉(zhuǎn)化,在這個(gè)過(guò)程中,擁有數(shù)據(jù)和傳感器的數(shù)量、物聯(lián)網(wǎng)和算法技術(shù)的成熟程度,以及平臺(tái)用戶(hù)的數(shù)量逐漸成為衡量傳播能力的新標(biāo)準(zhǔn),同時(shí)算法爬取人們的媒介使用痕跡并以標(biāo)簽化形式界定用戶(hù)行為,形成新聞內(nèi)容偏好的用戶(hù)擬象。從個(gè)體到群體,從群體到地區(qū)乃至國(guó)家,算法化的信息傳播逐漸占據(jù)人們的日常生活和傳播活動(dòng)。從哲學(xué)層面出發(fā),算法新聞不過(guò)是“萬(wàn)物皆數(shù)”哲學(xué)圖式的副產(chǎn)品,“萬(wàn)物皆數(shù)”意欲追求超穩(wěn)定的世界和諧,其核心概念是模仿、再現(xiàn)與控制,而算法新聞的生產(chǎn)機(jī)制正是沿著這樣的框架運(yùn)行的。(13)馮月季: 《反敘述: 算法新聞的符號(hào)哲學(xué)反思》,《編輯之友》2020年第1期,第74—78頁(yè)。可以說(shuō),算法新聞及其新聞?wù)鎸?shí)問(wèn)題已不僅僅是新聞專(zhuān)業(yè)主義框架下的探討議題,一定意義上構(gòu)成了部分的社會(huì)擬態(tài)。在社交平臺(tái)信息量劇增的后真相時(shí)代,傳統(tǒng)新聞專(zhuān)業(yè)主義面臨業(yè)務(wù)與倫理方面的雙重挑戰(zhàn),然而在數(shù)字新聞時(shí)代,算法語(yǔ)境下的新聞?wù)鎸?shí)由于先天具有數(shù)據(jù)盲點(diǎn)、歧視與弊端,在生產(chǎn)看似價(jià)值中立的“客觀”報(bào)道時(shí),也在一定程度上消解著新聞?wù)鎸?shí)。

猜你喜歡
算法模型
適用于BDS-3 PPP的隨機(jī)模型
p150Glued在帕金森病模型中的表達(dá)及分布
重要模型『一線(xiàn)三等角』
重尾非線(xiàn)性自回歸模型自加權(quán)M-估計(jì)的漸近分布
基于MapReduce的改進(jìn)Eclat算法
Travellng thg World Full—time for Rree
進(jìn)位加法的兩種算法
算法初步兩點(diǎn)追蹤
基于增強(qiáng)隨機(jī)搜索的OECI-ELM算法
3D打印中的模型分割與打包