宋建武 于書亞
摘要:在全面建設(shè)以全媒體為內(nèi)涵的現(xiàn)代傳播體系的媒體融合新階段,為響應(yīng)互聯(lián)網(wǎng)時(shí)代用戶的信息需求,主流媒體需要建立以人工智能編輯部為核心的新型傳播平臺。人工智能編輯部更加關(guān)注由于公眾廣泛參與帶來的傳播關(guān)系的變革,將人工智能技術(shù)全面應(yīng)用于信息采集、產(chǎn)生、分發(fā)、接收和反饋的全過程中。
關(guān)鍵詞:人工智能 媒體融合 智能傳播
一、使命與目標(biāo)
在全面建設(shè)以全媒體為內(nèi)涵的現(xiàn)代傳播體系的媒體融合新階段,主流媒體的互聯(lián)網(wǎng)化將產(chǎn)生新型媒體平臺,其價(jià)值和使命在于,成為一個(gè)全面應(yīng)用人工智能技術(shù),全面響應(yīng)互聯(lián)網(wǎng)時(shí)代用戶信息需求的新型傳播平臺。人工智能編輯部將是這一平臺的核心。
在全媒體的特性中,全程和全息強(qiáng)調(diào)了更為豐富和復(fù)雜的信息來源,全程指時(shí)空維度上,客觀事物運(yùn)動(dòng)的整個(gè)過程都會被現(xiàn)代信息技術(shù)捕捉和記錄并存儲;全息指信息狀態(tài)維度上,信息采集及呈現(xiàn)形態(tài)的“全息化”;全員則是從社會維度上來看,來自方方面面的各種主體(個(gè)人、各類機(jī)構(gòu))都在通過互聯(lián)網(wǎng)的賦能作用,進(jìn)入到社會信息的交互過程中,成為可能的信息源;而全效指在媒體功能維度上,新型的全媒體通過為平臺用戶提供全面化的服務(wù)功能和多元化的應(yīng)用場景,來獲得更為豐富的用戶數(shù)據(jù)和信息,并由此作為主要的價(jià)值變現(xiàn)模式,這使得新型的全媒體平臺必然成為社會的數(shù)據(jù)總匯和運(yùn)營樞紐,而這樣的功能,必須通過人工智能的應(yīng)用來實(shí)現(xiàn)。
本文試圖對人工智能編輯部應(yīng)用場景的大致展望作基本梳理,為業(yè)界和學(xué)界提供具有指向性的指導(dǎo)框架。在此之前,首先需要梳理幾個(gè)關(guān)鍵的概念。
(一)數(shù)據(jù)和信息
1、信息:信息是人類用以進(jìn)行決策和消除不確定因素的依據(jù)。在實(shí)踐中,人類大腦對采集后的訊號進(jìn)行加工處理,是在大腦“黑箱”中進(jìn)行的過程。這種信息的加工過程實(shí)質(zhì)上就是數(shù)據(jù)的結(jié)構(gòu)化。
2、數(shù)據(jù):數(shù)據(jù)是記錄客觀事物運(yùn)動(dòng)和變化的符號,主要通過機(jī)器進(jìn)行分析和處理。對于現(xiàn)有的信息來說,數(shù)據(jù)化就是對信息的分解過程,在這個(gè)過程中,我們可以找出一條信息中包含的各種元素,從而發(fā)掘信息中更加深層的某種鏈接。
信息與數(shù)據(jù)是相互關(guān)聯(lián)的?;纛D認(rèn)為:“信息是為了滿足用戶決策的需要而經(jīng)過加工處理的數(shù)據(jù)。”而數(shù)據(jù)是人類表征外部世界的初始化的符號,是記載客觀事物的性質(zhì)、狀態(tài)以及相互關(guān)系等的物理符號或這些物理符號的組合,是信息的數(shù)字化(數(shù)位化)表現(xiàn)形式和載體。
在物理世界,原子、電子、質(zhì)子和中子等更微小的微粒的發(fā)現(xiàn),不斷揭開微觀物質(zhì)世界的面紗,人類不斷加深對物質(zhì)世界的認(rèn)知。在信息領(lǐng)域,人們對客觀事物矛盾運(yùn)動(dòng)所發(fā)散出的各種訊息的采集和應(yīng)用,也由于傳感器的大規(guī)模使用,發(fā)展到了“數(shù)據(jù)”層面,通過大數(shù)據(jù)技術(shù)(包含數(shù)據(jù)采集、數(shù)據(jù)整理、數(shù)據(jù)存儲、數(shù)據(jù)安全、數(shù)據(jù)分析、數(shù)據(jù)呈現(xiàn)和數(shù)據(jù)應(yīng)用等),人們能夠?qū)?shù)據(jù)進(jìn)行關(guān)聯(lián)和歸屬,為機(jī)器學(xué)習(xí)中的模型訓(xùn)練提供數(shù)據(jù)基礎(chǔ),并應(yīng)用于人工設(shè)定的特定性能和運(yùn)算方式的實(shí)現(xiàn),打破信息的外殼,從而使人類更加接近“信息”的本質(zhì)。
數(shù)據(jù)化是信息分解的過程,在這一過程中,人們通過拆解一個(gè)信息所包含的各種元素,發(fā)現(xiàn)不同信息內(nèi)容間更深層的聯(lián)系和區(qū)別,對機(jī)器采集的數(shù)據(jù)和人體感官所獲得的信息解構(gòu)化的數(shù)據(jù)進(jìn)行整合、清洗、加工和標(biāo)簽化等處理,從而形成數(shù)據(jù)集。人工智能編輯部的數(shù)據(jù),一方面來自機(jī)器的智能采集,另一方面來自對人體感官所獲得的信息進(jìn)行解構(gòu)、并經(jīng)機(jī)器識別和處理后形成的數(shù)據(jù)。
主流的人工智能實(shí)現(xiàn)過程就是通過機(jī)器學(xué)習(xí)算法,輸入并輸出已知信息、按照固定的模板,通過將數(shù)據(jù)“喂”給算法后,自動(dòng)按照給定的規(guī)則填充公式化的表達(dá),可以進(jìn)行自動(dòng)稿件的生成、語音識別、圖像處理、機(jī)器翻譯等。這種“弱人工智能”,系統(tǒng)表現(xiàn)出一定的智能,但并不擁有自主意識,是能夠?qū)崿F(xiàn)特定功能的專用智能,而與之相對應(yīng)的“強(qiáng)人工智能”包含認(rèn)知智能和創(chuàng)造智能,能夠自適應(yīng)外界環(huán)境且具有自我意識。也是人工智能編輯部和智慧媒體下一步的發(fā)展方向。
(二)人工智能
人工智能是利用數(shù)字計(jì)算機(jī)或者計(jì)算機(jī)控制的機(jī)器模擬、延伸和擴(kuò)展人的智能,感知環(huán)境、獲取知識并使用知識獲得最佳結(jié)果的理論、方法、技術(shù)及應(yīng)用系統(tǒng)。通俗而言,人工智能就是根據(jù)人類的智能活動(dòng)規(guī)律,研究如何通過構(gòu)造一定的智能人工系統(tǒng)讓計(jì)算機(jī)模擬人類的行為并適應(yīng)人類工作的科學(xué)。
當(dāng)前,人工智能在信息領(lǐng)域的應(yīng)用需要通用的算法開發(fā)和在具體應(yīng)用領(lǐng)域內(nèi)專門的算法開發(fā)作為技術(shù)基礎(chǔ)。人工智能編輯部區(qū)別于傳統(tǒng)新聞編輯部,是由人工智能為信息的采集、生產(chǎn)及分發(fā)的全鏈條進(jìn)行賦能,從資訊傳播的起點(diǎn)到終點(diǎn)都賦予人工智能的技術(shù)基因,真正體現(xiàn)了智慧媒體的價(jià)值所在?!爸腔邸睂?shí)際蘊(yùn)含了算法和大數(shù)據(jù),“智”,即“通陰陽之變”,也就是基于一定的運(yùn)行和分析規(guī)則的基礎(chǔ)上進(jìn)行算法和程序的設(shè)定;“慧”,即“耳聰目明”,也就是大數(shù)據(jù)的廣泛運(yùn)用。算法、大數(shù)據(jù)和人工智能技術(shù)的賦能為媒體行業(yè)帶來了從宏觀到微觀全方位的改變,我們將其稱之為信息領(lǐng)域的智能傳播模式。
(三)信息傳播模式
信息的傳播模式經(jīng)歷了從印刷時(shí)代向數(shù)據(jù)時(shí)代的轉(zhuǎn)變。
印刷時(shí)代以前,人們獲取信息的途徑主要依靠口耳相傳,信息的傳播范圍局限于一個(gè)極小的地域內(nèi)。此后,人類逐漸從口語傳播、手抄傳播階段逐步邁入建立在紙張和印刷術(shù)發(fā)明的基礎(chǔ)之上的印刷時(shí)代,信息傳播進(jìn)入“鉛與火”的時(shí)代。印刷時(shí)代的來臨彌補(bǔ)了手抄傳播效率低、規(guī)模小、成本高的缺陷,信息以附著在紙質(zhì)或其他介質(zhì)上的圖文形式和模擬信號的方式傳遞,其傳播范圍、傳播效率與傳播質(zhì)量大大提升。造紙術(shù)和印刷術(shù)是中華民族為世界文明作出的兩大貢獻(xiàn)。15世紀(jì)40年代,德國工匠古登堡在活字印刷和油墨技術(shù)的基礎(chǔ)上,創(chuàng)造了金屬活字排版印刷,并將壓榨機(jī)改裝為印刷機(jī),實(shí)現(xiàn)了文字信息的機(jī)械化生產(chǎn)和大規(guī)模復(fù)制。歐洲工業(yè)革命推動(dòng)了印刷技術(shù)的革新,使之進(jìn)入到機(jī)械動(dòng)力和電力生產(chǎn)的階段,并推動(dòng)了近代報(bào)刊的誕生。
近40年,中國的信息傳播方式經(jīng)歷了從“鉛與火”的傳統(tǒng)鉛字印刷到“光與電”的數(shù)字化傳播的巨大飛躍。20世紀(jì)70年代,西方已經(jīng)采用“電子照排技術(shù)”,即利用計(jì)算機(jī)控制實(shí)現(xiàn)照相排版印刷,中國仍在沿用傳統(tǒng)的 “以火熔鉛、以鉛鑄字”的鉛字排版印刷技術(shù),這種方式能耗大、勞動(dòng)強(qiáng)度高、環(huán)境污染嚴(yán)重,且出版印刷能力極低。為改變這種狀況、跟上世界信息化發(fā)展步伐,必須將漢字與計(jì)算機(jī)技術(shù)相結(jié)合。1975 年,王選院士開始主持中國計(jì)算機(jī)漢字激光照排系統(tǒng)和以后的電子出版系統(tǒng)的研究開發(fā),他的目標(biāo)是直接研制世界尚無成品的第四代激光照排系統(tǒng),即在電腦控制下將數(shù)字化存儲的字模用激光束在底片上感光成字、制版印刷。王選使用“輪廓加參數(shù)”的數(shù)字方法來描述漢字字形,將字形信息壓縮500倍至1000倍的同時(shí)實(shí)現(xiàn)變倍復(fù)原時(shí)的高速和高保真,這一技術(shù)攻克了漢字字形信息的計(jì)算機(jī)存儲和復(fù)原的世界性難題。至90年代初,王選帶領(lǐng)團(tuán)隊(duì)先后研制出了八代激光照排系統(tǒng)產(chǎn)品,占有中國大陸99%的報(bào)社和90%以上的書刊出版社和印刷廠,中國印刷業(yè)從鉛板印刷直接步入激光照排階段,跨越了國外照排機(jī)40年的發(fā)展歷史。世界上首個(gè)“漢字信息處理與激光照排系統(tǒng)”的成功研發(fā),再次掀起一場印刷業(yè)的“光電革命”,這也成為我國邁入數(shù)字化時(shí)代的重要開端。
數(shù)字時(shí)代,信息傳輸更加高速便捷,大眾傳播的傳播技術(shù)手段以數(shù)字制式代替了傳統(tǒng)的模擬信號。信息的運(yùn)輸技術(shù)也實(shí)現(xiàn)了巨大的飛躍。在這一階段,報(bào)紙、廣播、電視的廣泛普及,共同成就了大眾傳播模式的輝煌。專業(yè)化的媒介組織運(yùn)用傳播技術(shù)和產(chǎn)業(yè)化的手段,以社會上一般大眾為對象,通過收集大量外部訊息并經(jīng)過加工處理(主要通過人的感覺器官及人腦)形成結(jié)構(gòu)化的信息后,進(jìn)行大規(guī)模的信息生產(chǎn)和傳播活動(dòng),信息生產(chǎn)和處理方式呈現(xiàn)工業(yè)化生產(chǎn)特征。80年代出現(xiàn)的電信傳真、衛(wèi)星通信技術(shù)大大提升了報(bào)刊的運(yùn)輸效率。借助電磁波頻率和振幅的調(diào)制技術(shù),人們發(fā)明了聲音信息的的載波方式,廣播成為信息傳播的重要載體之一。從ENG(Electronic News Gathering)、SNG(Satellite News Gathering)到DSNG(Digital Satellite News Gathring),信息的采集方式由電子化向數(shù)字衛(wèi)星采集技術(shù)不斷發(fā)展,人類體外化的聲音信息和體外化的影像信息得以長久保存。衛(wèi)星電視的發(fā)展使人們得以對活動(dòng)圖像進(jìn)行光電轉(zhuǎn)換并以有線或無線的方式高效運(yùn)輸,全球傳播成為可能。隨著數(shù)字電子技術(shù)的逐漸成熟,廣播、電視的音質(zhì)與畫質(zhì)提升,頻道與節(jié)目資源更加豐富,改變了過去傳播資源短缺的狀況,多樣化的信息需求被重視,受眾市場趨于細(xì)分化。計(jì)算機(jī)的出現(xiàn),使電腦開始執(zhí)行人腦的部分功能,意味著人類大腦這一信息處理中樞開始了體外化的進(jìn)程。數(shù)字多媒體技術(shù)的廣泛應(yīng)用實(shí)現(xiàn)了通過集計(jì)算機(jī)、通訊和聲像技術(shù)于一體的數(shù)字方式對交互處理聲音、圖像、文字和數(shù)據(jù)等信息進(jìn)行混合傳送,推動(dòng)了媒體形態(tài)的革新?;ヂ?lián)網(wǎng)的普及促使信息由單向傳播轉(zhuǎn)變?yōu)榻换ナ絺鞑?,信息發(fā)布不再是集中化模式,信息流通更為自由,形成了海量信息源?;ヂ?lián)網(wǎng)媒體平臺化的發(fā)展,使海量信息得以快速聚合和傳播。大眾電子傳播媒介實(shí)現(xiàn)了由廣播、窄播到個(gè)體化傳播的階段發(fā)展,傳播主體、傳播手段、顯示手段、受眾特點(diǎn)、服務(wù)形態(tài)及信息的制作方式等方面都發(fā)生著變化。
數(shù)據(jù)時(shí)代,信息的數(shù)據(jù)化開始了人工智能的探索和應(yīng)用,推動(dòng)了傳播資源的極大豐富?!笆鼙姟毕颉坝脩簟钡霓D(zhuǎn)變,使用戶成為關(guān)系網(wǎng)絡(luò)和信息傳播的重要節(jié)點(diǎn)。人工智能編輯部的技術(shù)應(yīng)用,要根據(jù)信息傳播領(lǐng)域公眾的需求特征,重點(diǎn)開發(fā)知識圖譜,建設(shè)內(nèi)容數(shù)據(jù)庫,研發(fā)專用算法。與單純借助人工智能技術(shù)強(qiáng)化媒體自身專業(yè)生產(chǎn)能力的應(yīng)用方式不同,人工智能編輯部要順應(yīng)互聯(lián)網(wǎng)平臺的開放趨勢,更加關(guān)注由于公眾廣泛參與帶來的傳播關(guān)系的變革,以人工智能技術(shù),全面服務(wù)全媒體時(shí)代互聯(lián)網(wǎng)用戶的信息需要和參與及社交的需要,把人工智能運(yùn)用于信息采集、產(chǎn)生、分發(fā)、接收和反饋的全過程中。
二、人工智能編輯部的未來探索展望
人工智能編輯部未來將從信息采集、生產(chǎn)、分發(fā)、接收、反饋五個(gè)方面進(jìn)行全方位的智能化探索。
(一)智能化采集:從信息到數(shù)據(jù),從感官到機(jī)器
人工智能編輯部的信息采集將包含信息智能化采集和信息數(shù)據(jù)化智能化兩個(gè)方面。信息的智能化采集主要著眼于在5G、物聯(lián)網(wǎng)等技術(shù)的支持下,依靠智能機(jī)器實(shí)現(xiàn)對外部數(shù)據(jù)更加高效、智能的采集;另一方面將通過專用的人工智能技術(shù)實(shí)現(xiàn)對“全員媒體”采集而來的信息內(nèi)容進(jìn)行智能化解構(gòu),其中將利用大數(shù)據(jù)技術(shù)、知識圖譜系統(tǒng)的指示標(biāo)簽系統(tǒng),對信息內(nèi)容進(jìn)行精準(zhǔn)識別和標(biāo)簽化處理,并運(yùn)用自然語言理解(Natural Language Understanding)和機(jī)器閱讀理解(Machine Reading Comprehension)等技術(shù),對信息進(jìn)行分解,以完成信息的數(shù)據(jù)化過程,以此來實(shí)現(xiàn)對外部信息和數(shù)據(jù)的全范圍覆蓋和采集,為建立起強(qiáng)大的內(nèi)容數(shù)據(jù)庫提供原料,并為下一步使用合成數(shù)據(jù)等技術(shù)進(jìn)行二次加工打下基礎(chǔ)。整體而言,信息的智能化采集工具將從依賴人類感官為主變?yōu)橐蕾嚈C(jī)器為主。采集的對象將從信息為主變?yōu)橐詳?shù)據(jù)為主。
5G牌照正式發(fā)放后,2019年可被稱之為人工智能在信息領(lǐng)域應(yīng)用的科技元年,標(biāo)志是人工智能在新聞生產(chǎn)方面的一系列應(yīng)用成果。在此之前,人類更多地是用感官來進(jìn)行信息收集,使用人腦進(jìn)行判斷做出決策。而未來的信息采集會更多地通過機(jī)器實(shí)現(xiàn)對數(shù)據(jù)的挖掘分析。在此過程中,借助5G和物聯(lián)網(wǎng)發(fā)展提供的技術(shù)基礎(chǔ),能夠?qū)崿F(xiàn)在更廣范圍、更大程度上使用各種信息和數(shù)據(jù)采集設(shè)備(各類監(jiān)測設(shè)備和傳感器),智能化地采集表征客觀事物存在與發(fā)展的訊息。這也是5G技術(shù)的真正顛覆性影響的體現(xiàn),即廣接入,這使得未來的信息采集會更加依賴機(jī)器采集外部信息數(shù)據(jù),這是信息采集從量變到質(zhì)變的變化,讓人們有可能更加深刻地認(rèn)識外部世界的變化。
同時(shí),對采集到的信息內(nèi)容進(jìn)行智能識別和標(biāo)簽化的結(jié)構(gòu)化處理,以便進(jìn)行后續(xù)的分析和重新組合。利用人工智能技術(shù)將采集而來的各類信息進(jìn)行“數(shù)據(jù)化”。例如,利用知識圖譜系統(tǒng)的指示標(biāo)簽系統(tǒng)對信息內(nèi)容進(jìn)行精準(zhǔn)識別和標(biāo)簽化處理,依賴強(qiáng)大的內(nèi)容數(shù)據(jù)庫并運(yùn)用自然語言理解、機(jī)器閱讀理解等技術(shù)對信息進(jìn)行進(jìn)一步的加工。這實(shí)際上是“信息數(shù)據(jù)化”的過程,為進(jìn)一步信息的智能化生產(chǎn)打下良好基礎(chǔ)。
2019年,亞馬遜研究科學(xué)家已經(jīng)在自然語言理解(Natural Language Understanding)方面取得了令人矚目的進(jìn)步,他們推出了新的計(jì)算架構(gòu)能夠幫助語音助手Alexa在人類不說完整的句子的情況下也能理解人類的語言內(nèi)容含義。而機(jī)器閱讀理解(Machine Reading Comprehension (MRC))也使得系統(tǒng)閱讀大數(shù)據(jù)、推斷含義并且立即得出答案的流程成為可能。目前的實(shí)踐應(yīng)用中,MRC已經(jīng)可以協(xié)助人類將技術(shù)手冊、歷史地圖和醫(yī)療記錄等各種資料轉(zhuǎn)化為易于搜索的信息集合??赏茰y,MRC是未來實(shí)現(xiàn)強(qiáng)人工智能的關(guān)鍵性步驟之一。
(二)智能化生產(chǎn):從物理反應(yīng)到核反應(yīng)
人工智能編輯部的智能化信息生產(chǎn)是通過機(jī)器智能化采集并對數(shù)據(jù)進(jìn)行分析的基礎(chǔ)上,根據(jù)人類生產(chǎn)生活各種場景的需要所進(jìn)行的,基于未來人工智能各種專用算法的開發(fā)應(yīng)用基礎(chǔ)上完成的。具體包含文本生成和文本審核兩個(gè)部分:
1、文本生成:數(shù)據(jù)的可視化處理和信息智能生產(chǎn)
在過去,人類大腦對通過感官接收到的訊號進(jìn)行“黑箱化處理”并做出判斷,這種“黑箱化”的處理體現(xiàn)了大腦對于采集信息的自然理解過程,而在未來依賴機(jī)器進(jìn)行對數(shù)據(jù)的智能采集時(shí),需要對采集而來的數(shù)據(jù)進(jìn)行可視化處理,以便讓人類能夠讀懂?dāng)?shù)據(jù)。
當(dāng)前實(shí)踐中,數(shù)據(jù)可視化處理主要通過自然語言生成(Natural Language Generation)和計(jì)算圖像的生成(Computational Image Completion and Generation)這兩種技術(shù)實(shí)現(xiàn)。
自然語言生成技術(shù)基于大規(guī)模的數(shù)據(jù)集構(gòu)建敘事,可實(shí)現(xiàn)的功能包括集成關(guān)鍵詞、搜索引擎優(yōu)化(利用搜索引擎的規(guī)則來提升網(wǎng)站的搜索排名)以及為用戶批量提供個(gè)性化的內(nèi)容?,F(xiàn)今已被不少媒體與營銷機(jī)構(gòu)所應(yīng)用,幫助非數(shù)據(jù)科學(xué)界人士更好地了解其所在組織中正在發(fā)生的事情。
計(jì)算圖像的自動(dòng)生成可以實(shí)時(shí)在運(yùn)動(dòng)畫面中尋找最佳幀并在場景中無縫添加或刪除對象、更改陰影等等。斯科爾科沃科學(xué)技術(shù)研究院和三星AI中心的AI研究人員使用這一技術(shù)使舊照片和著名畫作(如《蒙娜麗莎》)“動(dòng)”了起來。但是,這樣的技術(shù)也需要應(yīng)用者的進(jìn)一步思考,如何在現(xiàn)實(shí)與修改后的場景之間劃清界限?在沒有標(biāo)簽或披露信息的情況下,應(yīng)該修改照片到什么程度?
信息智能化生產(chǎn)方面,信息呈現(xiàn),即將各種信息組合成為人類可以直接接受的文本,當(dāng)前主流的自動(dòng)化信息生產(chǎn)一般包含以下五個(gè)環(huán)節(jié):1、輸入、檢索、鎖定數(shù)據(jù);2、對原始數(shù)據(jù)進(jìn)行清洗、整理、分類;3、通過排序、比較和聚合數(shù)據(jù)明確新聞故事的關(guān)鍵事實(shí);4、按照某種敘事的語義結(jié)構(gòu)對關(guān)鍵事實(shí)進(jìn)行組織;5、對形成的文本內(nèi)容進(jìn)行審核,按照需要提供不同風(fēng)格。
在未來的人工智能編輯部,信息的智能生產(chǎn)有望能夠在算法、數(shù)據(jù)和更多人工智能新技術(shù)的基礎(chǔ)上進(jìn)行更多嘗試。比如借助新聞型機(jī)器人(news bots)協(xié)助整合新聞信息,并自動(dòng)為用戶推送特定新聞內(nèi)容;借助生產(chǎn)力型機(jī)器人(productivity bots)使媒體機(jī)構(gòu)的日常流程實(shí)現(xiàn)自動(dòng)化。利用短視頻合成虛擬環(huán)境技術(shù)(Generating Virtual Environments From Short Video)實(shí)現(xiàn)多媒體內(nèi)容的多元呈現(xiàn),讓新聞的呈現(xiàn)方式更加智能化、互動(dòng)化,提升用戶的交互體驗(yàn)。芯片設(shè)計(jì)師Nvidia已經(jīng)利用了生成對抗網(wǎng)絡(luò)(GANs)的研究成果成功利用AI使用短視頻片段構(gòu)建出逼真的3D環(huán)境,并將此投放在自動(dòng)駕駛領(lǐng)域中使用。自動(dòng)生成虛擬環(huán)境的應(yīng)用前景無窮,可以應(yīng)用于物流(倉庫、工廠、運(yùn)輸中心)、城市規(guī)劃模擬,甚至包括測試游樂園和購物中心內(nèi)的客流量場景。
從現(xiàn)階段的業(yè)界實(shí)踐,不難預(yù)見,未來的信息智能生產(chǎn),有巨大的智能化探索空間。例如,斯坦福大學(xué)進(jìn)行的自動(dòng)視頻編輯產(chǎn)品實(shí)驗(yàn),能夠完成自帶視頻剪輯、利用面部識別和情緒識別系統(tǒng)進(jìn)行視頻的自動(dòng)剪輯并生成不同風(fēng)格的視頻。Quartz打造的聊天機(jī)器人,用戶和人工智能系統(tǒng)通過文字、語音或其他創(chuàng)新性地交互方式實(shí)現(xiàn)高效的人機(jī)互動(dòng),目前已經(jīng)可以實(shí)現(xiàn)對用戶需求的自動(dòng)讀取,同時(shí)能夠根據(jù)用戶的需求提供相關(guān)內(nèi)容,如圍繞著某一主題、人物或地點(diǎn)的新聞報(bào)道等。
在國內(nèi),搜狗與新華社共同開發(fā)打造的AI 合成主播能夠通過圖像表情,聲音語言習(xí)慣、邏輯思維層面進(jìn)行擬人化訓(xùn)練,生動(dòng)逼真地進(jìn)行新聞的播報(bào)。
2、文本審核:信息的智能識別和審核
信息的智能審核即通過機(jī)器來識別內(nèi)容并在此基礎(chǔ)上對信息加以判斷。未來,新聞機(jī)器人的使用將進(jìn)一步強(qiáng)化這一功能,并通過對大量文本的處理和實(shí)時(shí)的機(jī)器學(xué)習(xí),在語境中找出相關(guān)信息的邏輯漏洞和假消息?,F(xiàn)階段主要應(yīng)用的審核技術(shù)有:
算法的事實(shí)核查(Algorithmic Fact Checking)。德克薩斯大學(xué)阿靈頓分校和谷歌的研究人員研發(fā)了算法的框架語義自動(dòng)化技術(shù)(框架是描述了特定類型事件、情況、對象或關(guān)系及其參與者的示意圖)。通過FrameNet系統(tǒng)專門為包括自動(dòng)事實(shí)核查在內(nèi)的功能構(gòu)建新框架。
機(jī)器學(xué)習(xí)中的實(shí)時(shí)語境(Real-Time Context in Machine Learning)。IBM公司研發(fā)的Project Debater通過消化大量文本,從語境中找出邏輯漏洞、假消息,利用實(shí)際環(huán)境分辨真?zhèn)涡畔ⅰ?/p>
在屏事實(shí)核查(On-Screen Fact Checking)。杜克大學(xué)和得克薩斯大學(xué)阿靈頓分校的研究人員研發(fā)了ClaimBuster,能夠?qū)⒅辈ブ械囊?、視頻轉(zhuǎn)換為文本,通過過濾器識別其中有關(guān)事實(shí)的語句,將這些語句與數(shù)據(jù)庫進(jìn)行比對,從而實(shí)現(xiàn)事實(shí)核查。
合成并生成內(nèi)容核查(Synthetic and Generated Content Authentication)。哈佛大學(xué)和MIT-IBM Watson AI Lab的研究人員研發(fā)了一種用于識別算法何時(shí)生成文本的工具——Giant Language model Test Room,通過AI技術(shù)確定文本中的常用詞,并判斷文本是否由算法自動(dòng)完成,可以用來識別虛假或誤導(dǎo)性新聞、機(jī)器人生成的內(nèi)容及偽造品。
總的來說,當(dāng)前的信息自動(dòng)化生產(chǎn)還是物理層面上對于海量數(shù)據(jù)匯集、提取、分析和組合。這一生產(chǎn)過程的特性,在BBC的一款代表性智能化工具“果汁機(jī)(Juicer)”中體現(xiàn)非常充分和形象,它的任務(wù)是把包括新聞快訊、專題報(bào)道、視頻新聞、政府公告、社交媒體信息等在內(nèi)的海量數(shù)據(jù)匯集在一起,并進(jìn)行自由調(diào)用。自2012年首次被引用到BBC以來,Juicer平均每天處理來自850個(gè)新聞機(jī)構(gòu)、政府部門和社交網(wǎng)站的RSS信息推送,并能夠通過語義辨識對輸入的信息根據(jù)信源、地點(diǎn)、人物和事件進(jìn)行整理歸檔。當(dāng)記者需要調(diào)取關(guān)于某個(gè)主題的新聞或信息時(shí),“Juicer”能夠快速提供一個(gè)包含相關(guān)內(nèi)容的清單。目前,Juicer的審核內(nèi)容僅限于文字部分,未來它有望實(shí)現(xiàn)對圖片和視頻內(nèi)容的監(jiān)控與標(biāo)簽化審核。
在智能化的信息生產(chǎn)方面,未來的人工智能編輯部不僅要實(shí)現(xiàn)在物理層面對于海量數(shù)據(jù)的匯聚和使用,更要通過人工智能技術(shù)的支持,讓基于對更廣泛的數(shù)據(jù)中包含的每一條信息內(nèi)容的元素,自動(dòng)自發(fā)地實(shí)現(xiàn)與其他信息內(nèi)容元素的連接和碰撞,類似一種化學(xué)反應(yīng)的生成。不同的數(shù)據(jù)在各種人工智能及算法的助力下通過實(shí)時(shí)的信息結(jié)構(gòu)化、數(shù)據(jù)可視化、信息智能識別和更加智能化的審核功能,不僅包括對文本內(nèi)容語境的邏輯漏洞,也包括對圖片、視頻、VR等多種內(nèi)容形態(tài)進(jìn)行實(shí)時(shí)的審核修正。自動(dòng)化生產(chǎn)來發(fā)揮出有如核聚變般的巨大潛能。讓自動(dòng)化的新聞生產(chǎn)過程從“攪拌機(jī)”工具進(jìn)一步向“核反應(yīng)堆”“基因編輯器”發(fā)展,讓內(nèi)容形態(tài)的生產(chǎn)過程從物理形態(tài)進(jìn)一步向核反應(yīng)、基因工程的化學(xué)形態(tài)發(fā)展。
(三)智能化分發(fā)
現(xiàn)階段,信息分發(fā)在現(xiàn)在整個(gè)信息生產(chǎn)和消費(fèi)中居于核心地位,在主流媒體和商業(yè)平臺的競爭中處于關(guān)鍵位置。智能化信息分發(fā)的核心是將信息的內(nèi)容和信息的應(yīng)用場景進(jìn)行智能的匹配,以期提升分配效率,并充分實(shí)現(xiàn)信息的價(jià)值。
人工智能編輯部的智能化信息分發(fā)模式的完善應(yīng)把握好分發(fā)效率和用戶關(guān)系這兩個(gè)方面。一方面,智能化的信息分發(fā),要基于信息內(nèi)容標(biāo)簽來響應(yīng)用戶不同場景下的信息需求,以提高分發(fā)的適配度和傳播效率;另一方面,應(yīng)以公共廣泛參與為背景,通過算法促進(jìn)社交關(guān)系的建立,依托智能化的社交關(guān)系提高信息分發(fā)效率。
智能化的信息分發(fā)模式中尤其重要的一點(diǎn)是,為促進(jìn)社會共同利益的更大化實(shí)現(xiàn),應(yīng)該在分發(fā)規(guī)則的算法設(shè)定中充分體現(xiàn)主流價(jià)值觀。不僅僅局限于對于社會主義核心價(jià)值觀48字的內(nèi)容的簡單識別分發(fā),而更多將精力放在將數(shù)據(jù)、算法、人機(jī)交互有機(jī)結(jié)合,建立用戶和資源的個(gè)性化關(guān)聯(lián)機(jī)制,并對信息的價(jià)值實(shí)時(shí)實(shí)現(xiàn)有效評估和有效適配。由于個(gè)人移動(dòng)終端的使用場景和人的心理特征,“點(diǎn)擊量”實(shí)際上更多地表征了特定的資訊內(nèi)容對用戶的趣味性,而信息的重要性如何體現(xiàn),仍然是當(dāng)前推算法模型的盲區(qū)。
在智能化的信息分發(fā)過程中,我們?nèi)匀恍枰獙Α靶省钡淖非蟊3忠欢ǖ木?。算法分發(fā)雖然可以通過信息內(nèi)容的個(gè)性化匹配實(shí)現(xiàn)“人找消息”和“信息找人”效率的提升,滿足個(gè)性化需求,但不同的算法推薦原理和數(shù)據(jù)攝入會導(dǎo)致不同的風(fēng)險(xiǎn),出現(xiàn)“信息繭房”“用戶閱聽權(quán)轉(zhuǎn)移”“內(nèi)容下降螺旋(流量驅(qū)動(dòng)黃色新聞)”等問題。
(四)智能接收:終端系統(tǒng)智能化
在信息的智能化接收方面,人工智能編輯部將依托擁有多種終端播控技術(shù)和播控權(quán)的綜合優(yōu)勢,主要通過信息接收終端設(shè)備的智能化來實(shí)現(xiàn)。根據(jù)國內(nèi)外現(xiàn)有實(shí)踐和研究成果來看,AI芯片組(AI Chipsets)的應(yīng)用為終端設(shè)備的智能化的實(shí)現(xiàn)提供了可能。由于缺少足夠的處理單元,當(dāng)前以智能手機(jī)為代表的移動(dòng)終端尚難滿足機(jī)器學(xué)習(xí)的深度要求。近年來關(guān)于人工智能模型壓縮的算法大量出現(xiàn),為芯片組全面集成人工智能引擎提供了技術(shù)可能,人工智能芯片組中CPU、GPU等不同功能的核心發(fā)揮各自所長又相互協(xié)作,共同實(shí)現(xiàn)高效的智能處理。2019年4月,高通研發(fā)的人工智能推理芯片Cloud AI 100,可以大大降低終端與數(shù)據(jù)中心的延遲。由此可見,主流媒體有必要把握終端設(shè)備信息接收系統(tǒng)升級這一機(jī)遇,探索研發(fā)能夠效仿人類感知、輔助人類計(jì)算和記憶、學(xué)習(xí)人類知識模型和決策經(jīng)驗(yàn)的智能硬件與支持系統(tǒng),以便在各類終端系統(tǒng)上搭建未來AI媒體入口,通過在終端對用戶所接收的信息進(jìn)行智能分析,對內(nèi)容進(jìn)行審核與過濾,通過向用戶發(fā)出提示信息等方式,培養(yǎng)用戶良好的媒介使用習(xí)慣,以營造健康的媒介環(huán)境。在這一過程中對用戶行為數(shù)據(jù)的收集,能夠有效地拓展終端信息接收系統(tǒng)的應(yīng)用場景,增強(qiáng)人機(jī)交互體驗(yàn)。
另外,未來AI媒體入口的終端系統(tǒng)應(yīng)用為矯正和破除用戶信息繭房,提供了新的機(jī)會。當(dāng)前的信息繭房問題難以解決,主要是由于不以用戶個(gè)人興趣為核心規(guī)則的算法分發(fā)技術(shù)與各分發(fā)平臺的核心商業(yè)利益相互抵觸,也與智能分發(fā)提高分發(fā)效率的初衷和目標(biāo)相互矛盾。因此,更好的方式可能是通過在信息載體的終端智能化進(jìn)行過濾。不僅可以分析和判斷每一個(gè)個(gè)體如何獲得信息、獲得了什么信息,還可以通過終端及時(shí)、個(gè)性化的對用戶進(jìn)行提示,這也有利于我們更加可靠和方便的實(shí)現(xiàn)未來人工智能在信息傳播中對主流價(jià)值觀的引導(dǎo)。
(五)智能反饋:傳播效果及路徑的抓取和分析
智能化信息反饋的目的是,使信息生產(chǎn)者和信息分發(fā)平臺的運(yùn)營者能夠及時(shí)了解信息的傳播效果和傳播路徑,從而對信息生產(chǎn)和分發(fā)環(huán)節(jié)進(jìn)行相應(yīng)調(diào)整,提升信息生產(chǎn)和運(yùn)營效率。智能化的信息反饋,主要通過對傳播效果數(shù)據(jù)的挖掘、分析以及傳播路徑的分析來實(shí)現(xiàn)。
人工智能編輯部未來將主要以兩種方式取得反饋數(shù)據(jù),其一是對于部署了“AI媒體入口”的智能化終端,自動(dòng)化地反饋數(shù)據(jù);對于其它終端,則通過數(shù)據(jù)抓取的方式來獲得更多的反饋信息。人工智能編輯部數(shù)據(jù)中臺的多終端的實(shí)時(shí)運(yùn)營數(shù)據(jù)和傳播效果評估數(shù)據(jù)都應(yīng)納入智能反饋數(shù)據(jù)庫中。
一方面,智能工具大大增強(qiáng)傳播效果分析的精準(zhǔn)度。從瀏覽量、評論量、轉(zhuǎn)載量、點(diǎn)贊量、粉絲量等顯性數(shù)據(jù),逐步深入至用戶個(gè)性化消費(fèi)的行為、偏好、趨勢等隱性數(shù)據(jù),更準(zhǔn)確地反映傳播效果和用戶個(gè)性。計(jì)算機(jī)視覺、情緒識別、情感計(jì)算等技術(shù)也有可能應(yīng)用于識別用戶“微表情”,建立實(shí)時(shí)情感識別系統(tǒng),推測用戶在信息接收與反饋時(shí)的情緒狀態(tài),完善用戶實(shí)時(shí)狀態(tài)這一關(guān)鍵的場景要素。
另一方面,用于追蹤傳播路徑的智能工具為信息的生產(chǎn)分發(fā)和信息核查都提供有效途徑。對當(dāng)前的算法分發(fā)技術(shù)進(jìn)行逆向工程分析,可以有效實(shí)現(xiàn)信息生產(chǎn)和分發(fā)的路徑優(yōu)化。通過借助語義分析技術(shù),對傳播路徑的溯源,發(fā)現(xiàn)信息傳播與變異的關(guān)鍵節(jié)點(diǎn),將大大有助于虛假信息、水軍數(shù)據(jù)的識別算法模型構(gòu)建,構(gòu)建起應(yīng)對虛假信息的新型把關(guān)機(jī)制。
三、結(jié)語
整體上講,人工智能持續(xù)為信息傳播領(lǐng)域賦能,實(shí)現(xiàn)媒體行業(yè)從微觀到宏觀的全面變革,強(qiáng)化智能化信息采集和信息生產(chǎn),從“可知”邁入更具有豐富性的“可感”;強(qiáng)化智能化信息分發(fā),從基礎(chǔ)個(gè)性化分發(fā)到主流價(jià)值觀駕馭的數(shù)據(jù)推送,創(chuàng)新“為我”的定制感;強(qiáng)化智能化信息接收和反饋,在智能化終端系統(tǒng)的助力下進(jìn)一步實(shí)現(xiàn)“懂我”的滿足感;強(qiáng)化智能化信息反饋,通過信息傳播效果數(shù)據(jù)及路徑的抓取分析反哺信息的生產(chǎn)和分發(fā),充分發(fā)揮好全程媒體、全息媒體、全員媒體、全效媒體的功能。
信息傳播的外部性要求信息生產(chǎn)者及傳播平臺尤其是主流媒體在開發(fā)和利用人工智能時(shí),必須承擔(dān)起社會責(zé)任,比如防止濫用、保護(hù)個(gè)體用戶的隱私,并體現(xiàn)主流價(jià)值觀的引導(dǎo)作用。同時(shí),人工智能的強(qiáng)大能力及潛力要求“科技向善”,人工智能的開發(fā)和利用應(yīng)以增加社會成員的共同福祉和社會的共同利益作為基本的價(jià)值。
參考文獻(xiàn):
[1]宋建武.全媒體傳播格局中的主流價(jià)值引領(lǐng)[J].新聞與寫作,2019(11):1.
[2]李鵬.建設(shè)智媒體,打造新型傳播平臺[J].新聞戰(zhàn)線,2019(13):17-19.
[3]宋建武.沒有自主可控的平臺,就沒有主流媒體的一切[J].青年記者,2019(10):4.
[4]智媒前沿.“媒體+AI”生態(tài)布局重大創(chuàng)新:“人工智能編輯部”,來了![OL].https://mp.weixin.qq.com/s/liiApIvcH9MoKGGBaSihfg
[5] FTI 2020 Entertainment. Media and Technology Trends Report,2019.
(宋建武系中國人民大學(xué)新聞學(xué)院教授、博士生導(dǎo)師,新聞與社會發(fā)展研究中心及國家發(fā)展與戰(zhàn)略研究院研究員;于書亞系中國人民大學(xué)新聞學(xué)院碩士研究生。)