文/王曉楠
機器人新聞對新聞報道的挑戰(zhàn)與反思
文/王曉楠
機器人新聞是借助計算機程序和大數(shù)據(jù)分析而產(chǎn)生的。機器人新聞的出現(xiàn)對傳統(tǒng)新聞報道的時效性、客觀性和背景材料整合等方面帶來了挑戰(zhàn)。但這并不代表機器人新聞可以取代人工新聞報道,因為機器人新聞報道僅限于事實,對事實背后的原因很難表達,客觀性表現(xiàn)使新聞失去了人文關(guān)懷,且其提供的背景材料也是十分有限的。
中國地震臺網(wǎng)在2017年8月8日21時40分,根據(jù)測定結(jié)果自動發(fā)布了一篇名為《四川阿壩州九寨溝縣發(fā)生7.0級地震》的短消息。在這條消息中,不僅將地震信息完整、及時、準確地發(fā)布了出來,同時在文章末尾中也同樣做出了這樣的標注:“上述內(nèi)容由本站機器自行編寫,編寫耗時25s?!痹谶@條短消息中,用540個字和4張圖片,將所需要傳遞的八項內(nèi)容完整地表述了出來,并且在語法、文體上都非常規(guī)范。而在這條信息發(fā)布不久之后,被新華社官微全文引用,于3分鐘后發(fā)布了這一條消息,證明了中國地震臺網(wǎng)所發(fā)布信息的真實性和有效性。隨后,中國地震臺網(wǎng)還相繼發(fā)布了后續(xù)13次余震情況,均采用了機器人自動生成報道的形式編寫。
機器人新聞在中國第一次受到廣泛關(guān)注,引發(fā)了學界對機器人新聞的熱議。40年前,世界上第一個“故事寫作機器人算法”出現(xiàn)在耶魯大學,40年后的今天,隨著大數(shù)據(jù)技術(shù)的發(fā)展,機器人新聞已經(jīng)成熟。機器人新聞究竟如何運作,對新聞業(yè)又哪些影響,存在哪些問題,值得學界和業(yè)界關(guān)注。
筆者所介紹的“新聞機器人”,實際上是一種具有新聞素材自動搜集并編寫成符合人類閱讀習慣、語言規(guī)范的內(nèi)容的一種算法或者軟件。也就是說,“新聞機器人”從本質(zhì)上來說,是一種通過一系列數(shù)據(jù)規(guī)則而完成新聞信息素材抓取、分析以及自動編制成符合人類閱讀習慣的新聞生產(chǎn)方式、方法,具有一定的創(chuàng)新性和技術(shù)性。
我國的機器人新聞起步較晚,直到近年來大數(shù)據(jù)技術(shù)發(fā)展起來后才受到關(guān)注。騰訊新聞在2015年首次發(fā)布了國內(nèi)第一篇機器人新聞——《8月CPI同比上漲2%創(chuàng)12個月新高》。同年年底,新華社的新聞機器人“快筆小新”系統(tǒng)正式上線,只要輸入一個股票代碼,“快筆小新”即可在短短3秒鐘時間里完成一篇專業(yè)性極強的財報分析文稿的撰寫工作。
機器人是如何生產(chǎn)新聞的?哥倫比亞大學新聞學院Tow數(shù)字新聞中心曾把其生產(chǎn)流程分解為五個步驟:第一,學習大量標準化、結(jié)構(gòu)化的信息資料;第二,對信息資料中所隱藏的“新聞性”進行有針對性的分析和判斷;第三,結(jié)合實際情況,將確定下的一系列報道角度,按照優(yōu)先度進行排序;第四,匹配報道內(nèi)容和報道角度;第五,按照預先設(shè)定的流程和結(jié)構(gòu)生成新聞報道文本。
第一步,無論采用何種算法,都需要有相應(yīng)的海量數(shù)據(jù)輸入。而所輸入的數(shù)據(jù)越豐富、越“干凈”的領(lǐng)域越容易開發(fā)出具有實用價值的自然語言自動生成系統(tǒng)。數(shù)據(jù)的數(shù)量和質(zhì)量,決定了新聞機器人所能夠提供的新聞文稿的最終質(zhì)量。
第二步,完成數(shù)據(jù)輸入和讀取操作之后,算法將會對信息資料中所隱藏的“新聞性”進行針對性的判斷和分析。算法會挑出數(shù)據(jù)中最“反?!钡姆矫?,再通過歷史數(shù)據(jù)的對比分析,找尋“不同尋?!钡牡胤?,并以此為依據(jù)判斷信息存在“新聞性”。
第三步,在判斷信息具有“新聞性”之后,算法將會結(jié)合實際情況,將確定下的一系列報道角度,按照優(yōu)先度進行排序。而這里的報道角度,實際上是預先輸入的框架結(jié)構(gòu),選擇可行度最高的組織新聞報道的內(nèi)容。
第四步,完成上述工作之后,算法將會結(jié)合信息的實際情況,在其中搜索“故事點”,作為報道的主要方向。算法可以按照“接近性”原則優(yōu)先或重點報道相關(guān)新聞事實。
第五步,以自然語言的規(guī)范為基礎(chǔ),對所編纂的新聞稿件進行潤色。這一步對于算法的技術(shù)有著極高的要求,也同樣是影響新聞報道可讀性的主要因素。
事實表明,在一些財經(jīng)類、體育類的機器人新聞報道文稿中,讀者基本上無法分辨文稿是真正的人所撰寫的,還是機器人所生成的。而這種情況的客觀存在,證明了在新聞報道領(lǐng)域,機器人或者說機器算法的應(yīng)用有著廣闊的前景,一些特定題材的新聞已經(jīng)對新聞記者帶來了挑戰(zhàn)。
盡管不少人對機器人新聞仍存質(zhì)疑,但不可否認的是,機器人新聞的出現(xiàn)已經(jīng)在逐漸改變一些領(lǐng)域新聞報道的情況。特別在新聞的時效性、客觀性和背景材料選擇上,可以做得比人類的采訪報道更快、更好。
一是前所未有的時效性沖擊傳統(tǒng)時效觀念。新聞的時效性歷來是新聞的首要特點,也是新聞報道競爭的焦點。傳統(tǒng)的新聞采訪報道高度重視速度,甚至引發(fā)“搶新聞”的說法。盡管互聯(lián)網(wǎng)時代,新聞時效性已經(jīng)由于出現(xiàn)自媒體現(xiàn)場新聞而發(fā)生了變化,但機器寫作的出現(xiàn)卻極大提升了新聞的時效性。相對于新聞編輯來說,新聞機器人完全可以做到7×24小時在崗,只要發(fā)生突發(fā)事件,機器人就會通過各種渠道進行數(shù)據(jù)的采集工作,并按照預先設(shè)定的算法完成稿件的編寫工作,及時發(fā)布出去。
實踐中,機器人新聞在突發(fā)事件報道上已表現(xiàn)出不俗的成績,挑戰(zhàn)了人類新聞報道時效的極限。如,當前已經(jīng)投入實際使用的 Wordsmifh平臺,可以在1秒鐘時間完成2000篇文章的編寫工作。而我國的新聞機器人技術(shù)也同樣處于世界領(lǐng)先水平。早在2015年,騰訊的新聞機器人就能夠根據(jù)政府所提供的CPI資料,在短短幾分鐘時間內(nèi)完成相關(guān)領(lǐng)域新聞稿件從編寫到發(fā)布的一系列操作;2017年8月9日,新疆發(fā)生地震,中國地震臺網(wǎng)機器人新聞發(fā)布消息僅用時8秒。機器人新聞對新聞時效的挑戰(zhàn),或許將徹底改變傳統(tǒng)新聞理論中對新聞時效的認知。新聞機器人的出現(xiàn),不僅極大地提升了新聞出產(chǎn)的效率,同時對于新聞時效性的提升所具有的重要意義更是不言而喻的。
二是基于事實的客觀性挑戰(zhàn)選擇性報道??陀^性是新聞報道的基本原則之一。客觀報道講究用事實說話,不摻雜個人評論。在傳統(tǒng)新聞報道中,由于新聞事實是人為選擇的,無論其如何運用事實進行報道,終究難以擺脫人為的感情傾向,進而影響客觀性。機器人新聞的出現(xiàn),在客觀性方面對傳統(tǒng)新聞報道“選擇性的客觀報道”帶來強烈沖擊。
全自動的新聞生產(chǎn),是機器人新聞最為顯著的特征。在實際的新聞內(nèi)容撰寫過程中,人在其中只是程序設(shè)定時發(fā)揮了作用,而整個寫作過程都是機器人自行完成的,實現(xiàn)了寫作主體由人向機器的轉(zhuǎn)變。機器人寫作新聞時,對已有資料或數(shù)據(jù)庫進行大量數(shù)據(jù)采集,運用算法對采集到的數(shù)據(jù)進行關(guān)鍵信息提取和結(jié)構(gòu)化處理,完全是客觀存在的數(shù)據(jù)和事實。
以中國地震臺網(wǎng)對8月8日四川發(fā)生的地震報道內(nèi)容為例,機器人編纂的新聞內(nèi)容涵蓋了當?shù)氐臒崃θ丝凇⒄鹬刑鞖?、速報參?shù)、周邊村鎮(zhèn)、歷史地震以及震中地形和震中簡介在內(nèi)的八項內(nèi)容。這些事實都是機器人根據(jù)程序計算出來的,完整全面且客觀地報道了相關(guān)事實。而如果換作是人類記者采訪,難免會根據(jù)其認定的新聞價值進行選擇。
三是背景材料整合力度超出人為搜集。作為新聞中描繪事件環(huán)境、人物客觀條件、烘托主題的重要內(nèi)容,新聞背景對于新聞信息立體化有著重要的現(xiàn)實意義。在深度報道中,新聞背景材料的運用可以使報道更加全面、完整,加強報道的深度。特別是新媒體的發(fā)展對傳統(tǒng)新聞報道帶來沖擊之后,基于背景材料的整合的深度報道甚至被視為迎接挑戰(zhàn)的出路。
機器人新聞的出現(xiàn),沖擊了傳統(tǒng)新聞報道人工的資料搜集整理工作。在機器人新聞的產(chǎn)生和發(fā)展過程中,互聯(lián)網(wǎng)數(shù)據(jù)、用戶生成內(nèi)容等資源起到了重要的推動作用。而數(shù)據(jù)挖掘等技術(shù),則為機器人新聞素材的整合奠定了堅實的基礎(chǔ)。機器人新聞對背景材料及數(shù)據(jù)的搜集整理廣度、深度和時效都是人工所不能達到的。
機器人新聞在給傳統(tǒng)新聞報道帶來挑戰(zhàn)的同時,存在一些技術(shù)本身所無法避免的問題。正是因為存在這些問題,讓我們可以冷靜看待機器人新聞的意義,而不至于過于夸大機器人新聞的作用。
一是報道對象限于客觀事實。機器人新聞是基于計算機軟件程序和大數(shù)據(jù)分析的,這就導致機器人新聞只能在擁有龐大數(shù)據(jù)的分析基礎(chǔ)上產(chǎn)生。然而,新聞事實往往不僅限于新聞事件本身,還有各種歷史和背景信息,有宏觀真實和微觀真實之分,機器人新聞在這些事實的判斷上顯然缺乏人工新聞的智能。
所以,新聞機器人的應(yīng)用,只能局限于固定的部分領(lǐng)域之中。實際上,在這些可供新聞機器人發(fā)揮作用的新聞領(lǐng)域中,客觀的數(shù)據(jù)及分析是其最大優(yōu)勢,而一旦進入時政、文化、社會類新聞,必然受限于數(shù)據(jù)。即便是這些機械化的領(lǐng)域,機器人新聞也只能在分析結(jié)果基礎(chǔ)上根據(jù)人工設(shè)定程度選擇新聞點,套用相應(yīng)的模板生成新聞內(nèi)容??梢姡瑱C器人在新聞寫作上的創(chuàng)造力,實際上仍然是人類創(chuàng)造力的直接體現(xiàn),大可不必對其心懷憤懣。
二是客觀形式缺乏人文關(guān)懷。誠然,客觀報道是新聞報道的原則。但是,新聞報道之所以有魅力,在于其深刻的人文關(guān)懷,一則缺乏人文關(guān)懷的新聞將失去靈性,顯得乏味。因此,在機器人新聞發(fā)展勢頭強勁,業(yè)界、學界贊譽有加之時,我們也應(yīng)當意識到其技術(shù)上的不足,導致機器人記者只能以現(xiàn)有的模板和知識庫為基礎(chǔ)撰寫新聞文稿,不僅模式化問題嚴重,而且缺乏人文氣息、缺乏必要的情感。
美國國家公共電視臺在2015年組織了一場新聞編輯和新聞機器人新聞稿件撰寫比賽。雖然新聞機器人只用了短短2分鐘就完成了撰寫工作,但是在文章質(zhì)量的投票上,得票數(shù)卻遠遠少于人類所撰寫的新聞。從中我們可以發(fā)現(xiàn),新聞機器人所生成的新聞難以具有足夠的吸引力,對受眾而言,顯得“冰冷”而缺乏吸引力。
究其原因有三點:一是新聞機器人在實際應(yīng)用過程中,只能呆板地提取知識庫和模板庫中的東西,而不可能對情緒做出有效的判斷;二是新聞機器人很難做到歸因和舉證,無法引導讀者深入思考新聞;三是新聞機器人本身嚴重依賴于內(nèi)置邏輯的特征決定了無法適應(yīng)敘事性新聞稿件的撰寫要求。
三是背景材料限于事實材料。新聞背景材料的內(nèi)容是十分廣泛的,它不僅涵蓋了相應(yīng)的社會背景、歷史條件等內(nèi)容,同時也必然涉及到政治背景、知識背景等一系列新聞環(huán)境。與此同時,新聞背景運用方式上的差異,也同樣可以將其進一步劃分為說明性背景材料、對比性背景材料、注釋性背景材料等多種情況。在實際的報道過程中,結(jié)合同期聲、錄像、圖片以及各種電腦圖表等一系列聲畫資料,可以給受眾以直觀的感受。
如上文所述,機器人新聞受技術(shù)自身限制,報道范圍集中在體育、經(jīng)濟、災難等涉及大量數(shù)據(jù)、圖表和量化分析的專業(yè)領(lǐng)域。這些背景材料存在其局限性:一方面,背景材料是否可以進入新聞,取決于軟件程序員編程時的設(shè)定;另一方面,對一些社會背景、知識背景類的材料,機器人很難根據(jù)程序獲得。事實上,機器人新聞的背景材料,在信息海洋中是十分有限的,況且很多背景材料受眾可以通過網(wǎng)絡(luò)渠道獲得,并未體現(xiàn)出人為加工后的特定語境和用意。
作者系吉林師范大學傳媒學院講師
本文系2015年吉林省社會科學基金項目(基地項目)“新媒體語境下吉林省傳統(tǒng)文化的傳播與發(fā)展研究”(項目編號:2015JD7)的研究成果。