趙晗陽
自動化新聞指的是在新聞生產(chǎn)過程中“在沒有或者有限的人類干預(yù)下,由預(yù)先設(shè)定的程序?qū)?shù)據(jù)轉(zhuǎn)化為新聞文本的自動算法過程”[1],是隨著技術(shù)提升和數(shù)據(jù)庫資料的擴(kuò)充,由計(jì)算機(jī)輔助報道演化而來的新聞生產(chǎn)新方式。
自2015年始,國內(nèi)的自動化生產(chǎn)技術(shù)與新聞內(nèi)容也進(jìn)入快速發(fā)展時期,騰訊的“Dreamwriter”、新華社的“快筆小新”、阿里巴巴與第一財(cái)經(jīng)的“DT稿王”、今日頭條的“Xiaomingbot”、百度的“度秘解說”、南方都市報的“小南”以及廣州日報的“阿同”等機(jī)器人寫手相繼推出,自動化生產(chǎn)成為新聞傳播的重要組成部分。
與當(dāng)前自動化新聞廣泛的生產(chǎn)實(shí)踐活動相較,自動化新聞的學(xué)術(shù)研究相對滯后。筆者將從三種關(guān)系層面對自動化新聞的邊界進(jìn)行探析,以厘清自動化新聞研究領(lǐng)域存在的三種誤區(qū)。
在前述的由預(yù)先設(shè)定的程序?qū)?shù)據(jù)轉(zhuǎn)化為新聞文本這一新聞生產(chǎn)過程中,國內(nèi)學(xué)界一直存在機(jī)器人新聞與自動化新聞這兩種稱謂,筆者認(rèn)為,這一對概念之間有很大區(qū)別:
一方面,從形式上看,機(jī)器人新聞強(qiáng)調(diào)存在機(jī)器人這樣一個實(shí)體,或是肉眼可見的一個科技產(chǎn)品,通過此類產(chǎn)品形成新聞稿件;自動化新聞并無較高的產(chǎn)品形式要求,生成新聞依賴的是抽象的計(jì)算機(jī)軟件、代碼或數(shù)據(jù)。
另一方面,從內(nèi)容上看,機(jī)器人新聞的外延更廣,強(qiáng)調(diào)新聞生產(chǎn)需從新聞采集延伸到新聞產(chǎn)品呈現(xiàn)的全自動。從當(dāng)前的實(shí)踐情況看,自動化新聞只需在相應(yīng)的數(shù)據(jù)庫中搜尋符合某種算法的數(shù)據(jù)進(jìn)行新聞生產(chǎn),對新聞的采集與分發(fā)無具體要求。機(jī)器人新聞與自動化新聞是兩種不同的概念。當(dāng)前我國對此種新聞生產(chǎn)行為的研究應(yīng)是更注重算法的自動化新聞。筆者下文將統(tǒng)一運(yùn)用“自動化新聞”這一稱謂代替“機(jī)器人新聞”這一模糊概念。
有學(xué)者認(rèn)為,自動化新聞是一種基于大數(shù)據(jù)的生產(chǎn)模式,大數(shù)據(jù)時代的到來將自動化新聞的分析對象由結(jié)構(gòu)化轉(zhuǎn)為半結(jié)構(gòu)化乃至非結(jié)構(gòu)化,筆者看來,這種觀點(diǎn)實(shí)為對大數(shù)據(jù)與自動化新聞關(guān)系的強(qiáng)扭。
首先,從數(shù)據(jù)量的角度看,此數(shù)據(jù)應(yīng)為單機(jī)處理不了的內(nèi)容(如內(nèi)存限制、時間過久等),定量來說至少是PB級別以上的數(shù)據(jù)才能算是大數(shù)據(jù)。
其次,復(fù)雜算法也是動用大數(shù)據(jù)的基本條件之一,如自動化新聞所需數(shù)據(jù)只是PB級數(shù)據(jù)庫中數(shù)據(jù)的簡單累加或簡單計(jì)算,也不能稱之為動用了大數(shù)據(jù)的方式進(jìn)行處理。
真正的大數(shù)據(jù)運(yùn)算是同時滿足數(shù)據(jù)量和復(fù)雜算法這兩個標(biāo)準(zhǔn)時才會動用的手段。因此,自動化新聞生產(chǎn)和大數(shù)據(jù)的處理技術(shù)基本沒有關(guān)聯(lián)。自動化新聞的工作人員會構(gòu)建一個相對有限的數(shù)據(jù)庫。拿一場籃球比賽來說,新聞算法動用的數(shù)據(jù)也不過是歷史上相關(guān)籃球比賽的所有數(shù)據(jù),對于球員的度假信息、教練是如何參與當(dāng)?shù)卣我活惖难诱剐孕畔⒉]有過多涉及。即使是自動化寫手計(jì)算了該領(lǐng)域全部報道者的語言文字特點(diǎn),算法所基于的數(shù)據(jù)也只是有限的結(jié)構(gòu)化數(shù)據(jù),而非半結(jié)構(gòu)化甚至非結(jié)構(gòu)化數(shù)據(jù),更不用說大數(shù)據(jù)所謂的全量數(shù)據(jù)?;诖说乃惴ㄖ恍枰?jì)算一下兩球隊(duì)歷史上的交鋒次數(shù)與勝率,某球員獲得職業(yè)生涯最高分等數(shù)據(jù),用較為簡單的算法嵌套在預(yù)先寫好的模板中,便可生成新聞內(nèi)容。從以上分析可以看出,那些強(qiáng)扭自動化新聞與大數(shù)據(jù)關(guān)系的觀點(diǎn)顯然是站不住腳的。那么大數(shù)據(jù)與自動化新聞的關(guān)系是什么呢?
大數(shù)據(jù)時代的核心是預(yù)測,這種預(yù)測精神才是大數(shù)據(jù)帶給自動化新聞的最大貢獻(xiàn)。通過這種思維的創(chuàng)新,數(shù)據(jù)處理人員可以在相對結(jié)構(gòu)化的數(shù)據(jù)里通過某些算法找出所研究對象的發(fā)展趨勢,對其進(jìn)行基于海量數(shù)據(jù)的合理預(yù)測,以此更好地研判自動化寫手不太擅長的分析類報道。
當(dāng)前學(xué)界對自動化新聞的生產(chǎn)流程基本達(dá)成共識:經(jīng)由一個結(jié)構(gòu)化的數(shù)據(jù)處理、新聞性的測量、報道角度的選擇及排序、報道角度與數(shù)據(jù)點(diǎn)的匹配及報道文本的生產(chǎn)過程。從流程中我們不難看出自動化新聞是一種從信息數(shù)據(jù)經(jīng)由特定算法到達(dá)新聞文本的生產(chǎn)過程,但其所生產(chǎn)的新聞文本并不是最終投放界面的新聞產(chǎn)品,而是上傳到發(fā)布者的內(nèi)容管理平臺就結(jié)束了整個流程。
從當(dāng)前學(xué)界對自動化新聞的研究看,對其積極影響中的滿足個性化需求、放大長尾效應(yīng)以及消極影響里形成的“過濾氣泡”“信息繭房”以及造成“單向度的人”的觀點(diǎn),筆者不敢茍同。
推送分發(fā)軟件可以通過分析用戶的瀏覽記錄和喜好,運(yùn)用某種算法,點(diǎn)對點(diǎn)地為用戶推送其喜聞樂見或關(guān)心的新聞信息,具體來說,推送機(jī)制主要依靠用戶資料與用戶瀏覽記錄等建立與新聞內(nèi)容相似的匹配模型,并通過用戶的點(diǎn)擊收藏等正向反饋與標(biāo)記“不感興趣”的負(fù)反饋不斷優(yōu)化和提高投放的精準(zhǔn)度,但這都已經(jīng)超出了自動化新聞這一生產(chǎn)流程的范疇。如果我們強(qiáng)行認(rèn)為,正是因?yàn)樽詣踊侣効梢栽诙虝r間內(nèi)生產(chǎn)海量的新聞,才使得推送的算法擁有更多可以個性化精準(zhǔn)投放的資源,那無異于《寡人之于國也》中所描述的:“刺人而殺之,曰:‘非我者,兵也?!被谝陨嫌^點(diǎn),我們可以做出判斷,自動化新聞旨在進(jìn)行新聞文本生產(chǎn)成型以及之前的流程實(shí)踐,至于如何推送,是由其他算法進(jìn)行的,自動化新聞與新聞信息的推送機(jī)制無直接關(guān)聯(lián)。
學(xué)界普遍認(rèn)為,自動化新聞的發(fā)展,不會帶給新聞業(yè)和人類記者毀滅性的打擊,相反我們要利用好自動化寫手,使之與人類記者在新聞寫作的廣度和深度方面互補(bǔ)長短,助推新聞業(yè)的全面進(jìn)步。
在撫育管理方面,林地間作不科學(xué)、不合理;林地?fù)嵊芾聿患皶r,管理經(jīng)營粗放,導(dǎo)致原有油茶林地灌木和雜草瘋狂生長,造成與油茶爭光、爭水、爭養(yǎng)分,使得油茶長勢頹廢不健壯、欠佳。
與當(dāng)前研究領(lǐng)域的觀點(diǎn)相同,筆者也相信自動化新聞的發(fā)展會帶給新聞界更多積極的變化與發(fā)展,但發(fā)展的方面和程度,需要我們仔細(xì)考究并提出特色化發(fā)展建議。除去已有研究成果中的擴(kuò)展信息采集庫、提高相關(guān)技術(shù)水平、增加算法信息透明度、“術(shù)業(yè)專攻”地生產(chǎn)專業(yè)新聞外,筆者在新聞信息搜集、新聞事實(shí)核查與新聞產(chǎn)品融合角度對自動化新聞做出展望。
在上文中,筆者指出我國當(dāng)前研究領(lǐng)域的自動化新聞是由提取數(shù)據(jù)庫中有效信息而進(jìn)行的新聞生產(chǎn),但隨著技術(shù)的發(fā)展,自動化新聞的外延應(yīng)更為廣闊。
2016年3月,《華盛頓郵報》研發(fā)出聊天機(jī)器人“Feels”,在美國總統(tǒng)大選三周前,“Feels”聊天機(jī)器人每天晚上以一個簡單的問題與讀者互動:“今天的大選讓您感覺如何?”隨后的第二天早上,聊天機(jī)器人便向用戶推送關(guān)于前一天大選的感覺圖表和關(guān)于用戶感覺的原因摘錄。[2]通過此種方式,“Feels”將用戶信息采集并儲存在自己的信息庫中,直接充當(dāng)了傳統(tǒng)自動化新聞中的數(shù)據(jù)庫。學(xué)者匡文波提出:“技術(shù)總是會讓新聞報道增色”[3],我們有理由相信自動化新聞的光明前景。如若將機(jī)器人的信息采集、自動化新聞生產(chǎn)與新聞信息推送的算法整合到同一產(chǎn)品之中,自動化新聞就將由半自動化轉(zhuǎn)向全自動,新聞實(shí)踐就會有突破性進(jìn)展。
2016年,英國的一家事實(shí)檢查機(jī)構(gòu) Full Fact發(fā)布了測試版的監(jiān)控系統(tǒng),旨在從幾十個英國新聞網(wǎng)站(BBC、衛(wèi)報等)中搜尋信息,自動分析英國議會記錄和其他一些內(nèi)情,目標(biāo)是捕捉每個謠言的生命周期,進(jìn)而粉碎這些謠言。Full Fact下一步的計(jì)劃是以概念驗(yàn)證的方式進(jìn)行自動化檢測和核實(shí)統(tǒng)計(jì)出來的報道,在確保數(shù)據(jù)機(jī)器可讀的情況下提高人工智能的情景分析能力。[4]
這個實(shí)踐活動向我們展示了自動化新聞作為客觀無思想的科技產(chǎn)品,不僅在新聞生產(chǎn)領(lǐng)域有重要作用,在事實(shí)的核實(shí)方面也有人工無法達(dá)到的優(yōu)勢。正如Full Fact 的主任 Will Moy所言,事實(shí)核查在信息來源中監(jiān)控媒體、確認(rèn)關(guān)于事實(shí)的報道、檢驗(yàn)真假和公布核實(shí)結(jié)果的四個階段都可能實(shí)現(xiàn)自動化。
在美國學(xué)者簡·斯蒂文森(Jane Stevens)的定義里,融合新聞是文本、照片、視頻段落、音響、圖表和互動性的集合體,它以非線性結(jié)構(gòu)呈現(xiàn)在網(wǎng)站上,不同媒介的內(nèi)容互相補(bǔ)充且不重復(fù)。[5]若想拓寬自動化新聞的報道領(lǐng)域,提高新聞內(nèi)容的深度和適用性,應(yīng)使其所生產(chǎn)的新聞產(chǎn)品呈現(xiàn)出融合的形式。
自動化新聞一個很大的問題在于其涉足領(lǐng)域局限在天氣預(yù)報、體育賽事、公司財(cái)報、信息匯編、突發(fā)快訊等,但這種劣勢恰恰也是自動化寫手占領(lǐng)上述領(lǐng)域的有利條件。自動化新聞的算法不僅可以選取海量數(shù)據(jù)中的相對應(yīng)數(shù)據(jù)嵌套進(jìn)模版以生成文字,運(yùn)用其準(zhǔn)確高效的算法生產(chǎn)圖表、鏈接相關(guān)新聞及圖片,未來甚至可以做到在技術(shù)從業(yè)者將所采集到的音頻、視頻上傳到材料庫中后對其音頻和圖畫信息進(jìn)行解碼、重新編碼,最終形成嵌套文字、圖片、音頻、視頻等小模版的融合型大模版,直接生成融合式新聞內(nèi)容,再由相關(guān)從業(yè)人員進(jìn)行簡單的人性化處理,形成新聞產(chǎn)品。2016年10月,美聯(lián)社戰(zhàn)略企業(yè)發(fā)展部高級副總裁JimKennedy,在接受采訪時透露了美聯(lián)化人工智能應(yīng)用的下一個方向:將文字新聞自動轉(zhuǎn)換為廣播。[6]該項(xiàng)目的設(shè)想是,開發(fā)團(tuán)隊(duì)集中于一項(xiàng)特定的體育項(xiàng)目,制作出將文字轉(zhuǎn)換為廣播的模版,在此基礎(chǔ)上開發(fā)出適用于這一轉(zhuǎn)換的算法。這種融合式的新聞既保證了新聞時效性,又使自動化寫手所生產(chǎn)的新聞內(nèi)容得到更充分的展示,是吸引用戶關(guān)注、增加用戶在特定領(lǐng)域的黏性的可行之舉。
注釋:
[1] 許向東,郭萌萌.智媒時代的新聞生產(chǎn):自動化新聞的實(shí)踐與思考[J].國際新聞界,2017(5).
[2] 聊天機(jī)器人是新一代資訊App?《華盛頓郵報》最新開發(fā)手記曝光|獨(dú)家編譯[EB/0L].傳媒狐,[2016-12-19].http://www.sohu.com/a/121939061_465296.
[3] 匡文波.記者會被機(jī)器人取代嗎?[J].新聞與寫作,2017(9).
[4] 在人工智能和新聞的結(jié)合上,國外媒體已經(jīng)飛起來了?[EB/0L].刺猬公社,[2016-12-06].http://36kr.com/p/5058392.html.
[5]Jane Stevens.multimedia storytelling: learn the secrets from experts at multimedia storytelling institute 2014 [EB/OL].[2013-12-14]. http://multimedia.journalism.berkeley.edu/tutorials/starttofinish/multimedia/.
[6] 美 聯(lián) 社 黑 科 技 :機(jī) 器 人 寫 稿, 還 要 轉(zhuǎn) 換 成 廣 播 [EB/0L].傳 媒 狐 ,[2016-11-05].http://m.sohu.com/n/473268658/?pvid=000115_3w&_once_=000022_shareback_wechat_flow.