石 超
(新華通訊社,北京 100083)
日新月異的新媒體技術(shù)帶人們進(jìn)入擁有人工智能、云計(jì)算、AR/VR等高科技的智媒時(shí)代。智能化技術(shù)全面進(jìn)入傳統(tǒng)媒介新聞生產(chǎn)的核心環(huán)節(jié),及其寫作正在給新聞傳播領(lǐng)域帶來革命性的變化。[1]作為人工智能技術(shù)在新聞實(shí)踐領(lǐng)域運(yùn)用的代表性產(chǎn)物,“機(jī)器新聞寫作”是指運(yùn)用機(jī)器算法對數(shù)據(jù)進(jìn)行抓取、分析、整理和呈現(xiàn)的新聞寫作模式,它使新聞生產(chǎn)開始走上了工業(yè)化、自動化和智能化的道路。[2]
新華社承載了各種類型稿件的播發(fā),其中資訊稿是其中之一,其新聞發(fā)布的時(shí)效性,生成次數(shù)的頻繁,數(shù)據(jù)采集的繁瑣,無一不牽扯了編輯記者大量的時(shí)間和精力。新華社寫稿機(jī)器人“快筆小新”應(yīng)運(yùn)而生,它的工作范圍涵蓋了體育賽事、財(cái)經(jīng)、各大部委官方資訊、天氣等領(lǐng)域,自2015年11月7日上線運(yùn)行以來,7×24小時(shí)不間斷工作,為編輯記者在線采集海量數(shù)據(jù),生成大量咨詢類稿件,解放了編輯記者的雙手,使其有精力和時(shí)間投入到新聞稿件深度報(bào)道中。[3]
從2016年起,“快筆小新”相繼承擔(dān)了里約奧運(yùn)會、平昌冬奧會、中華人民共和國第十四屆運(yùn)動會、東京奧運(yùn)會重大賽事報(bào)道,并圓滿完成比賽成績公報(bào)播發(fā)的任務(wù)。2022年北京冬奧會,“快筆小新”再接再厲,從各種賽事報(bào)道中不斷積累經(jīng)驗(yàn),積極探索業(yè)務(wù)需求和智能化采寫技術(shù)的結(jié)合點(diǎn),在北京冬奧會賽事報(bào)道中推陳出新,解決困擾記者編輯多年的痛點(diǎn),真正做到技術(shù)落地,解放生產(chǎn)力。
隨著機(jī)器人寫稿在新華社的影響逐漸擴(kuò)大,業(yè)務(wù)部門聯(lián)系機(jī)器人寫稿項(xiàng)目組,提出2016年里約奧運(yùn)會的發(fā)稿需求,這是首次嘗試在奧運(yùn)會級別賽事上使用機(jī)器人寫稿系統(tǒng)播發(fā)比賽公報(bào)。在數(shù)據(jù)方面,為了確保數(shù)據(jù)的準(zhǔn)確性和時(shí)效性,多次聯(lián)系奧組委,申請接入奧組委奧運(yùn)賽事數(shù)據(jù)服務(wù)(ODF,Olympic Data Feed)。和ODF的成功對接,為將來的奧運(yùn)會賽事的機(jī)器人寫稿順利進(jìn)行打下了堅(jiān)實(shí)的基礎(chǔ)。
此次里約奧運(yùn)會機(jī)器人寫稿實(shí)現(xiàn)了包括每日中英文獎牌榜,所有39類項(xiàng)目的英文當(dāng)場成績和排名,重點(diǎn)球類項(xiàng)目(籃球、排球、足球、水球、曲棍球、乒乓球、羽毛球)英文當(dāng)場成績和小組賽排名等賽事公報(bào)的自動寫稿。里約奧運(yùn)會期間共生成稿件4000多條,其中寫入待編庫350多條(決賽成績排名和獎牌榜),被業(yè)務(wù)部門最終核對簽發(fā)稿件280多條。
機(jī)器人寫稿在里約夏季奧運(yùn)會賽事報(bào)道上的成功應(yīng)用,促使業(yè)務(wù)部門將之后各大國際重大賽事的成績公報(bào)的報(bào)道任務(wù)交給“快筆小新”進(jìn)行。平昌冬奧會是“快筆小新”接手的第二個(gè)國際重大賽事,因有里約奧運(yùn)會的機(jī)器人寫稿開發(fā)經(jīng)驗(yàn),以及和奧組委對接的經(jīng)歷,平昌冬奧會機(jī)器人寫稿的開發(fā)工作非常順利。同時(shí),在反思里約奧運(yùn)會時(shí)機(jī)器人寫稿在便捷性上的不足,重新開發(fā)了前端頁面,能方便業(yè)務(wù)部門編輯直接在線選稿、編輯稿件以及簽發(fā)至待編庫等操作,深耕用戶需求,以用戶為中心,提升和完善機(jī)器人寫稿功能。
“快筆小新”在東京奧運(yùn)會上首次實(shí)現(xiàn)自動發(fā)稿。國際疫情形勢嚴(yán)峻,導(dǎo)致賽前測試數(shù)據(jù)嚴(yán)重不足,因此采取敏捷開發(fā)的方式,循序漸進(jìn),逐步完善不同賽事的報(bào)道服務(wù),直到正式比賽開始一段時(shí)間之后,“快筆小新”才全部開發(fā)完畢。
一場比賽正式結(jié)束后,“快筆小新”同步接收奧組委ODF賽事數(shù)據(jù),實(shí)時(shí)自動編寫奧運(yùn)會賽事稿件,并自動入庫,全程無人工干預(yù),將稿件第一時(shí)間呈現(xiàn)在編輯面前,發(fā)稿效率進(jìn)一步提升。奧運(yùn)期間共采寫1050篇稿件,由于稿件生成又快又準(zhǔn),業(yè)務(wù)部門的英文終審發(fā)稿人特別表揚(yáng)機(jī)器人寫稿反應(yīng)快,效果很好。
同時(shí),“快筆小新”為新華社中英文客戶端奧運(yùn)獎牌榜提供實(shí)時(shí)獎牌榜數(shù)據(jù)接口。獎牌榜數(shù)據(jù)更新快,效果好,截至奧運(yùn)會閉幕式當(dāng)天,新華社英文客戶端獎牌榜海外瀏覽量超過1600萬,互動量近20萬,多次成為新華社海媒賬號當(dāng)日瀏覽量和互動量最高的稿件。新華社中文客戶端瀏覽量超過2600萬,訪問用戶678萬人次。
完成東京奧運(yùn)會賽事報(bào)道后,“快筆小新”臨時(shí)接到新的需求,即一個(gè)月后的全運(yùn)會報(bào)道。全運(yùn)會賽事系統(tǒng)和奧運(yùn)會ODF是完全不同體系的平臺,短時(shí)間內(nèi)對接成功,并開始播發(fā)賽事稿件是非常艱巨的任務(wù),同時(shí)還需要滿足業(yè)務(wù)部門不斷變更的新需求。時(shí)間緊,任務(wù)重,“快筆小新”頂著壓力,在敏捷開發(fā)模式下,嘗試總結(jié)歸納整個(gè)賽事期間生成的所有數(shù)據(jù),首次生成41篇按賽事種類總結(jié)的中文稿件,并全部被業(yè)務(wù)部門采用簽發(fā)。
此次全運(yùn)會首次報(bào)道的成功,能夠做到機(jī)器人寫稿中文和英文稿件全覆蓋,以及成功對接全運(yùn)會賽事平臺,為后續(xù)的全運(yùn)會賽事的機(jī)器人寫稿提供了寶貴的經(jīng)驗(yàn)。
此次北京冬奧會,是新華通訊社作為奧組委官方合作通訊社后第一次報(bào)道的冬季奧運(yùn)會賽事,報(bào)道內(nèi)容和范圍都比之前有了進(jìn)一步擴(kuò)大?!翱旃P小新”也肩負(fù)起了更加重要的使命。業(yè)務(wù)部門決定將比賽報(bào)道范圍從原先的半決賽、決賽擴(kuò)大至每種比賽的各個(gè)階段,這將導(dǎo)致本屆冬奧會機(jī)器人寫稿的稿件數(shù)量規(guī)模上遠(yuǎn)遠(yuǎn)超過以往冬奧會賽事報(bào)道。據(jù)統(tǒng)計(jì),寫稿機(jī)器人在冬奧會期間自動生成稿件1105篇,把記者從大量繁重的基礎(chǔ)性工作中解放出來,騰出更多時(shí)間和精力采寫更精彩、更有趣的深入性報(bào)道。
同時(shí),按照業(yè)務(wù)部門需求,新增每日比賽歸納總結(jié)性稿件,每種比賽需要在當(dāng)天所有子項(xiàng)目結(jié)束時(shí),歸納所有子項(xiàng)目比賽結(jié)果?!翱旃P小新”研發(fā)團(tuán)隊(duì)積極響應(yīng)用戶的每一個(gè)需求,做好用戶服務(wù)。
冬季項(xiàng)目比賽運(yùn)動員需要佩戴頭盔、護(hù)目鏡等安全護(hù)具,身份不易辨認(rèn),稍有疏忽就有可能弄錯(cuò)。在以往報(bào)道中,這給記者編輯發(fā)稿帶來很大麻煩,為此需要耗費(fèi)大量時(shí)間核對運(yùn)動員身份,影響了發(fā)稿時(shí)效。
為助力北京冬奧會報(bào)道,破解困擾記者編輯多年的痛點(diǎn),技術(shù)局自主研發(fā)出“Bib號速查”系統(tǒng),首次實(shí)現(xiàn)在新華社奧運(yùn)報(bào)道中實(shí)時(shí)查詢運(yùn)動員的身份信息和成績。
這個(gè)報(bào)道神器,助力前后方編輯記者,尤其是攝影記者在比賽現(xiàn)場通過運(yùn)動員身上的號碼牌(Bib號)快速查詢運(yùn)動員姓名、成績、排名等信息,賽前可預(yù)先查閱即將出場的運(yùn)動員信息,便于提前做好報(bào)道準(zhǔn)備。系統(tǒng)支持運(yùn)動員信息導(dǎo)出到圖片編輯軟件,輸入Bib號自動替換為運(yùn)動員名字,避免拼寫錯(cuò)誤。導(dǎo)出的數(shù)據(jù)樣式可根據(jù)情況自行設(shè)定,盡量減少重復(fù)性手工操作。系統(tǒng)嵌入到新華社“新圖片”系統(tǒng)和“采訪通”App,實(shí)現(xiàn)對不同應(yīng)用場景的支持。這些功能大大提高了冬奧報(bào)道時(shí)效,得到了編輯的一致好評。
“Bib號速查”系統(tǒng)同時(shí)集成了冬奧機(jī)器人寫稿功能。編輯記者只要勾選運(yùn)動員的名字,就可以自動生成稿件,方便快速發(fā)稿,同時(shí)減少人名拼寫錯(cuò)誤等問題,很大程度提高了冬奧報(bào)道的時(shí)效性和準(zhǔn)確性,為冬奧智慧賦能。
冬奧會期間,運(yùn)動員信息查詢系統(tǒng)日均接口調(diào)用量5000余次,查詢比賽2000余次,提供40多場2000多名運(yùn)動員的信息和比賽成績查詢服務(wù),為冬奧會報(bào)道提供強(qiáng)大助力。
“Bib號速查”系統(tǒng)在冬殘奧期間也多次被記者“點(diǎn)名”,希望可以繼續(xù)使用如此便利的功能。在北京冬奧會數(shù)據(jù)開發(fā)經(jīng)驗(yàn)和基礎(chǔ)上,“快筆小新”研發(fā)團(tuán)隊(duì)增加了殘奧會600多個(gè)運(yùn)動員、180多場比賽的信息數(shù)據(jù),并針對殘奧會的特點(diǎn)增加了視障項(xiàng)目“引導(dǎo)員”中英文姓名的查詢和導(dǎo)出功能,得到了前方記者的好評。冬殘奧會期間,“Bib號速查”系統(tǒng)平均每天查詢比賽300多場次。
在北京冬奧會報(bào)道期間,“快筆小新”研發(fā)團(tuán)隊(duì),配合業(yè)務(wù)部門,在后方做了大量的數(shù)據(jù)支持和運(yùn)維保障工作,提供實(shí)時(shí)獎牌榜數(shù)據(jù)更新服務(wù),協(xié)助推出了北京冬奧會獎牌榜(中文版和英文版),獎牌榜數(shù)據(jù)更新快,數(shù)據(jù)準(zhǔn)確,取得了非常好的傳播效果。
在新華社中文客戶端以及對內(nèi)報(bào)道渠道上,累計(jì)獲得近532萬次瀏覽;在新華社英文客戶端和海外社交媒體平臺等渠道上,累計(jì)獲得超過322萬次瀏覽,受到各方好評。
數(shù)據(jù)清洗過濾與分析方法研究與模塊實(shí)現(xiàn):通過ODF提供的Schema,進(jìn)行一致性檢查、篩除錯(cuò)誤結(jié)構(gòu),清洗接收的ODF數(shù)據(jù)。過濾非正式比賽結(jié)果信息,例如訓(xùn)練賽數(shù)據(jù)、比賽場地與天氣數(shù)據(jù)等。通過利用各種數(shù)據(jù)分析方法檢測比賽數(shù)據(jù)中的結(jié)構(gòu)和模式,輸出離散數(shù)據(jù)模式。例如比賽數(shù)據(jù)中的成績結(jié)果、獎牌榜的更新等。該模塊與具體比賽數(shù)據(jù)類型相關(guān),針對不同的數(shù)據(jù)類型所輸出的數(shù)據(jù)模式是不同的。通過對數(shù)據(jù)模式和輸入事件進(jìn)行分析,推斷出對應(yīng)的比賽成績處理模式,同時(shí)推斷出它們之間的關(guān)系,最后輸出高層消息以及消息之間的關(guān)系。例如針對某一場比賽數(shù)據(jù),如果是實(shí)時(shí)比賽結(jié)果數(shù)據(jù),這種中間結(jié)果產(chǎn)生的消息只需記錄即可,如果是最終的比賽結(jié)果,則需要創(chuàng)建一條最終消息。還需要檢測分析消息之間的關(guān)系,例如因果關(guān)系、時(shí)序關(guān)系等。
新聞規(guī)劃方法研究與模塊實(shí)現(xiàn):用于對信息進(jìn)行篩選歸類,并規(guī)劃新聞篇章結(jié)構(gòu)。針對不同的比賽規(guī)則和最終文本的呈現(xiàn)效果,分析決定哪些信息和關(guān)系需要在文本中提及,同時(shí)要確定文本的結(jié)構(gòu),最后輸出需要提及的信息以及文檔結(jié)構(gòu)。文檔規(guī)劃模塊必須明確文本中需要說明和展示的信息,一般可根據(jù)專家知識、消息的重要性、上游需求等來進(jìn)行選擇和確定。當(dāng)然,該模塊與成績數(shù)據(jù)類型也很相關(guān),不同數(shù)據(jù)類型對消息的選擇所考慮的因素不一樣,文檔的結(jié)構(gòu)也會不一樣。
句子規(guī)劃與實(shí)現(xiàn)方法研究與模塊實(shí)現(xiàn):基于選中的信息及結(jié)構(gòu),通過自然語言生成技術(shù)輸出最終的文本。該模塊主要涉及對句子進(jìn)行規(guī)劃以及句子實(shí)現(xiàn),要求最終實(shí)現(xiàn)的句子具有正確的語法、形態(tài)和拼寫,同時(shí)采用準(zhǔn)確的指代表達(dá)。
此次北京冬奧會機(jī)器人寫稿服務(wù),分為三部分,分別是賽事公報(bào)稿件生成服務(wù)、運(yùn)動員號碼牌查詢導(dǎo)出服務(wù)和奧運(yùn)會獎牌榜數(shù)據(jù)支持服務(wù)。
賽事公報(bào)稿件生成服務(wù)。基于奧組委奧運(yùn)賽事數(shù)據(jù)分發(fā)服務(wù)(ODF, Olympic Data Feed)的數(shù)據(jù)源,經(jīng)本地高性能自動數(shù)據(jù)處理轉(zhuǎn)發(fā)服務(wù),按照比賽的過濾規(guī)則進(jìn)行數(shù)據(jù)清洗,結(jié)合奧組委提供的Common Codes文檔,對數(shù)據(jù)進(jìn)行解析,提取關(guān)鍵信息,通過設(shè)定的模板庫實(shí)時(shí)生成各項(xiàng)數(shù)據(jù)并且傳送到目標(biāo)服務(wù)器,為新華社提供實(shí)時(shí)動態(tài)精確的奧運(yùn)會賽事報(bào)道服務(wù)。
圖1 機(jī)器人寫稿簽發(fā)系統(tǒng)
運(yùn)動員號碼牌查詢導(dǎo)出服務(wù)?;贠DF數(shù)據(jù)源,經(jīng)本地高性能自動數(shù)據(jù)處理存儲服務(wù),通過手機(jī)App或者PC端查詢某一場比賽運(yùn)動員的號碼牌對應(yīng)的成績、姓名等信息,并提供導(dǎo)出成文件功能。
圖2 Bib速查系統(tǒng)
奧運(yùn)會獎牌榜數(shù)據(jù)支持服務(wù)。基于ODF數(shù)據(jù)源,經(jīng)本地高性能自動數(shù)據(jù)處理轉(zhuǎn)發(fā)服務(wù),解析官方獎牌榜數(shù)據(jù),按國家提取金銀銅牌個(gè)數(shù)等關(guān)鍵信息,提供實(shí)時(shí)獎牌榜排行數(shù)據(jù)服務(wù)。
圖3 北京冬奧會獎牌榜(中文版)
圖4 北京冬奧會獎牌榜(英文版)
圖5 系統(tǒng)業(yè)務(wù)流程圖
庫茲韋爾曾經(jīng)斷定,人工智能將于2045年超越人類智慧;美國Narrative Science也斷定未來九成以上新聞內(nèi)容將由機(jī)器創(chuàng)作。[4]可以預(yù)見,隨著未來人工智能技術(shù)日新月異的發(fā)展,機(jī)器人必定會在新聞內(nèi)容生產(chǎn)方面發(fā)揮更大的作用,同時(shí)也必將更好地輔助媒體人在深度報(bào)道方面創(chuàng)造更多的可能。
近年來,“快筆小新”不斷地從各種賽事報(bào)道中積累經(jīng)驗(yàn),積極探索業(yè)務(wù)需求和智能化采寫技術(shù)的結(jié)合點(diǎn),新增各種解決新聞報(bào)道痛點(diǎn)的功能服務(wù),除了體育賽事的報(bào)道,在其他領(lǐng)域,包括財(cái)經(jīng)、各大部委官方資訊、天氣等也有成熟的稿件編寫能力。在此基礎(chǔ)上,“快筆小新”將繼續(xù)探索其更豐富的智能化功能,助力新華社新聞業(yè)務(wù)更上一層樓。