周璐
摘要:社會(huì)需求的增長(zhǎng),推動(dòng)了云計(jì)算、物聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能等新技術(shù)的發(fā)展,促成了如今媒體技術(shù)融合的時(shí)代。越來越多的互聯(lián)網(wǎng)新產(chǎn)品應(yīng)運(yùn)而生,成為我們生活中不可或缺的一部分。新聞媒體行業(yè)也在新趨勢(shì)的帶動(dòng)下,不斷與前沿科技相融合,提高媒體產(chǎn)能和推廣范圍,準(zhǔn)確把控靶定對(duì)象。本文主要以輿情分析系統(tǒng)為例,對(duì)當(dāng)下新聞行業(yè)進(jìn)行分析,以及對(duì)未來新聞媒體行業(yè)的發(fā)展做出的思考。
關(guān)鍵詞:人工智能;新聞報(bào)道;輿情分析;機(jī)器書寫;MGC
中圖分類號(hào):G201.7
文獻(xiàn)識(shí)別碼:A
文章編號(hào):1001-828X(2019)010-0420-02
一、引言
隨著我們每天的數(shù)據(jù)以PB規(guī)模不斷增長(zhǎng),以及人工智能研究的快速發(fā)展,中國(guó)傳媒行業(yè)已經(jīng)在人可控范圍內(nèi)迅猛成長(zhǎng)。自2017年12月由新華社在成都發(fā)布的中國(guó)第一個(gè)媒體人工智能平臺(tái)
“媒體大腦”成功上線,到如今的媒體大腦“3.0”在進(jìn)博會(huì)上的成功表演。這也就說明,我國(guó)目前在信息技術(shù)革命領(lǐng)域新聞報(bào)道方面已經(jīng)有了質(zhì)的飛躍。
在新聞報(bào)道方面,不管是新媒體,還是傳統(tǒng)媒體,對(duì)于機(jī)器寫作助手的認(rèn)可已經(jīng)是毋庸置疑的了。例如今日頭條的“張小明”、
“Giiso”寫作機(jī)器人、《時(shí)代財(cái)經(jīng)》等上千家出版社的“御用”寫手,都已經(jīng)逐步滲透到了人們的生活中,這些機(jī)器人依靠后臺(tái)強(qiáng)大的智能語(yǔ)義系統(tǒng)和數(shù)十億個(gè)數(shù)據(jù)庫(kù)中數(shù)千個(gè)節(jié)點(diǎn)的素材庫(kù)、知識(shí)地圖和語(yǔ)法功能讓它們躲過了大腦語(yǔ)言系統(tǒng)的審查。隨著數(shù)據(jù)庫(kù)的不斷更新、機(jī)器人系統(tǒng)的創(chuàng)新升級(jí)和營(yíng)銷擴(kuò)大化,新聞報(bào)道行業(yè)的自動(dòng)生成系統(tǒng)已經(jīng)初見規(guī)模。
二、輿情分析系統(tǒng)簡(jiǎn)報(bào)自動(dòng)生成
輿情分析系統(tǒng)的簡(jiǎn)報(bào)自動(dòng)生成,通過前端設(shè)定監(jiān)測(cè)時(shí)間、關(guān)鍵詞等一系列范圍性要點(diǎn),在系統(tǒng)后臺(tái)篩選出有價(jià)值的情報(bào)信息,并將它匯總到一篇文章中,簡(jiǎn)明扼要的對(duì)輿論信息及事態(tài)進(jìn)行恰當(dāng)分析。對(duì)于簡(jiǎn)報(bào)的輸出形式,根據(jù)不同的輿論輸入類型,文本生成可以大致劃分為三大類:文本到文本的生成,數(shù)據(jù)到文本的生成以及圖像到文本的生成[2]。
簡(jiǎn)報(bào)自動(dòng)生成系統(tǒng),主要來自于大量文義的解讀,在文本中抽取出相同含義的句子,將這些句子整合成語(yǔ)義不變的新句子。但是哪些句子是可以抽取出的呢?這個(gè)答案來自于句子抽取領(lǐng)域的第一篇論文,由IBM公司的科學(xué)家Luhn在1985年撰寫的《TheAutomaticCreationofLiteratureAbstracts》,他表示如果句子當(dāng)中包含的關(guān)鍵詞較多,那么就認(rèn)為這個(gè)句子就越重要,系統(tǒng)后臺(tái)就是要根據(jù)一定的算法找到這樣的句子,將他們匯總到一起,調(diào)整語(yǔ)序和表達(dá)詞匯,綜合成一篇簡(jiǎn)報(bào)??雌饋磉@樣的工作量很大,但對(duì)于計(jì)算機(jī)來說,強(qiáng)大的軟硬件的支持讓需求者可以在眨眼的功夫便拿到這樣一篇簡(jiǎn)報(bào)。文檔的完整解釋和總結(jié)摘要對(duì)于人類來說通常是困難的,而對(duì)于現(xiàn)有的文本自動(dòng)摘要技術(shù),也同樣是困難的[1]。這只是最初級(jí)最快速的辦法,如果想要深入,簡(jiǎn)報(bào)完全不能滿足人們對(duì)大量?jī)?nèi)容分析結(jié)果的需要。
雖然簡(jiǎn)報(bào)自動(dòng)生成系統(tǒng)是初級(jí)的,但對(duì)于需要每天面對(duì)大量數(shù)據(jù)分析的現(xiàn)代人,簡(jiǎn)報(bào)又是不可或缺的。
例如,對(duì)“全球硬科技創(chuàng)新大會(huì)”進(jìn)行輿情分析,檢測(cè)周期為十五天,運(yùn)用主題聚焦,定向站點(diǎn)采集,元搜索采集及第三方數(shù)據(jù)引入等手段對(duì)國(guó)內(nèi)外新聞網(wǎng)站、紙媒、廣播電視、海外主流媒體等多個(gè)渠道多語(yǔ)言進(jìn)行全面監(jiān)測(cè),檢測(cè)到信息4000余條,新聞報(bào)道3600余篇,紙媒報(bào)道370余篇等其他信息條。這樣龐大的一項(xiàng)數(shù)據(jù)監(jiān)測(cè)若是運(yùn)用人力怕是一件極其艱難的事情,但是通過輿情分析系統(tǒng)可以準(zhǔn)確把控到各大媒體的媒體走向、媒體流量、關(guān)注度等。將輿論后龐大的數(shù)據(jù)根據(jù)特定的算法和文本深度語(yǔ)義算法自動(dòng)分析,得到所需基本內(nèi)容概述。
三、文字自動(dòng)生成的特點(diǎn)
目前,學(xué)術(shù)界對(duì)“機(jī)器人寫作”的更一致的看法是,它是基于計(jì)算機(jī)的程序算法,在此基礎(chǔ)上捕獲和分析信息內(nèi)容。然后運(yùn)用一種新的新聞制作方法,使用自動(dòng)生成內(nèi)置模板的手稿完成新聞報(bào)道。目前用于財(cái)務(wù),體育和災(zāi)難性報(bào)道,特別是對(duì)于大量數(shù)據(jù)的新聞報(bào)道,它具有固有的優(yōu)勢(shì)[3]。
1.新聞報(bào)道生產(chǎn)速度之快,數(shù)量之大是人類望塵莫及的。生產(chǎn)之快源于它基于計(jì)算機(jī)強(qiáng)大的大腦,它可以在收集巨量數(shù)據(jù)后進(jìn)行整合,這包括靜態(tài)數(shù)據(jù),也包括動(dòng)態(tài)數(shù)據(jù),即每時(shí)每刻所發(fā)生的信息,都要在同一時(shí)間錄入到智能語(yǔ)義庫(kù)進(jìn)行讀取,并在下一瞬間進(jìn)行篩選、分割和重組,直到事件完成。同時(shí),由于強(qiáng)大的數(shù)據(jù)儲(chǔ)備支持,電腦也會(huì)在同一時(shí)刻調(diào)取到以往相關(guān)數(shù)據(jù)進(jìn)行分析,確定相關(guān)性以及匹配性,這一系列的動(dòng)作都是在大數(shù)據(jù)中來回的快速穿梭,以求在最短時(shí)間內(nèi),完成高質(zhì)量的新聞報(bào)道。如今,一篇文章的完成我們已經(jīng)可以用毫秒或是秒來計(jì)算了。
由于生產(chǎn)速度的提高,機(jī)器又優(yōu)于人類不知疲勞,所以機(jī)器的新聞報(bào)道生產(chǎn)數(shù)量是巨大的。在上百家媒體中的新聞報(bào)道一年可達(dá)10億個(gè),平均每秒2000篇的速度。智能化生產(chǎn),在提高生產(chǎn)率的同時(shí),節(jié)省了成本,增加了收益。
2.新聞報(bào)道是個(gè)性化的。基于現(xiàn)有龐大的數(shù)據(jù)庫(kù)和智能分析軟件,我們可以輕易的找到每個(gè)人,每個(gè)領(lǐng)域,每個(gè)年齡階段等不同類的語(yǔ)言使用習(xí)慣;另外,還可以根據(jù)需要、偏好和讀者群去人為設(shè)定新聞生成的種類與個(gè)性。騰訊公司的Dreamwriter推出個(gè)性化的實(shí)時(shí)多版本功能,其寫作邏輯是在達(dá)到一定的觸發(fā)條件后,系統(tǒng)通過對(duì)若干計(jì)算模型進(jìn)行定量和定性的分析,自動(dòng)根據(jù)數(shù)據(jù)選取合適的表達(dá)模板,將數(shù)據(jù)與模板相結(jié)合。[4]這樣的文章就不會(huì)是機(jī)器式死板的,而是靈活可變的。
四、媒體大腦生成“MGC”
在新聞生產(chǎn)的這100多年的歷史上,從最初的專業(yè)化生產(chǎn)到業(yè)余化生產(chǎn)再到如今的智能化生產(chǎn),從個(gè)人非營(yíng)利性生產(chǎn)到成為專業(yè)職業(yè),從靠人力資源到如今的多維融合。隨著智能化新聞生產(chǎn)逐步走向潮流,UGC、PGC已經(jīng)成為了我們新聞發(fā)展道路上的主要形式。而MGC(Machine?Generated?Content)也悄然到來。MGC一個(gè)通過攝像頭、無人機(jī)獲取視頻及數(shù)據(jù),然后經(jīng)由識(shí)別技術(shù)讓機(jī)器進(jìn)行價(jià)值判斷,最后依托于媒體大腦將理解到的內(nèi)容進(jìn)行關(guān)聯(lián),檢索語(yǔ)義,編版,最終智能生產(chǎn)新聞的新興技術(shù)。
第一條MGC新聞,時(shí)長(zhǎng)2分08秒,由“媒體大腦”中的2410(智能媒體生產(chǎn)平臺(tái))生產(chǎn),耗時(shí)10.3秒。2018年全國(guó)兩會(huì)上發(fā)布了全球首條關(guān)于兩會(huì)實(shí)時(shí)內(nèi)容的MGC視頻新聞——《2018兩會(huì)MGC輿情熱點(diǎn)》,這是在5億條輿情熱點(diǎn)信息中綜合篩選匯總后生成的。可見,智能新聞生產(chǎn)已經(jīng)開始擺脫單一的呈現(xiàn)形態(tài)、單一的表現(xiàn)方式和單一的題材領(lǐng)域的局限,人類的新聞生產(chǎn)活動(dòng)被真正帶入到全媒體、多形態(tài)、多領(lǐng)域的新聞生產(chǎn)過程中,利用新的媒介技術(shù)創(chuàng)新新聞生產(chǎn)方式。[5]
利用MGC進(jìn)行新聞生產(chǎn),最終形成富媒體新聞,這是一個(gè)需要多學(xué)科雜合融匯的過程,是一個(gè)技術(shù)深度交叉融合的結(jié)果,攝像頭、傳感器、AI技術(shù)+大數(shù)據(jù),每一項(xiàng)都是真實(shí)可靠的。機(jī)器是不會(huì)說謊的,它記錄到什么,收集到什么,就會(huì)反饋出什么,系統(tǒng)同樣會(huì)辨別出新聞的真實(shí)度,讓未來新聞越來越客觀真實(shí)。另外,MGC的生產(chǎn)效率之快是人類所不能企及的,人類生產(chǎn)一條新聞視頻的時(shí)間,媒體大腦可以生產(chǎn)180條,并且它還可以保證在快速出產(chǎn)的同時(shí)依靠全球最大新聞資訊庫(kù)使信息達(dá)到精準(zhǔn)無誤。
MGC新聞是將算法+數(shù)據(jù)+遙感相結(jié)合的產(chǎn)物,它提高了危險(xiǎn)新聞報(bào)道的安全性,使得在某些特定地點(diǎn),特定時(shí)間,不再需要人類去做一些繁復(fù)簡(jiǎn)單或是充斥危險(xiǎn)的一線工作。隨著科技的不斷進(jìn)步,“MAGIC”的提出,各媒體平臺(tái)相互交融,以擴(kuò)展傳播途徑和廣度,實(shí)現(xiàn)新聞報(bào)道新方向的新發(fā)展。五、新聞報(bào)道未來的發(fā)展
1.人機(jī)協(xié)同。寫作機(jī)器人、媒體大腦等新型的媒體手段,是新聞?lì)I(lǐng)域科技時(shí)代的前沿技術(shù)。時(shí)代在發(fā)展,但無論人工智能發(fā)展到什么樣的階段,人工智能都不會(huì)凌駕于人類之上,當(dāng)然,這需要人類對(duì)這一領(lǐng)域做出一定的行業(yè)標(biāo)準(zhǔn),在人類可控范圍內(nèi),最大化的突出人工智能區(qū)別于人的優(yōu)勢(shì)。人類要與它們協(xié)同合作,強(qiáng)強(qiáng)聯(lián)手,優(yōu)勢(shì)互補(bǔ)。運(yùn)用人類的思維和機(jī)器的速度,實(shí)現(xiàn)傳媒行業(yè)人機(jī)一體化的轉(zhuǎn)變與進(jìn)步。
2.思想是先鋒。從目前的機(jī)器人寫作情況來看,詩(shī)歌、對(duì)聯(lián)、專項(xiàng)新聞等占主要部分,而散文隨筆小說等帶入感情的純文學(xué)的作品,機(jī)器人還是達(dá)不到的。現(xiàn)代機(jī)器人無思想,無趣味性,無人情味,缺乏現(xiàn)場(chǎng)應(yīng)變能力等等與情感有關(guān)的方面永遠(yuǎn)都是他們的短板。在人類世界中,那些有溫度的話題,有微妙情緒的語(yǔ)句,也只有人類自己可以理解,這些無形的情感,是很難用程序化的代碼可以代替的。另外,傳媒人也應(yīng)不斷思考新鮮事物,將多樣化的信息以新穎的方式展現(xiàn)在人們面前,在永遠(yuǎn)保持一顆對(duì)主流事態(tài)和社會(huì)的責(zé)任心和社會(huì)認(rèn)同感的同時(shí),提升眼界和思維。
六、結(jié)語(yǔ)
在新聞報(bào)道領(lǐng)域發(fā)展的舞臺(tái)上,人與機(jī)器,并不應(yīng)該是同臺(tái)競(jìng)賽,對(duì)于新聞業(yè)的未來,也應(yīng)保持一顆平常心。在這個(gè)逐步發(fā)展,轉(zhuǎn)變的過程中,本著從用戶的角度來看待科技創(chuàng)新帶來的發(fā)展,堅(jiān)守住新聞人心中的底線。我們有理由相信,在未來,“人工智能+大數(shù)據(jù)”必將帶來可以期待的精彩。
參考文獻(xiàn):
[1]Mani?I?.Automatic?Summarization[M].John?Benjamins?Publishing,2001.
[2]Paper_weekly.EMNLP?2018?|?從對(duì)話生成和文本風(fēng)格轉(zhuǎn)化看文本生成技術(shù)[OL].https://blog.csdn.net/c9yv2cf9i06k2a9e/article/details/83388740,2018,10.
[3]徐婷婷.新聞業(yè)的“人工智能”時(shí)代[J].科技傳播,2016,8(15):82-83.
[4]楊名宜,吳海榮.探討“機(jī)器新聞寫作”的發(fā)展趨勢(shì)[J].視聽,2016(11):131-132.
[5]蔡筱牧.新華社媒體大腦:技術(shù)驅(qū)動(dòng)新聞生產(chǎn)方式變革[J].傳媒,2018(20):54-56.