徐常亮
一個(gè)個(gè)監(jiān)控?cái)z像頭將成為記者的眼睛,擴(kuò)大大家觸達(dá)新聞熱點(diǎn)的能力。在今年兩會(huì)報(bào)道時(shí),由新華社和阿里巴巴成立的新華智云科技有限公司通過(guò)對(duì)輿情熱點(diǎn)的發(fā)現(xiàn),把相關(guān)的輿情熱點(diǎn)報(bào)道視頻化,整個(gè)過(guò)程機(jī)器自動(dòng)制作,使之在很短時(shí)間內(nèi)就能迅速產(chǎn)生,這正是新華智云目前正在力推的一個(gè)理念叫MGC。隨著智能時(shí)代的到來(lái),萬(wàn)物皆媒時(shí)代,MGC會(huì)成為主流。
MGC指的是機(jī)器生產(chǎn)內(nèi)容,這方面對(duì)傳統(tǒng)主流媒體機(jī)構(gòu)而言有獨(dú)特優(yōu)勢(shì),傳統(tǒng)主流媒體更有優(yōu)勢(shì)接觸到這些數(shù)據(jù),只要在人工智能大數(shù)據(jù)的相關(guān)技術(shù)上予以跟進(jìn),就可以將內(nèi)容生產(chǎn)自動(dòng)化、流水線化,大大提高新聞線索的發(fā)現(xiàn)和生產(chǎn)。
不管是國(guó)內(nèi),還是海外媒體,都對(duì)新華社這樣的舉措非??隙?。新華智云今天所做的事情也不僅僅服務(wù)于新華社,新華社希望讓新華智云這家公司,在探索過(guò)程中沉淀下技術(shù)、經(jīng)驗(yàn),和全國(guó)的媒體機(jī)構(gòu)進(jìn)行分享。
媒體大腦由新華智云獨(dú)立研發(fā),致力于用業(yè)界領(lǐng)先的大數(shù)據(jù)及人工智能技術(shù),同媒體機(jī)構(gòu)和從業(yè)者一起,重新定義智能時(shí)代內(nèi)容生產(chǎn)者的核心競(jìng)爭(zhēng)力。去年12月,新華智云正式發(fā)布媒體大腦時(shí),介紹了媒體大腦的各項(xiàng)功能,集齊了報(bào)道線索、發(fā)現(xiàn)態(tài)勢(shì)到整個(gè)新聞制造流程,最后到分發(fā)覆蓋,但當(dāng)時(shí)我們更多是以工具或是單獨(dú)插進(jìn)的能力來(lái)做,我們稱之為媒體大腦1.0階段。
媒體大腦的理念是:憑計(jì)算之力,求數(shù)據(jù)洞察,賦萬(wàn)物為媒,迎智能時(shí)代。其中包含了四個(gè)要素:計(jì)算、數(shù)據(jù)、萬(wàn)物和智能。計(jì)算連接數(shù)據(jù),智能賦予萬(wàn)物,在萬(wàn)物皆媒的時(shí)代,萬(wàn)物要成為媒體,都需要大數(shù)據(jù)和人工智能技術(shù),這方面我們會(huì)一直深入探索。
▲媒體大腦1.0階段
▲媒體大腦2.0—— MAGIC智能生產(chǎn)平臺(tái)
今年6月,俄羅斯世界杯開(kāi)賽當(dāng)天,新華智云正式發(fā)布了媒體大腦2.0,我們將上文提到的所有功能進(jìn)行整合,放到一個(gè)大平臺(tái)中,在這個(gè)平臺(tái)里,整個(gè)內(nèi)容的采集、制造、分發(fā),成為一個(gè)整體。我們?cè)诎堰@套平臺(tái)作為新華社智能化編輯部探索的基礎(chǔ),同時(shí)也在和一些省級(jí)媒體合作,探索如何把這套平臺(tái)輸出到省級(jí)媒體,今后也可以成為區(qū)縣級(jí)融媒體中心發(fā)展的平臺(tái)基礎(chǔ)。
媒體大腦的重點(diǎn)仍在生產(chǎn)這條線,盡管它會(huì)覆蓋分發(fā),但其側(cè)重點(diǎn)仍是生產(chǎn)。在內(nèi)容生產(chǎn)領(lǐng)域,我們將理念提升為一條內(nèi)容生產(chǎn)的流水線,希望通過(guò)大數(shù)據(jù)和人工智能整體在線化地提供內(nèi)容生產(chǎn),讓大家今后的工作更智能化、輕量化。
隨著UGC等各類自媒體的出現(xiàn),主流媒體的聲音越來(lái)越弱,或者說(shuō)比例越來(lái)越小,這樣智能化平臺(tái)的推出,可以給大家?guī)?lái)更多的想象空間,把主流聲音加強(qiáng)。媒體大腦平臺(tái)不僅可以提高效率、批量生產(chǎn)、秒級(jí)生成,更重要的是希望受眾喜歡。
媒體大腦2.0—— MAGIC智能生產(chǎn)平臺(tái),MAGIC剛好是MGC(機(jī)器生產(chǎn)內(nèi)容)加上AI(人工智能),MAGIC平臺(tái)集中應(yīng)用了媒體大腦1.0的所有功能,由一條內(nèi)容生產(chǎn)流水線、四大智能基礎(chǔ)設(shè)施、五十余個(gè)智能系統(tǒng)構(gòu)成。MAGIC平臺(tái)能夠幫助內(nèi)容生產(chǎn)者更好地獲取和處理新聞資源,更快地發(fā)現(xiàn)新聞角度,生成的視頻滿足批量生產(chǎn)、秒級(jí)生成、受眾喜歡的要求。
媒體機(jī)構(gòu)發(fā)展至今,其本身積累的數(shù)據(jù)有很多價(jià)值,只是我們把這些數(shù)據(jù)進(jìn)行細(xì)分,比如世界杯每場(chǎng)比賽對(duì)觀眾而言可能就是一場(chǎng)90分鐘左右的比賽,但我們會(huì)把它切成兩秒、五秒或十秒一個(gè)片段,整場(chǎng)比賽會(huì)被切成500到1000個(gè)片段,進(jìn)行標(biāo)注,每個(gè)片段就是一個(gè)非常重要的數(shù)據(jù)。如何標(biāo)注就需要智能數(shù)據(jù)工坊。世界杯只是一個(gè)例子,每一篇文章都是非常重要的數(shù)據(jù),我們會(huì)把這篇文章里的時(shí)間、人物、地點(diǎn),或它關(guān)系到的各方面,包括誰(shuí)寫的、哪個(gè)機(jī)構(gòu)來(lái)發(fā)布的,都是一篇文章相關(guān)聯(lián)的重要數(shù)據(jù),通過(guò)視頻圖文等采集把它先聚攏起來(lái),然后再進(jìn)行處理。我們會(huì)做到甚至說(shuō)金融級(jí)數(shù)據(jù)的處理要求,把數(shù)據(jù)質(zhì)量提高到最純最有用,希望這些數(shù)據(jù)能成為今后再創(chuàng)造再生產(chǎn)的源泉,同時(shí)也會(huì)對(duì)原始的素材進(jìn)行打標(biāo),一方面通過(guò)智能的能力,另一方面也會(huì)結(jié)合人工。我們需要結(jié)合人和機(jī)器的能力,一起把數(shù)據(jù)加工到極致。
在基本的數(shù)據(jù)加工處理以后,我們會(huì)用智能媒資系統(tǒng)做一次精加工,其中使用到內(nèi)容理解、內(nèi)容萃取、各類人工智能技術(shù)來(lái)使媒資的內(nèi)容得到深入解釋。仍以世界杯為例,我們除了取它的畫面鏡頭,也會(huì)取它的比分鏡頭,取它的字模,把它的解說(shuō)轉(zhuǎn)成文字記錄下來(lái),今后可以做各類搜索。當(dāng)有了基本的數(shù)據(jù)處理和媒資整體的加工以后,整個(gè)批量生產(chǎn)構(gòu)造依賴于智能生產(chǎn)引擎。尤其對(duì)于二次創(chuàng)作的視頻,我們提出了一個(gè)想法就是先把原始視頻去化整為零,然后在化整為零的基礎(chǔ)上再化零為整,做成一個(gè)新的片子,這依賴背后整個(gè)智能生產(chǎn)引擎對(duì)內(nèi)容模板的組建管理,對(duì)實(shí)時(shí)數(shù)據(jù)介入和最后的素材灌入整個(gè)流程進(jìn)行串通。俄羅斯世界杯期間,MAGIC平臺(tái)第一次將生產(chǎn)流水線引入內(nèi)容生產(chǎn)領(lǐng)域,31天內(nèi),機(jī)器生產(chǎn)的世界杯短視頻新聞達(dá)到37581條,其中最快一條耗時(shí)僅6秒。全國(guó)關(guān)于世界杯的短視頻產(chǎn)量大概也就6萬(wàn)多條,我們占了將近60%的生產(chǎn)內(nèi)容提供量,背后源于這套系統(tǒng),對(duì)于一個(gè)3分鐘以內(nèi)的視頻要求在10秒之內(nèi)就能生產(chǎn)出來(lái),有賴于一個(gè)非常強(qiáng)大的生產(chǎn)引擎來(lái)支撐整體的產(chǎn)量。
MAGIC平臺(tái)是人機(jī)協(xié)作的重要突破點(diǎn),整個(gè)流程從選題開(kāi)始,就會(huì)通過(guò)AI大數(shù)據(jù)分析以往的熱點(diǎn),讓人的經(jīng)驗(yàn)作為一個(gè)補(bǔ)充,世界杯期間每場(chǎng)球開(kāi)始前我們都會(huì)有預(yù)定的目標(biāo),比如今天會(huì)有一個(gè)進(jìn)球集錦、紅牌集錦、黃牌集錦,這些主題在賽前都可以規(guī)劃好,當(dāng)賽事發(fā)生,全部由機(jī)器發(fā)現(xiàn)其中的進(jìn)球鏡頭,把這些鏡頭自動(dòng)剪輯后再形成新的集錦,整個(gè)流程速度很快。傳統(tǒng)媒體可以利用自身優(yōu)勢(shì),預(yù)先設(shè)定好模板,只要拿到數(shù)據(jù)源后,人就可以很少參與或介入,讓機(jī)器直接生成內(nèi)容。最后的內(nèi)容產(chǎn)品生成以后,像本次世界杯期間,我們還有人工干預(yù)階段,比如標(biāo)題怎么取,機(jī)器取標(biāo)題還是非常程式化。比如,C羅進(jìn)球的集錦,機(jī)器取的標(biāo)題就是“C羅進(jìn)球集錦”,但編輯人員會(huì)發(fā)現(xiàn)今天C羅進(jìn)了4個(gè)球,有左腳進(jìn)球、右腳進(jìn)球、頭球,可以改一下標(biāo)題——“讓大家領(lǐng)略一下C羅的全能風(fēng)采,看看他的左腳右腳和頭球”。機(jī)器本身可以幫助編輯發(fā)現(xiàn)相關(guān)新聞點(diǎn),它雖然取不出精彩的標(biāo)題,但它可以告訴編輯今天進(jìn)球集錦里包含了左腳、右腳、頭球進(jìn)球集錦,怎么取名字讓編輯發(fā)揮一下,成為一個(gè)閉環(huán)。
本次世界杯期間,這套平臺(tái)和騰訊系、阿里系、頭條系等平臺(tái)資源打通,視頻一生產(chǎn)出來(lái)的1分鐘或半分鐘內(nèi)就一下子分發(fā)出去,我們和今日頭條聯(lián)合做了一次進(jìn)球推送,在進(jìn)球后的2分鐘之內(nèi)就完成了這次進(jìn)球的全網(wǎng)推送。
比如,C羅剛出來(lái)的那個(gè)鏡頭,從物理場(chǎng)去抽出數(shù)據(jù)場(chǎng),對(duì)鏡頭里的人物,通過(guò)人臉識(shí)別、姿態(tài)識(shí)別,包括動(dòng)作識(shí)別去發(fā)現(xiàn)他到底是誰(shuí),也會(huì)借助球衣號(hào)碼或解說(shuō)等,通過(guò)視覺(jué)、聽(tīng)覺(jué)等一切可用信息去分析這個(gè)人到底是誰(shuí),然后和各網(wǎng)的媒資做關(guān)聯(lián)。這個(gè)其實(shí)和最開(kāi)始通過(guò)交通攝像頭發(fā)現(xiàn)道路上的爆炸是一樣的,先期要準(zhǔn)備相當(dāng)多類似的視頻進(jìn)行訓(xùn)練和學(xué)習(xí)。在足球領(lǐng)域?qū)σ恍╆P(guān)鍵的信息,如進(jìn)球、定位球、紅黃牌,進(jìn)行區(qū)分,今后在各垂直領(lǐng)域,可以去找到這樣的新聞點(diǎn)或進(jìn)球事件,用機(jī)器就可以做這個(gè)事情,讓整個(gè)生產(chǎn)流程提速。
這套系統(tǒng)背后利用了物聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)等技術(shù)。除了本身這套生產(chǎn)平臺(tái)以外,接下去我們也會(huì)發(fā)布區(qū)塊鏈的版權(quán),希望從這個(gè)平臺(tái)生產(chǎn)出來(lái)的內(nèi)容都能受到版權(quán)保護(hù)。整個(gè)內(nèi)容傳播鏈路和分發(fā)平臺(tái)有配合的話,我們也可以完成用戶畫像,整個(gè)鏈路很完整,當(dāng)然我們的側(cè)重點(diǎn)在生產(chǎn)這一側(cè)。
在媒體融合發(fā)展方面,我們希望引領(lǐng)新聞熱點(diǎn)報(bào)告這個(gè)新形勢(shì)。前段時(shí)間的一個(gè)熱點(diǎn)新聞,江蘇昆山一個(gè)路口的砍人事件,這個(gè)事情從報(bào)道的角度可以分兩方面來(lái)看,一方面是有技術(shù)能力的時(shí)候可以做報(bào)道,另一方面其實(shí)可以往前一步,當(dāng)有一輛車長(zhǎng)時(shí)間停在路口,對(duì)交通本身是阻礙,如果再能識(shí)別出一些動(dòng)作,其實(shí)可以更快地派警力到相關(guān)地方,避免發(fā)生這樣的慘案,把攝像頭新聞做到極致。攝像頭新聞這個(gè)理念最開(kāi)始是我在做城市大腦的過(guò)程中提取出來(lái)的。攝像頭可以成為線索發(fā)現(xiàn)、第一時(shí)間報(bào)道的重要渠道。
另外,可以打造一些品牌欄目智能生產(chǎn)。2015年,當(dāng)時(shí)我還在阿里云,我們和湖南衛(wèi)視《我是歌手》做了一期節(jié)目,用AI預(yù)測(cè)誰(shuí)是歌王。這方面可以進(jìn)行一些嘗試,一方面可以把人工智能強(qiáng)力植入到欄目本身,另外一方面可以在背后用人工智能支持品牌欄目的制作,在這方面一定會(huì)有很好的合作模式等待探索。
最后,今天媒體融合發(fā)展中很重要一環(huán)還是如何把我們的基礎(chǔ)數(shù)據(jù)利用起來(lái),例如在改革開(kāi)放40周年的一系列報(bào)道活動(dòng)中,如果能把歷史照片、歷史視頻,先通過(guò)人工智能的手段做標(biāo)注,記錄好某個(gè)片段有誰(shuí)的出現(xiàn),或在某個(gè)場(chǎng)合誰(shuí)說(shuō)了某句話,或者可以把一些地方性的建筑抽取出來(lái)看40年間的變化。
這背后有大數(shù)據(jù)或者說(shuō)算法的能力讓我們把已有的歷史資料庫(kù)挖掘出新意,就算沒(méi)有挖掘出新意至少把歷史文檔做了很好的標(biāo)注。最早在發(fā)布媒體大腦時(shí),我們希望通過(guò)媒體大腦來(lái)幫助大家在記錄歷史的時(shí)候,更好地定位歷史,標(biāo)注歷史,今后更好地回顧歷史。