王晨 陳栓緊
摘要:隨著新技術(shù)的成熟,全球首個(gè)AI主播于2018年誕生。AI主播有哪些優(yōu)勢(shì)能為傳媒業(yè)所用?未來AI主播又會(huì)何去何從?這些問題都值得研究。文章基于國(guó)內(nèi)外AI主播的研究現(xiàn)狀,梳理了AI主播的發(fā)展階段及特征,試論AI主播產(chǎn)生的影響,并就AI主播的應(yīng)用場(chǎng)景提出建議。
關(guān)鍵詞:AI主播;新聞媒體;應(yīng)用場(chǎng)景
中圖分類號(hào):G210.7 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-8883(2021)22-0007-03
一、引言
2017年,人工智能寫入國(guó)務(wù)院政府工作報(bào)告;2019年,中央全面深化改革委員會(huì)第七次會(huì)議審議通過《關(guān)于促進(jìn)人工智能和實(shí)體經(jīng)濟(jì)深度融合的指導(dǎo)意見》。此后,人工智能逐步與經(jīng)濟(jì)社會(huì)各領(lǐng)域“擁抱”,孕育出不少卓越成果。根據(jù)微軟和永安、清科數(shù)據(jù)測(cè)算,至2022年,中國(guó)人工智能市場(chǎng)規(guī)模預(yù)計(jì)將超過千億元。在此背景下,2018年,新華社推出首個(gè)AI主播,開創(chuàng)了新聞?lì)I(lǐng)域?qū)崟r(shí)音頻與AI真人形象合成的先河。它在為傳統(tǒng)媒體與人工智能的深度融合提供又一典型范例的同時(shí),也促使人們思考AI主播與傳統(tǒng)主播的優(yōu)劣及其未來的應(yīng)用場(chǎng)景。
二、AI主播的特征
AI主播可定義為基于“自然交互+知識(shí)計(jì)算”智能理念,結(jié)合語(yǔ)音及形象合成技術(shù),向觀眾展現(xiàn)出生動(dòng)逼真?zhèn)鬟_(dá)效果的主播,它主要有三個(gè)特征。
(一)極具擬人化傳播效果
AI主播大多脫胎于真人主播,他們是對(duì)真實(shí)主播形象的“復(fù)制”,通過對(duì)真人主播進(jìn)行技術(shù)性建模得到極具擬人化的軀體和聲音。例如新華社AI主播“新小微”,她是以新華社記者趙琬微為原型生成的,可以根據(jù)不同的新聞內(nèi)容和場(chǎng)景,利用AI算法實(shí)時(shí)驅(qū)動(dòng)自身形態(tài)、面部表情,變換服飾、發(fā)型等。逼真的外形、真實(shí)的擬人動(dòng)作,讓AI主播具象性與真人感并存,對(duì)觀眾來說,有效營(yíng)造出了新聞播報(bào)的現(xiàn)場(chǎng)氛圍。另外,AI主播減少了人為控制的因素。新聞編輯人員只需將要播報(bào)的文本數(shù)據(jù)輸入AI主播對(duì)應(yīng)的程序中,它就能基于自身的數(shù)據(jù)庫(kù)輸出語(yǔ)音、視頻,方便快捷,且有效避免了傳統(tǒng)新聞主播在新聞播報(bào)過程中出現(xiàn)的漏字、錯(cuò)字、別字等問題,或是打哈欠、打噴嚏等不可控的突發(fā)生理問題,為人們提供更及時(shí)、更廣泛的服務(wù)和更客觀的新聞。
(二)24小時(shí)待命實(shí)時(shí)傳遞信息
AI主播全天候在崗,可隨時(shí)為網(wǎng)絡(luò)平臺(tái)播報(bào)新聞,即使在凌晨,依然能以飽滿的狀態(tài)傳遞信息,有效緩解了真人主播的播報(bào)壓力,分擔(dān)了一定的工作任務(wù)。如在新華社客戶端中,AI主播曾在凌晨0點(diǎn)52分播報(bào)新聞,其工作狀態(tài)依舊良好,這有效增強(qiáng)了新聞畫面的可觀賞性,提高了新聞的時(shí)效性。再如,科大訊飛推出的多語(yǔ)種AI主播“小晴”,在全國(guó)兩會(huì)期間,第一時(shí)間運(yùn)用中、英、日、韓等語(yǔ)言播報(bào)會(huì)議最新動(dòng)態(tài),有效加快了中國(guó)媒體國(guó)際傳播的步伐,壓縮了對(duì)外發(fā)聲的時(shí)間差,也為中國(guó)媒體走向世界贏得了新的機(jī)遇與條件。
(三)智能數(shù)據(jù)處理減少制作成本
馬歇爾·麥克盧漢在《理解媒介:論人的延伸》中提到一種觀點(diǎn)——“媒介是人的延伸”[1]。AI主播依托數(shù)據(jù)存在,它的背后有特定的行業(yè)數(shù)據(jù)庫(kù)。AI主播不僅能夠播報(bào)新聞,而且能從數(shù)據(jù)庫(kù)中調(diào)取優(yōu)質(zhì)且精確的內(nèi)容,進(jìn)行數(shù)字化處理,總結(jié)出內(nèi)在邏輯、規(guī)律。目前,實(shí)時(shí)的交通、天氣、體育賽事等節(jié)目都需要提前開展大量的數(shù)據(jù)采集和組織工作,AI主播能充分發(fā)揮自身優(yōu)勢(shì),保證數(shù)據(jù)采集和集成的效率。隨著技術(shù)的不斷改進(jìn),AI主播依靠其強(qiáng)大的數(shù)據(jù)庫(kù),不斷挑戰(zhàn)真人主播的位置。如在央視網(wǎng)絡(luò)春晚的舞臺(tái)上,以節(jié)目主持人撒貝寧為模板的AI機(jī)器人“小小撒”登場(chǎng),他不僅能夠?qū)υ挘€能夠背誦詩(shī)詞,進(jìn)行簡(jiǎn)單互動(dòng)。新華社AI主播上崗以來,已實(shí)現(xiàn)量產(chǎn),參與了互聯(lián)網(wǎng)大會(huì)、進(jìn)博會(huì)、春運(yùn)、春節(jié)等重要新聞報(bào)道,通過新華社客戶端、新華網(wǎng)、短視頻平臺(tái)播放,引發(fā)國(guó)內(nèi)外媒體的廣泛關(guān)注。
三、AI主播的發(fā)展歷程
AI主播的合成,需要強(qiáng)大的技術(shù)支持,根據(jù)技術(shù)呈現(xiàn)效果的差異,可將AI主播的發(fā)展歷程分為兩個(gè)階段。
(一)起步階段
在這一階段,AI主播大多以三維虛擬形象出現(xiàn),表情及動(dòng)作較為僵硬,且耗時(shí)耗力,制作成本較高。2001年,世界上第一個(gè)人工智能虛擬主持人阿娜諾娃(Ananova)出現(xiàn),CNN將其描述為一個(gè)堪比真實(shí)的有血有肉的主播。隨后,日本、韓國(guó)等國(guó)家都推出了自己的人工智能主持人。2004年,CCTV—6頻道推出了國(guó)內(nèi)首位虛擬電視節(jié)目主持人—小龍。他采用3D形象設(shè)計(jì),將金城武、劉德華、梁朝偉的面部?jī)?yōu)勢(shì)吸收再重塑,負(fù)責(zé)主持《光影周刊》欄目。雖然在形式上有了重大突破,但事實(shí)上,起步階段的AI主播播報(bào)一期節(jié)目的成本甚至超過傳統(tǒng)主播。制作團(tuán)隊(duì)需要對(duì)聲音、形象進(jìn)行單獨(dú)制作,將其嵌入合并,再進(jìn)行三維程序制作,過程復(fù)雜煩瑣。
(二)探索階段
隨著科技發(fā)展,技術(shù)的成熟,AI主播逐漸趨于真實(shí)。2016年,科大訊飛、百度等相關(guān)科技企業(yè),在發(fā)布會(huì)上表示其人工智能的語(yǔ)音識(shí)別率已高達(dá)97%。人工智能語(yǔ)音識(shí)別技術(shù)的精確性,在一定程度上助推了AI主播進(jìn)入市場(chǎng)的進(jìn)程。2018年5月,AI主播“康小輝”亮相,這位AI主持人是由科大訊飛打造,與央視主持人康輝外形相似。“康小輝”相比以往的AI主播,最大的不同在于不再需要高昂成本,只需簡(jiǎn)單設(shè)備便可播報(bào)新聞。2018年11月8日,第五屆全球互聯(lián)網(wǎng)大會(huì)上,搜狗與人工智能合作的AI主播“新小浩”面世,“新小浩”幾近完美地克隆了新華社男主播邱浩,從形象到聲音,從唇形到動(dòng)作,幾乎是邱浩的“翻版”。2019年2月,“新小浩”由坐式變?yōu)檎玖⑹?,表現(xiàn)形式更加豐富。隨后“新小萌”“麗莎”等AI主播紛紛亮相。
在探索階段,我們能清晰地感受到AI主播越來越接近真實(shí)人類,服飾、性別等方面也做到了切換自如,制作成本越來越低,時(shí)間越來越短,技術(shù)不斷升級(jí)迭代。
四、AI主播與傳統(tǒng)主播的對(duì)比分析
(一)價(jià)值取向?qū)Ρ?/p>
由技術(shù)創(chuàng)造出的物品都有一定的價(jià)值取向。技術(shù)帶來的價(jià)值取向通常表現(xiàn)在這種技術(shù)的使用途徑和方式上。對(duì)比來看,AI主播盡管實(shí)現(xiàn)了量產(chǎn),但其作用依然是模仿、替代。他不是憑空創(chuàng)造出來的仿真數(shù)字人像,而是通過綜合描繪某一真實(shí)主播的身體特征、身份信息而產(chǎn)生的。通過數(shù)據(jù)的調(diào)動(dòng)和記錄,盡力去“克隆”傳統(tǒng)主播,實(shí)現(xiàn)信息輸出的目標(biāo)。
但信息的傳播往往不是一個(gè)單向循環(huán)的簡(jiǎn)單過程,而是不斷突破、再創(chuàng)造的行為。在傳媒業(yè),判斷一個(gè)主播是否優(yōu)秀,播音時(shí)長(zhǎng)、出現(xiàn)頻次都不是關(guān)鍵所在,更重要的是對(duì)新聞稿件進(jìn)行有思想力的表現(xiàn),更可以表達(dá)為對(duì)新聞的再加工創(chuàng)造。傳統(tǒng)主播可以合理運(yùn)用自身情感營(yíng)造新聞浸入感,而且傳統(tǒng)主播在多次實(shí)踐播音后能夠從中提煉技巧,升華自身技藝,從而得到“1+1>2”的創(chuàng)新效果,但AI主播在當(dāng)前的技術(shù)條件下,多次播音后,依然只能機(jī)械地念稿,盡力去模仿、還原傳統(tǒng)主播,并不能自我提升,得到的是“1+1=2”的效果。
(二)播出效果對(duì)比
播音的效果方面,不得不說,AI主播比傳統(tǒng)主播更加穩(wěn)定。因?yàn)锳I主播是由數(shù)據(jù)計(jì)算合成的3D數(shù)字人,不會(huì)存在像傳統(tǒng)主播一樣的生理問題、情緒波動(dòng)等,遇到突發(fā)狀況時(shí),AI主播也能毫無波瀾地完成新聞播報(bào)工作。反觀傳統(tǒng)主播,人們時(shí)常會(huì)在社交網(wǎng)絡(luò)或短視頻平臺(tái)刷到傳統(tǒng)主播的失誤合集,有的是流鼻涕、打哈欠、補(bǔ)妝等,有的是大笑、忘詞等,這在一定程度上都影響了節(jié)目播出的效果。那么AI主播在播音效果上絕對(duì)優(yōu)異嗎?當(dāng)然不是,因?yàn)槿斯ぶ悄軝C(jī)器人是靠數(shù)據(jù)發(fā)出聲音,而非聲帶發(fā)聲,這就導(dǎo)致他們播音時(shí)存在兩個(gè)問題。
第一是表達(dá)機(jī)械化,缺乏語(yǔ)流音變。人們?cè)谟闷胀ㄔ捊涣鲿r(shí),時(shí)常會(huì)出現(xiàn)兒化音、變調(diào)、多音字、輕聲等,而AI主播是多音節(jié)連續(xù)輸出,不能掌握全面的音變規(guī)律,導(dǎo)致播音時(shí)的機(jī)械性較強(qiáng)。如AI主播“新小浩”在一次兩會(huì)新聞播報(bào)中,讀到“什么東西最難攜帶?”中的“西”字時(shí)依然用陰平方式發(fā)聲,并未音變?yōu)檩p聲,這容易讓人混淆。第二是停頓不當(dāng),導(dǎo)致新聞邏輯不明。面對(duì)播報(bào)中的長(zhǎng)句子,AI主播很容易停頓不當(dāng),導(dǎo)致語(yǔ)義邏輯不順。
綜上所述,在播音效果方面,傳統(tǒng)主播和AI主播各有優(yōu)劣,不能一概而論。
(三)情感互動(dòng)對(duì)比
莎士比亞曾言,“一千個(gè)人眼中有一千個(gè)哈姆雷特”,這正是人類情感各異、思想存在差別的表現(xiàn)。人工智能作為一項(xiàng)技術(shù),可以讓虛擬主播利用后臺(tái)程序的數(shù)據(jù)表達(dá)理解情感,但無法真正感受情感。面對(duì)相同的稿件,不同的傳統(tǒng)主播會(huì)有不同的表達(dá)方式,會(huì)有不同的場(chǎng)景創(chuàng)設(shè),更有不同的理解。而AI主播只能根據(jù)程序的設(shè)定程式化地回應(yīng),進(jìn)而表達(dá),缺乏深層內(nèi)涵,不能做到言志傳神。缺乏情感的表達(dá),是AI主播的劣勢(shì)?;?dòng)方面,AI主播目前主要應(yīng)用于新聞播報(bào)中,不需要與觀眾互動(dòng)交流。但AI主播的應(yīng)用范圍不僅僅在新聞播報(bào)領(lǐng)域,還會(huì)在采訪、綜藝節(jié)目中出現(xiàn),面對(duì)這樣的場(chǎng)景,AI主播很難招架。如在采訪中,傳統(tǒng)主播能夠根據(jù)嘉賓的回答延伸,現(xiàn)場(chǎng)隨機(jī)變換問題,讓主播和嘉賓形成良性互動(dòng)。在綜藝節(jié)目中,主播需要把控觀眾情緒,又要照顧舞臺(tái)效果,這樣一來,主播不再只是見字發(fā)聲的機(jī)器,而是更需互動(dòng)、以人為本的高素質(zhì)主持人。
這樣來看,AI主播與傳統(tǒng)主播對(duì)比,缺少情感表達(dá),缺乏互動(dòng)性。
五、AI主播帶來的影響
(一)對(duì)傳統(tǒng)主播的影響
AI主播出現(xiàn)之后,是否能替代傳統(tǒng)主播呢?有不少學(xué)者對(duì)此進(jìn)行了研究。各方文章認(rèn)為AI主播的出現(xiàn)對(duì)傳統(tǒng)主播產(chǎn)生了三點(diǎn)影響。
一是迫使傳統(tǒng)主播不斷提高業(yè)務(wù)水平。在數(shù)據(jù)較多的財(cái)政股票、新聞?lì)惞?jié)目中可以看出,AI主播處理新聞時(shí)的精確度和標(biāo)準(zhǔn)度是傳統(tǒng)主播無法比擬的,傳統(tǒng)主播主持節(jié)目時(shí)很難保證沒有意外發(fā)生,但是AI主播可以100%避免這些失誤,這在無形中敦促傳統(tǒng)主播不斷提高自身業(yè)務(wù)水平。
二是倒逼傳統(tǒng)主播尋求職業(yè)上的轉(zhuǎn)型升級(jí)。AI主播已經(jīng)在媒體平臺(tái)量產(chǎn)播稿,他們通過文本的輸入就能實(shí)現(xiàn)仿真式的播音,自動(dòng)合成音、視頻,高效且便捷。傳統(tǒng)主播隊(duì)伍中存在個(gè)別缺乏特色且不上進(jìn)的主播,AI主播的出現(xiàn)一定程度上會(huì)讓這些主播面臨失業(yè)危機(jī),倒逼其創(chuàng)新進(jìn)步,不斷提高理論修養(yǎng)、自身素質(zhì)。
三是有利于形成良性競(jìng)爭(zhēng)的環(huán)境。
(二)對(duì)傳媒業(yè)態(tài)的影響
傳媒業(yè)處在變革時(shí)期,AI主播是順勢(shì)而生的創(chuàng)新產(chǎn)物。最直接的影響是AI主播直接提高了新聞的收視率,但收視率的提高并非因?yàn)閮?nèi)容,更多是因?yàn)樾问?。正如保羅·萊文森“媒介演進(jìn)三階段(玩具—鏡子—藝術(shù))”理論所言,新技術(shù)在初期被當(dāng)作“玩具”,人們新奇于它的形式。當(dāng)?shù)竭_(dá)“鏡子”階段后,人們開始逐步關(guān)注媒介表達(dá)的內(nèi)容,最終上升為后現(xiàn)實(shí)“藝術(shù)”[2]。所以AI主播在短期內(nèi)會(huì)增加新聞的閱讀量,但人們把它當(dāng)作“技術(shù)玩具”,當(dāng)人們適應(yīng)甚至是厭倦了這樣一種播音模式,傳媒業(yè)又會(huì)恢復(fù)常態(tài)。傳統(tǒng)的傳媒業(yè)重心在采、編、播。現(xiàn)下,這三項(xiàng)工作有了人工智能的輔助,變得更加輕松,傳媒業(yè)的工作重心將會(huì)逐漸偏向于把關(guān)。技術(shù)雖然讓傳媒業(yè)態(tài)變得高效快捷,但我們不能因此失去對(duì)新聞的掌控力。任何時(shí)候,當(dāng)人失去對(duì)技術(shù)的控制,后果將不堪設(shè)想。在人工智能給新聞業(yè)態(tài)提供了極大便利的情況下,我們更加需要對(duì)新聞生產(chǎn)進(jìn)行把關(guān),明確信息的真實(shí)性,維護(hù)傳媒業(yè)的公信力。
(三)對(duì)社會(huì)發(fā)展的影響
彭蘭教授認(rèn)為新媒體具有三大特征,即萬物皆媒、自我進(jìn)化、人機(jī)共生,這預(yù)示著傳媒業(yè)與智能技術(shù)交互協(xié)作將是大勢(shì)所趨[3]。
可以預(yù)見的是,未來傳媒業(yè)要把人工智能當(dāng)作輔助工具,使新聞生產(chǎn)更快捷、新聞信息傳遞更準(zhǔn)確、表現(xiàn)形式更生動(dòng),一步步推動(dòng)傳媒業(yè)轉(zhuǎn)型升級(jí)。
放眼世界,發(fā)達(dá)國(guó)家高度重視人工智能技術(shù)的發(fā)展,我國(guó)也將人工智能作為產(chǎn)業(yè)驅(qū)動(dòng)力。AI主播的發(fā)展,能夠進(jìn)一步優(yōu)化國(guó)家外部環(huán)境,推動(dòng)國(guó)家制定相關(guān)法律政策、完善倫理規(guī)范、引導(dǎo)社會(huì)風(fēng)向,讓技術(shù)與經(jīng)濟(jì)更加深入地融合,營(yíng)造良好數(shù)字生態(tài),建設(shè)數(shù)字中國(guó)。
不得不說,AI主播的出現(xiàn)也在一定程度上提升了我國(guó)的傳媒影響力,當(dāng)全球第一個(gè)AI主播在中國(guó)上崗時(shí),不僅在國(guó)內(nèi),在國(guó)際上也引發(fā)不小的轟動(dòng),美國(guó)、英國(guó)、印度權(quán)威媒體紛紛感慨主播“栩栩如生”,贊嘆中國(guó)在人工智能技術(shù)方面的實(shí)力。這無疑向世界展示了“中國(guó)創(chuàng)造”的力量,推動(dòng)產(chǎn)業(yè)創(chuàng)新升級(jí),創(chuàng)造社會(huì)價(jià)值,為國(guó)家高質(zhì)量發(fā)展注入新的動(dòng)力。
六、結(jié)語(yǔ)
目前,AI主播已能對(duì)模式化的信息進(jìn)行播報(bào),這在一定程度上解放了人力資源,但卻不能完全取代傳統(tǒng)主播。因?yàn)槿耸且蛩枷氩町惗?dú)特,人工智能終究是數(shù)字機(jī)器,無法理解情感,也不能自生思想。在不斷創(chuàng)新和變革的工業(yè)4.0時(shí)代,傳媒業(yè)應(yīng)該抓住技術(shù)日益成熟的機(jī)遇,讓人工智能技術(shù)更加成熟,探索高質(zhì)高效的人機(jī)合作,實(shí)現(xiàn)人類和技術(shù)的互補(bǔ)。
參考文獻(xiàn):
[1] 麥克盧漢.理解媒介[M].何道寬,譯.北京:商務(wù)印書館,2000:57.
[2] 胡嶸.新媒體視閾下電視新聞主播業(yè)務(wù)素質(zhì)的研究[J].記者觀察,2019(2):27.
[3] 彭蘭.智媒化:未來媒體浪潮:新媒體發(fā)展趨勢(shì)報(bào)告(2016)[J].國(guó)際新聞界,2016,38(11):6-24.
作者簡(jiǎn)介 王晨,碩士,研究方向:新聞與傳播。陳栓緊,碩士,研究方向:電影學(xué)。