文/張楷越
在媒體深度融合的進程中,人工智能技術(shù)已成為一支重要的推動力量。其中,智能語音技術(shù)以其高密度、高效率、強互動等特點,日益成為一項關(guān)鍵的智能技術(shù),在媒體融合中開始得到廣泛運用,為傳統(tǒng)媒體融合轉(zhuǎn)型提供了技術(shù)支撐。在各新型主流媒體中,基于智能語音技術(shù)、人機交互等技術(shù)的融媒體產(chǎn)品越來越多,應用場景逐漸延伸至日常生活中,拓展了融媒體發(fā)展空間。在媒體智能化發(fā)展的背景下,有必要對智能語音技術(shù)在融媒體中的應用做出更多探索,進一步推動媒體深度融合發(fā)展。
智能語音技術(shù)是人工智能的一個重要組成部分,其中智能語音識別是重要基礎。智能語音識別可以讓機器“聽懂”人類的語言,它既可以將語言轉(zhuǎn)換為書面文字,也可以自動理解語意并準確識別。在融媒體發(fā)展中,智能語音技術(shù)可以以語音合成、語音識別、語義理解、圖像處理等技術(shù)形式,融入新聞報道和融媒體產(chǎn)品服務中,讓用戶感受到融媒體的溫度。
1.提高融媒體生產(chǎn)效率。隨著智能技術(shù)的快速發(fā)展,融媒體發(fā)展的智能化趨勢越來越明顯,機器人新聞等智能采寫模式已經(jīng)較為成熟。而智能采寫的實現(xiàn)需要借助各種智能技術(shù),其中一項就是智能語音技術(shù)。在融媒體新聞生產(chǎn)中,智能語音技術(shù)應用所形成的智能采寫模式可以解放新聞從業(yè)人員的雙手,有效提升新聞生產(chǎn)效率。尤其是對傳統(tǒng)廣電媒體和新興音頻媒體來說,智能語音技術(shù)可以在各種聲音元素中得到運用,從而為其發(fā)展帶來廣闊的空間。
實踐中,智能語音技術(shù)憑借語音和文字的轉(zhuǎn)化功能,成為智能采訪寫作的助手。例如,在會議、庭審、采訪等場景中,智能語音技術(shù)可以通過實時語音識別將音頻信息轉(zhuǎn)換為文字,有效降低新聞記者錄音整理的成本,大幅提升了采訪效率。不僅如此,人工智能技術(shù)還可以將聲音轉(zhuǎn)化圖片、視頻等,從而提高了采訪素材的保存和使用效率。在新聞報道中,無論是會議還是采訪,都有大量語音材料需要整理,智能語音技術(shù)可以對語音材料進行快速加工,形成語音素材的智能采寫,從而提高融媒體生產(chǎn)效率。
2.改善融媒體用戶體驗。在融媒體發(fā)展中,產(chǎn)品創(chuàng)新是重要方向,也是最能體現(xiàn)出媒體融合效果的形式。為此,各大媒體廣泛運用各種新技術(shù),推出各種新穎的融媒體產(chǎn)品。融媒體語境下,用戶需要呈現(xiàn)出多樣化趨勢,單一的新聞報道已難以滿足。媒體的功能也不再局限于新聞報道,而是融入政務、服務、商務、社交等各項功能。在這種發(fā)展趨勢下,智能語音技術(shù)的出現(xiàn)為滿足用戶需求和媒體服務功能拓展提供了新的技術(shù)基礎。相比其他技術(shù)形態(tài)的產(chǎn)品來說,基于智能語音技術(shù)而打造的融媒體產(chǎn)品更加便于操作,用戶在使用時可以解放雙手,同時處理其他事情。智能語音產(chǎn)品可以有效拓展音頻的融合功能,提高融媒體產(chǎn)品的用戶體驗。正因如此,智能語音產(chǎn)品對融媒體發(fā)展的作用受到越來越多媒體的重視,也涌現(xiàn)出大量智能語音產(chǎn)品。
隨著媒體融合進入深度融合期,人工智能、大數(shù)據(jù)、VR等各種新技術(shù)廣泛用于融媒體報道中。智能語音技術(shù)逐漸成為一支新興的技術(shù)力量,在融媒體中得到越來越多的應用。而且,移動互聯(lián)網(wǎng)使用場景多,智能語音技術(shù)可以在新聞傳播的不同場景中發(fā)揮作用。目前,智能語音技術(shù)已經(jīng)在視頻直播、語音播報、智能問答等應用場景中表現(xiàn)出了巨大潛力。
1.網(wǎng)絡直播場景應用。網(wǎng)絡直播市場上,娛樂主播、帶貨主播備受關(guān)注,成為直播平臺上的主力軍。經(jīng)過多年發(fā)展,網(wǎng)絡直播市場逐漸飽和,而新的直播模式開始出現(xiàn)。其中,智能語音直播就是一種重要發(fā)展方向。目前市場上的智能直播機器人有虛擬直播間、虛擬人物,也有各種可任意切換的虛擬背景,可以根據(jù)使用終端切換,還可以在直播后臺設置話術(shù),以滿足用戶的個性化收聽需求。
相比傳統(tǒng)直播模式,智能語音直播有其獨特的優(yōu)勢,可以更好體現(xiàn)融媒體平臺的專業(yè)化水平。首先,智能語音直播可以對用戶群體進行個性化定制,功能比較簡單,開發(fā)周期短,大幅減輕了直播運營的前期投入。其次,智能語音直播只需要一個穩(wěn)定的連麥就可以實現(xiàn),突破了傳統(tǒng)直播對采集、渲染、編解碼、播放等環(huán)節(jié)的高要求。再次,智能語音直播擁有豐富的互動形式,不僅有傳統(tǒng)的禮物打賞、彈幕私信、連麥這些功能,也可以為用戶提供一對一語音聊天或多人語音聊天室。最后,智能語音直播可以細分用戶類型,根據(jù)不同類型打造出更加專業(yè)化的服務平臺。
例如,抖音已經(jīng)開啟了智能語音直播功能。用戶可以利用直播間的各類工具進行即時翻譯、調(diào)整語音速度和音量,以及設置自動回復等。甚至,不再需要手動輸入彈幕,可以自由交互,更加流暢。如此一來,不僅可以讓直播更加便捷,而且還可以提高直播的質(zhì)量和趣味性。
2.語音播報場景應用。在融媒體使用過程中,不同用戶的使用習慣不同,對語言、聲音等也有不同偏好。傳統(tǒng)直播模式可以做到內(nèi)容上的滿足,但在聲音上卻很難追蹤用戶需求。智能語音技術(shù)的應用,可以對用戶的個性化需求,按照不同需求設置不同話術(shù)、聲音等,使每個用戶都能根據(jù)自身喜好進行選擇,從而更好地留住用戶。
例如,微軟推出的智能機器人“小冰”曾一度受到廣泛關(guān)注。小冰具有細膩的語調(diào)和音色,與真人高度相似的語氣用詞,說話語調(diào)抑揚頓挫,聽起來非常逼真。近些年,京東、百度、阿里等也開始致力于智能語音播報的研發(fā),將智能語音技術(shù)應用于新聞生產(chǎn)、內(nèi)容分發(fā)、用戶互動等層面,并用“低價+補貼”的互聯(lián)網(wǎng)方式搶占市場。當然,隨著智能機器人的日益增多,用戶的新鮮感容易失去,需要通過使用場景及內(nèi)容作為支撐。為此,融媒體發(fā)展進程中,智能語音播報需要重視智能家居、車載等應用場景的開發(fā),為自身可持續(xù)發(fā)展提供終端基礎。
3.社交聊天場景應用。智能語音技術(shù)可以實現(xiàn)社交聊天場景應用。它既可以支持一對一語音聊天,也可以進行多人語音聊天,討論共同話題,聚合有共同愛好的用戶。在智能語音聊天系統(tǒng)中,動態(tài)發(fā)布功能更是有著極強社交屬性的功能,給用戶提供了發(fā)布個人的語音、圖片、視頻等動態(tài)信息的窗口,架起了媒體與用戶間溝通的橋梁。在此基礎上,還可以運用智能語音識別應用場景,實現(xiàn)語音文件的快速整理,并通過語音合成、語音識別、語義理解、圖像處理等技術(shù),對信息進行情感判斷,讓用戶感受到信息的溫度。
新技術(shù)的創(chuàng)新和運用是媒體深度融合的重要方法。作為媒體融合發(fā)展的一支新興力量,智能語音技術(shù)可從內(nèi)容生產(chǎn)、融媒體指揮和智能虛擬播報三個方面發(fā)揮更多作用。
1.賦能融媒體生產(chǎn)運營系統(tǒng)。統(tǒng)一的指揮系統(tǒng)是確保融媒體生產(chǎn)和傳播的重要基礎。因此,傳統(tǒng)媒體應充分利用自身優(yōu)勢,融合人工智能、云計算和大數(shù)據(jù)等新技術(shù),做好策、采、編、發(fā)、審、管的統(tǒng)一布局,實現(xiàn)“一次采集、多種生成、多元傳播”的創(chuàng)新性采編模式,打造融媒體中心的神經(jīng)中樞。在已有的融媒體指揮系統(tǒng)中,探索形成了融媒體生產(chǎn)的“中央廚房”模式,而智能語音技術(shù)的應用,可以進一步提升融媒體生產(chǎn)和運營效能。
以封面新聞APP為例,首先,將語音轉(zhuǎn)文字、文字轉(zhuǎn)語音等技術(shù)引入采編系統(tǒng),借助邊界的語音操控提高編輯記者的新聞生產(chǎn)效率,并通過智能分析和智能推薦,提高用戶對重點內(nèi)容的理解和把握能力。其次,重視優(yōu)化分發(fā)端的語音呈現(xiàn),如將人工語音合成技術(shù)應用于虛擬主機播放、視頻動畫配音、MR視頻、互動H5等新聞的呈現(xiàn),促進智能語音技術(shù)與其他人工智能技術(shù)的結(jié)合,打破原有信息終端分裂的局限,讓聲音成為用戶與APP主要的溝通途徑。最后,運用于融媒體運營體系,借助人機語音對話數(shù)據(jù),豐富用戶畫像,人工智能+營銷、人工智能+用戶調(diào)研等,提高融媒體運營效率。此外,用戶的互動、交流、反饋是體驗效果的重要部分。在融合發(fā)展過程中,各大媒體需要注重用戶與平臺之間的溝通與交流,及時了解用戶對智能語音技術(shù)產(chǎn)品的想法和訴求。只有這樣,才能不斷優(yōu)化融媒體報道的用戶體驗,吸引用戶并留住用戶。
2.優(yōu)化內(nèi)容資源建設。智能語音技術(shù)背景下融媒體的生態(tài)定位還是內(nèi)容提供者,優(yōu)化內(nèi)容資源建設是未來發(fā)展的關(guān)鍵。一是創(chuàng)新智能語音播報,作為智能語音技術(shù)應用于融媒體的早期形態(tài),智能語音播報是衡量內(nèi)容智能化水平的關(guān)鍵。央視微信公眾號廣播新聞欄目《早??!新聞來了》分為“要聞”“社會”“國際”三個板塊,一般為40~70字左右的短消息新聞,選題整體更加貼近社會民生,每期閱讀量均超過10萬,具備較強的傳播效果。二是發(fā)力短視頻新聞,短視頻是當下互聯(lián)網(wǎng)場域中的主要傳播形態(tài),對提升用戶體驗可以發(fā)揮重要作用。新華社“AI主播”短視頻新聞在智能語音合成技術(shù)的基礎上,還使用了虛擬數(shù)字人、3D智能合成等技術(shù),使得欄目更加人格化、實體化,在國內(nèi)外引起了廣泛討論,對智能語音技術(shù)背景下新聞生產(chǎn)的范式升級具有重要意義。
3.加深伴隨式場景體驗。融媒體時代,用戶的體驗十分重要。作為內(nèi)容提供商,媒體應利用現(xiàn)有智能語音技術(shù)創(chuàng)建創(chuàng)新應用場景,建立新的流量門戶,贏得新的盈利據(jù)點。一是開發(fā)智能語音助手的多重角色,擴充聲音數(shù)據(jù)庫,以封面新聞APP的“小冰”為例,用戶可設定該智能語音助手為“慈祥的奶奶”聲音,并對其形象進行定制化處理?!靶”弊x新聞也不僅是單純文字復述,而是加入語義理解和情感判斷,給新聞以“溫度”,也更能吸引用戶、留住用戶。二是將智能語音技術(shù)深度應用在媒體中的系統(tǒng)環(huán)節(jié),包括文稿唱詞系統(tǒng)、內(nèi)容轉(zhuǎn)寫系統(tǒng)、第三方的接口服務、融媒體會議系統(tǒng)等。如新華社“音訊”可支持多語種語音智能分析,包含移動APP、PC端、網(wǎng)頁端等產(chǎn)品形態(tài),不僅為新聞創(chuàng)作帶來無限可能,也能夠為用戶提供安全高效的體驗,受到了業(yè)界的廣泛贊譽。