摘要:隨著媒體融合發(fā)展進程推進,視覺媒體正在成為媒體跨端跨形態(tài)融合中重要媒體形態(tài)之一,人工智能技術(shù)對視覺媒體發(fā)展正在發(fā)揮其影響。本文旨在通過觀察人工智能技術(shù)對視覺媒體的既有影響,以人工智能技術(shù)中的計算機視覺為側(cè)重點,綜合市場規(guī)模發(fā)展、媒體經(jīng)營、內(nèi)容生產(chǎn)、媒體人才等維度進行思考,分析人工智能技術(shù)之于視覺媒體的作用,針對媒體轉(zhuǎn)型發(fā)展新方向(如虛擬主持人、數(shù)據(jù)新聞等),梳理發(fā)展機會與瓶頸,并給出解決方案。
關(guān)鍵詞:人工智能;視覺媒體;融合發(fā)展
中圖法分類號:TP18文獻標識碼:A
Value of artificial intelligence technology to development of media integration
-Taking visual media as an example
ZHAO Miao
(Beijing Mingsili Public Relations Consulting Co.,Ltd.,Beijing 100020)
Abstract:With the advancement of media integration development,visual media is becoming one of the important media forms in the cross-end and cross-form integration of media,and artificial intelligence is exerting its influence on the development of visual media.This paper aims to analyze the impact of artificial intelligence technology on visual media by observing the existing influence of artificial intelligence technology on visual media,focusing on computer vision in artificial intelligence technology,and comprehensively thinking about the development of market scale, media management, content production,media talents and other dimensions,and analyzes the development of artificial intelligence technology.Based on the role of visual media,it sorts out development opportunities and bottlenecks for new directions of media transformation and development (such as virtual hosts,datajournalism,etc.),and provides solutions.
Key words: artificial intelligence, visual media, integrated development
1 視覺媒體
麥克盧漢在《理解媒介:論人的延伸長》一書里提出“媒介即人的延伸”的概念,他認為任何媒介都不外乎是人的感覺和感官的擴展或延伸;文字和印刷媒介是人的視覺能力的延伸,廣播是人的聽覺能力的延伸,電視則是人的視覺、聽覺和觸覺能力的綜合延伸[1]。2013年,隨著社交網(wǎng)絡(luò)在全球范圍內(nèi)呈現(xiàn)出視覺化發(fā)展,在如今的數(shù)字媒體涌現(xiàn)時代,廣義上的視覺媒體不僅是文字、印刷、電視媒介的綜合體,社交媒體與視頻媒體也都是視覺媒體范疇,本文所研究的“視覺媒體“為更廣義的范疇,包括印刷媒介(報紙、雜志、出版物)、網(wǎng)絡(luò)視頻端、社交媒體(微信微博以及其他陌生人關(guān)系社交媒體)、電視以及游戲 APP 等。
2 概述
隨著媒體融合發(fā)展進程推進,視覺媒體正在成為媒體跨端跨形態(tài)融合中重要媒體形態(tài)之一,而人工智能技術(shù)對視覺媒體發(fā)展正在發(fā)揮其影響。目前,人工智能技術(shù)不僅包括技計算機視覺、數(shù)據(jù)挖掘、機器學習、機器人及 IC 設(shè)計等技術(shù),還包括語言識別和自然語言處理技術(shù)。計算機視覺技術(shù)在國內(nèi)人工智能技術(shù)應(yīng)用場景占比較多。根據(jù)億歐智庫人工智能企業(yè)數(shù)據(jù)庫統(tǒng)計,截至2019年5月,計算機視覺技術(shù)應(yīng)用領(lǐng)域的企業(yè)規(guī)模在整體人工智能領(lǐng)域占比30%,計算機視覺技術(shù)成為現(xiàn)階段深度學習研究的座上賓。
作為涵蓋計算機科學、數(shù)據(jù)、工程學、物理、生物學以及神經(jīng)科學的交叉學科,計算機視覺技術(shù)可實現(xiàn)對視覺環(huán)境的敏感捕捉與理解,有助于理解跨越復合交叉學科的深度學習,該技術(shù)被業(yè)內(nèi)很多科學研究者視為實現(xiàn)人工智能技術(shù)發(fā)展的優(yōu)質(zhì)路徑;計算機視覺技術(shù)應(yīng)場景包括人臉識別以及生物特質(zhì)統(tǒng)計(指紋、虹膜等)、圖像檢索、游環(huán)操作控制與監(jiān)控、智能駕駛,可以實現(xiàn)圖像分類、目標檢測、目標追蹤、語義分割與實例分割等[2],因此計算機視覺技術(shù)正在成為視覺媒體發(fā)展的重要支持技術(shù)方向。得益于其本身是對將計算機智能化的可編程算法展開研究,通過該方式,計算機可以像人類視覺那樣處理和理解人類視覺圖像。此外,數(shù)據(jù)挖掘、機器學習等人工智能技術(shù)還可以幫助視覺媒體實現(xiàn)對用戶的深度學習與了解。
3 價值與作用
在擁抱數(shù)字化的媒體時代,人工智能的發(fā)展為視覺媒體傳播經(jīng)營創(chuàng)造了新機遇,在市場環(huán)境、內(nèi)容生產(chǎn)、經(jīng)營管理等方面有不同價值。
3.1 人工智能技術(shù)為視覺媒體傳播活動創(chuàng)造了創(chuàng)新發(fā)展的市場環(huán)境基礎(chǔ)
資本市場在人工智能領(lǐng)域的持續(xù)投入,以計算機視覺技術(shù)占比較多,其次是在語義識別、機器學習、數(shù)據(jù)挖掘?qū)用?,而多樣化的人工智能技術(shù)應(yīng)用場景也受到資本市場的肯定,視覺媒體領(lǐng)域(包括視覺媒體傳播及業(yè)務(wù)經(jīng)營有關(guān)的廣告營銷領(lǐng)域)也正在獲得更多市場資本的支持。《億歐智庫2019年中國人工智能投資市場研究報告》顯示,資本市場對人工智能領(lǐng)域的投資熱度在2012~2018年期間增幅較快。結(jié)合人工智能涉足各行業(yè)的被投資情況來看,以企業(yè)營銷為主的服務(wù)領(lǐng)域獲投26次,互聯(lián)網(wǎng)服務(wù)企業(yè)獲投126次,內(nèi)容生產(chǎn)與審核,智能推薦、圖視頻處理為其中被投資較多的方向。從經(jīng)濟環(huán)境層面來看,人工智能技術(shù)對視覺媒體及其傳播活動提供了一定的發(fā)展推動作用,人工智能技術(shù)應(yīng)用領(lǐng)域同樣具有市場環(huán)境基礎(chǔ)。
3.2 人工智能技術(shù)對視覺媒體的內(nèi)容生產(chǎn)過程的優(yōu)化作用
在信息分配推薦的過程中,視覺媒體通過人工智能技術(shù)可以構(gòu)建智能分發(fā)和興趣推薦等個性化信息及用戶管理模式,借助人工智能技術(shù)可以更好地連接人、信息與生活,形成一條完整的內(nèi)容信息積累與優(yōu)化分析的鏈路。
3.2.1 助力媒體報道的內(nèi)容生產(chǎn)智能化
根據(jù)每個用戶的喜好做個性化新聞推薦,和用戶進行智能對話。錢江晚報推出“小冰”就旨在實現(xiàn)此功能,其作為人工智能記者入駐“浙江24小時”,可以在稿件中發(fā)布自動評價、引導評論風向。而人民日報社則在2020年推出 AI 編輯部,擁有包括數(shù)據(jù)新聞、直播拆條、同期字幕、視頻去抖、視頻轉(zhuǎn) GIF、視頻壓縮、智能清除、智能橫轉(zhuǎn)豎、智能配音等功能,為編輯記者提供移動化視頻采集、編輯和發(fā)布服務(wù)[3]。
3.2.2 幫助賽事新聞實現(xiàn)多維度的及時報道內(nèi)容支持
以字節(jié)跳動人工智能實驗室研發(fā)的 Deep Understanding of Live Soccer Matches 項目為例,通過目標檢測、軌跡跟蹤、語義分割等計算機視覺技術(shù),實現(xiàn)對足球比賽視頻的深度理解和信息挖掘,實時提供足球賽事精彩時刻畫面、比賽雙方攻守統(tǒng)計、足球運動熱力圖等多種信息,并同步呈現(xiàn)在今日頭條客戶端直播間里的報道專區(qū)[4];以 SSD 目標檢測逐幀輸出球員和足球位置,基于 Deep Sort 的多目標跟蹤,對球員和足球的運動進行建模,使用度量學習對球員外觀和體型進行建模;通過對固定劃窗內(nèi)的片段進行分類,包括在射門、任意球、角球、受傷等各種類型場內(nèi)捕捉精影瞬間,并且在賽后為賽事報道自動寫作機器人提供圖像素材,多維度報道、無縫隙同步賽事精彩畫面,以提升實時觀看體驗。
3.2.3 為網(wǎng)絡(luò)視頻媒體的自制作品提供智能化運營指引
人工智能技術(shù)對內(nèi)容運營的智能化指引是從內(nèi)容源頭的生產(chǎn)階段即開始存在,通過契合用戶偏好,結(jié)合用戶觀看內(nèi)容及停留數(shù)據(jù),在基礎(chǔ)內(nèi)容創(chuàng)作階段即結(jié)合偏好,為提升收視率奠定基礎(chǔ)。以愛奇藝為例,在內(nèi)容生產(chǎn)方面,通過 AI 智能剪輯、高效處理海量視頻數(shù)據(jù),將生產(chǎn)流程智能化,并提供視頻理解和分析能力支持,在后期制作期間幫助完成快速合版,接管過濾廢材、有效索引、標簽推薦等繁雜工作,很大程度上提升了內(nèi)容創(chuàng)作的生產(chǎn)效率,節(jié)省了內(nèi)容制作人力成本。此外,自制劇和綜藝的演員與嘉賓選擇上也可以借助人工智能技術(shù)進行優(yōu)化,保障自制作品演繹者契合受眾偏好,其中愛奇藝基于自主研發(fā)的人臉識別技術(shù),建立了智能明星庫和智能選角系統(tǒng);通過自然語言處理、人工智能匹配,智能選角系統(tǒng)還可以將制片方與海量的藝人數(shù)據(jù)進行高效、精準配對。針對深度開展用戶屬性分析,通過分析平臺用戶自主提交的地域、年齡、所在小區(qū)、職業(yè)類型、興趣愛好等信息,將其融入個性化推薦分析測算,以進一步洞悉用戶需術(shù),融入對于用戶的視頻搜索與評論留言的分析,建立用戶知識圖譜。此外,LBS 地理位置分析需求也正在融入信息推薦體系,根據(jù)用戶所在位置與當?shù)責狳c向其推送信息,建立本地化生活內(nèi)容智能推送機制。
3.2.4 視頻圖像內(nèi)容審核與過濾智能化
對于內(nèi)容 UGC 較多的短視頻平臺,可以通過人工智能技術(shù),更高效、更智能地幫助媒體方與審核團隊工作人員過濾問題圖像及視頻等內(nèi)容。以抖音短視頻平臺為例,為應(yīng)對龐大的短視頻內(nèi)容創(chuàng)作內(nèi)容信息,字節(jié)跳動啟用人工智能輔助審核,包括人臉識別技術(shù)與 Segmentation 技術(shù)及應(yīng)用,理解視頻內(nèi)容并對存在違規(guī)內(nèi)容的視頻進行過濾處理,對濾鏡版權(quán)機型進行識別,形成機器學習模型,并持續(xù)完善,通過人工智能技術(shù)對動作進一步深度理解、對物體進行監(jiān)測跟蹤、對視頻環(huán)境進行識制,并理解創(chuàng)作者的情感和情緒。此外,中央廣播電視總臺建立人工智能編輯部,用知識圖譜的方式對視頻進行審查,采用人工智能初審,準確率達到95%,比人工效率提高80多倍。
3.3 人工智能技術(shù)助力內(nèi)容分發(fā)、內(nèi)容信息流
與短視頻廣告推送匹配通過挖掘用戶的真實需求,匹配用戶喜好,提高用戶觀看時長與黏度,讓瀏覽者更便捷地獲得自身想看的內(nèi)容,讓媒體與用戶的關(guān)系更緊密,增加用戶訪問興趣和停留時間。但是,該模式會讓瀏覽者在一定時間內(nèi)出現(xiàn)過度沉浸的情況,短時間內(nèi)契合用戶興趣度,但是長期內(nèi)容同質(zhì)化推送,依然會讓瀏覽者出現(xiàn)視覺疲勞感,尤其是傾向于接收以新知識、新鮮事為代表的用戶群體,不利于滿足用戶信息需求以及用戶成長需求。
在應(yīng)用人工智能技術(shù)的過程中,面對不同效用目的有不同的操作模式,以實現(xiàn)用戶發(fā)展計劃:其一,面向新用戶,視覺媒體平臺可以使用“冷啟動”的方式,將媒體平臺上既有的熱度高的內(nèi)容推薦給新用戶,基于新用戶的收藏或者喜愛操作,記錄用戶的喜好傾向,建立用戶興趣標簽庫,嘗試推送用戶喜歡的視頻內(nèi)容,隨著推送內(nèi)容的變化,堅持持續(xù)記錄用戶興趣度,不斷完善用戶畫像的構(gòu)建;其二,面向老用戶,需要在長期更新、分析用戶喜好層面,綜合多類型內(nèi)容推薦。比如,愛奇藝通過知識圖譜與深度學習等 AI 技術(shù),優(yōu)化用戶視頻推薦模型,研發(fā)出“私人影院”“短視頻聯(lián)播”等實用性功能,根據(jù)用戶以往觀影數(shù)據(jù),推薦用戶沒看過的影視作品或者潛在要觀看的作品,以此提高了15%的觀看率。與此同時,在營銷方面,愛奇藝通過 AI 技術(shù)(包括優(yōu)化用戶視頻推薦模型等)、用戶特征識別等技術(shù),幫助廣告主創(chuàng)造出既符合用戶體驗,又可以打動消費者共鳴的營銷體驗。
3.4 視覺媒體團隊加入智能化角色
以虛擬主播為例,2019年6月20日,人民日報社推出虛擬播報員“果果”—通過采集真人主播的聲音和圖像,并通過 AI 技術(shù)合成制作出的虛擬主播。僅需輸入文字版新聞,就可以自動生成多種語種語音和配套表情,合成新聞播報視頻,使新聞播報準時且準確,并可以給觀眾提供一種奇特的交互體驗。隨后,澎湃還推出了播報早晚新聞的虛擬主播,這對媒體業(yè)內(nèi)人力資源緊張的現(xiàn)狀給予了一定的人力解放與減負,并且具有內(nèi)容生產(chǎn)過程中賽事直播報道智能化的價值,同樣可以提高編輯效率。
4 人工智能技術(shù)助力新媒體形態(tài)發(fā)展,豐富視覺媒體類型
在媒體融合轉(zhuǎn)型、跨形態(tài)跨平臺端發(fā)展的過程中,人工智能技術(shù)對媒體業(yè)態(tài)的應(yīng)用領(lǐng)域也正在起著改變媒體形態(tài)的作用,進而促進了視覺媒體矩陣擴大,包括數(shù)據(jù)新聞形態(tài)、機器人新聞端等。
4.1 多樣化視覺媒體形態(tài)正在發(fā)展
全國性報社旗下的媒體視覺化發(fā)展加速,人民日報、新華社都推進 VR、短視頻等新形態(tài)的媒體逐漸加入其融媒體體系。此外,機器人媒體在游戲行業(yè)、家庭生活領(lǐng)域應(yīng)用增多,而在未來的新聞行業(yè)或許會出現(xiàn)可視化新聞自動成像的機器人,只須錄入文字和圖片資料,機器人便可自動調(diào)取以往類似新聞接報情況,并基于以往新聞內(nèi)容積累深度學習,播報最新新聞并調(diào)用實際情況和過往相關(guān)新聞進行綜合呈現(xiàn)。
4.2 突破數(shù)據(jù)新聞發(fā)展瓶頸
隨著我國傳媒業(yè)多網(wǎng)融合、多端務(wù)平臺的發(fā)展,數(shù)據(jù)新聞也正式成為在此模式下開始遍地開花嘗試的新產(chǎn)物。但是,在發(fā)展數(shù)據(jù)新聞的過程中存在諸多問題,如數(shù)據(jù)量不足、數(shù)據(jù)新聞深度不足等,數(shù)據(jù)之間的深層次關(guān)系無法通過人工來進行快速分析與呈現(xiàn)。與此同時,數(shù)新聞可視化程度也需要提升。目前,數(shù)據(jù)新聞仍舊處于“只是表面上的數(shù)據(jù)呈現(xiàn)而已”的狀態(tài),尚未找到與讀者快速產(chǎn)生共鳴的多樣化數(shù)據(jù)模式,交互性低和講述模式有限也不利于公眾理解與自發(fā)傳播。而人工智能技術(shù)的加入,將在一定程度幫助數(shù)據(jù)新聞產(chǎn)品解決以上問題,如開放不同選題、不同地域以及不同風格的數(shù)據(jù)新聞產(chǎn)品面向不同類型的讀者,對讀者群體進行有效劃分;彌補數(shù)據(jù)新聞人才不足,幫助內(nèi)容制作者快速挖掘與發(fā)現(xiàn)數(shù)據(jù)之間和數(shù)據(jù)背后的新聞價值;拓寬選題范圍,從僅限于經(jīng)濟、民生,到增加關(guān)注社會特殊群體、特殊話題,讓數(shù)據(jù)新聞并不是為了可視化而可視化,強化數(shù)據(jù)新聞的功能性和實用性。
5 結(jié)束語
人工智能技術(shù)正在被廣泛應(yīng)用于媒體融合轉(zhuǎn)型發(fā)展之中,以視覺媒體為代表,在人工智能技術(shù)的助力下,將形成更大的影響力,建成國內(nèi)特有的視覺媒體傳播環(huán)境,為國內(nèi)視覺媒體及視覺文化產(chǎn)業(yè)的發(fā)展奠定了良好的前瞻基礎(chǔ)。
參考文獻:
[1]郭慶光.傳播學教程[ M].北京:中國人民大學出版社,2011.
[2] Double_V_.閑談5個改變未來的人工智能技術(shù)( CV 方向)[ EB/OL ].https:∥ blog.csdn.net/qq _25737169/article/ details/80099628.
[3]郝冠南,劉星宏.技術(shù)創(chuàng)新驅(qū)動高質(zhì)量內(nèi)容生產(chǎn)—人民日報 AI 編輯部3.0助力兩會報道[J].中國傳媒科技,2022(5):7?9.
[4]新智元.馬維英:AI Lab 是公司最能冒險的部門,五大 AI戰(zhàn)略資源是鑰匙[ EB/OL].https:∥baijiahao.baidu.com/s? id=1617562492369953557&wfr=spider&for=pc.
作者簡介:
趙淼(1986—),碩士,研究方向:新聞傳播。