薛佳
關(guān)鍵詞 人工智能 視頻制作 制作周期 畫質(zhì)修復(fù)
1概述
人工智能(Artificial Intelligence)技術(shù)也被稱作為AI 技術(shù)。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新技術(shù)。
人工智能領(lǐng)域包括機(jī)器人、語言識(shí)別、圖像識(shí)別、自然語言處理和專家系統(tǒng)等。從誕生以來,人工智能理論和技術(shù)變得越來越成熟,其應(yīng)用的行業(yè)也變得越來越廣。由此可見,未來的人工智能領(lǐng)域的科技產(chǎn)品將會(huì)是人類智慧的“容器”。人工智能將會(huì)對(duì)人的意識(shí)、思維等相關(guān)信息進(jìn)行模擬。人工智能本質(zhì)上不是人的智能,但它可以像人一樣思考,甚至能夠超過人類的智商。
在信息技術(shù)飛速發(fā)展的背景之下,人工智能技術(shù)逐步融入人們的日常生產(chǎn)和生活中,同時(shí)也發(fā)揮出了越來越重要的作用。盡管現(xiàn)階段人工智能屬于“用人工智能”的范疇,離不開人類主體自行運(yùn)行。然而,借助人工智能能夠有效減輕人們的工作強(qiáng)度和工作壓力,也有效提升了相關(guān)工作人員的工作效率?;诖耍疚慕榻B了人工智能技術(shù)在視頻生產(chǎn)制作中的應(yīng)用情況,希望能夠有效地促進(jìn)其發(fā)展與優(yōu)化。圖1 為傳統(tǒng)的視頻生命周期圖。
生命周期包括自動(dòng)采集、生產(chǎn)制作、播出分發(fā)和用戶體驗(yàn)四大環(huán)節(jié)。隨著科技的進(jìn)一步發(fā)展,視頻行業(yè)發(fā)生了巨大的變化。在視頻采集階段,傳統(tǒng)工作方式采用是專業(yè)的攝像機(jī)、錄像機(jī)進(jìn)行視頻采集,在新媒體時(shí)代下,每個(gè)人都是自媒體生產(chǎn)者,其利用手機(jī)拍攝自己喜歡的素材。在視頻的生產(chǎn)和制作階段,傳統(tǒng)視頻制作形式是采用專業(yè)級(jí)別的非線性編輯軟件制作視頻,而目前各大手機(jī)品牌都為其產(chǎn)品配備了濾鏡、美顏、專場、特效等制作功能,使得視頻制作工作者能夠在云端進(jìn)行視頻制作。同時(shí),在視頻的播出分發(fā)階段,傳統(tǒng)工作形式是微信直播、有線電視網(wǎng)絡(luò)直播,而現(xiàn)在用戶可以通過互聯(lián)網(wǎng)直接觀看直播或者點(diǎn)播視頻,這有效地提升用戶的體驗(yàn)感[1] 。由此可見,在整個(gè)視頻的制作過程中參與者發(fā)生了巨大的變化。因此,視頻領(lǐng)域的相關(guān)應(yīng)用變得越來越多。
2人工智能技術(shù)在視頻制作中的應(yīng)用
2.1美顏濾鏡類
所有的視頻和照片作品都在畫質(zhì)方面有著一定的要求。在傳統(tǒng)視頻剪輯中,人們采用PS 等工具制作影像作品,而隨著人工智能技術(shù)的快速發(fā)展,如今絕大多數(shù)的非專業(yè)人士也可以借助人工智能技術(shù)制作出質(zhì)量較高的影像作品,其中最受廣大用戶喜愛的是美顏濾鏡類的人工智能應(yīng)用,包括瘦臉、磨皮、美白、祛斑等諸多功能。除此之外,濾鏡也是圖像修復(fù)中的常用功能。濾鏡最初是指安裝在攝像鏡頭前過濾自然光線的附加鏡頭,其目的是實(shí)現(xiàn)風(fēng)格化的調(diào)色效果。各大軟件的濾鏡功能則是通過濾鏡算法實(shí)現(xiàn)場景模擬,進(jìn)而獲得類似的效果。隨著人工智能技術(shù)的發(fā)展,各種深度學(xué)習(xí)的風(fēng)格濾鏡算法和濾鏡種類變得越來越多,因此其應(yīng)用效果在一定程度上也遠(yuǎn)遠(yuǎn)超出了物理濾鏡能夠達(dá)到的水平。
2.2畫質(zhì)修復(fù)類
在實(shí)際操作過程中,畫質(zhì)修復(fù)主要是針對(duì)老舊照片和老舊視頻進(jìn)行修復(fù)和翻新上色。人工修復(fù)需要耗費(fèi)大量的人力、物力和財(cái)力,并且其修復(fù)效果也往往不盡如人意。隨著人工智能技術(shù)進(jìn)一步發(fā)展,其能夠?yàn)楫嬞|(zhì)修復(fù)工作帶來全新的工作模式。例如,在2020 年國慶節(jié)前夕,央視某部門借助人工智能技術(shù)修復(fù)了拍攝于1956 年的黑白電影《上甘嶺》中的合唱曲目《我的祖國》。在實(shí)際操作過程中,傳統(tǒng)修復(fù)手段與人工智能上色技術(shù)進(jìn)行有效結(jié)合,并且采用4K 數(shù)字化的修復(fù)技術(shù)去除了膠片中所殘留的物理損傷。之后,借助人工智能技術(shù)中的上色技術(shù)把黑白影像轉(zhuǎn)變?yōu)椴噬跋瘛?/p>
2.2.1畫質(zhì)修復(fù)
視頻影像資料的修復(fù)主要是補(bǔ)足幀率。由于老舊視頻在拍攝過程中受到相關(guān)條件的影響,因此通常情況下都會(huì)帶有卡頓、閃爍等問題。然而,借助人工智能技術(shù)修復(fù)老舊視頻,能使其畫面變得更加流暢和清晰,其中補(bǔ)足幀率是一個(gè)重要的環(huán)節(jié)。
2.2.2著色
著色是黑白影像資料修復(fù)中的一個(gè)關(guān)鍵環(huán)節(jié),傳統(tǒng)人工上色流程耗費(fèi)了大量的人力、物力和財(cái)力,通過著色能夠針對(duì)黑白影像資料進(jìn)行上色處理。除此之外,我們還可以按照原樣影片的相關(guān)歷史資料對(duì)上色模型進(jìn)行修改,進(jìn)而使得所修復(fù)的影像資料更加符合原片的時(shí)代背景?;谏疃葘W(xué)習(xí)的人工智能注冊(cè)模型能夠?yàn)楹诎讏D像帶來高質(zhì)量的著色效果,并且為相關(guān)視頻賦予全新的生命。
2.2.3提升分辨率
眾所周知,影像資料中的分辨率對(duì)于欣賞起著極其重要的作用。而提升影像資料的分辨率的主要手段是將原有視頻的分辨率提升到“高清”甚至到“4K高清”的水平。目前相關(guān)平臺(tái)的播出要求是必須充分滿足受眾群體的欣賞需求,如將影片《上甘嶺》的片段進(jìn)行還原。將影片修復(fù)到4K 分辨率能夠有效提升畫面清晰度,并且為觀眾留下深刻的印象。
2.3字幕自動(dòng)配音
視頻制作是借助軟件實(shí)現(xiàn)對(duì)相關(guān)信息的自動(dòng)化解鎖與處理的一種技術(shù)。該技術(shù)能夠確保視頻所表達(dá)的內(nèi)涵符合相關(guān)設(shè)計(jì)的制作需求。傳統(tǒng)形式下的視頻設(shè)計(jì)軟件必須以人工為基礎(chǔ),之后進(jìn)行修改。然而,在人工智能技術(shù)的支持下,視頻編輯工作流程得以簡化,有效提升了工作效率[2] 。除此之外,視頻剪輯還能降低門檻,如幫助非專業(yè)的編輯人員快速了解和應(yīng)用該技術(shù),以及讓相關(guān)工作人員具備語言處理能力以及語言識(shí)別能力,確保其在實(shí)際工作中實(shí)現(xiàn)一體化操作和服務(wù)。
制作視頻字幕實(shí)質(zhì)上是針對(duì)視頻所表達(dá)的內(nèi)容通過字幕的形式進(jìn)行排列組合,從而使得編排好的解說文本以畫面的形式進(jìn)行同步錄入,能夠有效保障在播放過程中解說人員不會(huì)產(chǎn)生口型和文字不對(duì)稱的現(xiàn)象。傳統(tǒng)形式下的視頻編輯工作在字幕和配音環(huán)節(jié)耗費(fèi)了大量的時(shí)間和精力,一方面要求配音人員具備極其專業(yè)的職業(yè)技能,另一方面需要后期編輯人員具備超高水平的專業(yè)技術(shù),進(jìn)而使其滿足匹配字幕的需求。隨著人工智能技術(shù)的進(jìn)一步發(fā)展與優(yōu)化,相關(guān)工作人員可以借助語音合成的智能化操作方式根據(jù)字幕實(shí)現(xiàn)同步配音效果。除此之外,在人工智能優(yōu)化算法的基礎(chǔ)之上針對(duì)不同的語種進(jìn)行同步翻譯。例如,相關(guān)工作人員在開展新聞采訪工作中可以同步支持多種語言,在最大程度上提升了視頻編輯的效果和質(zhì)量。
2.4視頻字幕的提取
視頻剪輯中的字幕提取主要是針對(duì)視頻內(nèi)容中的同期聲音配上與之相應(yīng)的字幕。通常情況下,該做法都會(huì)應(yīng)用到會(huì)議和采訪中。例如,工作人員在錄制視頻時(shí)所采用的是遠(yuǎn)景拍攝方法,而由于外部雜音過大,無法把整個(gè)演講內(nèi)容同步錄入視頻介紹中。在這種情況下,我們可以借助視頻字幕進(jìn)行同期聲字幕處理,從而幫助人們更好的理解視頻解說中的內(nèi)容。傳統(tǒng)形式下的視頻編輯工作是借助人們所聽到的文字進(jìn)行翻譯,并且還需要針對(duì)字幕的同步時(shí)間和同步語速、音調(diào)進(jìn)行調(diào)節(jié),此時(shí)翻譯內(nèi)容極易出現(xiàn)一些誤差和錯(cuò)誤[3] 。
隨著人工智能技術(shù)的進(jìn)一步發(fā)展和廣泛應(yīng)用,相關(guān)工作人員可以借助語音識(shí)別技術(shù)將視頻字幕同步翻譯出來,從而把字幕和語音進(jìn)行自動(dòng)匹配。在實(shí)際操作過程中,工作人員只需要針對(duì)文字進(jìn)行二次核驗(yàn),而文字的匹配率超過99%。除此之外,在國際化的視頻會(huì)議中,部分小語種翻譯還可能存在一定的誤差,因此傳統(tǒng)人工編輯模式必須借助語種本身所具備的特征充分結(jié)合不同國家歷史背景和文化進(jìn)行分析與處理,這極大地增加了工作人員的工作量。而借助人工智能技術(shù)進(jìn)行小語種翻譯,相關(guān)工作人員則可以有效地針對(duì)人工審核環(huán)節(jié)進(jìn)行強(qiáng)化處理,之后在不同項(xiàng)目中同步生成多種語言[4] ,如法語、藏語,并且借助自主生成的形式確保成品視頻的音質(zhì)和音量,從而盡可能地減少視頻前期的設(shè)計(jì)工作量。
2.5虛擬主播
在傳統(tǒng)新聞視頻編輯工作中,主播是新聞播報(bào)工作中的一個(gè)重要組成部分。借助人工智能技術(shù)可以自動(dòng)合成虛擬主播,并且根據(jù)不同場景將主播形象切入背景之中。在輸入檢索詞之后,新聞主播可以通過各個(gè)嘴型以及肢體形態(tài)根據(jù)不同場景的實(shí)時(shí)變化而形成獨(dú)特的播放效果。例如,口型語音內(nèi)容等播報(bào)形式也可以借助人工調(diào)節(jié)來約束其形態(tài),從而有效提升主播與環(huán)境之間的契合性,使得整個(gè)播報(bào)過程變得更加流暢、銜接更加自然,進(jìn)而有效規(guī)避視頻剪輯不精準(zhǔn)的問題。
2.6智能編輯與解鎖
通常情況下,絕大多數(shù)的視頻剪輯具有一定的復(fù)雜性,尤其是在針對(duì)專業(yè)性較強(qiáng)的內(nèi)容進(jìn)行編輯時(shí),必須要求編輯內(nèi)容符合播報(bào)的實(shí)際情況。除此之外,還需要針對(duì)不同用戶的訴求形成正確導(dǎo)向,這促使視頻制作中的歷史文獻(xiàn)和相關(guān)素材之間的片段存在一定的斷續(xù)性。一旦此類空白區(qū)域和用戶的訴求發(fā)生重合就會(huì)產(chǎn)生視頻的同質(zhì)化問題,從而降低視頻內(nèi)容的播放量,影響視頻的播放效果。鑒于此,借助人工智能技術(shù)能夠?qū)崿F(xiàn)智能視頻的編目和解鎖,從而使其根據(jù)視頻內(nèi)容的具體需求自主識(shí)別,并且把主體要素和視頻內(nèi)容進(jìn)行有效關(guān)聯(lián)[5] 。例如,可以借助人臉識(shí)別、文字識(shí)別、語音識(shí)別和場景識(shí)別等功能,在文獻(xiàn)中查證不同的文字內(nèi)容和信息內(nèi)容,使其能夠快速定位到相應(yīng)的片段中,實(shí)現(xiàn)相關(guān)信息的有效鏈接。這可以把各個(gè)視頻進(jìn)行關(guān)聯(lián)和調(diào)度,能夠縮減人工查詢時(shí)間,達(dá)到提升視頻質(zhì)量的目的。
3結(jié)束語
在視頻制作中應(yīng)用人工智能技術(shù)能夠?qū)σ曨l產(chǎn)業(yè)變革提供幫助,從而有效降低從業(yè)門檻并且提升工作效率,使得視頻更具創(chuàng)意,也能夠吸引更多的人才加入視頻制作行業(yè),進(jìn)而創(chuàng)作出更多的優(yōu)秀作品。