鄒莉莉
(安徽省合肥市肥東縣融媒體中心,安徽 合肥 231600)
高質(zhì)量的非壓縮視頻數(shù)據(jù)量極為龐大。以8K超高清視頻為例,即便是每秒24幀畫面,一秒鐘的數(shù)據(jù)量大小就達(dá)到57 Gb,其存儲、處理及傳輸對機(jī)器設(shè)備的硬件、帶寬、網(wǎng)絡(luò)等要求極為苛刻。如此龐大的數(shù)據(jù)量如果不經(jīng)過壓縮,很難通過網(wǎng)絡(luò)進(jìn)行傳輸,并將帶來極高的成本。同時(shí),傳統(tǒng)線性編輯系統(tǒng)以磁帶來存儲視頻數(shù)據(jù),需要通過重放磁帶中的視頻數(shù)據(jù)按信息記錄順序編輯,工作流程非常復(fù)雜,設(shè)備要求較多。為了給廣大受眾帶來更好的視聽效果,電視節(jié)目的錄制、編輯、特效制作通常會運(yùn)用數(shù)字視頻壓縮技術(shù),在保證視頻圖像質(zhì)量的前提下減少視頻數(shù)據(jù)量,從而降低對網(wǎng)絡(luò)帶寬、存儲設(shè)備等的要求,以降低存儲和傳輸成本。采用合適的數(shù)字視頻壓縮技術(shù),是視頻存儲、編輯及傳輸?shù)裙ぷ鞯闹攸c(diǎn)。
非線性編輯(Non Linear Editing,NLE)系統(tǒng)與線性編輯系統(tǒng)相對應(yīng)。與線性編輯系統(tǒng)需要反復(fù)在磁帶上尋找、按時(shí)間順序進(jìn)行編輯處理不同,非線性編輯系統(tǒng)用電腦、高速硬盤、專用錄像卡等設(shè)備來制作和加工節(jié)目,可以突破時(shí)間順序進(jìn)行編輯,可按各種順序進(jìn)行排列和素材調(diào)用,對任意畫面進(jìn)行隨機(jī)讀取、編輯及存儲,且可多次編輯而不會影響視頻信號質(zhì)量。相關(guān)工作人員稱之為“非線性編輯”(簡稱非編)。
本文所介紹的非線性編輯系統(tǒng)由硬件和軟件兩部分組成,是一種基于非線性編輯技術(shù)的視頻編輯系統(tǒng)。系統(tǒng)硬件部分的功能主要包括壓縮/解壓縮、存儲及輸入/輸出。此過程需要使用專用的音頻處理芯片、DSP數(shù)字處理相關(guān)的芯片,從而增強(qiáng)數(shù)據(jù)處理的整體性能。軟件基于硬件收集的數(shù)據(jù),編輯和制造數(shù)碼信號,儲存在電腦系統(tǒng)[1]。在一個(gè)完整的非線性編輯系統(tǒng)中,非編應(yīng)用軟件已經(jīng)成為不可缺少的組成部分。采用非線性編輯系統(tǒng),可以最大程度地發(fā)揮錄像設(shè)備、數(shù)字特技設(shè)備、音頻編輯設(shè)備以及調(diào)音設(shè)備等的功能。
非線性編輯系統(tǒng)可以利用數(shù)據(jù)采集卡、視頻采集卡,直接從攝像機(jī)、錄像機(jī)等信號源獲取數(shù)據(jù),并直接進(jìn)行精確的視頻數(shù)據(jù)轉(zhuǎn)換,同時(shí)將數(shù)據(jù)進(jìn)行實(shí)時(shí)壓縮,并將其存入電腦硬盤。
視頻素材的編輯是非線性編輯系統(tǒng)需要完成的核心工作。與線性編輯系統(tǒng)不同,非線性編輯系統(tǒng)對視頻素材的加工可以借助電腦直接在硬盤中進(jìn)行,并直接對音頻的波形文件進(jìn)行采樣編輯和錄音制作。為了獲得更高品質(zhì)的聲音,必須提高取樣頻率,增大取樣深度,但取樣深度和取樣頻率的增加將會使得音頻資料的尺寸呈幾何倍數(shù)增加,而當(dāng)前電視音響品質(zhì)的不斷提升,進(jìn)一步催生了用戶對音頻品質(zhì)的高要求,選用高品質(zhì)的音頻處理方法是必然選擇,如將采樣頻率為44.1 kHz的音頻信號,錄制成16位的立體聲音頻信號[4]。
對音頻和視頻素材進(jìn)行處理后,系統(tǒng)將制作好的視頻文件輸出到對應(yīng)的文檔中,再進(jìn)行數(shù)字信號的壓縮,將其轉(zhuǎn)換為數(shù)字視頻、音頻文件。傳統(tǒng)的線性編輯系統(tǒng)在處理音頻素材時(shí),多音頻需要占據(jù)多個(gè)音軌,因此會受到音軌數(shù)量的限制。而非線性編輯系統(tǒng)可以通過對多軌音頻進(jìn)行合成,從而擺脫音軌數(shù)量的限制,以實(shí)現(xiàn)更豐富的音頻音效。
目前,應(yīng)用最廣泛的數(shù)字視頻壓縮技術(shù)主要有Motion JPEG,MPEG-2P@ML及DV三 種。DV壓縮技術(shù)主要為家用錄像機(jī)所使用,適用于標(biāo)準(zhǔn)清晰度電視和高清晰度電視,在廣播電視領(lǐng)域已經(jīng)逐漸淘汰。因此本文僅對Motion JPEG和MPEG-2P@ML兩種數(shù)字視頻壓縮技術(shù)進(jìn)行探討。
Motion JPEG是一種采用JPEG編碼的視頻壓縮技術(shù)。這種壓縮技術(shù)采用幀內(nèi)壓縮方式對每一幀圖像進(jìn)行壓縮,最終形成一系列由JPEG獨(dú)立幀組成的信號流。這種壓縮算法不同于幀間壓縮方式,而是基于人們視覺器官的視覺特性,即:人眼觀察到的畫面,相對于顏色的改變而言,對光線變化會更為敏感?;谘劬Φ倪@種視覺特性,只需要保持畫面的亮度而不需要完全保持畫面中的顏色,即可保障人眼所獲得的視覺效果不發(fā)生改變,從而對視頻進(jìn)行數(shù)字壓縮[5]。
MPEG-2P@ML是一種MPEG-2視頻壓縮技術(shù)。由于視頻影像每一幀圖像都由若干像素點(diǎn)組成,同一幀圖像內(nèi)一個(gè)像素通常與周圍其他像素存在空間相關(guān)性。而若干幀連續(xù)圖像構(gòu)成一個(gè)動態(tài)畫面,前后幀圖像的像素通常又存在時(shí)間相關(guān)性。這種相關(guān)性表現(xiàn)為亮度、色度、位置等相關(guān)甚至完全相同,因此在空間和時(shí)間上存在大量的冗余信息現(xiàn)象。技術(shù)將冗余成分去除,只保留非相關(guān)像素信息,從而只傳輸非相關(guān)像素信息以減少傳輸容量,節(jié)省傳輸頻帶。這種算法最初設(shè)計(jì)的目的是以較少的傳輸頻帶實(shí)現(xiàn)視頻數(shù)據(jù)的傳輸,通過參考幀來解析當(dāng)前幀圖像,但實(shí)際上除了視頻第一幀外,后續(xù)每一幀都需要以參考幀作為參考來進(jìn)行解析。
Motion JPEG壓縮標(biāo)準(zhǔn)是當(dāng)前電視節(jié)目制作應(yīng)用最多的一種。由于這一技術(shù)采用幀內(nèi)壓縮的方式,主要基于同一幀像素的空間相關(guān)性進(jìn)行冗余信息處理,連續(xù)圖像前后幀像素的時(shí)間相關(guān)性上的冗余信息則不作處理。視頻每一幀是以JPEG格式的靜態(tài)影像進(jìn)行存儲和播放,壓縮位元率相對較低,能更好提高視頻幀率,在編碼和解碼上對設(shè)備運(yùn)算能力的需求相對較低。但由于采用幀內(nèi)壓縮技術(shù),幀間冗余信息依然較多,在低壓縮位元率下視頻數(shù)據(jù)量依然很大,要降低視頻數(shù)據(jù)量則需要提高壓縮位元率,而提高壓縮位元率則意味著只能從幀內(nèi)冗余信息入手,過高的壓縮率將嚴(yán)重影響視頻質(zhì)量,造成視頻畸變現(xiàn)象,產(chǎn)生方塊效應(yīng)[6]。因此,為了保證畫面的質(zhì)量,壓縮率需要控制在10∶1以內(nèi)。在這樣的壓縮率下,每一秒視頻的數(shù)據(jù)量依然極高,既便是320×240、20 f·s-1的視頻每秒數(shù)據(jù)量都高達(dá)2.4 MB,難以滿足4K、8K超高清數(shù)字視頻的存儲、傳輸需要,通常僅用數(shù)碼相機(jī)等來進(jìn)行短片的編碼壓縮。
MPEG-2P@ML能同時(shí)對視頻、音頻進(jìn)行壓縮。在視頻壓縮上采用了低采樣頻率,在音頻壓縮上進(jìn)行多聲道擴(kuò)展,能提供廣播級的視像和CD級音質(zhì),同時(shí)提供了更大范圍且可根據(jù)需求改變調(diào)整的壓縮率。該壓縮技術(shù)下,每一個(gè)圖像群組由I幀、P幀、B幀三類構(gòu)成。I類幀為參考圖像,僅采用幀內(nèi)壓縮技術(shù),作為后續(xù)圖像的參考幀;P類幀參照前面的圖像,僅保留非冗余信息;B類幀根據(jù)前后及本幀圖像作為參考,去除本幀與前后幀間的冗余信息。這一壓縮技術(shù)不僅能對幀內(nèi)的冗余像素信息進(jìn)行處理,還能對前后幀的冗余像素信息進(jìn)行處理,壓縮率最高可達(dá)到180∶1。對于最終用戶來說,廣播發(fā)送方可根據(jù)最終用戶的設(shè)備發(fā)送較高壓縮率的MPEG-2P@ML視頻,經(jīng)壓縮后的視頻數(shù)據(jù)量甚至僅有原始數(shù)字信號的1%不到,極大地降低了視頻信息傳輸對帶寬的要求。而對于視頻編輯、存儲處理需求,則根據(jù)需要采用較低的壓縮率,極為靈活。在視頻壓縮質(zhì)量損耗方面,MPEG-2P@ML壓縮標(biāo)準(zhǔn)可以輕松地通過預(yù)測幀結(jié)構(gòu)的調(diào)整,來減少視頻在傳送和頻繁壓縮/解壓縮期間造成的視頻質(zhì)量損耗問題,保證較高的視頻質(zhì)量。
盡管當(dāng)前Motion JPEG標(biāo)準(zhǔn)在電視節(jié)目的編輯處理中已經(jīng)得到廣泛應(yīng)用,但由于這一標(biāo)準(zhǔn)的視頻格式需要視頻卡的支持,導(dǎo)致各系統(tǒng)所處理的視頻數(shù)據(jù)共享十分煩瑣,給節(jié)目組帶來了很大的負(fù)擔(dān)。而利用MPEG-2P@ML標(biāo)準(zhǔn)改進(jìn)非線性編輯系統(tǒng),則可以很好地解決上述問題。傳統(tǒng)的非線性編輯系統(tǒng)采用應(yīng)用層的命令來控制硬件,而在硬件層面通過預(yù)先編程的方式來確定控制命令和處理方式,不同的視頻意味著要替換相應(yīng)的視頻卡,不同的視頻卡又需要相適應(yīng)的非線性編輯系統(tǒng)。在視頻數(shù)據(jù)編輯處理中,當(dāng)面臨多種格式的數(shù)字視頻時(shí),頻繁更換視頻卡和視頻編輯系統(tǒng)不僅耗時(shí)耗力,而且會降低工作效率,增加節(jié)目制作費(fèi)用。
針對以上問題,本文提出一種新的硬件抽象化方法。硬件抽象層把視頻卡的全部功能都封裝起來,外部只是作為控制界面。應(yīng)用層收到操作指令后,不再向硬件層傳輸指令,而是傳輸?shù)匠橄蟮挠布?,按照不同的格式,調(diào)用不同的視頻卡功能,向硬件層發(fā)布命令,從而實(shí)現(xiàn)對不同格式的視頻文件的處理和利用,而不需要修改平臺層和預(yù)先安裝的 代碼。
硬件抽象層由接口部分、播放部分、壓縮/解壓縮部分以及數(shù)據(jù)采集部分組成。該界面直接面向應(yīng)用程序,通過該界面采集應(yīng)用程序的指令。播放器的主要作用就是播放視頻和聲音,還可以在節(jié)目中加入一些特殊的特效,讓節(jié)目更受歡迎。
數(shù)字視頻的特點(diǎn)決定了視頻壓縮是整個(gè)視頻處理過程中最重要的部分,也是視頻存儲和傳輸?shù)幕A(chǔ)。更高的壓縮率能降低視頻存儲、傳輸成本,但容易降低視頻質(zhì)量,尤其不利于數(shù)字視頻的編輯處理。在電視節(jié)目制作中,MPEG-2P@ML壓縮技術(shù)具有靈活的比特率和GOP結(jié)構(gòu),可根據(jù)具體需要進(jìn)行選擇,在面向用戶進(jìn)行視頻信號傳輸時(shí)可采用較高的壓縮率,在存儲和編輯需求時(shí)則可以采用較低的壓縮率,既能滿足專業(yè)視頻數(shù)字化處理的需要,又能解決廣播電視系統(tǒng)多制式并存的問題,滿足不同用戶、不同使用環(huán)境對視頻信息質(zhì)量、數(shù)據(jù)量的要求,降低存儲、傳輸成本,降低制式轉(zhuǎn)換成本。