非線性編輯系統(tǒng)中的數(shù)字視頻壓縮技術(shù)探討

2023-01-17 14:34鄒莉莉

電視技術(shù) 2022年4期

鄒莉莉

（安徽省合肥市肥東縣融媒體中心，安徽合肥 231600）

0 引言

高質(zhì)量的非壓縮視頻數(shù)據(jù)量極為龐大。以8K超高清視頻為例，即便是每秒24幀畫面，一秒鐘的數(shù)據(jù)量大小就達(dá)到57 Gb，其存儲、處理及傳輸對機(jī)器設(shè)備的硬件、帶寬、網(wǎng)絡(luò)等要求極為苛刻。如此龐大的數(shù)據(jù)量如果不經(jīng)過壓縮，很難通過網(wǎng)絡(luò)進(jìn)行傳輸，并將帶來極高的成本。同時(shí)，傳統(tǒng)線性編輯系統(tǒng)以磁帶來存儲視頻數(shù)據(jù)，需要通過重放磁帶中的視頻數(shù)據(jù)按信息記錄順序編輯，工作流程非常復(fù)雜，設(shè)備要求較多。為了給廣大受眾帶來更好的視聽效果，電視節(jié)目的錄制、編輯、特效制作通常會運(yùn)用數(shù)字視頻壓縮技術(shù)，在保證視頻圖像質(zhì)量的前提下減少視頻數(shù)據(jù)量，從而降低對網(wǎng)絡(luò)帶寬、存儲設(shè)備等的要求，以降低存儲和傳輸成本。采用合適的數(shù)字視頻壓縮技術(shù)，是視頻存儲、編輯及傳輸?shù)裙ぷ鞯闹攸c(diǎn)。

1 非線性編輯系統(tǒng)概述

1.1 非線性編輯

非線性編輯（Non Linear Editing，NLE）系統(tǒng)與線性編輯系統(tǒng)相對應(yīng)。與線性編輯系統(tǒng)需要反復(fù)在磁帶上尋找、按時(shí)間順序進(jìn)行編輯處理不同，非線性編輯系統(tǒng)用電腦、高速硬盤、專用錄像卡等設(shè)備來制作和加工節(jié)目，可以突破時(shí)間順序進(jìn)行編輯，可按各種順序進(jìn)行排列和素材調(diào)用，對任意畫面進(jìn)行隨機(jī)讀取、編輯及存儲，且可多次編輯而不會影響視頻信號質(zhì)量。相關(guān)工作人員稱之為“非線性編輯”（簡稱非編）。

1.2 非線性編輯系統(tǒng)的組成

本文所介紹的非線性編輯系統(tǒng)由硬件和軟件兩部分組成，是一種基于非線性編輯技術(shù)的視頻編輯系統(tǒng)。系統(tǒng)硬件部分的功能主要包括壓縮/解壓縮、存儲及輸入/輸出。此過程需要使用專用的音頻處理芯片、DSP數(shù)字處理相關(guān)的芯片，從而增強(qiáng)數(shù)據(jù)處理的整體性能。軟件基于硬件收集的數(shù)據(jù)，編輯和制造數(shù)碼信號，儲存在電腦系統(tǒng)[1]。在一個(gè)完整的非線性編輯系統(tǒng)中，非編應(yīng)用軟件已經(jīng)成為不可缺少的組成部分。采用非線性編輯系統(tǒng)，可以最大程度地發(fā)揮錄像設(shè)備、數(shù)字特技設(shè)備、音頻編輯設(shè)備以及調(diào)音設(shè)備等的功能。

2 非線性編輯系統(tǒng)的工作原理

2.1 視頻素材的采集

非線性編輯系統(tǒng)可以利用數(shù)據(jù)采集卡、視頻采集卡，直接從攝像機(jī)、錄像機(jī)等信號源獲取數(shù)據(jù)，并直接進(jìn)行精確的視頻數(shù)據(jù)轉(zhuǎn)換，同時(shí)將數(shù)據(jù)進(jìn)行實(shí)時(shí)壓縮，并將其存入電腦硬盤。

2.2 視頻素材的編輯

視頻素材的編輯是非線性編輯系統(tǒng)需要完成的核心工作。與線性編輯系統(tǒng)不同，非線性編輯系統(tǒng)對視頻素材的加工可以借助電腦直接在硬盤中進(jìn)行，并直接對音頻的波形文件進(jìn)行采樣編輯和錄音制作。為了獲得更高品質(zhì)的聲音，必須提高取樣頻率，增大取樣深度，但取樣深度和取樣頻率的增加將會使得音頻資料的尺寸呈幾何倍數(shù)增加，而當(dāng)前電視音響品質(zhì)的不斷提升，進(jìn)一步催生了用戶對音頻品質(zhì)的高要求，選用高品質(zhì)的音頻處理方法是必然選擇，如將采樣頻率為44.1 kHz的音頻信號，錄制成16位的立體聲音頻信號[4]。

2.3 工程項(xiàng)目的輸出

對音頻和視頻素材進(jìn)行處理后，系統(tǒng)將制作好的視頻文件輸出到對應(yīng)的文檔中，再進(jìn)行數(shù)字信號的壓縮，將其轉(zhuǎn)換為數(shù)字視頻、音頻文件。傳統(tǒng)的線性編輯系統(tǒng)在處理音頻素材時(shí)，多音頻需要占據(jù)多個(gè)音軌，因此會受到音軌數(shù)量的限制。而非線性編輯系統(tǒng)可以通過對多軌音頻進(jìn)行合成，從而擺脫音軌數(shù)量的限制，以實(shí)現(xiàn)更豐富的音頻音效。

3 數(shù)字視頻壓縮技術(shù)類型

目前，應(yīng)用最廣泛的數(shù)字視頻壓縮技術(shù)主要有Motion JPEG，MPEG-2P@ML及DV三種。DV壓縮技術(shù)主要為家用錄像機(jī)所使用，適用于標(biāo)準(zhǔn)清晰度電視和高清晰度電視，在廣播電視領(lǐng)域已經(jīng)逐漸淘汰。因此本文僅對Motion JPEG和MPEG-2P@ML兩種數(shù)字視頻壓縮技術(shù)進(jìn)行探討。

3.1 Motion JPEG

Motion JPEG是一種采用JPEG編碼的視頻壓縮技術(shù)。這種壓縮技術(shù)采用幀內(nèi)壓縮方式對每一幀圖像進(jìn)行壓縮，最終形成一系列由JPEG獨(dú)立幀組成的信號流。這種壓縮算法不同于幀間壓縮方式，而是基于人們視覺器官的視覺特性，即：人眼觀察到的畫面，相對于顏色的改變而言，對光線變化會更為敏感?；谘劬Φ倪@種視覺特性，只需要保持畫面的亮度而不需要完全保持畫面中的顏色，即可保障人眼所獲得的視覺效果不發(fā)生改變，從而對視頻進(jìn)行數(shù)字壓縮[5]。

3.2 MPEG-2P@ML

MPEG-2P@ML是一種MPEG-2視頻壓縮技術(shù)。由于視頻影像每一幀圖像都由若干像素點(diǎn)組成，同一幀圖像內(nèi)一個(gè)像素通常與周圍其他像素存在空間相關(guān)性。而若干幀連續(xù)圖像構(gòu)成一個(gè)動態(tài)畫面，前后幀圖像的像素通常又存在時(shí)間相關(guān)性。這種相關(guān)性表現(xiàn)為亮度、色度、位置等相關(guān)甚至完全相同，因此在空間和時(shí)間上存在大量的冗余信息現(xiàn)象。技術(shù)將冗余成分去除，只保留非相關(guān)像素信息，從而只傳輸非相關(guān)像素信息以減少傳輸容量，節(jié)省傳輸頻帶。這種算法最初設(shè)計(jì)的目的是以較少的傳輸頻帶實(shí)現(xiàn)視頻數(shù)據(jù)的傳輸，通過參考幀來解析當(dāng)前幀圖像，但實(shí)際上除了視頻第一幀外，后續(xù)每一幀都需要以參考幀作為參考來進(jìn)行解析。

4 壓縮算法性能分析

4.1 Motion JPEG的性能特點(diǎn)

Motion JPEG壓縮標(biāo)準(zhǔn)是當(dāng)前電視節(jié)目制作應(yīng)用最多的一種。由于這一技術(shù)采用幀內(nèi)壓縮的方式，主要基于同一幀像素的空間相關(guān)性進(jìn)行冗余信息處理，連續(xù)圖像前后幀像素的時(shí)間相關(guān)性上的冗余信息則不作處理。視頻每一幀是以JPEG格式的靜態(tài)影像進(jìn)行存儲和播放，壓縮位元率相對較低，能更好提高視頻幀率，在編碼和解碼上對設(shè)備運(yùn)算能力的需求相對較低。但由于采用幀內(nèi)壓縮技術(shù)，幀間冗余信息依然較多，在低壓縮位元率下視頻數(shù)據(jù)量依然很大，要降低視頻數(shù)據(jù)量則需要提高壓縮位元率，而提高壓縮位元率則意味著只能從幀內(nèi)冗余信息入手，過高的壓縮率將嚴(yán)重影響視頻質(zhì)量，造成視頻畸變現(xiàn)象，產(chǎn)生方塊效應(yīng)[6]。因此，為了保證畫面的質(zhì)量，壓縮率需要控制在10∶1以內(nèi)。在這樣的壓縮率下，每一秒視頻的數(shù)據(jù)量依然極高，既便是320×240、20 f·s-1的視頻每秒數(shù)據(jù)量都高達(dá)2.4 MB,難以滿足4K、8K超高清數(shù)字視頻的存儲、傳輸需要，通常僅用數(shù)碼相機(jī)等來進(jìn)行短片的編碼壓縮。

4.2 MPEG-2P@ML的特征

MPEG-2P@ML能同時(shí)對視頻、音頻進(jìn)行壓縮。在視頻壓縮上采用了低采樣頻率，在音頻壓縮上進(jìn)行多聲道擴(kuò)展，能提供廣播級的視像和CD級音質(zhì)，同時(shí)提供了更大范圍且可根據(jù)需求改變調(diào)整的壓縮率。該壓縮技術(shù)下，每一個(gè)圖像群組由I幀、P幀、B幀三類構(gòu)成。I類幀為參考圖像，僅采用幀內(nèi)壓縮技術(shù)，作為后續(xù)圖像的參考幀；P類幀參照前面的圖像，僅保留非冗余信息；B類幀根據(jù)前后及本幀圖像作為參考，去除本幀與前后幀間的冗余信息。這一壓縮技術(shù)不僅能對幀內(nèi)的冗余像素信息進(jìn)行處理，還能對前后幀的冗余像素信息進(jìn)行處理，壓縮率最高可達(dá)到180∶1。對于最終用戶來說，廣播發(fā)送方可根據(jù)最終用戶的設(shè)備發(fā)送較高壓縮率的MPEG-2P@ML視頻，經(jīng)壓縮后的視頻數(shù)據(jù)量甚至僅有原始數(shù)字信號的1%不到，極大地降低了視頻信息傳輸對帶寬的要求。而對于視頻編輯、存儲處理需求，則根據(jù)需要采用較低的壓縮率，極為靈活。在視頻壓縮質(zhì)量損耗方面，MPEG-2P@ML壓縮標(biāo)準(zhǔn)可以輕松地通過預(yù)測幀結(jié)構(gòu)的調(diào)整，來減少視頻在傳送和頻繁壓縮/解壓縮期間造成的視頻質(zhì)量損耗問題，保證較高的視頻質(zhì)量。

4.3 非線性編輯系統(tǒng)的設(shè)計(jì)

盡管當(dāng)前Motion JPEG標(biāo)準(zhǔn)在電視節(jié)目的編輯處理中已經(jīng)得到廣泛應(yīng)用，但由于這一標(biāo)準(zhǔn)的視頻格式需要視頻卡的支持，導(dǎo)致各系統(tǒng)所處理的視頻數(shù)據(jù)共享十分煩瑣，給節(jié)目組帶來了很大的負(fù)擔(dān)。而利用MPEG-2P@ML標(biāo)準(zhǔn)改進(jìn)非線性編輯系統(tǒng)，則可以很好地解決上述問題。傳統(tǒng)的非線性編輯系統(tǒng)采用應(yīng)用層的命令來控制硬件，而在硬件層面通過預(yù)先編程的方式來確定控制命令和處理方式，不同的視頻意味著要替換相應(yīng)的視頻卡，不同的視頻卡又需要相適應(yīng)的非線性編輯系統(tǒng)。在視頻數(shù)據(jù)編輯處理中，當(dāng)面臨多種格式的數(shù)字視頻時(shí)，頻繁更換視頻卡和視頻編輯系統(tǒng)不僅耗時(shí)耗力，而且會降低工作效率，增加節(jié)目制作費(fèi)用。

針對以上問題，本文提出一種新的硬件抽象化方法。硬件抽象層把視頻卡的全部功能都封裝起來，外部只是作為控制界面。應(yīng)用層收到操作指令后，不再向硬件層傳輸指令，而是傳輸?shù)匠橄蟮挠布?，按照不同的格式，調(diào)用不同的視頻卡功能，向硬件層發(fā)布命令，從而實(shí)現(xiàn)對不同格式的視頻文件的處理和利用，而不需要修改平臺層和預(yù)先安裝的代碼。

硬件抽象層由接口部分、播放部分、壓縮/解壓縮部分以及數(shù)據(jù)采集部分組成。該界面直接面向應(yīng)用程序，通過該界面采集應(yīng)用程序的指令。播放器的主要作用就是播放視頻和聲音，還可以在節(jié)目中加入一些特殊的特效，讓節(jié)目更受歡迎。

5 結(jié) 語

數(shù)字視頻的特點(diǎn)決定了視頻壓縮是整個(gè)視頻處理過程中最重要的部分，也是視頻存儲和傳輸?shù)幕A(chǔ)。更高的壓縮率能降低視頻存儲、傳輸成本，但容易降低視頻質(zhì)量，尤其不利于數(shù)字視頻的編輯處理。在電視節(jié)目制作中，MPEG-2P@ML壓縮技術(shù)具有靈活的比特率和GOP結(jié)構(gòu)，可根據(jù)具體需要進(jìn)行選擇，在面向用戶進(jìn)行視頻信號傳輸時(shí)可采用較高的壓縮率，在存儲和編輯需求時(shí)則可以采用較低的壓縮率，既能滿足專業(yè)視頻數(shù)字化處理的需要，又能解決廣播電視系統(tǒng)多制式并存的問題，滿足不同用戶、不同使用環(huán)境對視頻信息質(zhì)量、數(shù)據(jù)量的要求，降低存儲、傳輸成本，降低制式轉(zhuǎn)換成本。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡