国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

低復(fù)雜度的快速降尺寸視頻轉(zhuǎn)碼算法

2012-11-06 11:40:14呂卓逸賈克斌蕭允治
通信學(xué)報(bào) 2012年1期
關(guān)鍵詞:宏塊轉(zhuǎn)碼特征向量

呂卓逸,賈克斌,蕭允治

(1. 北京工業(yè)大學(xué) 電子信息與控制工程系,北京 100124;

2. 香港理工大學(xué) 電子資訊與工程系,香港 九龍 999077)

1 引言

H.264是一種面向未來(lái) IP和無(wú)線網(wǎng)絡(luò)傳輸環(huán)境下的視頻壓縮標(biāo)準(zhǔn),在壓縮高效性和傳輸可靠性方面優(yōu)于其他標(biāo)準(zhǔn)[1]。隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,H.264在各個(gè)領(lǐng)域中得到了廣泛應(yīng)用,基于H.264的視頻編碼及轉(zhuǎn)碼技術(shù)成為近年來(lái)國(guó)內(nèi)外研究的熱點(diǎn)。

由于網(wǎng)絡(luò)種類的多樣性(如Internet網(wǎng)、電信網(wǎng)和蜂窩無(wú)線網(wǎng)等),終端設(shè)備性能(如顯示分辨率、處理能力和存儲(chǔ)能力等)的差異,使得提高視頻碼流在不同應(yīng)用環(huán)境之間的兼容性變得十分重要[1]。轉(zhuǎn)換空間分辨率的視頻轉(zhuǎn)碼,為支持各類視頻顯示設(shè)備提供了有效的解決方法,它將原始分辨率的視頻碼流轉(zhuǎn)換為適合接收端顯示的目標(biāo)分辨率碼流。

理想的視頻轉(zhuǎn)碼器應(yīng)具備低運(yùn)算復(fù)雜度,高轉(zhuǎn)碼質(zhì)量等性能。運(yùn)動(dòng)估計(jì)和多尺寸幀間模式預(yù)測(cè)是H.264編碼中非常關(guān)鍵且耗時(shí)的模塊,為視頻轉(zhuǎn)碼帶來(lái)極大的運(yùn)算負(fù)擔(dān),影響到算法的實(shí)時(shí)性[3]。因此,如何有效利用輸入碼流中的編碼信息來(lái)提高轉(zhuǎn)碼速度成為視頻轉(zhuǎn)碼研究中的關(guān)鍵問(wèn)題。對(duì)此,眾多科研人員做了大量工作來(lái)優(yōu)化轉(zhuǎn)碼器。文獻(xiàn)[2]聯(lián)合宏塊的空間和時(shí)間特性,通過(guò)計(jì)算率失真代價(jià)從前一參考幀中選擇最優(yōu)編碼模式。針對(duì)基于像素域的轉(zhuǎn)碼運(yùn)算復(fù)雜度高的問(wèn)題,許多基于壓縮域的轉(zhuǎn)碼框架相繼出現(xiàn)。文獻(xiàn)[3]提出的合并分裂算法,在DCT(discrete cosine transform)域內(nèi)實(shí)現(xiàn)了降尺寸轉(zhuǎn)碼。但是此類方法在重量化過(guò)程中易引入誤差產(chǎn)生漂移(drift),影響轉(zhuǎn)碼圖像質(zhì)量。因此,如何提高轉(zhuǎn)碼效率的同時(shí)保證圖像質(zhì)量仍然是一個(gè)有待探索的課題。

支持向量機(jī)(SVM, support vector machine)是由Vapnik提出的一種學(xué)習(xí)機(jī)制,近幾年來(lái)成為模式識(shí)別與機(jī)器學(xué)習(xí)領(lǐng)域研究的熱點(diǎn)[4]。SVM以統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ),基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,有效地避免了經(jīng)典學(xué)習(xí)方法中過(guò)學(xué)習(xí)、維數(shù)災(zāi)難、局部極小等傳統(tǒng)分類存在的問(wèn)題。在解決小樣本、非線性和高維模式識(shí)別問(wèn)題中表現(xiàn)出明顯優(yōu)勢(shì)[5]?,F(xiàn)已廣泛應(yīng)用于文本識(shí)別、人臉識(shí)別、三維圖像識(shí)別和生物信息學(xué)等方面。本文首次將SVM理論應(yīng)用于基于H.264的降尺寸視頻轉(zhuǎn)碼中,針對(duì)特征向量及核函數(shù)的選取,分類器決策樹(shù)結(jié)構(gòu)的設(shè)計(jì)展開(kāi)研究。

本文提出一種將SVM的理論應(yīng)用于快速降尺寸視頻轉(zhuǎn)碼的方法。首先從輸入的高分辨率視頻碼流中提取模式特征組成多維特征向量訓(xùn)練SVM分類器模型,建立高分辨率視頻編碼信息與降尺寸視頻宏塊編碼模式之間的相關(guān)性。然后設(shè)計(jì)構(gòu)建出分層式SVM分類器,對(duì)降尺寸視頻中宏塊的預(yù)測(cè)模式進(jìn)行分類,以此縮減預(yù)測(cè)模式數(shù)量,實(shí)現(xiàn)轉(zhuǎn)碼的再編碼過(guò)程中率失真優(yōu)化算法的提前終止,達(dá)到降低轉(zhuǎn)碼運(yùn)算復(fù)雜度的目的。

本文在第 2節(jié)中介紹 H.264幀間模式選擇算法,第3節(jié)詳細(xì)論述基于SVM的降尺寸轉(zhuǎn)碼快速模式?jīng)Q策算法,第4節(jié)給出實(shí)驗(yàn)結(jié)果及分析,最后是結(jié)束語(yǔ)。

2 H.264幀間模式選擇

H.264編碼標(biāo)準(zhǔn)支持7種不同塊大小的幀間編碼模式。每個(gè)宏塊可按照 16×16,16×8,8×16,P8×8進(jìn)行第1層的大塊模式分割,如果選擇P 8×8模式,還可按照 8×8,8×4,4×8,4×4 進(jìn)行第2 層的小塊模式亞分割[6]。

另外,幀間編碼還采用直接拷貝模式(SKIP),幀內(nèi)預(yù)測(cè)模式I4MB和I16MB。因此,H.264幀間模式選擇算法流程如下。

1) 對(duì)宏塊的大塊模式 16×16,16×8,8×16 進(jìn)行運(yùn)動(dòng)估計(jì),利用式(1)計(jì)算率失真代價(jià)(RDO, rate distortion optimal)。其中D是宏塊的失真,R是需要編碼的信息碼率,λ是用來(lái)調(diào)節(jié)失真與碼率權(quán)重的Lagrange系數(shù)。

2) 對(duì)每個(gè) P8×8塊的小塊模式 8×8,8×4,4×8,4×4進(jìn)行運(yùn)動(dòng)估計(jì),并計(jì)算其RDO,選擇RDO最小的模式作為P8×8塊的最佳模式。

3) 計(jì)算SKIP模式的運(yùn)動(dòng)矢量和RDO值。

4) 計(jì)算幀內(nèi)編碼模式I4MB和I16MB的RDO值。

5) 從 16×16,16×8,8×16,P8×8,SKIP,I4MB和I16MB中選擇RDO值最小的模式作為幀間宏塊編碼模式。

由于需要對(duì)每一種候選模式進(jìn)行運(yùn)動(dòng)估計(jì)和率失真代價(jià)的計(jì)算,使得編碼計(jì)算量急劇增加,編碼速度下降。為此,本文利用基于SVM的快速模式選擇算法實(shí)現(xiàn)了低復(fù)雜度的降尺寸視頻轉(zhuǎn)碼框架。算法的提出以輸入碼流中編碼信息與降尺寸視頻中宏塊編碼模式間有著較強(qiáng)相關(guān)性為依據(jù),將H.264模式選擇問(wèn)題轉(zhuǎn)化為模式分類問(wèn)題,即依據(jù)編碼信息將預(yù)測(cè)模式按其特征劃分為不同的類別,以此減少計(jì)算率失真代價(jià)的模式數(shù)量。

3 基于SVM的轉(zhuǎn)碼模式快速選擇算法

如上所述,H.264編碼器的運(yùn)算復(fù)雜性為引入機(jī)器學(xué)習(xí)方法來(lái)提高視頻轉(zhuǎn)碼速度帶來(lái)了良好契機(jī)。支持向量機(jī)方法是建立在統(tǒng)計(jì)學(xué)習(xí)理論中 VC維(vapnik chervonenkis dimension)[7]理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小原理基礎(chǔ)上的。對(duì)訓(xùn)練樣本集(x1,y1),…,(xl,yl)∈RN×{±1},其中,xl是從輸入的高分辨率視頻碼流中提取的特征向量,yl為低分辨率視頻中相應(yīng)宏塊的編碼模式,N為樣本特征(特征向量)空間的維數(shù)。SVM的目標(biāo)是求解能夠?qū)?類樣本正確分開(kāi),且使得分類間隔最大的最優(yōu)分類線。對(duì)于非線性可分情況,SVM通過(guò)映射 Φ 將非線性問(wèn)題轉(zhuǎn)換為高維特征空間中線性問(wèn)題,利用核函數(shù) K(xi, xj)代替最優(yōu)分類面中的內(nèi)積,求解最優(yōu)分類面的目標(biāo)函數(shù):

鑒于SVM在模式識(shí)別等領(lǐng)域,尤其在解決較復(fù)雜分類問(wèn)題方面表現(xiàn)出來(lái)的優(yōu)越性,本文提出了基于SVM的轉(zhuǎn)碼模式快速選擇算法。

3.1 分層式SVM分類器

一般來(lái)說(shuō),視頻序列中分布均勻的區(qū)域,例如背景區(qū)域,通常采用大塊分割模式(16×16,16×8,8×16),而分布不均勻的區(qū)域和邊緣部分通常采用小塊分割模式(8×8,8×4,4×8,4×4)。同時(shí),視頻序列中相鄰圖像之間普遍存在著時(shí)間相關(guān)性,即相鄰圖像的大部分區(qū)域的變化是比較緩慢的,如背景區(qū)域中SKIP模式占有相當(dāng)大的比重,而處于較長(zhǎng)時(shí)間靜止不動(dòng)或者變化緩慢區(qū)域內(nèi)的宏塊通常采用大塊分割模式。因此,利用從輸入碼流中提取的編碼信息,減少預(yù)測(cè)模式,僅對(duì)少量可能性大的模式計(jì)算率失真代價(jià),將有效降低轉(zhuǎn)碼的運(yùn)算復(fù)雜度。

SVM方法最初用于數(shù)據(jù)二分類問(wèn)題[8],多分類問(wèn)題是被分解為多個(gè)二分類問(wèn)題來(lái)實(shí)現(xiàn)的。目前的多分類算法,例如一對(duì)多(one against all)和一對(duì)一(one against one)等存在的共同問(wèn)題是:多數(shù)量的二分類問(wèn)題需要進(jìn)行大規(guī)模的標(biāo)準(zhǔn)二次型優(yōu)化,造成訓(xùn)練過(guò)程速度慢、算法復(fù)雜難以實(shí)現(xiàn)以及預(yù)測(cè)運(yùn)算量大等問(wèn)題。為了避免多分類器的弊端,本文采用基于二分類的SVM分類器以期獲得更加準(zhǔn)確的預(yù)測(cè)結(jié)果和更優(yōu)的轉(zhuǎn)碼效果。

本文構(gòu)建的分層式 SVM 分類器由以下 3個(gè)SVM二分類器組成,在降尺寸視頻轉(zhuǎn)碼編碼器中對(duì)宏塊進(jìn)行階梯式模式?jīng)Q策。

1) 頂層分類器劃分SKIP模式和non-SKIP模式。如果當(dāng)前宏塊被劃分為 SKIP模式,則僅預(yù)測(cè)幀間16×16模式和SKIP模式。換而言之,此分類器用于劃分出位于紋理分布較均勻或運(yùn)動(dòng)平緩區(qū)域的宏塊。

2) 中間層分類器劃分幀內(nèi)模式和幀間模式。被劃分為幀內(nèi)模式類別的宏塊,表明其具有運(yùn)動(dòng)劇烈或紋理復(fù)雜的特征,采用Intra-refresh模式編碼。

3) 下層分類器對(duì)在頂層和中間層SVM分類器中被劃分為non-SKIP模式和non-intra模式的宏塊進(jìn)行細(xì)分,劃分為大塊分割模式和小塊分割模式。

為了保證轉(zhuǎn)碼后視頻具有較高質(zhì)量,本文對(duì)通過(guò)SVM分類后的編碼模式進(jìn)行小范圍的模式修正,以犧牲少量運(yùn)算量為代價(jià)來(lái)獲得更加準(zhǔn)確的決策模式。模式修正策略的具體思想是:如果當(dāng)前宏塊被劃分為大塊分割模式,則預(yù)測(cè){inter16×16, inter16×8, inter8×8}和SKIP模式;如果當(dāng)前宏塊被劃分為小塊分割模式,則預(yù)測(cè) 7種幀間模式,SKIP模式和幀內(nèi)模式。算法流程如圖1所示。

圖1 算法流程

分層式SVM分類器實(shí)現(xiàn)了模式選擇的階梯式預(yù)判,通過(guò)縮減預(yù)測(cè)模式數(shù)量提前終止率失真優(yōu)化算法,達(dá)到降低算法復(fù)雜度的目的。圖2描述了基于SVM的視頻轉(zhuǎn)碼器實(shí)現(xiàn)框。首先,從高分辨率視頻碼流中提取編碼信息作為特征向量組成 SVM訓(xùn)練樣本集。其次,利用SVM模型建立的分層式分類器得到最終預(yù)測(cè)模式,實(shí)現(xiàn)低復(fù)雜度的H.264視頻轉(zhuǎn)碼。本文采用離線方法進(jìn)行SVM模型的訓(xùn)練及預(yù)測(cè),因此不會(huì)對(duì)轉(zhuǎn)碼器帶來(lái)額外的運(yùn)算負(fù)擔(dān)。

圖2 基于SVM的轉(zhuǎn)碼模式選擇

3.2 特征向量的選取

作為 SVM 理論中的關(guān)鍵技術(shù),特征向量的選取直接影響著 SVM 分類器的準(zhǔn)確度,是構(gòu)建SVM分類器的關(guān)鍵。特征向量的選擇應(yīng)滿足與宏塊編碼模式具有強(qiáng)相關(guān)性的原則,而直接利用輸入的視頻碼流中的編碼信息作為特征向量組成樣本集得到的分類準(zhǔn)確度較低,因此需要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理。針對(duì)本文提出的3層式模式分類體系,選取4個(gè)特征向量分別組成各層分類器的訓(xùn)練和預(yù)測(cè)樣本集。

首先,本文針對(duì)降尺度因子為1/4的視頻轉(zhuǎn)碼進(jìn)行研究,最直接的方法是選擇在高分辨率視頻的4個(gè)相鄰宏塊中編碼模式出現(xiàn)頻率最高的作為當(dāng)前宏塊的編碼模式。實(shí)驗(yàn)數(shù)據(jù)表明,通常情況下,出現(xiàn)頻率最高的模式往往是通過(guò)率失真優(yōu)化算法得到的最終編碼模式,尤其是當(dāng)編碼模式為SKIP模式和大塊分割模式時(shí)。表1中數(shù)據(jù)是由式(3)計(jì)算獲得,其中,Pmodei表示高分辨率視頻的4個(gè)相鄰宏塊中使用頻率不小于2的編碼模式數(shù)量(Hmodei)與降尺寸視頻實(shí)際采用該模式數(shù)量(Lmodei)的比例。因此,宏塊編碼模式在高分辨率視頻中的出現(xiàn)頻率被選作特征向量之一。

表1 出現(xiàn)頻率與編碼模式相關(guān)性

其次,幀間模式中各尺寸塊的選擇對(duì)編碼質(zhì)量有著重要影響。選擇大尺寸塊意味著編碼運(yùn)動(dòng)矢量和幀間分割模式占用比特較少,而運(yùn)動(dòng)劇烈區(qū)域內(nèi)宏塊在運(yùn)動(dòng)補(bǔ)償后的殘差較大;相反,如果選擇小尺寸塊則殘差較小,而大量的比特耗費(fèi)在編碼運(yùn)動(dòng)矢量和幀間分割模式上。本文將運(yùn)動(dòng)矢量和宏塊殘差作為下層SVM分類器的特征向量,并通過(guò)數(shù)據(jù)預(yù)處理來(lái)提高預(yù)測(cè)準(zhǔn)確度。利用統(tǒng)計(jì)計(jì)算方法將運(yùn)動(dòng)矢量轉(zhuǎn)換為運(yùn)動(dòng)矢量絕對(duì)值之和,將宏塊殘差轉(zhuǎn)換為殘差均值。經(jīng)過(guò)預(yù)處理之后的樣本集,類別分布更加清晰,模式表述更加明確。

另外,鑒于殘差塊不為零的 DCT系數(shù)與宏塊特征的緊密聯(lián)系,且其提取方法簡(jiǎn)單,無(wú)需進(jìn)行DCT逆變換,因此選為上層分類器的特征向量。最后,將降尺寸視頻中宏塊編碼模式規(guī)范為 6類:SKIP、non-SKIP、intra、non-intra、big-partition 和small-partition。

綜上所述,分層式SVM分類器的特征向量FV1,FV2和FV3分別包含如下屬性。在對(duì)預(yù)測(cè)準(zhǔn)確度的分析比較中(表 2)可以看到,本文選取的特征向量組成樣本集達(dá)到了較理想的訓(xùn)練和預(yù)測(cè)效果。

FV1=[原視頻模式使用頻率,不為零DCT系統(tǒng)個(gè)數(shù)]

FV2=[原視頻模式使用頻率,運(yùn)動(dòng)矢量絕對(duì)值之和]

FV3=[原視頻模式使用頻率,運(yùn)動(dòng)矢量絕對(duì)值之和,殘差均值]

3.3 核函數(shù)的選擇

核函數(shù)是支持向量機(jī)的重要組成部分,采用不同的核函數(shù)會(huì)組成不同的支持向量機(jī)算法。核函數(shù)、映射函數(shù)和特征空間一一對(duì)應(yīng),核函數(shù)參數(shù)的改變實(shí)際上隱含地改變了映射函數(shù),進(jìn)而改變樣本數(shù)據(jù)子空間分布的復(fù)雜程度。因此,核函數(shù)的選取變得十分重要。

目前,在SVM中研究最多的核函數(shù)主要有4類:線性(linear)核函數(shù),多項(xiàng)式(polynomial)核函數(shù),徑向基函數(shù)(RBF)和sigmoid核函數(shù)??傮w來(lái)說(shuō),核函數(shù)可以劃分為局部核函數(shù)和全局核函數(shù)2種[9]。局部核函數(shù)的學(xué)習(xí)能力較強(qiáng),泛化能力較弱,而全局核函數(shù)的泛化能力較強(qiáng),學(xué)習(xí)能力較弱。

表2 運(yùn)用不同特征向量獲得SVM模型預(yù)測(cè)準(zhǔn)確度/%

為了選取適用于視頻轉(zhuǎn)碼幀內(nèi)預(yù)測(cè)算法的最優(yōu)核函數(shù),本文定義了核函數(shù)性能參數(shù) J。假設(shè)輸入空間中的 2 類樣本:(x1, x2,…, xl)和(xl+1, xl+2,…, x2l)分別屬于類別 C1和 C2,其中 l為樣本數(shù)量。各類中心點(diǎn)在特征空間中表示為

用核函數(shù)K(xi, xj)替代映射函數(shù)Φ,計(jì)算類中心的二次范數(shù):

由式(6)計(jì)算獲得各類緊湊度參數(shù)δ21和δ22:

類別間的中心距離為

最后,得到核函數(shù)性能參數(shù)J:

其中,分子代表不同類樣本在特征空間中的可分度,分母代表同類樣本的緊湊度??梢?jiàn),J值越大則該核函數(shù)的性能越好。

從表3中可以看出,對(duì)于3層SVM分類器,徑向基函數(shù)(RBF)的 J值最大,因此選作最優(yōu)核函數(shù)進(jìn)行SVM訓(xùn)練及預(yù)測(cè)。

表3 核函數(shù)J值

4 實(shí)驗(yàn)結(jié)果與分析

在實(shí)驗(yàn)中,編碼采用H.264的測(cè)試模型JM12.2,實(shí)驗(yàn)平臺(tái)使用Visual C++6.0。選擇開(kāi)源軟件libSVM[10]作為SVM開(kāi)發(fā)工具,并采用離線方法訓(xùn)練SVM分類器,因此不會(huì)給轉(zhuǎn)碼器帶來(lái)額外運(yùn)算負(fù)擔(dān)。

為了驗(yàn)證本文提出算法的轉(zhuǎn)碼效果,實(shí)驗(yàn)選取常用分辨率格式CIF和4CIF,共16段具有不同運(yùn)動(dòng)程度、紋理特征的測(cè)試序列訓(xùn)練SVM分類器模型。首先將高分辨率視頻利用 JM12.2進(jìn)行編碼再解碼,以便提取編碼信息訓(xùn)練SVM模型。然后將CIF格式視頻 Foreman,Mother-daughter、Paris和Silent,以及4CIF格式視頻Crew、Harbor、Ice和Soccer以1/4尺寸縮小。編碼采用首幀為幀內(nèi)編碼(intra-frame,I幀),后續(xù)幀為幀間編碼(inter-frame,P幀),QP設(shè)置從22~32。

為評(píng)估本文選取特征向量的優(yōu)劣,實(shí)驗(yàn)中另外選用文獻(xiàn)[4]中使用的特征向量 FVo1,F(xiàn)Vo2和 FVo3訓(xùn)練SVM模型Modelo,與本文的SVM模型Modelp進(jìn)行比較。

FVo1=[不為零DCT系統(tǒng)個(gè)數(shù),殘差均值,殘差方差]

FVo2=[不為零DCT系統(tǒng)個(gè)數(shù),殘差均值,列差方差]

FVo3=[不為零DCT系統(tǒng)個(gè)數(shù),殘差均值,殘差方差,運(yùn)動(dòng)矢量均值]

表2所示為采用不同特征向量訓(xùn)練SVM模型預(yù)測(cè)編碼模式的準(zhǔn)確度。可以看出,基于兩組不同的特征向量,本文模型Modelp達(dá)到的預(yù)測(cè)準(zhǔn)確度更高,平均達(dá)到83.42%,最高可達(dá)97.95%。實(shí)驗(yàn)用于SVM訓(xùn)練與預(yù)測(cè)的視頻序列不同,從實(shí)驗(yàn)結(jié)果可以看出此SVM分類器具有很好的泛化及推廣能力。

本文提出的基于SVM的視頻轉(zhuǎn)碼快速模式選擇算法,與全搜索(full mode)算法和文獻(xiàn)[2]中提出的時(shí)空域聯(lián)合幀間模式預(yù)測(cè)算法(STMP)在轉(zhuǎn)碼質(zhì)量、比特率、預(yù)測(cè)準(zhǔn)確度和轉(zhuǎn)碼速度幾方面進(jìn)行比較。文獻(xiàn)[2]針對(duì)H.264編碼,利用宏塊的時(shí)域和空域特征對(duì)幀間模式進(jìn)行快速選擇;而本文針對(duì)H.264視頻轉(zhuǎn)碼,利用高分辨率視頻碼流中的編碼信息對(duì)低分辨率視頻進(jìn)行快速幀間編碼。由于STMP是最新且編碼效果最好的方法之一,因此作為對(duì)比算法,與本文提出的方法在轉(zhuǎn)碼再編碼過(guò)程中進(jìn)行編碼效果的比較。

表4 幾種算法進(jìn)行轉(zhuǎn)碼效果比較

如表4(正值表示增加,負(fù)值表示減小)所示,基于SVM的模式選擇算法比傳統(tǒng)的全搜索算法平均節(jié)省45.8%時(shí)間,并保證PSNR僅下降0.13dB,比特率增加10.1%。文獻(xiàn)[2]提出的算法STMP比f(wàn)ull mode方法平均節(jié)省 41%運(yùn)算時(shí)間,PSNR下降0.25dB,比特率增加29.7%。

另外,轉(zhuǎn)碼的效果與視頻序列的內(nèi)容,即運(yùn)動(dòng)快慢和分辨率有關(guān)。從PSNR和比特率2個(gè)方面考慮,利用STMP方法轉(zhuǎn)碼4CIF格式視頻比轉(zhuǎn)碼CIF視頻效果更好,而SVM方法轉(zhuǎn)碼CIF視頻比轉(zhuǎn)碼4CIF格式視頻效果更佳。對(duì)于4CIF格式視頻STMP算法比SVM算法獲得的圖像質(zhì)量稍好,但是運(yùn)算復(fù)雜度較高。從圖3和圖4可以看出,總體來(lái)說(shuō),對(duì)于大多數(shù)視頻序列而言,本文提出的基于 SVM的模式選擇算法相比STMP方法達(dá)到的轉(zhuǎn)碼效果更好,尤其是運(yùn)動(dòng)劇烈的視頻,例如Foreman序列等。

綜合衡量運(yùn)算復(fù)雜度、轉(zhuǎn)碼質(zhì)量和壓縮率等因素,本文提出的算法在有效提高降尺寸轉(zhuǎn)碼速度的同時(shí),與現(xiàn)有算法相比,取得了更優(yōu)的編碼效果和更廣泛的適用性。

圖3 Ice序列

圖4 算法復(fù)雜度

5 結(jié)束語(yǔ)

本文重點(diǎn)分析了H.264降尺寸轉(zhuǎn)碼中模式選擇算法,針對(duì)視頻轉(zhuǎn)碼運(yùn)算復(fù)雜度高的問(wèn)題,提出一種基于SVM的快速轉(zhuǎn)碼框架。利用SVM方法建立高分辨率視頻碼流編碼信息與降尺寸視頻中宏塊編碼模式間的聯(lián)系。在此基礎(chǔ)上,設(shè)計(jì)構(gòu)建分層式SVM分類器來(lái)預(yù)測(cè)宏塊編碼模式。此算法縮減了預(yù)測(cè)模式的數(shù)量,實(shí)現(xiàn)轉(zhuǎn)碼再編碼過(guò)程中率失真優(yōu)化算法的提前終止。實(shí)驗(yàn)結(jié)果表明,本文提出的算法有效降低了全搜索算法的轉(zhuǎn)碼時(shí)間,節(jié)省了高達(dá)67.31%的運(yùn)算量,并保證極小的圖像質(zhì)量下降。

本文專門針對(duì)基于 H.264的同類視頻轉(zhuǎn)碼降尺寸轉(zhuǎn)碼中模式選擇算法進(jìn)行研究。由于 H.264降尺寸視頻轉(zhuǎn)碼具有很高的實(shí)際應(yīng)用價(jià)值,因此如何在提高轉(zhuǎn)碼后視頻質(zhì)量的同時(shí)有效降低編碼復(fù)雜度方面仍需要進(jìn)行改進(jìn)。在下一步的工作中,將對(duì)運(yùn)動(dòng)矢量合成算法進(jìn)行研究,以期進(jìn)一步提高轉(zhuǎn)碼速度。

[1] STOCKHAMMER T, HANNUKSELA M M. H.264/AVC video for wireless transmission[J]. IEEE Wireless Communication, 2005,12(4):6-13.

[2] SONG-HAK R, YURI V, JOERN O. Fast inter-mode detection in an H.264/AVC encoder using mode and lagrangian cost correlation[J].IEEE Transactions on Circuits and Systems for Video Technology,2009, 19(2): 302-306.

[3] FUNG K T, SIU W C, DCT-based video downscaling transcoder using split and merge technique[J]. IEEE Transaction on Image Processing,2006, 15(2):394-403.

[4] JING X, SIU W C, CHAU L P, et al. Efficient inter mode decision for H.263 to H.264 video transcoding using SVMs[A]. Proceedings IEEE International Symposium on Circuits and Systems[C]. Taipei, China,2009. 2349-2352.

[5] JAEIL K, MUNCHURL K. Block-mode classification using SVMs for early terminatio of block mode decision in H.264|MPEG-4 part 10 AVC[A]. Proceedings, 2009 Seventh International Conference on Advances in Pattern Recognition[C]. Kolkata, India, 2009. 83-86.

[6] 謝晶,賈克斌. 一種基于二維直方圖的 H.264/AVC快速幀內(nèi)預(yù)測(cè)判決算法[J]. 電子與信息學(xué)報(bào), 2005, 27(7):1053-1057.XIE J, JIA K B. A fast Intra-frame prediction algorithm based on two-dimensional histogram for H.264/AVC[J]. Journal of Electronics& Information Technology, 2005, 27(7): 1053-1057.

[7] VAPNIK V N. Statistical Learning Theory[M]. New York, Wiley,1998.

[8] LIU Z B, JIN L W. A new method for multi-class support vector machines[A]. Proceedings 2008 International Joint Conference on Neural Networks[C]. Hong Kong, China, 2008. 727-732.

[9] SONG H Z, DING Z C, GUO C C, et al. Research on combination kernel function of support vector machine[A]. Proceedings 2008 International Conference on Computer Science and Software Engineer[C]. Wuhan, China, 2008. 838-841.

[10] CHANG C C, LIN C J. LIBSVM: a library for support vector machines[EB/OL]. http://www.csie.ntu.edu.tw/~ lin/libsvm.

猜你喜歡
宏塊轉(zhuǎn)碼特征向量
移動(dòng)云盤在線轉(zhuǎn)碼功能技術(shù)研究
二年制職教本科線性代數(shù)課程的幾何化教學(xué)設(shè)計(jì)——以特征值和特征向量為例
克羅內(nèi)克積的特征向量
視頻轉(zhuǎn)碼技術(shù)在廣播電視中的應(yīng)用研究
締客世界(2020年1期)2020-12-12 18:18:28
基于IPTV點(diǎn)播業(yè)務(wù)的視頻分段式轉(zhuǎn)碼方案的研究與應(yīng)用
傳播力研究(2018年7期)2018-05-10 09:42:47
一類特殊矩陣特征向量的求法
EXCEL表格計(jì)算判斷矩陣近似特征向量在AHP法檢驗(yàn)上的應(yīng)用
基于Hadoop 的分布式視頻轉(zhuǎn)碼方案
基于選擇特征宏塊的快速視頻穩(wěn)像
基于宏塊合并的H.264模式選擇算法
宽城| 晋江市| 治多县| 会昌县| 宁蒗| 宁南县| 镇沅| 光泽县| 克拉玛依市| 万山特区| 迁安市| 宁武县| 克东县| 贵港市| 蒲江县| 江川县| 三台县| 色达县| 竹溪县| 门头沟区| 墨江| 连州市| 临海市| 黄浦区| 安图县| 宜君县| 临湘市| 沙田区| 慈溪市| 剑川县| 阿荣旗| 舒兰市| 高青县| 甘谷县| 蕲春县| 会东县| 同仁县| 五台县| 芷江| 塘沽区| 隆昌县|