焦蓬蓬,郭依正
(南京師范大學(xué) 泰州學(xué)院 信息科學(xué)與技術(shù)系,江蘇 泰州 225300)
隨著網(wǎng)絡(luò)和多媒體技術(shù)的發(fā)展,通信數(shù)據(jù)量越來越大,特別是在視頻會(huì)議、視頻電話等圖像通信中,其通信數(shù)據(jù)量大得驚人。而目前通信網(wǎng)絡(luò)的帶寬有限,不能很好地支持高質(zhì)量的圖像通信業(yè)務(wù)。為了解決這些問題,國(guó)際電信聯(lián)盟先后提出了MPEG-2、MPEG-4標(biāo)準(zhǔn)。MPEG-4的初衷是針對(duì)于視頻會(huì)議、視頻電話的超低比特率編碼,但在以后的發(fā)展中,MPEG對(duì)該標(biāo)準(zhǔn)又進(jìn)行了修改。MPEG-4標(biāo)準(zhǔn)引入了視頻對(duì)象VO(Video Object)的概念,編碼是基于對(duì)象(Object)的[1]。所謂對(duì)象是指一個(gè)場(chǎng)景中可以操作和控制的實(shí)體,而傳統(tǒng)壓縮方法是基于幀的,已無法對(duì)對(duì)象進(jìn)行操作。MPEG-4中對(duì)比特率控制可以是基于對(duì)象的,即使在帶寬有限的情況下,可以利用碼率分配方法,對(duì)于用戶感興趣的對(duì)象可以多分配一些比特率,而對(duì)于用戶不感興趣的對(duì)象可以少分配一些比特率,這樣圖像質(zhì)量可以得到保證。所以在MPEG-4標(biāo)準(zhǔn)中,視頻對(duì)象分割算法顯得十分重要。
視頻對(duì)象分割算法與圖像分割技術(shù)聯(lián)系緊密,圖像分割算法被廣泛地應(yīng)用在視頻對(duì)象分割中。目前的視頻對(duì)象分割算法有很多,如檢測(cè)變化區(qū)域的分割方法[2],其主要是通過檢測(cè)序列圖像幀的變化區(qū)域與不變區(qū)域,從而分割出運(yùn)動(dòng)物體與靜止背景。該算法的關(guān)鍵是閾值的選取,分割后的圖像中沒有變化的部分表示背景圖像,變化的部分代表運(yùn)動(dòng)區(qū)域。這類算法的優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單,特別適用于室內(nèi)場(chǎng)景(如視頻電話、網(wǎng)絡(luò)會(huì)議等)。其缺點(diǎn)是對(duì)噪聲敏感,在背景場(chǎng)景變化復(fù)雜的室外情況下,分割的效果不好?;趯?duì)稱差分的視頻分割算法[3]是將數(shù)學(xué)的“與或”操作運(yùn)用在圖像分割中,通過連續(xù)幀的差減、“與或”運(yùn)算,可以提取出中間視頻幀的圖像運(yùn)動(dòng)對(duì)象。近年來,自適應(yīng)閾值的方法[4]也廣泛運(yùn)用在運(yùn)動(dòng)目標(biāo)的提取上,它結(jié)合了形態(tài)學(xué)中的開啟和閉合方法來對(duì)圖像進(jìn)行處理。此外還有基于時(shí)空信息的視頻對(duì)象分割算法[5]。綜上所述,視頻對(duì)象分割算法還處于發(fā)展之中,一種優(yōu)秀的分割算法不僅要與圖像分割相結(jié)合,而且還需要人工智能和運(yùn)動(dòng)分析等方面知識(shí)。
MPEG-4算法中對(duì)象的提取是關(guān)鍵技術(shù)之一,提取的效果直接關(guān)系到圖像壓縮的效率。對(duì)稱差分方法[3]簡(jiǎn)單有效,但這類算法也存在一些不足。首先,由于是連續(xù)的操作,視頻圖像的背景部分和運(yùn)動(dòng)部分都要進(jìn)行差減運(yùn)算,而實(shí)際上背景是靜止不變的,只會(huì)受到噪聲的一些小影響。所以在用該算法時(shí),背景的運(yùn)算是沒有必要的,特別是在硬件實(shí)現(xiàn)上,浪費(fèi)了大量CPU時(shí)間。其次,圖像的播放是30幀/s,如果在每秒都用對(duì)稱差分算法,顯然很不實(shí)際。所以一般采用的方法是每隔Δt后,采樣一幀圖像,再用該算法進(jìn)行提取視頻對(duì)象。此外,每秒的視頻序列很多,而視頻運(yùn)動(dòng)對(duì)象的運(yùn)動(dòng)范圍相對(duì)固定,所以可以認(rèn)為視頻對(duì)象只在一定的范圍內(nèi)變化,提取視頻對(duì)象時(shí),只要提取視頻圖像中該范圍內(nèi)的視頻對(duì)象信息即可。
根據(jù)視頻對(duì)象運(yùn)動(dòng)的特點(diǎn)和MPEG-4對(duì)視頻對(duì)象的要求,以及對(duì)對(duì)稱差分分割算法的理解分析,本文提出了一種基于背景提取的視頻對(duì)象分割算法。這種分割算法適合應(yīng)用在室內(nèi)環(huán)境或者是視頻會(huì)議等背景變化不大、視頻對(duì)象的運(yùn)動(dòng)范圍變化也不大的情況下。該算法思想是:首先通過對(duì)多幀視頻序列的比較,提取出背景圖像信息,同時(shí)得到視頻對(duì)象的運(yùn)動(dòng)區(qū)域。對(duì)于以后的視頻序列,只要提取運(yùn)動(dòng)區(qū)域內(nèi)的相關(guān)圖像信息即可,避免了以后視頻序列間的運(yùn)算,節(jié)約了時(shí)間,減少了運(yùn)算量。該算法的主要步驟如下:
(1)初始化圖像的參考對(duì)象,如第一幀圖像。
(2)求兩幀圖像之間的差,并選取一定的閾值,將圖像二值化。由于視頻對(duì)象的運(yùn)動(dòng),所以運(yùn)動(dòng)區(qū)域的像素點(diǎn)值相對(duì)于背景區(qū)域的像素點(diǎn)值變化較大,很容易找出視頻對(duì)象。同時(shí)也可以根據(jù)Surendra原理,將背景圖像更新。背景更新的算法根據(jù)公式(1)來計(jì)算。通過多幀視頻序列的迭代,得到的背景效果會(huì)更好,然后再二值化。
式中,Di(x,y)=1為視頻對(duì)象區(qū)域,Di(x,y)=0為背景區(qū)域,Bi為第i幀圖像,α為比例系數(shù)。
(3)對(duì)二值圖像分別從 x軸、y軸進(jìn)行自左向右、自上而下掃描,記錄下 Di(x,y)=1的點(diǎn)數(shù)和 Di(x,y)=0的點(diǎn)數(shù),并設(shè)置一個(gè)閾值,記錄下超過該閾值的行列值。
(4)對(duì)這些相鄰的行列值分別求差,并選取各個(gè)方向最大的兩個(gè)值作為視頻對(duì)象運(yùn)動(dòng)區(qū)域的上下左右4個(gè)點(diǎn)。因?yàn)橐曨l對(duì)象邊緣的像素點(diǎn)變化最大,通過求差分的方式可以表現(xiàn)出來。
(5)對(duì)于以后的視頻序列,可以只讀取該區(qū)域的圖像信息作為視頻對(duì)象。其中,這個(gè)矩形區(qū)域可以適當(dāng)調(diào)整。步驟(4)得到的矩形是視頻對(duì)象運(yùn)動(dòng)最劇烈的部分,經(jīng)調(diào)整可以將視頻對(duì)象提取得更完整一些。
實(shí)驗(yàn)環(huán)境:Dell公司的PC機(jī),CPU為Intel Pentium4,主頻 1.5 GHz,內(nèi)存 512 MB,操作系統(tǒng) Windows 2000。程序在Matlab 7.0下,采用foreman視頻序列來完成測(cè)試。foreman視頻序列如圖1所示,提取foreman序列時(shí)采用1幀/s的速率進(jìn)行提取。從圖中可以看到,人物的運(yùn)動(dòng)基本是在一個(gè)相對(duì)固定的區(qū)域。提取時(shí)首先提取視頻圖像的背景,后面的視頻序列只要讀取背景以外的部分就可以了。
圖2是提取的視頻圖像的背景,圖3是從第7幀、第17幀和第22幀中提取的視頻對(duì)象。程序運(yùn)行時(shí)從第7幀、第17幀和第22幀中采用任意兩幀用來提取視頻對(duì)象,運(yùn)行結(jié)果為“Elapsed time is 3.561000 seconds”,即總共運(yùn)行了3.561 s,少于其他算法的運(yùn)行時(shí)間。
由實(shí)驗(yàn)結(jié)果可以看到,該算法較準(zhǔn)確地分割出了視頻對(duì)象,且在計(jì)算上比其他算法要簡(jiǎn)單得多。但該算法分割出的對(duì)象區(qū)域是視頻對(duì)象運(yùn)動(dòng)最大的區(qū)域,導(dǎo)致在加矩形框時(shí),可能存在過分割的現(xiàn)象,即將多余的圖像信息也包含了進(jìn)去。因此,對(duì)于該算法中的矩形框的大小確定問題仍然需要深入研究。
本文考慮到實(shí)時(shí)性和計(jì)算量等因素,在一種對(duì)稱差分方法的基礎(chǔ)上,從視頻序列的背景入手,先找出視頻序列的背景信息,對(duì)以后的各幀圖像只要讀取背景以外的信息,就可以方便地提取出視頻對(duì)象。實(shí)驗(yàn)仿真表明,這種方法可以快速提取出視頻對(duì)象。但是,該算法只適合于視頻會(huì)議、視頻電話等背景區(qū)域變化不大的場(chǎng)合。如何實(shí)現(xiàn)在室外環(huán)境和背景不斷轉(zhuǎn)換的情況下的視頻對(duì)象的有效分割需要繼續(xù)深入研究。
[1]錢淵,張曉燕,夏靖波.視頻對(duì)象分割技術(shù)綜述[J].探測(cè)與控制學(xué)報(bào),2008,30(2):64-67.
[2]印勇,張影.基于變化檢測(cè)的視頻對(duì)象分割算法研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2008,44(13):161-163.
[3]賀貴明,李凌娟,賈振堂.一種快速的基于對(duì)稱差分的視頻分割算法 [J].小型微型計(jì)算機(jī)系統(tǒng),2003,24(6):966-968.
[4]姚軍,蔣曉瑜,黃應(yīng)清.一種基于自適應(yīng)閾值與邊緣跟蹤的目標(biāo)提取方法 [J].裝甲兵工程學(xué)院學(xué)報(bào),2004(4):56-57.
[5]張曉波,劉文耀,呂大偉.基于時(shí)空信息的自動(dòng)視頻對(duì)象分割算法[J].光電子·激光,2008,19(3):384-387.