一種基于背景提取的視頻對(duì)象分割算法

2010-11-27 01:46:22焦蓬蓬郭依正

網(wǎng)絡(luò)安全與數(shù)據(jù)管理 2010年19期

焦蓬蓬，郭依正

(南京師范大學(xué) 泰州學(xué)院信息科學(xué)與技術(shù)系，江蘇泰州 225300)

隨著網(wǎng)絡(luò)和多媒體技術(shù)的發(fā)展，通信數(shù)據(jù)量越來越大，特別是在視頻會(huì)議、視頻電話等圖像通信中，其通信數(shù)據(jù)量大得驚人。而目前通信網(wǎng)絡(luò)的帶寬有限，不能很好地支持高質(zhì)量的圖像通信業(yè)務(wù)。為了解決這些問題，國(guó)際電信聯(lián)盟先后提出了MPEG-2、MPEG-4標(biāo)準(zhǔn)。MPEG-4的初衷是針對(duì)于視頻會(huì)議、視頻電話的超低比特率編碼，但在以后的發(fā)展中，MPEG對(duì)該標(biāo)準(zhǔn)又進(jìn)行了修改。MPEG-4標(biāo)準(zhǔn)引入了視頻對(duì)象VO(Video Object)的概念，編碼是基于對(duì)象(Object)的[1]。所謂對(duì)象是指一個(gè)場(chǎng)景中可以操作和控制的實(shí)體，而傳統(tǒng)壓縮方法是基于幀的，已無法對(duì)對(duì)象進(jìn)行操作。MPEG-4中對(duì)比特率控制可以是基于對(duì)象的，即使在帶寬有限的情況下，可以利用碼率分配方法，對(duì)于用戶感興趣的對(duì)象可以多分配一些比特率，而對(duì)于用戶不感興趣的對(duì)象可以少分配一些比特率，這樣圖像質(zhì)量可以得到保證。所以在MPEG-4標(biāo)準(zhǔn)中，視頻對(duì)象分割算法顯得十分重要。

視頻對(duì)象分割算法與圖像分割技術(shù)聯(lián)系緊密，圖像分割算法被廣泛地應(yīng)用在視頻對(duì)象分割中。目前的視頻對(duì)象分割算法有很多，如檢測(cè)變化區(qū)域的分割方法[2]，其主要是通過檢測(cè)序列圖像幀的變化區(qū)域與不變區(qū)域，從而分割出運(yùn)動(dòng)物體與靜止背景。該算法的關(guān)鍵是閾值的選取，分割后的圖像中沒有變化的部分表示背景圖像，變化的部分代表運(yùn)動(dòng)區(qū)域。這類算法的優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單，特別適用于室內(nèi)場(chǎng)景(如視頻電話、網(wǎng)絡(luò)會(huì)議等)。其缺點(diǎn)是對(duì)噪聲敏感，在背景場(chǎng)景變化復(fù)雜的室外情況下，分割的效果不好?；趯?duì)稱差分的視頻分割算法[3]是將數(shù)學(xué)的“與或”操作運(yùn)用在圖像分割中，通過連續(xù)幀的差減、“與或”運(yùn)算，可以提取出中間視頻幀的圖像運(yùn)動(dòng)對(duì)象。近年來，自適應(yīng)閾值的方法[4]也廣泛運(yùn)用在運(yùn)動(dòng)目標(biāo)的提取上，它結(jié)合了形態(tài)學(xué)中的開啟和閉合方法來對(duì)圖像進(jìn)行處理。此外還有基于時(shí)空信息的視頻對(duì)象分割算法[5]。綜上所述，視頻對(duì)象分割算法還處于發(fā)展之中，一種優(yōu)秀的分割算法不僅要與圖像分割相結(jié)合，而且還需要人工智能和運(yùn)動(dòng)分析等方面知識(shí)。

1 視頻分割算法

MPEG-4算法中對(duì)象的提取是關(guān)鍵技術(shù)之一，提取的效果直接關(guān)系到圖像壓縮的效率。對(duì)稱差分方法[3]簡(jiǎn)單有效，但這類算法也存在一些不足。首先，由于是連續(xù)的操作，視頻圖像的背景部分和運(yùn)動(dòng)部分都要進(jìn)行差減運(yùn)算，而實(shí)際上背景是靜止不變的，只會(huì)受到噪聲的一些小影響。所以在用該算法時(shí)，背景的運(yùn)算是沒有必要的，特別是在硬件實(shí)現(xiàn)上，浪費(fèi)了大量CPU時(shí)間。其次，圖像的播放是30幀/s，如果在每秒都用對(duì)稱差分算法，顯然很不實(shí)際。所以一般采用的方法是每隔Δt后，采樣一幀圖像，再用該算法進(jìn)行提取視頻對(duì)象。此外，每秒的視頻序列很多，而視頻運(yùn)動(dòng)對(duì)象的運(yùn)動(dòng)范圍相對(duì)固定，所以可以認(rèn)為視頻對(duì)象只在一定的范圍內(nèi)變化，提取視頻對(duì)象時(shí)，只要提取視頻圖像中該范圍內(nèi)的視頻對(duì)象信息即可。

根據(jù)視頻對(duì)象運(yùn)動(dòng)的特點(diǎn)和MPEG-4對(duì)視頻對(duì)象的要求，以及對(duì)對(duì)稱差分分割算法的理解分析，本文提出了一種基于背景提取的視頻對(duì)象分割算法。這種分割算法適合應(yīng)用在室內(nèi)環(huán)境或者是視頻會(huì)議等背景變化不大、視頻對(duì)象的運(yùn)動(dòng)范圍變化也不大的情況下。該算法思想是：首先通過對(duì)多幀視頻序列的比較，提取出背景圖像信息，同時(shí)得到視頻對(duì)象的運(yùn)動(dòng)區(qū)域。對(duì)于以后的視頻序列，只要提取運(yùn)動(dòng)區(qū)域內(nèi)的相關(guān)圖像信息即可，避免了以后視頻序列間的運(yùn)算，節(jié)約了時(shí)間，減少了運(yùn)算量。該算法的主要步驟如下：

(1)初始化圖像的參考對(duì)象，如第一幀圖像。

(2)求兩幀圖像之間的差，并選取一定的閾值，將圖像二值化。由于視頻對(duì)象的運(yùn)動(dòng)，所以運(yùn)動(dòng)區(qū)域的像素點(diǎn)值相對(duì)于背景區(qū)域的像素點(diǎn)值變化較大，很容易找出視頻對(duì)象。同時(shí)也可以根據(jù)Surendra原理，將背景圖像更新。背景更新的算法根據(jù)公式(1)來計(jì)算。通過多幀視頻序列的迭代，得到的背景效果會(huì)更好，然后再二值化。

式中，Di(x，y)=1為視頻對(duì)象區(qū)域，Di(x，y)=0為背景區(qū)域，Bi為第i幀圖像，α為比例系數(shù)。

(3)對(duì)二值圖像分別從 x軸、y軸進(jìn)行自左向右、自上而下掃描，記錄下 Di(x，y)=1的點(diǎn)數(shù)和 Di(x，y)=0的點(diǎn)數(shù)，并設(shè)置一個(gè)閾值，記錄下超過該閾值的行列值。

(4)對(duì)這些相鄰的行列值分別求差，并選取各個(gè)方向最大的兩個(gè)值作為視頻對(duì)象運(yùn)動(dòng)區(qū)域的上下左右4個(gè)點(diǎn)。因?yàn)橐曨l對(duì)象邊緣的像素點(diǎn)變化最大，通過求差分的方式可以表現(xiàn)出來。

(5)對(duì)于以后的視頻序列，可以只讀取該區(qū)域的圖像信息作為視頻對(duì)象。其中，這個(gè)矩形區(qū)域可以適當(dāng)調(diào)整。步驟(4)得到的矩形是視頻對(duì)象運(yùn)動(dòng)最劇烈的部分，經(jīng)調(diào)整可以將視頻對(duì)象提取得更完整一些。

2 仿真結(jié)果與分析

實(shí)驗(yàn)環(huán)境：Dell公司的PC機(jī)，CPU為Intel Pentium4，主頻 1.5 GHz，內(nèi)存 512 MB，操作系統(tǒng) Windows 2000。程序在Matlab 7.0下，采用foreman視頻序列來完成測(cè)試。foreman視頻序列如圖1所示，提取foreman序列時(shí)采用1幀/s的速率進(jìn)行提取。從圖中可以看到，人物的運(yùn)動(dòng)基本是在一個(gè)相對(duì)固定的區(qū)域。提取時(shí)首先提取視頻圖像的背景，后面的視頻序列只要讀取背景以外的部分就可以了。

圖2是提取的視頻圖像的背景，圖3是從第7幀、第17幀和第22幀中提取的視頻對(duì)象。程序運(yùn)行時(shí)從第7幀、第17幀和第22幀中采用任意兩幀用來提取視頻對(duì)象，運(yùn)行結(jié)果為“Elapsed time is 3.561000 seconds”，即總共運(yùn)行了3.561 s，少于其他算法的運(yùn)行時(shí)間。

由實(shí)驗(yàn)結(jié)果可以看到，該算法較準(zhǔn)確地分割出了視頻對(duì)象，且在計(jì)算上比其他算法要簡(jiǎn)單得多。但該算法分割出的對(duì)象區(qū)域是視頻對(duì)象運(yùn)動(dòng)最大的區(qū)域，導(dǎo)致在加矩形框時(shí)，可能存在過分割的現(xiàn)象，即將多余的圖像信息也包含了進(jìn)去。因此，對(duì)于該算法中的矩形框的大小確定問題仍然需要深入研究。

本文考慮到實(shí)時(shí)性和計(jì)算量等因素，在一種對(duì)稱差分方法的基礎(chǔ)上，從視頻序列的背景入手，先找出視頻序列的背景信息，對(duì)以后的各幀圖像只要讀取背景以外的信息，就可以方便地提取出視頻對(duì)象。實(shí)驗(yàn)仿真表明，這種方法可以快速提取出視頻對(duì)象。但是，該算法只適合于視頻會(huì)議、視頻電話等背景區(qū)域變化不大的場(chǎng)合。如何實(shí)現(xiàn)在室外環(huán)境和背景不斷轉(zhuǎn)換的情況下的視頻對(duì)象的有效分割需要繼續(xù)深入研究。

[1]錢淵，張曉燕，夏靖波.視頻對(duì)象分割技術(shù)綜述[J].探測(cè)與控制學(xué)報(bào)，2008，30(2)：64-67.

[2]印勇，張影.基于變化檢測(cè)的視頻對(duì)象分割算法研究[J].計(jì)算機(jī)工程與設(shè)計(jì)，2008，44(13)：161-163.

[3]賀貴明，李凌娟，賈振堂.一種快速的基于對(duì)稱差分的視頻分割算法 [J].小型微型計(jì)算機(jī)系統(tǒng)，2003，24(6)：966-968.

[4]姚軍，蔣曉瑜，黃應(yīng)清.一種基于自適應(yīng)閾值與邊緣跟蹤的目標(biāo)提取方法 [J].裝甲兵工程學(xué)院學(xué)報(bào)，2004(4)：56-57.

[5]張曉波，劉文耀，呂大偉.基于時(shí)空信息的自動(dòng)視頻對(duì)象分割算法[J].光電子·激光，2008，19(3)：384-387.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

一種基于背景提取的視頻對(duì)象分割算法

1 視頻分割算法

2 仿真結(jié)果與分析