摘要:運(yùn)動(dòng)目標(biāo)的檢測(cè)與分割是視頻監(jiān)控系統(tǒng)的基礎(chǔ),所分割出的目標(biāo)的完整性對(duì)視頻的后續(xù)處理如目標(biāo)分類(lèi)、跟蹤及行為理解產(chǎn)生重要影響。實(shí)際場(chǎng)景通常很復(fù)雜包括靜態(tài)的背景和動(dòng)態(tài)的背景及運(yùn)動(dòng)目標(biāo)。該文提出了基于貝葉斯框架的目標(biāo)檢測(cè)方法。首先求相鄰兩幀之差,通過(guò)自適應(yīng)閾值把幀差圖二值化為變化部分和靜止部分。每個(gè)像素維護(hù)兩個(gè)表分別對(duì)應(yīng)靜止和運(yùn)運(yùn)兩種狀態(tài),表中表項(xiàng)記錄像素最近最重要的概率信息,檢索這些概率代入貝葉斯公式,求出當(dāng)前幀像素點(diǎn)的最大后驗(yàn)概率,根據(jù)貝葉斯分類(lèi)原則,對(duì)當(dāng)前幀的像素進(jìn)行分類(lèi)。最后,對(duì)室內(nèi)、室外拍攝的兩個(gè)視頻做實(shí)驗(yàn)進(jìn)行驗(yàn)證,實(shí)驗(yàn)表明該方法在較復(fù)雜環(huán)境下,也具有較好的目標(biāo)檢測(cè)能力。
關(guān)鍵詞:貝葉斯;目標(biāo)分割;
中圖分類(lèi)號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)04-0866-04
在視頻流中檢測(cè)和分割前景目標(biāo)是后續(xù)處理如目標(biāo)分類(lèi)、目標(biāo)跟蹤和行為理解的基礎(chǔ)。人腦智能所謂的前景通常是自已感興趣的目標(biāo),其他場(chǎng)景成分一概歸入背景。固定的攝像機(jī),分割前景常用的方法有幀差法、背景減除法等,這些方法假設(shè)背景都是由靜止的物體(其顏色或強(qiáng)度緩慢變化)構(gòu)成。然而,當(dāng)背景中含有目標(biāo)物體的陰影如車(chē)影,運(yùn)動(dòng)物體如晃動(dòng)的樹(shù)枝,水波以及光照變化給前景目標(biāo)的正確檢測(cè)和分割帶來(lái)挑挑戰(zhàn)。當(dāng)背景處于或場(chǎng)景緩慢變化時(shí),單高斯就能較好的描述背景像素的噪聲。對(duì)于周期運(yùn)動(dòng)的背景如搖動(dòng)的樹(shù)葉,像素在葉子和葉子后面的地面兩種顏色為均值的分布中變化。像素呈現(xiàn)雙峰狀態(tài)?;诒尘爸锌赡苡兄芷谛詣?dòng)用的物體,近來(lái),人們又提出了采用高斯混合模型(多個(gè)高斯的線(xiàn)性組合)來(lái)描述每個(gè)背景像素。高斯的權(quán)重、均值,方差迭代更新以適應(yīng)環(huán)境的變化。但是,這些方法不能處理光線(xiàn)的緩慢的變化和突變。如從早到晚的光線(xiàn)變化和開(kāi)關(guān)燈的全局背景光線(xiàn)的突變。此外,存在前景目標(biāo)與背景的相互轉(zhuǎn)換的情況如移動(dòng)背景物體而產(chǎn)生的背景局部變化(如移動(dòng)凳子)及開(kāi)車(chē)停在停車(chē)位,車(chē)成為了背景物體。在某些情況下,背景像素可能有多種狀態(tài),因此,對(duì)于復(fù)雜的場(chǎng)景,背景的不同部分應(yīng)用不同的特征來(lái)描述。
本文中采用基于貝葉斯框架目標(biāo)檢測(cè)方法。首先求相鄰兩幀之差,通過(guò)自適應(yīng)閾值把幀差圖二值化為變化部分和靜止部分。每個(gè)像素維護(hù)兩個(gè)表分別對(duì)應(yīng)靜止和運(yùn)運(yùn)兩種狀態(tài),表中表項(xiàng)記錄像素最近最重要的概率信息,檢索這些概率代入貝葉斯公式,求出當(dāng)前幀像素點(diǎn)的最大后驗(yàn)概率,根據(jù)貝葉斯分類(lèi)原則,對(duì)當(dāng)前幀的像素進(jìn)行分類(lèi)。
1 貝葉斯分類(lèi)
假設(shè)[vt]是序列圖像中t時(shí)刻, [s=x,y]位置,像素的特征向量。由貝葉斯規(guī)則,[vt]的后驗(yàn)概率是
[PC|vt,s=Pvt|C,sPC|sPvt|s] (1)
式中的分母
[Pvt|s=Pvt|C,sPC|s] (2)
其中[C]為前景或背景,這是兩類(lèi)判別問(wèn)題,由貝葉斯決策論,比較后驗(yàn)概率[Pb|vt,s]和[Pf|vt,s]的大小,如果滿(mǎn)足
[Pb|vt,s>Pf|vt,s] (3)
則把[vt]分類(lèi)為背景。將式(1)、(2)代入(3)中得
[2Pvt|b,sPb|s>Pvt|s] (4)
這個(gè)公式說(shuō)明,我們只要知道了當(dāng)前像素的三個(gè)概率:[Pb|s],[Pvt|b,s],[Pvt|s]就可以判定像素的類(lèi)別。
2 特征統(tǒng)計(jì)表示
背景通常被認(rèn)為是沒(méi)有出現(xiàn)感興趣目標(biāo)的場(chǎng)景,由無(wú)生命的物體組成,靜止在原地不動(dòng),背景像素的狀態(tài)穩(wěn)定。而感興趣目標(biāo)經(jīng)常在場(chǎng)景中移動(dòng)。因此,所選取表達(dá)背景的特征,在像素s,特征向量會(huì)集中在一個(gè)特征直方圖很少量直方塊內(nèi)。而前景的特征向量會(huì)分布在較寬的范圍。這種意味著,選擇好的特征,可以覆蓋大部的特征向量(背景在s處的像素,在時(shí)間域上的直方圖,少量的柱塊,就能反映大部分的像素變化),比例為[M],如[M1]=90%,[M2]=10%。設(shè)[Pvt|b,s,i=1,…,N1],是[Pvt|b,s]的降序排列的前[N1]個(gè)概率值。[N1]是經(jīng)驗(yàn)值,穩(wěn)定的背景特征相對(duì)集中,[N1]取較小值,而對(duì)于變化較大的背景,取稍大的值。
[i=1N1Pvit|f,s>M1], [i=1N1Pvit|f,s 每個(gè)像素,在t時(shí)刻都維護(hù)著一個(gè)統(tǒng)計(jì)表[Ss,t,ivt],記錄[N2]([N2>N1])個(gè)最重要的值的概率信息。表中的每個(gè)表項(xiàng),由三項(xiàng)組成,這三項(xiàng)對(duì)就于(4)式中的三個(gè)概率。 [Ss,t,ivt]= 此表由特征直方圖的最重要的部分構(gòu)成,表中的元素以[pt,iv]降序排列。同時(shí)[ps,tb=Pb|s]要據(jù)場(chǎng)景的變化,迭代更新。表中的前[N1]個(gè)元素足以覆蓋背景特征向量絕大部分。所以在表的前[N1]個(gè)元素中有,[pt,iv≈pt,ivb]。 3 特征選擇 靜態(tài)背景的像素,采用顏色的三個(gè)分量(r, g, b)做為特征向量,[vt=ct=[rt,gt,bt]]。對(duì)于運(yùn)動(dòng)的背景物體,雖然像素的顏色變化很大,但相鄰兩幀間運(yùn)動(dòng)物體上的顏色發(fā)生相似的變化。據(jù)此,采用前后幀兩組顏色分量做為特征向量,[vt=cct=[rt-1,gt-1,bt-1,rt,gt,bt]]。為了表達(dá)背景中的像素具有靜止和運(yùn)動(dòng)兩種狀態(tài),每個(gè)像素維護(hù)兩個(gè)記錄表[Ss,t,ic]和[Ss,t,icc]。 4 算法描述 4.1 變化檢測(cè) 前后兩幀求差和背景減除得到兩副幀差圖[FDjs,t=Fjs,t-Fjs,t-1]和[BDjs,t=Fjs,t-Bjs,t],其中[j=r,g,b],[Bjs,t]為參考背景圖。分別對(duì)[FDjs,t]和[BDjs,t]求灰度直方圖,直方圖求區(qū)間[255-i,255]上的方差[δ2i],其中[i=1,…,255]。 [T=maxδ2i] 。對(duì)[FDj]及[BDj]二值化,圖像靜態(tài)區(qū)域置0,變化區(qū)域設(shè)置1。 [T]取最大方差,考慮的是只有當(dāng)像素灰度變化很大時(shí),才把像素分為變化部分,提高了靜態(tài)背景的搞噪聲能力。 4.2 細(xì)分類(lèi) 二值圖 4.3 聯(lián)合時(shí)空域信息的分割 通過(guò)像素的鄰域約束關(guān)系可以減少目標(biāo)的破碎或孔洞的情況,提高分割的質(zhì)量。為了進(jìn)一步剔除被錯(cuò)誤檢測(cè)為前景的背景像素和填充漏檢的前就像素,我們聯(lián)合像素時(shí)空信息來(lái)對(duì)目標(biāo)二值化模板進(jìn)行處理。對(duì)于第t幀,由前面方法檢測(cè)的目標(biāo)區(qū)域,統(tǒng)計(jì)當(dāng)前二值圖像目標(biāo)外接矩形框內(nèi)各像素在前面[L]幀中屬于前景點(diǎn)的情況,計(jì)算像素的累計(jì)值。令[ps,t]表示當(dāng)前幀中像素[s]基于時(shí)域特征屬于前景的概率: [pus,t=1Li=t-L-1tFtds,t] (10) [pus,t]反映了各像素在時(shí)間軸上的相關(guān)性,即如果一個(gè)像素在序列圖像前若干幀中的對(duì)應(yīng)像素屬于前景,則該像素在當(dāng)前幀中屬于前景的可能性會(huì)比較大,相反,該像素屬于前景的可能性就小。 考慮第[t]幀二值圖像中像素[s]的[3×3]鄰域,如果一個(gè)像素鄰域內(nèi)有若干個(gè)像素屬于前景,則該像素屬于前景的可能性會(huì)比較大,反之,屬于前景的可能性就小。 [pvs,t=19k=-11j=-11Ftdx+k,y+j,t] (11) 令[pmaxs,t=maxpus,t,pvs,t],當(dāng)[pmaxs,t]大于預(yù)定義的閥值[Tp]時(shí),表示像素屬于前景。 4.4 模型更新 4.4.1 漸變時(shí)表更新 表的更新采用迭代等式同時(shí)進(jìn)行。 其中[Ms,tb]為最終分割出來(lái)二值圖像在[s=(x,y)]處的值。當(dāng)[vt]與[Ss,t,ivt]的[vit]最匹配時(shí),[Ms,t,iv=1],[Ms,t,jv=0,j∈1,…,N2,j≠i],由上式可以看出當(dāng)?shù)仁接疫叺钠ヅ漤?xiàng)[Ms,tb],[Ms,t,iv],[Ms,tb∧Ms,t,iv]為1時(shí),等式左邊的[ps,t+1b],[ps,t+1,ivb],[ps,t+1,ivb]分別略有增大,否則,減少。[α]決定背景的更新速度,[α]越小,越穩(wěn)定,越大,越來(lái)越能適應(yīng)環(huán)境的變化,但會(huì)對(duì)噪聲敏感。當(dāng)在[Ss,t,ivt]中找不到匹配項(xiàng)時(shí),令[Ss,t,ivt]的第[N2]項(xiàng)[ps,t+1,N2v=α],[ps,t+1,N2vb=α],[vN2t+1=vt]。表項(xiàng)更表完后,要對(duì)表項(xiàng)以[ps,t+1v]降序排序,保證最常出現(xiàn)的特征排在前面。 4.4.2 突變時(shí)表更新 背景穩(wěn)定時(shí)由(5)式,兩邊乘[Pf|s]得 [Pf|si=1N1Pvit|f,s 由此可以得出,當(dāng)由于背景突變時(shí),存在關(guān)系式 [Pf|si=1N1Pvit|f,s>T] (14) 將式(3)代入式(14)中,變換得 [i=1N1ps,t,iv-ps,tbi=1N1ps,t,ivb>T] (15) 此式為檢測(cè)到背景突變的判斷標(biāo)準(zhǔn),當(dāng)檢測(cè)到背景像素有突變時(shí),每個(gè)像素維護(hù)的表以下方式更新 4.4.3背景更新 根據(jù)像素s是否是變化點(diǎn),采用不同的更新方式如下: 5 實(shí)驗(yàn)結(jié)果 拍攝了兩個(gè)視頻:視頻1:一個(gè)人在室內(nèi)來(lái)回走動(dòng),室內(nèi)光線(xiàn)強(qiáng)度發(fā)生變化。 視頻2是戶(hù)外的以晃動(dòng)的樹(shù)為背景,兩個(gè)人在樹(shù)前來(lái)回走動(dòng),稍后,其中一個(gè)人停在原地不動(dòng),另外一個(gè)人,繼續(xù)走動(dòng)。 從以上視頻處理的結(jié)果,可以看出本文中提出的算法,對(duì)樹(shù)木擺動(dòng),光線(xiàn)變化,以及運(yùn)動(dòng)目標(biāo)轉(zhuǎn)變?yōu)楸尘暗拳h(huán)境具有較好的適應(yīng)能力。 6 結(jié)束語(yǔ) 本文提出了基于貝葉斯框架的目標(biāo)檢測(cè)方法。首先求相鄰兩幀之差,通過(guò)自適應(yīng)閾值把幀差圖二值化為變化部分和靜止部分。每個(gè)像素維護(hù)兩個(gè)表分別對(duì)應(yīng)靜止和運(yùn)運(yùn)兩種狀態(tài),表中表項(xiàng)記錄像素最近最重要的概率信息,檢索這些概率代入貝葉斯公式,求出當(dāng)前幀像素點(diǎn)的最大后驗(yàn)概率,根據(jù)貝葉斯分類(lèi)原則,對(duì)當(dāng)前幀的像素進(jìn)行分類(lèi)。最后,對(duì)室內(nèi)、室外拍攝的兩個(gè)視頻做實(shí)驗(yàn)進(jìn)行驗(yàn)證,實(shí)驗(yàn)表明該方法在較復(fù)雜環(huán)境下,也具有較好的目標(biāo)檢測(cè)能力。 參考文獻(xiàn): [1] Wren C, Azarbaygaui A, Darrell T, et al. Pfinder: Real-time tracking of the human body[J]. IEEE Trans. Pattern Analysis and Machine Intelligence, 1997,19(7):780-785. [2] Rosin P. Thresholding for change detection[J]. In Proceeding of IEEE Int’t Conf. on Computer Vision, 1998:274-279. [3] 葛慶國(guó).基于自適應(yīng)背景更新車(chē)輛檢測(cè)算法[J].電子測(cè)量技術(shù),2004,27(3):17-18. [4] Stauffer C, Grimson W E L. Adaptive background mixture models for real-time tracking[J].In Proceedings.1999 IEEE Computer Society Conference on Computer Vision and Pattern Recongition. IEEE Comput. Soc.,1999. [5] Christopher M. Bishop. Pattern Recognition and Machine Learning[M].Springer Science+Business Media, LLC,2006.