王金洋
基于混合高斯模型的運(yùn)動(dòng)目標(biāo)跟蹤算法
王金洋
王金洋 余紅英 樊永生
中北大學(xué)計(jì)算機(jī)與控制工程學(xué)院
視頻幀序列中實(shí)時(shí)運(yùn)動(dòng)目標(biāo)分割的一般方法是背景差分或者是對(duì)于背景圖與當(dāng)前幀的閾值公差。不同的方法之間的區(qū)別在于對(duì)于背景圖的建模和模型的更新策略。本文討論對(duì)每個(gè)像素進(jìn)行混合高斯模型建模和使用在線近似的方法更新模型。自適應(yīng)混合高斯模型的分布用來評(píng)估決定哪些像素點(diǎn)最有可能來自背景處理過程。每個(gè)像素點(diǎn)根據(jù)最有效代表它的高斯分布是否為背景模型的一部分進(jìn)行分類。本文最后得到一個(gè)穩(wěn)定、實(shí)時(shí)并且對(duì)于輕微變化不敏感和長(zhǎng)時(shí)間的場(chǎng)景變化的跟蹤器,滿足24h×7的基本工業(yè)要求。
過去較低的計(jì)算能力限制了復(fù)雜的、實(shí)時(shí)性的視頻處理應(yīng)用,導(dǎo)致許多機(jī)器視覺系統(tǒng)實(shí)時(shí)性太差難以投入實(shí)用或者對(duì)于實(shí)際的工況過多的限制條件。近年來隨著硬件計(jì)算能力的提升,研發(fā)人員越來越多的考慮采用更加復(fù)雜、健壯的數(shù)學(xué)模型完成流數(shù)據(jù)的實(shí)時(shí)分析。在安防領(lǐng)域,一個(gè)健壯的系統(tǒng)不能過度依賴攝像機(jī)安裝位置,而應(yīng)該對(duì)出現(xiàn)在場(chǎng)景中的目標(biāo)具有自適應(yīng)性并且對(duì)于光照效果不能要求苛刻。它應(yīng)該有能力處理來自于工作區(qū)域、視場(chǎng)目標(biāo)重疊、陰影、光線變化條件下的各種目標(biāo)運(yùn)動(dòng)信息。
一般方法中對(duì)于某個(gè)高斯分布中的像素?cái)?shù)值全部進(jìn)行建模,而本文僅對(duì)作為混合高斯模型的特定像素點(diǎn)進(jìn)行建模?;诨旌细咚狗植贾忻總€(gè)高斯函數(shù)的持續(xù)性和變化性,我們獲取某個(gè)對(duì)于背景模型顏色反應(yīng)最強(qiáng)的分布。不符合背景高斯模型的像素值被劃歸為前景,直至存在某個(gè)分布對(duì)于該像素點(diǎn)具有充分的和持續(xù)性的概率判斷才將其劃歸為背景模型點(diǎn)。
在線混合模型中,我們稱在一定時(shí)間段上的特定像素為一個(gè)像素過程,所以像素過程是對(duì)應(yīng)于一串時(shí)間序列的像素值,例如灰度圖像的梯度和彩色圖像的向量。在任何時(shí)間點(diǎn),t對(duì)應(yīng)于一個(gè)特定的像素點(diǎn){x0,y0},有下式,其中I代表視頻幀序列:
每個(gè)像素點(diǎn)的值代表它自身與其沿光流通路所接觸的第一個(gè)目標(biāo)的一種度量,假如背景和光照是靜態(tài)的則其值是相對(duì)常量。而采樣過程中存在的獨(dú)立的高斯噪音,其密度函數(shù)可以由均值的高斯分布來描述。一般來說對(duì)于背景模型的支持要有大量的數(shù)據(jù),但是不同目標(biāo)的顏色值往往是不同的。針對(duì)每個(gè)像素點(diǎn)的前幾幀數(shù)值{X1,…Xt},我們采用K個(gè)高斯分布進(jìn)行建模,可以得到當(dāng)前像素點(diǎn)的概率值為:
其中,K為高斯分布的數(shù)量,Wi,t為第i個(gè)高斯分布在時(shí)間t的權(quán)重系數(shù)估計(jì)值,Ui,t為第i個(gè)高斯分布在時(shí)刻t的均值,sum(i,t)是第i個(gè)高斯分布在時(shí)刻t的方差,u為高斯概率密度函數(shù):
其中K由計(jì)算機(jī)可用的內(nèi)存量和計(jì)算能力決定,取值范圍3~5。另外由于計(jì)算的原因,協(xié)方差矩陣采用如下的形式:
這樣存在一個(gè)前提是RGB三色具有獨(dú)立的數(shù)值并且具有相同的方差,但是這個(gè)前提在實(shí)際中不一定總存在,這樣就使得我們做一個(gè)相當(dāng)耗費(fèi)CPU的矩陣求反從而喪失了精度。
當(dāng)每個(gè)像素點(diǎn)對(duì)應(yīng)的混合高斯模型參數(shù)變化時(shí),我們想要得知哪個(gè)高斯分布最優(yōu)可能是背景過程產(chǎn)生的,這個(gè)問題轉(zhuǎn)化為尋找一個(gè)可能性最大而且方差最小的高斯分布。當(dāng)一個(gè)新的目標(biāo)出現(xiàn)在視場(chǎng)中時(shí),一般來說它與當(dāng)前的分布是不匹配的,而解決辦法有兩種,其一是建立一個(gè)新的分布,其二是增大現(xiàn)有分布的方差值,并且運(yùn)動(dòng)目標(biāo)的方差值要比背景模型的方差值大,直至運(yùn)動(dòng)目標(biāo)停止。為了對(duì)此過程建模,首先對(duì)高斯分布進(jìn)行編碼,在對(duì)混合高斯模型的參數(shù)進(jìn)行重新近似之后,就很容易將最大可能分布從背景模型分布中分離出來,因?yàn)橹挥衅ヅ涞降臄?shù)值發(fā)生了改變。這樣的對(duì)分布進(jìn)行排序是一種有效的,端部開放的列表,其中最大可能的背景模型分布在頂部,這樣背景模型的近似就可以用下式表達(dá):
其中,T為背景模型中符合匹配規(guī)則的像素點(diǎn)數(shù)目。如果T值選擇的較小,背景模型的高斯分布往往是單峰的,也即一般頂部的分布為最大近似分布;如果T的值選擇的比較大,則算法對(duì)于微小且長(zhǎng)時(shí)間的視場(chǎng)變化會(huì)敏感,例如旗幟的飄動(dòng),水波等等,會(huì)形成背景混合高斯模型的多峰分布。
在一臺(tái)SGI O2配置為R10000的計(jì)算機(jī)上,算法可以處理的幀速為11-13FPS(幀尺寸為160*120),另外幀速與前景中運(yùn)動(dòng)目標(biāo)數(shù)量也有關(guān)系。我們的跟蹤算法系統(tǒng)可以可靠地存儲(chǔ)5路視場(chǎng)信息,而隨著計(jì)算機(jī)性能的提升和并行性技術(shù)的研究,該系統(tǒng)算法可以在大尺寸圖像、采用大量高斯函數(shù)的背景模型條件下進(jìn)一步提升幀速率和精確度。而對(duì)全相關(guān)矩陣的計(jì)算和每個(gè)高斯分布的近似可以提升算法的健壯性和精確度。
10.3969/j.issn.1001-8972.2015.02.031