王 軍, 李云偉, 王愷睿
(中國礦業(yè)大學 信息與控制工程學院, 江蘇 徐州 221116)
弱小運動目標在圖像中一般僅占幾百甚至幾十個像素,檢測難度很大[1-3]?,F(xiàn)有的目標檢測算法,例如LOBSTER[4]、混合高斯模型(GMM)[5]、幀間差分法[6]、背景差分算法[7]等,都難以實現(xiàn)弱小運動目標的準確、高效檢測?;旌细咚鼓P驮谟糜谶\動目標檢測時,能夠動態(tài)更新背景模型參數(shù),具有較強的適應性和目標檢測能力,實時性也比較好。但是,它忽略了目標與背景之間的相似程度,僅用固定的閾值來判別目標和背景。當目標與背景相似程度高時,檢測準確率較低。
針對上述問題,本文提出一種基于SVD的改進混合高斯模型弱小運動目標檢測算法,根據(jù)目標與背景之間的相似程度,動態(tài)調(diào)整GMM的判別閾值,在保證實時性的基礎(chǔ)上提高了檢測準確度,能夠準確且高效地對弱小運動目標進行檢測。
(1)
由于無法判斷目標出現(xiàn)的時間和方位,因此圖像中某個像素屬于前景或背景的概率相等,即p(FG)=p(BG),且前景像素概率分布服從均勻分布,即
基于上述假設(shè),可知某像素屬于背景的判斷條件為
(2)
(3)
式中,μm為第m個高斯模型的均值,ωm為其權(quán)重,σm為其標準差,η為高斯概率密度函數(shù)。
(4)
(5)
(6)
(7)
一個新的樣本是屬于前景(目標)還是背景,取決于判別閾值3σ。如果樣本與GMM中任意一個高斯模型的馬氏距離小于3σ,則該樣本被判定為背景,否則該樣本被判定為目標,即:
(8)
即便σ每幀均會保持更新[8],但是在圖像中,對于背景固定的區(qū)域,σ基本上維持不變。當目標與背景相似程度很高時,如果仍然將3σ當作判別閾值,很容易出現(xiàn)目標檢測失敗的情況。所以,應該根據(jù)目標與背景的相似程度,適當調(diào)整判別閾值。
為了實現(xiàn)判別閾值根據(jù)目標與背景的相似程度進行動態(tài)調(diào)整,需要有一個合適的量來衡量目標與背景的相似程度。實際場景下,光照呈現(xiàn)出不均勻分布狀態(tài),在不同位置,目標的成像在RGB等顏色空間里各通道占比也會存在差異[9-11]。所以,用于衡量相似程度的量,最好能夠反映物體顏色特點,且受到光照影響的程度又很小。
根據(jù)Lambert光照模型可知,圖片中某一像素點的值I(x,y)可以分解為反射成分及其對應的照明成分,公式表述如下:
I(x,y)=R(x,y)L(x,y)
(9)
式中L(x,y)表示光照成分,R(x,y)表示對應的反射成分。L(x,y)是照射方向與物體表面法線方向所成夾角φ的函數(shù),其函數(shù)關(guān)系如下:
(10)
其中ca表示環(huán)境光強度,cp表示光源強度,t表示半影區(qū)域強度,t的大小由光源以及場景幾何關(guān)系決定。用B1、B2和B3表示圖像中同一區(qū)域在不同光照條件下的圖像塊。由于上述圖像塊都屬于同一區(qū)域,所以,這3個圖像塊的R(x,y)值相同。根據(jù)公式(10),能夠得到:
B2=K2·B1
(11)
(12)
B3=K3·B1
(13)
(14)
在局部小區(qū)域內(nèi),采用正交分解的方法可以對光照強度對結(jié)構(gòu)性特征的影響予以有效分解[12]。在本文中,用奇異值分解(SVD)實現(xiàn)正交分解,將大小為N×N的圖像塊B進行奇異值分解,B中每個像素點的值是:
B(x,y)=USVT
(15)
U和V均為正交矩陣,它們的列向量組成了B的正交基底。矩陣S是由奇異值(s1,…,sN)按從大到小的順序排列而成的對角矩陣,奇異值的大小反映了對應正交基底中的列向量對圖像塊B的貢獻程度。
N個奇異值中,數(shù)值最大的奇異值代表光照強度,而其他奇異值則代表空間像素之間的相對位置關(guān)系。由于最大的奇異值代表光照強度,通過將其他奇異值和最大奇異值求比值的方式能夠得到單位亮度水平特征值,即:
(16)
對圖像塊B1、B2、B3分別進行奇異值分解,得:Bk=UkSkVk,由式(15)、式(16)可得:
S2=K2S1
(17)
S3=K3S1
(18)
將式(17)、式(18)代入式(16)得:
(19)
(20)
根據(jù)上述推導可知:同一區(qū)域的3個圖像塊在不同的光照條件下經(jīng)SVD后求解出的單位水平特征值相同,不受光照條件的影響。因此可以分別計算目標和背景的單位亮度水平特征值fi后組成光照不變特征向量f,通過計算兩者光照不變特征向量f之間的距離,就能評估它們的相似程度。
在本文分析中,考慮到奇異值差異較大,故以馬氏距離來對特征向量相似性進行衡量[13-15]。馬氏距離計算公式如下:
(21)
至此,可以根據(jù)目標與背景的光照不變特征向量f之間的馬氏距離d來動態(tài)調(diào)整GMM的判別閾值。根據(jù)d的值來動態(tài)調(diào)整GMM的判別閾值的方法有很多,在本文中,采用一個簡單分段函數(shù),根據(jù)d的值來動態(tài)選取判別閾值σ的倍數(shù)k,如式(22)所示。
(22)
當目標與背景過于接近時(d≤2),將判別閾值降低為傳統(tǒng)GMM的一半(傳統(tǒng)GMM為3σ)。當目標與背景的相似程度很低時(d>10),將判別閾值提高到傳統(tǒng)GMM的1.5倍;其余情況根據(jù)目標與背景的相似程度動態(tài)調(diào)整判別閾值。之所以這樣選擇,是為了將動態(tài)調(diào)整的判別閾值控制在合理的范圍內(nèi),防止判別閾值過高或過低導致目標檢測算法失效的情況出現(xiàn)。
為驗證算法的有效性,在室內(nèi)環(huán)境下采集多段飛行中的羽毛球視頻用于實驗對比分析。之所以選擇室內(nèi)飛行的羽毛球作為實驗對象,是因為羽毛球符合弱小運動目標的特征,而且室內(nèi)既有與羽毛球相似程度很高的墻體等物體,也有與羽毛球差異很大的其他物體。
圖1為視頻中的其中一幀,紅色方框內(nèi)為手動提取的目標區(qū)域(羽毛球),對該區(qū)域內(nèi)每個像素點進行SVD分解,并求出光照不變特征向量f,然后分別求取f的均值和方差作為目標的特征向量fb和協(xié)方差矩陣Σb的對角線值。
圖2反映了整幅圖像中每個像素點的光照不變特征向量f到目標特征向量fb之間的馬氏距離。圖中凸起越高表示目標與背景的相似程度越低,反之則表示目標與背景很接近。根據(jù)公式(22)中目標與背景之間的距離d的取值范圍對整幅圖像進行分割,用紅色表示d小于2的區(qū)域,用黃色表示d值介于2和10之間的區(qū)域,用藍色表示d大于10的區(qū)域,分割結(jié)果詳見圖3。
圖1 視頻中的一幀圖像
圖2 像素點與目標之間特征向量的馬氏距離
圖3 閾值分割結(jié)果
通過對比圖1、圖2和圖3可知,原圖中與羽毛球相似的墻體等區(qū)域在分割圖中都被標注為紅色或者黃色,而與羽毛球差異較大的房門等區(qū)域都被標記為藍色。說明基于SVD分解的特征向量,能夠不受光照強度影響,對物體之間的相似性進行準確衡量。
用傳統(tǒng)的GMM算法和本文提出的方法對飛行中的羽毛球進行了檢測實驗,結(jié)果如圖4和圖5所示。圖4中,羽毛球與背景差異較大,兩種方法都成功的檢測到了目標。在圖5中,羽毛球與背景相似程度很高,傳統(tǒng)的GMM算法完全沒有檢測到羽毛球,而本文提出的方法依然可以準確檢測到羽毛球。
圖4 檢測實驗結(jié)果對比(弱小運動目標與背景差異大)
圖5 檢測實驗結(jié)果對比(弱小運動目標與背景差異小)
弱小目標檢測實驗是在普通PC機上完成的,CPU為Intel core i5 4590,操作系統(tǒng)為64位Windows10,編程環(huán)境為VisualStudio2017。本文提出的算法對于320×240像素彩色圖像進行目標檢測時平均耗時低于20 ms,實時性較好。
本文提出了一種基于SVD的改進混合高斯模型弱小運動目標檢測算法。運用基于奇異值分解的動態(tài)閾值更新方法,根據(jù)目標與背景之間的相似程度動態(tài)調(diào)整GMM的判別閾值,提高特定弱小運動目標檢測的準確度。實驗結(jié)果表明,本文提出的算法對弱小運動目標的檢測能力要優(yōu)于傳統(tǒng)方法,能夠?qū)崿F(xiàn)弱小運動目標的準確、高效檢測。