譚 菊,李正周,李文艷
(1重慶大學(xué)通信工程學(xué)院,重慶 400030;2重慶文理學(xué)院,重慶 610209)
地面背景既有各種地形地貌(山谷、河流、樹林、沙漠等)的差異,又有季節(jié)變化帶來的背景變化(大雪、植被四季變化等),因此檢測(cè)與跟蹤混雜在自然環(huán)境的人造目標(biāo)是一個(gè)極具挑戰(zhàn)的研究方向。
動(dòng)物能從復(fù)雜背景中快速、準(zhǔn)確的識(shí)別與跟蹤目標(biāo)。視覺心理學(xué)研究表明,目標(biāo)檢測(cè)的任務(wù)分兩步完成,即預(yù)注意和注意[1-2]。預(yù)注意主要實(shí)現(xiàn)將圖像中具有特殊涵義的不同區(qū)域區(qū)分開來,分析和標(biāo)注其與注意目標(biāo)相似程度,是減小目標(biāo)檢測(cè)區(qū)域、保證目標(biāo)檢測(cè)方法具有低虛警概率和高探測(cè)概率的有效手段,也是實(shí)現(xiàn)目標(biāo)識(shí)別與跟蹤的前提。
Itti模型是目前代表性的視覺注意計(jì)算模型[3-5]。該注意模型直接建立在初級(jí)階段提取的局部特征的基礎(chǔ)上,是基于空間區(qū)域的注意。它通常只考慮了局部幾何或亮度特征,而忽略了知覺組織規(guī)律體現(xiàn)在分割合理性上的主觀尺度,與生物視覺能夠以目標(biāo)為單位進(jìn)行檢測(cè)和掃視不相符合[6-8]。
圖像紋理是指圖像的局部灰度起伏,在一定空間范圍內(nèi)按某種規(guī)律重復(fù)出現(xiàn)的局部模式和排列規(guī)則,反映宏觀意義上灰度變化的規(guī)律。因此提取區(qū)域紋理和融合相似紋理區(qū)域是突破局部特征限制,實(shí)現(xiàn)知覺組織過程的有效手段之一[9-10]。文中在Itti模型的基礎(chǔ)上,采用灰度共生矩陣提取紋理特征,融入自頂至底的紋理粗糙度感知過程,提出一種基于視覺紋理粗糙度感知的目標(biāo)檢測(cè)方法。
圖1為文中在Itti模型的基礎(chǔ)上提出的基于紋理特征的顯著性感知模型,主要包括紋理、強(qiáng)度和方向三個(gè)特征計(jì)算模塊和非線性多特征融合函數(shù)。該模型首先提取圖像的強(qiáng)度和方向等初級(jí)視覺特征,并通過Center-Surround算子計(jì)算各種特征在不同尺度下的視覺反差[11],得到各自特征的特征圖,同時(shí)提取圖像景物的紋理特征圖,最后把不同特征圖通過非線性函數(shù)進(jìn)行融合形成顯著圖,從而得到反應(yīng)視覺顯著信息的注意焦點(diǎn)。由于方向、強(qiáng)度多通道多尺度計(jì)算過程與Itti模型一致,文中不再贅述。下面對(duì)模型中的紋理感知和非線性特征融合進(jìn)行分析。
圖1 基于紋理特征的顯著性感知模型
設(shè)強(qiáng)度特征圖、方向特征圖和紋理特征圖分別為Sq(s)、Sd(s)和St(s),空間興趣圖S(s)為上述特征的線性或非線性組合,即:
式中:s表示_特征顯著區(qū)域,S q(s)、S d(s)和S t(s)均需規(guī)范到 0,1_區(qū)間內(nèi),α、β和λ分別為強(qiáng)度特征圖、方向特征圖和紋理特征圖的權(quán)重系數(shù),并滿足α+β+λ=1。
自然景物的紋理特征較人造物體的紋理明顯,它的粗糙度等紋理特征往往較人造物體強(qiáng)。因此,為了抑制自然背景,突出人造物體,文中采用非線性加權(quán)方式計(jì)算紋理特征區(qū)域的加權(quán)系數(shù)λ,即:
紋理分布是由灰度分布在空間位置上反復(fù)出現(xiàn)而形成的,因而在圖像空間中相隔一定距離的兩像素間會(huì)存在一定的灰度關(guān)系,這種關(guān)系被稱為是圖像中灰度的空間相關(guān)特性。如圖像的灰度級(jí)定為L級(jí),灰度共生矩陣Pδ為L×L矩陣,即:
式中:Pδ(i,j)表述矩陣元素;i、j分別為兩個(gè)像素的灰度;L為圖像的灰度級(jí)數(shù);δ為兩個(gè)像素間的位置關(guān)系,用δ=(Δx,Δy)表示,即兩個(gè)像素在x方向和y方向上的距離分別為 Δx、Δy,不同的 δ決定了兩像素間距離和方向(一般在 0°、45°、90°和135°四個(gè)方向)。
文中用到的紋理特征參數(shù)有對(duì)比度Fcontrast、自相關(guān)系數(shù)、熵和粗糙度,它們的定義為式(4)~式(7)。
式中:n=i-j 。對(duì)比度可以理解為景物的清晰度,即紋理的清晰程度。紋理的溝紋越深,則其對(duì)比度F contrast越大,圖像的視覺效果越清晰。
熵值是景物所具有的信息量。若景物充滿著細(xì)紋理,則Pδ(i,j)的數(shù)值近似相等,則熵值 F entr opy最大;若圖像中分布著較少的紋理,Pδ(i,j)的數(shù)值差別較大,則該圖像的熵值F entropy較小。
根據(jù)以上對(duì)紋理特征的定義可知,主觀上景物紋理越強(qiáng),則對(duì)比度、自相關(guān)系數(shù)、熵和粗糙度取值越大。在沒有先驗(yàn)知識(shí)的情況下,采用平均加權(quán)方式組合四種紋理特征參數(shù)形成紋理特征圖,即:
自然景物的紋理特征較人造物體的紋理明顯,它的St(s)取值較人造物體St(s)的取值大。通過式(1)和式(2)非線性融合形成的空間興趣圖S(s),人造物體S(s)的取值則較自然景物的取值大,更為明顯。
利用文中算法和Itti模型對(duì)以地物為背景的飛機(jī)目標(biāo)圖像進(jìn)行了檢測(cè)對(duì)比試驗(yàn)。圖2為測(cè)試序列圖像數(shù)據(jù)中一幀圖像,有飛機(jī)以及樹木、山坡、草地等自然背景及噪聲,其中飛機(jī)是需注意和跟蹤的目標(biāo)。
圖3為采用Itti模型計(jì)算出的空間顯著圖,顯著程度以灰度亮度不同表示,即區(qū)域顯著性越強(qiáng)則越亮。樹木表現(xiàn)出比飛機(jī)、草地較強(qiáng)的邊緣特征,在空間顯著圖上最為顯著,飛機(jī)次之,而草地最弱。
圖4為Itti模型的檢測(cè)結(jié)果。它首先檢測(cè)到顯著性最強(qiáng)的樹木,之后檢測(cè)到飛機(jī),最后是草地。需注意的是,由于整個(gè)樹木被分離為多個(gè)顯著度不同的區(qū)域,Itti模型對(duì)樹木進(jìn)行多次視覺焦點(diǎn)轉(zhuǎn)移,多次檢測(cè)到樹木的局部。這是它只考慮了局部幾何或亮度特征,而忽略了知覺組織規(guī)律體現(xiàn)在分割合理性上的主觀尺度的局限所造成的。
圖5為紋理特征圖,樹木的紋理顯著性最強(qiáng),之后為草地,最后是飛機(jī)。同時(shí),由于利用紋理特征相似性準(zhǔn)則,合并相鄰區(qū)域,整個(gè)樹木被區(qū)分為一個(gè)整體。
圖6為文中算法所形成的空間顯著圖,以灰度亮弱不同表示區(qū)域的顯著性差異。通過非線性融合亮度、方向和紋理特征后,飛機(jī)人造目標(biāo)最為顯著。
通過注意空間顯著圖,進(jìn)行精細(xì)特征提出和分辨,提取感興趣的目標(biāo),如圖7所示。文中提出的融入紋理感知的目標(biāo)檢測(cè)方法能更為準(zhǔn)確的排除干擾,檢測(cè)到感興趣的人造目標(biāo)。
紋理感知是生物視覺系統(tǒng)的重要功能,人造目標(biāo)與背景景物存在的紋理差異是區(qū)別兩者的顯著特征之一。文中在Itti模型的基礎(chǔ)上融入自頂至底的紋理粗糙度感知過程,提出一種基于視覺紋理粗糙度感知的目標(biāo)檢測(cè)方法。理論分析和實(shí)驗(yàn)結(jié)果表明,該方法能快速、準(zhǔn)確地從背景中發(fā)現(xiàn)人造目標(biāo),減少目標(biāo)的截獲時(shí)間,提高目標(biāo)檢測(cè)性能。同時(shí),該模型融入了紋理粗糙度和相似性等特征來組織目標(biāo),其效果更接近人的主觀感知。
[1] 張鵬,王潤生.基于視點(diǎn)轉(zhuǎn)移和視區(qū)追蹤的圖像顯著區(qū)域檢測(cè)[J].軟件學(xué)報(bào),2004,15(6):891-898.
[2] 羅四維.視覺感知系統(tǒng)信息處理理論[M].北京:電子工業(yè)出版社,2006.
[3] L Itti,C Koch.Computational modeling of visual attention[J].Nature Reviews Neuroscience,2001,2(3):194-203.
[4] Laurent Itti.Models of bottom-up and up-bottom visual attention[D].California Institute of Technology,2000.
[5] L Itti,C Koch.Feature combination strategies for salience-based attention system[J].Journal of Electronic Imaging,2001,10(1):161-169.
[6] 韓世輝.視覺信息加工中的整體優(yōu)先性[J].心理學(xué)報(bào),2000,32(3):337-347.
[7] 陳鋒,韓世輝,朱瀅.視知覺組織及其神經(jīng)機(jī)制[J].心理科學(xué),2003,26(2):312-314.
[8] 楊文璐,張麗清,麻力波.內(nèi)容和運(yùn)動(dòng)方向感知計(jì)算模型[J].中國科學(xué),2008,38(4):386-397.
[9] Chaudhuri B B,Sarkar N.Texture segmentation using fractal dimension[J].IEEE Transactions on Pattern A-nalysis and Machine Intelligence,1995,17(1):72-77.
[10] Clausi D A,Bing Yue.Texture segmentation comparison using grey level co-occurrence probabilities and Markov random fields[C]//Proceedings of the17th International Conference on Pattern Recognition,2004,Vol.1:584-587.
[11] 李由,張恒,雷志輝.基于生物視覺center-surround機(jī)制的光團(tuán)目標(biāo)檢測(cè)與跟蹤[J].應(yīng)用光學(xué),2008,29(2):283-288.