国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于視覺(jué)仿生的圖像目標(biāo)分類算法

2014-09-10 01:18:34柳培忠王守覺(jué)
關(guān)鍵詞:亮度分類人類

柳培忠,王守覺(jué)

(1.華僑大學(xué) 工學(xué)院,福建 泉州362000;2.中國(guó)科學(xué)院 蘇州納米技術(shù)與納米仿生研究所,江蘇 蘇州215123)

0 引 言

復(fù)雜圖像的目標(biāo)分類是計(jì)算機(jī)視覺(jué)領(lǐng)域的核心研究熱點(diǎn)之一。而目標(biāo)分類屬于計(jì)算機(jī)學(xué)科領(lǐng)域的模式識(shí)別范疇,更應(yīng)理解為人類對(duì)圖像的視覺(jué)內(nèi)容認(rèn)知[1]。傳統(tǒng)的計(jì)算機(jī)目標(biāo)分類方法可以概括的分為以下四類:

(1)基于統(tǒng)計(jì)的識(shí)別算法

依據(jù)圖像中目標(biāo)特性的統(tǒng)計(jì)數(shù)據(jù),通過(guò)大量數(shù)據(jù)的訓(xùn)練和基于空間距離的度量特征匹配技術(shù)進(jìn)行分類。如二維不變矩[2]等,這類圖像的目標(biāo)分類算法目標(biāo)和周圍背景變化不大的效果顯著,對(duì)目標(biāo)解決姿態(tài)變化或目標(biāo)部分被遮擋等問(wèn)題效果不佳。

(2)知識(shí)理解的目標(biāo)分類算法

將專家系統(tǒng)運(yùn)用到圖像的目標(biāo)分類中,專家系統(tǒng)是以邏輯推理為基礎(chǔ),如馬爾科夫模型等描述目標(biāo)的特征量[3]。由于存在可利用的知識(shí)源的理解和最后的驗(yàn)證很困難,因而難以在復(fù)雜變化的圖像中獲得很好的效果。

(3)模型化的自動(dòng)分類算法

采取一種描述圖像空間各種復(fù)雜變化特性的研究方法。如空間投影理論[4]等,該類算法要建立非常復(fù)雜的樣本空間模型。

(4)人工神經(jīng)網(wǎng)絡(luò)的目標(biāo)分類算法

人工神經(jīng)網(wǎng)絡(luò)[5-7]以結(jié)構(gòu)簡(jiǎn)單的神經(jīng)元連為基礎(chǔ),通過(guò)大量的神經(jīng)元構(gòu)成復(fù)雜的網(wǎng)絡(luò)系統(tǒng),該系統(tǒng)提供更強(qiáng)更豐富的處理信息能力。實(shí)現(xiàn)很好的目標(biāo)識(shí)別效果。

人類視覺(jué)仿生的圖像目標(biāo)分類算法主要研究視覺(jué)感知器官對(duì)圖像的理解和分析方法,研究人類視覺(jué)系統(tǒng)對(duì)圖像信息的檢測(cè)、提取、整合等過(guò)程,實(shí)現(xiàn)復(fù)雜圖像的目標(biāo)分類[8],因而其原理和方法與上述的目標(biāo)分類算法有著本質(zhì)區(qū)別。

1 人類大腦的圖像認(rèn)知

隨著人類對(duì)大腦思維模式的研究不斷深入,其圖像的視覺(jué)認(rèn)知及在人類大腦的反映被清晰地描繪出來(lái)[8],基于視覺(jué)仿生的圖像理解模型構(gòu)建是通過(guò)以下相關(guān)理論來(lái)獲取數(shù)學(xué)模型:

1.1 亮度適應(yīng)性原理

依據(jù)Weber-Fechner定律,人眼對(duì)圖像視覺(jué)的亮度差別感覺(jué)取決于相對(duì)圖像亮度變化[9]。即人眼的主觀感覺(jué)亮度與實(shí)際亮度之間的關(guān)系不是線性關(guān)系,而是一個(gè)積分關(guān)系如下所示

式中:I——圖像的光分布,γ——相對(duì)光強(qiáng)度效率函數(shù),亮度 (光強(qiáng)度)與環(huán)境有關(guān)。

生物學(xué)研究表明,人眼對(duì)圖像內(nèi)容的主觀亮度是圖像內(nèi)容進(jìn)入眼睛的光強(qiáng)度的對(duì)數(shù)函數(shù)。圖1為實(shí)際圖像所含的光強(qiáng)度對(duì)數(shù)與人眼的主觀亮度的關(guān)系曲線關(guān)系。

圖1 光強(qiáng)對(duì)數(shù)與主觀亮度關(guān)系曲線

1.2 視皮層生理及仿生理解

人視覺(jué)系統(tǒng)從復(fù)雜的圖像背景中快速辨認(rèn)出要分類的目標(biāo)信息是一項(xiàng)熱門的研究問(wèn)題,在人眼的視皮層中,有一種與處理大范圍復(fù)雜圖像特征有關(guān)的功能結(jié)構(gòu)[8],如圖2所示。

(1)人類視覺(jué)處理系統(tǒng)對(duì)圖像視覺(jué)信息認(rèn)知存在兩種狀態(tài):靜態(tài)和動(dòng)態(tài)。

1)對(duì)圖像中對(duì)象的認(rèn)識(shí)通過(guò)靜態(tài)信息處理通路完成;

2)對(duì)圖像對(duì)象中的空間定位則由動(dòng)態(tài)信息處理通路實(shí)現(xiàn)處理。

(2)無(wú)論靜態(tài)還是動(dòng)態(tài)的視覺(jué)信息,人類視覺(jué)處理系統(tǒng)采取層次化的結(jié)構(gòu)進(jìn)行處理。層次化的各層次之間,既有前饋連接聯(lián)系,又有反饋連接聯(lián)系。

(3)人類視覺(jué)處理系統(tǒng)對(duì)圖像視覺(jué)信息的獲取不是均勻處理,而是根據(jù)視覺(jué)場(chǎng)景的內(nèi)容及具體的視覺(jué)任務(wù),人類視覺(jué)處理系統(tǒng)會(huì)選擇部分信息 (如顏色、亮度、形狀、運(yùn)動(dòng)狀態(tài)等視覺(jué)信息)進(jìn)行重點(diǎn)處理。

圖2 視皮層結(jié)構(gòu)

基于上述人類視覺(jué)系統(tǒng)的功能特性,本文提出了一種模擬人類視覺(jué)處理方法的圖像目標(biāo)分類算法。

2 圖像目標(biāo)分類算法

(1)基于亮度適應(yīng)性原理,首先對(duì)圖像進(jìn)行整體亮度自適應(yīng)調(diào)整[9],使得調(diào)整后圖像的亮度信息符合人類視覺(jué)處理系統(tǒng)對(duì)圖像信息的理解;

(2)依據(jù)人類視覺(jué)系統(tǒng)視皮層的層次圖像理解機(jī)制,視皮層中靜態(tài)和動(dòng)態(tài)視覺(jué)信息關(guān)注的圖像內(nèi)容不同,構(gòu)造一個(gè)基于層次化的圖像目標(biāo)分類方法;

(3)依據(jù)人類特有的形象思維原理實(shí)現(xiàn)對(duì)目標(biāo)信息的特征分類。

2.1 圖像整體亮度自適應(yīng)調(diào)整

依據(jù)上述人類對(duì)圖像的理解機(jī)制,本文的圖像整體亮度變換是對(duì)圖像整體明暗程度進(jìn)行調(diào)整,通過(guò)對(duì)圖像中暗區(qū)域的像素點(diǎn)進(jìn)行局部的增強(qiáng)和降低,以適應(yīng)人類視覺(jué)系統(tǒng)對(duì)于圖像光強(qiáng)的需要,其調(diào)整如下描述:

(1)基于視覺(jué)仿生的圖像整體亮度獲取

實(shí)驗(yàn)表明,在一定的范圍內(nèi),數(shù)字圖像亮度的LOG值與人類的視覺(jué)響應(yīng)近似成線性關(guān)系。人類對(duì)圖像的視覺(jué)仿生特性通過(guò)用式 (2)的亮度值變化描述

(2)基于視覺(jué)仿生的圖像非線性亮度變換

為使得圖像中某些區(qū)域亮度過(guò)高的亮度值降下來(lái),本文通過(guò)引入一個(gè)非線性亮度壓縮調(diào)整,使得圖像整體更為適合視覺(jué)特性,如下所示

寶雞市位于陜西省關(guān)中平原西部,東連咸陽(yáng)市,南接漢中市,西北與甘肅省天水市和平?jīng)鍪信?。全市轄區(qū)南北長(zhǎng)約160.6km,東西寬約156.6km,總面積18 172km2,轄三區(qū)九縣。

式中:Is——原圖信息,β——亮度調(diào)整的強(qiáng)度因子,具體值和Im有關(guān),且大于1;I′——視覺(jué)仿生的非線性亮度變換后的圖像。

為了驗(yàn)證本文視覺(jué)仿生調(diào)整算法對(duì)圖像視覺(jué)仿生的適應(yīng)性,本文通過(guò)對(duì)不同類型的圖像目標(biāo)進(jìn)行亮度調(diào)整分析,如圖3和圖4所示,本文算法提出的亮度調(diào)整算法與其它算法比較,通過(guò)實(shí)驗(yàn)分析可見(jiàn),本文算法具有很好的魯棒性,其亮度調(diào)整結(jié)果基本符合人類的視覺(jué)感知,而文獻(xiàn) [9]算法相對(duì)來(lái)說(shuō)并不太符合視覺(jué)感知特性。

圖3 亮度調(diào)整比較 (一)

2.2 圖像目標(biāo)分類方法

人類獲取圖像同類目標(biāo)的流程:依據(jù)人類視覺(jué)原理,本文提出了一種基于仿生原理的圖像同類目標(biāo)方法[11]。如圖5所示,該方法融合了人類視覺(jué)系統(tǒng)中的反饋機(jī)制,包含了人類已經(jīng)認(rèn)知的目標(biāo)數(shù)據(jù)庫(kù)。

基于內(nèi)容的圖像層次化是模仿大腦進(jìn)行目標(biāo)分類的前提;而反饋機(jī)制提取層次化后圖像的目標(biāo)區(qū)域,提高分類的精度。圖像目標(biāo)區(qū)域提取后,下一步目標(biāo)區(qū)的特征與人類記憶的數(shù)據(jù)庫(kù)比較,判斷目標(biāo)區(qū)域是否與人類認(rèn)識(shí)一致。

圖4 亮度調(diào)整比較 (二)

圖5 仿生圖像目標(biāo)分類流程

具體步驟如下:

步驟1 人類視覺(jué)對(duì)亮度的敏感度遠(yuǎn)遠(yuǎn)超過(guò)對(duì)顏色的敏感,在仿生視覺(jué)計(jì)算中,采用HSI空間進(jìn)行對(duì)圖像進(jìn)行空間轉(zhuǎn)化處理,如下所示

其中

步驟2 依據(jù)視皮層的視網(wǎng)膜感受野對(duì)視覺(jué)信息的感受機(jī)理,通過(guò)三維高斯函數(shù)獲得圖像主觀感覺(jué)亮度,如下所示

式中:A1、A2、A3——中央、四周和邊緣的權(quán)值系數(shù),σ1、σ2、σ3——中央、四周和邊緣的參數(shù)。

在處理圖像亮度對(duì)比變化時(shí),該模型符合人類認(rèn)識(shí)圖像內(nèi)容的原理[12],圖像中間信息包含的能量大且區(qū)域集中,需要中間區(qū)域的能量增強(qiáng);中間的四周區(qū)域?qū)儆谳o助作用,包含信息的能量較??;而邊緣包含的信息豐富,能量大,因而可有效地實(shí)現(xiàn)視皮層感受野認(rèn)知的圖像內(nèi)容層次化。

步驟3 在步驟2獲取目標(biāo)區(qū)域后,接著進(jìn)行目標(biāo)區(qū)域的邊界確定,本文采取Sobel算子邊界確定方法,改進(jìn)的Sobel算子對(duì)噪聲具有一定的抑制能力。

(1)為達(dá)到更好的邊緣檢測(cè)效果,本文對(duì)Sobel算子進(jìn)行改進(jìn),確定某個(gè)點(diǎn)X在8個(gè)方向的邊緣方向式子,例如在45°邊緣方向,改進(jìn)后的算子如式 (6)所示,對(duì)某個(gè)點(diǎn)X進(jìn)行計(jì)算相鄰8個(gè)點(diǎn)的亮度值,最大值對(duì)應(yīng)的方向?yàn)樵擖c(diǎn)X的邊緣方向

(2)上述檢測(cè)到的層次邊緣包含噪聲,為了實(shí)現(xiàn)目標(biāo)區(qū)域的準(zhǔn)確劃分層次,本文設(shè)置的閾值θ(θ為經(jīng)驗(yàn)值,依據(jù)圖像大小自動(dòng)調(diào)整),將像素?cái)?shù)目小于θ的點(diǎn)自動(dòng)剔除,用于去除噪聲,然后對(duì)得到的結(jié)果進(jìn)行形態(tài)學(xué)運(yùn)算以得到最優(yōu)的邊緣曲線[13]。

2.3 圖像目標(biāo)的特征分類方法

文獻(xiàn) [10]已經(jīng)對(duì)圖像特征分類方法做了大量的研究工作,圖像目標(biāo)的理解更多體現(xiàn)在形象思維方面,本文按照文獻(xiàn) [10]的圖像特征分類方法對(duì)圖像目標(biāo)的特征提取。

3 實(shí)驗(yàn)分析

3.1 圖像目標(biāo)分類分析

如圖6和圖7所示是本文分析各種算法的目標(biāo)分類結(jié)果,圖像中同類目標(biāo)本文用同一種顏色進(jìn)行表示,不同類的目標(biāo)用不同的顏色區(qū)分。

本文可以看出,相對(duì)于另外3種算法,本文算法的目標(biāo)分析總體上來(lái)說(shuō)比較好,能夠比較準(zhǔn)確地認(rèn)識(shí)出圖像里的同類目標(biāo)。

3.2 分類準(zhǔn)確率分析

本文用COREL標(biāo)準(zhǔn)圖像數(shù)據(jù)庫(kù)作為測(cè)試數(shù)據(jù)源,用本文算法、文獻(xiàn) [14]、文獻(xiàn) [15]和文獻(xiàn) [16]等計(jì)算比較的分類準(zhǔn)確率 (見(jiàn)表1)。計(jì)算方法:統(tǒng)計(jì)能正確識(shí)別圖像中不同類的數(shù)目占圖像庫(kù)的百分比。

圖6 同類目標(biāo)提取比較 (一)

圖7 同類目標(biāo)分類比較 (二)

4 結(jié)束語(yǔ)

圖像的目標(biāo)識(shí)別在眾多領(lǐng)域及其重要,特別是軍工、航天等特殊行業(yè)的應(yīng)用,隨著各種仿生技術(shù)在當(dāng)前的模式識(shí)別應(yīng)用領(lǐng)域的不斷深入,仿生技術(shù)也在不斷成熟和完善,其實(shí)現(xiàn)的原理更符合自然界的規(guī)律,因此探索一種視覺(jué)仿生的圖像目標(biāo)分類算法一直是一項(xiàng)很有意義的工作。

總之本文在分析了當(dāng)前圖像目標(biāo)獲取算法的發(fā)展現(xiàn)狀,提出了視覺(jué)仿生的圖像目標(biāo)分類算法,通過(guò)實(shí)驗(yàn)分析驗(yàn)證算法的優(yōu)越性,但在圖像的語(yǔ)義分析方面還存在眾多不足,以后繼續(xù)研究的方向。

[1]HUANG Shuangping.Study on key technologies of generic visual object recognition [D].Guangzhou:South China University of Technology,2011:10-26 (in Chinese). [黃雙萍.通用視覺(jué)目標(biāo)識(shí)別的關(guān)鍵技術(shù)研究 [D].廣州:華南理工大學(xué),2011.]

[2]XUE Bindang.Fresnel transform based invariant moments extraction and object recognition method [J].Journal of Beijing University of Aeronautics and Astronautics,2012,38 (8):1001-1005 (in Chinese). [薛斌黨.基于菲涅耳變換的不變矩提取及目標(biāo)識(shí)別方法 [J].北京航空航天大學(xué)學(xué)報(bào),2012,38(8):1001-1005.]

[3]LEI Xiaogang.Fast segmentation approach for SAR image based on simple Markov random field [J].Journal of Systems Engineering and Electronics,2010,21 (1):31-36.

[4]Myung J C,Torralba A,Willsky A S.A tree-based context model for object recognition [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2012,34 (2):240-252.

[5]Mutch J.Multiclass object recognition with sparse,localized features [C]//New York:IEEE Computer Society Conference on Computer Vision and Pattern Recognition,2006:11-18.

[6]Bosch.Scene classification using a hybrid generative/discriminative approach [J].IEEE Trans Pattern Analysis and Machine Intelligent,2008,30 (4):712-727.

[7]Kawasaki K.Learning to recognize visual objects with microstimulation in inferior temporal cortex [J].Journal of Neurophysiology,2008,100 (1):197-211.

[8]WEI Longsheng.Research on the computation models of attention mechanism in the visual information processin [D].Wuhan:Huazhong University of Science and Technology,2011:14-81(in Chinese).[魏龍生.視覺(jué)信息處理中注意機(jī)制計(jì)算模型研究 [D].武漢:華中科技大學(xué),2011:14-81.]

[9]CHEN Chen.An adaptive biomimetic image processing method:LDRF algorithm [J].CAAI Transactions on Intelligent Systems,2012,7 (5):404-408 (in Chinese). [諶琛.一種自適應(yīng)的仿生圖像增強(qiáng)方法:LDRF算法 [J].智能系統(tǒng)學(xué)報(bào),2012,7 (5):404-408.]

[10]WANG Shoujue.An image retrieval algorithm based on biomimetic imaginal thinking [J].ACTA Electronica Sinica,2010,38(5):1-4 (in Chinese).[王守覺(jué).基于仿生形象思維方法的圖像檢索算法 [J].電子學(xué)報(bào),2010,38 (5):1-4.]

[11]WANG Shoujue. Analysis and theory of high-dimension spacegeometry for artificial neural networks [J].ACTA Electronica Sinica,2010,38 (5):1-4 (in Chinese). [王守覺(jué).人工神經(jīng)網(wǎng)絡(luò)的多維空間幾何及其理論 [J].電子學(xué)報(bào),2002,28 (5):1-4.]

[12]GAO Qingyi.Target recognition algorithm based on visual perception [J].Journal of Harbin Institute of Technology,2013,45 (1):101-105 (in Chinese).[高慶一.視覺(jué)感知的目標(biāo)識(shí)別算法 [J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2013,45 (1):101-105.]

[13]CAO Jiannong.Review on image segmentation based on entropy [J].PR & AI,2012,25 (6):958-971 (in Chinese).[曹建農(nóng).圖像分割的熵方法綜述 [J].模式識(shí)別與人工智能,2012,25 (6):958-971.]

[14]KUANG Jinjun.Kernel sparse representation classification and multi-scale block rotation-extension based robust image recognition method [J].PR & AI,2012,26 (2):129-135(in Chinese).[匡金駿.基于核稀疏分類與多尺度分塊旋轉(zhuǎn)擴(kuò)展的魯棒圖像識(shí)別 [J].模式識(shí)別與人工智能,2012,26(2):129-135.]

[15]Yang J.Group-sensitive multiple kernel learning for object recognition [J].IEEE Transactions on Image Processing,2012,21 (5):2838-2852.

[16]Koen E A.Cees Snoek.Evaluating color descriptors for object and scene recognition [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2010,32 (9):1582-1596.

猜你喜歡
亮度分類人類
人類能否一覺(jué)到未來(lái)?
分類算一算
人類第一殺手
1100億個(gè)人類的清明
分類討論求坐標(biāo)
亮度調(diào)色多面手
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
亮度一樣嗎?
基于斬波調(diào)制的LED亮度控制
贵州省| 哈密市| 穆棱市| 祁东县| 高密市| 泾源县| 黄浦区| 乐至县| 兰溪市| 西华县| 灵台县| 烟台市| 随州市| 郁南县| 犍为县| 扎囊县| 彝良县| 绥阳县| 防城港市| 会同县| 依兰县| 满城县| 时尚| 宁远县| 七台河市| 司法| 龙州县| 固安县| 菏泽市| 阿克苏市| 兴仁县| 苏尼特右旗| 霍城县| 东源县| 汉沽区| 衢州市| 丹江口市| 会东县| 宁南县| 永仁县| 自治县|