阮旭良等
摘要針對(duì)基于邊緣檢測(cè)的圖像檢索中邊緣點(diǎn)容易受到噪聲干擾的問(wèn)題,提出一種基于LoG邊緣算子的棉花圖像檢索算法。首先在求取邊緣檢測(cè)前進(jìn)行濾除噪聲處理,然后根據(jù)歐式距離衡量圖像間的相似性。棉花圖像數(shù)據(jù)集的試驗(yàn)結(jié)果表明,算法能夠有效去除邊緣噪聲,提高了圖像檢索的查全率和查準(zhǔn)率,尤其適用于高噪聲環(huán)境下的棉花圖像檢索。
關(guān)鍵詞圖像檢索;LoG算子;邊緣檢測(cè);歐氏距離
中圖分類(lèi)號(hào)S126;TP391文獻(xiàn)標(biāo)識(shí)碼
A文章編號(hào)0517-6611(2014)28-10007-02
Research of Cotton Image Retrieval Algorithm Based on LoG Operator
RUAN Xuliang, XIA Bin, SANG Xiaotian et al(Zhengzhou Cotton & Jute Engineering Technology and Design Research Institute, China COOP, Zhengzhou, Henan 450004)
Abstract For the problem of image edge noise in the cotton image retrieval based on edge detection, a new algorithm using LoG edge operator was proposed. Firstly, the LoG operator was used to filter out noise before edge detection, then the similarity among images were measured according to Euclidean distance. Under the cotton image data sets, experimental results showed that the algorithm can remove edge noise and improve the image retrieval recall and precision effectively, especially for image retrieval of high noise environments.
Key words Image retrieval; LoG operator; Edge detection; Euclidean distance
隨著計(jì)算機(jī)視覺(jué)的飛速發(fā)展,以及數(shù)字圖像的大量應(yīng)用,人們迫切需要一種方法檢索近似圖像,因此,圖像檢索技術(shù)應(yīng)運(yùn)而生。圖像檢索是一個(gè)與計(jì)算機(jī)視覺(jué)、圖像處理、數(shù)據(jù)庫(kù)等學(xué)科緊密聯(lián)系的綜合性研究領(lǐng)域,它是以圖像本身的物理屬性或者描述關(guān)鍵詞在圖像數(shù)據(jù)庫(kù)中尋找與示例圖像相關(guān)或者相似的圖像[1]。在圖像檢索領(lǐng)域中,基于內(nèi)容的圖像檢索 (Content-Based Image Retrieval,CBIR)[2]是根據(jù)圖像的色彩(Color)、形狀(Shape)、紋理(Texture)等物理屬性檢索相似圖像,現(xiàn)已成為圖像檢索的有效方法。
在眾多圖像特征中,形狀是較為顯著的特征之一,而形狀的提取是以邊緣檢測(cè)[3]為前提,因此,邊緣檢測(cè)的結(jié)果直接影響到檢索的效果[4-6]。為了提高基于邊緣檢測(cè)的圖像檢索系統(tǒng)性能,國(guó)內(nèi)外研究人員針對(duì)邊緣檢測(cè)和圖像相似度衡量進(jìn)行了大量研究。王植等提出使用對(duì)灰度梯度的幅值和方向進(jìn)行非極大值抑制,然后采用雙閾值方法從候選邊緣點(diǎn)中檢測(cè)和連接邊緣[7];李牧等提出采用類(lèi)內(nèi)方差最小化和梯度幅度直方圖動(dòng)態(tài)地確定上下閾值的方法,來(lái)提高Canny 算子的動(dòng)態(tài)適應(yīng)性[8];Sarangi等提出采用模糊推理改進(jìn)對(duì)圖像邊緣的檢測(cè),并且結(jié)合Canny 算子檢測(cè)邊緣[9];趙宏中等提出使用Manhanttan距離衡量圖像間的相似性[10]。
在上述研究的基礎(chǔ)上,筆者提出一種基于LoG算子的棉花圖像檢索算法,在降噪處理的基礎(chǔ)上獲取圖像邊緣,根據(jù)歐氏距離衡量圖像間的相似性,并在棉花數(shù)據(jù)集上進(jìn)行了試驗(yàn)驗(yàn)證。
1LoG算子
LoG算子(Laplacian of Gaussian,LoG),也稱作拉普拉斯高斯算法[11-12],它是將拉普拉斯邊緣檢測(cè)結(jié)合高斯濾波形成的[13-16]。算法的特點(diǎn)是圖像先與高斯濾波器g(x,y)進(jìn)行卷積,用于平滑圖像、降低噪聲,同時(shí)濾除孤立的噪聲點(diǎn)和較小的疵點(diǎn),然后采用無(wú)方向性的拉普拉斯算子D2進(jìn)行邊緣檢測(cè)[17-19]。假設(shè)原圖像為f(x,y),通過(guò)卷積和拉普拉斯算子處理,得到輸出圖像h(x,y):
稱為高斯拉普拉斯算子,對(duì)于離散數(shù)字圖像,高斯拉普拉斯算子通常可以用一個(gè)離散的模板近似。通常的高斯拉普拉斯算子是一個(gè)5×5的模板,如圖1所示。
01/801/801/81/211/21/801-7101/81/211/21/801/801/80
圖1高斯拉普拉斯模板
此模板水平和垂直的4個(gè)方向上都設(shè)置為1,對(duì)角的4個(gè)方向上都設(shè)置為1/2,其他8個(gè)方向上都設(shè)置為1/8,這樣就會(huì)造成水平和垂直的4個(gè)方向邊緣檢測(cè)精度高,而其他12個(gè)方向的邊緣檢測(cè)精度低。
2圖像間相似性度量
圖像間的相似性度量[20]是基于內(nèi)容的圖像檢索中的關(guān)鍵環(huán)節(jié),它是在圖像內(nèi)容的基礎(chǔ)上,由其內(nèi)容的相似度而得到圖像相似性的一種度量方法。其中,圖像低層次上的特征主要包括圖像本身的顏色特征、紋理特征、形狀特征以及空間關(guān)系特征,具有相對(duì)直觀的特點(diǎn),而語(yǔ)義信息是圖像深層次上的特征,具有相對(duì)抽象的特點(diǎn)。
目前對(duì)于圖像間相似性度量的研究主要集中在圖像的顏色特征、紋理特征、形狀特征以及空間關(guān)系特征,圖像的特征通過(guò)向量的形式表示。在此基礎(chǔ)上,通常采用向量空間模型來(lái)衡量圖像間相似度,根據(jù)計(jì)算向量間兩點(diǎn)之間的遠(yuǎn)近程度來(lái)衡量圖像間的相似程度。
在模式識(shí)別領(lǐng)域中,特征的相似度量多采用距離方法,也即是特征之間的相似程度用向量的空間距離表示,距離越大,圖像間的差別就越大,反之,就越相似。
3基于LoG算子的棉花圖像檢索算法
3.1圖像特征的表達(dá)
由于傅里葉描述子具有旋轉(zhuǎn)不變性、轉(zhuǎn)置不變性、與起始點(diǎn)無(wú)關(guān)的特點(diǎn),因此,采用傅里葉描述子來(lái)描述邊緣向量,并以此作為圖像的形狀特征。
3.2相似圖像判定
圖像的相似性可以使用滿足測(cè)度空間條件的空間距離來(lái)衡量,距離函數(shù)需要滿足測(cè)度空間的3個(gè)測(cè)度公理。