劉晶 尹長青
摘要:提出一種新的圖像檢索方法,用離散余弦變換(DCT)和灰度共生矩陣(GLCM)提取圖像的視覺內(nèi)容。由于基于DC系數(shù)的特征向量保留了圖像最重要的視覺分量,所以計算基于均勻量化直方圖的DC系數(shù),并且從該直方圖導(dǎo)出了用于形成DC特征向量的一些統(tǒng)計參數(shù)。然后根據(jù)剩余圖像通過取原始圖像平面和基于DC系數(shù)的重構(gòu)圖像平面之間的差異來獲得其他重要視覺特征。最后從殘差圖像的GLCM中的一些統(tǒng)計參數(shù)用來構(gòu)建基于GLCM的特征向量,并且該特征向量可以更有效的識別殘差圖像的紋理特征。公共數(shù)據(jù)集的實驗結(jié)果表明圖像的組合特征提取提高了圖像檢索的速度和準(zhǔn)確性。
關(guān)鍵詞:CBIR 離散余弦變換 灰度共生矩陣 特征提取 統(tǒng)計參數(shù) 殘差圖像
一、概述
本文分別考慮了用于提取變換域和空間域圖像特征的DCT和GLCM描述符。利用塊級DCT提取圖像特征與GLCM相結(jié)合的方法構(gòu)造單一特征向量,提高了圖像檢索系統(tǒng)的準(zhǔn)確性。所提出的CBIR方案的性能在兩個著名的Corel-SK和Corel-10K圖像數(shù)據(jù)庫上得到驗證。
二、背景知識
(一)塊級離散余弦變換
塊級DCT工具主要用于數(shù)據(jù)壓縮、特征提取、水印等。DCT直接應(yīng)用于原始圖像,并將其分解成重要部分進行特征提取和圖像分析的重要部分在各個領(lǐng)域。DCT被定義為信號的一維形式,并被擴展到矩陣,圖像的二維變換中。這種變換具有可分離,正交,去相關(guān),能量壓縮和對稱性質(zhì)。令f(x,y)表示通過使用DCT變換將被變換到頻域的給定圖像的圖像值。一個大小為N×N的塊的二維DCT變換可以被定義為:
大部分能量在DC系數(shù)中是簡潔的,甚至DC系數(shù)和AC系數(shù)之間的特性也是非常不相似的。表1顯示了原始圖像和殘差圖像與不同的選定DCT系數(shù)之間的關(guān)系,發(fā)現(xiàn)原始圖像和殘差圖像之間的PSNR值對于選定的不同數(shù)量的DCT系數(shù)而言不會發(fā)生顯著變化。
三、塊級DCT信息和GLCM參數(shù)的CBIR
(一)DC特征向量構(gòu)造
通過計算每個DCT塊的DC系數(shù)的量化直方圖的統(tǒng)計參數(shù)來構(gòu)造DC特征向量。DC直方圖被定義為所有DCT塊的DC系數(shù)的出現(xiàn)或頻率,然后將DC直方圖量化為LL個bin/interval(本例中L L=8),并從每個修改的bin/interval或group中,計算出一些統(tǒng)計值,如平均值和標(biāo)準(zhǔn)偏差以形成DC特征向量。令H(b)為DC直方圖的DC系數(shù)的頻率,則概率P(b)直方圖可以定義為:
五、結(jié)束語
本文提出了本文提出了一種基于塊級DCT信息和殘差圖像的GLCM參數(shù)的CBIR檢索方法。通過基于DC特征的分量和GLCM參數(shù)串聯(lián)起來,以有效地形成低維特征向量,其中基于DC和GLCM的特征向量被單獨歸一化。