郭麗珍
(山西工程職業(yè)學院自動化工程系,山西 太原 030009)
隨著互聯(lián)網技術的普及,數(shù)字圖像數(shù)量的快速增長,如何快速、高效地從龐大的圖像數(shù)據庫中檢索出用戶所需的圖像信息技術,是當前圖像應用領域的熱門發(fā)展方向?;趫D像的低層特征顏色和紋理等的檢索屬于基于內容檢索。
物體的顏色是最感官的圖像特征。物體圖像的顏色特征描述方法對應有多種空間顏色模型。顏色模型是一種對顏色的特性和行為的解釋方法,并沒有哪一種顏色模型能夠解釋所有的顏色問題[1]。
在RGB顏色模型中,每幅彩色圖像若只考慮色彩,忽略亮度等參數(shù),則每個像素點顏色都可以用笛卡爾三維坐標(R,G,B)表示。這樣把每幅彩色圖分解到3個獨立的基色平面上[2]。RGB顏色模型不符合人對顏色的感知,HSV顏色模型可以彌補,通過RGB模型轉化到HSV模型。
在HSV顏色模型中,H表示色調,S表示飽和度和V表示亮度。
在RGB顏色模型中,任一像素點C顏色可以表示為:
(C)=r(R)+g(G)+b(B) .
因為r、g、b∈[0,1],RGB顏色模型轉換到HSV顏色模型的公式為:
顏色直方圖定義了圖像中的顏色分布,計算直方圖時首先是顏色量化,即劃分顏色區(qū)間,把每個區(qū)間稱為直方條。其次是計算顏色落在每個小區(qū)間內的像素數(shù)量。
聚類顏色模型法,是把圖像的顏色聚類為主顏色,用顏色直方圖表示主顏色的信息。聚類顏色模型分析是由若干模式組成,它基于相似性,在一個聚類中模式間的相似性更高于不在同一聚類中的模式[3]。
1) K-means算法思路[4]:首先從n個像素中任意選取k個像素作為初始聚中心,而對于其它沒選的像素,則由相似度分配到與其最相似的聚類;算出新聚類的聚類中心,直到收斂為止。聚類算法的特點:要求各聚類本身盡量緊湊,各聚類間盡量分開。
2) HSV顏色模型空間量化文獻[5]指出把HSV模型空間非均勻量化的方法。它把顏色大致上分9種:黑、灰、白、紅、黃、綠、青、藍、紫,假設一幅圖像中的顏色信息大致上可以用九種顏色描述,所以根據9種顏色確定主顏色數(shù)k。
3) 關于HSV模型的相似性本論文用下式計算兩個對應點間的相似度[5]。設HSV空間的兩個像素點ci=(hi,si,vi),cj=(hj,sj,vj),則ci,cj的相似性sij定義為:
(1)
本文取sij≥0.9。
本文通過HSV非等間距量化,確定主顏色數(shù)目k和MColor[k]。把滿足MColor[i]區(qū)間,且和其他初始聚類中心的不相似的像素點作為初始聚類中心記作MCCi。MCCi的值為該聚類中各像素的平均顏色。利用公式(1)計算各個像素點與中心MCCi的距離,并將其歸類到和該像素點最相似的聚類中。重復計算各個聚類的中心,直到每個聚類中心不再變化為止。然后統(tǒng)計各聚類的樣品數(shù)si,得到圖像的主顏色直方圖hi以及主顏色頻率pi。圖像的主顏色集就是各個聚類中心MCCi。
在改進的算法中,9種顏色的區(qū)間基本可以表示一幅圖的主顏色范圍,確定的k個初始聚類中心屬于主顏色范圍,并在顏色上還不相似,這樣就使得提取圖像的主顏色直方圖準確性增強。實驗結果顯示,采用改進后的K-means主顏色提取法,不僅減少了顏色的特征維數(shù),而且還較準確地描述了圖像顏色,達到維數(shù)和精度平衡。
紋理是能夠反映物體的質地,如粗糙度、顆粒性、光滑性等[6]。紋理特征是計算物體圖像中若干像素點的灰度值,并量化灰度值的變化。在通常情況下,紋理不受物體亮度影響,而和物體的尺寸、形狀、位置等有關[7]。其中灰度共生矩陣方法屬于結構法。
設在目標區(qū)域R中,具有某種特定空間聯(lián)系的像素對的集合S,則共生矩陣P可定義為:
(2)
公式(2)#代表數(shù)量,分子表示滿足具有某種空間關系的像素對個數(shù),分母表示總像素對數(shù),其中像素對的灰度值對應是g1和g2?;叶裙采仃嚪治龇ㄊ怯嬎慵y理中像素點某一灰度級特征重復出現(xiàn)的變化。這個特征隨著距離在精細紋理中變化快,而在粗糙紋理中變化慢。
若定義圖像的灰度級為N級,則灰度共生矩陣就是N×N階矩陣,共生矩陣元素M(Δx,Δy)(h,k)表示:兩個灰度值分別為h和k的像素,它們間距離是(Δx,Δy)的像素對出現(xiàn)的次數(shù)。
計算出灰度共生矩陣之后,可以通過CON,ASM,ENT和COR 4個特征向量來描述紋理。
1) 把彩色圖像轉為灰度圖像。
2) 把灰度圖像的灰度級粗量化,粗量化節(jié)省計算時間,盡管會失真但對紋理特征提取影響不大;
3) 求出任意4個方向的共生矩陣,并分別計算出每個共生矩陣的上述4個特征向量;
4) 求出各個特征向量的均值和標準差μCON,μASM,μENT,μCOR,σCON,σASM,σENT,σCOR。這8個分量作為紋理特征向量,因其取值范圍和物理意義不同,所以需進行高斯歸一化。
為了更好的突出圖像的主體部分,本文運用等面積環(huán)形分塊法檢索圖像。實驗證明效果優(yōu)于間隔環(huán)形分塊法。分塊主顏色檢索方法的思想:將圖像分成固定的塊數(shù),統(tǒng)計出各塊的主顏色直方圖,并計算出對應子塊間的主顏色距離,再對對應子塊間的距離加權求和得到兩圖間的相似距離。由于兩幅圖像在空間相近的位置上,同時存在相似的顏色區(qū)域,具有較大的相似度[8]。用等面積環(huán)形分塊法劃分圖像時,分塊的數(shù)目直接影響到檢索的效果和效率。在實際應用中,通常采用折中法。在本文中,鑒于圖像大小及運行效率,通過多次試驗可知將一般圖像分為5、7、9塊時檢索效果較好。
在本文的檢索中,將示例圖像1分為7個子塊。各個分子塊的權值從中心圓向外分別設成:0.26,0.24,0.20,0.15,0.10,0.05。查詢后返回的圖像數(shù)目為20,檢索出來的相關圖像數(shù)為12。在劃分塊數(shù)7相同的情況下,其檢索效果優(yōu)于其它兩種主顏色檢索法的效果,如下表1所示。
表1 顏直色方圖、主顏色與分塊主顏色檢索效果對比
圖1 示例圖像1
在缺少顏色空間分布信息的圖像中,分塊主顏色檢索法通過顏色直方圖,檢索出外觀上不相同的圖像[9],但對于主顏色不明確或主要目標太大偏離中心的圖像,該方法可能會降低檢索效果。
本文選用Corel圖像庫,分別是大象、建筑雕塑、花卉等10類,一共有1000幅。為了模仿現(xiàn)實中的實際環(huán)境,又增加了部分從網上下載的圖片。圖像的格式為bmp,像素為128×128。以示例圖像1檢索,顏色特征權值為1,紋理特征權值為0,相似度采用默認的方法,檢索結果如圖2所示;若設基于灰度共生矩陣方法的紋理特征權值為1,顏色特征的權值為0,檢索結果如圖3所示。
圖2 基于顏色特征檢索結果
顏色特征選擇分塊主顏色和分塊顏色矩組合,權值設置為0.6;紋理特征提取選擇灰度共生矩陣法,權值設置為0.4,示例圖像1所示的玫瑰花,其檢索結果如圖4。
從各圖可知,綜合利用顏色和紋理多特征的檢索方法,不僅考慮了圖像顏色和紋理的整體差異,又能較真實的反映圖像的空間分布信息,檢索效果較好,所以該算法較成功。
圖3 基于紋理特征檢索結果
圖4 基于顏色和紋理特征的檢索結果