李根根,馮嘉禮
(上海海事大學 信息工程學院,上海 200135)
隨著多媒體技術的飛速發(fā)展以及圖像獲取與存儲技術的提高,圖像數(shù)據(jù)庫得到了快速發(fā)展。面對如此龐大的圖像數(shù)據(jù)庫,各個領域的圖像都非常多,想要檢索其中用戶感興趣的圖像十分不容易。因此,有必要對圖像數(shù)據(jù)庫中的圖像進行聚類以減少圖像檢索的代價。俗話說“物以類聚”,圖像的聚類即是將圖像數(shù)據(jù)庫中最為相似的部分劃為一類,使得類內(nèi)的相似度盡可能高,而類間的相似度盡可能低。
本文中的圖像聚類采用圖像的顏色以及輪廓兩種特征。利用熟知的HSV模型來得到圖像的顏色譜,以此作為顏色特征。輪廓特征則利用屬性論方法來獲取。在提取了特征之后,利用轉換程度函數(shù)來完成聚類。
在聚類之前,先來介紹本文所用到的一些理論知識。好的聚類結果離不開兩個重要方面:準確有效的圖像特征以及合適的理論與方法。這兩方面缺任何一個都有可能達不到預期的效果。
眾所周知,事物有質和量的兩種規(guī)定性,質和量之間有質量互變規(guī)律:只有超過度的范圍的量變才導致質的變化,而限于度的范圍之內(nèi)的量變不導致質變。 這一性質可用如下定理表示:
定理 1:設 a(u)是事物 u 的一個屬性,x0∈[α,β]?X是 a(u)的一個量,[α,β]是 x0所 對應性質 p(x0,u)的定性基準(若α和β分別是性質 p(u)發(fā)生變化的兩個關節(jié)點,則稱區(qū)間[α,β]為性質 p(u)的“度”或定性基準),ξ=(α+β)/2 為[α,β]的球心,r=(β-α)/2 為[α,β]的半徑,并設q(x,u)是 x0變?yōu)?x=x0+Δx 所對應的性質。 若|x-ξ| 用邏輯語句則可表示為:if x∈[α,β],then p(u),else? p(u)。其中,? p(u)表示非 p(u),即不具備性質 p(u)。同時,若將定性基準[α,β]作為一個調控自變量 x變化范圍的參變量,則最簡性質命題判斷可表達為下述映射形式: 定義 1:設 a(u)是對象 u的某個屬性,x∈X?R是屬性 a(u)的一個量值,p(u)∈Po是屬性 a(u)的某個性質,[α,β]∈Γ 是性質 p(u)的定性基準,則稱映射 τ:X×?!鷞0,1}×Po,使得: 式(1)為最簡性質p(u)的判斷映射或定性映射。其中,為問題:“x 是否在[α,β]中? ”的算子,或“x 是否滿足性質(命題)p(u)的定性基準?”的算子。由于對每一個屬性 a(u),輸入的是 a(u)的一個量(特征)值 x, 輸出是 a(u)的一個性質 p(u)或非 p(u)的 q(u),因此,若強調式(1)是一個從量特征x到質特征p(u)的一個轉化過程,則符號又可以稱為屬性a(u)的量——質特征轉化算子,或(性)質特征抽取算子。 特別地,若用 τp(x)代替 τp(x,u)而不至引起誤解或混淆,則式(2)可寫為: 若令 ξi=(βi+αi)/2,因(αi,βi)是一個以 ξi為球心,以 δi=(βi-αi)/2 為半徑的拓撲鄰域 N(ξi,δi),則有: 于是,最簡判斷型定性映射式 (2)可改寫為τ:X×?!鷞0,1}i,使得: 以成績?yōu)槔齺碇v述轉換程度函數(shù)。比如x1=60分和x2=75分都是合格,但兩者在對知識的掌握程度上卻有所不同。盡管它們同屬一個定性基準[60,75],即:x1,x2∈[αi,βi],經(jīng)量—質特征轉化后,它們對應的性質同屬一個質特征類——合格,即:pi(x1),pi(x2)∈pi(u),但它們轉化為 pi(u)的程度 η(pi(x1))和 η(pi(x2))卻會因 x1≠x2而產(chǎn)生很大的差異。 因此,需要引進一個能刻畫這種差異的概念——轉化程度函數(shù)來描繪這種因量不同而導致同質轉化程度不同的差異。 k1(x),k2(x)∈[0,1], 故 ηi(x)∈[-1,1],則 轉 化 程 度 函數(shù) ηi(x)可定義為: 定義 2:稱映射 η:X×?!鶾-1,1]i為 pi(x)體現(xiàn)其質特 征 類 pi(ξi)的 程 度 函 數(shù) ,如 果 對?(x,N(ξi,δi))∈X×Γ,?ηi(x)∈[-1,1]i,得: 式(7)說明轉換程度函數(shù)導致了定性基準的邊界模糊化。 如果將轉化程度函數(shù)η(x)看作一個值域擴充為[-1,1]的定性映射,則定性映射 τi(x)就可看作是一個僅取{0,1}的轉化程度函數(shù)。反之,將式(7)的值域[-1,1]限制為{0,1},并令所有不等于 0的值 ηi(x)等于 1,那么轉化程度函數(shù)就退化為定性映射。由此可見,程度函數(shù)ηi(x)不僅是τi(x)誘導出來的,而且它們之間還存在著非常深刻的本質聯(lián)系,因此有時又將ηi(x)稱為定性程度函數(shù)。 由于 τi(x)的值域{0,1}僅有兩個值,因此 τi(x)只能表達基于屬性量—質特征轉化的定性判斷中的邏輯關系。而轉化程度函數(shù)ηi(x)的值域已擴充為區(qū)間[-1,1],故能對該量—質轉化中的程度差異進行數(shù)學表達。 對圖像提取輪廓,首先將圖像進行灰度化,然后獲得圖像的灰度直方圖,再確定圖像二值化的閾值,最后對圖像進行二值化。 二值化后的圖像只有兩種顏色,從屬性論的觀點出發(fā),每幅圖片只有黑色和白色兩種屬性,它們所對應的量值分別為0和255。由于圖像輪廓產(chǎn)生在這兩種屬性發(fā)生轉變的臨界部分,這樣圖像的輪廓就很容易提取出來了。將圖像分成若干個區(qū)域,在這些區(qū)域中利用表示白色與黑色屬性的定性映射做一個差,這個差值的絕對值不外乎兩種情況:1和0,1表示發(fā)生了性質的轉變,0表示未發(fā)生性質的轉變。當每一個區(qū)域中有1值時,就將這個區(qū)域劃為輪廓,否則不劃為輪廓部分并將這個區(qū)域變成白色。 圖像顏色的表達有許多種方式,如比較常見的RGB空間、HSV空間、HIS空間等。HSV空間具有如下特點:三個分量相對于人的視覺彼此獨立,信息結構更緊湊;能夠獲得對彩色的直觀表示;各彩色值根據(jù)主觀評價均勻量化,彩色距離的大小與人眼的感覺一致;人對顏色的感覺比較均勻。因此,本文以此空間來表示圖像的顏色。HSV空間中,H表示色調,S表示飽和度,V表示亮度。 HSV空間中,根據(jù)參考文獻[5],各分量的計算公式如下: 該模型中,max、min表示 R、G、B中最大的與最小的。當R=G=B時,S=0;當 V=0時,表示當前的點是黑色。接著對計算出來的值進行歸一化,歸一化公式如下: 將得到的H、S、V的量化值合成一維,合成公式為: 其中,Qs、Qv分別表示 S、V的量化級數(shù),通過式(11)可知它們都取值為2。由式(12)式很容易得到l的取值范圍,然后再統(tǒng)計圖像中各值的分布,即可得到圖像的顏色譜。 將上面得到的顏色特征記為向量C,輪廓特征記為向量P。由于應用的不同,可能想要得到的結果也就不同。通常的做法是為每一種特征都賦一個權值,由于并無確定權值的具體算法,因此只能從反復實驗中獲得一組合理的。 聚類的步驟如下: (1)由于開始時并無類別之分,因此就將第一個待歸類的作為一個類別。 (2)若待匹配的類別中只有一個元素,則可以用普通的余弦公式來計算它們的相似度;如果元素在兩個或者兩個以上,就可以建立基準,利用如式(3)所示的轉換程度函數(shù)公式來計算轉換程度。 其中,xj為待聚類的特征,x*為已知類的本征值。 最終相似度由兩種特征的相似度加權和得到。 (3)在對未知類圖像歸類后,對類別的基準以及本征值進行更新,即看每一維上的量值是否落在基準范圍內(nèi),若不在,將其量值作為基準的端點。對于本征值,可再求次平均。 (4)如果未知圖片與所有已知類別都不是很相似,也就是不滿足聚類前規(guī)定的閾值,則將其劃為新的一類,然后再回到步驟(2),如此循環(huán)下去,直到所有圖片均歸類。 本文選用Java和Eclipse來完成聚類。采用的圖像庫是哥倫比亞COIL100圖像庫,從中選取了20種不同的對象,每種對象45張圖片。同類圖片如圖1所示,不同類型如圖2所示。 圖1 同類圖片樣例 圖2 不同類圖片樣例 本文對圖像庫做了多次聚類,即在每次聚類所得類的基礎上再聚類。將利用本文方法所做的實驗結果與參考文獻[6]中方法的實驗結果相比較,結果如表1所示。 表1 本文方法與參考文獻[6]中方法的實驗結果對比 本文將屬性論方法應用在圖像聚類中,從表1中的結果可以看出該方法的有效性。但是本文提出的算法還存在很多不足,如權值以及相似度閾值的確定都比較依賴于人們的經(jīng)驗值或反復實驗所獲得的合理值,在無監(jiān)督的聚類中,將這些值變?yōu)槌绦蛴嬎愠鰜硎呛芾щy的。實驗所用圖像庫是對物體做360°全方位拍攝所得的圖片,本文只對圖片做了一種變換(即對稱變換)。下一步的工作就是對圖像做一個三維的變換來提高聚類的正確率以及減少聚類的次數(shù)。 [1]李文佩.基于定型映射和轉化程度函數(shù)的漢字識別[D].上海:上海海事大學,2004. [2]馮嘉禮.定性映射、基準變換、轉化程度函數(shù)、人工神經(jīng)元和集合模糊化[J].模糊數(shù)學與系統(tǒng),2004,18:53-56. [3]馮嘉禮.基于屬性坐標學習和分析的核事故評估與決策模型[J].應用基礎與工程科學學報,2006,5(14):1-8. [4]馮嘉禮.基于定性映射的程度函數(shù)及其誘導的模糊拓撲空間[J].計算機科學,2003,30(5):106-108. [5]孫即祥.圖像處理[M].北京:科學出版社,2009. [6]謝從華,沈鈞毅,宋余慶,等.一種圖像數(shù)據(jù)庫聚類與歸類方法的研究[J].控制與決策,2008,6(6):701-704.1.2 轉換程度函數(shù)[3-6]
1.3 輪廓特征提取
1.4 顏色特征提取
1.5 聚類算法
2 實驗結果及分析