李瑞光 姜鋒霞
摘要:從基于內(nèi)容圖像檢索特征來看,各特征反應(yīng)了圖像各側(cè)面內(nèi)在特性,利用此種技術(shù)檢索需要多類相似性度量方法,特征與特征之間的相似性度量方式是當(dāng)前CBIR的核心課題。使用圖形特征,在不同相似性的度量方式下,多種特征在圖像庫上的檢索性能,可為CBIR系統(tǒng)設(shè)計(jì)提供相應(yīng)的依據(jù),通過本次實(shí)驗(yàn)得知,圖像特征檢索性能不僅與度量方法有關(guān),也與圖像庫有密切關(guān)聯(lián)。
關(guān)鍵詞:內(nèi)容圖像檢索;特征;性能
中圖分類號(hào):E866 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)05-0922-02
基于內(nèi)容圖像檢索的關(guān)鍵環(huán)節(jié),便是圖像特征、相似性度量方式的選擇。圖像檢索系統(tǒng)的使用者大多有一定相關(guān)知識(shí),但從圖像特征中檢索自己所需要的往往不切實(shí)際;圖像檢索系統(tǒng)中可能擁有許多不同的圖像庫,單一特征搜索,往往無法適應(yīng)系統(tǒng)檢索功能。目前的檢索系統(tǒng),都需要使用者對(duì)圖像特征進(jìn)行選擇,而這樣的模式,使得檢索系統(tǒng)無法滿足廣大用戶的需求。本次研究主要為解決目前檢索系統(tǒng)中所存在的問題,對(duì)圖像多種特征性能做評(píng)價(jià),便于對(duì)特征做指導(dǎo)融合,系統(tǒng)可服務(wù)于大眾用戶,也能同時(shí)面對(duì)不同圖像庫。
1 相關(guān)的工作
上世紀(jì)末,基于內(nèi)容圖像檢索就已經(jīng)成為多媒體技術(shù)中備受矚目的領(lǐng)域,已經(jīng)有許多不同性質(zhì)的圖像檢索系統(tǒng)被開發(fā)使用。
QBIC為第一個(gè)用于藝術(shù)博物館、郵票、商標(biāo)等的圖像數(shù)據(jù)管理,是商業(yè)化基于內(nèi)容圖像的檢索系統(tǒng),對(duì)以后的圖像檢索發(fā)展有著極其深遠(yuǎn)的影響。其提出了檢索供功能的三個(gè)特征,紋理特征、顏色特征、形狀特征。在顏色特征查詢中,包括對(duì)顏色分布、百分比查詢。使用百分比查詢,使用者可以找到相似顏色,而顏色分布差異不僅可以造成相似顏色,也能造成分布相似的顏色圖案。
紋理特征是對(duì)圖像線條的方向性、對(duì)比性、粗糙性做綜合考慮;以形狀查詢則是對(duì)輪廓查詢、形象查詢。目前的系統(tǒng)雖然可以特征檢索,但特征之間毫無聯(lián)系,使用者需要對(duì)圖像特征有基本認(rèn)識(shí),將系統(tǒng)的使用便捷性大打折扣。
后來,又有了圖4中可視特征的檢索,分別為顏色布局、顏色、形狀、紋理。可設(shè)置0~10權(quán)值,使用者需要設(shè)定多個(gè)權(quán)值對(duì)檢索做優(yōu)化,當(dāng)然,要想達(dá)到最佳效果,還需要對(duì)實(shí)驗(yàn)反復(fù)做,此方法也存在問題。
在CBIR領(lǐng)域里,已有許多系統(tǒng),但對(duì)圖像特性做評(píng)價(jià)卻是很少,導(dǎo)致許多用戶盲目選擇特征的問題。
2 實(shí)驗(yàn)框架
2.1 圖像特征
圖像檢索一般都會(huì)選擇紋理、顏色、形狀等圖像基本特征。目前,顏色特征為圖像檢索中使用最為廣泛的視覺特征。為圖像顏色控制的數(shù)值度量,顏色特征與顏色空間有密切關(guān)系,常用顏色空間有HSV顏色空間、HGB顏色空間。紋理特征為圖像檢索的另一種廣泛使用的圖像特征。
人類視覺感知中,形狀為重要特征,形狀特征在圖像檢索中也較為常用,不同形狀表示,許多對(duì)形狀特征識(shí)別的方法已經(jīng)被推出。在實(shí)際操作中,圖像分割無法在計(jì)算機(jī)領(lǐng)域中有效使用,因此,形狀特征無法很好的將其應(yīng)用于圖像檢索中,因此實(shí)驗(yàn)主要基于紋理、顏色特征進(jìn)行。
2.2相似性度量
基于內(nèi)容圖像檢索特點(diǎn)為基于查詢樣例和數(shù)據(jù)候選圖像相似性,并非準(zhǔn)確匹配,在對(duì)圖像特征進(jìn)行選擇外,適合的相似性度量方式,能對(duì)圖像檢索性能造成影響。相似性度量可采用二階距離、一階距離。
2.3性能評(píng)價(jià)
以往信息檢索中,結(jié)果評(píng)價(jià)大多采用查準(zhǔn)率、查全率的參數(shù),CBIR系統(tǒng)中,系統(tǒng)會(huì)以排序結(jié)果為準(zhǔn),返給用戶相似度排列表。因此,查準(zhǔn)率、查全率并未用于CBIR中,大多使用前N個(gè)結(jié)果的正確率PN。
3 實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)數(shù)據(jù)主要有兩個(gè)圖庫,Corel與Brodatz。Corel圖庫有過六萬張圖片,其中包括風(fēng)景、人物、建筑、動(dòng)物、植物等,可在此圖庫中可挑選30個(gè)語義類,每類有120張,共3600張圖片可為實(shí)驗(yàn)數(shù)據(jù)。檢索中會(huì)將樣本圖片屬同語義類顯示正確,而相反則為錯(cuò)誤。
Brodatz圖庫中,可將圖像分割為15(4×4)張,而這樣可形成新測試圖庫,在檢索中,和樣本圖片所屬同張?jiān)紙D片,則顯示結(jié)果為正確,相反則為錯(cuò)誤。
3.1 圖像特征評(píng)價(jià)實(shí)驗(yàn)
圖像特征評(píng)價(jià)實(shí)驗(yàn)是對(duì)不同圖像做評(píng)價(jià),相同相似性的度量方式下,對(duì)圖像庫的檢索效果。在本次實(shí)驗(yàn)中10種圖像特征性高,使用L1、L2的相似度度量方法下,在Corel與Brodatz分別進(jìn)行。對(duì)圖像特征結(jié)果做對(duì)比,L1、L2度量時(shí),特征性能趨勢(shì)、結(jié)果一致,在兩個(gè)測試庫所得結(jié)果如圖1、圖2所示。
圖1 Corel圖庫特征查準(zhǔn)率對(duì)比
圖2 Brodatz圖庫特征查全率對(duì)比
3.2 相似性度量方式性能對(duì)比
對(duì)常用相似度度量方法對(duì)比,各相似性度量方式結(jié)果、趨勢(shì)一致,所有只有HSV顏色直方圖結(jié)果,在兩個(gè)測試庫所得結(jié)果如圖3、圖4所示。
圖3 Corel圖庫相似性度量方式性能對(duì)比
圖4 Brodatz圖庫相似性度量方式性能對(duì)比 (下轉(zhuǎn)第929頁)
(上接第923頁)
4 結(jié)束語
圖像特征檢索性能,與相似性度量方式有關(guān),也與圖像庫相關(guān)。從檢驗(yàn)結(jié)果中顯示,HSV顏色直方圖,顏色一致性向量在Corel圖庫上性能較好。而紋理特征則在Brodatz圖庫上性能較好。為系統(tǒng)有通用性,在做設(shè)計(jì)時(shí),不能以某一圖像特征為設(shè)計(jì)基礎(chǔ),而需要對(duì)不同圖庫做分析,從而對(duì)其特征進(jìn)確定。在實(shí)驗(yàn)分析中,對(duì)圖像特征做指導(dǎo)融合實(shí)驗(yàn),其效果極好,可讓系統(tǒng)有通用性。
參考文獻(xiàn):
[1] 朱文燕.基于內(nèi)容的圖像檢索中特征性能分析[D].天津:天津大學(xué),2009.
[2] 張國宏.基于多特征融合的外觀設(shè)計(jì)專利圖像檢索算法[D].廣州:廣東工業(yè)大學(xué),2011.
[3] 齊為民.基于內(nèi)容圖像檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].大連:大連理工大學(xué),2009.
[4] 魏翩翩.基于內(nèi)容的圖像檢索技術(shù)研究及系統(tǒng)實(shí)現(xiàn)[D].廈門:廈門大學(xué),2009.
[5] 張振華.基于內(nèi)容的圖像檢索關(guān)鍵技術(shù)研究[D].大連:大連理工大學(xué),2011.
[6] 郜妍妍.基于內(nèi)容圖像檢索的一些關(guān)鍵技術(shù)研究[D].長沙:國防科學(xué)技術(shù)大學(xué),2010.
[7] Canny.Based on the characteristics of the two layers of commodities research and implementation of image retrieval technology[D].Power system communication,2011.
[8] MapReduce.Key techniques of content-based medical image retrieval[D].Power system communication,2012.