王海峰
青島科技大學,山東青島 266000
計算機圖像數(shù)碼技術(shù)與互聯(lián)網(wǎng)技術(shù)飛速發(fā)展的結(jié)合,使人們越來越多的接觸到大量的圖像信息。如何從浩瀚的圖像數(shù)據(jù)庫中快速、準確的找出自己所需要的圖像,已經(jīng)成為一個受到廣泛關(guān)注的研究課題,并成為數(shù)字化圖書館等重大研究項目中的關(guān)鍵。目前,已經(jīng)有不少的搜索引擎提供網(wǎng)絡圖像的檢索服務,如Google、Ditto、Ixquick、Mamma、百度等。
從20世紀70年代開始,有關(guān)圖像檢索的研究就已開始,當時主要是基于文本的圖像檢索技術(shù)(Text-based Image Retrieval,簡稱TBIR),利用文本描述的方式描述圖像的特征,如繪畫作品的作者、年代、流派、尺寸等。到90年代以后,出現(xiàn)了對圖像的內(nèi)容語義,如圖像的顏色、紋理、布局等進行分析和檢索的圖像檢索技術(shù),即基于內(nèi)容的圖像檢索技術(shù)(Content-based Image Retrieval,簡稱CBIR)。CBIR屬于基于內(nèi)容檢索(Content-based Retrieval,簡稱CBR)的一種,CBR中還包括對動態(tài)視頻、音頻等其它形式多媒體信息的檢索技術(shù)。
在檢索原理上,無論是基于文本的圖像檢索還是基于內(nèi)容的圖像檢索,主要包括3三方面:一方面對用戶需求的分析和轉(zhuǎn)化,形成可以檢索索引數(shù)據(jù)庫的提問;另一方面,收集和加工圖像資源,提取特征,分析并進行標引,建立圖像的索引數(shù)據(jù)庫;還有一方面是根據(jù)相似度算法,計算用戶提問與索引數(shù)據(jù)庫中記錄的相似度大小,提取出滿足閾值的記錄作為結(jié)果,按照相似度降序的方式輸出。
為了進一步提高檢索的準確性,許多系統(tǒng)結(jié)合相關(guān)反饋技術(shù)來收集用戶對檢索結(jié)果的反饋信息,這在CBIR中顯得更為突出,因為CBIR實現(xiàn)的是逐步求精的圖像檢索過程,在同一次檢索過程中需要不斷地與用戶進行交互。而本文中對相關(guān)反饋技術(shù)沒有深入研究。
圖像檢索的目的就是為了解決圖像數(shù)據(jù)庫與用戶需求的匹配和選擇問題,網(wǎng)絡環(huán)境下的圖像檢索無疑也是如此。在此,主要介紹網(wǎng)絡環(huán)境中的圖像資源的檢索問題,區(qū)別于基于現(xiàn)成的特定圖像庫檢索的軟件和系統(tǒng),網(wǎng)絡圖像檢索問題將相對穩(wěn)定的圖像數(shù)據(jù)庫拓展為動態(tài)變化的網(wǎng)絡圖像庫。
基于內(nèi)容的圖像檢索技術(shù)作為一種新的檢索方法,目前已成為研究的熱點。它和基于文本的圖像檢索不同,主要是根據(jù)圖像的顏色、紋理、形狀及它們的空間關(guān)系等內(nèi)容特征作為圖像的索引,通過加算計查詢圖像和目標圖像的相似距離,按相似度進行檢索。
在圖像的形狀、顏色、紋理等特征中,顏色特征是最顯著、最可靠、最穩(wěn)定的視覺特征,是人識別圖像的主要感知特征。對于基于顏色特征的圖像檢索,科學工作者們提出了多種方案。譬如顏色直方圖、主色調(diào)、顏色矩(Color Moments),顏色集(Color sets)、聚類、掃描線投影等檢索算法,顏色直方圖是目前較常使用的檢索方法。
顏色直方圖法具有運算速度快、存儲空間要求低的特點,并且對圖像的尺度及旋轉(zhuǎn)變化不敏感,因此得到了廣泛的關(guān)注。目前基于顏色特征的檢索已經(jīng)成為檢索的一個重要手段,并提出了許多改進方法??傮w來說,主要分為兩類:全局顏色特征檢索和局部顏色特征檢索。按照全局顏色分布來索引圖像可以通過計算每種顏色的像素個數(shù)并構(gòu)造圖像是一個很好的途徑,局部顏色信息是指局部相似的顏色區(qū)域,它考慮了顏色的分類與一些初級的幾何特征。本文所采取的是全局顏色特征檢索。
本文主要對基于顏色分布的各種圖像檢索方法進行研究,在得到圖像的顏色直方圖的基礎上,通過計算圖像直方圖之間的相似性來進行圖像檢索是該方法的基本思想,而圖像之間相似性的度量方法有多種,本文主要應用適量距離法,另外提出其它4種方法同矢量距離法驚進行比較,從而得到尋找出一種更為精確的方法進行圖像檢索。在進行相似性測量之前建立圖像庫的顏色直方圖。
基于顏色直方圖的檢索方法一般是:首先,要選擇某個合適的顏色空間,然后,需要對顏色空間量化即顏色量化,從而得到顏色直方圖,通過對顏色直方圖的匹配來進行檢索。顏色空間的選擇是圖像檢索的準備工作。國際標準的MPEG-7定義了6種顏色空間:RGB、YCrCb、HSV、HMMD、RGB的任一線性變換和單色。在這些顏色空間中,HSV顏色空間更適合于圖像檢索的應用。HSV顏色空間的優(yōu)點在于一方面去除了亮度成分在圖像中與顏色信息的聯(lián)系,另一方面,飽和度成分與人們獲得顏色的方式密切相關(guān),而且,它還具有線性伸縮性,可感知的顏色差與顏色分量的相應值的歐幾里德距離成比例,因此,非常適合基于顏色的圖像相似性比較?;谝陨显颍疚牟捎肏SV顏色空間,在此基礎上得到圖像的顏色直方圖。
1)單幅圖像顏色直方圖的實現(xiàn)算法描述
(1)讀取該圖像的RGB數(shù)據(jù);
(2)將圖像的RGB轉(zhuǎn)換成HSV;
(3)根據(jù)顏色分布矩陣得到該圖像的大?。?/p>
(4)計算目標圖片的直方圖。
2)圖像數(shù)據(jù)庫中顏色直方圖的實現(xiàn)算法描述
(1)根據(jù)圖像庫文件夾的目錄讀取文件;
(2)利用1.1中的算法計算文件夾中所有目標圖片的直方圖;
(3)將得到的直方圖存入MAT文件中,使用前轉(zhuǎn)載MAT文件。
矢量距離法:
1)計算出待檢索圖像的三維顏色直方圖,然后采用插值法在每一個方向增加柄的數(shù)量;
2)對數(shù)據(jù)庫中的每一幅圖像I,裝載其直方圖并對其進行插值,使得圖像矩陣間的柄數(shù)相同,便于進行圖像矩陣間的四則運算;
3)計算出待檢索圖像與圖像I直方圖每一柄上的距離D;
4)在進行相似性度量之前定義兩個閾值T1,T2;
5)計算出兩圖像直方圖之間的歐幾里德距離,保留其中大于T1距離值D1,和小于T2的距離值D2。相似性度量的計算式為:S=LENGTH(D1)*MEAN(D2)/LENGTH(D2);
6)根據(jù)上式計算兩幅圖像的各對應子塊的相似度;
7)將N幅被比較的圖像與用戶輸入的源圖像的最后計算出來的相似度結(jié)果記錄放入數(shù)組中;
8)將N個相似度從大到小排列;
9)根據(jù)相似度的排列顯示檢索到的圖像。