許唯瑋
(張家口市電化教育館,河北 張家口075000)
隨著Internet與數(shù)字視頻設(shè)備的高速發(fā)展,數(shù)字圖像信息海量增加,如何幫助用戶迅速有效地找到最需要的數(shù)字圖像,已成為當(dāng)前一個研究熱點(diǎn).基于內(nèi)容的圖像檢索(Content Based Image Retrieval,CBIR)是指除了利用傳統(tǒng)的數(shù)據(jù)庫進(jìn)行存貯管理外,還利用圖像的顏色、紋理、形狀等特征進(jìn)行檢索.與這些常見的特征檢索相比,尺度不變的特征具有旋轉(zhuǎn)、縮放和仿射的不變性,因而在圖像匹配、圖像檢索領(lǐng)域得到越來越廣泛的應(yīng)用.在尺度不變的特征點(diǎn)提取算法中,較為經(jīng)典的便是SIFT算法,把圖像轉(zhuǎn)化為灰度圖像,再進(jìn)行特征點(diǎn)提取.
在2004年David G.Lowe總結(jié)了現(xiàn)有的基于不變量技術(shù)的特征檢測方法,并正式提出了一種基于尺度空間的,對圖像縮放、旋轉(zhuǎn)甚至仿射變換保持不變性的圖像局部特征描述算子-SIFT算子,其全稱是Scale Invariant Feat ure Transform,即尺度不變特征變換,一幅圖像SIFT特征向量的生成算法總共包括4步:
(1)尺度空間極值檢測,以初步確定關(guān)鍵點(diǎn)位置和所在尺度.
(2)通過擬和三維二次函數(shù)以精確確定關(guān)鍵點(diǎn)的位置和尺度,同時去除低對比度的關(guān)鍵點(diǎn)和不穩(wěn)定的邊緣響應(yīng)點(diǎn)(因?yàn)镈oG算子會產(chǎn)生較強(qiáng)的邊緣響應(yīng)),以增強(qiáng)匹配穩(wěn)定性,提高抗噪聲能力.
(3)利用關(guān)鍵點(diǎn)鄰域像素的梯度方向分布特性為每個關(guān)鍵點(diǎn)指定方向參數(shù),使算子具備旋轉(zhuǎn)不變性.
圖1 SIFT特征向量描述
(4)生成SIFT特征向量.首先將坐標(biāo)軸旋轉(zhuǎn)向關(guān)鍵點(diǎn)的方向,以確保旋轉(zhuǎn)不變性.接下來以關(guān)鍵點(diǎn)為中心取8×8的窗口.圖1左部分的中央黑點(diǎn)為當(dāng)前關(guān)鍵點(diǎn)的位置,每個小格代表關(guān)鍵點(diǎn)鄰域所在尺度空間的一個像素,箭頭方向代表該像素的梯度方向,箭頭長度代表梯度值,圖中的圈代表高斯加權(quán)的范圍(越靠近關(guān)鍵點(diǎn)的像素梯度方向信息貢獻(xiàn)越大)然后在每4×4的小塊上計算8個方向的梯度方向直方圖.在實(shí)際計算過程中,為了增強(qiáng)匹配的穩(wěn)健性,對每個關(guān)鍵點(diǎn)使用4×4共16個種子點(diǎn)來描述,這樣對于一個關(guān)鍵點(diǎn)就可以產(chǎn)生128個數(shù)據(jù),即最終形成128維的SIFT特征向量.
當(dāng)兩幅圖像的SIFT特征向量生成后,取被檢圖像中的某個關(guān)鍵點(diǎn),將關(guān)鍵點(diǎn)特征向量的歐式距離來作為兩幅圖像中關(guān)鍵點(diǎn)的相似性判定度量,并找出其與圖像庫中圖像歐式距離最近的前兩個關(guān)鍵點(diǎn).在這兩個關(guān)鍵點(diǎn)中,如果最近的距離除以次近的距離少于某個比例閾值,則接受這一對匹配點(diǎn).降低這個比例閾值,SIFT匹配點(diǎn)數(shù)目會減少,但更加穩(wěn)定.將所有匹配點(diǎn)達(dá)到一定閾值的兩幅圖像的歐式距離之和除以圖像分辨率系數(shù)為這兩幅圖像的距離.計算圖像庫中所有圖像與檢索圖像的距離并排序,返回前n項(xiàng)結(jié)果即完成檢索過程.由于這一檢索過程運(yùn)算量較大,實(shí)際操作過程中將特征值存入數(shù)據(jù)庫中,使用最近鄰算法進(jìn)行特征值的查找.
本文使用包含1200副5類圖像的li ff圖庫進(jìn)行試驗(yàn),使用SIFT算法進(jìn)行檢索,其中第一幅圖為待檢索圖像,檢索結(jié)果如圖2所示.從實(shí)驗(yàn)結(jié)果可以看出,上圖關(guān)于建筑類圖像在SIFT算法檢索出的前7幅圖中,有4幅是相關(guān)圖片.下圖關(guān)于植物類圖像檢索出的7幅圖中,有1幅是相關(guān)圖片.可見該算法檢索在人工目標(biāo)的檢索情況時,效果還是比較令人滿意的,但對于自然景物的檢索結(jié)果較差.這說明SIFT特征對于人工目標(biāo)比對自然景物更加敏感.加入顏色信息和全局信息,在檢索中可以提高的檢索效果.在實(shí)際應(yīng)用中,可以再加入一些反饋信息,比如感興趣區(qū)域.一副圖像我們想要的可能只是其中的某個區(qū)域或某個對象,這時候可以讓用戶用鼠標(biāo)選取一個矩形區(qū)域作為感興趣區(qū)域,然后以感興趣區(qū)域作為待檢索對象,忽略其他區(qū)域,結(jié)合了感興趣區(qū)域可以使檢索的結(jié)果更接近用戶的預(yù)期.
圖2 檢索結(jié)果圖
本文提出了一種能在目標(biāo)發(fā)生一定變化的情況下很好實(shí)現(xiàn)檢索的方法.該方法將圖像轉(zhuǎn)化為SIFT特征向量的集合,再計算對應(yīng)特征向量之間的歐式距離實(shí)現(xiàn)匹配.實(shí)驗(yàn)表明能對圖像進(jìn)行內(nèi)容檢索,具有縮放、平移、旋轉(zhuǎn)不變性.
[1]David G.Lowe,Distinctive Image Features from Scale-Invariant Keypoints.International Journal of Computer Vi-sion,2004.5
[2]趙壘,侯振杰,一種改進(jìn)的SIFT圖像配準(zhǔn)方法,計算機(jī)工程,2010.6
[3]Ritendra Datta,Dhiraj Joshi,Jia Li,and James Z.Wang Image Retrieval:Ideas,Influences,and Trends of the New Age,ACM Computing Surveys,Vol.40,2008.4