周占寧
【摘要】本文對電子商務中基于內容的圖像檢索應用進行了分析,文章闡述了基于內容的圖像檢索技術的應用現狀,并且對基于內容的圖像檢索技術(CBIR)進行了研究,最后提出了特征向量提取的要點。
【關鍵詞】電子商務;基于內容的圖像檢索;應用現狀;技術;特征提取要點
在現代社會,市場經濟體系得到了不斷的完善,各種新的經濟形式涌現出來,電子商務就是非常突出的例子。在電子商務企業(yè)的發(fā)展經營中,建立完善的商品運營體系是非常重要的,其中要用到大量的信息技術,搭建好信息傳輸、圖像檢索等平臺,使得商家和消費者之間形成良好的溝通。
一、基于內容的圖像檢索技術的應用現狀
電子商務購物網站本身具有一定的特別之處,而為了更全面地展現出商品信息,往往是將圖片作為其基本的信息載體。因為技術的原因,商品信息的檢索大多是依靠文本標注的方法來完成的,而這種標注方法雖然能夠獲得比較全面的信息,但是準確度并不高,這最終降低了商品信息的傳輸和檢索效率。以內容為主體的圖像檢索技術最早是運用在一些特殊行業(yè),如公安刑偵的頭像對比、安防工作的指紋對比等等。在商務工作中,國內發(fā)展比較先進的圖像搜索引擎是“安圖搜”,它是集傳圖、視覺搜索為一體的全網比較購物搜索引擎。
二、基于內容的圖像檢索技術(CBIR)研究
(一)CBIR技術概念界定
以內容為基礎的圖像檢索技術將圖像內容自身的特點當做索引,這就避免了以文本為索引的單一、模糊問題。CBIR是合集成技術,它整合了顏色、紋理、形狀等不同的特征屬性,而這些特征是用向量方式被保存數據庫中的,在檢索時,用戶只需要輸入模糊的特征,引擎自行通過匹配計算得到特征結論,并據此得到與之相關的圖像結果,按照特征相似度的高低,對其按先后進行排序、呈現。
(二)商品圖像特征提取層次模型
在圖像數據庫中,對目標特征進行提取,而圖像特點的提取可以歸納為三個層次,其一是可視化層次,其中包括了商品的色彩、紋理、形狀、輪廓等直觀的外在特點,這種提取方式最簡單、最直接,使用的頻次也最高。其二是中間對象的層次,這是將圖像的單個地區(qū)或者目標物體當作索引工具,在操作時技術難度會更高。其三是高級抽象層次,這是在局部特征提取的前提下所展開的抽象化描述,圖像的語義信息會更豐富,比如給圖像增添的的可以體現情感色彩的部分語義。
(三)組合特征提取算法分析
從電子商務商品的銷售特點來說,對實體圖像進行呈現,可以從多個方面來說,包括顏色、形狀等,所以以內容為基礎的圖像搜索方法中,也往往會和多個層次的特點提取操作相聯系,避免用單一檢索方法所帶來的局限性。而組合特征技術就是指對顏色、形狀特征向量二者加以聯合,構成一種綜合性的商品特征。借助這種組合性質的特征提取方法,可以綜合調動兩種方法各自的優(yōu)勢。在圖像檢索技術中,顏色是最常見的特征類型,在確定了具有該種顏色特征的產品范圍后,在此基礎上增加形狀特征等限定詞,縮小搜索范圍,使對象更加精確化。
三、特征向量提取的要點
(一)顏色特征向量提取
對商品來說,顏色本身是商品外在特征上非常重要的一種,而雖然各種商品都有其特定的特點,但顏色是圖像內容中最基礎的因素之一,并且構成了人們辨識圖像的重要感知方式。在圖像的多種特點中,顏色是相對具有穩(wěn)定性的一種?;趦热莸膱D像檢索技術通常依據HSV顏色模型算法設計,在操作時,重點分析圖像的色相(huge)、飽和度(saturation)和色調(value)三個角度的情況。
(二)形狀特征提取
形狀也是商品非常關鍵的一大外在特點,現在,根據商品形狀上的區(qū)別,對圖像進行檢索,大概可以分成根據圖像局部形狀特點、以及根據圖像整體形狀特點進行檢索兩種方法。其中,局部的檢索指的是工作人員在提取時,可以得到圖像中商品的部分形狀區(qū)域或形狀邊界等完整信息特征,并且借助該區(qū)域和相關特征得到完整的圖像內容。而這種局部形狀的理念,需要對整個圖像內容做細化處理和適當切割,而檢索的范圍也會因此被細化、受到局限。與之對應的,全局化的形狀特征檢索無省略了圖像細化這個步驟,可以直接借助體現圖像形狀的全局特征向量完成對應的圖像檢索工作,這種方法的運用,更多地出現在比較大型的通用圖像數據庫中。
(三)圖像相似性比對
基于內容的圖像檢索技術主要采用比對兩幅圖像的相似性的檢索方法。在檢索過程中,采用逐步求精的辦法,在匹配需求過程中不斷與用戶進行交互。用戶可以瀏覽系統(tǒng)反饋的查詢結果,相似度最大的商品排在前面。若需進一步明確查詢結果,則可在前期檢索結果的基礎上通過調整特征提取方法重新進行檢索匹配,直至找到自己心儀的商品為止。目標圖像與特征庫中圖像的匹配比對方法就是采用前面計算所得的顏色特征向量和形狀特征向量與特征庫中的數據進行相似度匹配,通常采用Euclidean距離算法計算。
四、結語
綜上所述,加強對電子商務中基于內容的圖像檢索應用問題的分析,意義重大。相關工作人員需要明確基于內容的圖像檢索技術的應用現狀;并且對基于內容的圖像檢索技術(CBIR)進行研究,把握CBIR技術概念界定、商品圖像特征提取層次模型、組合特征提取算法等等內容;在此基礎上,探討特征向量提取的要點,如顏色特征向量提取、形狀特征提取、圖像相似性比對等等。
參考文獻
[1]朱林婷,丁榮濤.基于內容的圖像檢索在電子商務中應用初探[J].商場現代化,2011(11):138~139.
[2]孫振權,肖詩斌,呂學強.基于內容圖像檢索的特征融合技術研究[J].圖像圖形技術研究與應用,2010(01):156~161.