王福興 伍花
【關(guān)鍵詞】內(nèi)容 圖像檢索 實(shí)現(xiàn)
1 設(shè)計目標(biāo)
這種數(shù)字圖像描述模型及處理系統(tǒng),它可以在低層特征索引和語義特征標(biāo)注之間建立一種統(tǒng)一的機(jī)制,該機(jī)制支持對特征提取結(jié)構(gòu)的標(biāo)準(zhǔn)化描述,支持描述的分層結(jié)構(gòu),支持?jǐn)?shù)據(jù)的透明訪問等。分為通用視覺特征及導(dǎo)出特征提取、特定語義特征提取、知識庫管理、查詢子系統(tǒng)訪問界面及統(tǒng)一存取子系統(tǒng)共5個子系統(tǒng)。
2 子系統(tǒng)功能
如圖1。
系統(tǒng)包括5個子系統(tǒng),其功能簡述如下:
2.1 通用視覺特征及導(dǎo)出特征提取子系統(tǒng)
子系統(tǒng)功能主要包括:通用視覺本體的定義、以WSDL方式描述視覺特征提取接口、完成特征索引等。
子系統(tǒng)對圖像的屬性主要考慮以下幾方面:
(1)圖像創(chuàng)建信息;
(2)圖像的顏色、顏色分布、紋理、輪廓形等低層特征;
(3)布局、擺放形式等導(dǎo)出特征。
2.2 特定語義特征提取子系統(tǒng)
子系統(tǒng)功能主要包括:特定領(lǐng)域本體的定義(如以人臉資料庫為例)、以WSDL方式描述語義特征提取接口、支持自動語義標(biāo)注或人工語義標(biāo)注等。
子系統(tǒng)對圖像的語義特征主要考慮以下幾方面:表現(xiàn)事件或過程的描述;特定的人、地點(diǎn)、事件;專業(yè)術(shù)語及專業(yè)中通用的復(fù)合概念;圖像相關(guān)的主觀感受等。
2.3 知識庫管理子系統(tǒng)
以RDF/OWL為基礎(chǔ),支持知識庫的斷言維護(hù)、實(shí)現(xiàn)知識庫的查詢語言功能、支持規(guī)則定義及推理機(jī)制。
知識庫中包括通用視覺特征及特定領(lǐng)域應(yīng)用兩種類型的斷言集和規(guī)則集。
2.4 查詢子系統(tǒng)
在知識庫的支持下,可以完成圖像資料庫的建立和維護(hù),并且可以實(shí)現(xiàn)類似QBIC或商業(yè)搜索引擎的查詢功能。
2.5 訪問界面及統(tǒng)一存取子系統(tǒng)
實(shí)現(xiàn)人機(jī)、機(jī)機(jī)兩種類型的訪問界面,提供系統(tǒng)不同層次間的統(tǒng)一訪問機(jī)制和接口調(diào)用。
3 開發(fā)環(huán)境
如表1。
系統(tǒng)支持的相關(guān)標(biāo)準(zhǔn)和協(xié)議
(1)在基礎(chǔ)數(shù)據(jù)格式、描述方法及存取路徑上遵循的協(xié)議,包括:RDF、OWL等相關(guān)標(biāo)準(zhǔn)。
(2)檢索上支持國際國內(nèi)的有關(guān)標(biāo)準(zhǔn)和協(xié)議,包括:通用查詢標(biāo)準(zhǔn),如:SPARQL等;低層信息檢索協(xié)議,如: WSDL等。
4 系統(tǒng)實(shí)現(xiàn)的主要功能
4.1 圖像預(yù)處理
用戶得到的圖書圖像,倘若不清晰或是有所劃痕,可以根據(jù)分?jǐn)?shù)階微積分處理技術(shù),如分?jǐn)?shù)階圖像增強(qiáng)技術(shù)、分?jǐn)?shù)階圖像修復(fù)技術(shù)對圖像進(jìn)行有效處理,得到有利與系統(tǒng)對圖書圖像的特征提取的效果圖。
4.2 下層語義查詢
圖像的通用視覺特征分為低層特征,如顏色、灰度、紋理、形狀、空間分布等,本系統(tǒng)通過自動的獲取圖像低層特征或手工標(biāo)注圖像低層特征,記錄這些特征并存儲起來。用戶輸入一張圖像或是手工輸入圖像低層特征,系統(tǒng)根據(jù)低層特征查詢包含用戶所錄低層特征的所有圖書。
4.3 上層語義查詢
圖書圖像的語義描述是提取圖書圖像的語義特征進(jìn)行標(biāo)注,并據(jù)此建立索引。對于圖書圖像的上層語義信息,即抽象的概念屬性,如作者、書名、出版日期、ISBN號、出版社、語種、版次、所屬分類、開本大小、字?jǐn)?shù)及定價等等。用戶輸入圖書的上層語義信息,通過SPARQL語句,后臺自動查詢并給出包含用戶所錄圖書上層語義信息的圖書。顯然,這種查詢的結(jié)果過多,并不精確,所以我們需要上層語義與下層語義結(jié)合起來共同查詢。
4.4 下層語義與上層語義結(jié)合查詢
用戶以自然語言的形式,同時將圖書圖像的下層語義信息與上層語義信息輸入到檢索框中,系統(tǒng)后臺實(shí)現(xiàn)自動分層,在實(shí)現(xiàn)上層語義的查詢的同時,再借助下層語義來精確檢索。如用戶要找一本“圖書封面背景是藍(lán)色的C語言”,系統(tǒng)在查詢出C語言書的同時,再根據(jù)低層圖像特征藍(lán)色來精確查詢結(jié)果。
參考文獻(xiàn)
[1]王東艷.中美數(shù)字圖書館研究比較[J]. 情報資料工作,2001(6):32-36.
[2]張蓓.圖像檢索技術(shù)的發(fā)展及現(xiàn)狀分析[J].福建電腦,2009(004):42-42.
[3]蒲亦非,周激流.分?jǐn)?shù)階微積分在現(xiàn)代信號分析與處理中應(yīng)用的研究[D].成都: 四川大學(xué),2006.
[4]黃曉斌.基于內(nèi)容的圖像檢索技術(shù)[J]. 大學(xué)圖書館學(xué)報,1999,17(4):25-27.
[5]祁宇明,季俊忠.Internet中圖像檢索技術(shù)的研究[J].科技咨詢導(dǎo)報,2007(021):8-8.