基于內(nèi)容的醫(yī)學(xué)圖像檢索技術(shù)在維吾爾藥材圖像檢索中的應(yīng)用前景
木拉提·哈米提, 孫靜, 嚴(yán)傳波, 阿布都艾尼·庫吐魯克
(新疆醫(yī)科大學(xué)醫(yī)學(xué)工程技術(shù)學(xué)院, 烏魯木齊830011)
摘要:維吾爾醫(yī)藥是我國醫(yī)藥學(xué)的重要組成部分,長期以來新疆維吾爾醫(yī)療機構(gòu)累積了大量的藥材數(shù)據(jù)資料,目前主要采用人工標(biāo)注、文本檢索的方式對其進行使用。為改善這種低效利用的局面,建立藥材資源數(shù)據(jù)庫及藥材圖像檢索平臺是一項亟待解決的問題。為滿足快速發(fā)展的維吾爾醫(yī)學(xué)及新藥開發(fā)過程中快速而準(zhǔn)確的檢索需求,將基于內(nèi)容的圖像檢索技術(shù)應(yīng)用于維吾爾醫(yī)藥材資源數(shù)據(jù)庫及檢索平臺中,此項技術(shù)的成功運用將會對維吾爾醫(yī)學(xué)臨床治療、新藥開發(fā)和民族地區(qū)衛(wèi)生醫(yī)療事業(yè)的發(fā)展產(chǎn)生積極而深遠的影響。本文針對基于內(nèi)容的圖像檢索技術(shù)、圖像特征提取方法以及圖像相似度匹配方法進行綜述。
關(guān)鍵詞:維吾爾醫(yī)藥材; 基于內(nèi)容的圖像檢索; 特征提取; 相似度匹配
中圖分類號:R318.04文獻標(biāo)識碼:A
doi:10.3969/j.issn.1009-5551.2015.07.005
[收稿日期:2015-04-19]
維吾爾族醫(yī)藥(簡稱“維藥”)有著長期的發(fā)展過程,長久以來維吾爾族人民在與疾病進行斗爭和自我保健的過程中,積累了許多寶貴經(jīng)驗,并通過連續(xù)不斷的發(fā)揚創(chuàng)新與總結(jié)提高,維藥在傳統(tǒng)中醫(yī)學(xué)的影響下,綜合了阿拉伯和古希臘醫(yī)藥學(xué)的優(yōu)點,逐步形成了具有新疆特色的醫(yī)學(xué)體系[1-4]。
維吾爾族醫(yī)藥在傳統(tǒng)醫(yī)學(xué)庫中占有很高的比例,僅常用藥就有1 000多種,再加上長期以來新疆維吾爾醫(yī)療機構(gòu)的行醫(yī)用藥,積累了大量維吾爾醫(yī)藥材數(shù)據(jù)資料。目前這些藥材數(shù)據(jù)資源主要是采用已編書籍來存檔,使用時通過目錄中記載的藥材名稱或人工標(biāo)注來進行檢索。查找過程中往往依賴于搜索者的先行經(jīng)驗,搜索存在諸多困難,數(shù)據(jù)利用率低,滿足不了快速發(fā)展的維吾爾醫(yī)學(xué)及新藥開發(fā)過程中快速而準(zhǔn)確檢索的需求。要高效利用這些數(shù)據(jù)資源,就要建立一個維吾爾醫(yī)藥材資源數(shù)據(jù)庫和檢索平臺。
針對上述目標(biāo),本課題組提出建立“維吾爾醫(yī)藥材資源數(shù)據(jù)庫及檢索平臺的研究與設(shè)計”,本文就該檢索平臺中的維吾爾族醫(yī)藥材數(shù)據(jù)庫中圖像檢索技術(shù)作一綜述。
1圖像檢索
圖像檢索技術(shù)從20世紀(jì)70年代興起,到21世紀(jì)80年代,基于文本的圖像檢索(TBIR)已經(jīng)普遍應(yīng)用起來。其將圖像作為一個處理單元,人為地進行關(guān)鍵信息標(biāo)識;使用時,通過對這些標(biāo)注的查找,完成對圖像的檢索。直到20世紀(jì)末,利用圖像的內(nèi)容進行分析和檢索的方法出現(xiàn)了,稱為基于內(nèi)容的圖像檢索(CBIR)[5-6]。
1.1基于文本的圖像檢索基于文本的圖像檢索使用了傳統(tǒng)的文本檢索方法,不關(guān)注圖像視覺信息[7-9],而是通過圖像的作者、創(chuàng)建日期、大小、圖像基本信息等信息標(biāo)識圖像,并利用這些標(biāo)識來查詢,或按照文件系統(tǒng)的結(jié)構(gòu)化目錄瀏覽圖像。進行圖像查找時,輸入描述性文本,當(dāng)描述信息與圖像標(biāo)識一致時即可輸出圖像;反之則輸出為空。文本標(biāo)識檢索包括2條途徑:(1)使用圖像基本信息進行檢索,包括圖像的作者、創(chuàng)建日期、大小以及其他的文本信息。(2)使用手工標(biāo)注進行檢索。用文字描述圖像的內(nèi)容,分類并標(biāo)識為關(guān)鍵字,進而建立索引。
基于文本的檢索容易實現(xiàn),操作簡單,目前仍然是各搜索引擎和門戶網(wǎng)站主要使用方法;但是用戶一旦對圖像的理解與圖像的標(biāo)注描述有偏差,就無法準(zhǔn)確地查找所需圖像;同時人為地進行圖像標(biāo)識,工作量較大且效率低,并且標(biāo)識是主觀的;某些圖像本身要表達的信息很難用語言或文字進行描述。
在數(shù)字化時代,圖像數(shù)據(jù)與日俱增,單純基于文本的圖像檢索已滿足不了用戶的需求。為了突破基于文本檢索中標(biāo)識的人為干預(yù),人們開始研究圖像視覺特征,并期望使用這些特征作為圖像的“關(guān)鍵字”。
1.2基于內(nèi)容的圖像檢索基于內(nèi)容的圖像檢索是根據(jù)圖像本身所包含的信息進行檢索,用目標(biāo)圖像本身的顏色、形狀等底層視覺特征構(gòu)成描述圖像內(nèi)容的特征向量,用特征向量建立索引并定義匹配方法,找出特性相似的圖像[10]。用圖像本身具有的內(nèi)容去描述圖像使得檢索的切入點更加準(zhǔn)確。目前已啟用的基于內(nèi)容的圖像檢索系統(tǒng)有很多[11],如IBM公司開發(fā)的QBIC系統(tǒng)、哥倫比亞大學(xué)研發(fā)的WebSeek系統(tǒng)、麻省理工學(xué)院研發(fā)的Photobook系統(tǒng)等?;趦?nèi)容的圖像檢索思路是:(1)針對不同來源的圖像進行預(yù)處理,選取特定算法進行特征提取,建立特征檢索索引;(2)使用相似度匹配算法,計算待查詢圖像與特征檢索索引之間的關(guān)聯(lián);(3)按相似度的不同級別進行反饋。該方法根據(jù)圖像表現(xiàn)實質(zhì)提取檢索特征;能夠近似匹配,在不知道目標(biāo)圖像注釋信息的情況下,利用圖像特征找到與其相似的圖片;基于內(nèi)容的圖像檢索系統(tǒng)一般配套有圖像庫、特征庫等,可以滿足用戶多方面的查詢要求[12-13]。
2圖像檢索的內(nèi)容特征提取
圖像內(nèi)容特征提取是對圖像本質(zhì)特性進行檢測并將圖像分割,將其數(shù)值化或符號化,形成特征矢量[14]。圖像的本質(zhì)特征是指那些能夠反映圖像內(nèi)在屬性和特點的低層信息。在提取這些特征時,對拍攝和采集環(huán)境的變化不敏感,因而在表示圖像時,盡可能地展現(xiàn)圖像本身的內(nèi)容,并不受到領(lǐng)域的干擾。特征提取是圖像識別、基于內(nèi)容的圖像檢索、圖像數(shù)據(jù)挖掘等工作的基礎(chǔ),是圖像分類和模式識別的重要環(huán)節(jié)[15]。
2.1圖像顏色特征顏色特征是最主要區(qū)分事物的視覺特征,在現(xiàn)有檢索系統(tǒng)中被廣泛使用,主要原因是與其他的視覺特征相比,對于圖像的大小、縮放和旋轉(zhuǎn)的依賴性較小,甚至在各種形變中,均能保持特征不變性,穩(wěn)定性比較好[16-18]。
2.1.1顏色直方圖特征顏色直方圖作為顏色特征廣泛地應(yīng)用于圖像檢索系統(tǒng),表現(xiàn)能力很好,彩色圖像的直方圖描述的是不同顏色在整幅圖像中所占得比例,而對顏色所處的空間位置并不是很關(guān)心[19]。計算顏色直方圖,首先根據(jù)使用的顏色空間劃分區(qū)間,每一個區(qū)間作為一個直方圖小單元;然后計算每一個區(qū)間中某顏色像素出現(xiàn)的頻率;最后進行圖形化描述。
2.1.2顏色矩特征顏色矩(Color Moments)特征是一種簡單有效的顏色特征表達方法[20],即用它的矩表示圖像的顏色分布,例如常使用顏色的一階矩(Mean)、二階矩(Variance)、三階矩(Skewness)。由于像素具有顏色空間的3個分量,結(jié)合每個分量上的3個顏色矩就可以表達圖像信息,特征量相對少,但是該特征分辨力較低,因而進行過濾縮小范圍時使用。
2.1.3顏色集顏色集比較類似于顏色直方圖,它支持大數(shù)據(jù)量的圖像檢索。在提取該特征時,首先要進行顏色空間的轉(zhuǎn)化,將RGB空間轉(zhuǎn)化為用戶感知特性的顏色空間,得到一個多顏色輸出的量化函數(shù);利用該顏色分量函數(shù)建立圖像的索引表。顏色集方法只是一種表達方式,類似于閾值直方圖,對大規(guī)模的圖像集檢索效果比較好。
2.1.4顏色相關(guān)圖顏色相關(guān)圖(Color Correlogram)是圖像顏色分布特征的描述。它描述了圖像中顏色變換的空間關(guān)系,該特征對于查詢空間相同的圖像比較好,但是計算量太大。
2.2圖像紋理特征紋理特征是一種量化的結(jié)構(gòu)特征,用于反映圖像中特定結(jié)構(gòu)的重復(fù),可區(qū)分不同內(nèi)容。近些年來,對紋理分析方法的各種理論或方法的應(yīng)用已經(jīng)比較成熟,目前常用的紋理特征提取方法包括結(jié)構(gòu)方法、信號處理方法、幾何方法、模型方法和統(tǒng)計方法。
2.2.1灰度共生矩陣灰度共生矩陣是20世紀(jì)70年代早期Haralick等[21]提出的基于二階灰度統(tǒng)計特征的共生矩陣方法?;叶裙采仃囀菆D像中處于相對位置的像素對同時具有某灰度值的頻數(shù)來統(tǒng)計表達圖像的紋理信息。該方法中總共有14種標(biāo)量來表征紋理特征,但是在實際應(yīng)用中只選用能量、慣性矩、熵、相關(guān)4種標(biāo)量,特征向量的維數(shù)較少,提取速度快,是公認的一種重要的紋理分析方法。
2.2.2Tamura紋理特征Tamura等[22]以人的主觀心理度量為標(biāo)準(zhǔn),提出6個基本的紋理特征,即粗糙度、方向度、對比度、線像度、規(guī)整度和粗略度,其中最常用的是前3個特征:(1)粗糙度:是指圖像中像素點之間灰度級別在三維形態(tài)下的變化差距和間距狀況,它反映了圖像灰度變化的程度。(2)對比度:是指一幅圖像中灰度變化的層次,層次越多表示對比度越大,反之則越小。(3)方向度:圖像中的像素在某個方向上呈現(xiàn)線性分布,例如人體肌肉或者組織的紋理。紋理分析在醫(yī)學(xué)中的應(yīng)用始于20世紀(jì)70年代,目前國內(nèi)外學(xué)者仍在不斷地進行探索。將紋理特征提取應(yīng)用于醫(yī)學(xué)圖像時,找到圖像的本質(zhì)特點和紋理分布規(guī)律,才可能取得較好的結(jié)果。
2.3圖像形狀特征形狀特征是屬于圖像的基本特征之一,有2種表示方法:一類是區(qū)域,它針對圖像中特定范圍;另一種是輪廓,它針對的是物體的邊界[23]。
2.3.1區(qū)域特征區(qū)域特征利用一定的界限范圍內(nèi),具有相似性和連續(xù)性的像素點來描述這一范圍的參數(shù)。矩的計算就要使用目標(biāo)范圍內(nèi)所有相關(guān)的點進行統(tǒng)計,從全圖像的角度描述對象。
Hu在應(yīng)用圖像二維矩進行模式識別時給出了一組基于通用矩組合的代數(shù)矩不變量,稱為Hu矩[24]。Hu矩利用圖像的第二、三階歸一化中心矩,可以得到描述圖像的7個特征變量組。由于Hu矩描述圖像輪廓時具有空間幾何不變性,已經(jīng)被廣泛用于描述圖像的形狀特征。
2.3.2輪廓特征輪廓特征是對對象形體和周圍區(qū)域之間的明顯變化進行描述,進而借助該描述,查詢具有相似輪廓的其他對象。常見的輪廓描述方法包括基于傅立葉變換的輪廓描述[25]、基于曲率尺寸空間的輪廓描述[26]、基于小波變換的輪廓描述、Hough變換以及鏈碼等方法。
3圖像特征提取方法比較
隨著圖像檢索技術(shù)的應(yīng)用,特征提取的方法也逐步深入,不同的特征提取方法也各有優(yōu)劣。圖像顏色特征能夠描述一幅圖像中不同顏色的分布比例,但其對圖像中局部顏色無能為力,而且在對各種色彩所處的空間位置進行描述也比較困難,即無法具體描述圖像中的對象[27]。
圖像紋理特征是全局特征,因而具有很好的可行性和穩(wěn)定性。相比顏色特征,紋理特征不會受到局部差異的影響而搜索失敗。同時該特征不受圖像轉(zhuǎn)動的影響,有很強的抗噪能力。但是,得到的紋理特征會隨著圖像的像素分辨率變化而變化[28]。
圖像形狀特征的目的性很明確,研究圖像中的特殊區(qū)域,但若目標(biāo)產(chǎn)生形變,則算法穩(wěn)定性會大大下降,同時由于形狀特征具有全局性,對其計算時間比較長,而且存儲空間要求也會比較大[29-30]。每一類圖像特征都有其各自的憂劣,僅使用某一類特征進行圖像檢索,可能從該特征的角度出發(fā),可獲得比較好的檢索結(jié)果,但是在進行整體描述時,卻可能和人眼觀察到的有偏差。因此,在進行整幅圖像內(nèi)容檢索時,通常不使用描述部分屬性的單一特征,大多數(shù)情況下,都會使用不同特征進行組合,力求最好的檢索效果。
4圖像特征的相似性匹配
一種合適的相似性匹配方法在很大程度上影響著檢索結(jié)果。人通過眼睛觀察、搜尋相似圖像和目前使用的距離算法有很大的差異,這也是導(dǎo)致檢索結(jié)果不一定符合要求的重要原因。
目前,進行圖像特征相似性匹配的主要方法是通過向量空間模型,計算圖像特征之間的距離來衡量彼此之間的相似性程度。
總之,基于內(nèi)容的圖像檢索技術(shù)已經(jīng)應(yīng)用于多個領(lǐng)域,彌補了傳統(tǒng)檢索方法的不足。隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,基于內(nèi)容的圖像檢索必將有著更為廣闊的使用前景。將基于內(nèi)容的圖像檢索技術(shù)運用到維吾爾醫(yī)藥學(xué)領(lǐng)域,找到適合于新疆維吾爾藥材圖像檢索的特征并驗證其檢索性能,旨在提高維吾爾醫(yī)藥材圖像檢索準(zhǔn)確率,為開發(fā)基于內(nèi)容的新疆維吾爾醫(yī)藥材圖像檢索系統(tǒng)提供一定的依據(jù),提高維吾爾醫(yī)藥材圖像資料的利用率,進一步輔助醫(yī)藥學(xué)科研人員及其他相關(guān)人員檢索所需藥材并查詢相關(guān)的藥理作用,高效地利用已有的維吾爾藥材數(shù)據(jù)資源。這對新疆維吾爾醫(yī)藥材數(shù)據(jù)資源的全面研究和有效利用有著積極而深遠的影響,對于促進民族地區(qū)醫(yī)藥事業(yè)和經(jīng)濟發(fā)展具有重要意義。
參考文獻:
[1]新疆藥物研究所維吾爾藥重點實驗室.維吾爾藥材真?zhèn)舞b別[M].烏魯木齊:新疆美術(shù)攝影出版社/新疆電子音像出版社,2007:132-133.
[2]Liu C, Gu ZY, Yang WJ, et al. Advances of biological taxonomy and species identification in Medicinal Plant Species by DNA barcodes[J].J Am Sci,2011, 7(5):147-151.
[3]黃秀蘭,周秋蘭.維吾爾醫(yī)藥發(fā)展現(xiàn)狀及存在問題分析[J].中央民族大學(xué)學(xué)報,2007,16(3):223-228.
[4]王宇真,呂風(fēng)民,韓勇明.維吾爾醫(yī)藥資源及藥物學(xué)說簡介[J].中國中藥雜志,2005,30(4):315-317.
[5]韋娜,耿國華,周明全,等.基于內(nèi)容的圖像檢索系統(tǒng)性能評價[J].中國圖像圖形學(xué)報,2004,9(11):1271-1276.
[6]王春燕,郭圣文,吳效明.基于內(nèi)容的醫(yī)學(xué)圖像檢索[J].醫(yī)療衛(wèi)生裝備,2008,29(5): 33-35.
[7]Nidhi G, Priti S. A refined hybrid image retrieval system using text and color[J].Int J Comput Sci Issues,2012,9(4):48-56.
[8]阿斯艷·哈米提,阿不都熱西提·哈米提.基于文本的圖像檢索與基于內(nèi)容的圖像檢索技術(shù)的比較研究[J].首都師范大學(xué)學(xué)報:自然科學(xué)版,2012,33(4):6-9.
[9]張騫.基于文本的與基于內(nèi)容的圖像檢索技術(shù)比較研究[J].情報探索,2012,171(1):111-113.
[10]齊恒,李克秋,申彥明.基于特征點組合聚類的圖像檢索新方法[J].大連理工大學(xué)學(xué)報,2014,54(4):477-481.
[11]王瑩,羅坤,姜磊,等.基于內(nèi)容的圖像檢索技術(shù)的專利技術(shù)綜述[J].電視技術(shù),2013,3(2):62-65.
[12]Shi ZP, Liu X, Li QY ,et al. Extracting discriminative features for CBIR[J]. Multimedia Tools Appl, 2012, 61(2):263-279.
[13]Imane D, Khalid I. A fast and efficient fuzzy approximation-based indexing for CBIR[J]. Multimed Tools Appl,2014,1(12):821-847.
[14]劉益新,郭依正.灰度直方圖特征提取的Matlab實現(xiàn)[J].電腦知識與技術(shù),2009,5(32):9032-9034.
[15]翟俊海,趙文秀,王熙照.圖像特征提取研究[J]. 河北大學(xué)學(xué)報, 2009, 29(1): 106-112.
[16]劉穎,范九倫.基于內(nèi)容的圖像檢索技術(shù)綜述[J].西安郵電學(xué)院學(xué)報,2012,17(2):1-8.
[17]Liu GH, Yang JY. Content-based image retrieval using color difference histogram [J]. Pattern Recognition, 2013, 46(1):188-198.
[18]Ping Y, Zhang CH. Image retrievals based on color and texture features [J]. IEEE Int Sig Pro Appl,2007, 2:1-4.
[19]張悅,霍宏,方濤.基于生物視覺的顏色直方圖特征提取[J].高技術(shù)通訊,2014,24(4):407-413.
[20]張少博,全書海,石英,等. 基于顏色矩的圖像檢索算法研究[J].計算機工程,2014,40(6):252-255.
[21]Haralick RM, Shanmugan K, Instein I. Texture features for image classification [J]. IEEE Trans Syst Man Cybern B Cybern,1973, 3(6): 610-620.
[22]Tamura W, Hideyuki T, Mori C, et al. Texture features corresponding to visual perception [J]. IEEE Trans Syst Man Cybern B Cybern, 1978, 8(6):460-473.
[23]Zhang DS, Lu GJ. Review of shape representation and description techniques[J]. Pattern Recognition,2004,37:1-19.
[24]Hu KM.Visual pattern recognition by moment invariant[J]. IEEE Trans Inf Theory,1962,8(2):179-187.
[25]Zhang DS, Lu GJ. Shape based image retrieval using generic fourier descriptors[J]. Signal Processing, 2002,17(10):825-848.
[26]Mokhtarian F, Mackworth AK. A theory of multiscale, curvature-based shape representation for planar curves [J]. IEEE Trans Pattern Anal Mach Intell, 1992, 14(8):789-805.
[27]Dong YB, Li J, Cheng GL. Research on Feature Extraction Based on Color and Texture[J]. Appl Mech Mater,2013,10(448): 3671-3674.
[28]Gletsos M, Mougiakakou SG, Matopoulos GK, et al. A computer-aided diagnostic system to characterize CT focal liver lesions: design and optimization of a neural network classifier [J]. IEEE Trans Inf Technol Biomed,2003,7(3):153-162.
[29]Sonal K, John HP, Andrew NY, et al. Histological image classification using biologically interpretable shape-based features[J]. BMC Med Imaging,2013,13(1):9.
[30]Li HL, Guo CH. Similarity measure based on multidimensional shape feature representation for time series[J]. Xitong Gongcheng Lilun YU Shijian (Systems Engineering Theory and Practice),2013,33(4):1024-1034.
(本文編輯施洋)