徐彤陽 任浩然 張國標(biāo)
〔摘要〕[目的意義]圖像包含了豐富、生動的信息,利用圖像檢索技術(shù)能夠有效的對大規(guī)模圖像信息進(jìn)行分析、組織和處理,具有重要的實(shí)踐意義。近年來,各國對圖像檢索的研究力度不斷加大,有必要對國際圖像檢索文獻(xiàn)進(jìn)行梳理。[方法過程]本文采用文獻(xiàn)計量方法和CitespaceⅢ可視化工具,對收集Web of Science數(shù)據(jù)庫中有關(guān)圖像檢索領(lǐng)域的文獻(xiàn)進(jìn)行分析,梳理了文獻(xiàn)時間分布規(guī)律、學(xué)科分布狀況,并重點(diǎn)從作者、機(jī)構(gòu)和國家和關(guān)鍵詞頻的角度探索了國際圖像檢索領(lǐng)域的主要研究力量和研究熱點(diǎn)。[結(jié)果結(jié)論]通過總結(jié)和分析發(fā)現(xiàn):圖像檢索領(lǐng)域的主要研究作者和機(jī)構(gòu)大部分來自于中國;國際作者合作尚未形成較為規(guī)模的團(tuán)隊(duì)、美國與中國是圖像檢索領(lǐng)域研究的主要力量;目前的研究熱點(diǎn)主要集中在基于內(nèi)容的圖像檢索、圖像分類和相關(guān)反饋這3個方面。
〔關(guān)鍵詞〕圖像檢索;文獻(xiàn)計量;Web of Science
DOI:10.3969j.issn.1008-0821.2017.10.024
〔中圖分類號〕G254927;G250252〔文獻(xiàn)標(biāo)識碼〕A〔文章編號〕1008-0821(2017)10-0144-07
〔Abstract〕[Purposesignificance] The image contains rich and vivid information,and it is of great practical significance to analyze,organize and deal with large-scale image information effectively by using image retrieval technology.In recent years,the research of image retrieval has been increasing,so it is necessary to sort out the international image retrieval literature.[Methodprocess]By collecting the literatures in the field of image retrieval in the Web of Science database,this paper used the method of bibliometrics and Citespace Ⅲ visualization to sort out and analyze the time distribution of relevant literatures,the distribution of disciplines,and focused on the main research strength and research hotspot in the field of international image retrieval from the perspective of authors,institutions countries and key words.[Resultconclusion]Through the summary and analysis,it was found that most of the main research authors and institutions in the field of image retrieval come from China ;the cooperation of international authors had not yet formed a relatively large-scale team.The United States and China were the main forces in the field of image retrieval.The current research focus was mainly on content-based image retrieval,image classification and related feedback.
〔Key words〕image retrieval;bibliometrics;Web of Science
隨著數(shù)據(jù)庫技術(shù)、互聯(lián)網(wǎng)技術(shù)以及多媒體技術(shù)的不斷發(fā)展,數(shù)字資源早已不單單以文字的形式存在,互聯(lián)網(wǎng)中還有大量的圖像、音頻、視頻等豐富的多媒體資源。其中,圖像資源是客觀對象的一種相似性的、生動性的描述和寫真,是人類社會中最常見的一種信息載體。近幾年,由于博客、論壇、社交網(wǎng)絡(luò)、微博等社交平臺的發(fā)展,給人們提供了分享和交流的機(jī)會,而數(shù)據(jù)存儲系統(tǒng)和云服務(wù)也日益完善,使得圖像資源呈現(xiàn)幾何增長。為了有效的組織、管理信息資源,自20世紀(jì)50年代,信息檢索技術(shù)就已出現(xiàn),它被描述為使用戶的信息需求能夠變?yōu)樽罱K的有用信息的過程,對社會信息化進(jìn)程起到了重大的促進(jìn)作用[1]。圖像檢索作為信息檢索研究領(lǐng)域中的一個分支,對快速在龐大的數(shù)據(jù)庫中檢索出用戶需求的圖像,提高檢索效率具有重要的研究意義。經(jīng)過20年的發(fā)展,科研人員以人工標(biāo)注的方式對圖像進(jìn)行索引,逐漸形成了初步的圖像檢索系統(tǒng)研究體系;90年代初期,圖像資源日益膨脹,以文本的方式檢索圖像出現(xiàn)了效率低、主觀性強(qiáng)和檢索結(jié)果差強(qiáng)人意等問題,需要新的方法去解決,因此,新一代圖像檢索系統(tǒng)應(yīng)運(yùn)而生。該系統(tǒng)通過提取圖像視覺特征進(jìn)行查詢,大大提高了檢索的效率,被稱為基于內(nèi)容的圖像檢索[2]。
近年來圖像檢索研究領(lǐng)域的發(fā)展速度很快,得到國內(nèi)外學(xué)者的廣泛關(guān)注,并有了豐碩的研究成果。梳理國際圖像檢索領(lǐng)域發(fā)展進(jìn)程并將當(dāng)前學(xué)術(shù)研究熱點(diǎn)等特征進(jìn)行系統(tǒng)的展示顯得尤為重要。國際圖像檢索研究較為完善和成熟,整體來看發(fā)展?fàn)顩r領(lǐng)先于國內(nèi),并且近幾年國內(nèi)對國際圖像檢索的總結(jié)性文獻(xiàn)較少。鑒于此,本文采用文獻(xiàn)計量方法對國際圖像檢索領(lǐng)域相關(guān)的文獻(xiàn)進(jìn)行分析,深入探究該領(lǐng)域的研究結(jié)構(gòu),以期理清國際圖像檢索發(fā)展脈絡(luò),為進(jìn)一步推動國內(nèi)相關(guān)研究的發(fā)展提供理論參考依據(jù)。endprint
1數(shù)據(jù)來源與分析方法
Web of science是世界上收錄最全面,具有影響力的學(xué)術(shù)期刊的數(shù)據(jù)庫之一,因此本文檢索來為Web of science數(shù)據(jù)庫。檢索時選擇“題名”字段進(jìn)行檢索,因?yàn)橹黝}檢索會造成大量誤檢,影響數(shù)據(jù)有效性,構(gòu)造的檢索式為題名=(image retrieval or image search)and 文獻(xiàn)類型=(ARTICLE OR PROCEEDINGS PAPER OR REVIEW)。檢索時間跨度選擇2002-2016年近15年的文獻(xiàn),最后使用NoteExpress軟件去除重復(fù)和不相關(guān)的文獻(xiàn),共檢索出屬于研究范圍的2 894篇文章。
本文主要采用文獻(xiàn)計量方法和知識圖譜方法對檢索到的數(shù)據(jù)進(jìn)行分析。結(jié)合兩種方法可以綜合的分析國際圖像檢索論文發(fā)表的規(guī)律,客觀評價不同國家、機(jī)構(gòu)或作者對該領(lǐng)域的研究現(xiàn)狀和發(fā)展歷程,并將圖像檢索領(lǐng)域的研究熱點(diǎn)、趨勢和知識結(jié)構(gòu)等以客觀、形象的可視化方式展現(xiàn)出來。主要工具選擇CitespaceⅢ可視化分析軟件。該軟件適用于分析多元、分時、動態(tài)的復(fù)雜網(wǎng)絡(luò),是新一代信息可視化技術(shù)[3]。
2國際圖像檢索發(fā)展概述
21時間分布
研究圖像檢索領(lǐng)域的歷年文獻(xiàn)發(fā)文數(shù)量可以把握該領(lǐng)域的發(fā)展程度和水平,是衡量該領(lǐng)域發(fā)展的重要指標(biāo),對評價該領(lǐng)域所處的階段、預(yù)測發(fā)展趨勢和動態(tài)具有重要意義[4]。圖1顯示了國際近15年圖像檢索領(lǐng)域文獻(xiàn)發(fā)表數(shù)量狀況。
圖12002-2016年國際圖像檢索文獻(xiàn)發(fā)文時間分布
通過統(tǒng)計分析可得出,國際圖像檢索領(lǐng)域的發(fā)展大致經(jīng)歷的3個階段。第一階段為2002-2005年,由于文本的檢索方式會浪費(fèi)大量的人力,并且每個人對圖像理解不相同以及其他缺陷,相關(guān)學(xué)者開始提出了新的基于內(nèi)容的檢索來滿足用戶的檢索個性化需求,同時隨著互聯(lián)網(wǎng)的普及和發(fā)展,圖像資源爆炸式增長,迫切需要新的技術(shù)來處理海量信息,因此圖像檢索的相關(guān)研究逐漸增加,發(fā)文量逐年上升。該階段主要提出了圖像檢索系統(tǒng)的概念和實(shí)現(xiàn)、基于紋理、形狀和顏色等基本的特征提取方法、相關(guān)反饋的概念和方法等內(nèi)容。第二階段為2006-2009年,該階段發(fā)問數(shù)量逐年下降是因?yàn)閳D像檢索技術(shù)達(dá)到瓶頸,但每年發(fā)文量在100篇以上,表明仍然得到學(xué)者的持續(xù)關(guān)注。第三階段為2010~2016年,在互聯(lián)網(wǎng)、多媒體技術(shù)以及移動端不斷發(fā)展的背景和跨媒體檢索、人工智能等技術(shù)的推進(jìn)下,圖像檢索又獲得了廣泛的關(guān)注和重視,近幾年發(fā)文量迅速增長。
22學(xué)科分布
探索國際圖像檢索領(lǐng)域的發(fā)展?fàn)顩r還可以著眼于研究所屬的學(xué)科性質(zhì),通過深入分析其研究方向,可以揭示不同學(xué)科對推動圖像檢索領(lǐng)域的發(fā)展所做出的貢獻(xiàn)及應(yīng)用前景。表1直觀展示了國際圖像檢索科研成果的學(xué)科分布情況。
本文統(tǒng)計顯示了發(fā)表數(shù)量最多的前10位有關(guān)圖像檢索的學(xué)科領(lǐng)域,表1統(tǒng)計的數(shù)據(jù)顯示,圖像檢索涉及多種學(xué)科,屬于多學(xué)科交叉領(lǐng)域。其中,所屬計算機(jī)科學(xué)的文獻(xiàn)最多,共1 728篇,占總數(shù)的5967%,說明圖像檢索領(lǐng)域的發(fā)展離不開計算機(jī)技術(shù)的支持,計算機(jī)科學(xué)為推動圖像檢索做出了重要的貢獻(xiàn);其次依次為:工程學(xué)875篇占3023%、成像科學(xué)攝影技術(shù)242篇占8359%、光學(xué)226篇占7807%、電子信息136篇占470%、圖書情報科學(xué)132篇占456%以及其他交叉學(xué)科的文獻(xiàn)等。通過統(tǒng)計不同學(xué)科領(lǐng)域的發(fā)文數(shù)量,我們可以看出圖像檢索領(lǐng)域的文獻(xiàn)廣泛應(yīng)用于自然科學(xué)領(lǐng)域,發(fā)展前景廣闊。計算機(jī)科學(xué)、工程學(xué)是該領(lǐng)域的研究的基礎(chǔ),除此之外圖像檢索還應(yīng)用于其他各個學(xué)科,這為社會發(fā)展的方方面面都起了不可忽視的作用。
從表中我們還可以得出,在今后的研究中,進(jìn)一步了解圖像檢索領(lǐng)域的研究特點(diǎn)和發(fā)展?fàn)顩r時,可以重點(diǎn)從以上學(xué)科入手,同時可以借鑒其他學(xué)科的研究方法,擴(kuò)大圖像檢索領(lǐng)域研究的內(nèi)容。
3主要研究力量
31核心期刊
核心期刊是期刊中學(xué)術(shù)水平較高的刊物,是進(jìn)行刊物評價而非具體學(xué)術(shù)評價的工具。核心期刊對教學(xué)科研單位申請高級職稱、基本的核心館藏、申報科研項(xiàng)目、科研機(jī)構(gòu)或高等院校學(xué)術(shù)水平評估等都具有重要的意義。研究國際圖像檢索領(lǐng)域的核心期刊有助于了解主要發(fā)文期刊,把握國際學(xué)術(shù)研究前沿動態(tài),對今后圖像檢索理論的研究具有指導(dǎo)意義。
依據(jù)布拉德福定律,如果科學(xué)期刊按其所刊載某一學(xué)科論文的數(shù)量多少,依遞減順序排列并劃分出一個與該學(xué)科密切相關(guān)的期刊所形成的核心區(qū)期刊區(qū)以及、相關(guān)區(qū)和非相關(guān)區(qū),各個區(qū)的文章數(shù)量相等,此時核心區(qū)、相關(guān)區(qū)、非相關(guān)區(qū)期刊數(shù)量成1∶ n∶ n2的關(guān)系。將所有相關(guān)文獻(xiàn)劃分為3個區(qū),使每個區(qū)的文獻(xiàn)數(shù)大致相等。筆者經(jīng)過統(tǒng)計后,2 894篇圖像檢索的文獻(xiàn)資料共有1245種涉及圖像檢索領(lǐng)域的期刊,均刊載文量為2篇。計算出屬于核心期刊的刊物11種,占全部期刊類別總數(shù)的09%,相關(guān)區(qū)期刊的刊物為120種,占全部期刊類別總數(shù)的96%,非相關(guān)區(qū)域期刊的刊物為1 114,占全部期刊類別總數(shù)的894%,它們之間的比率為1∶109∶1013(n約10),并且每個區(qū)域發(fā)表文獻(xiàn)數(shù)量大致相等,符合布拉德福定律。核心區(qū)相關(guān)期刊刊名及發(fā)文數(shù)量見表2。
由表可見,期刊《LECTURE NOTES IN COMPUTER SCIENCE》(計算機(jī)科學(xué)講義)以總篇數(shù)327排在第一,發(fā)文數(shù)量是排在第二名期刊《PATTERN RECOGNITION》(模式識別)的35倍。LNCS于1973年設(shè)立出版,至今已發(fā)行了8 000多卷,主要涉及人工智能和生物信息等主要領(lǐng)域的研究,LNCS一直與計算及科研院所、眾多知名學(xué)者、知名院校和學(xué)術(shù)團(tuán)體之間有密切的合作,發(fā)表最新的計算機(jī)科學(xué)和信息技術(shù)的研究報告和會議論文等,學(xué)術(shù)水準(zhǔn)較高。期刊《PATTERN RECOGNITION》于1968年設(shè)立出版,是最早發(fā)行模式識別相關(guān)文獻(xiàn)的主要期刊之一,比較注重理論、方法的創(chuàng)新和應(yīng)用。期刊發(fā)表涉及的主要方向有計算機(jī)視覺、圖像處理、視覺神經(jīng)網(wǎng)絡(luò)、文本和文檔分析、生物信息學(xué)、多媒體數(shù)據(jù)分析等,因此圖像檢索領(lǐng)域在該期刊的發(fā)文量也相對較多。endprint
在核心期刊中,除了以上2種期刊,還有《多媒體工具與應(yīng)用》、《圖像處理協(xié)會》、《神經(jīng)計算》、《IEEE多媒體事物》、《圖像和視頻檢索程序》和《視覺傳達(dá)與影像表現(xiàn)雜志》等期刊。這些核心期刊均屬于計算機(jī)領(lǐng)域的期刊,從側(cè)面說明計算機(jī)科學(xué)領(lǐng)域是圖像檢索研究的主要力量。同時,這些核心期刊大多都是有關(guān)多媒體檢索、圖像檢索領(lǐng)域的專業(yè)期刊,圖像檢索領(lǐng)域發(fā)表的相關(guān)文獻(xiàn)向?qū)I(yè)領(lǐng)域的期刊集中,所以這些期刊屬于核心期刊也在情理之中。
32主要研究機(jī)構(gòu)
研究機(jī)構(gòu)是有明確研究方向和任務(wù),有一定水平的學(xué)術(shù)帶頭人和一定數(shù)量科研人員組成的長期從事研究與開發(fā)活動的機(jī)構(gòu),是科研成果產(chǎn)生的重要來源。本文統(tǒng)計了圖像檢索領(lǐng)域排名前10的科研機(jī)構(gòu)(見圖2)并對其進(jìn)行分析。
圖2國際圖像檢索領(lǐng)域主要研究機(jī)構(gòu)
從圖2中可以看出,中國科學(xué)院以92篇的發(fā)文量排在第一,新加坡國立大學(xué)和南洋理工大學(xué)分別以50篇和48篇的發(fā)文量排在第二和第三名。排在前10名的機(jī)構(gòu)還有微軟亞洲研究院、印度理工學(xué)院、清華大學(xué)、中國科技大學(xué)、德克薩斯圣安東尼奧大學(xué)、浙江大學(xué)和美國國家航天局。通過分析發(fā)現(xiàn):①中國科學(xué)院發(fā)文量遙遙領(lǐng)先,在圖像檢索領(lǐng)域占有一定的地位,其它機(jī)構(gòu)發(fā)文數(shù)量相差不大,表明機(jī)構(gòu)之間在圖像檢索領(lǐng)域之間研究水平差距較??;②圖像檢索領(lǐng)域發(fā)文量排在前10的機(jī)構(gòu)有8家來自于高校,只有微軟亞洲研究院和美國國家航天局不在高校之列,表明各大高校是研究圖像檢索領(lǐng)域的主力軍;③排在前10的科研機(jī)構(gòu)中,有4家來自中國,在科研機(jī)構(gòu)中占據(jù)絕對優(yōu)勢,表明我國科研機(jī)構(gòu)成為該領(lǐng)域研究的主要群體,對推動圖像檢索領(lǐng)域的發(fā)展做出了積極的貢獻(xiàn)。
33作者發(fā)文情況
331重要影響力作者
因第一作者在文獻(xiàn)中的貢獻(xiàn)度較大,本文基于SSCI數(shù)據(jù)庫檢索結(jié)果,以第一作者發(fā)表的高被引文章數(shù)為基礎(chǔ)進(jìn)行統(tǒng)計,對在該領(lǐng)域發(fā)表高質(zhì)量文章數(shù)量總被引排名前10位的作者發(fā)文情況進(jìn)行分析,見表3。
從表3中看出,瑞士保羅謝勒研究所(Paul Scherrer Institut,Switzerland)的Pfeiffer,F(xiàn)作者發(fā)表數(shù)量雖然僅有1篇,但篇均被引高達(dá)877次,發(fā)文質(zhì)量高。該文提出利用低亮度X射線成像,可以有效的表示圖像,能廣泛適用于醫(yī)學(xué)成像和工業(yè)無損檢測等領(lǐng)域[5]。發(fā)文質(zhì)量排在第二的作者Datta,Ritendra來自賓夕法尼亞大學(xué)計算機(jī)系,在圖像檢索領(lǐng)域主要研究圖像標(biāo)注[6-7]。另外,排在前10的也有不少海外華人,比如澳大利亞莫納什大學(xué)的Liu,Ying,
主要研究圖像檢索中的高層語義檢索;英國倫敦大學(xué)伯克貝克學(xué)院的Tao,DC和美國西門子公司的Zhou,XS都分析了圖像檢索領(lǐng)域中的相關(guān)反饋機(jī)制存在的一些問題,并提出了改進(jìn)的算法。
332核心作者
核心作者是推動學(xué)術(shù)創(chuàng)新與學(xué)科發(fā)展的骨干力量,同時也是提升期刊學(xué)術(shù)影響力和競爭力的重要因素之一。計算核心作者可以采用普萊斯指數(shù),計算公式為:M=0749(Nmax)12,式中M 代表論文篇數(shù),Nmax 代表統(tǒng)計年限中發(fā)文數(shù)最多的作者的論文數(shù),M為核心作者。據(jù)本文統(tǒng)計,發(fā)表數(shù)量最多的作者論文數(shù)量為38,因此,發(fā)表了5篇以上的作者為圖像檢索領(lǐng)域的核心作者。15年間,圖像檢索領(lǐng)域發(fā)表了5篇以上的核心作者共有250人,發(fā)文數(shù)量共1 914篇,占文獻(xiàn)總數(shù)的61%,大于半數(shù)論文,符合普萊斯指數(shù)定律。這些核心作者中,大部分作者來自中國,是圖像檢索領(lǐng)域研究的關(guān)鍵力量。限于核心作者數(shù)量較多,本文列舉了前10位核心作者,具體見表4。
Tian,Q等人共同合作發(fā)表了許多有關(guān)圖像檢索模型的結(jié)構(gòu)和算法,如提出基于耦合二進(jìn)制嵌入的單詞模型圖像檢索,融合了顏色和SHIF紋理特征可以有效提高視覺匹配精度[8];構(gòu)建了基于視覺次模型和反向索引結(jié)構(gòu),提出了一種由兩個連續(xù)的模塊組成的有效的重新排列方法,提高了檢索效率[9]。ZHANG HJ等人從關(guān)鍵詞和標(biāo)簽等語義檢索方向來提取圖像信息,并在檢索中引入了相關(guān)反饋方法,改善了檢索效果[10-11]。其他的核心作者也提出了許多有關(guān)圖像檢索領(lǐng)域的相關(guān)理論和創(chuàng)新,對推動圖像檢索研究發(fā)展做出了重要的貢獻(xiàn)。
333作者合作情況
探究科研人員合作情況有利于發(fā)現(xiàn)國際圖像檢索領(lǐng)域的主要研究團(tuán)隊(duì),揭示核心團(tuán)隊(duì)的研究方向、了解當(dāng)前該領(lǐng)域的前沿動態(tài)等。本文通過CitespaceⅢ軟件繪制團(tuán)隊(duì)合著情況,其中圓點(diǎn)間的線條表示發(fā)文關(guān)系,圓圈表示作者,大小代表發(fā)文質(zhì)量,如圖3。
從圖3看出,國際圖像檢索領(lǐng)域之間的作者整體聯(lián)系較為稀疏,主要有3個合著團(tuán)隊(duì)。①Q(mào)i Tian為中心的合作網(wǎng)絡(luò),主要研究圖像索引和聚類方法來提高圖像檢索效率,該團(tuán)隊(duì)中Qi Tian來自浙江大學(xué)、Zhou WA來自中國科技大學(xué)、Huang QM來自中國科學(xué)院、Wang SJ來自清華大學(xué);② Tao Dacheng為中心的合作網(wǎng)絡(luò),Tao DC來自悉尼科技大學(xué),主要研究醫(yī)學(xué)圖像檢索,提出了醫(yī)學(xué)圖片特征提取的若干方法,如多視點(diǎn)的局部線性嵌入(MLLE)[12],可以有效的降低維數(shù),提升圖像的檢索速度和效率。Shen HL來自北京大學(xué),Wang M與Hua XS均來自中國科技大學(xué),Lu YJ來自西南德克薩斯州立大學(xué);③Zhang HJ為中的合作網(wǎng)絡(luò),其中Zhang HJ、Jing F、Li MJ均來自微軟亞洲研究院,Zhang B來清華大學(xué),主要研究圖像檢索領(lǐng)域中的相關(guān)反饋和基于區(qū)域的圖像檢索,他們還共同合作發(fā)表了許多國際會議文獻(xiàn)。通過分析看出,國內(nèi)的相關(guān)學(xué)者努力尋求合作,共同致力于圖像檢索領(lǐng)域的研究并在國際中積極扮演重要的角色。
34國際發(fā)文情況
341國際發(fā)文發(fā)展趨勢
通過統(tǒng)計分析主要國家每年發(fā)文量變化,可以了解不同國家地區(qū)學(xué)術(shù)水平的的高低以及變化發(fā)展趨勢。本文根據(jù)SSCI自有的國家地區(qū)統(tǒng)計功能,列舉了發(fā)文量排在前6位的國家地區(qū),如圖4。endprint