国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

我國信息檢索領域研究進展分析

2013-04-29 00:44:03朱靖
知識管理論壇 2013年9期
關鍵詞:信息檢索研究進展可視化

朱靖

【摘要】以在CSSCI數(shù)據(jù)庫中檢索到的數(shù)據(jù)為基礎,利用Citespace、Netdraw和SATI文獻題目統(tǒng)計和可視化工具對2007 -2011年信息檢索領域文獻的期刊分布、作者與機構分布、被引作者分布、研究熱點分布以及當前存在的問題和未來發(fā)展趨勢作分析研究,以期為我國信息檢索領域的研究提供參考。

【關鍵詞】信息檢索 研究進展 可視化

引 言

邁入信息社會,網(wǎng)絡已成為人們生活中不可或缺的一部分,而信息檢索理所當然地成為人們?nèi)谌刖W(wǎng)絡的一個重要途徑。在互聯(lián)網(wǎng)迅速發(fā)展的同時,信息檢索的研究也取得了較大的成績,信息檢索的理論和實踐對推動互聯(lián)網(wǎng)的發(fā)展有著重要的作用。為進一步了解我國信息檢索的研究狀況,本文對2007 -2011年這5年間的相關研究進行統(tǒng)計分析。

數(shù)據(jù)來源

筆者在CSSCI數(shù)據(jù)庫中以“信息檢索”為關鍵詞,時間設定為2007-2011年,檢索共得到398篇文獻,以這些文獻為基礎,利用文獻題錄統(tǒng)計與可視化工具來分析信息檢索研究的進展情況。

研究方法

作為現(xiàn)今多學科中一種常見的信息或數(shù)據(jù)可視化形式,科學知識圖譜是通過對某學科領域在特定時間段內(nèi)發(fā)表的學術論文或者專著的作者、題名、關鍵詞、作者機構等信息用可視化的圖譜形象地展示學科的核心框架、前沿領域和其他有關的信息,也可運用多元分析手段得出某學科領域在特定時期內(nèi)形成的以作者、文獻、期刊、機構等為節(jié)點的圖譜[1]。由于科學知識圖譜能夠直觀地展現(xiàn)學科知識結構,自20世紀80年代創(chuàng)制以來得到廣泛的傳播和深入的發(fā)展,出現(xiàn)了較多的知識圖譜分析工具。本文選取了Citespace、Netdraw和SATI這三種代表性工具來統(tǒng)計文獻信息和繪制科學知識圖表,通過對檢索到的信息檢索研究相關文獻信息進行統(tǒng)計和可視化展現(xiàn),更清晰地展示這5年間信息檢索的研究概況。

研究狀況分析

4.1文獻總量與年度分布

在這398篇文獻中,研究論文有359篇,綜述23篇,評論8篇,報告4篇;涉及的學科有管理學、語言學、藝術學、經(jīng)濟學、社會學、教育學等,其中圖書館、情報與文獻學是最多的,共352篇;在年度分布中,2007年113篇、2008年100篇、2009年73篇、2010年61篇、2011年51篇,如圖1所示:

從圖1中可以看出,有關信息檢索的研究文獻在2007-2011年是逐年遞減的,其中下降幅度最大的是2009年。筆者用同樣的檢索關建詞在CSSCI數(shù)據(jù)庫中查看往年的文獻數(shù)量,發(fā)現(xiàn)我國信息檢索的研究是經(jīng)歷了一個又冷到熱再組建到冷的發(fā)展,有關文獻的高峰期是在2004-2005年,之后由熱逐漸轉冷的過程由圖1可以清晰看到。

4.2 文獻的期刊分布

這398篇文獻分布在32種期刊上,平均每種期刊載文量是12.44篇,其中發(fā)表1篇的有10種,發(fā)表2篇的有3種,發(fā)表3篇的有2種,發(fā)表4篇以上的有17種,如表1所示:

這17種期刊都是圖書情報類期刊,共發(fā)表文獻376篇,占所檢索出的文獻總量的94.47%。這項統(tǒng)計也進一步說明了圖書情報類的期刊是信息檢索研究文獻發(fā)表的主要陣地。其中發(fā)文篇數(shù)在50篇以上的有《情報理論與實踐》、《情報雜志》、《圖書情報工作》。

4.3 作者與機構的分布

筆者對這398篇文獻的作者進行了統(tǒng)計,共有581人,發(fā)表3篇以上文獻的作者有38人。表2列出了2007-2011年間發(fā)表文獻最多的前19位學者,也就是發(fā)文總數(shù)在4篇及以上的作者及其所在的機構。需要說明的是,表中的數(shù)字可能不是每一個學者的全部發(fā)文量,因為筆者檢索文獻時設置了關鍵詞和CSSCI來源期刊等條件。

從表3可以看出,武漢大學以5年發(fā)文29篇、平均每年發(fā)文5.8篇高居榜首,其次是南京大學、中國科學技術信息研究所、中山大學、北京大學等機構,從高產(chǎn)機構的分布來看,信息檢索研究的主力軍還是來自高等院校。

4.4 高被引作者的分布

為更好地顯示信息檢索領域作者的學術影響力,筆者從作者的被引視角來進行分析。經(jīng)統(tǒng)計,在2007-2011年間發(fā)表的398篇文獻中,引用文獻共4 291篇次,篇均引文數(shù)為10.78篇次。在統(tǒng)計過程中剔除了無效引文和署名為機構或課題組的引文,最后統(tǒng)計出了作者被引數(shù), 2007-2011年被引數(shù)在5次及以上的作者,共20人,如表4所示:

從表4中可以看出,被引次數(shù)最高的是G.Salton,其次是賴茂生、T.Saracevic、N.J.Belkin、P.Ingwersen、周寧等學者,排除國外學者,國內(nèi)被引次數(shù)排在前列是有賴茂生、周寧、成穎、張曉林、吳丹、馬費成、李景、黃名選、孫茂松、曹樹金等學者。圖2顯示的是高被引作者按中心度分布的可視圖,中心度越大,在圖中表示的圓圈越大,其在信息檢索領域的影響也越大,其與被引次數(shù)作者的分布基本一致,更形象地表示了被引作者的影響力。

4.5 核心研究主題的分析

為更好地分析和展示近幾年信息檢索領域的研究主題和研究進展,筆者對這398篇文獻的關鍵詞作了統(tǒng)計分析。統(tǒng)計發(fā)現(xiàn)共有861個關鍵詞(無關鍵詞的文獻不在統(tǒng)計范疇),而共現(xiàn)次數(shù)越多的主題詞就越能成為近幾年的研究熱點。出現(xiàn)頻次在5次及以上的關鍵詞,如表5所示:

圖3是對共現(xiàn)次數(shù)高的關鍵詞進行了可視化的結果,可以更清晰地表示主題詞的分布特征。從表5和圖3可以看出,排除 “信息檢索”這一關鍵詞之后, 2007-2011年間關鍵詞共現(xiàn)較高的有:本體、跨語言信息檢索、查詢擴展、網(wǎng)絡信息檢索、數(shù)字圖書館、信息檢索系統(tǒng)、搜索引擎、向量空間模型、關聯(lián)規(guī)則、檢索模型、信息可視化、語義網(wǎng)、信息查詢、智能信息檢索、Web 2.0等,這些高頻主題詞無疑構成了近幾年信息檢索領域的研究熱點,其中跨語言信息檢索、網(wǎng)絡信息檢索、查詢擴展、信息檢索模型與系統(tǒng)、語義網(wǎng)等是最受研究者關注的。

信息檢索研究當前存在的問題

5.1 信息組織特別是網(wǎng)絡信息組織標準化、規(guī)范化研究滯后

網(wǎng)絡發(fā)展迅速,網(wǎng)絡信息發(fā)布和更新非??欤揖W(wǎng)絡的開放性使得任何單位或個人都可以在網(wǎng)上隨意發(fā)布信息,但信息發(fā)布者不會依據(jù)一定的標準或規(guī)范去組織他們的信息,而這些呈指數(shù)增長卻又無序的網(wǎng)絡信息增加了信息檢索的復雜度。要提高信息檢索的效率, 必須從源頭上來解決相關問題, 實行網(wǎng)絡信息組織標準化、規(guī)范化[2]。這方面的問題在信息檢索領域還有待解決。

5.2 檢索技術和工具的適應性研究滯后

當前我國對于檢索技術和工具的研究大多是集中在一般說明和比較分析方面, 很少有較具體的改進方案的提出和實現(xiàn),可以說我國信息檢索的技術性研究較薄弱。而且從現(xiàn)在的信息種類來看,人們不僅是要檢索文本和數(shù)據(jù)信息,而且更多地會關注圖形圖像、視頻、音頻等多媒體信息,所以要使人們在越來越發(fā)達的信息時代獲得所需信息, 就必須致力于解決新的技術和新工具的研究問題[3]。

5.3 檢索工具評價較模糊,檢索語言有待改進

高性能的檢索工具會大大提高檢索效率, 能為信息檢索者節(jié)省不少時間, 但面對較多的檢索工具時, 檢索者往往不知道如何選擇, 因此需要一套較完善的檢索工具評價指標作為選擇的依據(jù)[4]。另外,并非所有的檢索者都能懂檢索語言, 他們更傾向于使用自然語言,而目前的檢索結果往往無法滿足真正的需求,所以應致力于方便易用的檢索語言開發(fā)研究, 最終能使檢索者用簡易的檢索語言來達到檢索目標。

5.4 文獻研究內(nèi)容冗余、創(chuàng)新性低

筆者所檢索到的398篇關于信息檢索的文獻,有不少是內(nèi)容交叉、重復率高、可用性差的,使研究成果的質量降低,另有較大一部分僅僅是引進說明或分析比較國外的信息檢索成果,與國外信息檢索領域的研究深度差距仍較大。

信息檢索未來發(fā)展趨勢

6.1 個性化發(fā)展,對用戶體驗的關注越來越顯著

信息的冗余、雷同乃至信息爆炸等問題時刻困擾著人們,而信息檢索研究的目的就是要從紛繁復雜的信息中尋找出符合需求的信息,并且不同群體或用戶個體對信息的需求欲望愈來愈強烈,這就促使了信息檢索要向符合個性化服務的方向發(fā)展[5],更注重用戶的檢索體驗,針對不同用戶的不同需求來處理檢索的相關問題。

6.2 智能化發(fā)展

智能檢索是基于自然語言的檢索形式,通過對知識庫的推理和搜索,把現(xiàn)代人工智能的技術與方法引入信息檢索系統(tǒng),使后者具有一定程度的智能特征,其目的是使信息檢索系統(tǒng)理解文件包含的信息內(nèi)容和用戶的信息需要,在對內(nèi)容的分析理解、內(nèi)容表達、知識學習、推理機制、決策等基礎上實現(xiàn)檢索的智能化,得到用戶能直接加以利用的知識或信息[6-7]。隨著計算機智能技術和網(wǎng)絡技術的發(fā)展,信息檢索的智能化發(fā)展是必然趨勢。

6.3 融合趨勢更加突出

信息檢索不僅僅在計算機學科、圖書情報學領域作用突出,在醫(yī)藥、生物、農(nóng)業(yè)等領域也逐漸應用較多,現(xiàn)階段更有與金融商務、電子商務、網(wǎng)絡技術等學科融合緊密,成為了不可或缺的重要應用工具。在經(jīng)濟全球化的發(fā)展進程中,信息是發(fā)展的支持要素,而且信息檢索會更融入全球化的發(fā)展中,與其他更多的學科和領域相融發(fā)展。

6.4 專題信息、多媒體信息等新的信息檢索發(fā)展顯著

專題化信息檢索是基于某一信息領域或某一特定用戶領域的檢索,針對特定的用戶群或領域,在標引的過程中可以構建專業(yè)詞庫,大大提高標引的深度和專指度;網(wǎng)絡上多媒體信息越來越多,根據(jù)用戶自身體驗,在圖像、視頻、音頻的多媒體基礎上進行新技術的信息檢索。專題和多媒體信息檢索同樣也是個性化信息檢索發(fā)展的重要部分。

6.5 多語言、全球化信息檢索發(fā)展穩(wěn)步前進

由于互聯(lián)網(wǎng)是一個巨大的數(shù)字資源庫,包含不同語言信息,隨著信息查詢用戶素質的不斷提高,對全球信息了解的需要越來越強烈,針對這種需求,在網(wǎng)絡版敘詞表的基礎上,利用新的智能檢索技術,實現(xiàn)不同語種間的有效轉換,可以使用戶檢索不同語言的同類信息。這種多語言、全球化信息檢索也會是今后發(fā)展的一大趨勢。

結語

信息檢索是一門技術性和實踐性很強的學科[[8],在網(wǎng)絡信息化時代,我們更應認識到現(xiàn)階段信息檢索領域存在的問題,加強理論研究,大膽實踐創(chuàng)新,順應發(fā)展潮流,信息檢索領域的研究才能得到真正地長足地提升。

[參考文獻]

[ ] 侯劍華.工商管理學科演進與前沿熱點的可視化分析[D].大連:大連理工大學,2009.

[2] 談大軍,陳曉轉.1998-2003年我國網(wǎng)絡信息檢索研究論文的定量分析與研究[J].現(xiàn)代情報,2004(12):66-69.

[3] 常春.網(wǎng)絡信息檢索存在的問題及發(fā)展方向[J].情報雜志,2003(11):93-94.

[4] 韓圣龍.網(wǎng)絡信息檢索工具評價指標[J].情報學報,2001,20(4):471-477.

[5] 黃如花,張春蕾.網(wǎng)絡信息檢索的發(fā)展趨勢[J].圖書情報知識,2002(4):49-50.

[6] 畢維峰,劉劍鋒.網(wǎng)絡環(huán)境下數(shù)字圖書館信息檢索發(fā)展趨勢[J].現(xiàn)代情報,2007(6):89-90.

[7] 劉宏偉.現(xiàn)代信息檢索在網(wǎng)絡環(huán)境下的發(fā)展趨勢[J].現(xiàn)代情報,2006(10):67-68.

[8] 葉鷹.信息檢索:理論與方法[M].北京:高等教育出版社,2004:378-379.

猜你喜歡
信息檢索研究進展可視化
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
MiRNA-145在消化系統(tǒng)惡性腫瘤中的研究進展
基于CGAL和OpenGL的海底地形三維可視化
離子束拋光研究進展
“融評”:黨媒評論的可視化創(chuàng)新
傳媒評論(2019年4期)2019-07-13 05:49:14
獨腳金的研究進展
中成藥(2017年9期)2017-12-19 13:34:44
醫(yī)學期刊編輯中文獻信息檢索的應用
新聞傳播(2016年18期)2016-07-19 10:12:06
基于神經(jīng)網(wǎng)絡的個性化信息檢索模型研究
EGFR核轉位與DNA損傷修復研究進展
莲花县| 遂川县| 新营市| 江华| 克拉玛依市| 金堂县| 塔河县| 中西区| 郧西县| 延庆县| 莱阳市| 盐津县| 庆云县| 仁布县| 介休市| 永丰县| 昭平县| 渝北区| 浮山县| 龙山县| 临武县| 新化县| 阳信县| 曲周县| 曲靖市| 崇义县| 读书| 湘潭市| 定远县| 陵水| 庆云县| 永靖县| 桐庐县| 罗江县| 柳州市| 平凉市| 宜兴市| 沙洋县| 曲阜市| 海晏县| 秀山|