王旭 柯凱艷
摘 要 論文選取CNKI期刊收錄的近15年我國圖書情報(bào)領(lǐng)域信息檢索相關(guān)性研究的論文,基于文獻(xiàn)計(jì)量學(xué)對(duì)收集的數(shù)據(jù)進(jìn)行了量化分析,并運(yùn)用CiteSpace軟件和Ucinet軟件繪制了科學(xué)知識(shí)圖譜。同時(shí),論文分別從發(fā)文時(shí)間、作者、機(jī)構(gòu)和研究熱點(diǎn)(關(guān)鍵詞)四個(gè)方面對(duì)該領(lǐng)域研究進(jìn)展進(jìn)行了詳細(xì)分析和總結(jié),進(jìn)一步介紹了其知識(shí)結(jié)構(gòu)與發(fā)展趨勢,并為今后該領(lǐng)域研究提出了建議。
關(guān)鍵詞 圖書館學(xué) 情報(bào)學(xué) 信息檢索相關(guān)性
分類號(hào) G250.252
DOI 10.16810/j.cnki.1672-514X.2016.08.020
Analysis on Recent 15 Years Researches of Information Retrieval Relevance in Library and Information Science in China
Wang Xu,Ke Kaiyan
Abstract This paper selects 15 years articles related to information retrieval relevance in library and information science of China from CNKI database. It analyzes the collected data quantitatively based on bibliometrics and uses the visualization software (CiteSpace and Ucinet) to draw scientific knowledge mapping. Meanwhile, it makes a detailed analysis and summary of research progress in this field from four aspects including dispatch time, the author, institution distribution and research focuses, then introduces its' knowledge structure and development trend. Lastly, it proposes advice for future study in this field.
Keywords Library science. Information science. Information retrieval relevance.
信息檢索相關(guān)性研究距今已有80多年歷史,關(guān)于“相關(guān)性既是信息檢索的基本問題,也是情報(bào)學(xué)的基礎(chǔ)性概念”,國內(nèi)外圖書情報(bào)領(lǐng)域主流學(xué)者已達(dá)成共識(shí)[1-2],且在相關(guān)性研究上取得了一定的成果??紤]到目前圖書情報(bào)領(lǐng)域關(guān)于信息檢索相關(guān)性研究的內(nèi)容較少,同時(shí)也為了解國內(nèi)圖書情報(bào)領(lǐng)域信息檢索相關(guān)性研究的歷史、進(jìn)展,本文選用中國知網(wǎng)數(shù)據(jù)庫,利用CiteSpace、Ucinet等軟件繪制圖書情報(bào)領(lǐng)域信息檢索相關(guān)性主題詞文獻(xiàn)的科學(xué)知識(shí)圖譜,并對(duì)近15年國內(nèi)該領(lǐng)域的研究現(xiàn)狀進(jìn)行了系統(tǒng)的梳理和分析,試圖發(fā)現(xiàn)現(xiàn)有研究的不足以及未來研究趨勢,期望為該領(lǐng)域進(jìn)一步研究提供借鑒。
1 研究方法
本文采用文獻(xiàn)計(jì)量方法分析與解讀圖書情報(bào)領(lǐng)域信息檢索相關(guān)性研究論文,借助文獻(xiàn)的內(nèi)、外部特征,采用統(tǒng)計(jì)學(xué)方法,通過繪制科學(xué)知識(shí)圖譜來揭示該領(lǐng)域的知識(shí)結(jié)構(gòu)和知識(shí)特征,以及研究的前沿領(lǐng)域。
1.1 數(shù)據(jù)收集
在中國知網(wǎng)(CNKI)檢索界面,運(yùn)用檢索式主題=(信息檢索and相關(guān)性)or(檢索and相關(guān)性)(精確匹配)檢索2001年至2015年我國圖書情報(bào)領(lǐng)域信息檢索相關(guān)性研究論文,共得到191篇文獻(xiàn),經(jīng)去重、整理后為190篇。
1.2 可視化及統(tǒng)計(jì)工具
本文進(jìn)行可視化分析的工具是CiteSpace3.8R5版本和Ucinet6.212版本。CiteSpace 在Java語言環(huán)境下運(yùn)行,由陳超美教授開發(fā),在文獻(xiàn)引文網(wǎng)絡(luò)分析研究領(lǐng)域被廣泛應(yīng)用;Ucinet軟件由Linton Freeman編寫,在社會(huì)網(wǎng)絡(luò)分析中被廣泛應(yīng)用。為了呈現(xiàn)圖書情報(bào)領(lǐng)域信息檢索相關(guān)性研究的時(shí)間分布趨勢,本文利用Excel統(tǒng)計(jì)2001—2015年的發(fā)文數(shù)量并繪制了文獻(xiàn)年代分布趨勢圖譜。同時(shí),借助CiteSpace、Ucinet繪制科學(xué)知識(shí)圖譜,以可視化效果對(duì)圖書情報(bào)領(lǐng)域信息檢索相關(guān)性研究的分布機(jī)構(gòu)以及關(guān)鍵詞等進(jìn)行分析。
2 我國圖書情報(bào)領(lǐng)域信息檢索相關(guān)性研究的時(shí)空知識(shí)圖譜及其分析
2.1 年代分布分析
運(yùn)用文獻(xiàn)計(jì)量分析方法,從文獻(xiàn)歷時(shí)性上可以分析出學(xué)科的發(fā)展趨勢,發(fā)文量的多少代表了在一定時(shí)期內(nèi)該領(lǐng)域研究的冷熱程度。利用Excel繪制年代分布情況(見圖1),發(fā)現(xiàn)關(guān)于信息檢索相關(guān)性的研究在2003年后呈現(xiàn)明顯的上升趨勢,2011年達(dá)到研究的高峰期,2012~2013年發(fā)文量有所下降,2014年和2015年稍有回升。近幾年圖情領(lǐng)域有關(guān)信息檢索相關(guān)性研究熱度下降的原因可能是在信息檢索技術(shù)突破方面遇到了瓶頸。目前該領(lǐng)域研究已積累了大量的理論觀點(diǎn),今后在實(shí)證和技術(shù)方面的研究有待提高。
2.2 高產(chǎn)作者知識(shí)圖譜
發(fā)文量可以用來衡量研究者學(xué)術(shù)水平和科研能力,高產(chǎn)作者一定程度上影響著某一學(xué)科的發(fā)展、演變方向,對(duì)高產(chǎn)作者的研究具有重要意義。根據(jù)普萊斯高產(chǎn)作者計(jì)算公式: (其中Nmax為最高產(chǎn)作者論文數(shù))統(tǒng)計(jì)得知,成穎為最高產(chǎn)作者(8篇),則計(jì)算M值為2.11,M取鄰近最大整數(shù)為3,發(fā)文≥3篇的作者稱為高產(chǎn)作者(見表1)。
由表1可知,高產(chǎn)作者中有南京大學(xué)信息管理系的成穎(8篇),南開大學(xué)信息管理系的王知津(6篇),南京大學(xué)信息管理系的孫建軍(6篇)等。由此可知,我國圖書情報(bào)領(lǐng)域信息檢索相關(guān)性研究的核心群體仍是高校專業(yè)教師和圖書館員,他們擁有較強(qiáng)的科研實(shí)力和科研隊(duì)伍以及本專業(yè)深厚的研究底蘊(yùn),是國內(nèi)圖情領(lǐng)域信息檢索相關(guān)性研究的核心力量。而公共圖書館研究人員較少,應(yīng)鼓勵(lì)專業(yè)人員加入公共圖書館,進(jìn)行更好的理論分析及實(shí)踐研究[3]。
2.3 研究機(jī)構(gòu)知識(shí)圖譜
研究機(jī)構(gòu)是從事一項(xiàng)或者多項(xiàng)研究的專門性組織,在一定程度上可以理解為學(xué)術(shù)群體的代名詞。機(jī)構(gòu)合作有助于實(shí)現(xiàn)科研資源的優(yōu)化配置,提高科研生產(chǎn)力。運(yùn)用SPSS軟件統(tǒng)計(jì)國內(nèi)圖書情報(bào)領(lǐng)域信息檢索相關(guān)性研究2001年到2015年期間載文的機(jī)構(gòu)分布,共計(jì)有160家國內(nèi)學(xué)術(shù)機(jī)構(gòu)(包括一級(jí)單位和二級(jí)單位)參與論文的創(chuàng)作,其中25家機(jī)構(gòu)發(fā)文≥2篇(由于篇幅有限,統(tǒng)計(jì)圖示結(jié)果未列出),排名前25位的核心機(jī)構(gòu)累計(jì)發(fā)文91篇,約占全部發(fā)文的48%,是該領(lǐng)域研究的主要陣地。
采用CiteSpaceIII軟件,時(shí)間選擇為2001~2015年,時(shí)間分段單位(Slice Length)為1年,選擇網(wǎng)絡(luò)節(jié)點(diǎn)為機(jī)構(gòu)(Institution),采用最小生成樹算法,經(jīng)調(diào)試得到發(fā)文機(jī)構(gòu)知識(shí)圖譜(見圖2)。圖譜中有33個(gè)節(jié)點(diǎn),161條連線,網(wǎng)絡(luò)密度為0.0026,可知各機(jī)構(gòu)合作力度不大,跨地域、跨機(jī)構(gòu)科研合作較少,有待加強(qiáng)。圖譜顯示,高校圖書館和高校信息管理院系是圖書情報(bào)領(lǐng)域信息檢索相關(guān)性研究的主要陣地,是最活躍的系統(tǒng),貢獻(xiàn)最大。這與高校具有濃厚的學(xué)術(shù)氛圍,有一批較高水平和較高科研能力的研究者有關(guān)。
2.4 關(guān)鍵詞知識(shí)圖譜
根據(jù)文獻(xiàn)計(jì)量學(xué)中的齊普夫定律可知:通過統(tǒng)計(jì)分析某一學(xué)科中關(guān)鍵詞出現(xiàn)頻次及其相互關(guān)系,可以對(duì)該領(lǐng)域的知識(shí)結(jié)構(gòu)演變狀況、研究熱點(diǎn)分布情況做出清晰的揭示。
利用CiteSpaceIII軟件,通過設(shè)定適當(dāng)閾值,以一年為年限(Year Per Slice=1),節(jié)點(diǎn)選擇關(guān)鍵詞(Keyword),采用尋徑網(wǎng)絡(luò)算法剪枝修理后,可得到國內(nèi)圖書情報(bào)領(lǐng)域信息檢索相關(guān)性研究關(guān)鍵詞時(shí)序知識(shí)圖譜(見圖3),其下方年代對(duì)應(yīng)節(jié)點(diǎn)年代環(huán),在修枝后僅顯示部分熱點(diǎn)關(guān)鍵詞。同時(shí),利用Ucinet軟件繪制出圖書情報(bào)領(lǐng)域信息檢索相關(guān)性研究關(guān)鍵詞共現(xiàn)知識(shí)圖譜(見圖4)。
在國外,有關(guān)信息檢索相關(guān)性研究起步遠(yuǎn)遠(yuǎn)早于國內(nèi),研究成果較國內(nèi)豐富,研究體系較為完整。計(jì)算機(jī)科學(xué)界和圖書情報(bào)學(xué)界構(gòu)成國外信息檢索相關(guān)性研究的兩大學(xué)派,在計(jì)算機(jī)科學(xué)界,相關(guān)研究者被稱為系統(tǒng)中心派,即重點(diǎn)在于檢索系統(tǒng)自身的內(nèi)部運(yùn)行機(jī)制研究[4];在圖書情報(bào)學(xué)界,相關(guān)研究者被稱為用戶中心派,即重點(diǎn)在于用戶以及用戶與系統(tǒng)之間的交互研究[5-6]。國內(nèi)學(xué)者在借鑒國外信息檢索相關(guān)性研究成果的基礎(chǔ)上進(jìn)行研究,基于相關(guān)性的動(dòng)態(tài)性、多維性、可認(rèn)知性和可測度性觀點(diǎn),目前,國內(nèi)學(xué)者也普遍認(rèn)同上述兩種學(xué)派。
基于國內(nèi)外有關(guān)信息檢索相關(guān)性研究的兩大研究學(xué)派類型,結(jié)合圖3、圖4對(duì)190篇文獻(xiàn)進(jìn)行梳理后,可以從計(jì)算機(jī)檢索系統(tǒng)自身的內(nèi)部運(yùn)行機(jī)制研究和用戶以及用戶與系統(tǒng)之間的交互研究兩大視角,總結(jié)出典型研究者對(duì)我國圖書情報(bào)領(lǐng)域信息檢索相關(guān)性研究的進(jìn)展及概況,如表2、表3所示。
3 結(jié)語
本文以近15年(2001年~2015年)CNKI中有關(guān)圖書情報(bào)領(lǐng)域信息檢索相關(guān)性研究的論文為研究對(duì)象,從文獻(xiàn)計(jì)量學(xué)的角度,利用知識(shí)圖譜工具剖析了我國圖書情報(bào)領(lǐng)域信息檢索相關(guān)性研究現(xiàn)狀,著重分析了文獻(xiàn)發(fā)表時(shí)間、高產(chǎn)作者、研究機(jī)構(gòu)、關(guān)鍵詞等方面的內(nèi)容,經(jīng)梳理總結(jié),得出以下幾個(gè)方面的結(jié)論。
(1)從國內(nèi)圖情領(lǐng)域信息檢索相關(guān)性研究的發(fā)文數(shù)量時(shí)間分布來看,在2003年后呈現(xiàn)明顯的上升趨勢,2011年達(dá)到研究的高峰期,2012~2013年發(fā)文量有所下降,2014年和2015年稍有回升。另外,近幾年圖情領(lǐng)域有關(guān)信息檢索相關(guān)性研究熱度下降的原因可能是在信息檢索技術(shù)突破方面遇到了瓶頸。目前該領(lǐng)域研究已結(jié)積累了大量的理論觀點(diǎn),今后在實(shí)證和技術(shù)方面的研究有待提高。
(2)從國內(nèi)圖情領(lǐng)域信息檢索相關(guān)性研究的高產(chǎn)作者及機(jī)構(gòu)分布來看,高校圖書館員和高校信息管理系是該領(lǐng)域研究的主要陣地,擁有國內(nèi)該領(lǐng)域信息檢索相關(guān)性研究的核心群體。而公共圖書館相關(guān)研究人員較少,因此,還需要更多的專業(yè)人員加入公共圖書館,給予更好的理論分析及實(shí)踐研究。同時(shí),本研究領(lǐng)域迫切希望能夠涌現(xiàn)出領(lǐng)軍人物和核心研究團(tuán)體來制定大科學(xué)時(shí)代的研究戰(zhàn)略,組織本領(lǐng)域的協(xié)作研究,積極帶領(lǐng)廣大研究者開拓更廣泛的研究領(lǐng)域和做出更專深的探索[6]。
(3)從國內(nèi)圖情領(lǐng)域信息檢索相關(guān)性研究熱點(diǎn)來看,本文基于國內(nèi)外有關(guān)信息檢索相關(guān)性研究的兩大研究學(xué)派類型,分別從計(jì)算機(jī)索系統(tǒng)自身的內(nèi)部運(yùn)行機(jī)制研究和用戶以及用戶與系統(tǒng)之間的交互研究兩大視角進(jìn)行了梳理和總結(jié)。研究發(fā)現(xiàn),國內(nèi)在一定程度上取得了驕人的成績,但主要集中在信息檢索相關(guān)性研究的理論層面探討上,而在實(shí)證方面的研究還有待加強(qiáng)。面對(duì)日益增長的海量網(wǎng)絡(luò)信息,可以滿足用戶需求的信息檢索相關(guān)性越來越重要,因此,以計(jì)算機(jī)檢索系統(tǒng)為中心的設(shè)計(jì)思想轉(zhuǎn)變?yōu)橄到y(tǒng)與用戶并重的設(shè)計(jì)思想,重視用戶友好性,是提高信息檢索相關(guān)性的解決方案。相信未來國內(nèi)圖書情報(bào)領(lǐng)域信息檢索相關(guān)性研究會(huì)不斷深入,有所突破。
參考文獻(xiàn):
[ 1 ] SARACEVIC T. Information science[J].Journal of the American Society for Information Science,1999(12):1051-1063.
[ 2 ] 馬費(fèi)成.論情報(bào)學(xué)的基本原理及理論體系構(gòu)建[J].情報(bào)學(xué)報(bào),2007(26):3-13.
[ 3 ] 王旭.基于文獻(xiàn)計(jì)量的國內(nèi)大數(shù)據(jù)研究現(xiàn)狀分析[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2016(4):52-56.
[ 4 ] Bo-Y KANG, Dae-Won KIM, Sang-Jo LEE. Semantic indexing and fuzzy relevance model in information retrieval[J].Studies in Computational Intelligence (SCI),2005(2):49-60.
[ 5 ] HARTER S P. Psychological relevance and informationscience[J].Journal of the American Society for Information Science,1992(43):602-615.
[ 6 ] SPINK A, GREISDORF H, BATEMAN J. From highly relevant to not relevant:Examining different regions of relevance[J].Information Processing & Management,1998(34):599-621.
[ 7 ] MIZZARO S. Relevance: The whole history[J].Journal of the American Society for Information Science,1996(9):810-832.
[ 8 ] 王知津,卞丹,王文爽.信息檢索中“相關(guān)性”的概念、類型及其不確定性[J].山東圖書館刊,2011(1):1-5.
[ 9 ] 成全,司輝.信息檢索相關(guān)性評(píng)價(jià)及其改善策略研究[J].情報(bào)雜志,2008(2):129-133.
[10] 韓毅,鄧小昭,劉麗,等.信息檢索領(lǐng)域相關(guān)定義的演化及其啟示[J].情報(bào)理論與實(shí)踐,2006(3):270-273.
[11] 賴茂生,屈鵬.相關(guān)性基礎(chǔ)理論及其在檢索建模中的作用研究[J].情報(bào)理論與實(shí)踐,2008(6):801-805.
[12] 黃麗紅.信息檢索中“相關(guān)性”的探究[J].圖書館學(xué)研究,2006(2):65-67.
[13] 成穎,孫建軍,巢乃鵬.信息檢索中的相關(guān)性模型[J].圖書情報(bào)工作,2004(12):46-50.
[14] 王雅坤,成全.信息檢索相關(guān)性研究綜述及發(fā)展趨勢[J].圖書與情報(bào),2012(1):88-94.
[15] 朱涵.BIR模型在提高用戶檢索相關(guān)性中的應(yīng)用[J].情報(bào)探索,2007(4):53-55.
[16] 成穎.基于相關(guān)性判據(jù)的學(xué)術(shù)信息檢索系統(tǒng)成功模型建構(gòu)[J].現(xiàn)代圖書情報(bào)技術(shù),2011(9):46-53.
[17] 楊建林,鄧三鴻.信息檢索中相關(guān)性的維度與度量[J].情報(bào)理論與實(shí)踐,2005(6):27-30.
[18] 吳麗華,羅云鋒,張宏斌.信息檢索模型及相關(guān)性算法的研究[J].情報(bào)雜志,2006(12):25-27.
[19] 周瑛,方宏彬,張持健.模糊聚類在信息檢索中的應(yīng)用[J].微機(jī)發(fā)展,2005(3):107-109.
[20] 劉銘,劉秉權(quán),劉遠(yuǎn)超.面向信息檢索的快速聚類算法[J].計(jì)算機(jī)研究與發(fā)展,2013(7):1452-1463.
[21] 何紹華,宮兆暉.基于語義網(wǎng)的網(wǎng)絡(luò)信息檢索相關(guān)性研究[J].情報(bào)雜志,2007(12):120-123.
[22] 成全,司輝.信息檢索相關(guān)性評(píng)價(jià)及其改善策略研究[J].情報(bào)雜志,2008(2):129-133.
[23] 夏詠梅.淺析信息檢索評(píng)價(jià)中“相關(guān)性”問題的內(nèi)涵[J].情報(bào)雜志,2003(6):52-53.
[24] 楊銳.次序效應(yīng)對(duì)用戶判斷檢索結(jié)果相關(guān)性的影響[J].情報(bào)探索,2011(5):5-8.
[25] 成穎.信息檢索相關(guān)性判據(jù)及應(yīng)用研究[D].南京:南京大學(xué),2011.
[26] 程娟.基于用戶信息檢索相關(guān)性反饋模型的研究[J].圖書館雜志,2008(4):52-55.
[27] 李亞琴,孫建軍,楊月全,等.基于信息檢索用戶的相關(guān)性行為研究進(jìn)展[J].情報(bào)科學(xué),2014(5):157-160.
王 旭 黑龍江大學(xué)信息管理學(xué)院碩士研究生。黑龍江哈爾濱,150080。
柯凱艷 云南大學(xué)歷史與檔案學(xué)院碩士研究生。云南昆明,650000。
(收稿日期:2016-06-01 編校:陳安琪)