摘 要:對(duì)國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)領(lǐng)域文獻(xiàn)進(jìn)行統(tǒng)計(jì)計(jì)量分析,主要是為掌握該領(lǐng)域的研究現(xiàn)狀、相關(guān)熱點(diǎn)和未來趨勢(shì)。運(yùn)用Excel和SATI等軟件,對(duì)中國(guó)知網(wǎng)(CNKI)收錄的2010~2020年關(guān)聯(lián)數(shù)據(jù)的期刊文獻(xiàn)從年度發(fā)文分析、核心作者候選人及核心作者確認(rèn)、來源期刊、研究熱點(diǎn)和研究趨勢(shì)等進(jìn)行了分析,探討了當(dāng)前圖情領(lǐng)域關(guān)聯(lián)數(shù)據(jù)的發(fā)展現(xiàn)狀和趨勢(shì),目前研究重點(diǎn)為關(guān)聯(lián)數(shù)據(jù)的社會(huì)化應(yīng)用方面,研究關(guān)注度日益增高,研究空間較大,值得廣大研究者關(guān)注。
關(guān)鍵詞:關(guān)聯(lián)數(shù)據(jù);文獻(xiàn)計(jì)量;熱點(diǎn)分析
關(guān)聯(lián)數(shù)據(jù)(Linked data)的概念是互聯(lián)網(wǎng)之父Tim Berners-Lee在2006年的語(yǔ)義網(wǎng)項(xiàng)目會(huì)議上首次提出,他指出“關(guān)聯(lián)數(shù)據(jù)”是語(yǔ)義網(wǎng)的一種表現(xiàn)形式。其主要以HTTP URI方式表達(dá)和存取資源,并通過統(tǒng)一資源標(biāo)識(shí)符來描述發(fā)布、共享以及連接互聯(lián)網(wǎng),從而提供數(shù)據(jù)、信息和知識(shí)的方法。
圖情領(lǐng)域?qū)τ陉P(guān)聯(lián)數(shù)據(jù)的引入是2008年,Brooks,Terrence A在電子期刊發(fā)文,正式在圖情領(lǐng)域引入了Linked open data的概念;隨后在2009年Bradley在紙質(zhì)期刊上發(fā)文并闡述了Linked data的相關(guān)內(nèi)容;同年,國(guó)內(nèi)圖情領(lǐng)域的學(xué)者姚小樂、劉煒等將關(guān)聯(lián)數(shù)據(jù)(Linked data)一詞正式引入國(guó)內(nèi),關(guān)聯(lián)數(shù)據(jù)研究在行業(yè)內(nèi)開始風(fēng)靡。
關(guān)聯(lián)數(shù)據(jù)在圖書館學(xué)、情報(bào)學(xué)、信息管理學(xué)等多個(gè)學(xué)科領(lǐng)域具有很大的應(yīng)用和研究?jī)r(jià)值。本研究擬采用文獻(xiàn)計(jì)量方法,對(duì)我國(guó)在2010~2020年間關(guān)于關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的相關(guān)文獻(xiàn)進(jìn)行研究現(xiàn)狀、主要研究力量和熱點(diǎn)方面的分析,旨在對(duì)國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的研究現(xiàn)狀做出總結(jié),同時(shí)為相關(guān)的研究人員提供一些參考。
一、數(shù)據(jù)來源與分析方法
本文將運(yùn)用文獻(xiàn)計(jì)量的方法,對(duì)國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)研究文獻(xiàn)進(jìn)行分析,以中國(guó)知網(wǎng)(CNKI)的中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)中的相關(guān)文獻(xiàn)作為來源,以“主題”為檢索項(xiàng),檢索式為:主題=“關(guān)聯(lián)數(shù)據(jù)”O(jiān)R主題=“l(fā)inked data”,檢索年限為2010~2020年,檢索時(shí)間為2021年1月1日。通過對(duì)檢索結(jié)果剔除重復(fù)和非相關(guān)文獻(xiàn)后得到有效文獻(xiàn)413篇。
二、我國(guó)圖情領(lǐng)域關(guān)聯(lián)數(shù)據(jù)研究現(xiàn)狀
1.年度發(fā)文分析
在一定程度上,發(fā)文的數(shù)量可以反映出某領(lǐng)域?qū)W術(shù)研究水平和發(fā)展速度,2010~2020年,國(guó)內(nèi)共發(fā)論文413篇。國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)研究文獻(xiàn)主要以年為單位描述其在時(shí)間上的分布(如圖1所示),根據(jù)數(shù)據(jù)分析可知,2010~2020年國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的研究大致上可以分為四個(gè)階段:
一是研究初始階段(2013年以前),從國(guó)內(nèi)外對(duì)關(guān)聯(lián)數(shù)據(jù)的關(guān)注開始,關(guān)聯(lián)數(shù)據(jù)的概念從產(chǎn)生到引入圖情研究領(lǐng)域,與圖情領(lǐng)域的研究深入滲透,這一時(shí)期的發(fā)文量呈穩(wěn)定增長(zhǎng)態(tài)勢(shì)。
二是研究平穩(wěn)階段(2013~2014年),這一時(shí)期相關(guān)研究進(jìn)入平穩(wěn)時(shí)期,主要原因可能是受資金、技術(shù)等因素的制約,此階段的文獻(xiàn)量出現(xiàn)停滯甚至倒退的情況。
三是研究爆發(fā)階段(2014~2016年),上一階段的制約增長(zhǎng)因素取得突破,相關(guān)發(fā)文出現(xiàn)爆發(fā)增長(zhǎng)的現(xiàn)象。
四是研究相對(duì)成熟階段(2016~2018年),此時(shí)期,發(fā)文量的增長(zhǎng)率逐漸變小,其曲線也相對(duì)變得平緩,主要體現(xiàn)了文獻(xiàn)壽命長(zhǎng)、文獻(xiàn)質(zhì)量對(duì)后期研究發(fā)展貢獻(xiàn)大的特點(diǎn)。在2018年以后,該領(lǐng)域的發(fā)文量增長(zhǎng)再次呈下降趨勢(shì),停滯現(xiàn)象再現(xiàn)的同時(shí),突破也在形成。
圖1 國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)領(lǐng)域年度發(fā)文趨勢(shì)圖
2.核心研究作者分析
(1)核心作者候選人的確定
作者發(fā)文量可揭示作者對(duì)該領(lǐng)域研究的持續(xù)性、深度及貢獻(xiàn)大小。核心作者候選人需要綜合考慮該作者的發(fā)文量以及文獻(xiàn)被引量,從而避免單一指標(biāo)偏頗問題。因此,本文針對(duì)入選核心作者的標(biāo)準(zhǔn)為最低發(fā)文量和最低被引量。文中主要借鑒普賴斯定律來確定這兩個(gè)數(shù)值,符合兩個(gè)標(biāo)準(zhǔn)之一的作者就可以作為核心作者候選人。
在檢索得到的413篇關(guān)聯(lián)數(shù)據(jù)文獻(xiàn)中,一共有作者528名(包括第二、第三等合著作者),通過EXCEL軟件進(jìn)行相關(guān)統(tǒng)計(jì),根據(jù)普賴斯定律所提出的計(jì)算公式進(jìn)行統(tǒng)計(jì):
其中為該領(lǐng)域發(fā)文最多作者的論文數(shù)量,而M為該領(lǐng)域核心作者的最低發(fā)文量。為所有作者中累積被引頻次最大值,為高產(chǎn)作者累積被引頻次最小值。通過計(jì)算得出M的值約等于2.900,因此目前在國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域,發(fā)文量在3篇以上的作者可以入圍核心研究作者候選人,的值約等于20.621,所以在該領(lǐng)域文獻(xiàn)累積被引頻次在21次及以上的作者可入圍該領(lǐng)域的核心研究作者候選人。核心作者候選人需要滿足兩個(gè)條件中任意一個(gè)即可。在對(duì)上述滿足兩個(gè)標(biāo)準(zhǔn)之一的作者進(jìn)行統(tǒng)計(jì)和人工查重之后,本文確定的我國(guó)關(guān)聯(lián)數(shù)據(jù)核心作者候選人共為123位。
(2)核心作者測(cè)評(píng)
對(duì)于某研究領(lǐng)域核心作者可通過綜合指數(shù)法確定,綜合指數(shù)法是一種以正負(fù)均值為基準(zhǔn),將每項(xiàng)指標(biāo)折算指數(shù)后匯總為綜合指數(shù),然后按照數(shù)值大小對(duì)該對(duì)象進(jìn)行排序和評(píng)價(jià)的方法。它表達(dá)了不同計(jì)數(shù)單位的兩個(gè)或多個(gè)指標(biāo)的綜合水平,值最大為最優(yōu),大者為佳。
發(fā)文指標(biāo)指的是核心作者候選人的發(fā)文指數(shù)水平,發(fā)文平均數(shù)指的是左右核心作者候選人計(jì)算所得的平均發(fā)文量。本文中2010~2020年關(guān)聯(lián)數(shù)據(jù)領(lǐng)域中123位核心作者候選人共發(fā)文360篇,本文中,發(fā)文平均指數(shù)。
而被引指標(biāo)指的是核心作者候選人所著文獻(xiàn)量被引指數(shù),被引平均數(shù)指的是所有核心作者候選人文獻(xiàn)量的平均被引頻次,本文中2010~2020年關(guān)聯(lián)數(shù)據(jù)領(lǐng)域中的123位核心作者候選人發(fā)文被引頻次計(jì)算后可得為8766次,人均發(fā)文被引平均指數(shù)。
本文將引用鐘文娟學(xué)者用來測(cè)評(píng)核心作者的指標(biāo):發(fā)文量和被引量。發(fā)文量代表了作者對(duì)研究領(lǐng)域的重要性,被引頻次代表了作者的學(xué)術(shù)影響力,同時(shí)本文將發(fā)文量和被引頻次這兩項(xiàng)指標(biāo)的權(quán)重比例設(shè)為0.5∶0.5。按照下文所述計(jì)算核心研究作者候選人的綜合指數(shù):
在上述公式中,指的是第i位作者的綜合指數(shù),指第i位核心作者候選人的發(fā)文量,表示第i位候選人的被引頻次。運(yùn)用綜合指數(shù)法對(duì)2010~2020年我國(guó)關(guān)聯(lián)數(shù)據(jù)方面的123位核心作者候選人的綜合學(xué)術(shù)水平值進(jìn)行計(jì)算可得,綜合學(xué)術(shù)水平值≥100的候選人共有29個(gè)(如表1所示),這29位作者即為2010~2020年我國(guó)關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域的核心作者。其中,綜合指數(shù)位列第一的是劉煒,綜合指數(shù)約為754。根據(jù)普賴斯定律可得,當(dāng)核心作者發(fā)文量占該領(lǐng)域總發(fā)文量的50%及以上時(shí),便形成該領(lǐng)域的核心作者群。通過對(duì)相關(guān)數(shù)據(jù)的統(tǒng)計(jì)可得,關(guān)聯(lián)數(shù)據(jù)領(lǐng)域核心作者候選人共計(jì)發(fā)文221篇,占關(guān)聯(lián)數(shù)據(jù)領(lǐng)域相關(guān)發(fā)文數(shù)的53.51%,已經(jīng)達(dá)到普賴斯定律的形成條件,因此我國(guó)關(guān)聯(lián)數(shù)據(jù)領(lǐng)域已形成相對(duì)較為穩(wěn)定的核心作者群。
3.期刊貢獻(xiàn)度分析
依據(jù)布拉德福定律可知,刊載某研究領(lǐng)域等量論文的期刊數(shù)量,如果按照遞減的順序進(jìn)行排序,那么這些期刊區(qū)可以分為核心區(qū)、相關(guān)區(qū)和非相關(guān)區(qū),其期刊數(shù)量關(guān)系是1:n:n2(n>1)。把關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域413篇相關(guān)論文所屬期刊進(jìn)行統(tǒng)計(jì)去重后排序,可以得到刊載這些期刊的數(shù)量為65種,前16種期刊共計(jì)發(fā)文240篇,占關(guān)聯(lián)數(shù)據(jù)領(lǐng)域全部期刊發(fā)文量的58%。其中,圖書情報(bào)領(lǐng)域的期刊占絕大多數(shù)?!秷D書情報(bào)工作》發(fā)文量最多,共計(jì)39篇。經(jīng)過計(jì)算后發(fā)現(xiàn),2010~2020年我國(guó)關(guān)聯(lián)數(shù)據(jù)研究領(lǐng)域核心區(qū)、相關(guān)區(qū)和非相關(guān)區(qū)的期刊數(shù)量都符合布拉德福定律。最終,確定核心區(qū)的期刊數(shù)量為3種,核心區(qū)該領(lǐng)域的相關(guān)論文刊載量為94篇,相關(guān)區(qū)期刊數(shù)量為13種,期刊的實(shí)際分布情況如圖2所示。
4.關(guān)鍵詞分析
探究學(xué)科熱點(diǎn)比較常用的方法是對(duì)關(guān)鍵詞詞頻的統(tǒng)計(jì),主要是對(duì)出現(xiàn)頻次較高的關(guān)鍵詞進(jìn)行統(tǒng)計(jì)分析以確定某領(lǐng)域的研究熱點(diǎn)。本文通過SATI對(duì)關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的735個(gè)關(guān)鍵詞進(jìn)行統(tǒng)計(jì)分析,在人工合并同義、近義詞,刪除無實(shí)際意義的詞匯后,將關(guān)鍵詞按頻次降序排序(如表2所示)。
由該表可見,除“關(guān)聯(lián)數(shù)據(jù)”為中心詞外,“數(shù)字圖書館”“語(yǔ)義網(wǎng)”“本體”“書目數(shù)據(jù)”“數(shù)據(jù)網(wǎng)絡(luò)”“元數(shù)據(jù)”“知識(shí)組織”“開放數(shù)據(jù)”“知識(shí)服務(wù)”等關(guān)鍵詞出現(xiàn)的頻次較高,因此這些關(guān)鍵詞是關(guān)聯(lián)數(shù)據(jù)領(lǐng)域研究熱點(diǎn)。
經(jīng)過內(nèi)容分析發(fā)現(xiàn)國(guó)內(nèi)關(guān)聯(lián)數(shù)據(jù)研究的主題大致可以歸納為3個(gè)方面。
(1)關(guān)聯(lián)數(shù)據(jù)領(lǐng)域的基礎(chǔ)理論研究
這些文獻(xiàn)主要對(duì)關(guān)聯(lián)數(shù)據(jù)的概念、基本原則、相關(guān)模型、具體應(yīng)用和前景挑戰(zhàn)等方面進(jìn)行研究。其主要探究了關(guān)聯(lián)數(shù)據(jù)的基本概念以及在國(guó)內(nèi)外該技術(shù)的應(yīng)用實(shí)現(xiàn)情況,逐步對(duì)信息生命周期各階段關(guān)聯(lián)數(shù)據(jù)角色定位展開研究。
(2)關(guān)聯(lián)數(shù)據(jù)的技術(shù)和工具研究
主要集中在對(duì)關(guān)聯(lián)書目信息處理技術(shù)、方法和工具方面。較多立足于關(guān)聯(lián)數(shù)據(jù)的描述、組織、存儲(chǔ)、轉(zhuǎn)化、發(fā)布、檢索等進(jìn)行研究,從關(guān)聯(lián)數(shù)據(jù)的語(yǔ)義描述、組織、發(fā)布到檢索使用的工具,到解決關(guān)聯(lián)數(shù)據(jù)的管理、重用、共享和交互等方面的研究。目前,較多與數(shù)字人文領(lǐng)域交叉融合,對(duì)數(shù)字人文的相關(guān)項(xiàng)目進(jìn)行關(guān)系數(shù)據(jù)的描述和處理。
(3)關(guān)聯(lián)數(shù)據(jù)的應(yīng)用研究
在圖情領(lǐng)域(指圖書館、檔案館、博物館等)的資源與服務(wù)上,主要集中在數(shù)字圖書館、知識(shí)服務(wù)、數(shù)據(jù)挖掘以及數(shù)字人文領(lǐng)域。通過對(duì)信息資源的創(chuàng)建、組織和發(fā)布使用的技術(shù)或工具,來引導(dǎo)應(yīng)用的發(fā)展。同時(shí),涵蓋了網(wǎng)絡(luò)資源的管理和服務(wù),如開放政府、門戶導(dǎo)航等。其他如名稱規(guī)范、語(yǔ)義出版和可視化領(lǐng)域,較為獨(dú)特的有機(jī)構(gòu)評(píng)價(jià)、學(xué)者和學(xué)術(shù)關(guān)系發(fā)現(xiàn)、家譜等領(lǐng)域。這一類的研究已經(jīng)拓展到地理學(xué)、經(jīng)濟(jì)學(xué)、管理學(xué)、醫(yī)學(xué)等相關(guān)領(lǐng)域,社會(huì)化應(yīng)用趨勢(shì)明顯。
參考文獻(xiàn):
[1]TIM BERNERS LEE.Linked Data[EB/OL].[2020-01-05].http://www.w3.org/Design Issues/Linked Data.html.
[2]CHRISTIAN BIZER,TOM HEATH,TIM BERNERS LEE.Linking data:The Story So Far[J].In:IJSWIS,2009
[3]劉 煒.關(guān)聯(lián)數(shù)據(jù):概念、技術(shù)及應(yīng)用展望[J].大學(xué)圖書館學(xué)報(bào),2011
[4]Brooks Terrence A.Watch this:LOD-linking open data[J].Information research-an international electronic journal,2008
[5]Bradley Fiona.Discovering linked data[J],Library Journal,2009
[6]Ed Summers,Antoine Isaac,Clay Redding,Dan Krech,姚小樂,劉 煒.LCSH,SKOS和關(guān)聯(lián)數(shù)據(jù)[J].現(xiàn)代圖書情報(bào)技術(shù),2009
[7]丁學(xué)東.文獻(xiàn)計(jì)量學(xué)基礎(chǔ)[M].北京:北京大學(xué)出版社,1992
[8]鐘文娟.基于普賴斯定律與綜合指數(shù)法的核心作者測(cè)評(píng)——以《圖書館建設(shè)》為例[J].科技管理研究,2012
[9]李朝陽(yáng),龐弘燊.國(guó)內(nèi)外圖情領(lǐng)域關(guān)聯(lián)數(shù)據(jù)研究比較分析[J].圖書館研究,2020
[10]孫玉琦,魏楊燁.我國(guó)關(guān)聯(lián)數(shù)據(jù)研究的文獻(xiàn)計(jì)量分析[J].情報(bào)探索,2016
[11]許見亮.基于文獻(xiàn)計(jì)量學(xué)的我國(guó)檔案專業(yè)核心期刊分析與評(píng)價(jià)[D].安徽大學(xué),2007
[12]孫 浩.關(guān)于文獻(xiàn)計(jì)量服務(wù)的研究[J].現(xiàn)代情報(bào),2008
[13]陳文愛,楊 璐,趙瑞剛.專題文獻(xiàn)的計(jì)量學(xué)研究方法[J].情報(bào)資料工作,2007
[14]王建芳,屈寶強(qiáng),齊向華.我國(guó)文獻(xiàn)計(jì)量學(xué)近十年研究狀況[J].圖書情報(bào)工作,2003
[15]曹學(xué)艷,胡文靜.我國(guó)文獻(xiàn)計(jì)量學(xué)的發(fā)展[J].圖書情報(bào)工作,2004
(作者單位:西南大學(xué)計(jì)算機(jī)與信息科學(xué)學(xué)院)
作者簡(jiǎn)介:賈婧怡(1996-),女,漢族,河南洛陽(yáng)人,碩士研究生,研究方向:數(shù)字保存。