国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

我國(guó)人文社會(huì)科學(xué)文獻(xiàn)引文起飛分布規(guī)律探究

2022-05-19 06:58張靖雯孫建軍
情報(bào)學(xué)報(bào) 2022年4期
關(guān)鍵詞:睡美人比例系數(shù)

張靖雯,閔 超,孫建軍

(南京大學(xué)信息管理學(xué)院,南京 210023)

1 引 言

單篇文獻(xiàn)的被引過(guò)程是一個(gè)從零開始隨著時(shí)間逐漸累積的動(dòng)態(tài)過(guò)程,被引頻次在時(shí)間軸上呈現(xiàn)的曲線被稱為“引文曲線”[1]或“引文模式”[2]、“引文生命周期”[3]。一般而言,“經(jīng)典引文曲線”的動(dòng)態(tài)變化包括發(fā)表后進(jìn)入引用階段的首次被引,而后進(jìn)入引文快速成長(zhǎng)階段達(dá)到引用次數(shù)高峰,之后引用次數(shù)逐漸減少進(jìn)入衰老階段。在對(duì)引文動(dòng)態(tài)的研究中,閔超等[4]將引文理解為一種動(dòng)態(tài)變化的擴(kuò)散過(guò)程,并提出時(shí)間環(huán)境、首次被引、引文起飛、引文高峰、引文累積速度等引文擴(kuò)散要素及研究框架。其中,引文起飛作為引文擴(kuò)散的起點(diǎn),是引文生命周期由引入階段進(jìn)入快速增長(zhǎng)階段的轉(zhuǎn)折點(diǎn)[5],通常是文獻(xiàn)被廣泛采納、成為高影響力文獻(xiàn)的重要信號(hào)。

起飛最早用于描述市場(chǎng)中新產(chǎn)品銷售曲線從引入階段到成長(zhǎng)階段出現(xiàn)的急劇增長(zhǎng)的現(xiàn)象[6],如果將發(fā)表的文獻(xiàn)看作市場(chǎng)中的新產(chǎn)品,那么引文曲線中的起飛現(xiàn)象即為引文起飛。學(xué)界對(duì)于引文起飛的研究較少,“延遲承認(rèn)”現(xiàn)象的發(fā)現(xiàn),使引文曲線的快速增長(zhǎng)開始得到學(xué)者們的關(guān)注。van Raan[7]在2004 年將延遲承認(rèn)現(xiàn)象總結(jié)為睡美人,即文獻(xiàn)在發(fā)表后很長(zhǎng)一段時(shí)間內(nèi)處于低被引或零被引的狀態(tài),就如同沉睡的睡美人,而后在某個(gè)時(shí)點(diǎn)被喚醒,到達(dá)高被引狀態(tài);同時(shí)提出了睡美人文獻(xiàn)的量化定義。睡美人文獻(xiàn)的“蘇醒”是一類特殊引文曲線的起飛現(xiàn)象,我們將睡美人文獻(xiàn)的“蘇醒”點(diǎn)推廣至所有的引文曲線,普通文獻(xiàn)的引文曲線也有被引頻次迅速增長(zhǎng)的轉(zhuǎn)折點(diǎn),即引文起飛。引文動(dòng)態(tài)研究更加關(guān)注引文生命周期,從首次被引、引文峰值到文獻(xiàn)衰老。首次被引關(guān)注文獻(xiàn)從未被引用到引用的狀態(tài)轉(zhuǎn)變,許多研究基于首次被引構(gòu)建了引用速度指標(biāo)[8-9],用于評(píng)價(jià)文獻(xiàn)吸引引用的能力;引文峰值是引文曲線的最高點(diǎn),是文獻(xiàn)生命周期走向衰老的拐點(diǎn),許多研究從引文峰值入手對(duì)期刊影響因子等評(píng)價(jià)指標(biāo)進(jìn)行修正[10],預(yù)測(cè)引文完整生命周期[11]等。遺憾的是,引文起飛作為引文動(dòng)態(tài)中連接首次被與引文峰值的重要環(huán)節(jié)一直未在學(xué)界引起重視,而引文動(dòng)態(tài)特征相關(guān)的實(shí)證研究,學(xué)者大多選擇自然科學(xué)[3,10,12-14],部分學(xué)者選擇社會(huì)科學(xué)[15-17],只有極少數(shù)學(xué)者選擇人文科學(xué)[18]。

引文起飛作為文獻(xiàn)快速吸引引用的起點(diǎn),是學(xué)術(shù)成果被承認(rèn)和關(guān)注的關(guān)鍵節(jié)點(diǎn)[5],關(guān)于引文起飛的研究有助于進(jìn)一步理解文獻(xiàn)被引過(guò)程的動(dòng)態(tài)機(jī)制。因此,本文選擇人文社會(huì)科學(xué)領(lǐng)域文獻(xiàn),聚焦被引速度快速增長(zhǎng)的起點(diǎn),試圖探究引文起飛分布規(guī)律及分布模型,討論引文動(dòng)態(tài)擴(kuò)散內(nèi)在機(jī)制以及引文起飛在學(xué)科分類及被引速度指標(biāo)構(gòu)建中的相關(guān)應(yīng)用,為理解引文動(dòng)態(tài)模式提供新角度。

2 相關(guān)研究

2.1 引文起飛相關(guān)研究

起飛的概念由Golder 等[6]提出,用來(lái)描述新產(chǎn)品從引入階段到成長(zhǎng)階段產(chǎn)品銷售曲線急劇增長(zhǎng)的轉(zhuǎn)折現(xiàn)象。類似地,引文曲線也有從引入階段進(jìn)入成長(zhǎng)階段的轉(zhuǎn)折點(diǎn),即引文起飛。在引文分析中,通過(guò)對(duì)睡美人文獻(xiàn)的研究,引文起飛的現(xiàn)象得到學(xué)者們的關(guān)注。睡美人文獻(xiàn)表現(xiàn)為發(fā)表后一段時(shí)間是零被引或低被引,但在某個(gè)時(shí)點(diǎn)突然出現(xiàn)高被引。van Raan[7]在2004 年給出睡美人定義,并將睡美人特征歸納為沉睡期、喚醒期2 個(gè)時(shí)期,以及睡眠深度、睡眠時(shí)長(zhǎng)、喚醒強(qiáng)度3 個(gè)指標(biāo)。研究發(fā)現(xiàn),睡美人“沉睡期”一般在3~5 年,蘇醒期在4 年以上[19-20]。睡美人文獻(xiàn)是較為罕見(jiàn)的引文現(xiàn)象。Dey等[21]首次對(duì)計(jì)算機(jī)領(lǐng)域中的睡美人現(xiàn)象進(jìn)行識(shí)別,其中“算法與理論”和“科學(xué)計(jì)算”的子領(lǐng)域占全部睡美人文獻(xiàn)的50%。van Raan[13]在物理、化學(xué)工程及計(jì)算機(jī)科學(xué)3 個(gè)領(lǐng)域識(shí)別睡美人文獻(xiàn),發(fā)現(xiàn)睡美人文獻(xiàn)的數(shù)量在3 個(gè)領(lǐng)域中逐漸增加。Healy[18]在2760 篇哲學(xué)文獻(xiàn)中僅識(shí)別出4 篇睡美人文獻(xiàn),說(shuō)明哲學(xué)領(lǐng)域中的引用相對(duì)疏離。Ho 等[15]在心理學(xué)領(lǐng)域僅識(shí)別出3 篇睡美人文獻(xiàn)。Lange[16]識(shí)別了2 個(gè)心理學(xué)期刊的論文,發(fā)現(xiàn)命中型文獻(xiàn)(發(fā)表后不久就被科學(xué)界發(fā)現(xiàn)的作品)比睡美人文獻(xiàn)與學(xué)術(shù)界關(guān)注的熱點(diǎn)更相關(guān)。引文曲線的快速增長(zhǎng)是睡美人蘇醒的標(biāo)志。Li 等[22]通過(guò)觀察引文曲線快速增長(zhǎng)特征,發(fā)現(xiàn)了“全要素睡美人”,即睡美人文獻(xiàn)在沉睡前引文曲線出現(xiàn)引用跳躍。Li 等[19]引入基尼系數(shù),構(gòu)建“心跳圖譜”,基于睡美人文獻(xiàn)蘇醒的快速增長(zhǎng)特點(diǎn),通過(guò)計(jì)算引用分布的均勻性來(lái)識(shí)別睡美人文獻(xiàn)。Ke 等[23]從引文曲線點(diǎn)線角度出發(fā),連接引文最高點(diǎn)與原點(diǎn)作為參考線,規(guī)定引文曲線上與參考線垂直距離最大的點(diǎn)為睡美人文獻(xiàn)“蘇醒”時(shí)刻。睡美人文獻(xiàn)的識(shí)別研究使得引用的爆發(fā)增長(zhǎng)被學(xué)者關(guān)注,普通文獻(xiàn)的引文曲線也有進(jìn)入快速增長(zhǎng)的階段。Eom 等[24]在引文動(dòng)態(tài)研究中發(fā)現(xiàn)引文爆發(fā)(burst) 現(xiàn)象,并以引文增長(zhǎng)率進(jìn)行度量,發(fā)現(xiàn)90%文獻(xiàn)在發(fā)表后的前4 年出現(xiàn)引文爆發(fā)(增長(zhǎng)率>3)。睡美人文獻(xiàn)識(shí)別、引文爆發(fā)為引文起飛的識(shí)別提供了借鑒參考,相關(guān)研究提出了依據(jù)引文曲線分類選擇不同方法進(jìn)行引文起飛的識(shí)別[5]。引文起飛是普通文獻(xiàn)引文曲線被引頻次迅速增長(zhǎng)的轉(zhuǎn)折點(diǎn),對(duì)引文起飛的研究一方面能用于更好地識(shí)別睡美人文獻(xiàn),另一方面能進(jìn)一步探究高影響力文獻(xiàn)實(shí)現(xiàn)科學(xué)知識(shí)擴(kuò)散的內(nèi)在機(jī)制。

2.2 引文曲線特征研究

科學(xué)引文索引的建立使引文成為評(píng)估研究績(jī)效的重要指標(biāo)之一。引文數(shù)據(jù),如期刊影響因子[25]和科學(xué)家h 指數(shù)[26]等以被引頻次為基礎(chǔ)的量化指標(biāo)被廣泛應(yīng)用于學(xué)術(shù)文獻(xiàn)質(zhì)量和影響力的評(píng)價(jià)中。然而,被引是一個(gè)時(shí)間相關(guān)的二元事件,引文的發(fā)生是一個(gè)動(dòng)態(tài)的過(guò)程[4]。引文曲線是單篇文獻(xiàn)被引的動(dòng)態(tài)表現(xiàn),對(duì)引文曲線特征的研究主要集中在首次被引、引文波峰和睡美人文獻(xiàn)中。

首次被引是文獻(xiàn)打破零被引的重要起點(diǎn)。Nane[27]以 Web of Science 數(shù)據(jù)庫(kù) 2000 年收錄的文獻(xiàn)為研究對(duì)象,發(fā)現(xiàn)大多數(shù)文章在出版后2 年內(nèi)首次被引。Hancock[28]對(duì)期刊Journal of Research in Music Education(JRME) 1988 年至 2013 年的 617 篇文章進(jìn)行分析,發(fā)現(xiàn)25%的文章在出版2 年后首次被引,30%的文章在出版后3 年內(nèi)首次被引,90%的文章在出版后10 年內(nèi)首次被引;這與國(guó)內(nèi)學(xué)者武群芳等[17]對(duì)經(jīng)濟(jì)學(xué)科3 種期刊進(jìn)行研究發(fā)現(xiàn)10 年的時(shí)間可使文獻(xiàn)有充足時(shí)間至少獲得一次引用相一致。文獻(xiàn)實(shí)現(xiàn)首次被引的時(shí)間是文獻(xiàn)吸引引文能力的有力表現(xiàn)。Schubert 等[9]在即時(shí)指數(shù)(immediacy index)基礎(chǔ)上考慮文獻(xiàn)被引的時(shí)間因素,首次提出論文響應(yīng)時(shí)間(response time),即文獻(xiàn)出版日期到首次被引日期所經(jīng)過(guò)的時(shí)間。Egghe 等[8]基于h 指數(shù)思想提出首次被引速度指標(biāo)(first-citation-speed-in‐dex,F(xiàn)CSI),F(xiàn)CSI 越高,文獻(xiàn)從發(fā)布到第一次被引之間的時(shí)間越短。武群芳等[17]在Egghe 等[8]研究基礎(chǔ)上,引入零被引率對(duì)FCSI 指標(biāo)進(jìn)行改進(jìn)優(yōu)化,一定程度上彌補(bǔ)了FCSI 在大數(shù)據(jù)下區(qū)分度小的不足,但FCSI 指標(biāo)僅適用于文獻(xiàn)組或期刊。首次被引是文獻(xiàn)是否被“使用”的判斷標(biāo)準(zhǔn)。Rousseau[29]最早提出雙指數(shù)模型用來(lái)描述文獻(xiàn)組中首次被引的比例分布。Egghe[30]在此基礎(chǔ)上,提出遞減指數(shù)與洛特卡定律相結(jié)合的首次被引分布模型,實(shí)現(xiàn)凹形和S 形兩種曲線的擬合。高曉培等[31]以科技期刊論文為研究對(duì)象分析首次被引分布規(guī)律,發(fā)現(xiàn)不同學(xué)科、不同出版年的論文首次被引時(shí)間間隔均服從冪律分布。然而快速響應(yīng)并不意味著高影響力[32],文獻(xiàn)實(shí)現(xiàn)首次被引是文獻(xiàn)引用狀態(tài)的轉(zhuǎn)變,并非實(shí)現(xiàn)高被引的標(biāo)志。許多文獻(xiàn)可能在首次被引后便再無(wú)引用或短暫低被引后走向衰老,而引文起飛是文獻(xiàn)由低被引到高被引的轉(zhuǎn)折點(diǎn),是文獻(xiàn)實(shí)現(xiàn)知識(shí)擴(kuò)散、高影響力的重要起點(diǎn),因此,引文起飛的“響應(yīng)時(shí)間”一定程度上更能代表文獻(xiàn)吸引引文的能力。

首次被引后文獻(xiàn)被引數(shù)量逐年上升,到達(dá)引文峰值,即引文波峰。引文波峰是實(shí)現(xiàn)高影響力的重要時(shí)刻,波峰到達(dá)時(shí)間也得到眾多學(xué)者關(guān)注。姜春林等[33]統(tǒng)計(jì)分析了經(jīng)濟(jì)學(xué)、管理學(xué)和圖書情報(bào)學(xué)領(lǐng)域部分期刊,發(fā)現(xiàn)期刊引用峰值出現(xiàn)在出版后的1~3 年。Liu 等[10]以28 種眼科期刊作為研究對(duì)象,統(tǒng)計(jì)了2001—2006 年每年論文的引文趨勢(shì),發(fā)現(xiàn)被引峰值出現(xiàn)在發(fā)表后的2~4 年。黨蘭學(xué)[34]統(tǒng)計(jì)了50 本科技期刊被引數(shù)據(jù),發(fā)現(xiàn)科技期刊論文被學(xué)位論文引用的峰值出現(xiàn)在第8 年,而被期刊引用的峰值出現(xiàn)在第5 年。Bouabid[11]基于文獻(xiàn)引用模式利用引文峰值構(gòu)建模型預(yù)測(cè)文獻(xiàn)完整生命周期,發(fā)現(xiàn)不同國(guó)家間文獻(xiàn)引用峰值出現(xiàn)在4~5 年。Zhao 等[35]選擇Web of Science 中被引數(shù)最高的100 篇文獻(xiàn)的引用數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)高被引論文的引用峰值遠(yuǎn)遠(yuǎn)超過(guò)一般論文引用峰值,其分布平均值為21.9 年。李凌英等[12]以大量文獻(xiàn)數(shù)據(jù)為基礎(chǔ),對(duì)單篇文獻(xiàn)引文波峰分布分析后發(fā)現(xiàn)大多數(shù)文獻(xiàn)在發(fā)表后0~5 年到達(dá)被引首次波峰和最高峰。引文波峰是引文起飛后的直接表現(xiàn),引文曲線在引文起飛后進(jìn)入引文數(shù)量的快速增長(zhǎng)期從而出現(xiàn)引文波峰。對(duì)于引文起飛的進(jìn)一步研究有助于我們了解引文模式,預(yù)測(cè)引文峰值,構(gòu)建引文生命周期。

2.3 述 評(píng)

在研究領(lǐng)域上,引文曲線相關(guān)研究多以自然科學(xué)領(lǐng)域文獻(xiàn)為研究對(duì)象,如物理學(xué)[12]、醫(yī)學(xué)[10]等,部分研究涉及社會(huì)科學(xué)[15,17],極少數(shù)涉及人文科學(xué)[18]。由于學(xué)科的差異,自然科學(xué)相較于人文科學(xué)擁有更多的載文量和被引量,期刊引文索引及文獻(xiàn)分布規(guī)律最初是從自然科學(xué)文獻(xiàn)研究得來(lái)的[36]。然而隨著人文社會(huì)科學(xué)知識(shí)體系的不斷完善以及科學(xué)技術(shù)的快速發(fā)展,人文社會(huì)科學(xué)的“科學(xué)性”顯著增強(qiáng)[37],人文社會(huì)科學(xué)領(lǐng)域文獻(xiàn)及引文數(shù)量不斷增加,對(duì)人文社會(huì)科學(xué)引文的規(guī)律探究尤為必要。在數(shù)據(jù)集的選擇上,大多數(shù)學(xué)者只選擇了單個(gè)學(xué)科[10]或幾個(gè)學(xué)科[13]的文獻(xiàn),也有學(xué)者從期刊角度出發(fā),只選擇部分期刊作為研究數(shù)據(jù)來(lái)源[28]。Cl?nzel 等[32]選擇數(shù)學(xué)和細(xì)胞生物學(xué)文獻(xiàn)數(shù)據(jù)進(jìn)行研究時(shí)發(fā)現(xiàn)不同期刊、學(xué)科領(lǐng)域文獻(xiàn)首次被引分布差異較大。單一學(xué)科的數(shù)據(jù)研究結(jié)果具有較強(qiáng)的學(xué)科特點(diǎn)而不能推廣應(yīng)用至其他學(xué)科,具有一定的局限性。

在引文特征的研究對(duì)象上,目前學(xué)界關(guān)于引文起飛的研究較少,相關(guān)研究主要集中在首次被引、引文峰值和睡美人文獻(xiàn)。首次被引的研究主要集中在分布模型構(gòu)建和評(píng)價(jià)指標(biāo)的量化;引文峰值在其規(guī)律性探究基礎(chǔ)上更關(guān)注文獻(xiàn)生命周期,如通過(guò)引文峰值討論期刊影響因子的時(shí)間窗[10]。首次被引、引文峰值都是引文曲線的重要組成部分,首次被引關(guān)注文獻(xiàn)是否被“使用”的狀態(tài),以文獻(xiàn)轉(zhuǎn)變?yōu)椤笆褂谩睜顟B(tài)的時(shí)間評(píng)估文獻(xiàn)吸引引文的能力;而引文波峰作為文獻(xiàn)生命的“輝煌時(shí)刻”,是決定文獻(xiàn)生命周期的關(guān)鍵時(shí)刻。引文起飛作為連接首次被引與引文波峰的“中間角色”,與首次被引相比,引文起飛預(yù)示著引用的持續(xù)增長(zhǎng),更能體現(xiàn)文獻(xiàn)吸引引文的速度和能力;與引文波峰相比,引文起飛是引文波峰的必要條件,引文起飛的進(jìn)一步研究或許能探究更多的引用模式。睡美人文獻(xiàn)的“蘇醒”是特殊文獻(xiàn)上的引文起飛,對(duì)于所有文獻(xiàn)來(lái)說(shuō)都有其被“喚醒”的時(shí)刻,因此引文起飛更具一般性和普遍意義。

綜上所述,學(xué)界對(duì)于引文起飛的研究尚不夠充分,相關(guān)研究主要集中在睡美人文獻(xiàn),睡美人文獻(xiàn)的蘇醒是文獻(xiàn)進(jìn)入快速增長(zhǎng)的起飛點(diǎn),是引文起飛的典型代表。鑒于此,本文選擇我國(guó)人文社會(huì)科學(xué)領(lǐng)域的專業(yè)引文數(shù)據(jù)庫(kù)——中國(guó)社會(huì)科學(xué)引文索引(Chinese Social Sciences Citation Index,CSSCI),選擇10 年及以上引文時(shí)間窗,對(duì)應(yīng)24 個(gè)人文社會(huì)科學(xué)學(xué)科,對(duì)引文起飛分布及分布模型展開研究。

3 數(shù)據(jù)與方法

3.1 數(shù)據(jù)采集

中國(guó)社會(huì)科學(xué)引文索引(CSSCI)是我國(guó)專業(yè)的中文人文社會(huì)科學(xué)引文數(shù)據(jù)庫(kù),收錄管理學(xué)、經(jīng)濟(jì)學(xué)、歷史學(xué)、法學(xué)、政治學(xué)等學(xué)科800 多種學(xué)術(shù)期刊。本文采集CSSCI 數(shù)據(jù)庫(kù)1998—2018 年的文獻(xiàn)及引文數(shù)據(jù),截至2018 年,CSSCI 數(shù)據(jù)庫(kù)共計(jì)收錄171 萬(wàn)余篇學(xué)術(shù)論文和超過(guò)232 萬(wàn)論文間引用關(guān)系對(duì)。引文曲線的形成需要一定的時(shí)間,單篇文獻(xiàn)年均被引頻次過(guò)低,甚至為零時(shí),引文曲線呈現(xiàn)不規(guī)則波形,大量不規(guī)則波形引文曲線掩蓋了其他規(guī)則引文曲線,會(huì)影響研究結(jié)果的科學(xué)性和有效性。因此,本文選擇時(shí)間窗在10 年以上(包括10 年)、年均被引頻次不小于1 的文獻(xiàn),即2008 年以前(包括2008 年)發(fā)表的總被引頻次不少于20 的文獻(xiàn),對(duì)應(yīng)24 個(gè)學(xué)科,共計(jì)7553 篇。

3.2 引文起飛識(shí)別

目前,學(xué)界對(duì)于引文起飛并沒(méi)有系統(tǒng)的識(shí)別方法。在前期的工作中,我們提出利用論文被引速率(citation speed,CS)對(duì)引文曲線進(jìn)行分類,根據(jù)引文曲線類型不同分別運(yùn)用人為參數(shù)法、年度引文法和年均被引法進(jìn)行引文起飛的識(shí)別[5]。

對(duì)7553 篇文獻(xiàn)進(jìn)行引文起飛的識(shí)別,人為參數(shù)識(shí)別法的識(shí)別率為69.67%,總體引文起飛識(shí)別正確率達(dá)90%以上。通過(guò)人為參數(shù)識(shí)別方法發(fā)現(xiàn)部分文獻(xiàn)有2 個(gè)以上起飛點(diǎn)。其中,大部分文獻(xiàn)只有1 個(gè)起飛點(diǎn),占總文獻(xiàn)的78.73%;1336 篇文獻(xiàn)有2 個(gè)引文起飛點(diǎn),占17.69%;少數(shù)文獻(xiàn)的起飛點(diǎn)個(gè)數(shù)可達(dá)4 個(gè),占總文獻(xiàn)的0.42%??梢?jiàn)引文起飛作為文獻(xiàn)影響力快速增長(zhǎng)的轉(zhuǎn)折點(diǎn),大部分文獻(xiàn)生命周期中有且僅出現(xiàn)1 次。本文僅選擇第一次起飛點(diǎn)為研究對(duì)象,探究引文起飛分布規(guī)律。引文起飛在4 種曲線類型中的識(shí)別情況如圖1 所示。由圖1 可見(jiàn),利用被引速率對(duì)引文曲線分類后根據(jù)不同曲線類型選擇相應(yīng)的方法進(jìn)行引文識(shí)別的效果較好。

圖1 4種曲線類型引文起飛識(shí)別情況

4 結(jié)果與分析

4.1 數(shù)據(jù)的基本特征

通過(guò)計(jì)算論文被引速率(CS)對(duì)7553 篇文獻(xiàn)的引文曲線進(jìn)行分類,論文被引速率代表論文累計(jì)被引的速度,本文分別以0.3、0.5、0.7 為分界將引文曲線分為延遲承認(rèn)型、厚積薄發(fā)型、領(lǐng)先優(yōu)勢(shì)型和曇花一現(xiàn)型。如圖2 所示,厚積薄發(fā)型和領(lǐng)先優(yōu)勢(shì)型文獻(xiàn)數(shù)量最多,分別為3567 篇(占47.2%)和3370 篇(占44.6%),曇花一現(xiàn)型文獻(xiàn)為461 篇(占6.1%),延遲承認(rèn)型文獻(xiàn)數(shù)量最少,僅155 篇,占文獻(xiàn)總數(shù)的2.1%。由此也證明,大部分文獻(xiàn)的被引曲線符合經(jīng)典的引文生命周期曲線,即文獻(xiàn)發(fā)表后被引頻次逐漸增加,達(dá)到峰值后逐漸減少。

圖2 文獻(xiàn)類型分布

對(duì)文獻(xiàn)引文起飛識(shí)別結(jié)果進(jìn)行統(tǒng)計(jì)(表1),發(fā)現(xiàn)近一半的文獻(xiàn)(3191 篇,42.2%)在發(fā)表年就實(shí)現(xiàn)引文起飛;起飛時(shí)間距發(fā)表年10 年以上(包括10 年)的文獻(xiàn)有391 篇,占文獻(xiàn)總數(shù)的5.2%;起飛時(shí)間最晚的可在發(fā)表后18 年才實(shí)現(xiàn)引文起飛(3篇,0.04%)。文獻(xiàn)數(shù)量隨引文起飛時(shí)點(diǎn)的增加而逐漸減少。從被引均值上來(lái)看,起飛時(shí)點(diǎn)較早的文獻(xiàn)被引頻次普遍較高,在發(fā)表年就實(shí)現(xiàn)引文起飛的文獻(xiàn)篇被引均值為48 次,而發(fā)表后18 年才實(shí)現(xiàn)起飛的被引均值為26 次,前者幾乎是后者的2 倍,也印證了睡美人文獻(xiàn)是少數(shù)現(xiàn)象。

表1 引文起飛時(shí)間分布

4.2 引文起飛與首次被引、總被引數(shù)

首次被引是文獻(xiàn)突破零被引狀態(tài)的起點(diǎn),而引文起飛是文獻(xiàn)進(jìn)入快速引用的轉(zhuǎn)折點(diǎn),是引文知識(shí)擴(kuò)散起點(diǎn)。首次被引和引文起飛兩者之間可能存在重疊。當(dāng)引文起飛出現(xiàn)在首次被引前一年或兩者重疊時(shí),說(shuō)明文獻(xiàn)首次被引后就進(jìn)入快速引用階段;當(dāng)引文起飛在首次被引之后時(shí),說(shuō)明引文曲線經(jīng)歷成長(zhǎng)階段后快速增長(zhǎng),也可能是睡美人文獻(xiàn)。在7553 篇文獻(xiàn)中,較多文獻(xiàn)在發(fā)表年或發(fā)表第一年達(dá)到引文起飛狀態(tài),共4194 篇,占全部文獻(xiàn)的55.5%;87%的文獻(xiàn)在發(fā)表后的6 年內(nèi)達(dá)到引文起飛狀態(tài)。說(shuō)明大部分文獻(xiàn)在發(fā)表初期就進(jìn)入引文快速增長(zhǎng)階段,而后達(dá)到生命周期峰值,這與首次被引[27]、波峰分布[12]研究相一致。

將首次被引距離發(fā)表年時(shí)間與引文起飛距離發(fā)表年的時(shí)間分別作為X 軸和Y 軸,觀察首次被引與引文起飛不同位置的文獻(xiàn)數(shù)量對(duì)數(shù)分布,如圖3 所示,色塊顏色越深代表文獻(xiàn)數(shù)量越多。從圖3 可以看出,大部分文獻(xiàn)集中分布在左下角,且文獻(xiàn)首次被引和引文起飛緊鄰在一起,首次被引距離發(fā)表年的時(shí)間間隔越小,引文起飛與首次被引的時(shí)間間隔也越小,說(shuō)明大多數(shù)文獻(xiàn)“適應(yīng)力”較強(qiáng),并且由于優(yōu)先鏈接機(jī)制,在早期首次被引后直接進(jìn)入引文快速增長(zhǎng)階段。

圖3 首次被引-引文起飛對(duì)數(shù)分布

一般認(rèn)為,文獻(xiàn)的被引頻次在一定程度上反映了文獻(xiàn)的影響力。在首次被引和引文起飛關(guān)系的基礎(chǔ)上引入文獻(xiàn)的總被引頻次指標(biāo),構(gòu)建三維空間散點(diǎn)分布圖。在圖4 中,X 軸表示首次被引時(shí)點(diǎn),Y軸表示引文起飛時(shí)點(diǎn),Z 軸表示文獻(xiàn)總被引頻次,每個(gè)圓點(diǎn)代表1 篇文獻(xiàn)。文獻(xiàn)密集地分布在首次被引時(shí)點(diǎn)0~3 年,起飛時(shí)點(diǎn)在0~3 年,總被引頻次在200 次以下區(qū)域。從總體分布來(lái)看,高被引文獻(xiàn)一般在發(fā)表2 年內(nèi)實(shí)現(xiàn)首次被引,在發(fā)表5 年內(nèi)實(shí)現(xiàn)引文起飛。這表明如果一篇文獻(xiàn)在發(fā)表初期得到初次引用并進(jìn)入快速增長(zhǎng)階段,就容易獲得更多引用,成為高被引文獻(xiàn)。當(dāng)引文起飛距離發(fā)表年的時(shí)間間隔較長(zhǎng)時(shí),文獻(xiàn)獲得高被引的概率將大大下降。

圖4 引文起飛-首次被引-總被引數(shù)三維散點(diǎn)分布

由于文獻(xiàn)總被引頻次分布差值較大,本文選取按被引頻次排序后的前20%共1511 篇文獻(xiàn)作為高被引文獻(xiàn),以此為界,對(duì)比高被引文獻(xiàn)和非高被引文獻(xiàn)三維散點(diǎn)分布情況。從分布密度可以看出,高被引文獻(xiàn)的首次被引集中分布在發(fā)表后0~2 年,引文起飛集中分布在發(fā)表后0~3 年;而非高被引文獻(xiàn)分布較為散亂,沒(méi)有明顯的集中分布現(xiàn)象。在高被引文獻(xiàn)分布中(圖4a),引文起飛距離發(fā)表年較長(zhǎng)的文獻(xiàn)可能為睡美人文獻(xiàn)。

4.3 引文起飛指數(shù)分布模型及擬合

1)引文起飛分布基本特征

對(duì)于文獻(xiàn)的首次被引,不少研究提出了如雙指數(shù)模型[29]、冪律分布模型[31]等用于探究首次被引的分布問(wèn)題。與首次被引相似,CSSCI 論文的引文起飛論文數(shù)與引文起飛論文比例分布規(guī)律是我們考察的內(nèi)容。

繪制引文起飛的論文數(shù)比例分布趨勢(shì)圖,X 軸代表引文起飛時(shí)間,Y 軸代表不同引文起飛時(shí)間下的論文數(shù)量比例,如圖5 中的圓點(diǎn)所示。從圖5 中可以看出,引文起飛分布趨勢(shì)為當(dāng)引文起飛時(shí)間較小時(shí),論文數(shù)量比例隨著引文起飛距離發(fā)表年的時(shí)間增多而迅速下降;當(dāng)引文起飛時(shí)間較大時(shí),論文數(shù)量比例緩慢下降,引文起飛分布曲線呈指數(shù)分布。

圖5 引文起飛論文比例擬合效果

2)引文起飛的分布規(guī)律描述

引文起飛論文數(shù)比例分布呈凹形,總體分布呈指數(shù)分布。因此,本文選擇指數(shù)分布模型嘗試對(duì)引文起飛分布特性進(jìn)行擬合。指數(shù)分布也稱負(fù)指數(shù)分布,在統(tǒng)計(jì)學(xué)中,是描述泊松過(guò)程中事件的時(shí)間概率分布。一般情況下的指數(shù)分布的概率密度函數(shù)表示為

其中,參數(shù)λ>0,指數(shù)分布的區(qū)間是[0,∞),與引文起飛時(shí)點(diǎn)的取值區(qū)間相一致。因此,根據(jù)指數(shù)分布的概率密度函數(shù),以t表示引文起飛距發(fā)表年的時(shí)間,以R(t)表示引文起飛時(shí)點(diǎn)論文比例,引文起飛論文比例分布的指數(shù)分布規(guī)律可以表示為

其中,α、β、C均為常數(shù)。公式(2)可以解讀為在一組論文中,引文起飛論文比例服從參數(shù)為β的指數(shù)分布,α+C是論文發(fā)表年就實(shí)現(xiàn)起飛的論文比例。

對(duì)引文起飛論文數(shù)比例分布使用指數(shù)分布函數(shù)進(jìn)行擬合,擬合后的引文起飛論文比例分布函數(shù)為R(t) = 0.39e-0.93t+ 0.02,反映擬合效果的擬合優(yōu)度R2=0.96,R2值越大,說(shuō)明擬合效果越好。指數(shù)分布函數(shù)的擬合曲線如圖5 中虛線所示,可見(jiàn)擬合曲線與論文數(shù)比例分布(圓點(diǎn))較為一致。

4.4 人文社會(huì)科學(xué)引文起飛學(xué)科模型擬合

1)學(xué)科文獻(xiàn)引文起飛分布情況

表2 列出了7553 篇文獻(xiàn)數(shù)據(jù)的基本特征??梢钥闯觯鲗W(xué)科論文數(shù)量分布差異較大,其中,經(jīng)濟(jì)學(xué)類的論文數(shù)量最多,占論文總數(shù)的42.5%,也是除軍事學(xué)外被引均值最高的學(xué)科,其文章的最大被引達(dá)1687 次。管理學(xué)和圖書館、情報(bào)與文獻(xiàn)學(xué)(下文簡(jiǎn)稱“圖情文獻(xiàn)學(xué)”)緊隨其后,分別有1184 篇(占15.7%)和611 篇(占8.1%)。從最大被引數(shù)來(lái)看,經(jīng)濟(jì)學(xué)(1687)、心理學(xué)(1022) 和管理學(xué)(794)3 個(gè)學(xué)科的最大被引較大,而宗教學(xué)的最大被引僅為29,可能是由于經(jīng)濟(jì)學(xué)、心理學(xué)和管理學(xué)論文數(shù)較多而宗教學(xué)論文數(shù)較少。不同學(xué)科引文起飛時(shí)間均值分布在1~4 年,不同學(xué)科篇均引文起飛差異較大,其中,文學(xué)、考古學(xué)、歷史學(xué),以及人文、經(jīng)濟(jì)地理等學(xué)科引文起飛時(shí)間均值都在4 年以上,而經(jīng)濟(jì)學(xué)、管理學(xué)、新聞傳播學(xué)等學(xué)科引文起飛時(shí)間均值較短,圖情文獻(xiàn)學(xué)篇均引文起飛僅為1.05年。學(xué)科間引文起飛均值差在2 年以上,可見(jiàn)引文起飛在不同學(xué)科間具有一定差異。由于部分學(xué)科的文獻(xiàn)數(shù)量較少,如馬克思主義、軍事學(xué)、藝術(shù)學(xué)和教育學(xué)4 個(gè)學(xué)科論文數(shù)僅為個(gè)位數(shù),為了保證學(xué)科特征分析的準(zhǔn)確性,本文僅選取文獻(xiàn)數(shù)量在100 以上的學(xué)科進(jìn)行學(xué)科引文起飛規(guī)律分析,共計(jì)10個(gè)學(xué)科。

表2 文獻(xiàn)數(shù)據(jù)集的特征值

2)各學(xué)科引文起飛分布規(guī)律擬合效果

由上文分析可知,引文起飛總體分布規(guī)律符合指數(shù)分布,按學(xué)科分類進(jìn)行引文起飛論文比例的分布規(guī)律擬合,考察各學(xué)科的擬合情況。從擬合結(jié)果來(lái)看,除政治學(xué)學(xué)科的擬合優(yōu)度為0.88 外,其他學(xué)科的擬合優(yōu)度均在0.90 以上,說(shuō)明各學(xué)科引文起飛論文數(shù)比例分布都可用指數(shù)函數(shù)來(lái)近似表征。

觀察表3 擬合系數(shù)發(fā)現(xiàn),不同學(xué)科間擬合系數(shù)α、β、C有一定差異。其中,系數(shù)β差異較大,圖情文獻(xiàn)學(xué)系數(shù)β為2.052,而心理學(xué)的擬合系數(shù)β僅為0.343。為了進(jìn)一步探究不同β系數(shù)的學(xué)科擬合曲線差異以及α、β系數(shù)代表的具體內(nèi)涵,本文選擇擬合系數(shù)α相近、擬合系數(shù)β大于1 的圖情文獻(xiàn)學(xué)、新聞學(xué)與傳播學(xué),以及擬合系數(shù)β相近且小于1 的社會(huì)學(xué)、心理學(xué)共4 個(gè)典型學(xué)科,分為A、B 兩組,根據(jù)擬合效果圖,探究系數(shù)β含義。由圖6 擬合曲線的形狀可以看出,當(dāng)β>1 時(shí),引文起飛論文數(shù)比例隨引文起飛時(shí)間的增加而快速下降,擬合曲線呈現(xiàn)出接近90°的急轉(zhuǎn),曲線轉(zhuǎn)折點(diǎn)靠近Y 軸;當(dāng)β<1時(shí),引文起飛論文數(shù)比例隨引文起飛時(shí)間的增加而緩慢下降,擬合的指數(shù)函數(shù)曲線形狀柔和,呈圓滑的弧線,曲線轉(zhuǎn)折點(diǎn)離Y 軸較遠(yuǎn)。當(dāng)擬合系數(shù)α相近時(shí),β系數(shù)越大(如A 組的圖情文獻(xiàn)學(xué)和B 組的管理學(xué)),引文起飛時(shí)點(diǎn)分布就越集中,發(fā)表年起飛的文獻(xiàn)數(shù)遠(yuǎn)高于其他時(shí)點(diǎn)起飛文獻(xiàn)。由此可以推斷,系數(shù)β反映的是引文起飛論文數(shù)比例隨引文起飛時(shí)間下降的快慢,即學(xué)科中起飛時(shí)點(diǎn)分布差異的大小。當(dāng)系數(shù)β值越大時(shí),引文起飛論文數(shù)比例隨引文起飛時(shí)間的增加下降越快。因此,擬合系數(shù)β一定程度上反映了文獻(xiàn)集中引文起飛時(shí)間分布的集中離散情況。

圖6 引文起飛論文比例擬合效果

表3 各學(xué)科擬合特征值

選擇擬合系數(shù)β相近、α系數(shù)相差較大的新聞學(xué)與傳播學(xué)和法學(xué)2 個(gè)學(xué)科繪制擬合效果(圖7),探究系數(shù)α含義。當(dāng)擬合系數(shù)β相近時(shí),擬合曲線形狀相近,而α較大的新聞學(xué)與傳播學(xué)在發(fā)表年起飛的文獻(xiàn)比例高,α較小的法學(xué)在發(fā)表年起飛的文獻(xiàn)比例較小。由擬合公式可知,文獻(xiàn)發(fā)表年就實(shí)現(xiàn)引文起飛的文獻(xiàn)數(shù)占比為α+C,而實(shí)際數(shù)據(jù)的擬合可以發(fā)現(xiàn)擬合系數(shù)C遠(yuǎn)遠(yuǎn)小于α,均值在0.01 左右。因此,擬合系數(shù)α可近似表示某學(xué)科在發(fā)表年實(shí)現(xiàn)引文起飛文獻(xiàn)比例,系數(shù)α值越大,在發(fā)表年實(shí)現(xiàn)引文起飛文獻(xiàn)比例越高。

圖7 不同擬合系數(shù)α的引文起飛論文比例擬合效果

在學(xué)科層面上觀察擬合系數(shù)α和β可以發(fā)現(xiàn),不同學(xué)科在擬合系數(shù)上具有較大差異。對(duì)于圖情文獻(xiàn)學(xué)、新聞學(xué)與傳播學(xué)和經(jīng)濟(jì)學(xué)等更貼近生活的學(xué)科,α、β值相近且較大,說(shuō)明學(xué)科吸引引用能力較強(qiáng);而對(duì)于管理學(xué)、語(yǔ)言學(xué)和心理學(xué)等理論性較強(qiáng)的學(xué)科,α值相近且較小,學(xué)科吸引引用速度較慢。

4.5 不同被引頻次擬合結(jié)果

文獻(xiàn)被引頻次一定程度上反映了科學(xué)研究的影響力。高被引文獻(xiàn)與非高被引文獻(xiàn)引文起飛是否服從指數(shù)分布?為了進(jìn)一步探究擬合結(jié)果系數(shù)內(nèi)在含義,探尋高被引文獻(xiàn)形成的內(nèi)在機(jī)制,本文按照總被引頻次從高到低排列,前25%的文獻(xiàn)和后25%的文獻(xiàn)分別劃為被引頻次較高組和被引頻次較低組,其他的文獻(xiàn)為被引頻次適中組,共三組。被引頻次高、中、低三組文獻(xiàn)的引文起飛擬合結(jié)果如表4 和圖8 所示,不同被引頻次組引文起飛比例分布均符合指數(shù)分布,擬合優(yōu)度都在0.93 以上。

圖8 不同被引頻次引文起飛比例分布擬合效果

表4 不同被引頻次引文起飛比例分布擬合結(jié)果

觀察擬合系數(shù)可以發(fā)現(xiàn),高被引頻次文獻(xiàn)組擬合系數(shù)α和β均大于中、低被引頻次組,可見(jiàn)高被引文獻(xiàn)引文起飛分布更為集中,近一半的文獻(xiàn)在發(fā)表年實(shí)現(xiàn)引文起飛,這說(shuō)明多數(shù)具有高被引潛力的論文在發(fā)表之初就實(shí)現(xiàn)了引文起飛,高被引文獻(xiàn)擬合曲線的尾部是睡美人文獻(xiàn)??梢园l(fā)現(xiàn),擬合系數(shù)α隨著被引頻次的降低而變小,被引頻次較低的文獻(xiàn)組擬合系數(shù)α、β均小于被引頻次居中和被引頻次較高的文獻(xiàn)組。然而在被引頻次較低的文獻(xiàn)組中,大部分文獻(xiàn)在發(fā)表后2年內(nèi)實(shí)現(xiàn)引文起飛,反映了人們?cè)谝梦墨I(xiàn)時(shí)一般傾向于引用較新的文獻(xiàn)闡述當(dāng)前研究現(xiàn)狀,也進(jìn)一步說(shuō)明了文獻(xiàn)發(fā)表時(shí)間越久,其被引用的概率會(huì)越低。

5 討 論

5.1 引文起飛分布的內(nèi)在機(jī)制

從引文起飛的分布規(guī)律來(lái)看,大多數(shù)文獻(xiàn)在發(fā)表后1~3 年內(nèi)實(shí)現(xiàn)引文起飛,首次被引往往伴隨著引文起飛。文獻(xiàn)從發(fā)表到被引,經(jīng)歷了首次被引、引文起飛,進(jìn)而實(shí)現(xiàn)引文高峰。關(guān)于引文高峰的分布,不論是以期刊為單位的文獻(xiàn)集或是單篇文獻(xiàn),引文高峰均出現(xiàn)在文獻(xiàn)發(fā)表后的5 年內(nèi)[10,38],這與本文的研究發(fā)現(xiàn)是相一致的。文獻(xiàn)被引表明文獻(xiàn)受到學(xué)界的關(guān)注,產(chǎn)生影響;當(dāng)論文撰寫者在查找相關(guān)主題的文獻(xiàn)時(shí),為了了解領(lǐng)域內(nèi)最新研究成果,研究者一般傾向于閱讀最近發(fā)表的論文,并在研究成果中進(jìn)行引用。因此,對(duì)于新發(fā)表的文獻(xiàn),在引用上具有一定的“優(yōu)先優(yōu)勢(shì)”[39]。普賴斯提出的“累積優(yōu)勢(shì)”[40]進(jìn)一步解釋了引文起飛的產(chǎn)生,文獻(xiàn)被引用的概率與其被引頻次成正比,即文獻(xiàn)的被引頻次越高,獲得引用的概率越大。在發(fā)表初期就獲得引用的文獻(xiàn)與未被引用的文獻(xiàn)相比,由于“累積優(yōu)勢(shì)”更容易獲得更多的引用,從而實(shí)現(xiàn)引文起飛;Schubert 等[9]的研究也表明,4 年內(nèi)沒(méi)有獲得被引的文獻(xiàn)之后獲得引用的概率也大大降低。

高被引文獻(xiàn)引文起飛集中分布在文獻(xiàn)發(fā)表初期,近一半的高被引文獻(xiàn)在發(fā)表年即實(shí)現(xiàn)了引文起飛,而低被引文獻(xiàn)引文起飛的分布較為離散。從引文起飛時(shí)點(diǎn)與篇均被引頻次來(lái)看,隨著引文起飛時(shí)

點(diǎn)的增加,篇均被引頻次逐漸減少。引文起飛是文獻(xiàn)實(shí)現(xiàn)其影響力擴(kuò)散的重要起點(diǎn),是文獻(xiàn)吸引引文能力的重要體現(xiàn),潛在的高被引文獻(xiàn)具有快速吸引引用實(shí)現(xiàn)引文起飛的能力,這與文獻(xiàn)引用的適應(yīng)性機(jī)制[41]是相一致的,適應(yīng)性節(jié)點(diǎn)在加入網(wǎng)絡(luò)后能以較快的速度獲取鏈接并超越舊節(jié)點(diǎn)。

5.2 引文起飛分布的應(yīng)用

(1)為學(xué)科知識(shí)門類劃分提供參考??茖W(xué)文獻(xiàn)是知識(shí)成果的重要載體,其所承載的知識(shí)在傳播和利用過(guò)程中必然經(jīng)歷擴(kuò)散老化的過(guò)程,而不同的學(xué)科、知識(shí)門類由于內(nèi)在的學(xué)科特質(zhì),其知識(shí)引用、擴(kuò)散及衰老過(guò)程存在一定差異性。不少研究也證明了不同學(xué)科領(lǐng)域間的引用存在顯著差異[42-43]。Moed[44]發(fā)現(xiàn),面向大眾研究的文獻(xiàn)更易吸引引用;也有研究發(fā)現(xiàn)知識(shí)面較窄的學(xué)科獲得引用概率較低[45]。在文獻(xiàn)老化研究中,普賴斯指數(shù)從文獻(xiàn)的參考文獻(xiàn)角度出發(fā)衡量各知識(shí)領(lǐng)域文獻(xiàn)的老化程度,通過(guò)比較普賴斯指數(shù)可以發(fā)現(xiàn)不同學(xué)科領(lǐng)域存在不同老化規(guī)律[46-47]。引文起飛比例分布模型的擬合以單篇文獻(xiàn)的引文曲線為研究對(duì)象,以文獻(xiàn)生命周期為基礎(chǔ),一定程度上反映了科學(xué)文獻(xiàn)知識(shí)擴(kuò)散、老化的整體趨勢(shì),其擬合系數(shù)α和β對(duì)科學(xué)文獻(xiàn)集的引文起飛整體分布進(jìn)行量化描述,是科學(xué)文獻(xiàn)集吸引引用速度的重要體現(xiàn)。通過(guò)不同學(xué)科的引文起飛比例分布擬合結(jié)果可以發(fā)現(xiàn),學(xué)科性質(zhì)較為相似的學(xué)科α和β值較為接近,如圖情文獻(xiàn)學(xué)、新聞學(xué)與傳播學(xué)。不同學(xué)科α、β系數(shù)差異較大,擬合系數(shù)α、β一定程度上反映了文獻(xiàn)集知識(shí)擴(kuò)散的整體趨勢(shì),可為學(xué)科、知識(shí)門類劃分提供參考。

(2)為引用速率指標(biāo)構(gòu)建提供新角度。科學(xué)文獻(xiàn)的被引頻次一直被視為科學(xué)評(píng)價(jià)的重要指標(biāo),被引頻次作為固定時(shí)間窗內(nèi)的靜態(tài)指標(biāo),其弊端也不斷顯現(xiàn)。從引用的動(dòng)態(tài)角度來(lái)看,科學(xué)文獻(xiàn)的質(zhì)量不僅體現(xiàn)在被引頻次上,更體現(xiàn)在文獻(xiàn)的被引速度上[48]。Schubert 等[9]最早將被引速度引入文獻(xiàn)計(jì)量學(xué),而早期的被引速度僅以首次被引速度作為計(jì)量指標(biāo),以文獻(xiàn)由零被引進(jìn)入被引的狀態(tài)轉(zhuǎn)變衡量文獻(xiàn)科學(xué)研究質(zhì)量[30]。然而,首次被引僅代表文獻(xiàn)被引生命周期的開始,是文獻(xiàn)“被利用”的起點(diǎn),而引文起飛代表著文獻(xiàn)“被廣泛關(guān)注”的起點(diǎn)。比如,睡美人文獻(xiàn)在發(fā)表初期獲得首次被引后一直處于低被引狀態(tài),多年后突然被廣泛關(guān)注實(shí)現(xiàn)引文起飛。因此,以引文起飛時(shí)間構(gòu)建學(xué)術(shù)評(píng)價(jià)指標(biāo)衡量文獻(xiàn)被引速度、吸引引文的能力,用于評(píng)價(jià)科學(xué)文獻(xiàn)質(zhì)量更具有說(shuō)服力,為學(xué)術(shù)評(píng)價(jià)提供了一個(gè)新的視角。

6 結(jié) 論

本文在前期研究工作基礎(chǔ)上,通過(guò)對(duì)引文曲線中引文起飛的識(shí)別,選擇人文社會(huì)科學(xué)領(lǐng)域,探究我國(guó)人文社會(huì)科學(xué)引文起飛分布規(guī)律及學(xué)科間的差異,擴(kuò)充引文起飛研究框架。本研究發(fā)現(xiàn):①大部分文獻(xiàn)只有一個(gè)引文起飛點(diǎn)。引文起飛作為文獻(xiàn)被認(rèn)可和廣泛采納的起點(diǎn),大部分文獻(xiàn)生命周期中有且僅出現(xiàn)1 次,這符合文獻(xiàn)生命周期理論;我國(guó)人文社會(huì)科學(xué)文獻(xiàn)引文起飛主要分布在發(fā)表后的0~3年,并且首次被引往往伴隨著引文起飛,高被引文獻(xiàn)的引文起飛時(shí)間分布較為集中。②引文起飛的論文數(shù)比例分布符合負(fù)指數(shù)分布規(guī)律,指數(shù)分布函數(shù)的擬合效果良好。各學(xué)科間的引文起飛分布均符合負(fù)指數(shù)分布。指數(shù)分布函數(shù)的擬合系數(shù)α可近似表示某學(xué)科在發(fā)表年實(shí)現(xiàn)引文起飛的文獻(xiàn)比例,擬合系數(shù)β一定程度上反映了論文在引文起飛時(shí)間分布上的集中離散情況。③我國(guó)人文社會(huì)科學(xué)各學(xué)科引文起飛分布規(guī)律有較大差異。其中,圖書館、情報(bào)與文獻(xiàn)學(xué),以及新聞學(xué)與傳播學(xué)引文起飛均值較小,引文起飛比例時(shí)間分布較為相近,在發(fā)表年實(shí)現(xiàn)引文起飛的文獻(xiàn)占比較大,文獻(xiàn)在起飛時(shí)間上的分布較為集中;而心理學(xué)、法學(xué)引文起飛均值較大,從引文起飛比例分布來(lái)看,發(fā)表年實(shí)現(xiàn)引文起飛的文獻(xiàn)占比不足一半,文獻(xiàn)在起飛時(shí)間上的分布較為均勻離散。從學(xué)科層面來(lái)看,擬合系數(shù)一定程度上代表了學(xué)科和知識(shí)門類的劃分。④不同被引頻次分組均服從引文起飛比例的指數(shù)分布。不同被引頻次的引文起飛指數(shù)分布模型能進(jìn)一步解釋文獻(xiàn)被引的內(nèi)在機(jī)制和睡美人現(xiàn)象。

本文以我國(guó)人文社會(huì)科學(xué)文獻(xiàn)作為研究對(duì)象探究引文起飛分布規(guī)律,在引文起飛識(shí)別基礎(chǔ)上進(jìn)一步探究文獻(xiàn)引用過(guò)程的內(nèi)在機(jī)制。本文在數(shù)據(jù)選擇上僅以人文社會(huì)科學(xué)領(lǐng)域文獻(xiàn)為研究對(duì)象,研究結(jié)論是否適用于自然科學(xué)領(lǐng)域是一個(gè)值得探討的問(wèn)題。相關(guān)研究也表明,由于不同的出版和引文環(huán)境,文獻(xiàn)的引用在學(xué)科間存在差異,如自然科學(xué)相較于人文社會(huì)科學(xué),高被引更集中,文獻(xiàn)老化速度較快[36];相較于人文社會(huì)科學(xué),自然科學(xué)領(lǐng)域睡美人文獻(xiàn)占比高于人文社會(huì)科學(xué)領(lǐng)域[15,18]。故后續(xù)研究工作可進(jìn)一步對(duì)比人文社會(huì)科學(xué)領(lǐng)域和自然科學(xué)領(lǐng)域引文起飛分布規(guī)律的差異,挖掘影響引文起飛相關(guān)因素,探討不同層面引文起飛模型擬合系數(shù)代表的深層含義及具體應(yīng)用。

猜你喜歡
睡美人比例系數(shù)
人體比例知多少
組成比例三法
小小糕點(diǎn)師
蘋果屋
嬉水
用比例解幾何競(jìng)賽題
GO GO SLEEP!睡出水光??!
《睡美人怕什么》等
睡美人(中)
待定系數(shù)法在分解因式中的應(yīng)用
永州市| 洛宁县| 昌乐县| 英山县| 安达市| 奇台县| 承德市| 商城县| 乌兰察布市| 浙江省| 乌鲁木齐市| 喜德县| 盱眙县| 错那县| 温州市| 沙田区| 和静县| 鹤岗市| 启东市| 靖江市| 翁牛特旗| 抚远县| 南投县| 焉耆| 安多县| 麦盖提县| 辛集市| 贵德县| 宜兰市| 庆云县| 大城县| 四川省| 当涂县| 民丰县| 靖宇县| 内江市| 鹤岗市| 宜阳县| 双牌县| 大竹县| 凌云县|