高健航 高繼平 師麗娟
(1.中國農(nóng)業(yè)大學(xué)情報研究中心 北京 100083;2.中國科學(xué)技術(shù)信息研究所 北京 100038)
一篇論文的學(xué)術(shù)影響可以通過被引頻次為計量指標進行定量測度[1-2]。20世紀60年代,科研人員發(fā)現(xiàn),在高被引論文中,有一部分在發(fā)表之初并未得到學(xué)界認可,但在發(fā)表多年之后由于某些原因被引數(shù)量激增。最典型的例子莫過于孟德爾于1866年所做的豌豆雜交育種實驗[3],實驗結(jié)果發(fā)布35年之后才逐漸被科學(xué)界認可并最終成為遺傳學(xué)理論經(jīng)典。起初,學(xué)者將這種現(xiàn)象稱之為“阻滯發(fā)現(xiàn)”[4]、“早期發(fā)現(xiàn)”[5]、“遲滯承認”[6]。2004年,荷蘭計量學(xué)家Van Raan將這種現(xiàn)象冠以童話般的名字“睡美人”[7]。與遲滯承認的睡美人現(xiàn)象相反,有些論文在發(fā)表之初即得到學(xué)界認可并出現(xiàn)較高被引頻次,但持續(xù)時間很短便被遺忘,這種現(xiàn)象被稱之為“流星”[8]或“曇花一現(xiàn)”[9]。目前,國內(nèi)外對于上述兩種現(xiàn)象的研究主要聚焦于文獻產(chǎn)生原因及識別方法。
a.產(chǎn)生原因:從影響力維度來看,作者及期刊的知名度會在一定程度上影響學(xué)者對該篇論文的關(guān)注程度[4, 6],青年科學(xué)家由于在學(xué)界知名度不高,其學(xué)術(shù)成果被忽視的現(xiàn)象屢見不鮮;同時,期刊水平高低也會影響論文的受關(guān)注程度。從內(nèi)容維度來看,睡美人文獻多包含超前的學(xué)術(shù)思想或與當下研究范式不符而遭到學(xué)術(shù)共同體抵制,從而產(chǎn)生了睡美人文獻。Campanario調(diào)查發(fā)現(xiàn)[10],有19位諾獎得主的研究成果曾遭遇學(xué)術(shù)共同體抵制、24位諾獎得主曾遭遇期刊審稿人抵制。除上述原因之外,期刊的可獲得性、論文撰寫語言的通用性,均影響論文的受認可程度,也是睡美人文獻產(chǎn)生的可能原因。曇花一現(xiàn)文獻則主要是由技術(shù)更替[11]、研究主題轉(zhuǎn)移[12]等造成的。相對人文社會科學(xué)領(lǐng)域,工程技術(shù)領(lǐng)域所使用技術(shù)頻繁更替,容易產(chǎn)生曇花一現(xiàn)文獻;另一方面,當研究問題被解決或研究主題過時后,學(xué)術(shù)界也會將注意力轉(zhuǎn)向新的方向。此外,論文的外在屬性(比如,一流期刊還是非一流期刊)也可能會影響到曇花一現(xiàn)文獻的產(chǎn)生[12]。
b.識別方法:現(xiàn)有研究主要聚焦在引文曲線擬合法、參數(shù)主觀賦值法和無參數(shù)客觀識別法。①在引文曲線擬合法方面,Avramescu在1979年提出5種引文曲線并對論文被引頻次變化的現(xiàn)象進行了解釋[13]。此后,李江采用曲線擬合法構(gòu)建341位諾獎得主的引文分析框架[14],提出兩種規(guī)則引文曲線與三種不規(guī)則引文曲線。曲線擬合法通過引文曲線的變化來揭示文獻的引文變化特征,從而識別不同類型文獻,計算方法簡單,但需要人工觀察每一條曲線,在數(shù)據(jù)量過大時,費時費力。②參數(shù)主觀賦值法主要以Van Raan的三指標識別法[7]、Costas的四分位數(shù)分布統(tǒng)計法[9]及張家榕等的引文角β測量法[15]為代表。參數(shù)主觀賦值法的優(yōu)點在于操作簡單且易于理解,但人為主觀設(shè)定閾值缺乏一定的科學(xué)依據(jù)。此外,參數(shù)主觀賦值法忽視不同學(xué)科間差異,使用相同閾值測算不同學(xué)科有失偏頗。③無參數(shù)客觀識別法的代表性方法主要包括被引速率指標[16]、B指數(shù)[17]、SBc指數(shù)[18]及Bcp指數(shù)[19-21]等,該識別方法有效避免人為設(shè)定閾值的主觀因素影響,同時兼顧不同學(xué)科間的差異,識別精準度得到明顯提高,但公式計算過于復(fù)雜,對不同類型的文獻區(qū)分并不明顯。
在睡美人文獻與曇花一現(xiàn)文獻的相關(guān)研究中,從多維視角比較兩類文獻基本特征進而探究文獻產(chǎn)生原因的研究還鮮有涉及。為此,本文在識別睡美人文獻與曇花一現(xiàn)文獻基礎(chǔ)上,擬從期刊與作者、引文與自引,以及施引文獻三個視角系統(tǒng)分析與解讀兩類文獻的異同,進而探究兩類文獻產(chǎn)生的深層次差異。
本文首先遴選《新英格蘭醫(yī)學(xué)雜志》(NEJM,NewEnglandJournalofMedicine)、《柳葉刀》(Lancet)和《英國醫(yī)學(xué)雜志》(BMJ,BritishMedicalJournal)三種學(xué)術(shù)界公認的醫(yī)學(xué)名刊中的高被引論文;之后計算每篇論文Bcp指數(shù)并結(jié)合四分位數(shù)識別標準,識別睡美人文獻與曇花一現(xiàn)文獻。數(shù)據(jù)來源于Web of Science(WoS)核心合集(檢索日期2021年12月29日),檢索表達式為“SO= (New England Journal of Medicine OR Lancet OR British Medical Journal)”。
①原始文獻集。以1970年以來發(fā)表的論文為基礎(chǔ)數(shù)據(jù),為保證論文至少有10年的引文窗口期,將論文發(fā)表時間限定在1970—2010年,文獻類型限定“Article”,共計獲得原始文獻114 761篇。
②引文數(shù)據(jù)集。通過WoS的引文報告功能獲?、僦忻科撐淖园l(fā)表以來到2020年各年份被引頻次及總被引頻次(引文截止時間為2020年12月31日),得到有效數(shù)據(jù)9 783 120條,即引文數(shù)據(jù)集。
③高被引論文集。NEJM、Lancet和BMJ三種期刊5年影響因子分別為74.699、60.39、30.313,平均每年每篇論文被引頻次約為55次。在此基礎(chǔ)上,本文參考吉林大學(xué)李賀等人的高被引論文識別方法[22],根據(jù)期刊5年影響因子及10年引文窗口期,選擇②引文數(shù)據(jù)集中總被引頻次大于等于530次的論文作為高被引論文集,共計3 927篇。
1.2.1無參數(shù)指標Bcp指數(shù)
無參數(shù)指標通過綜合考慮文獻的相關(guān)引文數(shù)據(jù)對文獻類型進行客觀識別,常見識別指標包括B指數(shù)、SBc指數(shù)、Bcp指數(shù)等。通過對不同識別方法優(yōu)劣的比較分析,本文選取識別優(yōu)勢相對顯著的無參數(shù)指標Bcp 指數(shù)對樣本數(shù)據(jù)進行文獻類型識別。
圖1 Bcp指數(shù)示意圖[20-21]
Bcp指數(shù)由杜建于2017年提出[19],如圖1所示,該方法采用論文年度累計被引頻次百分比進行文獻識別。以橫坐標t表示論文發(fā)表時長,縱坐標為論文年度累計被引頻次百分比,上方曲線代表“睡美人”引文曲線,下方曲線代表“曇花一現(xiàn)”引文曲線。文獻發(fā)表年累計被引頻次百分比點為(0,c0),引文窗口結(jié)束年累計被引次數(shù)百分比點為(tm,1),參考線l為縱坐標c0與ctm兩點間連線,ct為論文發(fā)表第t年的累計被引頻次百分比,lt為論文年齡t在參考線上對應(yīng)的值,對于任意t (1) 其中:d(t)為論文累計引文曲線到參考線l的距離,該距離最大時的時間分別定義為喚醒年(記作tw)與下降年(記作tf),d(t)計算公式如下: (2) Bcp 指數(shù)最大優(yōu)勢在于喚醒年和下降年基于論文整個引文區(qū)間進行計算,喚醒年并不是年引用次數(shù)最少的,下降年也不是年引用次數(shù)最多的。同時Bcp值取決于累積引文曲線形狀并不依賴論文總被引次數(shù),值越大,睡美人文獻特征越明顯,反之,曇花一現(xiàn)文獻特征較為顯著。此外,Bcp指數(shù)可應(yīng)用于不同學(xué)科文獻的識別。 1.2.2參數(shù)識別指標 現(xiàn)有無參數(shù)指標均以計算指數(shù)大小為主要目的,并不能給出確切的標準來界定是否為睡美人文獻[22]。因此,本文采用無參數(shù)指標Bcp與參數(shù)指標相結(jié)合方法,給定閾值來進一步識別睡美人文獻與曇花一現(xiàn)文獻。 參數(shù)識別指標采用Costas提出的四分位數(shù)識別標準,該方法對文獻引文窗口期的選擇同Bcp指數(shù)相同,均考慮了文獻的整個引文時間窗口。基本思路為:首先計算每篇文獻在出版后獲得50%累計引用頻次所需時間,并將其定義為“年50% ”;其次,統(tǒng)計論文數(shù)據(jù)集中同年發(fā)表的所有文獻及這些文獻達到各自總被引頻次50%時所需時間,并從小到大依次排序,將排序列表中文獻分為前25%和后75%兩部分;前25%文獻達到總被引頻次50%時所需時間的最大值,用P25來表示,后75%的文獻達到總被引頻次的50%時所需時間的最小值用P75表示;最后,定義文獻類型標準如下: a.曇花一現(xiàn):論文“年50%”值小于該領(lǐng)域的P25值(< P25)。 b.延遲文檔:論文“年50%”的值大于該領(lǐng)域的P75值(> P75)。 c.經(jīng)典文獻:論文“年50%”的值在P25和該領(lǐng)域的P75值之間(≥P25和≤P75)。 本文在測度3 927篇文獻Bcp指數(shù)基礎(chǔ)上,結(jié)合四分位數(shù)進行二次識別,保證無參數(shù)指標識別范圍涵蓋全面的同時,能夠有效劃分出經(jīng)典型、“睡美人”型及“曇花一現(xiàn)”型三類不同類型文獻。 以3 927篇高被引文獻為基礎(chǔ)數(shù)據(jù),測度所有文獻Bcp值,數(shù)值范圍為[-17.856,13.072]。結(jié)合四分位數(shù)識別標準,識別曇花一現(xiàn)與睡美人文獻。通過計算,共有670篇文獻滿足睡美人文獻標準,Bcp取值在[-2.627,13.072]之間,占論文總數(shù)17.06%;有734篇滿足曇花一現(xiàn)文獻標準,Bcp值取[-17.856,2.856],占論文總數(shù)18.69%。經(jīng)典文獻2 523篇,占比近64.25%。三種類型文獻識別結(jié)果如圖2所示。 圖2 高被引文獻Bcp值分布圖 觀察圖2不難發(fā)現(xiàn),綜合四分位標準識別出的睡美人文獻Bcp值多數(shù)為正,曇花一現(xiàn)文獻Bcp值除5篇外均為負值,識別結(jié)果與Bcp指數(shù)識別標準相符合。經(jīng)典文獻Bcp值多為負數(shù),相較于延遲承認,經(jīng)典文獻更偏向具有及時承認的特征。 分析670篇睡美人文獻及734篇曇花一現(xiàn)文獻發(fā)現(xiàn),睡美人文獻自1970—2003年發(fā)文數(shù)量呈上升趨勢,并于2003年達發(fā)文量峰值共計39篇,此后發(fā)文量逐年走低。曇花一現(xiàn)文獻自1970—2006年發(fā)文量逐年上升,2006年發(fā)文量達峰值共計41篇。截止到本世紀初,兩類文獻發(fā)文量的增多與醫(yī)學(xué)領(lǐng)域的快速發(fā)展不無關(guān)系,但兩類文獻呈現(xiàn)其特征均需要一定的時間,這也是二者發(fā)文量在后期變低原因所在。 統(tǒng)計兩類文獻發(fā)文所屬國別,睡美人文獻中美國發(fā)文371篇排名第1、英國第2(180篇),二者遙遙領(lǐng)先于排名第3的加拿大(69篇)和第4名荷蘭(32篇)。中國(10篇)位居第14位,其中中國香港地區(qū)6篇、中國大陸發(fā)文4篇。曇花一現(xiàn)文獻中,美國以474篇位居發(fā)文數(shù)量榜首,英國148篇處于第2位,其后分別為加拿大、德國、荷蘭等國家。中國(16篇)位列第18名,其中中國香港地區(qū)發(fā)文11篇,中國大陸發(fā)文5篇。 從所屬機構(gòu)來看,發(fā)表睡美人文獻數(shù)量排名前3的機構(gòu)分別為哈佛大學(xué)醫(yī)學(xué)院、布列根和婦女醫(yī)院(哈佛醫(yī)學(xué)院教學(xué)附屬醫(yī)院)和多倫多大學(xué)。產(chǎn)出曇花一現(xiàn)文獻數(shù)量排名前3的機構(gòu)分別為哈佛大學(xué)醫(yī)學(xué)院、加利福尼亞大學(xué)及布列根和婦女醫(yī)院??梢姡鸫髮W(xué)醫(yī)學(xué)院無論在睡美人文獻產(chǎn)出還是曇花一現(xiàn)文獻產(chǎn)出方面均處于首位。 在文獻受項目資助方面,兩類文獻中多數(shù)獲得美國衛(wèi)生部(United States Department of Health and Human Services,HHS)和美國國立衛(wèi)生研究院(National Institutes of Health,NIH)的資助。無論是睡美人文獻或曇花一現(xiàn)文獻均是領(lǐng)域內(nèi)高被引論文,后續(xù)研究中,學(xué)者可重點關(guān)注上述機構(gòu)資助項目產(chǎn)出的研究成果。 文獻特征包括內(nèi)容特征與外部特征兩部分,分別用來直接或間接揭示文獻的內(nèi)涵與外在屬性。作為科學(xué)研究成果的書面表達形式,文獻中的標題、摘要、關(guān)鍵詞、正文中的詞、短語、句子和段落都是為表達文獻的研究內(nèi)容服務(wù)的[23],具體體現(xiàn)了研究內(nèi)容中的學(xué)科類別、主題內(nèi)容、基本觀點、學(xué)術(shù)傾向[24];表征文獻外部特征的通常包括發(fā)表時間、期刊、國別、機構(gòu)、作者、基金資助等。本研究分別選取用以表征文獻內(nèi)外特征的期刊、作者、參考文獻、引文及研究領(lǐng)域等對睡美人文獻與曇花一現(xiàn)文獻加以比較分析。 表1列舉了睡美人文獻和曇花一現(xiàn)文獻特征明顯的10篇代表性文獻。 表1 睡美人文獻與曇花一現(xiàn)文獻基本信息比較 從期刊維度來看,表1中的10篇“曇花一現(xiàn)”型文獻,有7篇來源于Lancet,3篇來源于NEJM。論文集中所識別出的734篇“曇花一現(xiàn)”型文獻中,233篇來源于Lancet,493篇來源于NEJM,僅有8篇來源于影響因子相對較低的BMJ??梢钥闯觯皶一ㄒ滑F(xiàn)”型論文絕大多數(shù)(近98.9%)來源于影響因子較高的Lancet與NEJM期刊。相比較而言,睡美人文獻來源分布較為平均。表1中10篇文獻有5篇來源于NEJM,3篇來源于Lancet,2篇來源于BMJ。而在所識別出的670篇睡美人文獻中,240篇來源于Lancet,87篇來源于BMJ,343篇來源于NEJM。由此可見,相較于睡美人文獻,“曇花一現(xiàn)”型論文更多發(fā)表于高影響因子期刊,因為影響因子較高的期刊可提升學(xué)術(shù)界對論文的關(guān)注度及認可度。 從作者維度來看,由于缺乏論文通信作者出生信息,參考Bayer等對科技人員職業(yè)年齡判定標準[25],將本研究中的通信作者從事首份科技工作年齡按30歲計算。對表1中睡美人文獻通信作者發(fā)表該篇論文生理年齡統(tǒng)計后發(fā)現(xiàn),有8人位于30~40歲、2人位于40~50歲之間。“曇花一現(xiàn)”型文獻作者,5人位于30~40歲,5人位于40~50歲??傮w來看,兩類文獻作者40歲以下的青年學(xué)者占大多數(shù),曇花一現(xiàn)文獻作者年齡略顯偏大。 將生理年齡超過40歲的通信作者定義為年長學(xué)者,結(jié)合作者履歷信息分析發(fā)現(xiàn):年長學(xué)者均為該領(lǐng)域權(quán)威人士,具有較多代表作品。如T3“曇花一現(xiàn)”型文獻通信作者Williams發(fā)表該篇論文年紀介于40~50歲之間,截止到1977年共發(fā)表文獻194篇,論文研究領(lǐng)域主要分布在免疫學(xué)、生物學(xué)、神經(jīng)科學(xué)等領(lǐng)域;T5曇花一現(xiàn)文獻通信作者Carlson發(fā)表該篇文獻年齡為50歲左右,截止到1972年共發(fā)表文獻147篇,主要分布于醫(yī)學(xué)、生物化學(xué)、遺傳學(xué)及藥理學(xué)等多個領(lǐng)域,是領(lǐng)域內(nèi)享有盛譽的學(xué)者。由此表明,作者知名度可一定程度帶動論文的關(guān)注程度,有較高聲譽的作者在論文發(fā)表后更容易被學(xué)界所認可。 同時,相較于曇花一現(xiàn)文獻,筆者觀察到表1中睡美人文獻合作者數(shù)量更少。曇花一現(xiàn)文獻作者數(shù)量2~9人,篇均作者5.6人;睡美人文獻作者數(shù)量1~7人,篇均作者3人??梢娬撐淖髡呷藬?shù)多少也是其受關(guān)注度的重要原因之一。通過查閱兩類文獻作者機構(gòu)分布,10篇睡美人文獻作者中,9篇論文所屬作者均來自于單一機構(gòu),10篇“曇花一現(xiàn)”型論文作者有7篇來自于單一機構(gòu),機構(gòu)數(shù)量并未有明顯差異??梢娮髡咚鶎贆C構(gòu)數(shù)量的多少并未影響論文的關(guān)注程度,且兩類文獻的作者所屬機構(gòu)數(shù)量均偏少,并未像常規(guī)認知中機構(gòu)所屬越多傳播效應(yīng)越廣。 綜上所述,基于期刊層面,期刊影響因子的大小對期刊內(nèi)論文的關(guān)注度有較為直接的影響,同行學(xué)者會更多關(guān)注于影響因子較高的期刊所刊載的文獻,高影響因子期刊可對其刊載的論文影響力的傳播產(chǎn)生正向推動作用。基于作者層面,知名學(xué)者產(chǎn)出的科研成果更易得到同行業(yè)的認可。此外,一篇文獻作者數(shù)量越多對文獻的傳播產(chǎn)生積極影響越大,但作者所屬機構(gòu)的數(shù)量對傳播力度影響卻并不顯著。 論文的參考文獻可以反應(yīng)已有的研究成果對作者研究的啟發(fā)及認知影響,參考文獻數(shù)量的多少一定程度上可以體現(xiàn)作者論文新穎度的高低[26]。對比分析兩類文獻參考文獻數(shù)量發(fā)現(xiàn),10篇睡美人文獻中最多引用34篇,最少為零引用,篇均引用17.3篇;10篇“曇花一現(xiàn)”型文獻最多引用57篇文獻,最少引用7篇,篇均引用29.2篇,可見睡美人文獻原創(chuàng)性更高,具有更多較新的研究觀點。比對兩類文獻頁數(shù),睡美人文獻篇均4.6頁,曇花一現(xiàn)論文篇均4.8頁,考慮到論文頁數(shù)對參考文獻數(shù)量影響,計算頁平均引用參考文獻數(shù)量,睡美人文獻每頁平均引用參考文獻3.8篇,曇花一現(xiàn)文獻每頁平均引用參考文獻6.1篇,再次證明睡美人具有更多原創(chuàng)觀點的正確性。 論文的自引頻次一定程度上也會影響論文的受關(guān)注程度。10篇睡美人文獻篇均自引14.4次,曇花一現(xiàn)文獻篇均自引38次。考慮到曇花一現(xiàn)文獻作者數(shù)量較多,進一步計算每位作者平均自引頻次發(fā)現(xiàn):10篇睡美人文獻共30位作者,每位作者篇均自引4.8次;10篇曇花一現(xiàn)文獻作者共56位,每位作者篇均自引6.8次。通過查看作者自引情況,筆者發(fā)現(xiàn),曇花一現(xiàn)文獻作者自引多發(fā)生在論文發(fā)表后的2~5年,分別選取兩類文獻自引頻次最高的兩篇文章,以T2曇花一現(xiàn)文獻和S10睡美人文獻為例進行比較。 圖3 曇花一現(xiàn)論文(入藏號:MEDINE:4137918) 圖4 睡美人論文(入藏號:MEDINE:4136544) 如圖3所示,該篇曇花一現(xiàn)文獻發(fā)表于1974年10月,6位作者自引頻次達68次。根據(jù)Bcp指數(shù)計算下降年方法,該篇文獻從發(fā)表到下降年跨度13年,在這13年間自引59次,占總自引頻次86.8%,總被引頻次6.8%。1981年自引10次達到峰值,被引頻次也于同年達到峰值98次。計算自引頻次與被引頻次間Pearson相關(guān)系數(shù)值為0.895,相關(guān)性極強。表明作者自引次數(shù)的增多可以在一定程度上帶動被引頻次的增長。圖4所示睡美人文獻發(fā)表于1974年7月,兩位作者共自引41次,睡眠期25年中共自引21次,占總自引頻次51.2%,表明作者在發(fā)表該篇文獻后仍然從事相關(guān)主題的研究,但文獻發(fā)表后的幾年中年自引頻次一直未超過3次,亦即作者的自引對于文獻的傳播并未起到較強的推動作用。 總體來看,作者對自身最新研究成果的大量自引,對其論文影響力的提升起到了正向推動作用。這樣使得文章在發(fā)表初年便可達到較高的被引頻次,極大程度避免文章成為睡美人文獻或經(jīng)典文獻。睡美人文獻多出自于自主性研究,雖蘊藏高質(zhì)量的學(xué)術(shù)價值,但由于缺少關(guān)注度或作者本身宣傳力度不夠,導(dǎo)致研究成果發(fā)表之初不被廣泛接受。 睡美人文獻多包含顛覆性的觀點或技術(shù)上的創(chuàng)新,其施引文獻又具有何種特點?睡美人沉睡期對其引用的論文就睡美人文獻所表達的觀點持何種態(tài)度?此類文獻又是否具有睡美人的特征?而曇花一現(xiàn)文獻自發(fā)表年到下降年期間,其施引文獻又具有何種特性?對原曇花一現(xiàn)文獻引文分布有何影響?從專利對兩類文獻的引用來看,睡美人文獻和曇花一現(xiàn)文獻技術(shù)影響力大小及技術(shù)持久力又具有何種差異呢? 2.3.1論文引用分析 選取表1中S1睡美人文獻為研究數(shù)據(jù),該篇論文總被引1 567次,1971年發(fā)表,2005年喚醒。1 567篇施引文獻的被引頻次在[0,2177]之間,其中不乏多篇高被引論文。本文選取被引頻次排名TOP10%共計156篇文獻視作對“睡美人”S1產(chǎn)生最大影響的施引文獻。測度156篇文獻發(fā)現(xiàn),這些高影響力施引文獻多數(shù)發(fā)表于1996年之后,主要集中發(fā)表于2002—2015年,與S1文獻的喚醒期基本重合。通過對156篇施引論文進行Bcp求值并結(jié)合四分位識別法及論文總被引頻次進行限制,經(jīng)專家確認篩選出1篇具有“睡美人”特征的文獻Theconceptsandprinciplesofequityandhealth。此篇文獻發(fā)表于1992年,沉睡17年后于2009年被喚醒,Bcp值6.98,截止到2020年末總計被引733次,該論文對S1中所持觀點持贊成態(tài)度。此篇文獻與S1睡美人文獻共被引8次,其中有1篇發(fā)表于兩篇文獻沉睡期,剩余7篇發(fā)表于兩篇文獻喚醒之后。 選取表1中T1曇花一現(xiàn)文獻為研究數(shù)據(jù),該篇論文總被引625次, 1971年發(fā)表,下降年為1984年,自發(fā)文到下降年期間論文共被引556次,施引文獻的被引頻次在[0,466]之間。選取被引頻次排名TOP10%共計62篇文獻視作對“曇花一現(xiàn)”T1產(chǎn)生最大影響的施引文獻。對62篇文獻統(tǒng)計后發(fā)現(xiàn),這些高影響力的施引文獻主要集中發(fā)表于1973—1976年間,而這個時間段恰好為“曇花一現(xiàn)”T1被引頻次最高的時間段。對62篇文獻進行Bcp求值并結(jié)合四分位數(shù)篩選,發(fā)現(xiàn)篩選出的論文均具有“曇花一現(xiàn)”特征并且多篇施引文獻同T1存在共被引現(xiàn)象。本文選取兩篇共被引頻次較高的論文為分析對象。第一篇文獻發(fā)表于1976年JournalofExperimentalMedicine期刊,被引292次,Bcp值-15.49,截止T1下降年之前與其共被引34次,對T1所寫內(nèi)容持贊成態(tài)度。第二篇文獻發(fā)表于1974年Lancet期刊,被引329次,Bcp值-15.40,截止T1下降年之前與其共被引25次,對T1所含觀點同樣表示支持。兩本期刊5年影響因子分別為11.743和60.39,均為領(lǐng)域內(nèi)高影響力期刊。 以上研究表明,睡美人文獻沉睡期間的引文同樣也會有睡美人特征,這樣原睡美人文獻覺醒的同時也可以激發(fā)施引文獻中睡美人文獻的覺醒。文獻引用的過程都是在前人知識的基礎(chǔ)上知識進化的過程,是知識的選擇、遺傳和變異的過程[27]。因此,在睡美人文獻識別基礎(chǔ)上,未來研究可以進一步深入探討沉睡期間施引文獻的特征,發(fā)現(xiàn)睡美人文獻的延伸價值,甚至也可以分析施引文獻中高被引文獻對睡美人文獻覺醒的幫助。對于曇花一現(xiàn)文獻而言,其施引文獻多數(shù)與原曇花一現(xiàn)文獻具有共被引現(xiàn)象,且施引文獻類型也多數(shù)為曇花一現(xiàn)文獻。發(fā)表在高影響力期刊的施引文獻對原曇花一現(xiàn)文獻的“宣傳”會起到積極作用,可有效擴大原曇花一現(xiàn)文獻的影響范圍并幫助其在發(fā)表之初就獲得較高被引頻次。 2.3.2專利引用分析 專利對非專利引文(Non-Patent References,NPR)的引用能夠反映基礎(chǔ)研究與技術(shù)創(chuàng)新之間的相互關(guān)聯(lián),顯示具體科學(xué)知識向不同技術(shù)領(lǐng)域的知識擴散軌跡,從而揭示科學(xué)知識與技術(shù)知識之間的關(guān)系。在Lens數(shù)據(jù)庫中逐篇檢索表1中論文的專利引用情況,共有S2、S3、S4等7篇睡美人文獻被專利所引用。其中,S9文獻共被專利引用40次,引用頻次最高。而10篇曇花一現(xiàn)文獻僅有1篇被專利引用。引用S9睡美人文獻的40項專利中有36項專利具有同族專利,其中最大的專利族有61項復(fù)雜同族專利(US 8921344);引用“曇花一現(xiàn)”型T9文獻的19項專利均具有同族專利,且最大的專利族有48項復(fù)雜同族專利(US 4690937)。已有研究認為,同族專利數(shù)量及專利族大小可以有效反應(yīng)某項專利的技術(shù)價值和經(jīng)濟價值[28],可見,睡美人文獻雖具有更強的技術(shù)影響力,但某些曇花一現(xiàn)文獻也同樣具備技術(shù)特性。 為探求技術(shù)層面對論文被引頻次的影響因素,選擇睡美人文獻中被專利引用最多3篇文獻S4、S9、S10為分析對象,曇花一現(xiàn)文獻T9為分析對象。本文定義專利申請年為專利對兩類文獻產(chǎn)生影響的開始時間,并以專利被引頻次作為對專利質(zhì)量評價的量化指標。分析發(fā)現(xiàn),3篇睡美人文獻的施引專利中被引頻次最高的專利申請均位于論文喚醒年之前,被引頻次較高的專利申請多數(shù)集中于睡美人文獻喚醒前10年至喚醒后2年,而這期間正是睡美人文獻被引頻次陡增的主要時期;T9曇花一現(xiàn)文獻的施引專利被引頻次排名前10位的專利中有8項專利申請年份位于論文發(fā)表5年內(nèi),可見技術(shù)層面的影響對曇花一現(xiàn)文獻早期被引頻次的增長存在一定的關(guān)聯(lián)。進一步探究上述被專利引用的4篇文獻近十年的專利引用情況發(fā)現(xiàn),引用睡美人文獻的91項專利中有66項為近十年內(nèi)申請,占比72.5%,引用曇花一現(xiàn)文獻的19項專利有89.5%集中在論文發(fā)表后5年之內(nèi),近十年申請占比為零。 專利作為技術(shù)信息有效載體,與科學(xué)文獻具有同等重要的學(xué)術(shù)價值。專利的引用無疑會帶動同行業(yè)學(xué)者對NPR引文的關(guān)注,進而對兩類文獻的被引頻次起到促進作用。此外,從科學(xué)知識與技術(shù)知識間的流動性來看,相較于曇花一現(xiàn)文獻,睡美人文獻可以更好體現(xiàn)科學(xué)與技術(shù)間的互動,同時睡美人文獻在技術(shù)價值方面也具有更強的影響力與持久力,對技術(shù)創(chuàng)新貢獻度優(yōu)于曇花一現(xiàn)文獻。 為了探索研究主題關(guān)注度對論文引用的影響,筆者截取Bcp最大值和最小值所對應(yīng)的文獻,通過與學(xué)科領(lǐng)域?qū)<夜餐凶x論文標題及摘要內(nèi)容,提取相關(guān)主題詞。之后檢索獲得該主題的研究領(lǐng)域,藉此研判領(lǐng)域研究進展與文獻引用數(shù)量間關(guān)系。 S1睡美人文獻,由Hart發(fā)表于1971年,研究主題為逆向照顧法則(Inverse care law)。Hart為英國著名的國民衛(wèi)生服務(wù)(醫(yī)療保健)領(lǐng)域?qū)<?,被譽為世界初級衛(wèi)生保健理論專家之一,開創(chuàng)了以醫(yī)療實踐為主(Pruerice-based research)的研究,在高血壓與流行病領(lǐng)域建樹頗多,也是著名的作家、政治評論員與社會倡導(dǎo)者[29-31]。逆向照顧法則1971年由Hart首先提出,該理論認為:越是需要醫(yī)療照顧及社會關(guān)懷的人,其可得到的資源反而越少。也就是說,獲得良好醫(yī)療保健的機會與目標人群的需要成反比[31]。在巿場機制下,該法則暴露出的情形將更為徹底。論文發(fā)表后的近20年,并未引起學(xué)界太多關(guān)注,直至2005年論文被喚醒。2019年新冠疫情的爆發(fā),該篇論文引發(fā)學(xué)術(shù)界更廣泛的討論,逆向照顧法則正在成為有關(guān)醫(yī)療不平等爭議的核心議題。在WoS核心合集中通過高級檢索,輸入表達式TS=(inverse care* AND law*),時間限制在1971—2020年,共計得文獻444篇。如圖5所示,在1990年之前,該研究方向一直處于不溫不火狀態(tài),1990年之后該領(lǐng)域關(guān)注度有所提升,領(lǐng)域內(nèi)發(fā)文數(shù)量開始增加,同時也帶動了睡美人文獻被引頻次的上升;2005年后,領(lǐng)域發(fā)文數(shù)量漲勢顯著,被引頻次帶動效應(yīng)尤為明顯。計算該領(lǐng)域的發(fā)文量和睡美人被引頻次間的Pearson相關(guān)系數(shù)值為0.921,相關(guān)性極強。由此看來,研究領(lǐng)域關(guān)注度的增加有利于促使睡美人文獻的喚醒。 圖5 典型睡美人文獻(J.T. Hart,1971) T1曇花一現(xiàn)文獻,由Barnes等發(fā)表于1971年,研究主題為胸腺依賴淋巴細胞 ( T淋巴細胞,簡稱T細胞 ) 對自身免疫功能的影響。20世紀60年代,現(xiàn)代免疫學(xué)取得重大突破,醫(yī)學(xué)界證實了胸腺為中樞性免疫器官,發(fā)現(xiàn)了胸腺和胸腺依賴淋巴細胞的免疫功能,開創(chuàng)了細胞免疫研究的新途徑[32]。60年代中期,學(xué)界對T細胞和B細胞在免疫過程中相互影響與相互制約機制的研究開始興起[33]。進入70年代,以T細胞為中心的免疫生物學(xué)研究成為該時期免疫學(xué)研究最活躍的領(lǐng)域之一[34],學(xué)界對于T細胞的發(fā)生、分化及功能研究,以及對T細胞抗原識別受體等方面的研究均取得較大發(fā)展[35]。在WoS中輸入表達式TS=(lymphocytes* AND immunity*),時間限制在1971—2020年,共計得到文獻30 434篇。如圖6所示,在文章發(fā)表后幾年中,文章的被引頻次均高于該領(lǐng)域的論文發(fā)文數(shù),學(xué)界對研究領(lǐng)域的關(guān)注與“曇花一現(xiàn)”型文獻被引頻次并未有直接關(guān)系。但筆者觀察到,由于論文發(fā)表后前幾年被引數(shù)量高于該領(lǐng)域發(fā)文數(shù)量,說明該篇文獻被其他研究領(lǐng)域所大量引用,產(chǎn)生跨研究領(lǐng)域的影響。究其原因,發(fā)現(xiàn)隨著對免疫機制的深入了解,20世紀70年代,單克隆抗體雜交瘤技術(shù)、高效免疫抑制劑的開發(fā)與應(yīng)用等技術(shù)相繼取得突破,進一步完善了現(xiàn)代免疫治療體系。尤其是單克隆抗體和分子生物學(xué)抗體的應(yīng)用,促進學(xué)界從基因、分子、細胞及整體不同層次上來深入研究免疫細胞生命活動規(guī)律與機制。值得關(guān)注的是,該領(lǐng)域在1991年關(guān)注度激增,共發(fā)表文章446篇,較前一年多出390篇,涉及主題領(lǐng)域由免疫學(xué)、普通內(nèi)科、醫(yī)學(xué)實驗技術(shù)、微生物學(xué)、公共環(huán)境與職業(yè)健康等為數(shù)不多領(lǐng)域開始向腫瘤科、傳染病、細胞生物學(xué)、分子生物學(xué)、外科手術(shù)、病理學(xué)、病毒學(xué)、藥理學(xué)、獸醫(yī)學(xué)、寄生蟲學(xué)、營養(yǎng)學(xué)、臨床神經(jīng)學(xué)等領(lǐng)域拓展。但“曇花一現(xiàn)”型文獻并未因此增加引用,反而逐年走低。由此說明,因缺乏足夠新穎、創(chuàng)新的研究內(nèi)容,“曇花一現(xiàn)”型文獻并沒有在多年之后被再次發(fā)掘,而是隨著新理論、新方法的不斷產(chǎn)生逐漸被學(xué)術(shù)界所遺忘。 圖6 典型曇花一現(xiàn)文獻(R.D.Barnes,1971) 以上分析表明,文獻所屬研究領(lǐng)域的關(guān)注度對該篇文獻被引頻次的增長有著帶動作用。就睡美人文獻而言,研究領(lǐng)域關(guān)注度的提高可以有效擴大睡美人文獻在該領(lǐng)域的影響力進而促進“睡美人”的提前覺醒。而曇花一現(xiàn)文獻則不然,文獻影響力的大小與研究領(lǐng)域關(guān)注度的高低并無明顯關(guān)系,并且通過上文研究所述,曇花一現(xiàn)文獻在發(fā)表之初便得到高度認可,極有可能因為其內(nèi)容的影響范圍涉及多學(xué)科、多領(lǐng)域而得到廣泛關(guān)注。 本文通過對三大醫(yī)學(xué)期刊1970—2010年間論文數(shù)據(jù)進行統(tǒng)計,依據(jù)無參數(shù) Bcp 指數(shù)的計算和參數(shù)四分位識別標準,識別出三大期刊高被引文獻中的睡美人文獻和曇花一現(xiàn)文獻作為研究樣本,并從中篩選出代表性睡美人文獻與曇花一現(xiàn)文獻,從期刊、作者與引文三個維度進行兩類不同文獻的基本特征比較以探究兩類文獻的深層次異同。 a.通過不同維度對兩類文獻的分析,作者發(fā)現(xiàn):相較于睡美人文獻,“曇花一現(xiàn)”型文獻更多發(fā)表于高影響因子期刊,作者數(shù)量也相對較多;兩類文獻的通信作者年齡多介于30~40之間,其中曇花一現(xiàn)文獻作者整體年齡偏大;睡美人文獻引用的參考論文數(shù)量更少,且論文中多包含原創(chuàng)性、新穎性觀點。此外,作者對論文的自引可以提高該篇論文的宣傳力度,但睡美人文獻顯然不善于“營銷”,自引數(shù)量較少。通過對研究領(lǐng)域主題與論文被引量間相關(guān)性分析,發(fā)現(xiàn)領(lǐng)域關(guān)注度的提高可以帶動“睡美人”的提早覺醒。同時筆者發(fā)現(xiàn),曇花一現(xiàn)文獻也可能是因為跨領(lǐng)域研究,從而導(dǎo)致其發(fā)表初就有較高的被引頻次。 b.通過研究典型睡美人文獻與其沉睡期間的引文關(guān)聯(lián)性發(fā)現(xiàn),睡美人文獻沉睡期間的施引文獻同樣會出現(xiàn)“睡美人”特征。此類文獻對原睡美人文獻所持觀點持支持態(tài)度,這樣原睡美人文獻的覺醒會在一定程度上帶動施引文獻中具有“睡美人”特征文獻的覺醒。另外,若施引文獻中睡美人文獻的覺醒要早于原睡美人文獻,是否會帶動原來睡美人文獻的覺醒還需要后續(xù)進一步論證。探索曇花一現(xiàn)文獻與其施引文獻間的關(guān)系發(fā)現(xiàn),二者間多具有共被引現(xiàn)象發(fā)生,且共被引頻次較高的施引文獻多發(fā)表于高影響力期刊,這對曇花一現(xiàn)早期被引頻次的增多起到正向推動作用。 c.文獻引用作為知識流動的一種重要方式,是知識選擇、遺傳和變異的過程,不僅擴大了知識融合,更為知識增值與技術(shù)創(chuàng)新提供了條件。隨著科學(xué)與技術(shù)之間知識流動愈發(fā)的頻繁,專利對科學(xué)文獻的引用一定程度上反映了基礎(chǔ)研究對技術(shù)創(chuàng)新的貢獻大小。施引文獻分析表明,兩類文獻均具有技術(shù)價值,但睡美人文獻所包含的技術(shù)價值更容易得到專利的引用,同時也更具有持久性,在科學(xué)與技術(shù)的互動中,睡美人文獻總體表現(xiàn)更勝一籌,對技術(shù)創(chuàng)新貢獻更大。 d.就研究主題受關(guān)注程度對論文引用的影響而言,文獻內(nèi)容所涉及研究領(lǐng)域的關(guān)注度對兩類文獻被引頻次的增長帶動作用差異顯著。以睡美人文獻來看,本研究領(lǐng)域關(guān)注度的提高可以有效擴大睡美人文獻在該領(lǐng)域的影響力進而促進“睡美人”的覺醒。而曇花一現(xiàn)文獻則不然,文獻影響力的大小與本研究領(lǐng)域關(guān)注度的高低并無明顯關(guān)系,并且通過上文研究所述,曇花一現(xiàn)文獻在發(fā)表之初便得到高度認可,極有可能因為其內(nèi)容的影響范圍涉及多學(xué)科、多領(lǐng)域而得到廣泛關(guān)注。 關(guān)于睡美人文獻覺醒原因,本文僅探討其所屬研究領(lǐng)域關(guān)注度提高所引發(fā)的覺醒。技術(shù)“王子”(專利)對兩類文獻的影響研究目前國內(nèi)較少涉及,專利引用可以很好地體現(xiàn)科學(xué)與技術(shù)間的互動,這也是本領(lǐng)域下一步研究重點關(guān)注的方向。除上述考量之外,近些年替代計量學(xué)的興起,網(wǎng)絡(luò)對于文章的傳播度的影響也是重要因素之一。筆者通過查詢文章在PlumX度量中的網(wǎng)絡(luò)影響發(fā)現(xiàn),睡美人文獻在網(wǎng)絡(luò)上點贊數(shù)及提到頻率遠大于曇花一現(xiàn)文獻,可見睡美人文獻中的研究價值持久性較長。但考慮本文識別出的睡美人文獻和曇花一現(xiàn)文獻發(fā)表年較早,網(wǎng)絡(luò)普及度并不普遍,日后研究睡美人文獻的覺醒和曇花一現(xiàn)文獻發(fā)表后前幾年被引數(shù)量的激增,網(wǎng)絡(luò)上的影響同樣是一個值得考慮的因素。1.3 睡美人文獻與曇花一現(xiàn)文獻分布
2 代表性睡美人文獻與曇花一現(xiàn)文獻的特征比較
2.1 期刊與作者分析
2.2 引文與自引分析
2.3 施引文獻分析
2.4 研究領(lǐng)域分析
3 總結(jié)與啟示