柳 娟,許 爽,田文燦,王賢文,許小可*
(1.大連民族大學(xué)信息與通信工程學(xué)院 遼寧大連116600;2.大連理工大學(xué)科學(xué)學(xué)與科技管理研究所暨WISE實(shí)驗(yàn)室 遼寧大連 116024)
近年來(lái),隨著科學(xué)研究的迅速發(fā)展以及數(shù)據(jù)分析技術(shù)的廣泛應(yīng)用,基于數(shù)據(jù)驅(qū)動(dòng)的科學(xué)家合作信息挖掘成為科學(xué)學(xué)領(lǐng)域的重要研究方向[1-2]??茖W(xué)家合作是科研活動(dòng)組織與科學(xué)信息傳播的基礎(chǔ),可推動(dòng)科研工作的交流與創(chuàng)新,對(duì)知識(shí)的創(chuàng)造和傳播具有重要意義,因此受到科研學(xué)者的廣泛關(guān)注[3-5]。學(xué)術(shù)論文是科研成果的重要展示形式之一,科學(xué)家合作最直接的表現(xiàn)形式就是合作發(fā)表論文。關(guān)于學(xué)術(shù)論文的發(fā)表,大家經(jīng)常會(huì)提出這樣一個(gè)問(wèn)題:“如果以前從未在著名期刊上發(fā)表過(guò)文章,那么在該期刊上發(fā)表文章時(shí)是否需要已經(jīng)在該期刊上發(fā)表過(guò)論文的知名作者提供幫助呢?”針對(duì)此問(wèn)題,近期PNAS中的一項(xiàng)研究將最后作者作為文章的最重要作者,研究了在同一期刊中沒(méi)有經(jīng)驗(yàn)的科學(xué)家如何在期刊上發(fā)表論文。研究表明如果科學(xué)家在頂級(jí)期刊上以普通作者的身份參與過(guò)論文的發(fā)表,由于在論文發(fā)表過(guò)程中有重要作者的陪護(hù),那么該科學(xué)家今后在該期刊上以重要作者身份發(fā)表論文的可能性就越大,稱(chēng)為“陪護(hù)人效應(yīng)”[6]。該效應(yīng)強(qiáng)調(diào)了科學(xué)家在職業(yè)生涯初期的論文發(fā)表經(jīng)驗(yàn)對(duì)其后來(lái)發(fā)表高水平論文的重要性。相反,如果科學(xué)家從未以任何身份在某個(gè)期刊上發(fā)表過(guò)論文,那么這位科學(xué)家以重要作者的身份在該期刊上發(fā)表論文的可能性較低。
陪護(hù)人原本指陪同年輕人出席社交場(chǎng)合的監(jiān)護(hù)人,在科學(xué)家合作中是指曾經(jīng)在著名期刊上發(fā)表過(guò)論文的導(dǎo)師,他們?cè)诳蒲泄ぷ髦邪l(fā)揮重要的指導(dǎo)作用,可以為年輕科學(xué)家發(fā)表高水平論文帶來(lái)優(yōu)勢(shì)。即科學(xué)家發(fā)表論文往往是有一個(gè)學(xué)術(shù)“陪護(hù)”過(guò)程,第一次在高水平期刊上發(fā)表論文的科學(xué)家往往都需要“大?!睂?dǎo)師的“陪護(hù)”,而這些“大?!睂?dǎo)師可能已經(jīng)在這些期刊上發(fā)表過(guò)多篇文章,對(duì)相關(guān)研究和期刊審稿等各個(gè)過(guò)程比較熟悉??偟膩?lái)說(shuō),PNAS中“陪護(hù)人效應(yīng)”的主要研究對(duì)象是文章作者署名中最重要的作者,該文中指的是排名最后的作者,他們對(duì)第一次在頂級(jí)期刊上發(fā)表文章的“配角”作者有重要的指導(dǎo)作用。因此,定義文章的重要作者是對(duì)“陪護(hù)人效應(yīng)”進(jìn)行檢測(cè)的前提條件。
在實(shí)際的科學(xué)研究過(guò)程中,一些影響力較大的科研成果一般是由團(tuán)隊(duì)共同完成的[7-10],因此一些權(quán)威的學(xué)術(shù)文章通常也是由多個(gè)作者共同撰寫(xiě)的。與單一作者的論文相比,多個(gè)作者合著論文的比例一直在增長(zhǎng),文獻(xiàn)[11]最早關(guān)注到多作者合作發(fā)文增多的現(xiàn)象,并提出成果中應(yīng)該描述團(tuán)隊(duì)中參與者各自承擔(dān)的工作和他們之間的關(guān)系,這樣有助于明確作者角色及貢獻(xiàn)。由于一些重要作者往往在多作者合著論文的撰寫(xiě)和發(fā)表過(guò)程中起著關(guān)鍵作用,因此識(shí)別該類(lèi)作者具有重要意義[12-13]。
在多個(gè)作者合著的文章中,論文作者的署名順序?yàn)樽髡咴陧?xiàng)目中所作的貢獻(xiàn)提供重要信息,而占據(jù)不同署名位置的作者扮演著不同的角色[14-16]。如在生物和物理科學(xué)領(lǐng)域中,論文的第一作者往往是該項(xiàng)目的主要執(zhí)行者;最后作者一般是項(xiàng)目的指導(dǎo)者,負(fù)責(zé)指導(dǎo)項(xiàng)目的實(shí)施、構(gòu)建論文的寫(xiě)作框架以及與期刊編輯聯(lián)系等工作;而處于第一作者和最后作者之間的中間作者通常負(fù)責(zé)一些數(shù)據(jù)支持或數(shù)據(jù)分析等工作[17-18]。同時(shí),在科技期刊中標(biāo)注通訊作者已經(jīng)變得越來(lái)越普遍,如《材料研究學(xué)報(bào)》、《科技通報(bào)(英文版)》和《力學(xué)學(xué)報(bào)》等,通常認(rèn)為文章的通訊作者是課題的總負(fù)責(zé)人,負(fù)責(zé)指導(dǎo)課題及論文投稿等方面的工作,是合著作者中較權(quán)威的作者[19-21]。由此可見(jiàn),學(xué)術(shù)論文中的重要作者并不相同,其可能是文章的第一作者、最后作者或通訊作者。根據(jù)大多數(shù)期刊都要求標(biāo)記通訊作者的情況,本文將通訊作者當(dāng)作文章最重要作者,為研究不同署名位置作者與通訊作者的差異性以及對(duì)差異性進(jìn)行解釋提供依據(jù)。
本文研究了Web of Science上6本著名期刊在1984?2019年間發(fā)表的近10萬(wàn)篇論文,涉及自然科學(xué)和醫(yī)學(xué)科學(xué)等領(lǐng)域。首先,探究了不同署名位置作者與通訊作者之間是否存在差異性。然后將處于不同署名位置的第一作者、最后作者、通訊作者、倒數(shù)第二作者、第二作者和第三作者假設(shè)為文章的重要作者(principal investigator,PI),并將PI分成3類(lèi):新PI、有經(jīng)驗(yàn)PI和資深PI,通過(guò)對(duì)比6種位置作者的3類(lèi)PI比例隨時(shí)間變化的趨勢(shì)來(lái)對(duì)“陪護(hù)人效應(yīng)”進(jìn)行檢測(cè)。最后,計(jì)算了不同署名位置作者與通訊作者之間的相似性系數(shù),對(duì)他們與通訊作者之間的差異性進(jìn)行解釋。本研究將有助于理解不同署名位置作者的角色和貢獻(xiàn)的差異性,也將進(jìn)一步加深對(duì)學(xué)術(shù)論文發(fā)表過(guò)程的認(rèn)識(shí)。
本文實(shí)驗(yàn)利用了Web of Science中6本著名期刊數(shù)據(jù),包括《科學(xué)》、《自然》、《新英格蘭醫(yī)學(xué)雜志》、《柳葉刀》、《美國(guó)醫(yī)學(xué)會(huì)雜志》和《英國(guó)醫(yī)學(xué)期刊》?!蹲匀弧泛汀犊茖W(xué)》屬于世界最權(quán)威的綜合類(lèi)學(xué)術(shù)期刊,涵蓋科學(xué)研究的各個(gè)學(xué)科領(lǐng)域,如生命科學(xué)、自然科學(xué)和物理化學(xué)等領(lǐng)域。其余4本期刊是頂級(jí)的醫(yī)學(xué)領(lǐng)域期刊。6本期刊涉及不同學(xué)科領(lǐng)域,可使實(shí)驗(yàn)結(jié)果具有普適性。其中,《自然》包含了1998?2018年的全部數(shù)據(jù),《科學(xué)》和其他4本醫(yī)學(xué)期刊則包含了1984?2019年的全部數(shù)據(jù)。對(duì)于每一篇論文,數(shù)據(jù)集包含了發(fā)表時(shí)間、文章類(lèi)型、文章作者及署名順序、作者所屬機(jī)構(gòu)和文章通訊作者等字段信息。在這些期刊中設(shè)有各種不同的欄目,考慮到科學(xué)家合作主要是在研究性學(xué)術(shù)論文中進(jìn)行的,因此僅考慮Article和Review這2種文獻(xiàn)類(lèi)型。由于實(shí)驗(yàn)數(shù)據(jù)不存在共同第一作者的情況,并且共同通訊作者的文章占比較少,在《自然》和《科學(xué)》中共同通訊作者的文章占比0.046,而4本醫(yī)學(xué)期刊中共同通訊作者的文章僅占比0.003,綜上本文將不考慮共同第一作者和共同通訊作者的情況。
由于原始數(shù)據(jù)存在冗余信息較多、數(shù)據(jù)格式不統(tǒng)一和姓名歧義等問(wèn)題,因此在研究之前需要對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,提取研究所需的字段信息,包括發(fā)表時(shí)間、作者及通訊作者等信息。數(shù)據(jù)預(yù)處理包括作者姓名消歧[22-23]和期刊合并兩個(gè)過(guò)程。
1)姓名消歧。由于數(shù)據(jù)中作者的姓名由姓氏全稱(chēng)加上名字首字母縮寫(xiě)構(gòu)成,這樣就會(huì)存在不同作者的姓名相同的情況,于是本文對(duì)姓名進(jìn)行了消歧處理,判斷兩篇文章中同名作者是否為同一人。消歧的原則為:當(dāng)兩篇文章存在姓名相同的作者時(shí),如果在兩篇文章中該作者存在相同的合著者,那么為同一作者,否則為不同作者。
2)期刊合并。在發(fā)表高影響力科學(xué)成果時(shí),經(jīng)驗(yàn)往往起著至關(guān)重要的作用,這一點(diǎn)在頂級(jí)期刊論文上表現(xiàn)尤為明顯。如果一位科學(xué)家在《自然》上發(fā)表過(guò)文章,那么在同級(jí)別期刊《科學(xué)》上發(fā)表文章的可能性就很大。同一類(lèi)別的頂級(jí)期刊往往有多本,如《自然》和《科學(xué)》都屬于同級(jí)別綜合類(lèi)期刊,而《新英格蘭醫(yī)學(xué)雜志》、《柳葉刀》、《美國(guó)醫(yī)學(xué)會(huì)雜志》和《英國(guó)醫(yī)學(xué)期刊》也是同級(jí)別醫(yī)學(xué)類(lèi)期刊,這樣作者投稿這兩大類(lèi)期刊時(shí)不確定具體會(huì)投稿哪個(gè)期刊。即可認(rèn)為作者向《自然》投稿與向《科學(xué)》投稿的可能性基本相同。如果只在每類(lèi)期刊中選擇一種期刊單獨(dú)進(jìn)行實(shí)驗(yàn),那么數(shù)據(jù)量偏少而且無(wú)法充分考慮作者的論文發(fā)表情況。如果將同類(lèi)期刊的多本期刊合并,那么在數(shù)據(jù)量增加的同時(shí)也會(huì)使實(shí)驗(yàn)結(jié)果更加穩(wěn)定。因此本文在進(jìn)行研究時(shí),將《自然》和《科學(xué)》合并成一類(lèi)期刊,將《新英格蘭醫(yī)學(xué)雜志》、《柳葉刀》、《美國(guó)醫(yī)學(xué)會(huì)雜志》和《英國(guó)醫(yī)學(xué)期刊》4本頂級(jí)醫(yī)學(xué)期刊合并成一類(lèi),這樣就產(chǎn)生兩組文章數(shù)分別約為5萬(wàn)的論文數(shù)據(jù)集,利用這兩大類(lèi)期刊的論文數(shù)據(jù)檢測(cè)“陪護(hù)人效應(yīng)”。
研究中將1篇論文的作者劃分成3類(lèi):第一作者、最后作者和中間作者。中間作者是指該篇文章署名中位于第一作者和最后作者之間的作者,那么很明顯兩個(gè)作者的文章不存在中間作者。由于在單一作者的文章中,第一作者也是最后作者,并且不存在中間作者,所以3類(lèi)作者之間明顯不存在交集。綜合以上因素,此處僅考慮作者數(shù)大于2的文章。根據(jù)文章的作者數(shù)分別統(tǒng)計(jì)了第一作者是通訊作者、最后作者是通訊作者和中間作者是通訊作者的比例,結(jié)果如圖1所示,縱坐標(biāo)表示3類(lèi)作者是通訊作者的比例,橫坐標(biāo)表示文章的作者數(shù),可以看出《自然》和《科學(xué)》與4本醫(yī)學(xué)期刊的結(jié)果有一定的差異性。
圖1 作者數(shù)與通訊作者比例關(guān)系曲線
在《自然》和《科學(xué)》中,第一作者是通訊作者的比例曲線由最初的比例最大緩慢下降至第二位,曲線呈下降后又慢慢上升的趨勢(shì)。中間作者是通訊作者的比例曲線則整體呈上升趨勢(shì),這可能與中間作者的數(shù)量逐漸變多、因此通訊作者分布在中間位置的可能性變大有關(guān)。而最后作者是通訊作者的比例曲線由最初的第二位逐漸升至第一位,超過(guò)了第一作者是通訊作者的比例,曲線整體呈上升后又慢慢下降的趨勢(shì),該曲線比例最大約為0.56,說(shuō)明在《自然》和《科學(xué)》中,最后作者和通訊作者之間的關(guān)聯(lián)性較大。當(dāng)文章的作者數(shù)大于25以后,3種情況的比例已基本相同,說(shuō)明此時(shí)通訊作者可能分布在文章作者署名順序的第一位置、最后位置和中間位置,并且分布在3個(gè)位置的可能性基本相近。
與《自然》和《科學(xué)》結(jié)果不同,在4本醫(yī)學(xué)期刊中,第一作者是通訊作者的比例最大,即使隨著作者數(shù)的增多,該曲線呈下降趨勢(shì),而另外兩條曲線呈上升趨勢(shì),但是第一作者是通訊作者的比例仍然高于其他兩種情況,該曲線比例最低也達(dá)到了0.6左右,而最后作者是通訊作者的比例則遠(yuǎn)小于第一作者是通訊作者的比例,比例最大也未超過(guò)0.3,中間作者是通訊作者的比例則最小。說(shuō)明在醫(yī)學(xué)期刊中,最后作者和中間作者擔(dān)任通訊作者的可能性較小,而第一作者和通訊作者之間則存在較大的聯(lián)系,三者在論文中的角色并不一致。
通過(guò)上述分析得知,隨著作者數(shù)不同,3類(lèi)作者是通訊作者的比例會(huì)發(fā)生變化,并且這兩類(lèi)期刊的結(jié)果存在一定的差異性。隨著時(shí)間推移,3類(lèi)作者是通訊作者的比例也有變化,如圖2所示。在《自然》和《科學(xué)》這兩本期刊中,隨著時(shí)間推移,第一作者是通訊作者的比例曲線由最高下降至最低,中間作者是通訊作者的比例曲線由最低緩慢上升,而最后作者是通訊作者的比例曲線由第二位上升至比例最高,最大比例約為0.54,說(shuō)明最后作者與通訊作者之間的重疊性相比于另外兩類(lèi)作者要高。在4本醫(yī)學(xué)期刊中,最后作者是通訊作者的比例曲線雖然有一定程度的上升,但是仍遠(yuǎn)小于第一作者是通訊作者的比例,該曲線比例最大僅為0.25左右;中間作者是通訊作者的比例最小,未超過(guò)0.1。醫(yī)學(xué)期刊中最后作者和中間作者擔(dān)任通訊作者的比例較小,而第一作者是通訊作者的比例最大,該比例最小也大于60%,說(shuō)明第一作者和通訊作者之間的關(guān)聯(lián)性較大。
基于圖1和圖2中兩類(lèi)期刊的3曲線,可發(fā)現(xiàn)無(wú)論是隨著文章作者數(shù)量還是時(shí)間變化,兩類(lèi)期刊的結(jié)果均存在明顯的差異性。在《自然》和《科學(xué)》中,最后作者是通訊作者的比例占了一半以上,約為0.55左右。說(shuō)明在該類(lèi)綜合性期刊中,最后作者與通訊作者之間存在很強(qiáng)的重疊性,而第一作者、中間作者與通訊作者的重疊性不高。但是在4本醫(yī)學(xué)期刊中,第一作者和通訊作者之間存在較強(qiáng)重疊性,而最后作者和中間作者一般較少擔(dān)任通訊作者,最后作者是通訊作者的比例遠(yuǎn)小于第一作者是通訊作者的比例,該比例最大也未超過(guò)0.3。綜合兩類(lèi)期刊來(lái)看,第一作者、最后作者是文章通訊作者的概率較大,但是中間作者是通訊作者的可能性較小。
圖2 時(shí)間與通訊作者比例關(guān)系曲線
在PNAS的文章中,研究者基于最后作者是文章最重要作者(PI)的假設(shè),發(fā)現(xiàn)了“陪護(hù)人效應(yīng)”的存在[6]。研究中將重要作者(PI)主要分成了3類(lèi)[6]:1)新PI指的是以前從未以任何作者身份在特定期刊上發(fā)表過(guò)文章的作者;2)有經(jīng)驗(yàn)PI指的是以前只以普通作者的身份(非最后作者)在特定期刊上發(fā)表過(guò)文章,但從未當(dāng)過(guò)重要作者(PI)的作者;3) 資深PI指的是以前以重要作者身份(最后作者)在特定期刊上發(fā)表過(guò)文章的作者。
根據(jù)這3類(lèi)定義可知,任何文章中的重要作者只能歸于這3類(lèi)中的一類(lèi)。如2000年A在《自然》上首次以重要作者(最后作者)發(fā)表文章,但是2000年以前他從未以任何身份在《自然》上發(fā)表過(guò)文章,那么A將被歸類(lèi)為2000年在《自然》上的新PI。2006年,A再次以重要作者(最后作者)的身份在《自然》上發(fā)表文章,那么由于2000年他已經(jīng)以重要作者(最后作者)的身份在《自然》上發(fā)表過(guò)文章,于是在2006年他將被歸類(lèi)為《自然》上的資深PI。同時(shí),如果B是這篇2006年文章的另外3個(gè)普通合著者之一(非最后作者),如果2008年B以重要作者(最后作者)身份在《自然》上發(fā)表文章,那么B將被歸類(lèi)為2008年在《自然》上的有經(jīng)驗(yàn)PI。
PNAS文章中將最后作者作為論文的PI,分析了以上3類(lèi)PI隨時(shí)間的變化趨勢(shì),研究發(fā)現(xiàn):如果一名科學(xué)家在事業(yè)早期沒(méi)發(fā)過(guò)《自然》之類(lèi)的頂級(jí)期刊,那么該科學(xué)家在成為PI后的論文也更難登上同樣的期刊。這一趨勢(shì)在多學(xué)科期刊最為顯著,隨后依次是生物學(xué)、醫(yī)學(xué)、化學(xué)、物理等學(xué)科。需要注意的是,不同學(xué)術(shù)領(lǐng)域中文章的重要作者可能并不相同,可能是文章的第一作者、最后作者,也可能是文章的中間作者。本文已經(jīng)在兩大類(lèi)期刊中分別繪制了隨著作者數(shù)和時(shí)間的變化,最后作者、第一作者和中間作者擔(dān)任通訊作者的比例曲線。本文發(fā)現(xiàn)在《自然》和《科學(xué)》這樣綜合類(lèi)期刊中,最后作者和通訊作者存在強(qiáng)重疊性;但是在4本頂級(jí)醫(yī)學(xué)期刊中,第一作者和通訊作者之間存在最強(qiáng)重疊性?;谶@些結(jié)果,本文嘗試基于不同署名位置的作者角色對(duì)廣義的“陪護(hù)人效應(yīng)”進(jìn)行檢測(cè),檢測(cè)是否處于任何署名位置的作者都具有該效應(yīng),而不只有最后作者具有該效應(yīng)。
在PNAS論文中也檢測(cè)了“陪護(hù)人效應(yīng)”隨著時(shí)間的變化情況,發(fā)現(xiàn)《自然》雜志從1990?2012年,由那些以其他身份發(fā)過(guò)論文的科學(xué)家擔(dān)任末位作者的論文從16%增長(zhǎng)到22%,而初次在《自然》雜志中以末位作者發(fā)布的論文比例從39%逐步下降到31%。盡管這種時(shí)變特性非常有意義,但是作者們?cè)谘芯恐袥](méi)有對(duì)數(shù)據(jù)進(jìn)行加時(shí)間窗處理。當(dāng)不加時(shí)間窗進(jìn)行限制時(shí),隨著時(shí)間的演化在一本期刊上發(fā)表的論文越來(lái)越多,在該期刊已發(fā)表過(guò)文章的作者數(shù)量將越來(lái)越多,而新作者數(shù)很自然將會(huì)越來(lái)越少,這樣有可能會(huì)導(dǎo)致實(shí)驗(yàn)結(jié)果不準(zhǔn)確。
為了排除以上因素的影響,本文對(duì)實(shí)驗(yàn)進(jìn)行了加時(shí)間窗處理,并與不添加時(shí)間窗的結(jié)果對(duì)比,以便準(zhǔn)確地探究“陪護(hù)人效應(yīng)”隨著時(shí)間的變化情況。為了選擇合適的時(shí)間窗長(zhǎng)度,本文首先繪制了論文作者的生存曲線,選擇至少發(fā)表兩篇文章的作者,計(jì)算作者的發(fā)文時(shí)間間隔。如果作者在期刊上發(fā)表的第一篇文章的時(shí)間為t1,發(fā)表的第i篇文章的時(shí)間為ti,最后發(fā)表的一篇文章的時(shí)間為tend,那么該作者的發(fā)文時(shí)間間隔為tend?t1,根據(jù)此規(guī)則統(tǒng)計(jì)所有作者發(fā)文時(shí)間間隔所占的比例。結(jié)果如圖3所示,結(jié)合兩類(lèi)期刊的作者生存曲線可以看出,當(dāng)發(fā)文時(shí)間間隔大于15年時(shí)所占的比例基本小于0.02,因此可認(rèn)為作者在兩類(lèi)期刊上的生存時(shí)間約為15年,本研究中選擇時(shí)間窗長(zhǎng)度為15年。于是將選擇兩種實(shí)驗(yàn)條件進(jìn)檢測(cè),分別是加時(shí)間窗和不加時(shí)間窗,以驗(yàn)證不同條件下的實(shí)驗(yàn)結(jié)果是否存在差異。
圖3 生存曲線方面的描述
在“陪護(hù)人效應(yīng)”的檢測(cè)實(shí)驗(yàn)中,本文將假設(shè)通訊作者、第一作者、最后作者和中間作者(分別為第二作者、第三作者和倒數(shù)第二作者)作為文章的重要作者(PI),以檢測(cè)該效應(yīng)是否存在。由于要計(jì)算多種中間作者的3類(lèi)PI的比例,所以這里選擇作者數(shù)大于2的文章進(jìn)行數(shù)據(jù)分析。根據(jù)已經(jīng)選好的時(shí)間窗長(zhǎng)度,分別計(jì)算期刊中各個(gè)作者的3類(lèi)PI比例隨著時(shí)間的變化趨勢(shì),結(jié)果分別如圖4和圖5所示。其中橫坐標(biāo)表示年份,縱坐標(biāo)表示3類(lèi)PI的比例。
從圖4和圖5中的實(shí)驗(yàn)結(jié)果看出,在每類(lèi)期刊中無(wú)論加窗與否,各種作者的3類(lèi)PI比例都隨時(shí)間變化而變化,并且整體變化趨勢(shì)相似,說(shuō)明在不同條件下的實(shí)驗(yàn)結(jié)果是一致的。但是同條件下的6種作者的“伴隨效應(yīng)”大小存在一定差異。在圖4的《自然》和《科學(xué)》中,最后作者與通訊作者之間的比例相對(duì)來(lái)說(shuō)很接近,說(shuō)明最后作者和通訊作者之間存在一定關(guān)聯(lián)性,這與前面小節(jié)中得出的最后作者與通訊作者之間的重疊性有關(guān)。但是第一作者、第二作者、第三作者和倒數(shù)第二作者這4種作者與通訊作者之間的比例相差很大,這說(shuō)明他們與通訊作者之間存在較大差異。對(duì)比3種中間作者的實(shí)驗(yàn)結(jié)果,發(fā)現(xiàn)中間作者的“陪護(hù)人效應(yīng)”存在一定差異,其中第二作者和第三作者的結(jié)果更加接近,兩者都與倒數(shù)第二作者存在較大差異。
圖4 《自然》和《科學(xué)》6種作者的3類(lèi)PI比例曲線
圖5 4本醫(yī)學(xué)期刊中6種作者的3類(lèi)PI比例曲線
與綜合性期刊《自然》和《科學(xué)》的結(jié)果不同,在圖5的4本醫(yī)學(xué)期刊中,第一作者與通訊作者之間的曲線相對(duì)比較接近,尤其是有經(jīng)驗(yàn)PI比例,即圖5c和圖5d,說(shuō)明在4本醫(yī)學(xué)期刊中第一作者與通訊作者之間具有一定的關(guān)聯(lián)性,該結(jié)果與前面分析中第一作者與通訊作者之間存在較強(qiáng)重疊性有關(guān)。但是最后作者、倒數(shù)第二作者、第二作者和第三作者與通訊作者之間的結(jié)果相差較大,說(shuō)明他們與通訊作者在文章中所扮演的角色不同,對(duì)文章所做的貢獻(xiàn)也不相同。對(duì)比3種中間作者可以看出,第二作者、第三作者和倒數(shù)第二作者之間的差異性并不大,這3種作者的“陪護(hù)人效應(yīng)”的結(jié)果相對(duì)比較接近。
從整體結(jié)果來(lái)看,無(wú)論是《自然》和《科學(xué)》還是4本醫(yī)學(xué)期刊,3類(lèi)PI比例中6種角色的PI比例曲線隨時(shí)間變化的趨勢(shì)整體上是一樣的,即新PI比例隨時(shí)間變化呈下降趨勢(shì),有經(jīng)驗(yàn)PI隨時(shí)間變化整體呈上升趨勢(shì),資深PI隨時(shí)間變化整體呈上升趨勢(shì)。從3類(lèi)PI的變化趨勢(shì)來(lái)說(shuō)看,正與PNAS論文中的“陪護(hù)人效應(yīng)”相符合。但是,原始“陪護(hù)人效應(yīng)”的研究發(fā)現(xiàn)實(shí)際是基于文章最重要作者(即最后作者)的,研究的是向頂級(jí)期刊發(fā)表論文時(shí),重要作者對(duì)一般作者的“陪護(hù)”過(guò)程。本文發(fā)現(xiàn)不僅僅文章的最后作者才能具有該效應(yīng),即使是處于不同署名位置的作者,數(shù)據(jù)分析仍存在與“陪護(hù)人效應(yīng)”相同的變化趨勢(shì),說(shuō)明實(shí)際上存在廣義的“陪護(hù)人效應(yīng)”,即頂級(jí)學(xué)者只要參與到論文合作(頂級(jí)學(xué)者不一定非得是通訊作者)就對(duì)一般作者有一定的“陪護(hù)”效應(yīng)。
雖然不同署名位置的作者都存在“陪護(hù)人效應(yīng)”,但是不同位置作者的“陪護(hù)”作用仍然有一定區(qū)別。綜合3種PI比例變化可以看到,在圖4的《自然》和《科學(xué)》中,倒數(shù)第二作者的陪護(hù)效果相對(duì)更好。在圖5的四本醫(yī)學(xué)期刊中,最后作者和倒數(shù)第二作者的陪護(hù)效果相對(duì)更好。
盡管不同署名位置作者之間存在明顯的論文分工差異,但是通過(guò)基于不同位置作者對(duì)“陪護(hù)人效應(yīng)”進(jìn)行的檢測(cè)表明,無(wú)論任何位置作者都存在“陪護(hù)人效應(yīng)”的作用,但不同署名位置作者的陪護(hù)人效應(yīng)存在一定的區(qū)別。
本節(jié)根據(jù)不同署名位置作者和通訊作者之間相似性的差別對(duì)這一區(qū)別進(jìn)行解釋?zhuān)f(shuō)明影響陪護(hù)人效應(yīng)的內(nèi)在原因。本文分別計(jì)算最后作者與通訊作者、第一作者與通訊作者、倒數(shù)第二作者與通訊作者、第二作者與通訊作者和第三作者與通訊作者的之間杰拉德相似系數(shù),相似系數(shù)可定義為:
式中,Ui表示某一年中通訊作者的作者群;Uj表示某一年中最后作者、第一作者、倒數(shù)第二作者、第二作者或第三作者的作者群;相似系數(shù)則為兩個(gè)作者群交集與并集的作者數(shù)量比值。如兩類(lèi)期刊中每一年都會(huì)存在最后作者和通訊作者的作者群,若這兩個(gè)作者群的相似性系數(shù)較大,那么說(shuō)明大多數(shù)最后作者也是通訊作者。最后作者群與通訊作者群越相似,那么兩者之間存在強(qiáng)關(guān)聯(lián)性;若兩個(gè)作者群的相似性系數(shù)較小,則說(shuō)明最后作者和通訊作者之間的差異性較大。
如圖6所示,橫坐標(biāo)表示論文的發(fā)表時(shí)間,縱坐標(biāo)表示作者之間的杰拉德相似性系數(shù)。在《自然》和《科學(xué)》中,最后作者與通訊作者的相似系數(shù)隨著時(shí)間呈上升趨勢(shì),相似性最大約為0.5左右。第一作者與通訊作者之間的相似性呈下降趨勢(shì);而倒數(shù)第二作者、第二作者和第三作者與通訊作者之間的相似性最小。這些結(jié)果說(shuō)明在綜合類(lèi)期刊中,最后作者與通訊作者之間的相似性是最大的,這可以解釋前述研究中本文發(fā)現(xiàn)綜合類(lèi)期刊中最后作者與通訊作者之間的強(qiáng)重疊性。
圖6 通訊作者與另外5種作者之間的相似系數(shù)
與綜合類(lèi)期刊不同,4本醫(yī)學(xué)期刊中第一作者與通訊作者之間的相似性系數(shù)最大,占到了50%以上。最后作者與通訊作者的相似系數(shù)遠(yuǎn)小于第一作者和通訊作者之間的相似系數(shù),僅為0.12左右;而倒數(shù)第二作者、第二作者和第三作者與通訊作者之間的相似性系數(shù)最小,未超過(guò)0.05。這說(shuō)明在4本醫(yī)學(xué)期刊中,第一作者與通訊作者的相似性最大,但最后作者、倒數(shù)第二作者、第二作者和第三作者與通訊作者之間的相似性很小,說(shuō)明他們與通訊作者之間存在較大差異。這也對(duì)前面得出的第一作者與通訊作者之間存在強(qiáng)重疊性、而另外4種作者與通訊作者之間存在差異性進(jìn)行了解釋。
本文基于不同位置作者對(duì)廣義“陪護(hù)人效應(yīng)”進(jìn)行了檢測(cè),將第一作者、最后作者、通訊作者和3種中間作者(即第二作者、第三作者和倒數(shù)第二作者)假設(shè)為文章的重要作者(PI),并將文章的PI分成3類(lèi):新PI、有經(jīng)驗(yàn)PI和資深PI,在兩大類(lèi)期刊中對(duì)6種作者的3類(lèi)PI比例隨時(shí)間的變化進(jìn)行了分析。從整體變化趨勢(shì)來(lái)看,在兩大類(lèi)期刊中6種作者的新PI比例均隨著時(shí)間的變化慢慢下降,有經(jīng)驗(yàn)PI比例隨著時(shí)間上升,資深PI比例隨著時(shí)間的變化也慢慢上升。也就是說(shuō),在3種PI比例曲線中,6種位置作者的整體變化趨勢(shì)是類(lèi)似的,都呈現(xiàn)出廣義的“陪護(hù)人效應(yīng)”。本文分別計(jì)算了第一作者、倒數(shù)第二作者、最后作者、第二作者和第三作者與通訊作者之間的相似性系數(shù),對(duì)不同位置的作者間的差異性進(jìn)行了解釋?zhuān)嗨菩韵禂?shù)較大的作者之間存在較強(qiáng)的重疊性,而相似性系數(shù)較小的作者間則存在一定的差異。
本研究有助于深入理解不同署名位置的作者的角色和貢獻(xiàn),為科學(xué)學(xué)領(lǐng)域的探索提供新的研究思路,也可以為理解科學(xué)論文的動(dòng)態(tài)發(fā)表過(guò)程以及年輕科學(xué)家選擇科研導(dǎo)師帶來(lái)一些啟示。在進(jìn)行創(chuàng)新性的科研工作和發(fā)表高水平的科研論文時(shí),年輕的科學(xué)家選擇與資歷較深的科學(xué)家合作,能拓寬科研認(rèn)知,提高自身的科研水平,“站在巨人的肩膀上”增加在知名學(xué)術(shù)期刊上的發(fā)表機(jī)會(huì)。同時(shí),本文研究結(jié)果也可為科研管理部門(mén)和基金資助機(jī)構(gòu)提供啟示,對(duì)科研團(tuán)隊(duì)的組建提供更多合理可行的指導(dǎo)和建議。如在團(tuán)隊(duì)組成中注重老中青研究者的合理構(gòu)成,有利于年輕一代學(xué)者更好更快地成長(zhǎng)。在未來(lái)的研究中,如何準(zhǔn)確區(qū)分不同署名位置作者的角色及貢獻(xiàn),深入理解高水平科研成果的產(chǎn)出過(guò)程與陪護(hù)人效應(yīng)的內(nèi)在機(jī)制是值得探討的研究問(wèn)題。