宋艷輝 魏新星 邱均平
關(guān)鍵詞: 高產(chǎn)學(xué)者; 學(xué)者影響力; Altmetrics 指標(biāo); 評價指標(biāo)
DOI:10.3969 / j.issn.1008-0821.2024.01.014
〔中圖分類號〕G250.252 〔文獻標(biāo)識碼〕A 〔文章編號〕1008-0821 (2024) 01-0153-15
2020 年《中共中央關(guān)于制定國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和二0三五年遠(yuǎn)景目標(biāo)的建議》中指出, 要激發(fā)人才創(chuàng)新活力, 貫徹尊重勞動、尊重知識、尊重人才、尊重創(chuàng)造方針, 深化人才發(fā)展體制機制改革, 全方位培養(yǎng)、引進、用好人才, 造就更多國際一流的科技領(lǐng)軍人才和創(chuàng)新團隊, 培養(yǎng)具有國際競爭力的青年科技人才后備軍?,F(xiàn)今, 論文發(fā)表的數(shù)量已經(jīng)成為衡量學(xué)者和機構(gòu)對科學(xué)研究作出貢獻的一個重要依據(jù)[1] 。并且隨著研究的深入和擴展, 科研人員為促進彼此之間資源共享、提高科研攻關(guān)能力而越來越多地采取合作科研的方式[2] , 因此論文合著現(xiàn)象越來越普遍, 這有效提高了學(xué)者的科研產(chǎn)出量, 在領(lǐng)域內(nèi)也逐漸形成了高產(chǎn)學(xué)者群。各個不同研究領(lǐng)域匯集著不同的學(xué)者群體, 而高產(chǎn)學(xué)者群是其中的骨干力量, 在科研工作中發(fā)揮著關(guān)鍵的導(dǎo)向作用, 能夠推動該領(lǐng)域研究的繁榮與進步。普賴斯最早注意到高產(chǎn)作者研究的重要性, 他在1969 年發(fā)表的《小科學(xué), 大科學(xué)》一書中指出: 撰寫全部論文一半的高產(chǎn)作者的數(shù)量等于全部科學(xué)作者總數(shù)的平方根, 這就是著名的普賴斯定律[3] , 該定律是文獻計量學(xué)領(lǐng)域獲取主要學(xué)者分布數(shù)據(jù)的理論基礎(chǔ)[4] , 并被學(xué)者們在甄別高產(chǎn)學(xué)者時廣泛使用。評估高產(chǎn)學(xué)者的影響力有利于推動學(xué)者研究的積極性, 也可為上級引進優(yōu)秀人才提供參考[5] 。普賴斯定律對高產(chǎn)學(xué)者的定義已經(jīng)通過科研產(chǎn)出量這一單一指標(biāo)對學(xué)者的影響力進行了一定的評判, 但合理的學(xué)者影響力評價方法在評價學(xué)者科研產(chǎn)出絕對數(shù)量的基礎(chǔ)上還應(yīng)考慮科研成果的質(zhì)量, 對學(xué)者進行多維度的綜合影響力評價研究。學(xué)者綜合影響力是學(xué)者獲得學(xué)術(shù)界和社會大眾的重視及影響他們的作用力, 包括科研影響力和社會影響力, 對高產(chǎn)學(xué)者的綜合影響力展開評價, 可以甄別領(lǐng)域內(nèi)真正高質(zhì)量的高產(chǎn)學(xué)者, 幫助學(xué)者摒棄唯發(fā)文量至上的觀念, 促進領(lǐng)域研究的進步, 切實提升論文質(zhì)量, 也能為政府引進優(yōu)秀人才, 打造領(lǐng)先科研團隊, 從而推動地區(qū)領(lǐng)域研究攀上新高度提供有效參考。
以往對于學(xué)者的影響力評價大多以傳統(tǒng)文獻計量指標(biāo)為主。而近些年來, 越來越多研究采用Alt?metrics 指標(biāo)來評價學(xué)者的影響力, Altmetrics 指標(biāo)用于學(xué)者影響力評價的科學(xué)性和有效性已經(jīng)基本得到證實, 并且大部分學(xué)者認(rèn)為Altmetrics 指標(biāo)主要適用于學(xué)者的社會影響力評價[6] 。Altmetrics.com 是Altmetrics 指標(biāo)數(shù)據(jù)的主要搜集來源之一, Altmet?rics.com 會追蹤記錄包括News、Blog、Policy Docu?ment 等約20 項指標(biāo), 并給這些指標(biāo)賦予一定的權(quán)重, 從而計算加權(quán)的Altmetric Score。自2012 年10月, Nature 雜志及其子刊開始對其2012 年1 月1日及之后發(fā)表的論文開始實時在線統(tǒng)計, NatureMetrics 為Nature 的每一篇研究論文提供CrossRef 數(shù)據(jù)(DOI 文獻的被引用情況)、Web of Science 引用數(shù)據(jù)和在線關(guān)注數(shù)據(jù)(Altmetrics)[7] , 并提供Online Attention Score(Altmetric Score)。由于Altmetrics.com的評分標(biāo)準(zhǔn)歷史上發(fā)生過幾次變更, 并且官網(wǎng)也存在很多不夠透明的信息, 所以僅根據(jù)Online Atten?tion Score 不足以判斷某篇論文的社會影響力或水平, 需要對各項Altmetrics 指標(biāo)做進一步分析。
本文以Nature 生物科技子刊為例, 為深入了解該領(lǐng)域高產(chǎn)學(xué)者的綜合影響力, 選取了反映學(xué)者學(xué)術(shù)水平和科研合作程度的一系列傳統(tǒng)指標(biāo)作為待選指標(biāo), 同時融合Altmetrics 指標(biāo), 以3 本Nature生物科技子刊的官網(wǎng)為數(shù)據(jù)源, 試圖從高產(chǎn)學(xué)者的科研影響力和社會影響力兩個維度構(gòu)建其綜合影響力評價指標(biāo)體系。通過相關(guān)性分析、因子分析、主成分分析等方法分別對高產(chǎn)學(xué)者的科研影響力和社會影響力進行評價, 并分析兩個維度間的相互關(guān)系,最后得到高產(chǎn)學(xué)者影響力的二維評價結(jié)果。
1 國內(nèi)外研究現(xiàn)狀
1.1 基于傳統(tǒng)文獻計量指標(biāo)的學(xué)者影響力研究
目前, 較多研究側(cè)重從學(xué)者的學(xué)術(shù)、科研水平角度, 基于傳統(tǒng)的文獻計量指標(biāo)對學(xué)者的影響力進行研究。2005 年, 美國物理學(xué)家Hirsch J E[8] 基于學(xué)者與其文獻間的內(nèi)在關(guān)聯(lián), 率先提出一項旨在評價科研學(xué)者科研績效的新指標(biāo)———h 指數(shù)(h-in?dex)。h 指數(shù)隨即風(fēng)靡世界的學(xué)術(shù)圈, 成為學(xué)術(shù)界被廣泛應(yīng)用的計量指標(biāo), 并催生出一些新的h 型指數(shù)。2006 年, 比利時計量學(xué)家Egghe L[9] 在分析h指數(shù)評價效果時, 提出了一種基于學(xué)者以往累積貢獻的g 指數(shù)(g-index); 同年, 金碧輝等[10] 提出了R 指數(shù)和AR 指數(shù), 作為h 指數(shù)的補充指標(biāo)。隨著對學(xué)者影響力的研究越來越全面, 學(xué)術(shù)文獻測度指標(biāo)也逐漸完善。葉鷹[11] 圍繞發(fā)文量和引用量這兩個基本的學(xué)術(shù)文獻評價指標(biāo), 將學(xué)術(shù)文獻評價指標(biāo)歸納為均值測度指標(biāo)(篇均被引頻次、期刊影響因子、皇冠指數(shù)[12] 、活動指數(shù)[13] 、相對特化指數(shù)[11] 、引發(fā)距[11] 、h 指數(shù))、高影響特征測度(R 指數(shù)[10] 、e 指數(shù)[14] 、AR 指數(shù)[10] 、調(diào)和h 指數(shù)[15] )、整體綜合測度(調(diào)和R 指數(shù)[15] 、學(xué)術(shù)跡[11] 、集成影響因子[16] )3 類。學(xué)者們采用這些傳統(tǒng)的文獻計量指標(biāo)對學(xué)者的影響力進行了眾多實證分析。邱均平等[17]認(rèn)為, 將核心期刊的發(fā)文量和h 指數(shù)相結(jié)合的方法在篩選高影響力作者時具有優(yōu)勢, 并通過對圖書情報學(xué)領(lǐng)域的實證研究證明了該方法的有效性。劉萍等[18] 則在考慮傳統(tǒng)引文指標(biāo)的同時, 基于構(gòu)建的加權(quán)文獻引文網(wǎng)絡(luò)模型, 收集圖書情報學(xué)領(lǐng)域的16 種重要期刊文獻數(shù)據(jù), 利用引文對該領(lǐng)域的學(xué)者文獻影響以及學(xué)者學(xué)術(shù)影響力分別進行了綜合測度。
由于科研合作和跨學(xué)科研究的流行, 測度學(xué)者科研合作行為的計量指標(biāo)也不斷涌現(xiàn), 如合作度[19] 、合作率[20] 、合作系數(shù)[21] 這些常用指標(biāo)。進一步地,András S[22] 參照h 指數(shù)的設(shè)計思想, 同時考慮合作學(xué)者的數(shù)量及合作頻次, 提出了評價學(xué)者科研合作水平的新指標(biāo): 合作能力指數(shù), Guillaume C[23] 驗證了該指數(shù)在計算機領(lǐng)域的適用性。不少學(xué)者也研究了合作能力指數(shù)與傳統(tǒng)文獻計量指標(biāo)之間可能存在的關(guān)系。Ronald R[24] 指出“合作能力指數(shù)及其衍生指標(biāo)在計量學(xué)領(lǐng)域、社會科學(xué)領(lǐng)域中具有潛在研究價值”。國內(nèi)學(xué)者王衛(wèi)等[2] 通過對圖書情報領(lǐng)域522 位作者的實證分析, 得到合作能力指數(shù)與作者科研績效指標(biāo)(發(fā)文量、總被引、h 指數(shù))存在正相關(guān)關(guān)系, 而合作度、合作率、合作系數(shù)這些指標(biāo)卻不具備上述特征的結(jié)論。
還有一部分研究在傳統(tǒng)文獻計量指標(biāo)的基礎(chǔ)上, 引入了社會網(wǎng)絡(luò)分析的觀點對學(xué)者的影響力進行研究。余波等[25] 選取了社會網(wǎng)絡(luò)分析方法的點度中心度、中介中心度、接近中心度的測度指標(biāo),同被引頻次、學(xué)者發(fā)文數(shù)等傳統(tǒng)文獻計量指標(biāo)作為二級評價指標(biāo)測度中國學(xué)術(shù)話語權(quán)。范如霞等[26]則結(jié)合發(fā)文量和度數(shù)中心度兩個指標(biāo)分別測度學(xué)者在不同時間維度下的個人影響力和在團隊的影響力,以補充學(xué)者的動態(tài)學(xué)術(shù)影響力測評。
根據(jù)以上回顧總結(jié), 梳理的評價學(xué)者影響力傳統(tǒng)指標(biāo)如表1 所示。
1.2 基于Altmetrics 指標(biāo)的學(xué)者影響力研究
開放科學(xué)背景下, 在線學(xué)術(shù)交流日益盛行, 傳統(tǒng)的學(xué)術(shù)評價方式已不能全面反映學(xué)術(shù)成果的多維度影響。美國學(xué)者Jason Priem 在2010 年首次于Twitter 上使用“Altmetrics” 一詞, 并將其視為對傳統(tǒng)文獻計量指標(biāo)的補充。經(jīng)歷了兩年熱議后,Altmetrics 指標(biāo)因其客觀性、時效性和開放性得到驗證而逐漸受到學(xué)者們的廣泛關(guān)注[28] 。
應(yīng)用Altmetrics 指標(biāo)評價學(xué)者影響力的研究越來越多。Li X 等[29] 以Nature 和Science 雜志上的論文為樣本, 將WoS、Google 的被引數(shù)據(jù)與CiteU?Like、Mendeley 兩個平臺上的讀者數(shù)據(jù)進行相關(guān)性分析, 結(jié)果表明讀者數(shù)指標(biāo)適用于論文學(xué)術(shù)影響力評價。郭穎等[6] 在分析國外Altmetrics 指標(biāo)來源平臺的基礎(chǔ)上, 從國內(nèi)相似平臺的代表性平臺: 知網(wǎng)、科學(xué)網(wǎng)、微信公眾號、微博、百度百科以及新聞提及中選?。粒欤簦恚澹簦颍椋悖?指標(biāo), 構(gòu)建評價指標(biāo)體系,用于我國學(xué)者的影響力評價。楊柳等[30] 則以機構(gòu)知識庫為數(shù)據(jù)源, 分別基于標(biāo)準(zhǔn)化Altmetrics 得分、Altmetric Score、標(biāo)準(zhǔn)化被引得分3 種方法進行學(xué)者影響力評價。
目前, Altmetrics 指標(biāo)的研究工具主要有Alt?metrics. com、ImpactStory、Plum Analytics 和PLoSALMs, 各種研究工具在評價對象、面向用戶、獲取方式和服務(wù)形式上都存在著異同[31] 。本研究使用最常用的Altmetrics.com 作為Altmetrics 指標(biāo)的研究工具, 依靠點擊每篇Nature 論文的簡介網(wǎng)頁中的“Metric” 按鈕從而跳轉(zhuǎn)至Altmetrics.com。
1.3 結(jié)合傳統(tǒng)計量指標(biāo)和Altmetrics 指標(biāo)的學(xué)者影響力研究
隨著對學(xué)者影響力的研究日益深入, 學(xué)者影響力的評價從單一指標(biāo)向多維指標(biāo)轉(zhuǎn)變, 許多學(xué)者采用傳統(tǒng)計量指標(biāo)和Altmetrics 指標(biāo)相結(jié)合的方法對學(xué)者的綜合影響力進行探究。王妍[32] 從學(xué)術(shù)維度和社會維度兩方面測度學(xué)者影響力, 選取傳統(tǒng)引文指標(biāo)和Altmetrics 指標(biāo)為待選指標(biāo), 通過因子分析法得到分別代表學(xué)術(shù)影響力和社會影響力的兩個公因子, 將這兩個因子投射到二維直角坐標(biāo)系中, 以反映學(xué)者的科研角色。王菲菲等[33] 為研究基因編輯領(lǐng)域?qū)W者的綜合影響力, 分別選取調(diào)和h 指數(shù)、調(diào)和R 指數(shù)等作為學(xué)術(shù)文獻影響力的二級指標(biāo),選取Altmetric Score 均值、Altmetric-h 指數(shù)、Alt?metric 各項均值作為社會影響力的二級指標(biāo), 探究多類指標(biāo)對各維度影響力的作用程度。
通過實證分析學(xué)者們也證實了Altmetrics 指標(biāo)對傳統(tǒng)計量指標(biāo)的有效補充作用。Torres-Salinas D等[34] 比較了傳統(tǒng)計量指標(biāo)引文量和Altmetrics 指標(biāo)的關(guān)系, 研究表明被引量最高的論文Altmetrics 得分也最高, 得到被引量和Altmetrics 得分之間具有正相關(guān)關(guān)系的結(jié)論。劉曉娟等[35] , 獲得Mendeley與Web of Science 兩平臺的交叉文獻集合, 通過具體分析證實了以閱讀數(shù)和標(biāo)簽數(shù)為代表的選擇性計量指標(biāo)可以在一定程度上評估文獻的影響力。范少萍等[36] 對比僅使用學(xué)術(shù)跡進行學(xué)者學(xué)術(shù)影響力的評價結(jié)果發(fā)現(xiàn), 學(xué)術(shù)跡與F1000 因子的綜合方法可彌補傳統(tǒng)評價方式的不足。
根據(jù)前人的研究可知, 學(xué)者影響力評價的發(fā)展方向應(yīng)為傳統(tǒng)計量方法與Altmetrics 指標(biāo)計量方法的結(jié)合。雖然在對學(xué)者的綜合影響力進行評價研究時, 有學(xué)者考慮了多維度的影響力因素, 但都是對所有水平的學(xué)者進行的一貫評價。因此, 本文選定高產(chǎn)學(xué)者為樣本學(xué)者, 預(yù)先界定了學(xué)者的水平, 作為一個新的角度, 融合傳統(tǒng)指標(biāo)和Altmetrics 指標(biāo)對他們的綜合影響力進行評價, 分析領(lǐng)域內(nèi)不同發(fā)文量的高產(chǎn)學(xué)者的綜合影響力差異, 探究學(xué)者的科研成果的高產(chǎn)量是否就同時意味著高質(zhì)量。
2 高產(chǎn)學(xué)者綜合影響力評價指標(biāo)體系構(gòu)建
構(gòu)建高產(chǎn)學(xué)者綜合影響力評價指標(biāo)體系, 須初步采集科研影響力和社會影響力這兩個維度的待選傳統(tǒng)指標(biāo)和Altmetrics 指標(biāo)及其數(shù)據(jù), 再通過一系列分析篩選可用指標(biāo), 最終完成評價指標(biāo)體系構(gòu)建。
2.1 高產(chǎn)學(xué)者綜合影響力的評價指標(biāo)選取
2.1.1 傳統(tǒng)指標(biāo)的選取
針對傳統(tǒng)指標(biāo), 根據(jù)表1, 考慮從學(xué)者學(xué)術(shù)文獻水平、科研合作行為及社會網(wǎng)絡(luò)地位3 個評價角度分別篩選指標(biāo)。
1) 學(xué)者學(xué)術(shù)文獻水平角度
由于大部分論文的合著作者較多, 因此在前人研究的基礎(chǔ)上, 同時考慮指標(biāo)的代表性和學(xué)者署名次序, 經(jīng)過謹(jǐn)慎遴選, 確定發(fā)文量、總被引頻次、調(diào)和被引頻次、調(diào)和h 指數(shù)、調(diào)和R 指數(shù)這5 個指標(biāo)為待選指標(biāo)。前兩個指標(biāo)為最基本的文獻計量指標(biāo)。由于學(xué)者的署名次序差異大, 采用簡單的均值測度指標(biāo)可能對研究結(jié)果產(chǎn)生影響, 因此用調(diào)和被引頻次指標(biāo)代替均值測度指標(biāo)中的篇均被引頻次。調(diào)和h 指數(shù)與調(diào)和R 指數(shù)分別為高影響特征測度和整體綜合測度指標(biāo)。
其中, 調(diào)和h 指數(shù)是指學(xué)者發(fā)表的N 篇論文中, 有h 篇論文的調(diào)和被引頻次大于或等于h 次,而其余N-h 篇論文的調(diào)和被引頻次均小于h 次[15] 。調(diào)和h 指數(shù)(harmonic h-core)中的調(diào)和被引次數(shù)(harmonic citations)考慮學(xué)者的署名次序進而分配不同的權(quán)重, 用c 表示作者第j 篇文獻的被引頻次,i 表示作者的署名次序, n 為作者人數(shù)[33] , 其計算公式如下:
2) 學(xué)者科研合作行為角度
確定合作能力指數(shù)為待選指標(biāo)。主要考慮到合作度、合作率、合作系數(shù)這3 項指標(biāo)通常作為一組整體指標(biāo)對學(xué)者的科研合作行為進行測度, 而合作能力指數(shù)可作為一個單獨的指標(biāo), 以不同的角度,在揭示作者的科研績效方面更有優(yōu)勢。
合作能力指數(shù)的計算方法可表述為: 將某一作者的合作者按照其與該作者的合作頻次降序排列,當(dāng)合作者序號首次大于對應(yīng)合作頻次時, 該序號減1 即為該作者的合作能力指數(shù)[37] 。
3) 學(xué)者社會網(wǎng)絡(luò)地位角度
確定點度中心度、中介中心度作為待選指標(biāo)。點度中心度和中介中心度關(guān)注的都是某個節(jié)點與網(wǎng)絡(luò)中其他節(jié)點的直接關(guān)系, 而接近中心度關(guān)注的是捷徑[25] 。簡單來說, 中介中心度表現(xiàn)控制能力,而接近中心度表現(xiàn)不被控制的能力, 為了對學(xué)者的影響力進行最直接的評價, 本文沒有選取接近中心度這個指標(biāo)。
點度中心度是在網(wǎng)絡(luò)分析中刻畫節(jié)點中心性的最直接度量指標(biāo)。一個節(jié)點的節(jié)點度越大就意味著這個節(jié)點的點度中心性越高, 該節(jié)點在網(wǎng)絡(luò)中就越重要[38] 。用C(N )表示節(jié)點i 的點度中心度, 用于計算節(jié)點i 與其他g-1 個j 節(jié)點(i≠j), 其計算公式如下:
2.1.2 Altmetrics 指標(biāo)的選取
針對Altmetrics 指標(biāo), 為保證所有指標(biāo)的時序一致性, 將Weibo、Google+、LinkedIn 和Pinterest這4 項分別于2015 年、2019 年、2014 年、2013 年不再被追蹤記錄的指標(biāo)剔除, 將剩余19 個Altmet?ric.com 會記錄的指標(biāo)都納入評價學(xué)者社會影響力的待選指標(biāo)。
初步選取的高產(chǎn)學(xué)者綜合影響力的所有評價指標(biāo)如表2 所示。
2.2 數(shù)據(jù)來源及說明
作為科研創(chuàng)新的核心力量, 活躍高產(chǎn)的頂尖學(xué)者群體在引領(lǐng)學(xué)術(shù)發(fā)展和推動科學(xué)革命過程中發(fā)揮著關(guān)鍵作用[40] 。本文在Scopus 數(shù)據(jù)庫中選擇Bio?technology 學(xué)科類別, 選?。玻埃玻?年CiteScore 前3 位的期刊: Nature Biotechnology、Nature Methods 和Na?ture Biomedical Engineering 作為數(shù)據(jù)源, 在3 本期刊的官網(wǎng)中采集所需數(shù)據(jù)。這3 本期刊中的論文是生物科技領(lǐng)域高被引的高水平論文, 論文質(zhì)量與頂尖學(xué)者比例較高, 因此選擇它們有助于采集到理想的指標(biāo)數(shù)據(jù), 得到更科學(xué)合理的研究結(jié)果。分別選?。?本期刊Research Articles 目錄下類別為Article的文章, 綜合考慮高產(chǎn)學(xué)者的活躍度、時效性, 與論文被引高峰因素, 將發(fā)表年份設(shè)置為2019—2021年, 數(shù)據(jù)采集時間為2023 年3 月。共檢索得到727篇論文, 涉及8 675名不同的學(xué)者。根據(jù)普賴斯定律計算得出高產(chǎn)學(xué)者人數(shù)為√8675, 向上取整即為94 名。統(tǒng)計8 675名學(xué)者的發(fā)文數(shù)量并從大到小排序, 發(fā)現(xiàn)發(fā)文量大于等于3 篇的學(xué)者共95 名, 因此將這95 名學(xué)者全部納入樣本, 樣本數(shù)量為95 個。
針對Altmetrics 指標(biāo), 由于Altmetrics.com 顯示的指標(biāo)相比Nature Metrics 更為完整, 因此以每篇文章為單位, 記錄每篇文章下由“Metric” 按鈕跳轉(zhuǎn)至Altmetrics.com 詳情頁中的各項Altmetrics 指標(biāo)值。發(fā)文量、總被引頻次、調(diào)和被引頻次、調(diào)和h指數(shù)、調(diào)和R 指數(shù)以及合作能力指數(shù)的計算是通過統(tǒng)計的期刊官網(wǎng)提供的各文章的CrossRef(DOI文獻的被引用情況)數(shù)據(jù), 以及每篇文章的作者總數(shù)及樣本學(xué)者的署名次序、合作關(guān)系簡單計算得出。點度中心度和中介中心度則利用Ucinet 軟件計算得出。為了避免各項指標(biāo)值在短時間內(nèi)發(fā)生變動而對研究結(jié)果產(chǎn)生影響, 所有數(shù)據(jù)均在連續(xù)的3 天內(nèi)采集完成。在全部指標(biāo)計算完成后, 發(fā)現(xiàn)有12 名學(xué)者的重要指標(biāo)值缺失, 因此將這12 名學(xué)者從樣本中整體剔除, 得到有效樣本學(xué)者83 名, 最終的作者合作網(wǎng)絡(luò)也由這83 名學(xué)者所構(gòu)建??紤]同一論文由83名學(xué)者中的多名學(xué)者共著的情況, 2019—2021 年83名學(xué)者共計發(fā)表不重復(fù)的論文310 篇, 具體發(fā)文量情況如表3 所示。
2.3 評價指標(biāo)的描述性統(tǒng)計分析
為進一步了解樣本數(shù)據(jù)的分布情況, 初步剔除表2 中表征能力較弱的評價指標(biāo), 利用SPSS 軟件分別對Altmetrics 指標(biāo)和傳統(tǒng)指標(biāo)進行描述性統(tǒng)計分析, 得到如表4 所示的結(jié)果。繪制P-P 圖, 發(fā)現(xiàn)樣本數(shù)據(jù)點均不在明顯的一條直線上, 因此指標(biāo)數(shù)據(jù)都不符合正態(tài)分布。觀察表4 的指標(biāo)覆蓋率結(jié)果, 發(fā)現(xiàn)Altmetrics 指標(biāo)中出現(xiàn)較多0 值, 共有5項, 為Syllabi、Q&A、Youtube、Citeulike Readers 和Connotea Readers。覆蓋率低的Altmetrics 指標(biāo)還包括Reddit(11.61%)、Research Highlights (11.29%)、Wikipedia(10.65%)、Video Uploader(4.19%)、Poli?cy Document ( 2.26%)、Peer Review (0.65%) 和F1000(0.32%)??紤]到覆蓋率低的指標(biāo)表征能力較弱, 本文借鑒王凱利等[41] 的做法, 剔除覆蓋率值取整后低于25%的Altmetrics 指標(biāo), 剩余8 個Altmet?rics 指標(biāo), 分別為: ①Altmetric Score、②News、③Blog、④Patent、⑤Twitter、⑥Facebook、⑦MendeleyReaders、⑧Dimensions & WoS Citations。所有8 個傳統(tǒng)指標(biāo)均采集到數(shù)據(jù), 指標(biāo)覆蓋率100%。從表4 可知, 初步篩選后的兩部分指標(biāo)數(shù)值的最大值與最小值差異顯著, 說明指標(biāo)數(shù)值的波動范圍極大。兩個維度指標(biāo)數(shù)值的均值差異顯著, 標(biāo)準(zhǔn)差也較大, 表明指標(biāo)數(shù)值整體上具有離散程度較高的特征。最后,從分布形態(tài)上看, 高產(chǎn)學(xué)者綜合影響力評價指標(biāo)數(shù)值的偏度、峰度均為正值, 表明數(shù)值的分布均呈長尾偏右的尖頂曲線特征。因此這16 個評價指標(biāo)在各自的維度內(nèi)整體上差異顯著, 表征能力較強, 保留這兩部分共16 個指標(biāo)以做下一步分析。
2.4 科研影響力評價
2.4?.1 指標(biāo)相關(guān)性及信效度檢驗
樣本數(shù)據(jù)都不符合正態(tài)分布, 因此采用Spearman相關(guān)性分析方法。將8 個傳統(tǒng)指標(biāo)依次用T1 ~ T8表示, 得到的Spearman 相關(guān)系數(shù)如表5 所示。分析表5 結(jié)果可知, 各指標(biāo)間均存在顯著相關(guān)的指標(biāo)對, 故保留所有傳統(tǒng)指標(biāo)。
為保證所有數(shù)據(jù)可比, 運用SPSS 軟件對8 個傳統(tǒng)指標(biāo)進行Z-score 標(biāo)準(zhǔn)化處理, 并對指標(biāo)的信效度進行檢驗, 結(jié)果如表6 所示。通常, 可以通過Cronbach Alpha 系數(shù)的大小評價內(nèi)在的信度的高低[42] , 分析檢驗結(jié)果可知, 傳統(tǒng)指標(biāo)的CronbachAlpha 值為0.844, 指標(biāo)信度較高, 對全部傳統(tǒng)指標(biāo)進行保留, 指標(biāo)篩選結(jié)束。
一般認(rèn)為, 當(dāng)KMO 值小于0.5 時, 不適合進行因子分析, 而KMO 值大于0.9 時, 則非常適合進行因子分析[43] 。由表6 可知, KMO 值為0.771, 大于0.5, Bartlett 檢驗的顯著水平為0.000, 達(dá)到顯著水平。因此, 本文的樣本數(shù)據(jù)適合進行因子分析。
2.4.2 因子分析與主成分分析
在多指標(biāo)綜合評價中很多指標(biāo)信息重復(fù), 會增加計算工作量從而影響評價的準(zhǔn)確性。主成分分析法就是通過降維將原來眾多具有一定相關(guān)性的指標(biāo)重新組合成一組新的互相無關(guān)、盡量少的綜合指標(biāo)來代替原來的指標(biāo), 這些新的綜合指標(biāo)保留了原始變量的主要信息, 同時彼此之間又不相關(guān), 比原始變量具有更優(yōu)越的性質(zhì), 從而更能反映問題的實質(zhì)。確定主成分以及相應(yīng)的權(quán)數(shù)一般可以用特征根大于1 作為納入標(biāo)準(zhǔn)[44] 。根據(jù)表7 的總方差解釋表, 實驗對傳統(tǒng)指標(biāo)共提取出兩個公共因子, 特征值均大于1, 累計方差貢獻率為68.568%, 說明前兩個因子可以揭示大部分變量的特征。
由因子分析得到成分矩陣, 通過最大方差法進行因子旋轉(zhuǎn)后, 得到旋轉(zhuǎn)成分矩陣表, 如表8 所示。因子載荷是變量與公共因子的相關(guān)系數(shù), 當(dāng)變量在某公共因子中的載荷絕對值越大, 表明該變量與該公共因子更密切[45] 。表中只顯示了因子載荷大于0.5 的值, 因子載荷小于0.5 值已被隱去。觀察表8 可知, 各指標(biāo)間不存在交叉載荷, 說明篩選出的可用指標(biāo)均有意義。
因子1 主要解釋發(fā)文量、總被引頻次、調(diào)和被引頻次、調(diào)和h 指數(shù)、調(diào)和R 指數(shù)和中介中心度6個變量。其中, 一個學(xué)者發(fā)文量的多少會對論文的總被引頻次產(chǎn)生影響, 基本上呈促進作用。而調(diào)和被引頻次的計算需要依據(jù)單篇論文被引頻次的數(shù)據(jù)最后得出一個加總數(shù), 依托調(diào)和被引頻次數(shù)據(jù)才能計算調(diào)和h 指數(shù), 接著計算調(diào)和h 指數(shù)的平方根才可得到調(diào)和R 指數(shù)。因此這5 個變量環(huán)環(huán)相扣,同時在因子1 下顯現(xiàn)。“中心性” 是社會網(wǎng)絡(luò)分析的重點之一, 個人或組織在社會網(wǎng)絡(luò)中具有怎樣的權(quán)力, 或者說居于怎樣的中心地位, 對于信息在整個網(wǎng)絡(luò)中如何傳播, 及其傳播效果如何都有著十分重要的意義[46] , 點度中心度和中介中心度都是社會網(wǎng)絡(luò)中心性分析的方法。生物科技領(lǐng)域高產(chǎn)學(xué)者的論文合著現(xiàn)象極多, 也就是說該領(lǐng)域的高產(chǎn)學(xué)者之間普遍存在科研合作的關(guān)系, 而社會網(wǎng)絡(luò)分析方法正是以研究關(guān)系見長的一種方法[47] 。所謂“社會網(wǎng)絡(luò)” 指的是社會行動者及其間的關(guān)系的集合[48] , 社會網(wǎng)絡(luò)分析就是要對社會網(wǎng)絡(luò)中行為者之間的關(guān)系進行量化研究[49] 。而發(fā)文量的多少就會影響論文作者(社會行動者)數(shù)量的多少, 即某一學(xué)者發(fā)文量越多, 涉及與其合作的作者就越多, 因此中介中心性同另外5 個傳統(tǒng)文獻計量指標(biāo)共用一個公因子便有據(jù)可依了。這與李亮等[47] 的研究結(jié)論也是一致的: 發(fā)表文獻比較多的作者同他人的合作也比較頻繁。
因子2 解釋合作能力指數(shù)和點度中心度兩個變量。中介中心性著重刻畫行動者對資源的控制程度, 而網(wǎng)絡(luò)中某個節(jié)點的點度中心度則是根據(jù)網(wǎng)絡(luò)中與該點有連接的點的數(shù)目來衡量, 即節(jié)點的連接數(shù)越多, 就代表該節(jié)點的社會關(guān)系越多, 其影響力就越強。合作能力指數(shù)也融有網(wǎng)絡(luò)概念, 從考察學(xué)者的嵌入自我網(wǎng)絡(luò)方式出發(fā), 著重研究學(xué)者的合作行為是否穩(wěn)定, 測度其高頻合作水平如何??傮w上, 合作能力指數(shù)和點度中心度都是度量科研合作網(wǎng)絡(luò)中的一個節(jié)點(一位學(xué)者)與其他節(jié)點(其他學(xué)者)的聯(lián)系密切程度, 所以兩個變量同時在因子2下顯現(xiàn)。
根據(jù)表7, 把進行因子旋轉(zhuǎn)后的各因子方差貢獻率占總方差貢獻率的比重作為權(quán)重, 并進一步加權(quán)匯總, 得出生物科技領(lǐng)域高產(chǎn)學(xué)者的科研影響力得分計算公式如下:
根據(jù)上述公式計算得出每位樣本學(xué)者的科研影響力得分, 得分排名前30 位的學(xué)者如表10 所示。
2.5 社會影響力評價
2.5.1 指標(biāo)相關(guān)性分析及信效度檢驗
同樣用SPSS 軟件對樣本數(shù)據(jù)進行Spearman 相關(guān)性分析。根據(jù)檢驗結(jié)果, 各Altmetrics 指標(biāo)之間均存在顯著的相關(guān)關(guān)系, 故保留所有指標(biāo)。
接著對8 個Altmetrics 指標(biāo)進行數(shù)據(jù)標(biāo)準(zhǔn)化處理, 進行信效度檢驗。剔除同時在兩個因子中負(fù)荷較高的指標(biāo)——Mendeley Readers 后, 得到表11 的檢驗結(jié)果。指標(biāo)整體的Cronbach Alpha 值為0.91,表明指標(biāo)的信度很高; KMO 值為0.671, 因此樣本數(shù)據(jù)適合進行因子分析。
2.5.2 因子分析與主成分分析
根據(jù)表12 的總方差解釋表, 實驗對Altmetrics指標(biāo)提取出兩個公共因子, 特征值均大于1, 累計方差貢獻率達(dá)到83.847%, 說明前兩個因子可以揭示大部分變量的特征。
由因子分析得到成分矩陣, 通過最大方差法進行因子旋轉(zhuǎn)后, 得到旋轉(zhuǎn)成分矩陣表如表13 所示。結(jié)果顯示各指標(biāo)間不存在交叉載荷, 證明篩選出的Altmetrics 指標(biāo)均有意義。
因子1 解釋Altmetric Score、News、Blog、Twit?ter 和Facebook 5 個變量。News、Blog、Twitter 和Facebook 是最具代表性的幾個Altmetrics 指標(biāo)。其中, News 指示有幾條新聞中提到了某篇論文; Blog指示一篇論文所引發(fā)的在線學(xué)術(shù)討論的次數(shù),Twitter 和Facebook 顯示了由出版物引發(fā)的一般公眾在社交媒體平臺上發(fā)帖的次數(shù)[50] 。這4 個變量注重新聞、百科及社交媒體上這些學(xué)術(shù)界外的廣泛影響力, 也是Altmetric Score 計分的主要來源。
因子2 解釋Patent 與Dimensions & WoS Cita?tions 兩個變量。Patent 指示論文被專利文件引用的次數(shù), 即實體文件的引用次數(shù), 已經(jīng)脫離了互聯(lián)網(wǎng)和媒體的范疇, 而Dimensions & WoS Citations 指標(biāo)由于包含論文在Dimensions 和WoS 網(wǎng)站上的引用量數(shù)據(jù), 因此兩個變量共用一個公因子。
2.5.3 社會影響力評價指標(biāo)函數(shù)的構(gòu)建及結(jié)果評價
Altmetrics 指標(biāo)各成分得分系數(shù)矩陣如表14 所示, 將表中的變量依次表示為Y、Y、…、Y, 兩個成分分別表示為F3 和F4, 則可以得到以下因子得分函數(shù):
根據(jù)上述公式計算得出樣本學(xué)者的社會影響力得分, 分值排名前30 位的學(xué)者如表15 所示。表中同時顯示了各學(xué)者的社會影響力得分排名與科研影響力得分排名相比的變化情況, 正數(shù)表示和科研影響力相比, 該學(xué)者的社會影響力排名有所上升, 負(fù)數(shù)表示排名下降。觀察排名變動可知, 表中大部分的學(xué)者在兩個維度的影響力排名變化較大。說明兩個評價維度的結(jié)果差異明顯, 單獨使用任一維度的指標(biāo)體系對高產(chǎn)學(xué)者的影響力進行評價都是不全面的。
3 高產(chǎn)學(xué)者的影響力二維測度
3.1 科研影響力及社會影響力相關(guān)性分析
對樣本學(xué)者的科研影響力及社會影響力得分值結(jié)果進行Spearman 相關(guān)分析, 得到如表16 所示的相關(guān)系數(shù)表。根據(jù)相關(guān)分析結(jié)果, 兩者的相關(guān)系數(shù)為0.629, 表明兩者呈較強的正相關(guān)關(guān)系。因此,本文將科研影響力和社會影響力二者結(jié)合進行高產(chǎn)學(xué)者影響力評價具有一定的意義, 將兩個維度結(jié)合得到的高產(chǎn)學(xué)者綜合影響力結(jié)果更具合理性。本文故借鑒王妍[32] 的二維評價方法對高產(chǎn)學(xué)者的影響力進行測度。
3.2 二維測度
本文將樣本學(xué)者的科研影響力得分值繪制于X軸, 社會影響力得分值繪制于Y 軸, 以代表平均水平的(0,0)點為原點, 并依據(jù)原點設(shè)置標(biāo)準(zhǔn)分界線,繪制的高產(chǎn)學(xué)者影響力的二維評價散點圖如圖1 所示。根據(jù)王妍[32] 的評價思想, 可將樣本學(xué)者劃分為以下4 類。
1) “名家學(xué)者”: 得分點落于第一象限, 共有14 位高產(chǎn)學(xué)者, 占比16.87%。他們同時具有高科研影響力和高社會影響力, 是其所在研究領(lǐng)域的關(guān)鍵人物。“名家學(xué)者” 中最突出的得分點來自美國康涅狄格大學(xué)病理生物學(xué)與獸醫(yī)科學(xué)系(Depart?ment of Pathobiology and Veterinary Science, Univer?sity of Connecticut, Storrs) 的學(xué)者Tyler D.Gavitt,其3 年的發(fā)文量為53 篇, 并且于每篇論文中均是署名第二的作者。該學(xué)者的科研影響力與社會影響力排名都是第一名, 說明他為生物科技領(lǐng)域的研究做出了卓越的貢獻。
2) “明星學(xué)者”: 得分點落于第二象限, 共有5位高產(chǎn)學(xué)者, 占比6.02%。這部分學(xué)者獲得了較高的社會關(guān)注度, 但科研貢獻度相對較低。以該區(qū)域的學(xué)者Jonathan S. Weissman 為例, 他來自美國加州大學(xué)舊金山分校細(xì)胞與分子藥理學(xué)研究中心(Depart?ment of Cellular and Molecular Pharmacology, Univer?sity of California, San Francisco), 3 年間共發(fā)表4 篇論文, 論文News 累積提及量就有34 次, Twitter 累計提及量更是高達(dá)781 次, 被專利文件引用的次數(shù)也多達(dá)19 次, 因此其社會影響力排名較高, 為14名。相較之下, 該學(xué)者發(fā)表的4 篇論文的總被引頻次為300 次, 而調(diào)和被引頻次只有19.55 次, 其科研影響力排名僅為59 名, 兩份排名結(jié)果懸殊。
3) “普通學(xué)者”: 得分點落于第三象限, 這個區(qū)域共有52 位高產(chǎn)學(xué)者, 占比62.65%, 是占全體樣本學(xué)者比重最大的部分。這部分學(xué)者在科研貢獻度和社會關(guān)注度方面都表現(xiàn)平平, 并且這個區(qū)域的大部分學(xué)者與坐標(biāo)軸都有一定距離, 因此這部分學(xué)者無論是在提高科研水平還是獲得社會關(guān)注度方面都應(yīng)持續(xù)努力。
4) “專業(yè)學(xué)者”: 得分點落于第四象限, 共有12 位高產(chǎn)學(xué)者, 占比14.46%。“專業(yè)學(xué)者” 有著較強的科研能力, 卻沒能贏得大眾的廣泛關(guān)注。以該區(qū)域來自美國斯坦福大學(xué)病理學(xué)系(Departments ofPathology, Stanford University)的學(xué)者Caleb A.Lareau為例, 其在3 年間所發(fā)表的5 篇論文中就有4 篇署名第一或第二, 調(diào)和被引頻次高達(dá)103.87 次。但這幾篇論文的Blog 累計提及量僅為3 次, Facebook累計提及量僅為6 次, 顯示出其發(fā)表的論文的較低社會關(guān)注度。因此“專業(yè)學(xué)者” 可以適當(dāng)提高自身在社交媒體的活躍度[51] , 以期提升大眾熟知度及其科研成果的社會影響力。
4 結(jié)論
本文為構(gòu)建融合Altmetrics 指標(biāo)和傳統(tǒng)指標(biāo)的高產(chǎn)學(xué)者綜合影響力評價指標(biāo)體系, 在前人的研究基礎(chǔ)上, 初步遴選傳統(tǒng)指標(biāo)和Altmetrics 指標(biāo), 以Nature 生物科技子刊雜志官網(wǎng)為數(shù)據(jù)源, 采集相關(guān)指標(biāo)數(shù)據(jù)。分別從科研影響力和社會影響力兩個維度, 對樣本學(xué)者的影響力開展評價并進行排序, 同時比較了兩份排名的結(jié)果。結(jié)果發(fā)現(xiàn), 大部分學(xué)者在兩個維度的影響力排名結(jié)果差別較大, 即單獨使用任一維度的評價指標(biāo)體系對高產(chǎn)學(xué)者的影響力進行評價都是有局限性的。遂進一步對樣本學(xué)者的科研影響力及社會影響力的得分結(jié)果進行Spearman相關(guān)分析, 得到兩者呈較強的正相關(guān)關(guān)系, 說明本文將科研影響力即傳統(tǒng)指標(biāo)與社會影響力即Alt?metrics 指標(biāo)二者結(jié)合進行高產(chǎn)學(xué)者的綜合影響力評價具有合理性。最后本文得出高產(chǎn)學(xué)者影響力的二維測度結(jié)果。
同時, 觀察高產(chǎn)學(xué)者的影響力排名與發(fā)文量關(guān)系可知, 在高產(chǎn)學(xué)者群體中, 部分發(fā)文數(shù)量較多的學(xué)者和發(fā)文量相對較少的學(xué)者相比, 其科研影響力和社會影響力卻并不如后者。以3 年發(fā)文量為7 篇的學(xué)者Robert Langer 和發(fā)文量為3 篇的學(xué)者MikhailKolmogorov 為例作對比, 前者的科研和社會影響力排名分別為22 名和15 名, 而后者的排名為8 名和12 名, 即發(fā)文量少的這名學(xué)者的排名都比這名發(fā)文量多的學(xué)者靠前。說明高產(chǎn)學(xué)者科研成果的“高產(chǎn)出量” 并不完全意味著“高質(zhì)量”。生物技術(shù)是促進經(jīng)濟社會可持續(xù)發(fā)展的有效途徑, 各國(地區(qū))在生物科技領(lǐng)域的競爭也日益加?。郏担玻?。領(lǐng)域內(nèi)的科研學(xué)者應(yīng)摒棄唯發(fā)文量至上的觀念, 不能單純關(guān)注科研產(chǎn)出的絕對數(shù)量, 在保證科研產(chǎn)出量的同時, 學(xué)者們還應(yīng)切實提高成果的質(zhì)量, 努力形成一支高質(zhì)量的高產(chǎn)作者隊伍, 不僅帶領(lǐng)領(lǐng)域研究攀上新的高度, 也能促進經(jīng)濟社會的可持續(xù)發(fā)展,使研究成果成功轉(zhuǎn)化為社會效益。
本文研究的不足之處在于僅選定了3 本Nature生物科技子刊的高產(chǎn)學(xué)者作為樣本進行研究, 存在一定的局限性, 對于其他領(lǐng)域是否適用還有待進一步考證; 對傳統(tǒng)指標(biāo)的選擇可能也不盡完善。未來的研究中, 會進一步擴大數(shù)據(jù)源, 增加樣本的多樣性, 同時選擇更多具有代表性的傳統(tǒng)指標(biāo), 使研究結(jié)果更具說服力, 以期對不同領(lǐng)域高產(chǎn)學(xué)者的影響力進行更加深入的評價研究。