許恩平 賈娜 李敏 余以勝
摘要:針對目前h指數(shù)存在的不足,學(xué)界尚缺乏一種綜合有效的評價指標(biāo),為此,筆者期待介紹一種論文評價的ammaa算法,并提出一種融入時間維度的優(yōu)化算法,即t_ammaa算法,通過對論文影響力的評價來反映學(xué)者個人的影響力評價。研究過程中,以Web of Science作為數(shù)據(jù)源,聚焦國內(nèi)圖情領(lǐng)域作者發(fā)文,計算論文ammaa值及t_ammaa值,進而得出學(xué)者的ammaa值及t_ammaa值,并將兩種算法結(jié)果排名與學(xué)者H值排名通過歸一化處理,進行實證對比分析。結(jié)果表明:t_ammaa算法綜合考慮發(fā)文被引次數(shù)、被引次數(shù)的闕值限制、合著者人數(shù)及論文被引時間的異質(zhì)性,既可以對獨著和合著論文影響力進行綜合性評價,也可以消除時間因素帶來的影響,是一種更為合理的學(xué)者和論文影響力評價計量方法。
關(guān)鍵詞:ammaa算法;時間異質(zhì)性;多作者論文影響力;作者影響力;評價指標(biāo);破“五唯”
中圖分類號:G350;G6444 文獻標(biāo)志碼:A 文章編號:1008-5831(2021)06-0111-14
眾所周知,學(xué)者所進行的科學(xué)研究及成果傳播在科學(xué)進步及社會發(fā)展中發(fā)揮著重要作用[1],其成果形式多以學(xué)術(shù)論文、著作和專利為主。事實上,高校和科研單位的
人才引進、職稱評定也愈加倚重學(xué)術(shù)論文在個人學(xué)術(shù)影響力評價中的作用。2018年教育部聯(lián)合多個部門,開展清理“唯論文、唯帽子、唯職稱、唯學(xué)歷、唯獎項”(以下簡稱“五唯”)專項行動。需要注意的是,在破“五唯”過程中,尤其是破“唯論文”現(xiàn)象時,尚應(yīng)充分考慮我國科研發(fā)展的不同階段及其具體情況,“一步到位”既不現(xiàn)實也無必要,筆者以為應(yīng)著力于扭轉(zhuǎn)不科學(xué)的教育評價導(dǎo)向,進而對學(xué)者進行合理的學(xué)術(shù)影響力評價。
目前,國際上廣泛應(yīng)用的學(xué)術(shù)影響力評價指標(biāo),如被引次數(shù)、h指數(shù)、g指數(shù)等均是用于評估單作者影響力的方法。但隨著信息技術(shù)的發(fā)展,科學(xué)合作與知識交流普遍常態(tài)化,多著者合作的形式可以顯著提高學(xué)術(shù)研究水平[2],科學(xué)研究的進步需要多領(lǐng)域研究人員之間的合作[3]。在理工科領(lǐng)域,物理學(xué)論文的合作者可達上百人,目前共同作者數(shù)量有增加的趨勢,文章由不止一位作者撰寫成為越來越正常的現(xiàn)象[4]。但近年來,客座作者[5]、禮物作者[6]、非學(xué)術(shù)合作者[7]等署名資格問題[8]已經(jīng)成為影響科研誠信的重要議題。相關(guān)研究也發(fā)現(xiàn),合著者人數(shù)的增多,卻未必能提高研究成果的影響力,如被引頻次、下載量等[9]。因此,學(xué)術(shù)期刊大多要求每位合著者都要作出相應(yīng)的努力和貢獻[10-12],基于此,D.Gnana Bharathi提出了一種多作者聚合分析算法指標(biāo),即aggregating metrics for multiple authors’ analysis,簡稱ammaa算法[13]。
一、相關(guān)研究文獻分析
2005年,Hirsch[14]提出綜合考慮學(xué)者發(fā)文數(shù)量和發(fā)文質(zhì)量的h指數(shù)影響力評價指標(biāo),并得到學(xué)術(shù)界的認可和推廣應(yīng)用。同年,即被Nature文章[15]評論道,h指數(shù)的魅力在于它能凸顯那些有持久重大貢獻卻未得到與其聲望相稱榮譽的研究者。自h指數(shù)提出以來,國內(nèi)外學(xué)者對其做了很多研究。隨著研究的不斷深入,h指數(shù)的固有缺點也不斷暴露,如:(1)虛假合作,不能區(qū)分作者貢獻[16];(2)對論文數(shù)量不敏感,只考慮h核內(nèi)的論文數(shù)量和被引頻次,忽略h核以外的論文;(3)無法跨領(lǐng)域評價作者影響力[17];(4)無法對學(xué)者近期影響力進行評價[18]等。至今,對h指數(shù)的修正研究擴展指數(shù)已不下30余種[19]。2006年,L.Egghhe從論文被引頻次的累計貢獻角度,提出g指數(shù)[14],同樣側(cè)重論文被引頻次角度的還有R指數(shù)及Hr指數(shù)[20]。2010年,Prathap G.提出p指數(shù),優(yōu)化了h指數(shù)的靈敏度和區(qū)分度[21]。從作者合作角度進行修正的改進則包括均等共享和差異分享論文影響力兩種。差異分享論文影響力研究包括考慮主要貢獻作者和計算合作者權(quán)重。其中,考慮主要貢獻作者是在計算h指數(shù)時,只納入該作者作為主要貢獻作者的論文,如hmaj指數(shù)[22];計算合作者權(quán)重則基于作者排序和合著者數(shù)量的榮譽分配法[23]。均等共享論文影響力研究包括直接對h指數(shù)進行平均和對論文數(shù)或被引次數(shù)進行平均,前者如hI指數(shù)[24],后者如hm指數(shù)[25]、pf指數(shù)[22]等。2016年,學(xué)者Shaon Sahoo針對合著論文個人貢獻率問題提出I指數(shù),使得各合著者隨著論文作者數(shù)量的增加而減小,在一定程度上降低了沒有實質(zhì)貢獻的“論文掛名”的影響[26]。2019年,學(xué)者D.Gnana Bharathi提出多作者聚合分析算法指標(biāo),即ammaa算法[13],該算法實現(xiàn)了通過對論文影響力的評價進而對學(xué)者影響力進行評價的目的。
綜合以上研究,雖然都在一定程度上對h指數(shù)的缺點有所彌補或改進,但依然沒有一種綜合有效的方法應(yīng)用于學(xué)者影響力評價中。為此,筆者期待在D.Gnana Bharathi提出的ammaa算法基礎(chǔ)上考慮到時間異質(zhì)性,提出一種融入時間因素的改進算法,即t_ammaa算法,并嘗試通過數(shù)據(jù)實證,與h指數(shù)進行對比和相關(guān)性分析,證明t_ammaa算法對學(xué)者影響力評價結(jié)果更全面、公平和精細。
二、ammaa算法介紹
(一)ammaa算法原理
ammaa算法引入一種閾值變量T,也就是合著者數(shù)量的乘數(shù)。對任一論文而言,從以下公式(1)(2)(3)不難看出,若論文為單作者獨著成果,則該文ammaa值就是其被引頻次;當(dāng)作者人數(shù)大于1時,其ammaa值是總引文量的平方除以閾值T和作者數(shù)量,再加上按著者數(shù)平分總引文量的值,使得每篇論文的影響力都隨著引文數(shù)的增加而增加,直至該值達到由合著者數(shù)量和閾值設(shè)定的引文限制(即aT-T),其ammaa值才等于文章的總引文量,如以下公式(2)所示,這時,每個著者才可以算是獲得了該文章所有的引文影響力。這種所有作者平均共享被引次數(shù),每增加1次引用,其影響力的值就會同等份額逐漸增加的度量方法,原理類似于為工人生產(chǎn)率的每一次增長都提供同等的績效激勵,直至達到目標(biāo)要求,團隊的所有成員都可以得到全額獎勵。這樣既不會由所有作者平分引文總數(shù)那樣弱化實際作者貢獻值,降低合著者的積極性,也不會夸大沒有實際貢獻合著者的影響力。
一篇論文的ammaa值計算公式如下:
對于單作者的文章,ammaa值等于總被引次數(shù),即:
當(dāng)a=1時,AMMAA=c(1)
對于其他任何形式多作者合著文章,即:
當(dāng)a>1,且c<aT-T時,AMMAA=(c+c2/T)/a(2)
當(dāng)a>1,且c≥aT-T時,AMMAA=c(3)
式中,c為被引次數(shù),a為作者人數(shù),T為閾值變量。
在衡量同一學(xué)科的多作者論文影響力時,T值是相同的,所有合著者都享有的全部引文量閾值(aT-T)就會隨著合著者人數(shù)的增多而變大,如圖1所示。在達到閾值前,引文量相同的情況下,ammaa值會隨著合著者人數(shù)a的增多而變小,如圖2所示。由此,ammaa算法同時考慮了作者人數(shù)及論文被引頻次兩個因素,實現(xiàn)了既可以對單作者論文評價,也可以對多作者論文進行評價的創(chuàng)新融合。
T的賦值可通過普遍共識或由特定國家、團體或組織來確定。傳統(tǒng)上被引用次數(shù)較少的學(xué)科,如地質(zhì)學(xué)、數(shù)學(xué),其T值較低。被引用次數(shù)較多的學(xué)科,如生物醫(yī)學(xué)、生物化學(xué),其T值較高。T的其他任何值也可以在科學(xué)合理的基礎(chǔ)上設(shè)置,通用情況下,作者建議將T值暫設(shè)為100,一旦設(shè)置了T,就可以為每篇合著文章計算其ammaa值,也就是衡量每篇論文為合著者中的每位學(xué)者帶來的影響力。T值的設(shè)定是根據(jù)學(xué)科性質(zhì)確定的,所以,當(dāng)出現(xiàn)普遍低被引學(xué)科的作者與普遍高被引學(xué)科的作者跨學(xué)科合作時,T值的設(shè)定還可以平衡由學(xué)科差異帶來的影響。
(二)ammaa算法的不足
在論文影響力評價過程中,統(tǒng)計評價指標(biāo)時常常忽略時間軸不統(tǒng)一的問題[27],從而降低評價的有效性。ammaa算法綜合考慮了論文被引次數(shù)、作者人數(shù)兩方面因素,卻忽視了時間因素對評價效果的影響。論文被引時間的異質(zhì)性體現(xiàn)論文成果傳播的時間差異性,被引時刻才是知識傳播和交流、發(fā)揮效用的時間,發(fā)文與被引的時間差反映了論文的知識流動性和影響力的大小[28]。兩篇不同論文的發(fā)表時間不同,總被引頻次相同時,發(fā)表時間更短的論文有更大的影響力;發(fā)表時間相同,總被引頻次相同,引文量逐年上升和引文量逐年下降的論文學(xué)術(shù)價值也是不同的[29]。因此,筆者在分析ammaa算法忽略時間維度的情況下,力求基于發(fā)文時間和被引時間的異質(zhì)性對ammaa算法進行優(yōu)化。
三、t_ammaa算法的提出
加權(quán)是為平衡某一要素在整個要素體系中,因重要程度不同而分別賦予該要素不同權(quán)值的過程[30]。本優(yōu)化方法對論文發(fā)表后每年的ammaa值賦予不同的權(quán)重,計算論文的加權(quán)ammaa。這樣,一篇論文的t_ammaa值就是對它每年的ammaa值賦予不同權(quán)重后之和,作者的t_ammaa值就等于其所有論文t_ammaa值之和。
對于每篇論文而言:
t_ammaa=(1*ammaa1+2*ammaa2+3*ammaa3……+n*ammaan)/n(4)
式中,n=(數(shù)據(jù)采集時間-論文發(fā)表時間)/年;ammaa1、ammaa2……ammaan表示論文發(fā)表后第一年、第二年……第n年的ammaa值,每年的ammaa值利用作者所發(fā)文章在這一年的被引頻次c計算。
對于每個作者而言:
t_ammaa=t_ammaa1+t_ammaa2+t_ammaa3……+t_ammaan(5)
式中n為某作者的第n篇論文;t_ammaa1、t_ammaa2、t_ammaa3……t_ammaan為該作者的第一篇、第二篇……第n篇論文的t_ammaa值。
四、t_ammaa算法實證研究
(一)數(shù)據(jù)來源及處理
本文以國內(nèi)圖情領(lǐng)域?qū)W者為研究對象,選取Web of Science核心合集(以下簡稱為WOS)作為實驗數(shù)據(jù)來源,檢索策略為:SU=(Information science and library science);檢索時間跨度為2010年至2019年,限定語言類型為英文;精煉限定:國家/地區(qū)為(“PEOPLES R China”) OR (“China”),文獻類型為ARTICLE,結(jié)果顯示共有21 279條文獻記錄。
為保證所得數(shù)據(jù)的可靠性,剔除標(biāo)注為“被撤回的出版物”以及無作者記錄12條,考慮數(shù)據(jù)的可操作性,刪除年均被引頻次小于1的論文記錄6 528條,剩余14 739條可用記錄。通過Python程序分詞統(tǒng)計得到60 342位作者,及每位作者的全部發(fā)文和被引詳情。并采取前文所述中的作者建議,暫把T值設(shè)為100。根據(jù)公式(1)(2)(3)和公式(4)(5),分別計算每位作者的ammaa值和t_ammaa值,并排序。
(二)實驗過程
本文嘗試從兩個角度進行數(shù)據(jù)梳理,然后再綜合進行分析討論。
第一個角度,從發(fā)文量和引用量出發(fā),比較分析ammaa算法及t_ammaa算法和h指數(shù)的區(qū)別和相關(guān)性。為保證實驗可操作性,設(shè)定(1)年均被引頻次40次以上,在2010—2019年所發(fā)論文總被引頻次不少于400次,和(2)在(1)的基礎(chǔ)上,年均發(fā)文3篇以上,在2010—2019年期間總發(fā)文量不少于30篇的作者兩個篩選條件,最終篩選出52位符合以上條件的作者,并對52名作者進行核查,排除同名同姓的情況。因篇幅有限,摘錄發(fā)文總數(shù)前25位作者發(fā)文及引用情況記錄(表1)。
h指數(shù)為現(xiàn)行國際上使用的評價指標(biāo),故本文先通過ammaa算法與作者h值排名比較(即排名1-排名2),證明ammaa算法的調(diào)節(jié)力和區(qū)分度,再通過作者ammaa值排名減去t_ammaa值排名比較(即排名2-排名3),對比分析ammaa算法和t_ammaa算法。各位學(xué)者的h值是在WOS核心庫中通過設(shè)定與數(shù)據(jù)源同一限定條件加上作者姓名檢索獲得。兩排名比較中均采用正數(shù)表示作者排名上升,負數(shù)相反,數(shù)值絕對值表示作者排名變化量。因篇幅有限,現(xiàn)摘錄部分學(xué)者結(jié)果,如表2所示。
第二個角度,從ammaa值出發(fā),分析討論ammaa值排名靠前的學(xué)者發(fā)文及被引頻次情況。參考前文數(shù)據(jù),故保留前52位作者并進行核查,排除同名同姓情況?,F(xiàn)摘錄部分數(shù)據(jù)如表3所示。
(三)結(jié)果與分析
綜合全部導(dǎo)出數(shù)據(jù)及表1可見,被調(diào)查的14 739篇論文中獨著論文157篇,僅占1.07%。其中,發(fā)文數(shù)大于30篇,總被引頻次大于400次的52位學(xué)者中,僅有7位學(xué)者在2010—2019年各發(fā)表了1篇獨著論文,表明論文合著的形式已被
普遍接受,并可通過科學(xué)合作以提高科研成果影響力[2]。該結(jié)果與國家科學(xué)技術(shù)評估中心-科睿唯安分析結(jié)果及國內(nèi)外學(xué)者的研究結(jié)論吻合[31-33]。
如表3所示,經(jīng)計算ammaa值排名前52的學(xué)者中,發(fā)文數(shù)小于10篇的有21位,發(fā)文數(shù)介于10到30篇之間的學(xué)者有26位,占比50%,大于30篇的有5位,占比不到10%。學(xué)者Law Rob獨著數(shù)1篇,學(xué)者Zhou Tao獨著數(shù)10篇。其中,發(fā)文數(shù)與總被引頻次均相同的學(xué)者有三組,分別為Csordas Attila和Ternent Tobias;del-Toro Noemi和Dianes Jose A;Tang Zefang和Li Chenwei。經(jīng)調(diào)查詳細數(shù)據(jù)發(fā)現(xiàn),Csordas Attila和Ternent Tobias、del-Toro Noemi和Dianes Jose A參與合著1篇論文被引頻次高達2 023次,Tang Zefang和Li Chenwei參與合著1篇論文被引頻次為1 720次,且三組學(xué)者第一組僅有2篇論文發(fā)表,后兩組僅有1篇。假若綜合考慮發(fā)文數(shù),排除發(fā)文數(shù)少于10篇的學(xué)者記錄,且以年均發(fā)文至少1篇為限制條件,則ammaa算法既可以突出發(fā)文能力較強如獨著較多的學(xué)者,也能篩選出文章質(zhì)量較高的學(xué)者。
本研究中,我們保留ammaa值排名前52且發(fā)文至少10篇的學(xué)者各指標(biāo)值,用與前文相同的條件查詢各位學(xué)者的H值并排名(表4),綜合第一角度一并做以下分析與討論。
1.ammaa算法與t_ammaa算法調(diào)節(jié)能力結(jié)果與討論
由表2和表4可知,兩種算法的計算結(jié)果中,均未出現(xiàn)ammaa值、t_ammaa值相同的情況,而表2中H值查詢結(jié)果中相同的學(xué)者有Law,Rob 等12組,共48位學(xué)者,占比92.3%;表4中H值相同的有Zhang,Lei等6組,共19位學(xué)者,占比86.4%。分別對H值、ammaa值和t_ammaa值三者排名進行歸一化處理,并按照H值排序,如圖3、圖4所示,ammaa算法和t_ammaa算法排名較H指數(shù)排名總體趨勢一致,二者均圍繞H值排名上下浮動,且幅度較大;加入時間權(quán)重因素后,與ammaa值相比,表2中52位作者有40位學(xué)者的t_ammaa值名次發(fā)生變化,名次變化學(xué)者
占比76.9%,表4中22位學(xué)者有21位學(xué)者名次發(fā)生變化,名次變化學(xué)者
占比95.5%。說明ammaa算法和t_ammaa算法識別效果都較H指數(shù)好,且t_ammaa算法較ammaa對學(xué)者影響力評價更敏感,調(diào)節(jié)作用更明顯。
需要說明的是,圖3、圖4、圖5、圖6因版面所限,圖面文字不夠清晰,有興趣者可與筆者線上交流。
首先分析比較ammaa算法與h指數(shù)。在表2中,兩種評價方法下除Wang Yi和Zhang Jie兩位學(xué)者名次未發(fā)生變化外,其余學(xué)者排名均產(chǎn)生變動,變化最多的是學(xué)者Wang Yu和Zhao Jing,變化值均為38。表4中,除學(xué)者Wang Rui名次未發(fā)生變化外,其余21位學(xué)者名次均發(fā)生變化,其中變化最大的是學(xué)者Liu Yang,變化值為16。
下面就表2中名次變化最大的學(xué)者Wang Yu分析原因,除各位學(xué)者原本h值排名并列的情況外,結(jié)合每位作者的所有發(fā)文和被引頻次及合著者人數(shù),對比分析下降名次最多的Wang Yu和與其h值相同排名卻未發(fā)生變化的Zhang Lin,及排名上升最多的Zhang Lei(上升8個名次)三位作者,均取其被引頻次大于10的論文,發(fā)現(xiàn)學(xué)者Wang Yu平均每篇論文的合著者人數(shù)為8.62,最高被引頻次為41次,且該篇合著者人數(shù)為9人。而學(xué)者Zhang Lei和Zhang Lin,平均每篇論文的合著者人數(shù)分別為6.39和6.04,單篇最高被引頻次分別為1 219次和389次,且兩位學(xué)者該篇合著者人數(shù)均為3人,故學(xué)者Wang Yu的ammaa值排名明顯下降。以上對比分析說明,考慮合著者人數(shù)的ammaa算法對合著論文的評價調(diào)節(jié)作用明顯,且對高被引頻次文章具有敏感的識別力。
2.t_ammaa算法與ammaa比較
觀察表2的計算結(jié)果,有三組作者的ammaa值幾乎相同,分別是Li Xia(588.96)和Zhang Jie(588.94),Liu Xin(212.77)和Lin Hongfei(212.28),Wang Jing(179.90)和Zhang Jian(179.38),進一步觀察三組作者的t_ammaa值分別為236.17 和190.16,64.73 和91.01 ,78.38 和71.02 ,其差值分別為46.01,26.28和7.36。觀察表4的計算結(jié)果,Tao Dacheng 和Xu Wei、Ge Shuzhi和Huang Lei兩組學(xué)者的ammaa值分別為2 223.68和2 222.12、1 303.80和1 307.4,差值分別為1.56和3.6,進一步觀察兩組作者的t_ammaa值分別為641.44和1 313.58、424.68 和530.79,差值分別為672.13和106.11??梢姡啾萢mmaa算法,t_ammaa算法的區(qū)分效果更加顯著。
由表2和圖5可知,加入時間權(quán)重后,t_ammaa值名次下降最多的是作者Liu Xin,下降11個名次,居第43位;而總被引頻次和ammaa值都比其小的學(xué)者Lin Hongfei卻沒有變化,仍居第33位。觀察表4和圖6可知,考慮時間因素后,t_ammaa值名次下降最多的是學(xué)者Tao Dacheng,下降5個名次,上升最多的是學(xué)者Zhang Lei和Sun Jian,均上升4個名次。這是在作者數(shù)量較少的情況下,如果作者數(shù)量較多,排名變化可能更大。
下面就學(xué)者Liu Xin和Lin Hongfei名次變化分析其原因。由表1及兩位學(xué)者發(fā)文、每年被引次數(shù)可知:(1)在2010—2019年,兩位學(xué)者均發(fā)文30篇,總被引次數(shù)分別為829和722次。(2)學(xué)者Liu Xin年被引頻次在2015年較前一年下降,其余年份均較前一年有所增加,而學(xué)者Lin Hongfei年被引頻次均保持逐年增加狀態(tài)(圖7)。(3)兩位學(xué)者的ammaa值總體呈上升狀態(tài),學(xué)者Liu Xin僅在2013和2016年ammaa值略高于Lin Hongfei,其余年份與后者持平或遠低于后者。以2015年為界,學(xué)者Liu Xin的ammaa值從2015年的8上升至2019年的22,而Lin Hongfei則從12上升到42,后者增幅較大(圖8)。說明學(xué)者Lin Hongfei影響力在2015—2019年間已逐漸超過學(xué)者Liu Xin。故引入時間權(quán)值,越靠近統(tǒng)計時間的因素占比越重,學(xué)者Liu Xin的t_ammaa值排名較Lin Hongfei下降越明顯。
另外,結(jié)合表2和圖5可以看出,分別由ammaa算法和t_ammaa算法得出的排名中,前三名均是Tao Dacheng、Law Rob和Zhang Lei三位學(xué)者,后三名均是Li Li、Wang Yu和Wang Tao三位學(xué)者。結(jié)合表4和圖6可以看出,ammaa算法和t_ammaa算法前三名均是Xu Xin 、Thong J和Venkatesh Viswanath,說明兩種算法在描述作者學(xué)術(shù)影響力上的趨勢是同步的,均能較準(zhǔn)確識別高影響力學(xué)者。
3.各指標(biāo)相關(guān)性分析
如果
某一算法改進后與原算法的計算結(jié)果相差太大,則認為對原算法的改進是不合理的[34]。引入時間因素的t_ammaa算法對學(xué)者影響力有一定的調(diào)節(jié)作用,但這種調(diào)節(jié)作用對ammaa算法的改善并不是顛覆性的。由此,我們將表2中52位作者的t_ammaa值、ammaa值、h值、總被引次數(shù)和年均被引次數(shù),進行斯皮爾曼相關(guān)性分析,證明t_ammaa算法更具合理性(表5)。由分析數(shù)據(jù)可見,作者的t_ammaa值與其他指標(biāo)均呈極顯著相關(guān)關(guān)系,其中與ammaa值、h值、總被引次數(shù)和年均被引次數(shù)的相關(guān)系數(shù)分別為0.956、0.552、0.907及0.762。h值、總被引次數(shù)和年均被引頻次均可用于對作者影響力進行評價[14,35-36],說明與h指數(shù)呈極顯著正相關(guān)的ammaa算法和t_ammaa算法也適用于對作者影響力進行評價,且后者對前者的優(yōu)化是合理的。
五、結(jié)論和建議
相對于h指數(shù),筆者在ammaa算法的基礎(chǔ)上,提出一種基于時間維度的ammaa優(yōu)化方法——t_ammaa算法,通過對國內(nèi)圖情領(lǐng)域?qū)W者在WOS核心數(shù)據(jù)庫中發(fā)文情況分析發(fā)現(xiàn):(1)針對h指數(shù)無法識別高影響力論文,對合著論文評價不靈敏,以及無法涉及作者全部論文的缺陷,ammaa算法和t_ammaa算法對h值排名相同的情況有明顯調(diào)節(jié)作用,通過設(shè)置閾值變量T和被引次數(shù)的平均共享,使合著論文的所有作者均等增加影響力的激勵方法,不僅能更好地挖掘出高影響力和引用價值的科研文獻,還能有效避免客座作者[5]、禮物作者[6]、非學(xué)術(shù)合作者[7]較多出現(xiàn)在論文署名中,從而影響評價結(jié)果的公平性,使得作者影響力評價方法更為合理和客觀。(2)與ammaa算法相比,t_ammaa算法考慮時間因素,能有效識別領(lǐng)域內(nèi)長時間保持高活躍度,影響力持續(xù)發(fā)揮或不斷上升的學(xué)者。由此,t_ammaa算法綜合考慮了作者發(fā)文數(shù)量、作者人數(shù)、被引頻次、被引頻次的闕值限制及被引時間異質(zhì)性,解決了作者影響力評價方法中多作者署名問題,無法識別高影響力論文,被引次數(shù)受論文發(fā)表時間長短影響,以及跨領(lǐng)域合作學(xué)者影響力評價等需要解決的問題。(3)在圖情人文社會科學(xué)領(lǐng)域中,合著已成為普遍現(xiàn)象,獨著論文占比極少,且存在學(xué)者一篇論文被引頻次極高、總發(fā)文數(shù)極少,但ammaa值和t_ammaa值排名居前的現(xiàn)象。建議在人文社科類評價過程中,可考慮設(shè)置學(xué)者必須在近些年,比如近3年或5年內(nèi)必須有若干論文或獨著成果產(chǎn)出,以削弱虛假合作者在評價中的影響力。
由以上研究結(jié)論可以看出,通過論文影響力來間接揭示作者學(xué)術(shù)影響力,并非簡單通過影響因子來評價,論文引用數(shù)據(jù)等僅可作為評價參考,尤其在2021年人社部、教育部印發(fā)《關(guān)于深化高等學(xué)校教師職稱制度改革的指導(dǎo)意見》中特別強調(diào),不得以SCI或SSCI等論文相關(guān)指標(biāo)作為前置條件和判斷的直接依據(jù),必須考慮學(xué)術(shù)論文的實際內(nèi)容,特別是真正具有高影響力和引用價值的代表性論文,本研究通過時間要素的引入,可以有效解決僅憑論文“數(shù)量”和引用次數(shù)評價的局限,在對有持續(xù)學(xué)術(shù)貢獻力學(xué)者的甄別中,可以設(shè)置近1年或3年內(nèi)發(fā)表論文的數(shù)量作為學(xué)者持續(xù)影響力的重要評價手段,解決了部分學(xué)者突擊或集中于某個階段發(fā)文,或在獲得一定職稱或榮譽后長期處于“學(xué)術(shù)休眠”狀態(tài)的問題;最后,對于多作者的署名問題,本文提出的被引次數(shù)平均共享和T值,可以有效解決掛名作者、客座作者或通訊作者等問題,通過優(yōu)化算法,使得真正有持續(xù)貢獻力的學(xué)者可以被有效識別出來,提高論文或?qū)W者貢獻度評價的客觀性。
本研究也存在一些不足之處,一方面,本文僅選擇圖書情報領(lǐng)域?qū)W者在WOS中的發(fā)文數(shù)據(jù)對t_ammaa算法進行實證分析,樣本涉及領(lǐng)域單一;另一方面,本文閾值T的設(shè)置采取原作者對通用領(lǐng)域的取值建議,今后可進一步研究科學(xué)設(shè)置
T值的學(xué)科和條件。
參考文獻:
[1]馬瑞敏,張慧.加權(quán)引用視角下的作者學(xué)術(shù)影響評價研究[J].情報學(xué)報,2017(8):790-797.
[2]POLYAKOV M,POLYAKOV S,IFTEKHAR M S.Does academic collaboration equally benefit impact of research across topics? The case of agricultural, resource, environmental and ecological economics[J].Scientometrics,2017,113(3):1385-1405.
[3]GAZNI A, SUGIMOTO C R,DIDEGAH F.Mapping world scientific collaboration: Authors, institutions, and countries[J]. Journal of the American Society for Information Science and Technology,2012,63(2):323-335.
[4]SHABAN S.Multiple authorship trends in prestigious journals from 1950 to 2005[J].Saudi Medical Journal,2007,28(6):927-932.
[5]WAGER E,SINGHVI S, KLEINERT S.Too much of a good thing? An observational study of prolific authors[J].PeerJ,2015(3):e1154.doi.org/10.7717/peerj.1154.
[6]JACK G.Is mass authorship destroying the credibility of papers[ED/OL].[2020-11-09]. https://www.timeshighereducation.com/news/mass-authorship-destroying-credibilitypapers#node-comments.
[7]SARNA-WOJCICKI D,PERRET M,EITZEL M V,et al.Where are the missing coauthors? Authorship practices in participatory research[J].Rural Sociology, 2017,82(4):713-746.
[8]高曉培,潘云濤,馬崢.科技期刊論文署名規(guī)范化探討與實踐研究[J].編輯學(xué)報,2012(1):30-33.
[9]IRIBARREN-MAESTRO I,LASCURAIN-SNCHEZ M L,SANZ-CASADO E.Are multi-authorship and visibility related? Study of ten research areas at Carlos III University of Madrid[J].Scientometrics,2009,79(1):191-200.
[10]TARNOW E.Coauthorship in physics[J].Science and Engineering Ethics,2002,8(1):175-190.
[11]ILAKOVAC V,F(xiàn)ISTER K,MARUSIC M,et al.Reliability of disclosure forms of authors’ contributions[J].CMAJ,2007,176(1):41-46.
[12]YAGER K.Each co-author should sign to reduce risk of fraud[J].Nature,2007,450(7170): 610.
[13]BHARATHI D G.Measuring the impact of an author of multi-authored articles—Aggregating metrics for multiple authors’ analysis[J].ISSI,2019,2(5):448-458.
[14]HIRSCH J E.An index to quantify an individual’s scientific research output[J].Proceedings of the National Academy of Sciences of the United States of America,2005,102(46): 16569-16572.
[15]BALL P.Index aims for fair ranking of scientists[J].Nature,2005,436(7053):900.
[16]周春雷.h指數(shù)合作式注水缺陷與對策[J].圖書情報知識,2009(3):109-112.
[17]BORNMANN L,DANIEL H D.Does the h-index for ranking of scientists really work?[J].Scientometrics, 2005,65(3):391-392.
[18]COSTAS R,BORDONS M.The h-index:Advantages,limitations and its relation with other bibliometric indicators at the micro level[J].Journal of Informetrics,2007,1(3):193-203.
[19]WILDGAARD L,SCHNEIDER J W,LARSEN B.A review of the characteristics of 108 author-level bibliometric indicators[J].Scientometrics,2014,101(1):125-158.
[20]金碧輝,Rousseau Ronald.R指數(shù)、AR指數(shù): h指數(shù)功能擴展的補充指標(biāo)[J].科學(xué)觀察,2007(3): 1-8.
[21]PRATHAP G.The 100 most prolific economists using the p-index[J].Scientometrics, 2010,84(1):167-172.
[22]HU X J,ROUSSEAU R,CHEN J.In those fields where multiple authorship is the rule, the h-index should be supplemented by role-based h-indices[J].Journal of Information Science,2010,36(1):73-85.
[23]SHEN H W,BARABASI A L.Collective credit allocation in science[J].PNAS,2014,111(34):12325-12330.
[24]BATISTA P D,CAMPITELI M G,KINOUCHI O.Is it possible to compare researchers with different scientific interests?[J].Scientometrics,2006,68(1):179-189.
[25]SCHREIBER M.To share the fame in a fair way, hm modifies h for multi-authored manuscripts[J].New Journal of Physics, 2008,10(4).
[26]SAHOO S.Analyzing research performance: Proposition of a new complementary index[J].Scientometrics, 2016,108(2):489-504.
[27]俞立平.期刊影響力指標(biāo)的時間異質(zhì)性及其重構(gòu)研究:基于多屬性評價的視角[J].圖書情報工作,2016(12):109-114.
[28]謝瑞霞.基于“時間異質(zhì)性”和“合著網(wǎng)絡(luò)”的作者影響力評價研究[D].曲阜:曲阜師范大學(xué), 2019.
[29]舒予,張黎俐.時序動態(tài)視角下的學(xué)術(shù)影響力評價方法及實證研究[J].現(xiàn)代情報,2017(11):74-80,86.
[30]科普中國.加權(quán)[EB/PL].[2020-10-09].https://baike.baidu.com/item/加權(quán)/91816?fr=Aladdin.
[31]National Center for Science and Technology Evaluation,Clarivate Analytics.China’s international scientific research collaboration—A bibliometric analysis[R].2018:1-69.
[32]張雪,張志強,陳秀娟.基于期刊論文的作者合作特征及其對科研產(chǎn)出的影響:以國際醫(yī)學(xué)信息學(xué)領(lǐng)域高產(chǎn)作者為例[J].情報學(xué)報,2019(1):29-37.
[33]THELWALL M,SUD P.National,disciplinary and temporal variations in the extent to which articles with more authors have more impact: Evidence from a geometric field normalised citation indicator[J].Journal of Informetrics, 2016,10(1): 48-61.
[34]張欣,馬瑞敏.基于改進Page Rank算法的核心專利發(fā)現(xiàn)研究[J].圖書情報工作,2018(10):106-115.
[35]方卿,王玨.開放存取期刊學(xué)術(shù)質(zhì)量評價(一):基于總被引頻次視角的分析[J].出版學(xué),2011(6):67-70.
[36]PASTERKAMP G,ROTMANS J I,KLEIJN D V P,et al.Citation frequency:A biased measure of research impact significantly influenced by the geographical origin of research articles[J]. Scientometrics, 2007,70(1):153-165.
Abstract: Aiming at the deficiency of h index and the lack of a comprehensive and effective evaluation index, this paper introduces an ammaa algorithm for paper evaluation, and proposes an optimization algorithm integrating time dimension: t-ammaa algorithm, which reflects the influence evaluation of individual scholars through the evaluation of paper influence. Using Web of Science as the data source and focusing on the papers published by domestic authors in the field of library and information science, the ammaa value and t-ammaa value of these papers are calculated, and then the ammaa value and t-ammaa value of the scholars are obtained. The result ranking of the two algorithms and the scholars’ H-value ranking are normalized for empirical comparison and analysis. The results show that t-ammaa algorithm considers the cited times, the cited threshold limit, co-author number and the temporal heterogeneity of the cited papers. It can not only comprehensively evaluate the influence of single-author and co-authored paper, but also eliminate the influence brought by time factor. It is a more reasonable measurement method for evaluating the influence of scholars and papers.
Key words:? ammaa algorithm; temporal heterogeneity; multi-author paper influence; author influence; evaluation index; break the “five-only”
(責(zé)任編輯 彭建國)
3118500589214