孫勁楠,丁佐奇,2*
(1.中國藥科大學(xué) 理學(xué)院,江蘇 南京 210009;2.中國藥科大學(xué)《中國天然藥物》編輯部,江蘇 南京 210009)
科研人員是科學(xué)研究過程中最重要的因素,對科研人員學(xué)術(shù)水平的評價不僅關(guān)系到對其研究成果的認(rèn)可程度,也關(guān)系到其自身后續(xù)的發(fā)展。一個嚴(yán)謹(jǐn)、科學(xué)的評價體系既有助于高校、科研院所建立切實(shí)可行的獎勵、晉升體系,又可以充分調(diào)動科研人員的積極性。
中共中央辦公廳和國務(wù)院辦公廳于2018年發(fā)布的《關(guān)于分類推進(jìn)人才評價機(jī)制改革的指導(dǎo)意見》中明確提出要對人才評價體系進(jìn)行改革、實(shí)施代表性成果評價等內(nèi)容。據(jù)此,代表作評價制度受到了廣泛的關(guān)注,國內(nèi)的學(xué)者也提出了很多針對性的建議[1-3],但是針對代表作制度也存在很多的質(zhì)疑。代表作制度的主要問題集中在代表作認(rèn)定、評價標(biāo)準(zhǔn)和具體實(shí)踐上[4]?,F(xiàn)今對代表作的認(rèn)定還沒有一個公認(rèn)的標(biāo)準(zhǔn)和方法,并且由于學(xué)科的特殊性使得不同學(xué)科的代表作認(rèn)定存在差異,這無疑增加了標(biāo)準(zhǔn)制定的難度。
在文獻(xiàn)計量學(xué)方面,研究人員利用引文、出版物和其他指標(biāo)評估科學(xué)家的學(xué)術(shù)表現(xiàn)與學(xué)術(shù)影響,并通過不斷改進(jìn)完善評價指標(biāo)優(yōu)化評價體系。常用的指標(biāo)包括被引量、學(xué)科規(guī)范化引文影響力(Category Normalized Citation Impact, CNCI)和期刊規(guī)范化引文影響力(Journal Normalized Citation Impact, JNCI)。但已有研究表明基于引文的指標(biāo)在衡量個別學(xué)者的整體學(xué)術(shù)影響存在某些方面的局限性:由于基于引文的指標(biāo)極易被認(rèn)為存在著操縱(自引、不正當(dāng)引用等行為)、高度依賴時間積累等問題,造成其無法可靠反映學(xué)術(shù)成果實(shí)際影響、不能作為學(xué)者科學(xué)影響力的唯一指標(biāo)[5]。而隨著互聯(lián)網(wǎng)和社交媒體的快速發(fā)展,利用各種網(wǎng)絡(luò)平臺進(jìn)行論文的獲取、分享與傳播已成為當(dāng)前學(xué)術(shù)交流的主要形式,替代計量學(xué)(Altmetrics)應(yīng)運(yùn)而生,其評價指標(biāo)主要基于用戶對文章的下載、分享、閱讀、評論等行為。而對于替代計量學(xué)能否作為評價指標(biāo)存在著一定的爭議,一些學(xué)者認(rèn)為替代計量學(xué)的指標(biāo)僅能反映的是論文的社會關(guān)注度和受歡迎程度而非對社會經(jīng)濟(jì)的影響[6],同時因替代計量學(xué)缺少成體系的理論而受到了較多的質(zhì)疑[7];另一些學(xué)者認(rèn)為,替代計量學(xué)指標(biāo)通過社交媒體網(wǎng)絡(luò)的應(yīng)用反映了研究成果的社會和經(jīng)濟(jì)影響[8],并且由于其提供了一種具有廣泛性、多樣性、高速性、開放性的新方法來參與對研究的衡量工作,可以及時跟蹤學(xué)術(shù)成果對社交網(wǎng)絡(luò)平臺的影響。無論是文獻(xiàn)計量學(xué)還是替代計量學(xué)指標(biāo)都存在著一個先天缺陷,即引文周期。兩類指標(biāo)數(shù)值的增加需要依賴時間,這就導(dǎo)致高質(zhì)量的研究成果無法立刻識別。因此,陳超美博士于2012年提出了基于參考文獻(xiàn)的結(jié)構(gòu)變異模型(Structural Variation Model, SVM),并在此基礎(chǔ)上提出了結(jié)構(gòu)變異分析(Structural Variation Analysis, SVA)[9]。該模型通過文章的參考文獻(xiàn)構(gòu)筑引文網(wǎng)絡(luò),借助引入某一文章后的引文網(wǎng)絡(luò)變化篩選出具有潛力的文章,已達(dá)到提前選取高質(zhì)量研究成果的目的。一般來說,科研人員的研究工作存在著連貫性,基于引文網(wǎng)絡(luò)結(jié)構(gòu)變化的SVA篩選出的文章能夠篩選出對連貫性“突破”最大的研究成果。因此,該方法篩選出的文章可以定性認(rèn)為是某一科研人員的所有研究成果中最具創(chuàng)新性的文章,而這一篩選代表作的思想同國家于2020年底發(fā)布的《“雙一流”建設(shè)成效評價辦法(試行)》中提到的“強(qiáng)調(diào)成果的創(chuàng)新質(zhì)量和貢獻(xiàn)”這一科研成果評價的思想不謀而合[10]。
因此,本研究提出以下問題作為研究重點(diǎn):使用SVM能否有效篩選出科研人員的創(chuàng)新性文章?不同性別的科研人員在綜合評價體系中是否存在差異?不同年齡段的科研人員在綜合評價體系中是否存在差異?基于這些問題本研究將重點(diǎn)關(guān)注C高校藥物化學(xué)領(lǐng)域教授的科研論文在經(jīng)過SVA法篩選后的文獻(xiàn)計量學(xué)指標(biāo),以分析該方法在性別及年齡層次上是否存在顯著性差異,以期為代表作選取提供建議。
由于本研究將年齡層次納入分類標(biāo)準(zhǔn),考慮到一般意義上博士研究生是每位科研人員獨(dú)立科研工作的開始并且需要一定的時間積累才能產(chǎn)出較為高水平的研究成果,因此設(shè)置了學(xué)術(shù)年齡 5~10年、11~15年、16~20年三個年齡層次。學(xué)術(shù)年齡是指在其在C高校工作后在WoS核心合集中能夠檢索到的最早文章出版年到2021年的時間差。考慮到數(shù)據(jù)的代表性,共選取了24位教授,其中男性15位、女性9位。各年齡組情況見表1。
1.2.1 SVA法
由于CiteSpace中可以直接完成SVA法選取代表作的操作,因此,在WoS核心合集中以教授姓名和高校名稱為標(biāo)準(zhǔn)檢索其發(fā)表的所有文章,作為元數(shù)據(jù)集。將各教授元數(shù)據(jù)集導(dǎo)入 CiteSpace中,選擇SVA法,時間區(qū)間為2011.1~2021.12,Node Type為Reference,以1年為跨度滑動窗(1-year span sliding windows),進(jìn)行分析。選取中心性發(fā)散(centrality divergence)值最高的兩篇文章作為其代表作。
Table 1 Study subjects and the number of people in each group表1 研究對象及各組別人數(shù)
1.2.2 描述性統(tǒng)計分析及顯著性檢驗(yàn)
研究將主要分析篩選出的代表作的所屬期刊影響因子、分區(qū)、發(fā)表年、作者人數(shù)等基本文獻(xiàn)計量學(xué)指標(biāo),研究代表作被引量、影響因子在性別和各年齡組間是否存在顯著性差異,以及文章作者人數(shù)和被引量、影響因子間是否存在相關(guān)性。因此,將提取各教授元數(shù)據(jù)中的作者人數(shù)、被引量、期刊影響因子、分區(qū)、出版年等指標(biāo)。
由于被引量、影響因子的分布不呈現(xiàn)正態(tài)分布,因此顯著性選用曼—惠特尼 U檢驗(yàn)(Mann-Whitney Test)和克魯斯卡爾—沃利斯檢驗(yàn)(Kruskal-Wallis test)作為檢驗(yàn)方法,相關(guān)性檢驗(yàn)采用皮爾遜相關(guān)性檢驗(yàn)(Person)。P值小于0.05即認(rèn)為存在顯著性。所有的檢驗(yàn)均在SPSS 19中完成。
1.2.3 數(shù)據(jù)檢索時間
為避免數(shù)據(jù)庫更新導(dǎo)致的誤差,所有的檢索工作均于2021年11月20日完成。
由于本研究僅探討SVA法用于代表作篩選的實(shí)用性,因此沒有區(qū)分是否為第一作者或通訊作者,進(jìn)而選取出的代表作可能存在重復(fù)。篩選出的48篇代表作中有2篇重復(fù),因此共計46篇文章。
從被引量看,46篇文章的被引量從0~161次不等,均值為27.30次。除1篇被引量在100以上外,32篇在10~100之間,13篇在0~9之間。從影響因子看,影響因子從1.652~15.419不等,均值為6.321。17篇文章影響因子在5以下,占比37.0%;22篇文章影響因子在5~10,占比47.8%;7篇文章影響因子在10以上,占比15.2%。從期刊分區(qū)看,29篇文章發(fā)表于Q1期刊上,16篇發(fā)表于Q2期刊上,僅有1篇發(fā)表在Q3期刊上。從JNCI看,46篇文章的JNCI從0~4.32不等,均值為1.09,其中有19篇JNCI值大于1超過全球平均水平。從CNCI看,46篇文章的CNCI從0~6.31不等,均值為1.49,其中有28篇文章CNCI值大于1,超過全球平均水平。從學(xué)科領(lǐng)域百分比看,46篇文章從0.71%到99.92%不等,均值為34.35%,其中有20篇位于該領(lǐng)域的全球前20%,8篇位于全球前10%。由于引文指標(biāo)受到引文周期的較大影響,因此發(fā)表于2021年的文章基本沒有任何指標(biāo)積累從而表現(xiàn)為0次被引、JNCI和CNCI值為0。引文指標(biāo)結(jié)果共同表明,基于創(chuàng)新性的SVA法能夠篩選出教授的高學(xué)術(shù)價值研究成果。
從發(fā)表年看,46篇文章的時間跨度為2012~2021年(見圖1)。其中發(fā)表于2018年的文章數(shù)最多,為11篇。近五年發(fā)表的文章數(shù)為23篇,占比50.0%。發(fā)表年的數(shù)據(jù)表明,SVA法能夠篩選出較新的研究成果,這也符合代表作篩選的基本原則。從作者數(shù)量上看,46篇文章的平均作者數(shù)為7.95人。由5位及以下作者完成的文章為9篇,6~10位作者完成的文章為31篇,11位及以上的作者完成的文章數(shù)為6篇。統(tǒng)計結(jié)果表明,科研人員傾向于合作完成科研工作。
為了進(jìn)一步闡明經(jīng)過SVA篩選出的代表作能夠基本反映科研人員的科研能力,進(jìn)一步分析了46篇文章的被引量、JNCI、CNCI和學(xué)科領(lǐng)域百分位與每位教授的對應(yīng)指標(biāo)中位數(shù)之間的差異(見圖2)統(tǒng)計圖表明,從各項(xiàng)指標(biāo)上看,經(jīng)過SVA法篩選出的代表性研究成果總體上優(yōu)于各教授的平均水平。46篇文章在被引量、JNCI、CNCI和學(xué)科領(lǐng)域百分位中分別有14、18、15和15篇低于對應(yīng)教授指標(biāo)中位數(shù)。進(jìn)一步具體考察各指標(biāo)中低于中位數(shù)的文章的情況,被引量小于其中位數(shù)的14篇文章中有9篇被引量和其中位數(shù)差值小于5次,最小為1次;JNCI小于其中位數(shù)的18篇文章中有11篇JNCI和其中位數(shù)差值小于0.35,最小為0.02;CNCI小于其中位數(shù)的15篇文章中有7篇CNCI和其中位數(shù)差值小于0.35,最小為0.03;學(xué)科領(lǐng)域百分位小于其中位數(shù)的15篇文章中5篇差值小于10%,最小為1.57%??紤]到46篇文章中有20篇文章發(fā)表于2018年及以后,由于引文周期的存在導(dǎo)致其被引量的積累尚不夠,JNCI、CNCI、學(xué)科領(lǐng)域百分位都是被引量的衍生指標(biāo),從而表現(xiàn)出了和被引量類似的分布情況。因此,總體上基于創(chuàng)新性的SVA法能夠篩選出科研人員的高水平研究成果。
Fig.1 Published year distribution of representative works圖1 代表作發(fā)表年分布
Fig.2 Comparison of each index value with the median (arranged according to the descending order of percentile in the subject area)圖2 各指標(biāo)值與中位數(shù)對比(依照學(xué)科領(lǐng)域百分位降序排列)
由于顯著性和相關(guān)性檢驗(yàn)是針對單篇文章的,因此在該部分研究中并未排除重復(fù)的兩篇文章。
針對性別間的差異性檢驗(yàn)表明(見表2),篩選出的代表作在被引量(P=0.953>0.05)和影響因子(P=1.000>0.05)間均不存在顯著性差異。統(tǒng)計結(jié)果表明,樣本教授的科研能力不存在性別上的顯著性差異。
針對各年齡組間的差異性檢驗(yàn)表明(見表3),篩選出的代表作在被引量(P=0.906>0.05)和影響因子(P=0.919>0.05)間均不存在顯著性差異。統(tǒng)計結(jié)果表明,樣本教授的科研能力不存在年齡上的顯著性差異。
針對作者人數(shù)和被引量與影響因子的相關(guān)性檢驗(yàn)表明(見表4),作者人數(shù)和被引量(P=0.715>0.05)、影響因子(P=0.343>0.05)間均不顯著相關(guān)。統(tǒng)計結(jié)果表明,科研合作可能并不是提高文章創(chuàng)新性的有效手段。
Table 2 Significance test between different genders表2 不同性別間的顯著性檢驗(yàn)
Table 3 Significance test between different age group表3 不同年齡組間的顯著性檢驗(yàn)
Table 4 Correlation test between number of authors and number of citations, impact factors表4 作者人數(shù)與被引量、影響因子間的相關(guān)性檢驗(yàn)
研究表明,基于創(chuàng)新性的SVA法能夠較為有效地篩選出科研人員的高質(zhì)量研究成果,并且不同性別、不同年齡組之間科研人員的研究水平不存在顯著性差異。
3.1.1 有效地提前篩選出具有潛力的文章
在本研究中篩選出的46篇文章中,有20篇發(fā)表于2018年及以后,且有一篇發(fā)表于2021年。表現(xiàn)出了SVA法篩選優(yōu)質(zhì)文獻(xiàn)的前瞻性。由于引文周期的存在,具有開創(chuàng)新的研究成果在發(fā)表初期可能不具備較高的文獻(xiàn)計量學(xué)指標(biāo),這就可能導(dǎo)致采用被引量或其他計量學(xué)指標(biāo)不能準(zhǔn)確定位到此類文章。不同于傳統(tǒng)的文獻(xiàn)計量學(xué)指標(biāo),SVA法通過構(gòu)建基于參考文獻(xiàn)的引文網(wǎng)絡(luò),從參考文獻(xiàn)的角度發(fā)掘具有高潛力的文章。其理論核心就是通過單篇文章對引文網(wǎng)絡(luò)的“變構(gòu)”程度,尋找到連接多個不同研究方向文章的“重點(diǎn)文章”。參考文獻(xiàn)作為在論文完成時就已確定的內(nèi)容,可以有效規(guī)避因?yàn)橐闹芷趲淼闹笜?biāo)差異,做到快速、有效地篩選出文章。研究發(fā)現(xiàn),篩選出的文章大多發(fā)表于Q1或Q2期刊上,并且各項(xiàng)文獻(xiàn)計量學(xué)指標(biāo)總體上優(yōu)于各教授的平均水平,部分文章甚至大幅超越平均水平,因此該方法在一定程度上達(dá)到了創(chuàng)新性和科學(xué)性的平衡。
3.1.2 無效引用造成的結(jié)果誤差
由于SVA法的核心是從引用的參考文獻(xiàn)出發(fā)篩選代表作,每一篇引用的文章都在此方法中發(fā)揮著重要的作用。但已有研究表明,科學(xué)界存在著大量的同質(zhì)化研究,從而埋沒了真正具有價值的研究成果[11]。同質(zhì)化研究導(dǎo)致單篇文章的學(xué)術(shù)價值下降、從而影響了參考文獻(xiàn)在文章中的價值。此外,由于科研論文需要回顧以往的相關(guān)研究,因此將會引用大量的科研論文,但是并不是每一篇文章都會對研究產(chǎn)生貢獻(xiàn)。同時,已有研究表明,在文章投稿時期刊編輯會建議作者引用一定數(shù)量的目標(biāo)期刊文章[12],此類文章可能和研究的相關(guān)性并不高,這同樣會導(dǎo)致引用文章的價值下降。因此,如果文章中存在著一定數(shù)量的無效引用,將有可能影響到SVA法篩選的準(zhǔn)確性。
3.1.3 數(shù)據(jù)集不足造成結(jié)果誤差
SVA法的核心是分析對引文網(wǎng)絡(luò)的“變構(gòu)”程度,這種變構(gòu)是基于引文網(wǎng)絡(luò)已經(jīng)存在一定規(guī)模的基礎(chǔ)上的。倘若已經(jīng)發(fā)表的文章的數(shù)量尚不能構(gòu)成一個較為完整的引文網(wǎng)絡(luò),那么可能通過SVA法無法有效篩選出對中心性發(fā)散情況產(chǎn)生影響的文章。這一點(diǎn)在較為年輕的科研工作者的代表作篩選中可能會存在,進(jìn)而造成無法有效篩選出其創(chuàng)造性的研究成果。
3.2.1 重視科學(xué)研究的創(chuàng)新性
什么樣的學(xué)術(shù)論文是有價值的,一直是科研評價中無法繞開的關(guān)鍵問題。由于歷史等多方面的原因,國內(nèi)形成了“唯論文、唯職稱、唯學(xué)歷、唯獎項(xiàng)”的錯誤評價導(dǎo)向。這已經(jīng)嚴(yán)重影響到了人才評價、機(jī)構(gòu)評估等科學(xué)評價活動的良性發(fā)展。因此,基于代表作的科學(xué)評價成為了主要的替代方案。以何種方式選取代表作成為科研人員需要面臨的最主要問題。代表作評價的特征在于突出質(zhì)量、貢獻(xiàn)和影響,注重“量”和“質(zhì)”的平衡等[13]。這種定性表達(dá)導(dǎo)致科研人員在選取代表作時不能準(zhǔn)確有效地選取出最能代表其科研能力的文章,往往大多選擇在影響因子高的期刊上發(fā)表的文章,或是被引量高的文章,這類文章可能有較高的文獻(xiàn)計量學(xué)指標(biāo),但也可能已經(jīng)落后于時代,已不能反映出科研工作者現(xiàn)今的科研實(shí)力,反而不能實(shí)現(xiàn)代表作評價的初衷。所以,有必要采取基于創(chuàng)新性的代表作選取和評價模式,從而反映出科研工作者的實(shí)際科研能力。
科學(xué)研究的創(chuàng)新性包含多方面的內(nèi)容,不僅在于新理論、新觀點(diǎn)、新方法、新成果,也在于對已有研究結(jié)論的完善補(bǔ)充等多方面的內(nèi)容[14]?;趧?chuàng)新性的代表作選取和評價模式將能夠引導(dǎo)科研人員在科研實(shí)踐中關(guān)注研究中的新問題、前沿領(lǐng)域、亟待突破的重點(diǎn)領(lǐng)域。這不僅有助于科研人員自身發(fā)表高質(zhì)量的研究成果,也有助于國家創(chuàng)新水平的提升,真正解決在關(guān)鍵領(lǐng)域的“卡脖子”問題,從而發(fā)揮好科研評價的“指揮棒”作用。
3.2.2 形成完善的代表作評價體系
代表作評價的兩個關(guān)鍵問題在于,如何選取代表作和如何對代表作做出客觀準(zhǔn)確的評價。兩者是遙相呼應(yīng)、相輔相成的。代表作的選取要參考評價標(biāo)準(zhǔn)、評價標(biāo)準(zhǔn)的確立要以選取代表作的指導(dǎo)思想為參照?;趧?chuàng)新性的代表作選取模式,要求對于代表作的評價需要從科研成果的創(chuàng)新性評價展開。
目前,我國采取的代表作評價方式是以定性評價為主、定量評價為輔的綜合評價模式。定性評價主要是指同行評議,定量評價則是基于多種文獻(xiàn)計量學(xué)指標(biāo)開展的。但實(shí)踐工作中面臨著諸多問題,例如有學(xué)者認(rèn)為我國目前尚未形成真正意義的學(xué)派,還不具備形成學(xué)術(shù)共同體的條件和群體意識[15],進(jìn)而導(dǎo)致同行評議制度尚不完善;隨著代表作評價工作的全面展開,必然導(dǎo)致工作量的增加,為了滿足實(shí)際工作的需要就需要增加評審專家數(shù)量,這可能會導(dǎo)致專家平均水平的下降,從而影響了同行評議的準(zhǔn)確度。而基于文獻(xiàn)計量學(xué)指標(biāo)的定量評價體系也可能存在著指標(biāo)數(shù)量選取不合理、指標(biāo)權(quán)重賦值不合理等問題,進(jìn)而導(dǎo)致基于文獻(xiàn)計量學(xué)指標(biāo)的定量評價信息缺失、客觀性下降,不能全面準(zhǔn)確地展現(xiàn)科研論文的學(xué)術(shù)價值。同時,研究發(fā)現(xiàn),篩選出的代表作發(fā)表時間可能較短,對于文獻(xiàn)計量學(xué)指標(biāo)的積累必然落后于其他文章,但其學(xué)術(shù)價值可能反而較高。如果一味采用以往的指標(biāo)體系,將不能有效展現(xiàn)這類文章的價值。因此,有必要形成與創(chuàng)新性相匹配的代表作評價模式。
3.2.3 開展更高效的科學(xué)合作
科學(xué)評價的一項(xiàng)最為重要的目的是為了促進(jìn)科研人員的良性發(fā)展,從而達(dá)到整體國家科研實(shí)力的增強(qiáng)。因此,科研人員自身采取一定的措施進(jìn)行高質(zhì)量研究,不僅有助于科研評價工作的開展、也有助于自身科研實(shí)力的增強(qiáng)。本研究發(fā)現(xiàn)作者數(shù)量與被引量和期刊影響因子之間不存在顯著的相關(guān)性。因此,科研人員需要思考是否所有的科學(xué)合作都是有意義的,都是能夠推進(jìn)高質(zhì)量成果產(chǎn)生的。
研究表明,單純增加作者人數(shù)并不能直接帶來文章被引量和發(fā)表期刊水平的提升。但已有研究表明,科學(xué)合作能夠促成高被引研究成果的產(chǎn)生[16]。兩者看似是矛盾的,但本質(zhì)上反映的是作者數(shù)量增加與高質(zhì)量科研合作間的矛盾。在證明了科研合作可以提高被引量的研究中,相較于國內(nèi)合作或單一機(jī)構(gòu)內(nèi)部的合作,國際合作在提高被引量上發(fā)揮著更為重要的作用,但在本研究中篩選出的46篇文章中,僅有4篇是國際合作論文。并且由于本研究只選取了來自藥物化學(xué)領(lǐng)域的24位教授,他們之間存在著較為廣泛的合作關(guān)系,導(dǎo)致大量的文章出現(xiàn)了在本校課題組間的合作現(xiàn)象。而這種合作關(guān)系是否真正在科學(xué)研究中發(fā)揮了助推作用,仍有待商榷。
隨著科研的不斷進(jìn)步,科研合作在科學(xué)研究中發(fā)揮著不可替代的作用,特別是在自然科學(xué)領(lǐng)域,突破性的研究成果往往需要多方的合作完成。因此,科研人員在科研工作中不可避免地需要與同行進(jìn)行合作。因此,建議科研人員,特別是在同一科研機(jī)構(gòu)內(nèi)工作的科研人員積極開展與機(jī)構(gòu)間的合作,盡可能與領(lǐng)域內(nèi)有一定影響力的課題組合作,而不是局限于機(jī)構(gòu)內(nèi)合作。當(dāng)然,這也不是意味著必須與其他機(jī)構(gòu)間合作。合作意味著科研分工,不同課題組間需要發(fā)揮自身優(yōu)勢,高效率完成科研工作。因此,尋求科研合作的對象應(yīng)該是能夠合作完成高水平研究的課題組,在科研合作中避免“人情合作”“無效合作”等等。
3.2.4 避免性別和資歷的評價導(dǎo)向
科研評價的本質(zhì)應(yīng)當(dāng)是對科研成果的評價,從而反映出以科研人員的科研實(shí)力,而不是通過科研人員的科研實(shí)力反映科研成果的價值。以往的“唯資歷”“唯職稱”等正是由于顛倒了兩者之間的關(guān)系,從而導(dǎo)致了錯誤的評價模式。本研究表明,基于創(chuàng)新性的代表作的被引量和影響因子在各年齡組間不存在顯著性差異。這不僅表明了SVA法能夠有效篩選出所有年齡組科研人員的高質(zhì)量研究成果,也避免了“唯資歷”“唯職稱”等不良評價模式的錯誤。
目前,國際上對于性別在科研工作中的研究日益增多。部分研究表明,女性科學(xué)家在發(fā)文量和被引量上和男性存在顯著性差異[17]。大量的研究最終得出,女性在科研活動存在著普遍的被歧視現(xiàn)象。在科研活動中對于女性的普遍性性別歧視在中國似乎尚未形成,但應(yīng)該避免。正如前文所述,科研評價應(yīng)當(dāng)針對的是成果本身,而不應(yīng)該受到任何其他無關(guān)因素的干擾,如果本末倒置就會對科研評價結(jié)果的正確性產(chǎn)生干擾。正是因?yàn)樾枰_對待性別問題,使得科研人員在日常科研工作中拒絕對于性別的刻板印象,國家于2021年發(fā)布了《關(guān)于支持女性科技人才在科技創(chuàng)新中發(fā)揮更大作用的若干措施》的通知,通過設(shè)立專項(xiàng)資助基金以及一些政策優(yōu)惠,進(jìn)一步激發(fā)女性科研人員的創(chuàng)新活力[18]。在制度層面上為消除可能產(chǎn)生的性別偏見提供了制度保證。
差異性檢驗(yàn)表明,篩選出的代表作在不同性別間、不同年齡組間不存在顯著性差異,這就表明性別和資歷不應(yīng)當(dāng)成為評價科研人員的影響因素??蒲性u價應(yīng)當(dāng)重新回到評價成果上,在由此產(chǎn)生的資金項(xiàng)目資助評定、職稱評定等一系列人才評定工作中,真正做到從科研成果出發(fā),客觀準(zhǔn)確地對科研能力做出評定。
代表作評價是現(xiàn)今難以解決的問題,至今仍沒有一種公認(rèn)的完美的方法達(dá)到學(xué)術(shù)評價和代表作選取的完全客觀、公正?;趧?chuàng)新性的SVA法,有利于推動科研人員潛心科學(xué)研究、致力于“從0到1”的原始創(chuàng)新、從而發(fā)表高水平的原創(chuàng)性論文,最終提升中國整體的科研實(shí)力。