劉克佳
(中國(guó)科學(xué)技術(shù)部,北京 100862)
對(duì)科研成果和科研人員進(jìn)行客觀公正的評(píng)價(jià)一直是學(xué)術(shù)界的熱點(diǎn)議題。學(xué)術(shù)著作、項(xiàng)目產(chǎn)出及其經(jīng)濟(jì)影響、研究生培養(yǎng)、獎(jiǎng)勵(lì)、頭銜、學(xué)術(shù)活動(dòng)等各項(xiàng)評(píng)價(jià)指標(biāo)都是體現(xiàn)研究人員和科研機(jī)構(gòu)實(shí)力的重要內(nèi)容。隨著學(xué)術(shù)界對(duì)客觀、公正、透明的要求日益強(qiáng)烈,可量化的論文相關(guān)指標(biāo),如論文數(shù)量、被引次數(shù)、期刊影響因子等成為學(xué)術(shù)界關(guān)注的核心評(píng)價(jià)指標(biāo),發(fā)揮著無(wú)可替代的重要作用。
按照評(píng)價(jià)對(duì)象的不同,如國(guó)家科技發(fā)展總體水平、政府科技計(jì)劃的績(jī)效、特定研究機(jī)構(gòu)或研究人員等,所采用的評(píng)價(jià)方法、指標(biāo)設(shè)置以及各指標(biāo)的權(quán)重都有很大差別。
美國(guó)是最早進(jìn)行科研績(jī)效評(píng)價(jià)的國(guó)家之一。20世紀(jì)初,美國(guó)國(guó)會(huì)成立了咨詢服務(wù)部,對(duì)科技進(jìn)行研究、分析和評(píng)價(jià),成為科技評(píng)價(jià)的雛形。二戰(zhàn)后,隨著政府不斷加大科研投入,為了加強(qiáng)科研質(zhì)量和效率管理,政府對(duì)科研投入、研究過程與結(jié)果等進(jìn)行績(jī)效評(píng)價(jià)的規(guī)定也愈發(fā)完善。美國(guó)國(guó)會(huì)1993年通過了《政府績(jī)效與結(jié)果法案》,作為開展政府部門科研績(jī)效評(píng)價(jià)的法律依據(jù),并制定了績(jī)效評(píng)價(jià)程序。
1.1.1 開展科技評(píng)價(jià)工作的機(jī)構(gòu)
一是國(guó)會(huì)、聯(lián)邦政府的科技評(píng)價(jià)機(jī)構(gòu)。美國(guó)政府中沒有負(fù)責(zé)全面管理科技評(píng)價(jià)的獨(dú)立部門,但國(guó)會(huì)預(yù)算辦公室、國(guó)會(huì)研究服務(wù)部、審計(jì)署等機(jī)構(gòu)具有科技評(píng)價(jià)的職能,主要為國(guó)會(huì)和政府機(jī)構(gòu)提供服務(wù)。此外,國(guó)家航空航天局、國(guó)立衛(wèi)生院、國(guó)家科學(xué)基金會(huì)、國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院等聯(lián)邦科研資助機(jī)構(gòu)都有自己的評(píng)估體系。
二是開展科技評(píng)價(jià)的社會(huì)機(jī)構(gòu)。世界技術(shù)評(píng)估中心(World Technology Evaluation Center)是一家有代表性的非營(yíng)利評(píng)估組織,發(fā)布了數(shù)十份宏觀科研評(píng)價(jià)報(bào)告,涵蓋信息、電子、生物、制藥、核能、深海等領(lǐng)域。
三是學(xué)術(shù)機(jī)構(gòu)。各類學(xué)術(shù)團(tuán)體通常具有完善的組織網(wǎng)絡(luò)、雄厚的研究資源、成熟的運(yùn)作機(jī)制和顯著的社會(huì)影響力。美國(guó)科學(xué)、工程和醫(yī)學(xué)院是典型代表,一般只接受國(guó)會(huì)或聯(lián)邦政府的任務(wù)委托,對(duì)重大研究項(xiàng)目進(jìn)行評(píng)價(jià)。此外,美國(guó)知名智庫(kù),如戰(zhàn)略與國(guó)際問題研究中心、布魯金斯學(xué)會(huì)、信息技術(shù)與創(chuàng)新基金會(huì)、蘭德公司等也會(huì)設(shè)計(jì)各種指標(biāo)體系,從各種角度對(duì)不同國(guó)家、不同領(lǐng)域的科技創(chuàng)新進(jìn)行評(píng)價(jià)。
1.1.2 常見評(píng)價(jià)方法
美國(guó)科學(xué)院在1999年發(fā)布的《評(píng)價(jià)聯(lián)邦研究計(jì)劃:科學(xué)研究與政府績(jī)效和結(jié)果法案》報(bào)告對(duì)最常用的科技評(píng)價(jià)方法進(jìn)行了總結(jié),主要有以下幾種[1]。
文獻(xiàn)計(jì)量分析:包括對(duì)出版物、論文引用情況及專利等的計(jì)數(shù)分析。該方法的前提是認(rèn)同文獻(xiàn)發(fā)表和引用的價(jià)值,最大優(yōu)勢(shì)是其定量的特性。一項(xiàng)研究表明文獻(xiàn)計(jì)量分析與同行評(píng)議結(jié)果的吻合度大概在60%左右,說明文獻(xiàn)計(jì)量分析具有較高的準(zhǔn)確性。但其最大的問題是無(wú)法準(zhǔn)確區(qū)分不同文章和引用的重要程度,例如谷歌創(chuàng)始人拉里·佩奇關(guān)于搜索引擎算法的論文發(fā)表在影響因子只有1.2的《計(jì)算機(jī)網(wǎng)絡(luò)》期刊上,與論文的實(shí)際影響力顯著不對(duì)稱。
經(jīng)濟(jì)回報(bào)率分析:從經(jīng)濟(jì)學(xué)角度出發(fā),通過多種手段建模,對(duì)科學(xué)研究的經(jīng)濟(jì)回報(bào)進(jìn)行分析。優(yōu)勢(shì)是可以量化科技成果的價(jià)值,便于計(jì)算與比較,但缺陷在于只適用于某些目標(biāo)比較明確的項(xiàng)目,而對(duì)基礎(chǔ)科學(xué)以及需要很長(zhǎng)時(shí)間才可能表現(xiàn)出社會(huì)、經(jīng)濟(jì)和科學(xué)影響的研究,很難進(jìn)行準(zhǔn)確評(píng)價(jià)。
同行評(píng)議:同行評(píng)議是科學(xué)界進(jìn)行自我評(píng)價(jià)的一種方法,是很多聯(lián)邦機(jī)構(gòu)對(duì)科學(xué)研究進(jìn)行事前、事中和事后評(píng)價(jià)的主要方法,缺點(diǎn)在于會(huì)受到人的主觀判斷影響。如果進(jìn)行嚴(yán)格的專家選擇與科學(xué)的流程設(shè)計(jì),再輔以文獻(xiàn)計(jì)量等定量指標(biāo),可能使主觀影響降到最小。但同行評(píng)議往往難以使某些高風(fēng)險(xiǎn)、突破性創(chuàng)新脫穎而出,且只適合某一較窄領(lǐng)域,不適用于宏觀整體評(píng)價(jià)。
案例分析:對(duì)重大科學(xué)事件和科學(xué)成果產(chǎn)生過程進(jìn)行回顧式分析,優(yōu)點(diǎn)是能發(fā)現(xiàn)某些潛在的、具有啟示性的一般規(guī)律,幫助確定某些重要的非知識(shí)性產(chǎn)出,如機(jī)構(gòu)或人員間的合作關(guān)系等。缺點(diǎn)是成本較高,難以大量統(tǒng)計(jì),且容易受到分析者主觀因素和分析能力影響。
定量指標(biāo)分析:針對(duì)某一特定的評(píng)價(jià)目的,設(shè)計(jì)某些定量指標(biāo),通過統(tǒng)計(jì)學(xué)方法進(jìn)行采樣分析。其可靠性取決于指標(biāo)反映評(píng)價(jià)目的的相關(guān)程度,以及可獲取的采樣數(shù)據(jù)質(zhì)量。
1.1.3 典型案例
國(guó)家科學(xué)基金會(huì)下設(shè)的國(guó)家科學(xué)與工程統(tǒng)計(jì)中心(NCSES)是美國(guó)政府中唯一法定的科技創(chuàng)新相關(guān)指標(biāo)統(tǒng)計(jì)機(jī)構(gòu),其兩年發(fā)布一次的《科學(xué)和工程指標(biāo)》涵蓋了美國(guó)在科學(xué)、技術(shù)、工程、教育及創(chuàng)新等相關(guān)領(lǐng)域的權(quán)威統(tǒng)計(jì)數(shù)據(jù),并對(duì)各領(lǐng)域發(fā)展態(tài)勢(shì)進(jìn)行總結(jié)。該報(bào)告由國(guó)家科學(xué)與工程統(tǒng)計(jì)中心在眾多統(tǒng)計(jì)調(diào)查的基礎(chǔ)上通過定量分析得出,只提供客觀的基礎(chǔ)數(shù)據(jù),不強(qiáng)調(diào)數(shù)據(jù)所代表的意義,也不提供相關(guān)政策建議,為各類科技評(píng)價(jià)提供了堅(jiān)實(shí)的基礎(chǔ)。2020年度報(bào)告主要包括中小學(xué)科學(xué)教育、科學(xué)和工程高等教育、科學(xué)和工程勞動(dòng)力、論文與專利、研發(fā)經(jīng)費(fèi)、成果轉(zhuǎn)化、高技術(shù)產(chǎn)業(yè)產(chǎn)出與貿(mào)易、公眾對(duì)科學(xué)的態(tài)度等內(nèi)容,采用指標(biāo)涵蓋了在校生數(shù)量、科學(xué)和工程勞動(dòng)力總量與薪酬水平、論文數(shù)量、經(jīng)費(fèi)投入、貿(mào)易量等,其中論文相關(guān)指標(biāo)僅作為衡量科學(xué)產(chǎn)出的眾多指標(biāo)之一。
美國(guó)科技類智庫(kù)信息技術(shù)與創(chuàng)新基金會(huì)從2009年起對(duì)世界主要經(jīng)濟(jì)體的創(chuàng)新競(jìng)爭(zhēng)力進(jìn)行評(píng)價(jià)和比較研究,主要采用人力資本、創(chuàng)新能力、創(chuàng)業(yè)、信息技術(shù)基礎(chǔ)設(shè)施、經(jīng)濟(jì)政策、經(jīng)濟(jì)績(jī)效6個(gè)一級(jí)指標(biāo),畢業(yè)率、單位就業(yè)人口的科研人員數(shù)量、企業(yè)研發(fā)投入、政府研發(fā)投入、出版物的數(shù)量和質(zhì)量、風(fēng)險(xiǎn)資本、新企業(yè)數(shù)量等16個(gè)二級(jí)指標(biāo)。
1.2.1 論文在科技評(píng)價(jià)中的重要作用
自18世紀(jì)末研究型大學(xué)誕生以來(lái),通過出版物獲得聲譽(yù)和認(rèn)可一直是學(xué)術(shù)界職業(yè)發(fā)展的重要途徑。發(fā)表研究成果的能力也有助于在大學(xué)或研究機(jī)構(gòu)獲得終身職位。除論文外,獲得項(xiàng)目資助、研究生培養(yǎng)、受邀的學(xué)術(shù)會(huì)議演講和訪問、獎(jiǎng)勵(lì)和頭銜、成為國(guó)際期刊編輯委員會(huì)成員、以推薦信和評(píng)語(yǔ)為代表的同行評(píng)價(jià)等也可以體現(xiàn)研究能力,但這些指標(biāo)具有較大的主觀性。
根據(jù)Schimanski等[2]針對(duì)美國(guó)高校研究人員晉升和評(píng)價(jià)過程的研究,多數(shù)美國(guó)高校的指導(dǎo)方針和政策中通常沒有明確規(guī)定各類指標(biāo)的權(quán)重,但大多數(shù)高校研究人員都認(rèn)為一個(gè)優(yōu)秀的研究和論文發(fā)表記錄是必要的,而且近幾十年其重要性愈發(fā)突出:20世紀(jì)80年代,大多數(shù)高校希望員工在研究、教學(xué)或?qū)W校服務(wù)三者之一中取得優(yōu)異成績(jī);90年代開始出現(xiàn)轉(zhuǎn)變,卓越的教學(xué)和學(xué)校服務(wù)不再足以獲得終身教職,到21世紀(jì)初,研究和論文發(fā)表已明確成為最重要的標(biāo)準(zhǔn)。
在各類學(xué)術(shù)出版物中,經(jīng)過評(píng)審的期刊論文是證明研究質(zhì)量的關(guān)鍵,權(quán)重明顯高于書籍、報(bào)告等[3]。根據(jù)Foos等[4]的研究,美國(guó)高校的地球科學(xué)系在開展科技評(píng)價(jià)時(shí)一般會(huì)依據(jù)影響力和重要性將各類學(xué)術(shù)出版物進(jìn)行打分,1分為“非常重要”,5分為“不考慮”。國(guó)際和國(guó)家級(jí)期刊論文為1.22分,書籍章節(jié)和地區(qū)性期刊為2分,會(huì)議論文為2.3分,政府出版物、教科書、實(shí)驗(yàn)室手冊(cè)、實(shí)地指南和技術(shù)報(bào)告等為2.5~5分。
1.2.2 論文相關(guān)指標(biāo)的應(yīng)用實(shí)踐
隨著學(xué)術(shù)界對(duì)客觀、公正、透明的要求日益強(qiáng)烈,一系列論文相關(guān)指標(biāo),如論文數(shù)量、被引次數(shù)、期刊影響因子、作者順序、H指數(shù)等,得以產(chǎn)生和發(fā)展。論文指標(biāo)涵蓋了基于研究和學(xué)術(shù)活動(dòng)的廣泛內(nèi)容,其中一些數(shù)據(jù)可以展示學(xué)術(shù)能力和論文影響力,成為評(píng)估個(gè)人或機(jī)構(gòu)科學(xué)能力的關(guān)鍵工具之一[5]。但是沒有一個(gè)單一的指標(biāo)能夠衡量作者的業(yè)績(jī)、質(zhì)量或影響力,也不能預(yù)測(cè)作者的研究潛力。這些指標(biāo)在實(shí)踐中通常需要綜合使用。
論文數(shù)量。由于美國(guó)高校在求職和晉升方面的要求日益嚴(yán)格,研究人員普遍感到發(fā)表特定數(shù)量論文的壓力[6],但有的高校針對(duì)論文數(shù)量要求做出正式規(guī)定,有的則是以潛規(guī)則或口頭通知的方式。例如在美國(guó)的地球科學(xué)領(lǐng)域,27%的院系制定了獲得終身教職所需論文的數(shù)量要求,范圍在1~12篇之間,平均3.7篇。在加州大學(xué)伯克利分?;瘜W(xué)工程系[7],雖沒有明文規(guī)定,但研究人員認(rèn)為一年需要3~4篇論文才能成功獲得終身教職,而晉升正教授需要在主要期刊上發(fā)表大約20篇論文,并在研究領(lǐng)域獲得廣泛的國(guó)際認(rèn)可。目前,我們很難準(zhǔn)確量化不同學(xué)科對(duì)論文數(shù)量的要求,因?yàn)楦咝5闹笇?dǎo)政策并不具體,并且有一定的靈活性,比如當(dāng)研究人員擁有高質(zhì)量論文時(shí),數(shù)量要求就不再重要。
期刊影響因子。盡管影響因子一直受到爭(zhēng)論和批評(píng),尤其是不適合判斷某一具體論文或研究人員的水平,但學(xué)術(shù)界仍將其視為質(zhì)量的代表。美國(guó)大學(xué)的地球科學(xué)系在評(píng)價(jià)期刊時(shí),一般認(rèn)為國(guó)際和國(guó)家級(jí)期刊優(yōu)于地區(qū)性期刊。在美國(guó)的信息系統(tǒng)領(lǐng)域[8],研究人員預(yù)計(jì)至少在“頂尖期刊”上發(fā)表4篇論文才能獲得終身職位。美國(guó)大學(xué)高度重視優(yōu)質(zhì)論文的發(fā)表,但大多沒有給出關(guān)于影響因子的明確規(guī)定,而是強(qiáng)調(diào)論文應(yīng)是“開創(chuàng)性的”“可持續(xù)學(xué)術(shù)的象征”和“受到廣泛稱贊”。
各指標(biāo)所占權(quán)重在規(guī)則層面的模糊性。美國(guó)研究機(jī)構(gòu)通常不會(huì)規(guī)定出明確的權(quán)重來(lái)說明科技評(píng)價(jià)中哪一個(gè)指標(biāo)是最重要的,政策的措辭往往非常寬泛。有研究發(fā)現(xiàn)[9],美國(guó)研究型大學(xué)在教師的任期和晉升決策方面具有相當(dāng)?shù)撵`活性,評(píng)價(jià)人員多使用自己的加權(quán)判斷做出決定,或通過查看所有的申請(qǐng)材料來(lái)預(yù)測(cè)申請(qǐng)人是否具備持續(xù)和優(yōu)秀的學(xué)術(shù)潛質(zhì)。一般而言,研究成果質(zhì)量是最重要的,可以推翻關(guān)于論文數(shù)量或被引次數(shù)的規(guī)定。這一規(guī)則的模糊也導(dǎo)致不同機(jī)構(gòu)之間,甚至機(jī)構(gòu)內(nèi)各部門之間的差異。相比頂尖院校,二線院校對(duì)出版的要求不那么嚴(yán)格,可接受的期刊更多,所需論文數(shù)量較少,而且更加重視教學(xué)。此外,在不同的職業(yè)生涯階段,晉升和評(píng)價(jià)的標(biāo)準(zhǔn)也有變化,申請(qǐng)終身教職的助理教授壓力更大,傾向于在影響力大的期刊發(fā)表文章,而已獲得終身教職的副教授可選擇的期刊范圍更廣。
2010年,Nature雜志對(duì)150名研究人員和近30家研究機(jī)構(gòu)的教務(wù)長(zhǎng)、部門負(fù)責(zé)人和其他管理人員做了一項(xiàng)調(diào)查[10],了解他們?nèi)绾慰创褪褂酶黝惗恐笜?biāo)。結(jié)果表明,研究人員和管理者對(duì)指標(biāo)價(jià)值的看法存在脫節(jié)。研究人員表示,在錄用、晉升、評(píng)估中,機(jī)構(gòu)最重視項(xiàng)目撥款、論文數(shù)量、高影響因子論文以及被引次數(shù),而同行評(píng)價(jià)在所有34項(xiàng)指標(biāo)中僅排在中間位置,有20%~30%的受訪者表示機(jī)構(gòu)根本不重視同行評(píng)價(jià)。然而,大多數(shù)管理者堅(jiān)持認(rèn)為,定量指標(biāo)確實(shí)會(huì)產(chǎn)生影響,但對(duì)錄用、晉升、評(píng)估的影響并不像研究人員認(rèn)為的那么重要。一些管理者甚至表示在決策時(shí)完全忽略論文相關(guān)指標(biāo),而主要依賴同行評(píng)價(jià)。但來(lái)自不同機(jī)構(gòu)的管理者也顯示出了相當(dāng)大的差異。例如,亞利桑那州立大學(xué)等許多機(jī)構(gòu)密切關(guān)注候選人爭(zhēng)取項(xiàng)目資助的能力,而麻省理工學(xué)院則表示,對(duì)研究人員的晉升幾乎從來(lái)沒有考慮過項(xiàng)目資助,同時(shí)很少關(guān)注論文數(shù)量和被引次數(shù)。調(diào)查還發(fā)現(xiàn),盡管63%的受訪者對(duì)定量指標(biāo)的使用方式表示不滿,但他們?nèi)匀恍蕾p定量指標(biāo)的透明度和客觀性。量化指標(biāo)可以讓年輕研究人員確信,學(xué)術(shù)網(wǎng)絡(luò)中實(shí)際成就比個(gè)人關(guān)系更重要。所以管理者面臨的挑戰(zhàn)不是減少對(duì)指標(biāo)的依賴,而是更清晰、一致和透明地應(yīng)用這些指標(biāo)。
1.2.3 新興指標(biāo)的出現(xiàn)
傳統(tǒng)的基于計(jì)數(shù)的方法已無(wú)法展示更有意義和透明的成果,一種超越簡(jiǎn)單計(jì)數(shù)的指標(biāo)變得越來(lái)越重要。H指數(shù)和文件級(jí)分析(Document-level Unit of Analysis)是近年新興的兩個(gè)指標(biāo)。
2005年,加州大學(xué)圣地亞哥分校物理學(xué)家喬治·赫希(Jorge Hirsch)提出H指數(shù),學(xué)術(shù)界越來(lái)越多地將其作為衡量研究人員、學(xué)術(shù)機(jī)構(gòu)甚至資助機(jī)構(gòu)業(yè)績(jī)的基準(zhǔn)。H指數(shù)擺脫了傳統(tǒng)上對(duì)期刊進(jìn)行評(píng)價(jià)的思路,而是更為關(guān)注研究人員本身。H指數(shù)借助一個(gè)公式,通過論文和引用情況估算出某一研究人員長(zhǎng)期累積的研究成果的重要性和影響力。目前,包括Google Scholar在內(nèi)的許多數(shù)據(jù)庫(kù)已提供研究人員的H指數(shù)。
隨著出版平臺(tái)和社交媒體的發(fā)展,文件級(jí)分析作為新的衡量標(biāo)準(zhǔn),已經(jīng)允許社會(huì)公眾參與衡量出版物的使用情況。文件級(jí)分析的衡量依據(jù)包括:在線下載次數(shù)、在線瀏覽次數(shù)、在線閱讀書簽標(biāo)記次數(shù)、在Twitter或Facebook等社交網(wǎng)站上提及次數(shù)、博客或大眾媒體中的討論、分享平臺(tái)如Slideshare、Figshare或YouTube中的收藏或推薦、在線評(píng)論平臺(tái)如PubMed Commons中的評(píng)論或注釋等。公共科學(xué)圖書館(PLoS)于2009年首次提供文件級(jí)分析數(shù)據(jù),是目前最成熟的發(fā)布平臺(tái)。其他發(fā)布者還有ScienceDirect、PubMed Central、BioMed Central等。然而,這些基于社會(huì)關(guān)注度或公眾參與度的指標(biāo)也可能代表了強(qiáng)烈分歧、研究錯(cuò)誤或科研不當(dāng)[11]。
1.2.4 典型案例
美國(guó)弗吉尼亞理工大學(xué)規(guī)定,終身教職候選人的評(píng)估主要根據(jù)三部分內(nèi)容:教學(xué)、研究和推廣,應(yīng)基于某一領(lǐng)域的杰出成就和對(duì)個(gè)人職業(yè)生涯中未來(lái)成就的預(yù)測(cè)[12]。被提升為終身副教授的個(gè)人,必須在教學(xué)、創(chuàng)造性學(xué)術(shù)以及學(xué)校服務(wù)方面明確表現(xiàn)出突出的專業(yè)成就。評(píng)估過程所需的材料包括:學(xué)院院長(zhǎng)、系主任等對(duì)候選人專業(yè)能力的評(píng)估,至少4封同行機(jī)構(gòu)外部評(píng)審員對(duì)候選人學(xué)術(shù)能力的評(píng)審函,個(gè)人介紹性陳述,教授的課程和研究生指導(dǎo)工作,大學(xué)服務(wù),國(guó)際活動(dòng)等。
弗吉尼亞理工大學(xué)強(qiáng)調(diào),在考察候選人研究成績(jī)的質(zhì)量和數(shù)量時(shí),應(yīng)首先考慮質(zhì)量。質(zhì)量主要是指對(duì)一個(gè)學(xué)科的推動(dòng)、學(xué)科間關(guān)系的建立、思想和方法的創(chuàng)造性。相比候選人對(duì)熟悉的課題進(jìn)行細(xì)微變化或重復(fù)的工作,在概念框架、結(jié)論和方法上的原始創(chuàng)新應(yīng)更受重視。質(zhì)量是評(píng)價(jià)候選人成績(jī)的首要標(biāo)準(zhǔn),盡管不是唯一的標(biāo)準(zhǔn)。此外,經(jīng)同行評(píng)審的論文、會(huì)議論文和主題演講、同行評(píng)價(jià)、擔(dān)任期刊編輯、知識(shí)產(chǎn)權(quán)、獲得項(xiàng)目資助情況、獎(jiǎng)勵(lì)和表彰等也可以展示候選人的專業(yè)素質(zhì)。
隨著論文相關(guān)指標(biāo)與個(gè)人求職、晉升、獲得資助和榮譽(yù)等掛鉤,論文發(fā)表已成為一種壓力,在美國(guó)學(xué)術(shù)界引發(fā)了諸多問題,主要表現(xiàn)為對(duì)論文相關(guān)指標(biāo)的過分強(qiáng)調(diào)、論文欺詐、期刊行業(yè)畸形繁榮,以及形成“不發(fā)表就毀滅”(Publish or Perish)的學(xué)術(shù)文化等。美國(guó)學(xué)術(shù)界目前已有一些反思的聲音,提出一些倡議,但尚未見到明顯效果。
(1)衡量標(biāo)準(zhǔn)模糊。
使用文獻(xiàn)計(jì)量工具來(lái)評(píng)估實(shí)驗(yàn)室、研究項(xiàng)目或個(gè)人一直存在爭(zhēng)議。雖然一個(gè)科學(xué)組織的科學(xué)生產(chǎn)力可以被看成投資的產(chǎn)物,但是在行政、經(jīng)濟(jì)或文獻(xiàn)計(jì)量方面,沒有一個(gè)線性模型能夠比較組織架構(gòu)、行政和財(cái)務(wù)狀況非常不同的機(jī)構(gòu)[13]。對(duì)于研究人員的工作表現(xiàn),目前也沒有一種算法或衡量科學(xué)生產(chǎn)力的基準(zhǔn)可以用在評(píng)估中,這就造成不同機(jī)構(gòu)采取的標(biāo)準(zhǔn)千差萬(wàn)別,無(wú)法形成統(tǒng)一明確的規(guī)則。
(2)對(duì)于數(shù)字的片面強(qiáng)調(diào)導(dǎo)致數(shù)字本身成為目的。
隨著科學(xué)界對(duì)自身和組織的理解發(fā)生了深刻變化,招聘、項(xiàng)目評(píng)價(jià)和機(jī)構(gòu)評(píng)估等逐漸從對(duì)同行評(píng)審的依賴轉(zhuǎn)為對(duì)指標(biāo)的依賴。這種對(duì)科學(xué)活動(dòng)量化的強(qiáng)調(diào)提供了對(duì)復(fù)雜現(xiàn)實(shí)進(jìn)行簡(jiǎn)化和客觀化的方法,但數(shù)字本身變成了目的,喪失了對(duì)科學(xué)政策和資源分配的有效指導(dǎo)。此外,對(duì)數(shù)字的過分強(qiáng)調(diào)導(dǎo)致了一些扭曲結(jié)果,包括頻繁的抄襲、自我引用、多余的論文、不當(dāng)?shù)淖髡邭w屬和搭便車的研究人員??茖W(xué)評(píng)價(jià)不能淪為對(duì)論文的分析,一篇文章的有用性不能局限于它在科學(xué)界的可見度,科學(xué)成果的卓越性也不能降低到國(guó)際上的相似性[14]。
(3)指標(biāo)設(shè)置和使用上的問題。
將期刊影響因子等同于某一具體文章的影響力是指標(biāo)誤用的常見表現(xiàn)之一。期刊上發(fā)表的論文中10%~20%的論文對(duì)期刊影響因子的80%~90%負(fù)責(zé)[15]。有研究顯示4 500種頂級(jí)科學(xué)期刊發(fā)表的文章中,只有45%在發(fā)表后的5年內(nèi)被引用[16]。期刊影響因子能否衡量論文優(yōu)劣是應(yīng)當(dāng)存疑的。目前,學(xué)術(shù)界采用更精確的文檔級(jí)指標(biāo)以取代粗放的期刊級(jí)指標(biāo)的工作進(jìn)展緩慢。此外,論文影響力和質(zhì)量的其他體現(xiàn)方法,因?yàn)闆]有數(shù)字化的處理和表現(xiàn)形式,也被忽略了。
(4)學(xué)術(shù)界自我拯救的努力。
學(xué)術(shù)界的反思和自我拯救的努力,除了上文提及的建立新的績(jī)效衡量指標(biāo)外,還以研究人員、機(jī)構(gòu)和協(xié)會(huì)提出倡議的形式出現(xiàn)。然而,這些倡議對(duì)改變當(dāng)前實(shí)踐的全球影響仍然未知。
2012年12月在美國(guó)細(xì)胞生物學(xué)學(xué)會(huì)年會(huì)上起草的《舊金山研究評(píng)估宣言》(San Francisco Declaration on Research Assessment)對(duì)期刊影響因子和研究人員績(jī)效等指標(biāo)之間的相關(guān)性提出了質(zhì)疑[17]。截至2020年9月,已有2 033個(gè)組織和近16 400名個(gè)人簽署了該宣言?!缎浴诽岢鋈?xiàng)基本原則,并分別針對(duì)資助機(jī)構(gòu)、科研機(jī)構(gòu)、出版機(jī)構(gòu)、計(jì)量指標(biāo)提供方和研究人員提出具體建議。三項(xiàng)基本原則包括:一是在資助、聘用和晉升科研人員時(shí),需要擯棄基于期刊的計(jì)量指標(biāo),例如期刊影響因子;二是需要評(píng)價(jià)研究工作本身的價(jià)值,而非出版物所在期刊的價(jià)值;三是要充分利用在線出版的機(jī)會(huì),例如放寬對(duì)于論文字?jǐn)?shù)、數(shù)據(jù)和參考文獻(xiàn)的不必要限制,并探索評(píng)價(jià)重要性與影響力的新指標(biāo)。
2015年,Hicks等[18]在Nature雜志上發(fā)表《萊頓宣言》(Leiden Manifesto),提出了適用于研究評(píng)估的十項(xiàng)新原則,凝練了基于指標(biāo)的科研評(píng)估的規(guī)范?!度R頓宣言》提出定量和定性的證據(jù)不可或缺,并且這二者都是客觀的。十大原則包括:量化評(píng)估應(yīng)當(dāng)支持定性的專家評(píng)審;根據(jù)機(jī)構(gòu)、團(tuán)隊(duì)或研究人員的研究任務(wù)衡量績(jī)效;保護(hù)當(dāng)?shù)叵嚓P(guān)研究的優(yōu)秀成果;數(shù)據(jù)采集和分析過程應(yīng)公開、透明、簡(jiǎn)單;允許被評(píng)估者檢驗(yàn)相關(guān)數(shù)據(jù)和分析;在發(fā)表和引用中考慮到學(xué)科差異;對(duì)于學(xué)者個(gè)人的評(píng)估應(yīng)基于對(duì)其全部研究成果的定性評(píng)判;避免不當(dāng)?shù)木唧w性和虛假的精確性;認(rèn)識(shí)到科技評(píng)估和指標(biāo)的系統(tǒng)性影響;定期審查指標(biāo)并更新。
隨著學(xué)術(shù)界對(duì)客觀、公正、透明的要求日益強(qiáng)烈,科技評(píng)價(jià)經(jīng)歷了從定性評(píng)價(jià)到定量評(píng)價(jià)的演變。論文相關(guān)指標(biāo)作為重要的學(xué)術(shù)能力標(biāo)志,在美國(guó)科技評(píng)價(jià)體系中發(fā)揮著無(wú)可替代的作用,但同時(shí)也引發(fā)了諸如過于看重?cái)?shù)據(jù)指標(biāo)、學(xué)術(shù)風(fēng)氣不良等問題。美國(guó)學(xué)術(shù)界對(duì)此進(jìn)行了深刻反思和努力矯正,雖然目前仍沒有根本解決這一問題,但其提出的倡議激勵(lì)著后來(lái)的研究人員繼續(xù)不斷地探索和前行?!?/p>