宋旭紅,高 源
(1.濟南大學(xué)高等教育研究院,山東濟南250022;2.南京師范大學(xué)教育科學(xué)學(xué)院,江蘇南京210046;3.山東交通學(xué)院威海校區(qū)基礎(chǔ)教學(xué)部,山東威海,264200)
傳統(tǒng)意義上的代表作是指具有時代意義或最能體現(xiàn)作者水平、風(fēng)格的著作或藝術(shù)作品。大學(xué)教師評價中的代表作最初是作為教師研究能力的一種體現(xiàn),主要是指最能體現(xiàn)其學(xué)術(shù)成就、研究價值或?qū)W術(shù)潛力的著作和論文。本研究將代表性成果評價限定為代表性科研成果評價。
我國大學(xué)較早采用的教師代表作評價,更多地指向了人文社會科學(xué)(文科)的教師評價。例如:2003年南開大學(xué)在教師學(xué)術(shù)成果評定和職務(wù)晉升評審中試行代表作制度;2004年清華大學(xué)在人文與社會科學(xué)院系實行代表性學(xué)術(shù)成果評價;2005年北京大學(xué)中文系等系在教師崗位考核中試點論文代表作制度;2009年中國人民大學(xué)在全校范圍推行論文代表作制;2010年復(fù)旦大學(xué)在部分人文社會學(xué)科試行代表作學(xué)術(shù)評價制度并在2011年推廣至所有人文社會學(xué)科。
人文社會學(xué)科的性質(zhì)和特征決定了對人文社會科學(xué)很難做到純量化、純當下和純客觀的評價,與自然科學(xué)評價存在明顯的差異性。首先,自然科學(xué)具有研究對象客觀性、研究價值和評價標準統(tǒng)一性、研究程序可重復(fù)性、研究成果直觀可測量等特征;而人文社會科學(xué)由于其理論學(xué)說和思想體系的創(chuàng)新性需要在歷史和現(xiàn)實的兩個時空中做出價值和意義判斷,需要經(jīng)長期實踐檢驗,所以其成果評價具有滯后性、多樣性和復(fù)雜性的特點。其次,自然科學(xué)研究成果更容易被引用,其影響力更多遵循指數(shù)衰減曲線規(guī)律;而人文社會科學(xué)成果獨立研究作者多,合作作者論文相對少,文獻引用的半衰期較長,引用的時間窗口被拉長,引用著作比引用期刊論文多[1]13-25。再次,在某些人文社會學(xué)科領(lǐng)域具有重要社會意義的本土研究對象具有文獻引用本土化特征,難顯國際化特征,難獲更多引用。文獻計量評價對某些人文社會科學(xué)成果評價會產(chǎn)生功能性障礙,存在更大難度和更多不可控因素,其跨學(xué)科比較具有不公平性[2]。人文學(xué)科需要相當廣泛的質(zhì)量指標,這些指標必須符合該領(lǐng)域中成果、目標人群和出版文化的多樣性[3]。代表作評價始于人文社會科學(xué),正是基于此。
與“代表作”相聯(lián)系的另一個概念是“代表性成果”?!按硇猿晒备拍畹淖畛跆岢隹梢宰匪莸?004年發(fā)表的兩篇論文,作者認為,代表性學(xué)術(shù)成果就是能夠反映該學(xué)科領(lǐng)域的學(xué)術(shù)水平和學(xué)術(shù)地位的成果,可分解為代表性學(xué)術(shù)著作和代表性學(xué)術(shù)論文兩項具體的指標[4-5]。以此可認為,至2004年,代表性成果概念的內(nèi)涵和外延可以等同于代表作,兩者內(nèi)涵和外延發(fā)生變化的時間,大致可以2012年為界。
一是從代表作評價到代表性成果評價,概念的內(nèi)涵和外延發(fā)生了變化。從實踐層面看,2012年復(fù)旦大學(xué)正式在全校教師高級職務(wù)聘任中實施“代表性成果”評價機制[6]。從最初部分文科院系中的代表性論著評價,擴展到全校所有學(xué)科教師的教學(xué)、科研、社會服務(wù)不同維度的評價,在政策演變路徑中體現(xiàn)出代表性成果概念的開放性和多樣性。從國家政策層面看,自2013年教育部在《關(guān)于深化高等學(xué)??萍荚u價改革的意見》中提出分類評價,“對主要從事創(chuàng)新性研究的科技活動人員實行代表性成果為重點的評價”以來,代表性成果評價機制先后在《關(guān)于深化高校教師考核評價制度改革的指導(dǎo)意見》《關(guān)于加快直屬高校高層次人才發(fā)展的指導(dǎo)意見》《關(guān)于分類推進人才評價機制改革的指導(dǎo)意見》《深化新時代教育評價改革總體方案》等國家政策文本中被強調(diào)。代表性成果評價作為大學(xué)教師評價、高等教育綜合評價中的特定概念開始出現(xiàn)在地方政府及其教育行政部門的政策文件里,并在不同類型高校中得到推廣和實施。
二是代表作內(nèi)容和形式的變化導(dǎo)致其概念的內(nèi)涵和外延發(fā)生變化。在2018年《關(guān)于深化項目評審、人才評價、機構(gòu)評估改革的意見》、2019年《關(guān)于深化自然科學(xué)研究人員職稱制度改革的指導(dǎo)意見》、2020年《關(guān)于規(guī)范高等學(xué)校SCI論文相關(guān)指標使用樹立正確評價導(dǎo)向的若干意見》中,都明確提出了代表作評價機制。前者將代表作評價應(yīng)用到不同學(xué)科門類的項目申請、人才評價和機構(gòu)評估之中,豐富了代表作形式,明確規(guī)定項目成果、研究報告、專著譯著、技術(shù)標準規(guī)范等均可作為代表作;后兩者將代表作評價應(yīng)用到自然科學(xué)領(lǐng)域,指向了自然科學(xué)的論文評價。代表作概念內(nèi)涵和外延的變化,無疑將代表作評價等同于代表性成果評價。
代表作和代表性成果概念內(nèi)涵和外延的變化,更加鮮明地體現(xiàn)了我國新時代教育評價改革在摒棄以量代質(zhì)、強化學(xué)術(shù)本體價值之路上的積極應(yīng)對和有益探索,但同時也導(dǎo)致了代表性成果評價在理想與現(xiàn)實、統(tǒng)一性與多樣性之間更加復(fù)雜的關(guān)系。當學(xué)科評價范圍從人文社會科學(xué)(文科)教師評價向自然科學(xué)(理工科)教師評價、從進行創(chuàng)新性研究的科技人員向不同類型的科技人員、從個別世界一流大學(xué)建設(shè)單位向不同層次和類型高校延伸之時,代表性成果的認定方式和評價方式就需要再審視。在“三流學(xué)校數(shù)論文篇數(shù)、二流學(xué)校數(shù)論文的影響因子、一流學(xué)校不對論文發(fā)表提要求”[7]存在現(xiàn)實客觀性和局部合理性的情況下,代表性成果評價中原創(chuàng)性和創(chuàng)新性的核心標準和評價目的就需要再審視。當學(xué)術(shù)評價內(nèi)容和形式從單純的論文、著作、作品等方面的評價向項目成果、研究報告、技術(shù)標準規(guī)范、重大成果轉(zhuǎn)化與推廣等評價方面延伸,從科研領(lǐng)域的代表性成果向教學(xué)領(lǐng)域的代表性成果擴展,代表性成果評價的程序、方法和實現(xiàn)路徑就需要再審視。
從國家政策看,代表性成果評價只是一種倡導(dǎo)和探索的評價機制,并不是強制性的硬規(guī)定。優(yōu)化和深化我國大學(xué)教師評價是一個系統(tǒng)工程,代表性成果評價只是大學(xué)教師評價的一種重要機制。它是一劑良藥,但并不能包治百病。學(xué)術(shù)晉升之路的奮力攀升是學(xué)術(shù)職業(yè)生命意義的全部呈現(xiàn),無論是否存在代表作或代表性成果評價的概念和模式,大學(xué)教師在每一次職稱晉升和評聘的關(guān)鍵點上都會把自己最好的代表性學(xué)術(shù)成果優(yōu)先呈現(xiàn)出來。無論國內(nèi)國外,只要是大學(xué)就概莫能外。
從嚴格意義上說,代表作與代表性成果是兩個有差別的概念,代表性成果的內(nèi)涵和外延比代表作寬泛。代表作只是代表性成果一個最重要的組成部分,應(yīng)保持其原始意義中的論文、著作和創(chuàng)作作品的外延不變。當代表性成果評價呈現(xiàn)出學(xué)科多樣、高校層次和類型多樣、評價內(nèi)容和形式多樣等復(fù)雜形態(tài),并且相互交織、彼此滲透,代表性成果的概念及其呈現(xiàn)出來的意義比代表作更具現(xiàn)實合理性。
從我國高校實施的代表性成果評價看,可概括為3種模式,分別可稱為武漢大學(xué)模式、復(fù)旦大學(xué)模式和北京大學(xué)模式①。
武漢大學(xué)模式,是在教師專業(yè)技術(shù)崗位聘任和破格聘任有序進行的基礎(chǔ)上,將代表性成果評價作為一種獨立評價機制運行。武漢大學(xué)分學(xué)科、類型,按年度進行教師專業(yè)技術(shù)崗位評聘。與此并行,實行代表性成果評價制度:由教師個人按“代表性成果評價制度”條款申報,填寫《武漢大學(xué)代表性成果同行專家鑒定表》,提交3項標志性突出成果(論文、著作、項目、獲獎、咨詢報告等)的證明材料;各單位確定申報人申報資格,組織5名校內(nèi)外同行專家,以通訊評審或會議評審的方式進行評議,評議結(jié)果分為“達到”“未達到”兩個等級,回收的評議結(jié)果至少要有3份“達到”,方可進入下一輪評審程序。
復(fù)旦大學(xué)模式,歷經(jīng)兩個階段,以鼓勵教師潛心科研,做出高質(zhì)量、創(chuàng)新性乃至突破性的優(yōu)秀成果為宗旨,以“小同行”評價為核心標準,以分類評價和綜合準入為基礎(chǔ)標準,以“青年杰出人才”申請為專門渠道的“代表性成果”評價機制。第一個階段始于2010年,基本做法是:對于學(xué)校和院系制定的學(xué)術(shù)標準難于判別的、個別真正優(yōu)秀的文科申請人,可以自主向?qū)W院提出申請,提交1~3篇代表作;學(xué)院學(xué)術(shù)評估通過后,由學(xué)校隨機選擇5位校外具有較高學(xué)術(shù)聲望的學(xué)者,匿名對申請人是否“真正優(yōu)秀”“能否破格”“是否勝任”等問題進行學(xué)術(shù)評估。候選人能否參加高級職稱競聘的核心標準是同行專家的學(xué)術(shù)評價。第二階段始于2012年,在全校教師高級職務(wù)聘任中正式推出“代表性成果”評價機制,并對代表性成果做出了明確界定:教師在穩(wěn)定的學(xué)科方向上,通過持續(xù)的研究,形成能代表自己學(xué)術(shù)水平的創(chuàng)新性成果。此后,學(xué)校不斷完善代表性成果機制,如:精準實施校外“小同行”評議;將正高和副高申請人的外審份數(shù)從3~5份和2~3份增加至8份和5份;建立人文與社科、理科、工科、醫(yī)科、教學(xué)為主5類學(xué)術(shù)評價指導(dǎo)標準;通過“青年杰出人才”專門渠道申請正高級專業(yè)技術(shù)職稱的候選人,可不受學(xué)校規(guī)定的“代表性成果數(shù)量”或“任職資歷”限制;完善綜合準入基礎(chǔ)上的“代表性成果”評價機制,在堅守依法教學(xué)、教書育人、為人師表等教育質(zhì)量標準的基礎(chǔ)上,將教師個人高質(zhì)量的學(xué)術(shù)成就作為教師專業(yè)技術(shù)崗位聘任根本標準。
北京大學(xué)模式主要包括兩種形式:第一種是在教學(xué)科研系列中的長聘職位和教授職位晉升中,對主要學(xué)術(shù)成就中的著作、論文設(shè)置提交數(shù)量,采用代表性學(xué)術(shù)成果評價;第二種是對講席教授、人文講席教授等人才稱號職位聘任和正高級專業(yè)技術(shù)二級、三級崗位聘任,主要采用代表性學(xué)術(shù)成果評價。在第一種形式中,規(guī)定提交主要學(xué)術(shù)成就中的代表性著作、論文總計不超過10篇(部);而在主要科研項目、科研成果應(yīng)用轉(zhuǎn)化情況、有重要影響力的研究報告方面,均未做出具體數(shù)量限制。在第二種形式中,要求提供近5年的教學(xué)科研工作和成果目錄,代表性學(xué)術(shù)論文或?qū)V怀^5篇(部);對于符合學(xué)校規(guī)定的激勵條件類型,在教學(xué)獎勵、教學(xué)責任、科研獎勵、科研責任、社會服務(wù)等類型中,每一類只列舉一項。
雖然,3種模式共同強調(diào)了教師學(xué)術(shù)成就的高質(zhì)量和影響力,更加注重學(xué)術(shù)專長和學(xué)術(shù)創(chuàng)新,但高質(zhì)量的評價標準在3種模式之間顯然不具有絕對意義上的一致性。復(fù)旦大學(xué)模式是教師評聘的基本形式,武漢大學(xué)模式是教師評聘形式中的一種形式,北京大學(xué)模式則是教師評聘中的一個方面。在3種模式中,北京大學(xué)以著作和論文為主體的代表性成果評價,最接近代表作評價的原本意義。
武漢大學(xué)模式從制度上鼓勵僅憑重大成果就能脫穎而出的學(xué)術(shù)創(chuàng)新人才,營造呵護甘于沉潛寂寞的學(xué)術(shù)發(fā)展環(huán)境。申請代表性成果評價的教師明顯是以質(zhì)取勝,其代表性成果的學(xué)術(shù)水平不僅要高于正常晉升教師的成果水平,而且還要得到教師個人、學(xué)校和學(xué)術(shù)共同體的集體公認。
復(fù)旦大學(xué)模式在評價范圍普遍化的過程中,個人高質(zhì)量學(xué)術(shù)成就的評價標準必將會與當年度教師崗位評聘的數(shù)量和候選人的學(xué)術(shù)水平產(chǎn)生內(nèi)在關(guān)聯(lián),其評價標準也因此具有一定的相對性。在大致同等學(xué)術(shù)水平教師之間的競爭中,其提交代表性學(xué)術(shù)成果之外的學(xué)術(shù)產(chǎn)出數(shù)量與質(zhì)量無疑也是衡量教師能否晉升聘任的一個砝碼,但這個砝碼由于被評價成果的數(shù)量限制而變得無處安放并難以衡量。面對這一問題,復(fù)旦大學(xué)通過增加代表性成果的數(shù)量進行了部分緩解。
北京大學(xué)模式無疑更加接近美國一流大學(xué)的教師晉升和終身教職評價模式,在堅持教師發(fā)展綜合評價和業(yè)績?nèi)娉尸F(xiàn)的基礎(chǔ)上,突出教師個人代表性成果評價。既重視教師評聘的主要學(xué)術(shù)成就,重視高質(zhì)量著作和論文的代表性,又不輕易將教師學(xué)術(shù)成果的質(zhì)量與數(shù)量絕對分離,從而將大學(xué)教師的社會職責通過教師評聘制度立體化地呈現(xiàn)出來。
有學(xué)者認為,大學(xué)教師代表性成果評價主要是借鑒國外大學(xué)教師評價的成功經(jīng)驗。的確,很多國外大學(xué)在教師評價中都十分強調(diào)教師學(xué)術(shù)的內(nèi)在品質(zhì),但并沒有完全放棄將學(xué)術(shù)成果數(shù)量和學(xué)術(shù)生產(chǎn)力作為教師評價的一個重要方面,也并沒明確提出代表作或代表性成果這樣一種評價機制。例如,美國哈佛大學(xué)在其教師手冊里提到,副教授晉升到教授需要提交的出版成果包括精選重要文章和最新文章(或其他作品)、未發(fā)表的重要手稿、候選人出版作品的所有重要評論;藝術(shù)成果包括重要的創(chuàng)意作品、最新作品以及所有重要評論的清單;引用信息包括候選人作品的總被引次數(shù)、候選人每份出版物的引文計數(shù)[8]。斯坦福大學(xué)在終身教職評估中對研究績效或前景的考慮因素包括學(xué)術(shù)活動和生產(chǎn)力,學(xué)術(shù)影響、創(chuàng)新和創(chuàng)造力,在相應(yīng)領(lǐng)域的認可度和知名度等[9]。有研究認為,盡管世界頂尖大學(xué)晉升和終身教職評價中所謂的“卓越”包含很多要素,但其中一個主要因素是個人出版物的質(zhì)量和數(shù)量[10]。對于這一數(shù)量的要求,南加州大學(xué)認為:學(xué)術(shù)生產(chǎn)力是學(xué)者未來學(xué)術(shù)發(fā)展前景的有力證明,聘用、晉升、終身教職決策雖與完成數(shù)字的目標無關(guān),但學(xué)術(shù)貢獻和影響力通常來源于累積的成果數(shù)量,如果學(xué)術(shù)成果的數(shù)量低于通常的水準就會造成一些問題[11]。北京大學(xué)雖與南加州大學(xué)教師評價模式最為接近,但在著作、論文方面對于候選人的要求恰好相反:南加州大學(xué)重點強調(diào)候選人應(yīng)在影響力大的期刊上發(fā)表足夠數(shù)量的論文,而北京大學(xué)卻對候選人的著作和論文數(shù)量做了限定。
大學(xué)教師評價制度中的數(shù)量和質(zhì)量的關(guān)系非常復(fù)雜,重數(shù)量與輕質(zhì)量、重質(zhì)量與輕數(shù)量并不具有互為前提的、直接因果關(guān)系。費斯特(Gregory J.Feist)[12]根據(jù)出版物的特點,將美國加州頂級研究型大學(xué)的99位男性科學(xué)家分為4個類型:多產(chǎn)型(prolific,既出版物多,又引用廣泛),沉默型(silent,出版物很少,引用也很低),大量生產(chǎn)型(mass producer,出版物很多,但引用很少)和完美主義型(perfectionist,出版物很少,但引用廣泛)。判斷科學(xué)家卓越聲譽的原始標準是成為美國國家科學(xué)院(NAS)的成員。根據(jù)1980-1984年及1990年這6年的數(shù)據(jù),在99位科學(xué)家中,沉默型科學(xué)家被引16次,大量生產(chǎn)型的被引少于25次,完美主義型和多產(chǎn)型分別有123和150次被引;沉默型和完美主義型的出版物數(shù)量為65和75,大量生產(chǎn)型和多產(chǎn)型平均擁有200多種出版物;99位科學(xué)家中有31位是NAS成員,在31位NAS成員中,沉默型占3%,完美主義型占14%,大量生產(chǎn)型占62.5%,多產(chǎn)型占54.8%②。實證研究結(jié)果表明,至少在相對精英的科學(xué)家群體中,卓越度既與質(zhì)量相互影響,又同樣取決于數(shù)量:對于大量生產(chǎn)型和多產(chǎn)型來說,無論其作品是否被高引用,數(shù)量優(yōu)先于影響力;但對于完美主義型來說,質(zhì)量非常重要,高質(zhì)量的成果可以帶來更高的卓越度和享有盛譽的獎項。
學(xué)術(shù)成果的數(shù)量積累在一定程度上是學(xué)術(shù)影響力和學(xué)術(shù)生產(chǎn)力形成的基礎(chǔ)和科學(xué)家卓越的標志,同樣也是科學(xué)家進一步進行學(xué)術(shù)創(chuàng)新的資本。雖不缺少僅憑數(shù)量不多而水平極高的學(xué)術(shù)成果獲得聘任和晉升的教師,但這樣的教師群體評價并沒有成為大學(xué)教師整體評價的基本標準和基本方式,就如同沒有將數(shù)量的要求作為大學(xué)教師評價硬性規(guī)定或前置條件一樣。
唯論文并不僅僅是重數(shù)量和輕質(zhì)量的問題,重數(shù)量與論文低水平重復(fù)發(fā)表并不是完全等同的概念,重質(zhì)量在絕對意義上也并不一定要輕數(shù)量,數(shù)量少并不一定等同于質(zhì)量高,質(zhì)量高也并不等同于數(shù)量少。代表性成果的質(zhì)量與數(shù)量并不對立、不矛盾,而這一重一輕則把數(shù)量和質(zhì)量對立了起來,這種非此即彼的二元對立思維方式,無法從根本上破解教育評價乃至科學(xué)創(chuàng)新中的“卡脖子”難題。
在我國高等教育評價中,通過行政干預(yù)在較短時期解決重數(shù)量的現(xiàn)實問題并不難,但需要在很長時期內(nèi)花大力氣去解決怎樣重質(zhì)量的問題,需要進一步論證和反思不同科學(xué)家的工作類型、不同高校的類型、不同教師的學(xué)科類型在量化評價與質(zhì)性評價中的共融空間,以及在科學(xué)研究活動中數(shù)量與質(zhì)量的共生價值。
首先是代表性成果由誰界定的問題,其關(guān)鍵是高校要確定代表性成果認定的主體。
對于代表性成果評價對象個體來說,代表性成果就是教師自我認定的最高水平的學(xué)術(shù)成果,評價標準源于教師個人的學(xué)術(shù)判斷。但是,教師自我認定的“那桿秤”,究竟是自己的,還是所在大學(xué)同一學(xué)科內(nèi)的最高水平成果?是國內(nèi)的,還是國際的同一個研究領(lǐng)域的最高水平成果?
南加州大學(xué)認為,教師每次聘用、晉升、終身教職決策都應(yīng)符合一流大學(xué)的國內(nèi)和國際標準,提高學(xué)術(shù)單位的整體地位。校方要求候選人的學(xué)術(shù)或藝術(shù)作品應(yīng)是杰出的,在同行中獲得廣泛認可,在其學(xué)術(shù)領(lǐng)域中享有良好的聲譽[11]。南加州大學(xué)將教師評價過程的自我學(xué)術(shù)水準認定和同行學(xué)術(shù)水準認定從整體上做了統(tǒng)一。代表性成果不僅僅是教師自我認定的“那桿秤”,同時又是教師學(xué)術(shù)成就在所在大學(xué)、所在國家乃至全世界同行中的一個水平認定的過程;在教師自我認定的最高學(xué)術(shù)水平成果的基礎(chǔ)上,還要有一個基于學(xué)術(shù)共同體能夠達成基本共識的認定水準。這其中真正考量的既是被評價者在國內(nèi)外同一研究領(lǐng)域中的內(nèi)在質(zhì)優(yōu),又是同行評價者的學(xué)術(shù)水準、學(xué)術(shù)誠信和學(xué)術(shù)良知。
其次是代表性成果怎樣界定的問題,其關(guān)鍵是代表性成果認定標準的問題。
最能得到學(xué)術(shù)共同體公認的代表性成果是那些具有原創(chuàng)價值和重大社會貢獻度的創(chuàng)新性、標志性成果;評價的是大學(xué)教師中最具有特殊天賦和特殊貢獻的非常規(guī)和超常規(guī)人才,這一群體的學(xué)術(shù)影響力以質(zhì)取勝足矣,數(shù)量限定確是畫蛇添足。但是,任何一個國家的學(xué)術(shù)職業(yè)都不是只由頂尖學(xué)術(shù)精英構(gòu)成,也不是任何一個教師都能成為學(xué)術(shù)領(lǐng)軍人物和原始創(chuàng)新的開拓者。不是所有類型高校的所有教師都具有“數(shù)十年鑄一劍”的創(chuàng)造力,成為摘得國際學(xué)術(shù)桂冠的頂級科學(xué)家。
當代表性成果成為大學(xué)教師評價的共同尺度和基本制度時,代表性成果中的科學(xué)桂冠和頂峰之作的指向意義就會在一定程度上消減,而代表性成果評價本體價值的象征意義就成為制度的邏輯起點,合理的數(shù)量認定和明確的質(zhì)量標準就成為這一制度構(gòu)建不得不面對的關(guān)鍵問題。
一是構(gòu)建科學(xué)的代表性成果數(shù)量限定。統(tǒng)一的、硬性的數(shù)量限制很難公平公正地評價出不同學(xué)術(shù)生產(chǎn)力類型教師的學(xué)術(shù)影響力。在實施代表性成果評價的高校中,代表性成果的數(shù)量是由教師評價管理部門規(guī)定,但這些規(guī)定很難在政策文本和研究文獻中找到一個嚴謹而清晰的科學(xué)依據(jù)。與一個統(tǒng)一的數(shù)量規(guī)定相比,申請人自我認定的高水平成果,抑或是其同一研究領(lǐng)域的系列發(fā)表或出版,抑或是其全部學(xué)術(shù)成果中的前10%~20%,在應(yīng)然上更具合理性。而具體到不同模式的代表性成果評價,武漢大學(xué)模式更要突出高水平成果在專攻領(lǐng)域的原創(chuàng)性和影響力;復(fù)旦大學(xué)模式則更要突出個人成果自我認定的代表性,在評價標準上要盡可能地兼顧成果的數(shù)量與質(zhì)量。3種模式都要在數(shù)量限定的同時平衡不同學(xué)科的差異性,以及系列出版物在同一研究領(lǐng)域創(chuàng)新過程中的內(nèi)在關(guān)聯(lián)性。
二是構(gòu)建具有共識的代表性成果認定標準。具有共識的評價標準是代表性成果在學(xué)術(shù)共同體內(nèi)具有可比性的前提條件。如美國國家科學(xué)基金會的同行評議,其中通信評議有一份用于總體評價的5級評價標準,分別為優(yōu)秀、良好、好、尚好和差,其中優(yōu)秀的評分標準是:“可能落到在這一分科中最好的10%的申請上;最優(yōu)先支持的申請。該評分僅適用于真正杰出的申請?!盵13]再如,武漢大學(xué)代表性成果同行專家評議的5級水平評價標準:頂尖(前10%)、優(yōu)秀(前30%)、良好(平均水平)、一般(平均水平以下)、較差。如果按總體評價的5級評價標準,正高級職位的候選人代表性成果評價標準至少應(yīng)該屬于國內(nèi)同一時期同一個專攻領(lǐng)域中最好的10%,或是國際同一時期同一個專攻領(lǐng)域中前30%;副高級職位的候選人代表性成果評價標準至少應(yīng)該屬于國內(nèi)同一時期同一個專攻領(lǐng)域中前30%。
三是文獻計量學(xué)在代表性成果評價中價值定位的問題。文獻計量學(xué)自20世紀90年代以來普遍成為評價科研和科研人員的主要工具,其原因恰是因為同行評價越來越多地被認為過于主觀,需要用更為客觀的數(shù)據(jù)來加以補充甚至替換[1]8。但是,研究者又發(fā)現(xiàn)文獻計量學(xué)評價存在著自身難以克服的缺陷:如論文的引用不多有時并不代表論文本身質(zhì)量不高,只是反映了科學(xué)家們還沒有對這一主題感興趣;在人均論文數(shù)量不變的情況下,被引頻次也取決于學(xué)術(shù)共同體的規(guī)模;一些真正具有創(chuàng)新價值的成果可能在一段時間內(nèi)處于零引用,許多重大發(fā)現(xiàn)可能很多年后才會被引用,像愛因斯坦的發(fā)現(xiàn)或DNA結(jié)構(gòu)一樣,一個較低h指數(shù)的背后也許隱藏著一位高水平的科研人員等[1]13-64。文獻計量學(xué)中的“睡美人”現(xiàn)象[14]及其不同學(xué)科論文引用存在的差異性同時又為同行評價的合理性提供了反證,為文獻計量學(xué)評價提供了反對和批評的證據(jù)。從總體來看,除了引用行為的多樣性和差異性外,引用仍然對成果的科學(xué)影響力評價有積極作用,因為它隱含多種用途的全球顯示度(包括修辭學(xué)引用的說服功能)[15]。
我國大學(xué)教師代表性成果評價已經(jīng)存在的弊端體現(xiàn)在三個方面:一是以刊評文、以被引頻次論質(zhì)的評價思維慣性導(dǎo)致評價的主客體對于成果的創(chuàng)新性、貢獻度的關(guān)注不夠,論文發(fā)表刊物的級別、影響因子成為同行評價的基本依據(jù);二是代表性成果評價范圍的擴大帶來評價難度和成本的提高,以及同行評價專家遴選目標針對性的降低,大文科、大理科同行評價也就在所難免;三是我國同行評價制度體系有待健全,還沒有作為本質(zhì)存在嵌入科學(xué)之基,與整個科技大廈融為一體。
同行評議是支持最優(yōu)質(zhì)研究和成果的根本依據(jù)[13],致力于關(guān)注那些被認為是最“好”的且最為重要的研究活動。從代表性成果評價外在指標凸現(xiàn)到內(nèi)在質(zhì)優(yōu)的轉(zhuǎn)化,同行專家的通訊評議起著關(guān)鍵作用。而同行專家要對研究者的能力、研究內(nèi)容和研究價值做出客觀、公正的學(xué)術(shù)判斷,在堅持保密政策和避免產(chǎn)生利益沖突的基本前提下,其專業(yè)水準及其與申請者申請內(nèi)容的契合度和精準度成為至關(guān)重要的決定因素。
小同行評議,從同行評議專家的遴選范圍來說,是一個縮小的同行評議專家圈,一個具有相同或相似研究主題聚集而成的小型學(xué)術(shù)群體;從學(xué)科分類的角度來說,是由學(xué)科門類-一級學(xué)科-學(xué)科研究方向下的研究領(lǐng)域,或是研究領(lǐng)域下的一個研究方向,聚集而成的學(xué)術(shù)群體中的領(lǐng)先專家。絕大多數(shù)學(xué)科都包含范圍廣泛的子專攻領(lǐng)域,主要形成了基于理論、基于技術(shù)、基于共同研究主題三種專攻類型,這三種專攻類型往往相互交集而存在;同一專攻領(lǐng)域的學(xué)者,他們專業(yè)身份上往往具有共同的定義[16]。小同行評議專家是一個專攻領(lǐng)域中的領(lǐng)先者。小同行評議作為代表性作品評價最適切的方式,其核心價值和意義正在于它能夠有效而可靠地去測度候選人學(xué)術(shù)成果的科學(xué)性和優(yōu)質(zhì)程度,從而確保學(xué)術(shù)資源達到最合理的配置。
南加州大學(xué)對于小同行評議專家及其來源做了三方面界定:在許多領(lǐng)域中擔任領(lǐng)先期刊的編輯或編委,在專業(yè)協(xié)會中擔任領(lǐng)導(dǎo)職務(wù),在許多領(lǐng)域應(yīng)邀出席戈登研究會議(Gordon Research Conferences)的學(xué)者[11]。將小同行評議與第三方評價綜合運用,共同培育提升國家自主創(chuàng)新能力的學(xué)術(shù)生態(tài),是代表性成果評價機制良性運行的一條有效路徑選擇。
大學(xué)教師評價的“第三方”,更多的是指政策制定者和政策執(zhí)行者之外的非行政隸屬、無利益關(guān)系、具有獨立法人資質(zhì)的專業(yè)化組織和機構(gòu)。第三方評價功能有效發(fā)揮的先決條件是具有獨立性和專業(yè)性資質(zhì)。第三方機構(gòu)是依法獨立設(shè)置、具有法人資格的機構(gòu),能夠獨立承擔民事責任,與第一方和第二方既無行政上的直接附屬關(guān)系,也無經(jīng)濟上的利益關(guān)聯(lián),能夠客觀、公正、中立、負責地做出自主評價。當然,第三方機構(gòu)還要具有專業(yè)倫理精神、專業(yè)自律能力和超越個人私利進行利他服務(wù)的道德水準。
在我國大學(xué)教師代表性成果第三方評價中,可構(gòu)建委托型第三方評價+小同行評議運行模式:由高校作為委托方,按照“小同行評價”標準和要求,通過購買服務(wù)的方式對代表性成果進行第三方評價。著作、論文代表性成果可依托國內(nèi)外高水平學(xué)術(shù)期刊,充分利用這些期刊長期累積形成的國內(nèi)外審稿專家群和編輯委員會進行小同行專家評議;項目和成果獎勵代表性成果可依托國內(nèi)外行業(yè)學(xué)會協(xié)會、高等教育行業(yè)評價機構(gòu)等進行小同行專家評議;應(yīng)用研究和技術(shù)開發(fā)代表性成果可依托第三方中介機構(gòu)進行由用戶、市場和專家共同參與的多元評價,以期對技術(shù)實現(xiàn)的可能性、可行性、經(jīng)濟性等做出綜合判斷。
一個國家自主創(chuàng)新的基石,一是基于由基礎(chǔ)研究而形成的原創(chuàng)性突破,二是基于事關(guān)國家安全和人民生命健康關(guān)鍵核心技術(shù)的突破。雙重突破的關(guān)鍵是造就一支以科學(xué)為志業(yè)、以科學(xué)精神為身份標識和靈魂象征、具有國際創(chuàng)新水準和原始創(chuàng)新能力的科學(xué)家隊伍。
代表性成果評價制度設(shè)計的初心和根本是厚植學(xué)術(shù)創(chuàng)新土壤,倡導(dǎo)和弘揚勇攀高峰、敢為人先的創(chuàng)新精神,保障學(xué)術(shù)人員對科學(xué)本身的好奇心和激情,以及大膽質(zhì)疑的勇氣、由懷疑抵達真理的執(zhí)著。代表性成果評價制度是對大學(xué)教師無功利無私利自由探索的呵護,以及靜心篤志、耐得住寂寞、“數(shù)十年鑄一劍”的包容和支持。代表性成果評價為破解大學(xué)排名與教師評價相互疊加的功能異化以及由此產(chǎn)生的學(xué)術(shù)不端行為、學(xué)術(shù)急功近利行為、學(xué)術(shù)投機行為和論資排輩行為,為建立更具競爭力的科技創(chuàng)新生態(tài)系統(tǒng),實現(xiàn)國家自主創(chuàng)新與關(guān)鍵核心技術(shù)自主可控提供最強智力支撐。
代表性成果評價制度設(shè)計的關(guān)鍵是以科學(xué)研究活動的創(chuàng)新力和影響力為評價的首要和核心標準,是對以“績效和競爭”為核心形成的泰勒主義、“文獻計量學(xué)評價=科學(xué)研究活動評價”等評價制度邏輯的再審視。代表性成果評價是以成果的開創(chuàng)性、可持續(xù)性、同行的廣泛認可性等內(nèi)在優(yōu)質(zhì)評價和廣泛影響(社會福祉和社會效益)來矯正絕對量化和精確化的評價模式,矯正將科學(xué)研究活動質(zhì)量評價指標簡單、機械地轉(zhuǎn)化為外在的量化評價指標和外在的知名度評價。值得注意的是,代表性成果評價是對以上現(xiàn)象的矯正,而不是全盤的否定,不同層級、不同類型的高校、學(xué)科、教師,對于代表性成果的數(shù)量與質(zhì)量關(guān)系的認定和評價是不同的,具有普遍意義和同一數(shù)量限定的評價標準在跨學(xué)科比較中不具有公平性和客觀性。以量取勝只是文獻計量學(xué)評價中的一種情況,量化評價和數(shù)量評價不是完全對等的兩個概念,代表性成果評價不是必須非要限定為一個一成不變的、全校統(tǒng)一的成果數(shù)量范圍。尤其對于人文社會學(xué)科來說,一個具有重大創(chuàng)新價值理論體系的構(gòu)建,可能是一生沉潛的寥寥珍本,也可能是大量論著積累而成的系統(tǒng)支撐,數(shù)量的限定要服務(wù)于教師在塑造和建設(shè)中國特色理論學(xué)派中的價值引領(lǐng)、思想原創(chuàng)和體系貢獻。矯枉過正,代表性成果評價制度的正確價值取向同樣會被扭曲和破壞,會成為催生偽代表性成果的溫床。
代表性成果評價既是同行評價認定標準的價值回歸,又是對文獻計量學(xué)評價標準的一種理性的揚棄,也是對依靠行政權(quán)力進行學(xué)術(shù)評價的一種制衡。“定量指標(例如基于引文的數(shù)據(jù))在單獨使用時不能充分提供精細或有力的質(zhì)量評價標準”,“質(zhì)量需要被視為任何一個指標都無法捕捉的多維概念”,“不可能有一個放之四海皆準的評價標準:成熟的研究系統(tǒng)需要有定量和定性評價相結(jié)合的,保持可變的專家評審體系”[3]。代表性成果評價中同行評價的價值內(nèi)核,是學(xué)術(shù)共同體內(nèi)部共同守護的學(xué)術(shù)自治、學(xué)術(shù)自由、真理至上,是基于學(xué)術(shù)共同體作為學(xué)術(shù)良知和學(xué)術(shù)內(nèi)在質(zhì)量的守門人價值判斷,是對行政權(quán)力干預(yù)學(xué)術(shù)評價的有效防御和抵制。值得注意的是,代表性成果評價不是完全等同于同行評價,恰如文獻計量學(xué)評價不是完全等同于評價一樣。文獻計量學(xué)評價從本質(zhì)上說反映的是科學(xué)研究活動的外在影響力,但外在影響力在一定程度上又是科學(xué)研究活動內(nèi)在質(zhì)量的外在顯現(xiàn)。代表性成果評價不是對于文獻計量學(xué)評價的全盤否定,文獻計量學(xué)評價在克服同行評價的主觀性和公信力不足等弊端、評價從無到有和非共識項目原創(chuàng)價值等方面具有客觀優(yōu)勢。代表性成果評價要放棄的是將計量文獻學(xué)評價作為教師科學(xué)活動質(zhì)量判斷唯一、直接、全部的依據(jù),杜絕的是將量化指標作為教師評價的前置條件和絕對標準。
注釋
①概括出3種模式的依據(jù)主要來源于這3所高校職能部門官網(wǎng)公布的材料,以及具體政策文本和教師手冊。
②該研究中這四種類型的劃分不是獨立分類,中間存在交叉。即,有的科學(xué)家雖然不屬于沉默型,但可能同時屬于完美主義型、大量生產(chǎn)型和多產(chǎn)型中的兩種或多種。所以,分類的數(shù)值上可能存在重疊,占比之和不等于100%。