王小青 王九民
(1.北京大學(xué) 教育學(xué)院,北京 100871 ;2.北京第二外國(guó)語學(xué)院 教務(wù)處,北京 102199)
對(duì)于資源缺乏、政府財(cái)力薄弱的中國(guó)高等教育而言,低成本擴(kuò)張機(jī)制是在短時(shí)間內(nèi)實(shí)現(xiàn)高等教育規(guī)模擴(kuò)增,普及高等教育升學(xué)機(jī)會(huì)的有效手段。然而,馬丁·特羅(Trow)認(rèn)為,規(guī)模擴(kuò)張和質(zhì)量提升,這雙重使命形成了高等教育發(fā)展中的悖論。[1]17高校面臨著越來越大的壓力,它們需要向家長(zhǎng)和其他利益相關(guān)者們證明,大學(xué)能夠很好地利用投資并幫助學(xué)生為畢業(yè)后的職業(yè)生涯做好準(zhǔn)備[2-3],或者說,學(xué)校和學(xué)生之間關(guān)系轉(zhuǎn)變?yōu)轱@性的產(chǎn)品提供方和顧客的關(guān)系,導(dǎo)致了問責(zé)制度(accountability)的產(chǎn)生[4]35-36。問責(zé)制往往需要借助于評(píng)估來完成。簡(jiǎn)言之,問責(zé)制的執(zhí)行推動(dòng)了評(píng)價(jià)運(yùn)動(dòng),高等教育利益相關(guān)者希望明確高等院校是否真正促進(jìn)了學(xué)生的學(xué)業(yè)成就,是否對(duì)學(xué)生發(fā)展產(chǎn)生增值效應(yīng),是否培養(yǎng)了適應(yīng)于當(dāng)今知識(shí)經(jīng)濟(jì)發(fā)展的合格人才,這里的學(xué)業(yè)成就(learning outcomes)指的是,由于高等院校學(xué)習(xí)所導(dǎo)致的學(xué)生個(gè)體變化或收益。[1]49
那么,如何才能評(píng)價(jià)出學(xué)業(yè)成就的提升和進(jìn)步呢?西方流行的美國(guó)大學(xué)生學(xué)習(xí)經(jīng)歷調(diào)查(the National Survey for Student Engagement,NSSE)、研究型大學(xué)學(xué)生就讀經(jīng)驗(yàn)調(diào)查(Student Engagement in Research University,SERU)(也稱為“加州大學(xué)本科生就讀經(jīng)驗(yàn)調(diào)查”,UCUES)、課程經(jīng)驗(yàn)問卷(Course Experience Questionnaire,CEQ)都是在嘗試回答這一問題。[5]國(guó)內(nèi)北京大學(xué)的全國(guó)高校教學(xué)質(zhì)量與學(xué)生發(fā)展監(jiān)測(cè)項(xiàng)目①原名為“首都高校教學(xué)質(zhì)量與學(xué)生發(fā)展評(píng)價(jià)項(xiàng)目”,自2017年開始正式命名為“全國(guó)高校教學(xué)質(zhì)量與學(xué)生發(fā)展監(jiān)測(cè)項(xiàng)目”。這里簡(jiǎn)稱“北大項(xiàng)目”。、清華大學(xué)的中國(guó)大學(xué)生學(xué)習(xí)與發(fā)展追蹤調(diào)查(CCSS)、廈門大學(xué)的中國(guó)大學(xué)生學(xué)習(xí)情況調(diào)查研究項(xiàng)目(NCSS)等也加入對(duì)大學(xué)生學(xué)業(yè)成就評(píng)估的行列。如果以復(fù)旦大學(xué)社會(huì)學(xué)系于1998年開始主持的“上海大學(xué)生發(fā)展研究”為起點(diǎn),中國(guó)大學(xué)生學(xué)業(yè)成就評(píng)估的探索剛好二十年。筆者綜合使用文獻(xiàn)研究法、比較研究法、歷史研究法和訪談法,對(duì)近二十年大學(xué)生學(xué)業(yè)成就評(píng)估工具、評(píng)估方法和評(píng)估結(jié)果應(yīng)用等進(jìn)行梳理,試圖發(fā)現(xiàn)存在的問題并為國(guó)內(nèi)的實(shí)踐提供可參考的建議。由于中國(guó)大學(xué)生學(xué)業(yè)成就評(píng)估的測(cè)評(píng)工具、測(cè)評(píng)方法和應(yīng)用等均是“西學(xué)東漸”的過程,故討論中國(guó)的大學(xué)生學(xué)業(yè)成就評(píng)估發(fā)展,往往需要以歐美國(guó)家的發(fā)展為參照物,在行文之中均會(huì)簡(jiǎn)單介紹國(guó)際上的基本情況再過渡到中國(guó)本土的情境。
在此,需要指出的是,有學(xué)者將學(xué)業(yè)成就評(píng)估進(jìn)一步歸納為質(zhì)量評(píng)估的“增值”問題[6]126,在國(guó)內(nèi)部分文獻(xiàn)中稱為“增值評(píng)價(jià)”[7-11],考慮到本研究需要對(duì)目前大陸比較有代表性的大學(xué)生學(xué)業(yè)評(píng)估項(xiàng)目進(jìn)行研究,而有的項(xiàng)目負(fù)責(zé)人對(duì)將他們的項(xiàng)目看作增值評(píng)價(jià)表示強(qiáng)烈反對(duì),爭(zhēng)議點(diǎn)在于“增值”太難測(cè)量②來源:2017年11月7日與M老師面對(duì)面談話。,筆者閱讀了其他研究增值評(píng)價(jià)的文獻(xiàn),發(fā)現(xiàn)增值評(píng)價(jià)的對(duì)象就是學(xué)業(yè)成就,因此,本研究采納學(xué)業(yè)成就評(píng)估這一范疇,可以囊括增值評(píng)價(jià)的相關(guān)研究。③比如章建石認(rèn)為:“所謂增值評(píng)價(jià)即通過對(duì)學(xué)生在整個(gè)大學(xué)就讀期間或某個(gè)階段的學(xué)習(xí)過程、學(xué)習(xí)結(jié)果的分析,來描述學(xué)生在學(xué)習(xí)上進(jìn)步或發(fā)展的增量,這個(gè)增量可看作教學(xué)質(zhì)量提升的結(jié)果,是學(xué)校教學(xué)改進(jìn)的標(biāo)志,也是教學(xué)質(zhì)量評(píng)價(jià)所要關(guān)注的重點(diǎn)。”詳見章建石:《基于學(xué)生增值發(fā)展的教學(xué)質(zhì)量評(píng)價(jià)與保障研究》,北京師范大學(xué)出版社,2014年版。唯一的焦點(diǎn)在于后者的研究者們認(rèn)為學(xué)生的增值可以測(cè)量[9][10]8[12]。下文文獻(xiàn)綜述部分也將會(huì)詳細(xì)展開。
在20世紀(jì)70年代末80年代初,美國(guó)就出現(xiàn)了一些測(cè)評(píng)工具,如McBer公司的“行為事件訪談”(Behavioral Event Interview),美國(guó)ACT和ETC關(guān)于通識(shí)教育的測(cè)評(píng)工具等。[13]51-53近年來國(guó)際上的大學(xué)生學(xué)業(yè)成就評(píng)估工具發(fā)展迅速,筆者根據(jù)評(píng)估內(nèi)容和測(cè)評(píng)對(duì)象的不同,整理出了各國(guó)研究者們開發(fā)的27種測(cè)評(píng)工具。
美國(guó)最多,主要包括合作性的院校研究項(xiàng)目—新生調(diào)查(Cooperative Institutional Research Program-Freshman Survey,CIRP-FS)(1966)[13]211、大學(xué)生期望問卷調(diào)查(College Studeut Expectation Questionaire,CSXQ)[14]、大學(xué)學(xué)術(shù)能力測(cè)評(píng)(Collegiate Assessment of Academic Proficiency,CAAP)(1988)[1]50、學(xué)業(yè)表現(xiàn)和進(jìn)步測(cè)量(Measure of Academic Proficiency and Progress,MAPP)(2006)[1]50[12]、大學(xué)生就讀經(jīng)驗(yàn)調(diào)查(College Student Experience Questionnaire,CSEQ)(1994)[15]19、大學(xué)生調(diào)查(College Student Survey,CSS)(1993)[1]61、全美大學(xué)生滿意度調(diào)查(National Student Satisfaction Study,NSSS)(2000)[16]、學(xué)院學(xué)習(xí)結(jié)果評(píng)估(Collegiate Learning Assessment,CLA)[1]51[12]、美國(guó)大學(xué)生學(xué)習(xí)經(jīng)歷調(diào)查(NSSE)(2000)[1]59、研究型大學(xué)就讀經(jīng)驗(yàn)調(diào)查(SERU)[17]92、CIRP 大四學(xué)生調(diào)查(CIRP College Senior Survey,CIRP-CSS)(1992)[18]30、全美大型質(zhì)量評(píng)估項(xiàng)目(the Wabash National Survey of Liberal Arts Education,WNSLAE或Wabash)(2006)[19-20]、專業(yè)領(lǐng)域測(cè)試(Major Field Test,MFT)[12]以及大學(xué)結(jié)果調(diào)查(College Results Survey,CRS)和綜合性的校友評(píng)價(jià)問卷調(diào)查(Comprehensive Alumni Assessment Survey,CAAS)[14]等。澳大利亞次之,包括畢業(yè)生技能評(píng)價(jià)(Graduate Skills Assessment,GSA)(2000)[12]、大學(xué)生經(jīng)驗(yàn)調(diào)查(Student Experience Survey,SES)(2015)④大學(xué)生經(jīng)驗(yàn)調(diào)查(SES)的前身是大學(xué)經(jīng)驗(yàn)調(diào)查(University Experience Survey),主要包括教學(xué)與支持、學(xué)習(xí)者參與和教育發(fā)展。詳見https://www.qilt.edu.au/about-this-site/student-experience。、課程經(jīng)驗(yàn)問卷(CEQ)(1993)[10]85、畢業(yè)生就業(yè)目的地調(diào)查(the Graduate Destination Survey,GDS)(1974)[12]、畢業(yè)生收獲調(diào)查(Graduate Outcomes Survey,GOS)(2016)⑤畢業(yè)生收獲調(diào)查(GOS)從2016年開始代替澳大利亞畢業(yè)生調(diào)查(Australian Graduate Survey,AGS)及相關(guān)的調(diào)查和出版物,包括GDS、CEQ、PREQ等。詳見澳大利亞社會(huì)研究中心的《澳大利亞2016年全國(guó)大學(xué)畢業(yè)生收獲調(diào)查報(bào)告》(2016 Graduate Outcomes Survey :National Report),載于https://www.qilt.edu.au/about-this-site/graduate-employment。等。還有英國(guó)的全英大學(xué)生滿意度調(diào)查(National Student Survey,NSS)(2005)[10]90[16]和大學(xué)畢業(yè)生目的地調(diào)查(the Destinations of Leavers From Higher Education,DLHE)[12],加拿大的青年工作轉(zhuǎn)換調(diào)查(the Youth in Transition Survey,YITS)和全國(guó)畢業(yè)生調(diào)查(National Graduates Survey,NGS)[12],日本的全國(guó)大學(xué)生調(diào)查(東京大學(xué)創(chuàng)成科研項(xiàng)目,CRUMP調(diào)查)和日本大學(xué)生調(diào)查(山田禮子科研項(xiàng)目,JCSS調(diào)查)[1]62。國(guó)際經(jīng)濟(jì)合作與發(fā)展組織(OECD)2008年發(fā)起的高等教育學(xué)生學(xué)業(yè)成就跨國(guó)評(píng)估項(xiàng)目(The Assessment of Higher Education Learning Outcomes,AHELO)[21]屬于涉及的國(guó)家數(shù)量最多的項(xiàng)目。
其中,評(píng)估內(nèi)容又有認(rèn)知和非認(rèn)知的區(qū)別,前者一般分為共同性知識(shí)與領(lǐng)域特定的知識(shí)[12]。如美國(guó)的CAAP、MAPP、Wabash項(xiàng)目[19]測(cè)量的就是通識(shí)教育教學(xué)成效,CLA測(cè)量的是特定領(lǐng)域的學(xué)習(xí)結(jié)果,而CEQ、NSSE主要關(guān)注非認(rèn)知學(xué)習(xí)結(jié)果和一般性能力,MFI則是兩者兼而有之。[12]從測(cè)評(píng)對(duì)象來看,大多數(shù)是關(guān)注過程中的大學(xué)生就讀經(jīng)驗(yàn)和收獲,如美國(guó)的CSEQ、NSSE、SERU,澳大利亞的CEQ、GAS,英國(guó)的NSS,等等,而CIRPFS和CSXQ關(guān)注的則主要是新生的基本信息和就讀期望。與此同時(shí),一些測(cè)評(píng)已經(jīng)關(guān)注到校友層面的增值和發(fā)展,如美國(guó)的CRS、CAAS,澳大利亞的CEQ、GDS,英國(guó)的DLHE,加拿大的YITS和NGS,等等。還有兩個(gè)測(cè)評(píng)工具比較特殊:一是日本的全國(guó)大學(xué)生調(diào)查,既關(guān)注在校生也關(guān)注校友;一是OECD發(fā)起的高等教育學(xué)生學(xué)業(yè)成就跨國(guó)評(píng)估項(xiàng)目(AHELO)測(cè)評(píng)多國(guó)的大學(xué)生增值情況,可以是一般性能力,也可以是專業(yè)能力。[1]53
上述這些測(cè)評(píng)工具之間存在一些“互相借鑒學(xué)習(xí)”(或稱為本土化)的情況,如英國(guó)的NSS就是在澳大利亞的CEQ基礎(chǔ)上修訂而成[10]90,美國(guó)的 NSSE原版調(diào)查問卷的2/3來自CSEQ的問卷內(nèi)容[22],而日本的全國(guó)大學(xué)生調(diào)查參考了美國(guó)的NSSE調(diào)查[1]63。之所以花了很大的篇幅先介紹國(guó)外的測(cè)評(píng)工具,是因?yàn)榘l(fā)生在英國(guó)和日本的這種本土化進(jìn)程也同樣發(fā)生在中國(guó)。
國(guó)內(nèi)方面,自從有學(xué)者開始討論大學(xué)生就讀經(jīng)驗(yàn)[23-24],始于2007年左右的學(xué)業(yè)成就評(píng)估蓬勃發(fā)展,逐步形成了多足鼎力的第三方機(jī)構(gòu)評(píng)價(jià)局面(見表1)。主要有北大項(xiàng)目、清華大學(xué)的CCSS、北京師范大學(xué)的CCSEQ、南京大學(xué)發(fā)起的國(guó)內(nèi)SERU調(diào)查項(xiàng)目[12,17]、廈門大學(xué)的NCSS等。有研究者還提到了北京市學(xué)習(xí)科學(xué)研究會(huì)杜智敏教授主持的“北京市大學(xué)生學(xué)情調(diào)查”(2002),山東理工大學(xué)譚秀森負(fù)責(zé)的“當(dāng)代大學(xué)生學(xué)習(xí)環(huán)境與研究”(2007),復(fù)旦大學(xué)的“上海大學(xué)生發(fā)展研究”(1998)等都是學(xué)生學(xué)習(xí)與成就相關(guān)的測(cè)量工具[1]71,這些測(cè)評(píng)工具盡管不完全是建立在學(xué)業(yè)成就評(píng)估基礎(chǔ)上的,但依然對(duì)了解學(xué)生學(xué)業(yè)成果和發(fā)展有重大意義。國(guó)內(nèi)的測(cè)評(píng)工具全國(guó)性調(diào)查與地方性調(diào)查并存。全國(guó)性調(diào)查如清華的CCSS、廈大的NCSS等,地方性的調(diào)查如湖南省借助大學(xué)生就讀經(jīng)驗(yàn)調(diào)查(CSEQ)對(duì)105所本科及高職院校進(jìn)行調(diào)查[25]48-55,北大項(xiàng)目從2017年由原先地方性的“首都高校教學(xué)質(zhì)量與學(xué)生發(fā)展監(jiān)測(cè)研究”成功轉(zhuǎn)變?yōu)槿珖?guó)性調(diào)研。①來源:2017年5月25日與項(xiàng)目負(fù)責(zé)人的對(duì)話。當(dāng)然也有很多高校嘗試自主研發(fā)測(cè)評(píng)工具主要服務(wù)于各自的院校研究如中山大學(xué)[26],可以稱之為“校本模式”。
表1 國(guó)內(nèi)主要的大學(xué)生學(xué)業(yè)成就評(píng)估工具一覽
參與測(cè)評(píng)院校數(shù)量而言,以北大項(xiàng)目和清華項(xiàng)目(CCSS)為例(見圖1),北大項(xiàng)目自2006年開始6所學(xué)校參加,到2008—2015年每年參加的首都高校穩(wěn)定在50所上下,十年參與人數(shù)超過30萬人次[27]10,2017年開始推廣到全國(guó),參加院校近100所②來源:2017年5月25日與項(xiàng)目負(fù)責(zé)人的對(duì)話。。清華領(lǐng)銜的CCSS,2009—2015年參加的院校累計(jì)超過100所,人數(shù)超過30萬次。[16]145廈大的NCSS,2011—2014年期間每年參加的院校在50所左右,參加學(xué)生人數(shù)亦超過30萬人次。③數(shù)據(jù)來源于史秋衡、汪雅霜《大學(xué)生學(xué)習(xí)情況調(diào)查研究》(教育科學(xué)出版社,2016年版)和史秋衡《大學(xué)生學(xué)習(xí)情況究竟怎樣》(載于《中國(guó)高等教育》,2015年第Z1期)的數(shù)據(jù)核算。據(jù)估算,2017年選擇參加三個(gè)項(xiàng)目的院校數(shù)量,預(yù)計(jì)超過200所④如上文所述,北大項(xiàng)目參加院校近100所,清華項(xiàng)目和廈大項(xiàng)目均值在50所。,占全國(guó)高校近1/10⑤截至2017年5月31日,全國(guó)高等學(xué)校共計(jì)2 914所,其中:普通高等學(xué)校2 631所(含獨(dú)立學(xué)院265所),成人高等學(xué)校283所。數(shù)據(jù)來自教育部2017年6月14日發(fā)布的《全國(guó)高等學(xué)校名單》,2017年11月12日下載于http://www.moe.gov.cn/srcsite/A03/moe_634/201706/t20170614_306900.html。。此等規(guī)模在中國(guó)高教史上具有紀(jì)念意義,越來越多的中國(guó)高校自發(fā)地通過學(xué)業(yè)成就評(píng)估來促進(jìn)自身的長(zhǎng)遠(yuǎn)發(fā)展。
圖1 北大項(xiàng)目和清華項(xiàng)目2006-2016年參與院校數(shù)量統(tǒng)計(jì)圖⑥數(shù)據(jù)來源:(1)北大項(xiàng)目數(shù)據(jù)(2006—2015)主要來源于鮑威等《首都高校教學(xué)質(zhì)量與學(xué)生發(fā)展監(jiān)測(cè)研究》(人民日?qǐng)?bào)出版社,2016年版)第10-11頁(yè)。2016年數(shù)據(jù)由該課題組提供。(2)清華項(xiàng)目數(shù)據(jù)主要來源于文獻(xiàn)、官網(wǎng)報(bào)道、第三方媒體報(bào)道。如2012年數(shù)據(jù)參見趙琳等《大學(xué)前教育經(jīng)歷對(duì)高等教育質(zhì)量的影響機(jī)制研究——兼議教育領(lǐng)域綜合改革》(載于《清華大學(xué)教育研究》,2014年第3期),2016年數(shù)據(jù)、2010年數(shù)據(jù)分別來自搜狐教育、清華教育研究院官網(wǎng)。2013年數(shù)據(jù)、2015年數(shù)據(jù)結(jié)合論文、會(huì)議報(bào)道后的估算。
另外,南京大學(xué)、西安交通大學(xué)、湖南大學(xué)、同濟(jì)大學(xué)參與了SERU項(xiàng)目。北京大學(xué)也在考慮加入。⑦來源:2017年12月24日與北京大學(xué)教育學(xué)院Z老師面對(duì)面訪談。國(guó)內(nèi)參與學(xué)校盡管較少,但可以與美國(guó)的17所頂尖大學(xué)(如加州伯克利大學(xué))、歐洲(如牛津大學(xué))和南美的6所頂尖大學(xué)、韓國(guó)首爾大學(xué)等近30所大學(xué)形成跨國(guó)的數(shù)據(jù)庫(kù)。[12]在“雙一流”建設(shè)政策[28]背景下國(guó)內(nèi)大學(xué)可以更好地與國(guó)外大學(xué)在相同指標(biāo)上進(jìn)行比較,看出各自大學(xué)的長(zhǎng)處和短板。
國(guó)際上測(cè)評(píng)工具絕大多數(shù)都有較好的信效度[18]34,在國(guó)內(nèi)學(xué)者引入和本土化過程中也進(jìn)行了信效度檢驗(yàn),相當(dāng)一部分在研究中都呈現(xiàn)了較好的結(jié)果[1]73-74[10]99-110[16,17,26,29,30];多數(shù)學(xué)者使用的是克倫巴赫α信度系數(shù)[1]74[10]99[16]或者項(xiàng)目反應(yīng)理論邊際信度[31],探索性因子和驗(yàn)證性因子驗(yàn)證效度[10]101-102[31]。
大學(xué)生學(xué)業(yè)成就評(píng)估方法通常采用定量方法:根據(jù)信息來源不同,可以分為直接估算法和間接估算法;按照測(cè)評(píng)學(xué)生是否為同一批,可以分為橫向評(píng)估法和縱向評(píng)估法。測(cè)評(píng)的數(shù)據(jù)分析方法也各有不同。
直接和間接估算法。直接估算法,通常采用直接對(duì)比的方法,在大學(xué)入學(xué)時(shí)對(duì)學(xué)生進(jìn)行標(biāo)準(zhǔn)化的測(cè)試,或者在學(xué)生的入學(xué)考試成績(jī)基礎(chǔ)上預(yù)測(cè)大學(xué)學(xué)習(xí)結(jié)果評(píng)估(the Collegiate Learning Assessment,CLA)的成績(jī)作為基礎(chǔ)值,在就讀的某一階段,通常是在學(xué)生畢業(yè)時(shí),進(jìn)行類似測(cè)試以確定結(jié)果,兩個(gè)得分的差異即可視為學(xué)業(yè)成就的提升。國(guó)際上,使用直接估算法的測(cè)評(píng)工具主要有美國(guó)的CAAP、MAPP、CLA及MFT,澳大利亞的GSA等。間接估算法則通過學(xué)生自我匯報(bào)的方法確定學(xué)業(yè)成就提升的程度。國(guó)際上,美國(guó)的NSSE、NSSS、CSEQ、SERU,澳大利亞的CEQ即為代表,國(guó)內(nèi)方面,北大項(xiàng)目、清華的CCSS、北師大的CCSEQ、廈大的NCSS等都屬于自我匯報(bào)法。
橫向和縱向評(píng)估法。橫向評(píng)估法對(duì)一年級(jí)新生和四年級(jí)畢業(yè)生同時(shí)進(jìn)行測(cè)試,入學(xué)新生被視為控制組,其當(dāng)前狀況被近似地等同于現(xiàn)有畢業(yè)生的當(dāng)時(shí)入學(xué)狀況,新生和老生之間的差距就被標(biāo)識(shí)為“大學(xué)在學(xué)生的學(xué)習(xí)經(jīng)驗(yàn)的發(fā)展上所起的作用和作出的貢獻(xiàn)”[12]。這種評(píng)估方式的問題在于,當(dāng)前的新生狀況不能完全地等同于老生入學(xué)時(shí)的基準(zhǔn)狀況,諸如轉(zhuǎn)學(xué)或輟學(xué)學(xué)生、招生標(biāo)準(zhǔn)等因?yàn)闀r(shí)間因素所導(dǎo)致的諸多變化和影響沒有被考慮進(jìn)來。[1]53這種缺陷,可以通過縱向評(píng)估或跟蹤評(píng)估得到很好的解決。縱向評(píng)估被用來測(cè)量同一組學(xué)生在時(shí)間發(fā)展序列上的學(xué)習(xí)結(jié)果變化,這種方式保證了對(duì)入學(xué)時(shí)的各種輸入變量的良好控制,美國(guó)的CAPP、MAPP和CLA即采用此法。[12]構(gòu)建通識(shí)教育的理想教育產(chǎn)出的全美大型質(zhì)量評(píng)估項(xiàng)目(WNSLAE,簡(jiǎn)稱Wabash)[19]和澳大利亞畢業(yè)生收獲調(diào)查(Graduate Outcomes Survey,GOS)亦采用了跟蹤調(diào)查。國(guó)內(nèi)北大項(xiàng)目從2011年也開始加入縱向評(píng)估。[1]72-73盡管如此,縱向評(píng)估仍然因?yàn)槠渫獠凯h(huán)境因素的不可控性、樣本的大幅流失和天花板效應(yīng)等原因存在著一些局限性。[1]53最理想的解決辦法以加拿大青年工作轉(zhuǎn)換調(diào)查(YITS)為代表,選擇一組沒有進(jìn)入大學(xué)的高中畢業(yè)生,他們與進(jìn)入大學(xué)的且接受測(cè)試的學(xué)生群體在個(gè)人特征和學(xué)術(shù)背景上基本相同,并將該組學(xué)生作為控制組進(jìn)行評(píng)估。[12]
數(shù)據(jù)分析的技術(shù)層面,主要有多元線性回歸模型(Multivariable Linear Regression Model,MLRM)和分層線性模型(Hierarchical Linear Model,HLM)。通過多元線性回歸模型得到的殘差值,即是大學(xué)生在一段時(shí)間內(nèi)學(xué)習(xí)進(jìn)步的增值;分層線性模型可以將影響學(xué)生學(xué)業(yè)成果的外部因素(如學(xué)生的學(xué)習(xí)基礎(chǔ)、家庭背景等)與學(xué)?;蚪處煹男?yīng)分離開來,得到學(xué)?;蚪處煹摹皟粜?yīng)”,從而判斷學(xué)校對(duì)學(xué)生的影響力。[32]國(guó)內(nèi)北大項(xiàng)目[33]和清華的CCSS[16]采用的均是多元線性回歸模型。
綜合國(guó)內(nèi)外的測(cè)評(píng)方法,可以將大學(xué)生學(xué)業(yè)成就評(píng)估方法歸納為一個(gè)矩陣(見表2)。國(guó)際上早期處于第二象限、第三象限,但現(xiàn)在測(cè)評(píng)工具多數(shù)處在第一、四象限,不管是直接估算法還是間接估算法的測(cè)評(píng)工具都能很好地實(shí)現(xiàn)跟蹤調(diào)查。而國(guó)內(nèi)主要采用的間接估算法,直接估算法的測(cè)評(píng)工具研發(fā)相對(duì)比較落后,大多數(shù)院校采用的是橫向評(píng)估法,很少能像北大項(xiàng)目和清華CCSS做到長(zhǎng)期跟蹤調(diào)查。因此,我國(guó)大學(xué)生學(xué)業(yè)成就評(píng)估方法應(yīng)該向第一、第四象限努力,如果能夠?qū)⒅苯雍烷g接估算法相結(jié)合并且做到長(zhǎng)期跟蹤,則效果更佳。
表2 大學(xué)生學(xué)業(yè)成就評(píng)價(jià)方法組合一覽表
理論上,大學(xué)生學(xué)業(yè)成就評(píng)估的結(jié)果是用來指導(dǎo)教育教學(xué)改革和實(shí)踐。Astin1985年就談到它的功能:學(xué)生的前測(cè)表現(xiàn)出的優(yōu)缺點(diǎn)可以用來作為學(xué)業(yè)建議和職業(yè)咨詢的依據(jù),后測(cè)中對(duì)學(xué)生成長(zhǎng)的性質(zhì)和程度也可以為學(xué)生、教師和管理者所用。[13]61對(duì)于學(xué)業(yè)成就評(píng)估結(jié)果的使用可以從教育行政管理、學(xué)校(含教師)和學(xué)生三個(gè)角度分別闡述。
國(guó)際上,對(duì)于教育行政管理而言,教學(xué)行政部門可以通過CSEQ對(duì)學(xué)校常模的分析,把握學(xué)校的實(shí)際教學(xué)狀況,為高校教育質(zhì)量的評(píng)估、認(rèn)證奠定現(xiàn)實(shí)基礎(chǔ),并從根本上提高對(duì)高校教學(xué)質(zhì)量干預(yù)的科學(xué)性。[10]84這種“干預(yù)”在有些國(guó)家是作為資源分配的依據(jù),如澳大利亞政府通過CEQ結(jié)果對(duì)各個(gè)大學(xué)的教學(xué)質(zhì)量進(jìn)行排名,排名結(jié)果將作為大學(xué)撥款的重要衡量指標(biāo)。[34]美國(guó)的VSA系統(tǒng)得出的學(xué)生們的增值得分可以給參加的學(xué)校進(jìn)行排名[3],其結(jié)果的進(jìn)一步使用由州政府決定。在有些國(guó)家結(jié)果使用卻是間接的,英國(guó)政府盡管會(huì)通過NSS測(cè)評(píng)結(jié)果,掌握高校教學(xué)工作和人才培養(yǎng)的基本情況,并可以此作為對(duì)高校進(jìn)行質(zhì)量問責(zé)的依據(jù),但堅(jiān)持“有限使用”的原則,并不以此來對(duì)高校的教學(xué)工作水平進(jìn)行排序和獎(jiǎng)懲,也不直接以此來干預(yù)高校內(nèi)部的教學(xué)質(zhì)量保障工作。[10]91在學(xué)校方面,對(duì)于美國(guó)的院校,評(píng)價(jià)結(jié)果除了可以衡量?jī)?nèi)部教學(xué)的質(zhì)量并進(jìn)行恰當(dāng)?shù)母深A(yù)外,還可以向認(rèn)證機(jī)構(gòu)表明教學(xué)工作的成效,滿足認(rèn)證的需要。[10]94同時(shí),也可以通過橫向比較和縱向比較,發(fā)現(xiàn)自己多年來的進(jìn)步和問題,以及與同行相比的優(yōu)劣勢(shì),便于更好地自我定位。對(duì)于教師而言,學(xué)生對(duì)教師個(gè)人教學(xué)效果的評(píng)估結(jié)果是保密的,但會(huì)以恰當(dāng)?shù)男问礁嬷處焸€(gè)人,并附以改進(jìn)的意見。[10]87在學(xué)生方面,除了Astin提到的作用外,美國(guó)CSEQ官方認(rèn)為還可以為學(xué)生自我反思和評(píng)價(jià)提供非常有價(jià)值的信息,促使他們思考學(xué)習(xí)的經(jīng)歷及取得的進(jìn)步[10]84;英國(guó)的準(zhǔn)大學(xué)生還可以根據(jù)NSS提供的質(zhì)量信息來選擇高校與專業(yè)[10]91;澳大利亞的GSA給參與評(píng)價(jià)學(xué)生求職時(shí)提供其課程申請(qǐng)簡(jiǎn)歷與GSA得分,提供評(píng)估院校新生識(shí)別和研究生增值信息。[1]52
相比較而言,國(guó)內(nèi)大學(xué)生學(xué)業(yè)成就評(píng)估結(jié)果使用的系統(tǒng)性研究較少。即使產(chǎn)生的影響也是以學(xué)校和學(xué)生為主。與美國(guó)大學(xué)生學(xué)業(yè)成就評(píng)估結(jié)果可以滿足認(rèn)證的需要不同,在中國(guó)對(duì)于高校的這種制度性的內(nèi)部動(dòng)力并不存在,不過審核性評(píng)估為此類似的動(dòng)力提供了可能性。①來源:2018年6月4日與北京某地方院校教務(wù)處J老師面對(duì)面交流。將本科教學(xué)評(píng)估結(jié)果與大學(xué)的資源分配相掛鉤的方法在國(guó)內(nèi)一般而言屬于政府主導(dǎo)的教育教學(xué)評(píng)估的功能范疇,而非民間發(fā)起的大學(xué)生學(xué)業(yè)成就評(píng)估項(xiàng)目。再者,有些項(xiàng)目負(fù)責(zé)人明確表態(tài)需要抵擋住排名的誘惑和弊端,否則數(shù)據(jù)的真實(shí)性將會(huì)大打折扣。②來源:該觀點(diǎn)來源于某項(xiàng)目負(fù)責(zé)人于2018年2017—2018年度第二學(xué)期研究生課堂。一般而言,國(guó)內(nèi)的大學(xué)生學(xué)業(yè)項(xiàng)目的研究結(jié)果使用一般交給參與項(xiàng)目的院校自主處理。對(duì)于學(xué)校而言,理論上可以從學(xué)生個(gè)體層面監(jiān)控、保障教學(xué)質(zhì)量,還可以根據(jù)需要形成院系、年級(jí)、專業(yè)等類別的常模,把握各院系、年級(jí)、專業(yè)的學(xué)生整體的學(xué)習(xí)的動(dòng)態(tài)變化,有針對(duì)性地改進(jìn)教學(xué),不斷提高教學(xué)質(zhì)量。[10]84而實(shí)際上,有關(guān)大學(xué)生學(xué)業(yè)成就評(píng)估結(jié)果對(duì)于學(xué)校的發(fā)展和教師的教學(xué)如何影響的研究鳳毛麟角。清華大學(xué)的CCSS研究發(fā)現(xiàn),清華教師對(duì)學(xué)生的支持度不夠,建立了學(xué)生輔導(dǎo)中心,參與CCSS項(xiàng)目的一些院校也存在類似的問題,也建立了相應(yīng)的機(jī)構(gòu);從學(xué)生的滿意度也可以看到學(xué)生對(duì)教學(xué)、環(huán)境等方面的精準(zhǔn)需求。③來源:2017年12月25日與清華大學(xué)CCSS項(xiàng)目組成員T老師面對(duì)面訪談。也有研究表明,南京大學(xué)將SERU評(píng)估工作作為“三三制”教學(xué)改革的三駕馬車之一。[35]其項(xiàng)目介紹人所言,SERU項(xiàng)目扮演了孵化器的角色,引發(fā)了一系列類似的實(shí)證調(diào)研,逐漸在該大學(xué)形成了證據(jù)文化。④來源:2018年5月26日與南京大學(xué)呂林海教授面對(duì)面訪談,經(jīng)他本人同意實(shí)名觀點(diǎn)引用。然而,對(duì)于參與這些大學(xué)生學(xué)業(yè)成就項(xiàng)目的院校而言,對(duì)于評(píng)估結(jié)果的重視程度本身也存在差異。有項(xiàng)目負(fù)責(zé)人言:“有的加盟院校只是派一名輔導(dǎo)員來領(lǐng)取報(bào)告,相關(guān)的一些說明和注意事項(xiàng)回去傳達(dá),僅有個(gè)別院校邀請(qǐng)我們?nèi)ソo所有學(xué)工部門的領(lǐng)導(dǎo)和人員宣講和解釋,或者在新教師培訓(xùn)上講講。”⑤來源:2017年5月18日對(duì)國(guó)內(nèi)某測(cè)評(píng)工具聯(lián)盟研究項(xiàng)目負(fù)責(zé)人面對(duì)面訪談。對(duì)于學(xué)生而言,像國(guó)外大學(xué)學(xué)業(yè)成就評(píng)估信息作為學(xué)生選擇大學(xué)、就業(yè)或繼續(xù)升學(xué)方面的功能尚未在國(guó)內(nèi)已有研究中發(fā)現(xiàn)。他們?cè)诖髮W(xué)生學(xué)業(yè)成就評(píng)估中的角色僅限于填寫問卷提供自己的個(gè)人信息,至于個(gè)人的實(shí)際調(diào)研結(jié)果到底意味著什么很難得知。很多時(shí)候,大學(xué)生學(xué)業(yè)成就評(píng)估結(jié)果可以確定在少數(shù)部門、少數(shù)群體內(nèi)部共享,而對(duì)于到底如何影響了本科教育教學(xué)改革,可以說是一個(gè)黑箱。“國(guó)際上的測(cè)評(píng)工具由于校領(lǐng)導(dǎo)和教務(wù)處領(lǐng)導(dǎo)主推,評(píng)價(jià)結(jié)果得以抵達(dá)院系主管教學(xué)副院長(zhǎng),具體這份報(bào)告發(fā)揮了怎樣的作用,就不得而知?!雹迊碓矗?017年2月15日對(duì)某C9院校教務(wù)處老師的面對(duì)面訪談。
首先是標(biāo)準(zhǔn)化問題,盡管現(xiàn)在在大陸涌現(xiàn)出豐富多彩的基于學(xué)業(yè)成就評(píng)估理念的測(cè)評(píng)工具,北大、清華這些著名高校所負(fù)責(zé)的測(cè)評(píng)項(xiàng)目也帶領(lǐng)著一部分高校在搜集橫向和縱向的數(shù)據(jù),形成常模,對(duì)于各自學(xué)校來說,也或多或少都有積極的影響。但問題在于,研發(fā)測(cè)評(píng)工具需要非常強(qiáng)的專業(yè)性,而且周期很長(zhǎng),即便高校自己可以解決這個(gè)問題。[4]82完全自主設(shè)計(jì)的測(cè)評(píng)工具可以反映院校具體的課程重點(diǎn)和前瞻性風(fēng)格,卻更容易變化或缺乏穩(wěn)定性[13]71,而且無法形成校際、省際、國(guó)際之間的比較。因?yàn)楦髯砸罁?jù)的理論框架不同,甚至沒有理論框架,最后的數(shù)據(jù)結(jié)果只能在本校進(jìn)行分析,無法在同類學(xué)校之間形成比較。如此學(xué)校就沒法定位自己在推動(dòng)學(xué)生學(xué)業(yè)成就提升方面究竟處于怎樣的位置,如同大海里的小船,一旦沒有燈塔,很容易在劇烈的高等教育改革大潮中迷失方向,失去機(jī)會(huì)(美國(guó)、韓國(guó)、日本有相關(guān)的法律要求,也許可以借鑒)。其次是本土化的問題,慶幸的是早已有研究者意識(shí)到測(cè)評(píng)工具的本土化問題,并且傾向于先引進(jìn)后本土開發(fā)。[12]清華、南大分別在NSSE和SERU基礎(chǔ)上進(jìn)行改進(jìn)或微調(diào),前者還增加了畢業(yè)生的跟蹤調(diào)查。廈大、中山大學(xué)主要是自主開發(fā)工具,而北大的首都高校教學(xué)質(zhì)量與學(xué)生發(fā)展評(píng)價(jià)項(xiàng)目兼顧了本土化和國(guó)際化的雙重特征。再次是單一化問題,即測(cè)評(píng)工具選擇單一化,如未參加國(guó)內(nèi)幾大測(cè)評(píng)工具聯(lián)盟的院校僅選擇自己開發(fā)的工具,或者即便是選擇了國(guó)際化的測(cè)評(píng)工具,也存在的問題在于每個(gè)測(cè)評(píng)工具都有不同的側(cè)重點(diǎn),如NSSE和Wabash項(xiàng)目比較傾向于通識(shí)教育,而澳大利亞的CEQ和OECD主導(dǎo)的AHELO比較全面。如果使用商用評(píng)估工具或研究協(xié)會(huì)開發(fā)的調(diào)查工具,優(yōu)點(diǎn)在于使用的院校可以獲得運(yùn)用校內(nèi)自行開發(fā)工具所不能得到的“常模數(shù)據(jù)”,從而使得同類院校的比較研究成為可能;缺點(diǎn)在于,大多數(shù)這類調(diào)查問卷為了使用的廣泛性而削足適履,不能評(píng)估那些源于本校學(xué)生所在的特定環(huán)境中產(chǎn)生的、為他們所獨(dú)有的經(jīng)驗(yàn)。[4]82比較理想化的方法是,選擇至少兩種測(cè)評(píng)工具。參與美國(guó)Wabash項(xiàng)目的成員學(xué)校學(xué)生除了填寫該項(xiàng)目的調(diào)查外,還被要求填寫NSSE和CESQ的問卷,這將大學(xué)教育產(chǎn)出的測(cè)量和學(xué)生學(xué)習(xí)過程的測(cè)量緊密地結(jié)合在一起。[19]
然而,在工具的選擇上面,無論選擇哪種方案,院校都需要明白測(cè)評(píng)的共性和個(gè)性相結(jié)合的問題,前者傾向于通過院校聯(lián)盟的方式采用同一種測(cè)評(píng)工具,而后者則針對(duì)本校特色的校本測(cè)評(píng)工具。當(dāng)然,也可以選擇一些比較靈活的測(cè)評(píng)項(xiàng)目,如美國(guó)考試中心和教育考試服務(wù)中心,一般同一份工具可以包括共性的問題和學(xué)校自己增加的問題[6]77-80,可以同時(shí)實(shí)現(xiàn)測(cè)評(píng)共性問題和學(xué)校的特色的目的。國(guó)內(nèi)也開始出現(xiàn)一種模式,即參與北大項(xiàng)目的院??梢赃x擇除了參與統(tǒng)一的測(cè)評(píng)外,還可以委托項(xiàng)目組提供“定制服務(wù)”,目前已有兩所院校進(jìn)行了實(shí)踐。①來源:2018年5月29日,北京大學(xué)“全國(guó)高校教學(xué)質(zhì)量與學(xué)生發(fā)展監(jiān)測(cè)項(xiàng)目”項(xiàng)目推進(jìn)會(huì)上的案例介紹。
直接估算法和間接估算法各有優(yōu)缺點(diǎn),目前國(guó)內(nèi)的問題在于集中在使用間接估算法,即依靠自我匯報(bào)法獲得數(shù)據(jù),這種方法適用于非認(rèn)知變量的測(cè)量,但對(duì)于認(rèn)知能力的測(cè)量則需要直接估算法,如美國(guó)的CAAP、MAPP測(cè)量的通識(shí)能力。估算法的選擇背后是評(píng)估內(nèi)容的選擇,這是理論的本土化問題。[36]選擇間接估算法意味著認(rèn)知變量無法很好地兼顧,對(duì)于測(cè)量學(xué)生學(xué)業(yè)成就來說是不全面的。
而在橫向評(píng)價(jià)法和縱向評(píng)價(jià)法或跟蹤評(píng)價(jià)法中,很顯然縱向評(píng)價(jià)法對(duì)于同一組學(xué)生的測(cè)評(píng)能夠控制可能影響學(xué)業(yè)成就提升的輸入變量,可以更好地解釋增量。也就是說,多數(shù)的研究使用的是截面數(shù)據(jù),而非面板數(shù)據(jù)。橫向評(píng)價(jià)法的局限是只能進(jìn)行學(xué)生發(fā)展的描述性分析和解釋性調(diào)查研究,無法動(dòng)態(tài)地探究高校人才培養(yǎng)質(zhì)量與學(xué)生發(fā)展的變化趨勢(shì)和因果關(guān)系,也無法充分考慮高校學(xué)生在不同學(xué)年過程中的發(fā)展和行為特性等。[1]72選擇橫向和縱向評(píng)價(jià)法的差異核心在于,研究者認(rèn)為不同時(shí)期學(xué)生的特征是否一樣。美國(guó)幾十年的CIRP項(xiàng)目研究證明,“不同時(shí)期學(xué)生的特征是有差異的”[13]68-69。國(guó)內(nèi)測(cè)評(píng)方法比較顯著的問題,在于主要實(shí)施橫向評(píng)價(jià)法,原因可能在于跟蹤研究(follow-up studies)的難度較大和樣本丟失問題。然而,如果不是建立在面板數(shù)據(jù)的分析基礎(chǔ)上,所謂的縱向比較難以經(jīng)得住考驗(yàn)。學(xué)校決策者就沒法獲得確切的證據(jù)來了解自己的本科教育是否獲得了進(jìn)步以及獲得了多大的進(jìn)步,因?yàn)檠芯拷Y(jié)果無法剝離學(xué)生群體之間的能力差異。
在選擇學(xué)業(yè)成就評(píng)估方法的同時(shí),還需要注意到周期和質(zhì)性證據(jù)兩個(gè)問題。周期問題就是一個(gè)測(cè)評(píng)工具需要選擇高年級(jí)學(xué)生和畢業(yè)生校友進(jìn)行測(cè)評(píng),上文已經(jīng)提及,實(shí)際上取決于研究者對(duì)于學(xué)業(yè)成就內(nèi)容的時(shí)間維度的把握。國(guó)內(nèi)大學(xué)對(duì)于學(xué)生的就業(yè)率和就業(yè)待遇非常關(guān)注,但對(duì)于學(xué)生的學(xué)業(yè)成就提升或增值和畢業(yè)后續(xù)的發(fā)展關(guān)注是較少的。像Pascarella和Terenzini提及的對(duì)于學(xué)生的終身學(xué)習(xí)、下一代子女影響等[37]78-110幾乎沒有關(guān)注。而質(zhì)性證據(jù)問題,則在于證據(jù)是通過量表、問卷還是訪談等質(zhì)性研究方法搜集數(shù)據(jù)。在與N大學(xué)教務(wù)處工作人員訪談中,他坦承現(xiàn)在教育質(zhì)量的評(píng)價(jià)看到的都是數(shù)據(jù)分析的圖表,缺乏了對(duì)活生生的學(xué)生的關(guān)注和了解,應(yīng)該去課堂上看看教師是如何教的,學(xué)生是如何反應(yīng)的。①來源:2017年2月15日對(duì)某C9院校教務(wù)處人員的面對(duì)面訪談。“質(zhì)量問題不應(yīng)通過使用許多量化的目標(biāo)來回避,否則會(huì)導(dǎo)致更大的風(fēng)險(xiǎn)。評(píng)估僅僅基于數(shù)量和特征的描述,將意味著對(duì)質(zhì)量的追求只是實(shí)現(xiàn)正確的數(shù)字?!保?8]“也許是最令人不安的事實(shí)是,在我們的調(diào)查中,幾乎有一半(48%)的大學(xué)生說,他們感到他們所在的學(xué)校對(duì)待他們像書本上的數(shù)字一樣?!保?9]258這段來自學(xué)生的沮喪的體驗(yàn)不只是說定量研究方法的局限,更重要的是提醒我們質(zhì)性研究更具有人情味,學(xué)生能夠感覺到來自學(xué)校實(shí)實(shí)在在的關(guān)心。而這個(gè)關(guān)心則是多重意義的,將會(huì)決定著他們對(duì)學(xué)校的滿意度。[40]閻光才認(rèn)為,將定量研究和定性研究等多種研究方法結(jié)合在一起,可以更大程度上緩解單個(gè)方法帶來的偏誤。[41]
上文提及的國(guó)內(nèi)大學(xué)生學(xué)業(yè)成就評(píng)估使用的情況主要渠道來自中國(guó)大學(xué)生學(xué)業(yè)成就評(píng)估項(xiàng)目的負(fù)責(zé)人或參與成員,來自參與項(xiàng)目成員院校的第一手信息則較為罕見?;氐阶罨镜膯栴}是,這個(gè)結(jié)果到底是如何使用信息,我們根本不得而知。關(guān)于質(zhì)量的信息應(yīng)該對(duì)公眾開放到何種程度?[6]前言2這個(gè)問題是有爭(zhēng)議的。然而,國(guó)內(nèi)有的院??赡苓€停留在“信息是否公開”的問題上??梢哉f評(píng)價(jià)結(jié)果使用幾乎是黑箱。中國(guó)大學(xué)生學(xué)業(yè)成就評(píng)估項(xiàng)目負(fù)責(zé)方通過無償或有償?shù)姆绞綖閰⑴c院校撰寫調(diào)研報(bào)告供其推進(jìn)本科教育教學(xué)改革作為參考,是否使用以及如何使用完全取決于院校自身,這是市場(chǎng)所決定的。誠(chéng)如上文從訪談中得知參與院校對(duì)于評(píng)估結(jié)果的態(tài)度有天壤之別。因此,可以說,不只是評(píng)價(jià)結(jié)果是否到達(dá)院級(jí)二級(jí)單位,而是在學(xué)校層面是否很好地接受和消化的問題。也就是說,測(cè)評(píng)工具的功能使用面臨虛化和懸置的尷尬境地。另一個(gè)問題是,問卷調(diào)查是為教育教學(xué)改革服務(wù),但實(shí)際情況可能恰恰相反,“某些決策者不是通過調(diào)查以及由此得來的數(shù)據(jù)來了解學(xué)校的總體情況和學(xué)生對(duì)于學(xué)校運(yùn)作的基本看法和評(píng)價(jià),而是將調(diào)查當(dāng)成是一種應(yīng)急的工具”[4]34。
為什么學(xué)業(yè)成就評(píng)估結(jié)果使用處于黑箱?可能存在以下幾個(gè)原因:第一,傳統(tǒng)公立院校的絕大多數(shù)經(jīng)費(fèi)來自中央部委或地方政府,故由上級(jí)管理部門發(fā)起的評(píng)價(jià),不管是否喜歡,要拿到資源就必須按照教育質(zhì)量評(píng)價(jià)的一套制度來辦學(xué),資源依賴?yán)碚摚≧esource dependence theory)[42]已經(jīng)能支撐這個(gè)觀點(diǎn),顯然,學(xué)業(yè)成就評(píng)估的實(shí)施并不能幫助學(xué)校直接獲得經(jīng)費(fèi),反而要使用經(jīng)費(fèi)。第二,評(píng)估屬于部門發(fā)起者“自導(dǎo)自演”,未能調(diào)動(dòng)全員。收益沒有考慮清楚,學(xué)業(yè)成就評(píng)估往往成為學(xué)校本科教育質(zhì)量成績(jī)的依據(jù),而不是促進(jìn)教育教學(xué)質(zhì)量的工具,目的和手段本末倒置。師生未能充分地參與,學(xué)生參與的形式停留在填寫問卷和提交問卷上,甚至都無法獲知自己填寫的結(jié)果到底意味著什么。從組織層面來說,院系作為學(xué)校的二級(jí)單位,也是被動(dòng)參與自我評(píng)價(jià)。參與評(píng)價(jià)主體缺失嚴(yán)重的表現(xiàn)之一還在于,教師沒有參與到測(cè)評(píng)工具的開發(fā)和完善中來,如商用測(cè)評(píng)工具關(guān)注的通識(shí)教育是否是教師認(rèn)為的呢?[4]52第三,院校的學(xué)業(yè)成就評(píng)價(jià)并未成為常規(guī)的本科教育質(zhì)量的活動(dòng),往往與學(xué)校分管領(lǐng)導(dǎo)的喜好有關(guān),帶有一定的偶然性,上級(jí)決策層覺得很重要,那對(duì)于結(jié)果相對(duì)重視,即便如此,信息公開非常有限,特別是如果結(jié)果不利于學(xué)校聲譽(yù),那更難對(duì)公眾開放結(jié)果。第四,就國(guó)內(nèi)而言,政府有自己的一套評(píng)價(jià)制度,而學(xué)校發(fā)起學(xué)業(yè)成就評(píng)估并非是自下而上“倒逼”所致,而是研究范式與國(guó)際接軌所致,我們政府的問責(zé)和公眾的問責(zé)尚屬于“同床異夢(mèng)”,或者說,政府問責(zé)是強(qiáng)勢(shì),而公眾問責(zé)是弱勢(shì),而強(qiáng)勢(shì)一方對(duì)于學(xué)業(yè)成就評(píng)價(jià)還不能真正用于其重大決策,其質(zhì)量評(píng)價(jià)實(shí)際上還停留在所歸納的“四種傳統(tǒng)質(zhì)量觀”(“基于聲望的質(zhì)量觀”、“基于資源的質(zhì)量觀”、“基于結(jié)果的質(zhì)量觀”和“基于教育內(nèi)容的質(zhì)量觀”)[13]xii-xii。簡(jiǎn)言之,國(guó)內(nèi)這類評(píng)價(jià)結(jié)果使用缺乏強(qiáng)有力的內(nèi)在動(dòng)力。
除了上面討論的學(xué)業(yè)成就評(píng)估工具、評(píng)估測(cè)評(píng)方法的選擇與使用、評(píng)價(jià)結(jié)果使用等方面的問題以外,評(píng)估團(tuán)隊(duì)的專業(yè)化[18,43]等問題也是需要院校推進(jìn)和解決的實(shí)際問題。
盡管學(xué)界對(duì)于學(xué)業(yè)成就評(píng)估有這樣或那樣的批評(píng),但退一步講,學(xué)業(yè)成就評(píng)估已經(jīng)是國(guó)際上發(fā)達(dá)國(guó)家非常認(rèn)可的質(zhì)量問責(zé)的途徑,我們的任務(wù)在于如何讓它更好地服務(wù)于提高國(guó)內(nèi)的本科教育質(zhì)量,而非躲躲閃閃、閃爍其詞。目前由北大、清華、南大、廈大等高校發(fā)起的評(píng)價(jià)聯(lián)盟已經(jīng)讓人們看到了更大進(jìn)步和更多希望,初步形成了北大模式、清華模式、南大模式、廈大模式和校本模式,究竟其各個(gè)模式特征如何有待進(jìn)一步研究。筆者提出如下未來需要努力的方向。
上文討論的評(píng)估內(nèi)容、評(píng)估方法、工具選擇與使用,以及結(jié)果使用都屬于學(xué)業(yè)成就評(píng)估制度的內(nèi)部組成部分,未來院校還需要將這些組成部分通過系統(tǒng)的方式有機(jī)地形成一個(gè)整體。澳大利亞從2015年開始進(jìn)行了一系列的調(diào)整,將原來相對(duì)分散的測(cè)評(píng)工具通過QILT的項(xiàng)目方式聯(lián)系在一起來綜合衡量學(xué)生學(xué)業(yè)成就。也就是說,澳大利亞高校的質(zhì)量保障形成了“組合拳”,其理念是教育增值。國(guó)內(nèi)大學(xué)將學(xué)業(yè)成就評(píng)價(jià)作為單項(xiàng)或?qū)m?xiàng)的本科教育質(zhì)量評(píng)價(jià),已經(jīng)遠(yuǎn)遠(yuǎn)不夠。
對(duì)過去二十年間的評(píng)估實(shí)踐略加考察我們便會(huì)發(fā)現(xiàn),高校評(píng)估所面臨的問題遠(yuǎn)不是挑選一兩個(gè)評(píng)估工具或創(chuàng)建一個(gè)數(shù)據(jù)庫(kù)就能解決的,高校必須首先在更深的層面上回答傳統(tǒng)范式和新范式之間的爭(zhēng)論和整合問題。傳統(tǒng)的質(zhì)量保障環(huán)節(jié)看起來是閉環(huán)管理,但信息完全的假設(shè)是不成立的,導(dǎo)致結(jié)果不是“O”型,而是“C”型。程星提出的新范式是“三級(jí)金字塔”[4]54-55:
(1)對(duì)直接參與教學(xué)活動(dòng)的團(tuán)體負(fù)責(zé),負(fù)責(zé)將學(xué)生學(xué)習(xí)的成果交代清楚;(2)對(duì)直接和間接支付教育費(fèi)用的團(tuán)體負(fù)責(zé),負(fù)責(zé)將他們投資高等教育所能得到的回報(bào)交代清楚;(3)對(duì)直接和間接管理與規(guī)范高等教育的團(tuán)體負(fù)責(zé),負(fù)責(zé)將高校的社會(huì)效益交代清楚。在這個(gè)三級(jí)范式中,評(píng)估活動(dòng)根據(jù)信息接收端的需求展開,并且上一級(jí)的評(píng)估總是建立在下一級(jí)評(píng)估所提供的信息基礎(chǔ)之上。
該新的范式最大的進(jìn)步是利益相關(guān)者理念再次得到體現(xiàn)。然而,根據(jù)對(duì)我國(guó)特有文化的了解,傳統(tǒng)范式和新范式都面臨信息公開的問題。將學(xué)業(yè)成就評(píng)價(jià)結(jié)果等信息對(duì)公眾公開估計(jì)還需要漫長(zhǎng)的道路,當(dāng)前比較有希望實(shí)現(xiàn)的則是“內(nèi)部科學(xué)有效使用”。在筆者看來,這種新范式的形成還需要漫長(zhǎng)的過程,比較務(wù)實(shí)的做法還是傾向于在傳統(tǒng)范式上的微調(diào),尤其是通過立法對(duì)于信息的公開進(jìn)一步推進(jìn)。時(shí)機(jī)成熟再考慮向程星所提倡的新范式過渡。
評(píng)估的多元化包括兩種情況,一種是我們需要采用多元化的測(cè)評(píng)工具,典型的澳大利亞的學(xué)習(xí)與教學(xué)質(zhì)量指標(biāo)(QILT)包括學(xué)生經(jīng)歷調(diào)查(SES)、畢業(yè)生雇傭(GOS)、畢業(yè)生滿意度(CEQ)和雇主滿意度(ESS①全稱Employer Satisfaction Survey,通過對(duì)畢業(yè)生雇主的訪談獲得畢業(yè)生的表現(xiàn)情況,詳見https://www.qilt.edu.au/aboutthis-site/employer-satisfaction,2017年5月23日搜索。)來綜合衡量學(xué)生學(xué)業(yè)成就。另一種是指學(xué)業(yè)成就評(píng)估和其他學(xué)習(xí)結(jié)果評(píng)價(jià)結(jié)合使用形成的更大結(jié)構(gòu)的多元化。盡管我們討論了學(xué)業(yè)成就評(píng)估的種種優(yōu)點(diǎn),但并非否定傳統(tǒng)的結(jié)果評(píng)價(jià)的方式,如學(xué)業(yè)成績(jī)、畢業(yè)率、就業(yè)指標(biāo)等[4]88,這些多元的指標(biāo)在評(píng)價(jià)內(nèi)容的探討部分已經(jīng)可見一斑。當(dāng)然,需要提醒的是,關(guān)于學(xué)習(xí)結(jié)果評(píng)價(jià)數(shù)據(jù)的統(tǒng)一性(和真實(shí)性),我國(guó)高等教育主管部門則需要努力改進(jìn)。否則省際、校際之間就無法實(shí)現(xiàn)比較,也就失去在橫向和縱向比較中進(jìn)步的機(jī)會(huì)。在數(shù)據(jù)端口的統(tǒng)一性方面,美國(guó)的做法值得借鑒,如美國(guó)高等教育委員會(huì)向大學(xué)推薦CLA和NSSE兩個(gè)測(cè)量工具[4]43,自愿問責(zé)系統(tǒng)(VSA)允許參與的院校使用ETS成績(jī)包、CAAP和CLA三種測(cè)量工具[3]。尤其需要注意的是,高校如何向相關(guān)利益群體證明數(shù)據(jù)的真實(shí)性和可靠性,也是另一個(gè)令人頭疼的問題。①筆者曾經(jīng)負(fù)責(zé)的一個(gè)學(xué)校管理服務(wù)學(xué)生滿意度調(diào)查,分析數(shù)據(jù)發(fā)現(xiàn)某個(gè)學(xué)院的得分普遍非常高,其他所有學(xué)院與之相差一大截,說明學(xué)生填寫時(shí)出現(xiàn)了“干擾”。類似的問題,章建石在其著作《基于學(xué)生增值發(fā)展的教學(xué)質(zhì)量評(píng)價(jià)與保障研究》第92頁(yè)中也提到英國(guó)某大學(xué)老師引導(dǎo)學(xué)生打高分。
所謂元評(píng)價(jià)(meta-evaluation),就是對(duì)現(xiàn)有評(píng)價(jià)的評(píng)價(jià),即“按照一定的理論框架和價(jià)值標(biāo)準(zhǔn)對(duì)教育評(píng)價(jià)所進(jìn)行的評(píng)價(jià)”[10]153。“國(guó)內(nèi)做學(xué)業(yè)成就評(píng)價(jià)已經(jīng)做了很多年,研究成果也那么多了,那么效果到底怎么樣?還是需要有相關(guān)研究關(guān)注?!雹趤碓矗?017年5月18日對(duì)北京大學(xué)教育學(xué)院M老師的面對(duì)面訪談。通過評(píng)估才能發(fā)現(xiàn)現(xiàn)有的評(píng)價(jià)哪些部分是值得保留的,哪些是需要改進(jìn)的。如英國(guó)高等教育研究院組織專家于2006年年底對(duì)質(zhì)量信息收集工具——NSS的影響和成效進(jìn)行評(píng)估。其評(píng)估結(jié)果既認(rèn)可了調(diào)查本身對(duì)于高校教育質(zhì)量保障的作用,也發(fā)現(xiàn)在行動(dòng)方面真正付諸實(shí)施的高校也不多。[10]92國(guó)內(nèi)的學(xué)業(yè)成就評(píng)估可以評(píng)價(jià)結(jié)果使用的跟蹤作為起點(diǎn),搞清楚結(jié)果是如何被學(xué)校和二級(jí)單位使用的,在實(shí)際的整改方案中是否體現(xiàn)了專家組的意見。在一定時(shí)期內(nèi),通過一定的評(píng)價(jià)標(biāo)準(zhǔn)或工具來評(píng)價(jià)整改的效能。
謝立中歸納了四種社會(huì)科學(xué)本土化類型,即對(duì)象轉(zhuǎn)換型本土化、補(bǔ)充—修正—?jiǎng)?chuàng)新型本土化、理論替代型本土化和理論方法、全面替代型本土化,這里的分類只是事實(shí)判斷,并無價(jià)值判斷。[44]所幸,我國(guó)的專家學(xué)者早已認(rèn)識(shí)到本土化的重要性[1]73,北大項(xiàng)目、清華的CCSS、廈大的NCSS等項(xiàng)目測(cè)評(píng)工具方面的本土化則可見一斑。早期參與北大項(xiàng)目的盧曉東研究員的觀點(diǎn)則具有代表性:“中國(guó)和國(guó)外的教育發(fā)展階段不一樣,所以國(guó)外的大學(xué)問題有些和中國(guó)不是一回事。所以這些量表也不可能問的是中國(guó)的問題。評(píng)估量表應(yīng)該問中國(guó)的問題,反映教育管理人員、教師和學(xué)生的問題,應(yīng)該用中國(guó)的教學(xué)管理老師、教學(xué)老師和學(xué)生的話來編制,框架可以借鑒,必須本土化?!雹蹃碓矗?017年11月15日對(duì)北京大學(xué)教育學(xué)院盧曉東老師的面對(duì)面訪談,經(jīng)他本人同意實(shí)名觀點(diǎn)引用。目前,中國(guó)大學(xué)生學(xué)業(yè)成就評(píng)估的對(duì)象轉(zhuǎn)換型本土化、補(bǔ)充—修正—?jiǎng)?chuàng)新型本土化形式已經(jīng)基本實(shí)現(xiàn),第三種有關(guān)理論方面的本土化,則處于較為緩慢的階段,主要還是借助于西方的院校影響力理論,但這也是最難的,需要一個(gè)發(fā)展的過程。我國(guó)高等教育進(jìn)入后大眾化發(fā)展階段中,涌現(xiàn)出很多特有的現(xiàn)象和問題,需要更具有解釋力的本土理論指導(dǎo)實(shí)踐,以學(xué)業(yè)成就評(píng)估為契機(jī)提高我國(guó)高等教育的競(jìng)爭(zhēng)力。
評(píng)價(jià)部門人員的專業(yè)化是院校開展包括學(xué)業(yè)成就評(píng)估在內(nèi)的各種評(píng)價(jià)活動(dòng)的基本性前提,盡管如今的社會(huì)機(jī)構(gòu)測(cè)評(píng)比較成熟,但院校自身應(yīng)該有專門的研究人員能夠甑別工具的優(yōu)劣,能夠解讀最終的結(jié)果,并能夠深入淺出,說服相關(guān)高校決策層重視學(xué)業(yè)成就評(píng)估的作用,推動(dòng)該評(píng)估在本科教育質(zhì)量保障過程中的功能發(fā)揮。
蘇州大學(xué)學(xué)報(bào)(教育科學(xué)版)2018年3期