伍亞婷 解凱彬*
摘 要 本研究是在江蘇省實(shí)施新課程改革6年的背景下,針對(duì)目前實(shí)行的生物學(xué)業(yè)水平測試與生物新課程標(biāo)準(zhǔn)的一致性關(guān)系,采用美國學(xué)者波特(Porter)于2002年提出的二維矩陣法,對(duì)江蘇省2007~2013年的生物學(xué)業(yè)水平測試試卷從內(nèi)容主題與認(rèn)知層次兩個(gè)維度進(jìn)行了數(shù)據(jù)統(tǒng)計(jì)和量化分析。結(jié)果顯示六份試卷中有四份與新課標(biāo)之間存在統(tǒng)計(jì)學(xué)意義上顯著的一致性,另外兩份試卷雖然一致性系數(shù)沒有達(dá)到課標(biāo)規(guī)定的標(biāo)準(zhǔn),但其一致性也比較高。同時(shí)也從一致性、內(nèi)容主題、認(rèn)知水平這三方面出發(fā),對(duì)當(dāng)前的江蘇省學(xué)業(yè)水平測試這個(gè)評(píng)價(jià)體系所值得肯定和仍需要改進(jìn)的地方進(jìn)行了思考和反思。
關(guān)鍵詞 學(xué)業(yè)水平測試 一致性 內(nèi)容主題 認(rèn)知水平
中圖分類號(hào) G633.91 文獻(xiàn)標(biāo)識(shí)碼 B
1 研究過程
1.1 內(nèi)容與認(rèn)知水平的分類
首先是采用波特(2002)的通用編碼框架——“內(nèi)容×認(rèn)知”水平矩陣來對(duì)高中生物課程標(biāo)準(zhǔn)和生物學(xué)科學(xué)業(yè)水平測試卷進(jìn)行編碼。編碼之前,筆者首先對(duì)內(nèi)容和認(rèn)知水平進(jìn)行分類。對(duì)內(nèi)容的分類是采用美國各州首席教育官員委員會(huì)(CCSSO,2004)發(fā)展起來的課程調(diào)查規(guī)范(ESC)中關(guān)于生物學(xué)科內(nèi)容的分類標(biāo)準(zhǔn),但是由于學(xué)業(yè)水平測試只涉及必修的內(nèi)容,而“科學(xué)與技術(shù)”這一內(nèi)容包含在選修模塊,所以本研究在內(nèi)容上分為9類,分別為:
① 生命系統(tǒng)的組成;② 生物化學(xué);③ 植物學(xué);④ 動(dòng)物學(xué);⑤ 人體生物學(xué);⑥ 遺傳學(xué);⑦ 進(jìn)化;⑧ 生殖與發(fā)育;⑨ 生態(tài)學(xué)。
認(rèn)知水平的分類依據(jù)布盧姆教育目標(biāo)分類學(xué)修訂版,將認(rèn)知分為記憶、理解、應(yīng)用、分析、評(píng)價(jià)和創(chuàng)造六級(jí)水平。
1.2 內(nèi)容與認(rèn)知水平的編碼
根據(jù)以上分類將高中課程標(biāo)準(zhǔn)、2007~2013年的生物學(xué)業(yè)水平測試卷進(jìn)行內(nèi)容和認(rèn)知水平通過9×6(對(duì)應(yīng)9個(gè)內(nèi)容分類和6個(gè)認(rèn)知水平分類)的矩陣表格對(duì)應(yīng)內(nèi)容和認(rèn)知水平按照考點(diǎn)分?jǐn)?shù)比例標(biāo)準(zhǔn)化之后進(jìn)行編碼。關(guān)于課程標(biāo)準(zhǔn)的編碼(具體編碼結(jié)果參照劉恩山等人的成果)最終編碼數(shù)據(jù)見表1。
本過程為了確保精確性和科學(xué)性,由1位生物學(xué)教育副教授、16位生物學(xué)科教學(xué)專業(yè)碩士研究生和3位本科生。編碼者對(duì)7份試卷獨(dú)立進(jìn)行編碼后對(duì)存在的分歧點(diǎn)一一討論,得到最終的編碼數(shù)據(jù)見表2(其余年份的編碼過程與此類似,比例不同,結(jié)果在圖1、2中呈現(xiàn))。
1.3 求解具有統(tǒng)計(jì)顯著性的P值
筆者采用了美國學(xué)者Gavin的思路,利用matlab軟件里的unidmd函數(shù),將69個(gè)具體內(nèi)容標(biāo)準(zhǔn)隨機(jī)賦值到一個(gè)9行6列的矩陣中,將試卷總分100分隨機(jī)賦值到另一個(gè)矩陣中,對(duì)兩個(gè)矩陣標(biāo)準(zhǔn)化處理后計(jì)算出一個(gè)P值,將這樣的過程重復(fù)20 000次,就可以得到關(guān)于P的正態(tài)分布(表3)。
江蘇省生物學(xué)業(yè)水平測試卷面總分為100分,在這個(gè)正態(tài)分布曲線中,要達(dá)到0.05水平的統(tǒng)計(jì)顯著性,則需要P≥0.6408。
1.4 計(jì)算波特一致性系數(shù)
本研究采用美國學(xué)者波特于2002年提出的二維矩陣法,即從內(nèi)容匹配和認(rèn)知程度匹配兩個(gè)維度來檢驗(yàn)內(nèi)容標(biāo)準(zhǔn)和測驗(yàn)項(xiàng)目之間的一致性。
為了研究高中生物課程標(biāo)準(zhǔn)和生物學(xué)業(yè)水平測試試卷之間的一致性,將課程標(biāo)準(zhǔn)和考試題用相同的方法分別編碼到一個(gè)內(nèi)容×認(rèn)知的二維矩陣中,任意兩者之間的一致性就是以兩個(gè)矩形表格中的單元格賦值為依據(jù)進(jìn)行計(jì)算。為使表格兩兩之間具有可比性,單元格賦值在統(tǒng)計(jì)結(jié)果的基礎(chǔ)上需要被標(biāo)準(zhǔn)化處理,即被轉(zhuǎn)換成總和是1的比值。運(yùn)用波特一致性系數(shù)定量計(jì)算內(nèi)容標(biāo)準(zhǔn)和測試題的一致性程度。
運(yùn)用如下公式分別求得每份試卷與課程標(biāo)準(zhǔn)的波特一致性系數(shù),此時(shí)n=54。
其中,n表示矩陣中的單元格數(shù)目,i表示其中一個(gè)特定的單元,其數(shù)值從1取到n。波特系數(shù)P的數(shù)值介于0和1之間,當(dāng)P=0時(shí)表示兩者間的差異性最大,當(dāng)P=1時(shí)表示比較的兩組數(shù)間具有完美的一致性。
2 研究結(jié)果與數(shù)據(jù)分析
2.1 一致性比較
由表4可以看出,將2007~2013年的江蘇省生物學(xué)業(yè)水平測試試卷和課程標(biāo)準(zhǔn)的一致性系數(shù)與95%水平的P值參考值作比較,發(fā)現(xiàn)除了2007年和2010年的P值略低于參考值P值外,其余五年的P值都大于參考值。
2.2 7年學(xué)測試卷內(nèi)容主題與課程標(biāo)準(zhǔn)分布的比較
在內(nèi)容主題維度上對(duì)生物課程標(biāo)準(zhǔn)和江蘇省六份生物學(xué)業(yè)水平測試卷進(jìn)行的比較如圖1所示。從圖中可以看出,高中生物課程標(biāo)準(zhǔn)在“生命系統(tǒng)組成”、“遺傳學(xué)”、“生態(tài)學(xué)”與“生物化學(xué)”主題上著墨較多。而這幾個(gè)主題在六份學(xué)測試卷中的表現(xiàn)分析如下:對(duì)于“生命系統(tǒng)組成”這一主題,江蘇省2011年生物學(xué)業(yè)水平測試卷與高中生物課程標(biāo)準(zhǔn)差距是最小的,其余5年的試卷則在這一內(nèi)容上明顯低于課標(biāo)的要求;對(duì)于“遺傳學(xué)”這一主題,從圖中可以看出,2007年和2012年的江蘇學(xué)測試卷中這一內(nèi)容的比重都明顯高于課標(biāo)的要求;而在“生態(tài)學(xué)”這一內(nèi)容主題上,除了2008年的內(nèi)容比重略低于課標(biāo)要求外,其他五年的試卷內(nèi)容分布基本上都大于課程標(biāo)準(zhǔn)的要求;最后 “生物化學(xué)”部分尤以2009年最突出,遠(yuǎn)遠(yuǎn)超過了課程標(biāo)準(zhǔn)的要求,2012年的試卷與課標(biāo)基本持平,其余四年的江蘇省生物學(xué)測試卷都不同程度高于課標(biāo)要求;同時(shí)從圖中還可以看出對(duì)于其他五個(gè)內(nèi)容主題,有的高于課標(biāo),有的卻低于課標(biāo)要求,沒有什么規(guī)律可循。
2.3 7年學(xué)測試卷認(rèn)知水平與課程標(biāo)準(zhǔn)分布的比較
在認(rèn)知水平維度上對(duì)生物課程標(biāo)準(zhǔn)和兩份試卷進(jìn)行的比較如圖2所示。從圖2中可以發(fā)現(xiàn)無論是7年的江蘇省生物學(xué)測試卷,還是生物課程標(biāo)準(zhǔn)90%以上都是以理解和記憶水平為主。但值得注意的是,對(duì)于記憶這一認(rèn)知要求,7年的試卷一律都高于課程標(biāo)準(zhǔn)的要求,但對(duì)于理解這一認(rèn)知水平,7年的試卷竟然無一例外都沒有達(dá)到課標(biāo)的要求。對(duì)于其他四個(gè)認(rèn)知水平,無論是課標(biāo)還是7年的試卷考查的都相對(duì)較少,其中2008年的學(xué)測試卷對(duì)運(yùn)用水平的分析遠(yuǎn)遠(yuǎn)高于課標(biāo),分析水平的考查在2007、2008、2010、2011、2012年的試卷中均有體現(xiàn),至于評(píng)價(jià)和創(chuàng)造,有些年份的試卷也有一定程度的涉及,并且都高于課標(biāo)的要求。
3 結(jié)論與思考
3.1 一致性系數(shù)
從表4可以看出,除了2007年和2010年的學(xué)測試卷與95%水平的參照值0.6408稍有偏差之外,其余5年的江蘇生物學(xué)測試卷都與課程標(biāo)準(zhǔn)有統(tǒng)計(jì)學(xué)意義上顯著的一致性。這是江蘇省積極響應(yīng)新課改實(shí)施以來基礎(chǔ)教育考試改革的一個(gè)很好的證明。眾所周知,學(xué)業(yè)水平測試是基于國家課程標(biāo)準(zhǔn)的“標(biāo)準(zhǔn)參照考試”,課程標(biāo)準(zhǔn)是由教育部直接制定的,而學(xué)業(yè)水平測試則是由各個(gè)省市依據(jù)國家課程標(biāo)準(zhǔn)獨(dú)立執(zhí)行,因此對(duì)于學(xué)業(yè)水平測試各個(gè)環(huán)節(jié)性質(zhì)的不同理解都可能導(dǎo)致最后的命題結(jié)果與課程標(biāo)準(zhǔn)出現(xiàn)一定的偏頗,所以說,江蘇省的學(xué)業(yè)水平測試從量化的一致性系數(shù)這個(gè)分析層面上來說,做得還是比較成功的,達(dá)到了國家課程標(biāo)準(zhǔn)的要求,沒有違背國家開展基礎(chǔ)教育考試的初衷。
本篇論文是采用量化的方式分析7年的學(xué)測試題與課程標(biāo)準(zhǔn)之間在內(nèi)容主題和認(rèn)知水平上的一致性程度,雖然最后的結(jié)果比較理想,一份試卷在確定給學(xué)生使用之前,就應(yīng)該先去分析它的一致性,這樣才能及時(shí)發(fā)現(xiàn)問題,調(diào)整命題方向。因此這一環(huán)節(jié)應(yīng)該被推廣到試題的命制上,引起廣大命題專家的重視,這樣對(duì)江蘇省學(xué)業(yè)水平測試的功能定向、考試建模、命題機(jī)制的專業(yè)化都是有益的。
3.2 內(nèi)容主題
對(duì)于九大內(nèi)容主題,其中有六項(xiàng)內(nèi)容(生命系統(tǒng)組成、植物學(xué)、人體生物學(xué)、生態(tài)學(xué)、遺傳學(xué)、生物化學(xué))在7年的試題中的比重都不同程度超過了課標(biāo)的要求,至于其他三項(xiàng)內(nèi)容,雖然有些年份的試卷沒有達(dá)到課標(biāo)的要求,可是并沒有出現(xiàn)很大的差距,也就是說江蘇省學(xué)業(yè)水平測試的命題在內(nèi)容上與課標(biāo)的要求具有顯著的一致性。這種一致性對(duì)于江蘇生物新課程的實(shí)施會(huì)產(chǎn)生積極的影響。因?yàn)樵嚲韮?nèi)容主題的分布合理與否,會(huì)直接影響到廣大一線教師在課堂上如何選擇教學(xué)內(nèi)容,如何合理分配不同生物教學(xué)內(nèi)容在課堂上的比重。
雖然整體上可以看出九大內(nèi)容主題分布的趨勢(shì)和課標(biāo)基本保持一致,可是具體到每一份試卷來說,無論是同一內(nèi)容在不同年份試卷的比例還是同一份試卷對(duì)于九大內(nèi)容主題比重的安排上都有很強(qiáng)的隨機(jī)性,根本毫無規(guī)律可循。如“生物化學(xué)”這一內(nèi)容,課標(biāo)的要求是10%,可是從2007年~2013年的學(xué)測試卷對(duì)內(nèi)容的把握卻大相徑庭,雖然都達(dá)到了要求,可是有的年份持平,有的超過課標(biāo)10%,有的甚至是課標(biāo)要求的兩倍還多,如此高的內(nèi)容比重,難免會(huì)影響學(xué)業(yè)水平測試中對(duì)其他知識(shí)點(diǎn)的把握和考查,這些都暴露出當(dāng)前江蘇省學(xué)業(yè)水平測試在對(duì)考試性質(zhì)定位、命題機(jī)制的完善、評(píng)價(jià)體系的理解等等上都是需要進(jìn)一步反思和改進(jìn)的。
3.3 認(rèn)知水平
從圖表可以看出7年的試卷和課標(biāo)都將考查的認(rèn)知重點(diǎn)放在了記憶和理解這兩個(gè)水平上,但是具體到每一份試卷上也是有很多問題:7年的試卷在記憶水平上都超過課標(biāo)的要求,而在理解水平上卻無一例外都低于其考查標(biāo)準(zhǔn);同時(shí)在對(duì)較高的認(rèn)知水平的考查上,多份試卷的比重都超過課標(biāo)要求;不同內(nèi)容考查的認(rèn)知水平和課標(biāo)有出入,如課標(biāo)對(duì)“生物化學(xué)”的考察主要體現(xiàn)在理解水平上,可是從7年的試卷中可以看到,大部分都是有關(guān)生化記憶性知識(shí)的測試……以上諸多問題都反映出當(dāng)前江蘇省學(xué)業(yè)水平測試這個(gè)評(píng)價(jià)體系存在的種種缺陷,這些問題的出現(xiàn)都是對(duì)推行新課標(biāo)不利的,一味地降低或者提高試題的難度都是與國家推行新課標(biāo)的初衷是相違背的,因此無論是從宏觀上的國家考試制度的規(guī)范和立法、地方考試組織管理、評(píng)價(jià)體系的改善,還是具體到各級(jí)考試管理機(jī)構(gòu)、命題機(jī)構(gòu)、教育單位對(duì)于新課程改革的理解、對(duì)于基礎(chǔ)教育的重視程度、對(duì)課標(biāo)的解讀都是需要進(jìn)一步完善的。
總之,以上只是基于對(duì)江蘇省2007年~2013年的學(xué)測試卷的量化分析得到的一些啟示和思考,實(shí)際上一套完善、成功的評(píng)價(jià)體系是否能夠順利建立受到很多方面因素的制約和影響的,只有全社會(huì)認(rèn)識(shí)到學(xué)業(yè)水平測試對(duì)我國的基礎(chǔ)教育和高等教育的重要性,才能最終真正讓學(xué)業(yè)水平測試發(fā)揮它的高效功用和潛力、才能讓基礎(chǔ)教育真正發(fā)揮它督促學(xué)校認(rèn)真執(zhí)行課程方案和課程標(biāo)準(zhǔn),規(guī)范高中教育教學(xué)行為,提高學(xué)校教育教學(xué)質(zhì)量以及促進(jìn)中學(xué)生全面發(fā)展的重要作用。
參考文獻(xiàn):
[1] CCSSO,Surveys of Enacted Curriculum,2004. http://www.ccsso.org/projects/Surveys_of_Enacted_Curriculum/.
[2] 劉恩山.盧群.張穎之,2010年高考生物試卷與課程標(biāo)準(zhǔn)一致性分析[J].基礎(chǔ)教育課程,2010:61-67.
[3] Qun Lu & Enshan Liu (2012): Alignment between High School Biology Curriculum Standard and the standardised tests of four provinces in China, Journal of Biological Education, DOI:10.1080/00219266.2011.645855.
[4] X.F.liu,B.H.Zhang,L.L.Ling,Gavin Fulmer,Beaumie Kim,H.Q.Yuan.Allgnment Between the Physics Content Standard and the Standardized Test: A Comparison Among the United States-New York State,Singapore,and China-Jiangsu. Science Education .2008, 93(5):777-797.
[5] Porter,A,C,Measuring the content of instruction: Uses in research and practice. Educational Researcher, 2002.31(7):3-1.