隨著知識經(jīng)濟時代的到來,國力競爭越來越突出地表現(xiàn)為科學技術(shù)競爭和人才競爭,因此,關(guān)系到國民科技素養(yǎng)水平以及國家創(chuàng)新能力的科學教育引起了各國的高度重視。各國政府在繼續(xù)加強本國科學教育的同時,也在審視之前的相關(guān)政策和措施是否收到了預期的效果。
世界經(jīng)濟合作與發(fā)展組織(以下簡稱世界經(jīng)合發(fā)展組織)的國際學生測評項目(The Programme for International Student Assessment)于2007年12月4日公布了其測評結(jié)果。該測評在2006年進行,涵蓋了包括世界經(jīng)合發(fā)展組織成員國在內(nèi)的57個國家和地區(qū)的40萬名學生,測評結(jié)果代表2 000萬名15歲學生的情況,此次國際學生測評項目的過程和結(jié)果對我們了解參與國家和地區(qū)科學教育的現(xiàn)狀和存在的問題,對于比照已有經(jīng)驗和教訓改進中國的科學教育,都具有比較重要的意義。
一、國際學生測評項目的有關(guān)背景
國際學生測評項目由世界經(jīng)合發(fā)展組織發(fā)起并組織實施,每隔三年對成員國及有興趣參與的國家和地區(qū)的15歲學生進行一次知識和技能的問卷調(diào)查和測評,就某一學科收集來自學生、家庭和學校各方面的信息資料,在了解學生對學科知識掌握程度的基礎(chǔ)上,解釋學生成績?yōu)槭裁磿霈F(xiàn)差異,并由有經(jīng)驗的專家來進行有效的跨國和跨文化的比較研究。
國際學生測評項目的測評規(guī)模和內(nèi)容以及要采集的背景信息全部由參與國家和地區(qū)的專家們討論決定,測評的總體方向則由各參與國家和地區(qū)的政府在共同利益和政策導向的基礎(chǔ)上共同把握。由于測評涉及到語言文化迥異的許多國家和地區(qū),因此在測評材料方面要做很多努力來達成文化和語言方面的包容與平衡,并在翻譯、抽樣和資料收集過程中輔以嚴格的質(zhì)量保障機制,從而保證國際學生測評項目的結(jié)果有效和可靠。迄今為止,國際學生測評項目已經(jīng)在2000年、2003年和2006年進行過三次,測評重點分別是閱讀、數(shù)學和科學,三次測評分別有28個、41個和57個國家和地區(qū)參加。這幾次測評的結(jié)果及研究顯著地增強了對世界上經(jīng)濟最發(fā)達國家以及處于經(jīng)濟發(fā)展初期的國家和地區(qū)的教育成績的了解,有效地達到了預計的目標。相同學科的測評還會在2009年、2012年和2015年再次進行,以便能繼續(xù)連貫地監(jiān)測教育成績,并對各個國家和地區(qū)中不同教育系統(tǒng)的質(zhì)量、公平性和效率給出評價。
在進行教育成績測評的同時,國際學生測評項目還根據(jù)參與國家和地區(qū)的需要開發(fā)新的測評方法和工具,不僅包括收集詳細的教育政策與實踐的信息,還包括利用以計算機為基礎(chǔ)的測評方法,在測評學生的信息與通訊技術(shù)技能的同時,測評更廣范圍內(nèi)學生知識和技能的互動能力。
除了測評知識和技能之間的相關(guān)性,即學生依據(jù)所學知識進行推斷的能力,以及在各種情況下提出、解決和闡釋問題的分析能力以外,國際學生測評項目的另一個鮮明特點是其設(shè)計和報告方法都緊密圍繞影響教育政策和實踐的目標進行,而非簡單隨意的成績測評。由于測評內(nèi)容注重內(nèi)在規(guī)律性,各參與國可以根據(jù)其他國家的成績來監(jiān)測本國教育成果的改進。國際學生測評項目最近十分注意吸收終身教育的理念和內(nèi)容,使參與的國家和地區(qū)不僅能了解學生掌握的知識和技能,而且能在一定程度上了解學生的學習動機、各自的信仰,以及對所學知識的態(tài)度。因此,該測評得到越來越多國家和地區(qū)的響應和參與,其涵蓋范圍逐年擴大,參加2006年國際學生測評項目的國家和地區(qū)已經(jīng)達到57個。中國香港、中國澳門和中國臺北地區(qū)參與了2006年的測評,而且成績在各參與國家和地區(qū)中名列前茅。
二、2006年測評的總體情況
2006年的國際學生測評項目測評重點是科學教育,旨在獲得學生科學課成績的詳細資料,并了解學生學習科學課的態(tài)度,了解學生在多大程度上意識到具備科學能力有助于把握生活中的很多機會,以及他們所在的學校提供的科學學習機會和環(huán)境。2006年共抽取57個國家和地區(qū)的40萬名學生參加了測評,結(jié)果代表著2 000萬名15歲學生的情況。
2006年國際學生測評項目測評的具體方式包括兩個小時的開放式問題和多重選擇題目,此外,學生還填寫了有關(guān)本人情況的問卷,校長填寫了有關(guān)學校情況的問卷,有16個國家的家長填寫了家長問卷,說明了對孩子教育的投資情況,并表達了對有關(guān)科學問題和就業(yè)問題的看法。2006年國際學生測評項目還測試了學校環(huán)境、教學和學生使用計算機的情況,以及家長對于學生和學校的看法。除了重點測評科學知識和技能以外,閱讀和數(shù)學也在測試范圍之內(nèi)。
1. 科學知識和技能得分
在2006年國際學生測評項目科學知識和能力測評中,學生平均分位居榜首的國家是芬蘭,得分高達563分;加拿大、日本、新西蘭、中國香港、中國臺北和愛沙尼亞緊隨其后,得分在530~542分之間;澳大利亞、荷蘭、韓國、德國、英國、捷克、瑞士、奧地利、比利時、冰島、列支敦士登、斯洛文尼亞和中國澳門學生的平均成績也都超過了世界經(jīng)合發(fā)展組織國家的平均分(500分)。
此次國際學生測評項目科學量表的能力級別共分為六級,其中,六級是最高能力級別,達到這一級別的學生能在各種復雜的生活場景中始終一貫地定義、解釋和應用科學知識以及有關(guān)知識。世界經(jīng)合發(fā)展組織國家15歲的學生中有1.3%達到了六級標準。其中,新西蘭和芬蘭各有3.9%的學生達到了六級標準,英國、澳大利亞、日本、加拿大、列支敦士登、斯洛文尼亞和中國香港也各有2%~3%的學生達到六級標準,都高于世界經(jīng)合發(fā)展組織國家的平均水平。世界經(jīng)合發(fā)展組織國家達到五級標準的學生比例為9%,其中,芬蘭和新西蘭以21%和18%的比例遙遙領(lǐng)先,日本、澳大利亞、加拿大、中國香港和中國臺北也以14%~16%的比例遠遠超出世界經(jīng)合發(fā)展組織國家的平均水平。相反,有15個國家和地區(qū)達到五級和六級的學生比例不到1%,有25個國家達到這兩級的學生比例不足5%。
此次測評的二級標準要求學生能夠記住簡單的科學概念,能運用數(shù)據(jù)表格表現(xiàn)科學實驗結(jié)果。一般認為,只有達到二級標準的學生才開始具備積極參加與科技相關(guān)的日?;顒拥目茖W能力。世界經(jīng)合發(fā)展組織國家中,有19.2%的學生成績在二級以下,5.2%的學生成績沒有達到一級。
與顯現(xiàn)出顯著性別差異的閱讀和數(shù)學測評成績截然不同,絕大多數(shù)世界經(jīng)合發(fā)展組織國家學生的總體科學成績并沒有顯現(xiàn)出性別差異。在大多數(shù)國家,女生在“定義科學事項”方面的能力要強一些,而男生在“科學地解釋現(xiàn)象”方面的能力更勝一籌。進入成績高、學術(shù)性軌道或?qū)W校的多是女生而不是男生。也就是說,盡管在總體上并不明顯,但許多國家在學校層面或?qū)W科層面還是呈現(xiàn)出科學知識和技能的性別差異。
此次測評結(jié)果顯示出下面兩條規(guī)律:第一,科學成績達到六級水平的學生數(shù)量與該國學生的整體成績并不存在必然的正相關(guān)關(guān)系。例如韓國處于國際學生測評項目科學成績高的國家之列,平均分為522分,而美國的分數(shù)為489分,在世界經(jīng)合發(fā)展組織國家的平均分之下,但是,美國和韓國達到六級水平的學生比例卻相差無幾。第二,國家的大小和15歲學生的國際學生測評項目平均成績沒有任何關(guān)系。
測評同時分析了造成學生成績差異的原因。在世界經(jīng)合發(fā)展組織國家中,學生成績的差異約有1/3是由學校條件差異造成的。德國和保加利亞的學生成績因?qū)W校條件不同而產(chǎn)生的差異最大,為世界經(jīng)合發(fā)展組織平均水平的兩倍,捷克共和國、奧地利、匈牙利、荷蘭、比利時、日本、意大利、斯洛文尼亞、阿根廷和智利的學生成績因?qū)W校條件不同而產(chǎn)生的差異為世界經(jīng)合發(fā)展組織平均水平的一倍多。瑞典、波蘭、西班牙、丹麥、冰島、挪威、拉脫維亞和愛沙尼亞的學生成績與其就讀的學校關(guān)系不大,芬蘭表現(xiàn)尤其突出,全部學生成績差異只有不到5%是由學校差異造成的,換言之,芬蘭的各個學校在科學教育方面發(fā)展均衡,學校系統(tǒng)有著高效和統(tǒng)一的標準,學校之間鮮有差異。
學生的社會、經(jīng)濟背景差異也是造成學校差異并進而影響學生成績的重要因素之一。在一些國家,學生的家庭背景在很大程度上造成了校際差異乃至科學成績差異,如美國、捷克共和國、盧森堡、比利時、斯洛伐克共和國、德國、希臘、新西蘭、保加利亞、智利、阿根廷和烏拉圭都是如此。在另一些國家,學生的家庭背景對成績差異的影響低于10%,如在科學課平均分超過530分的成績最高的7個國家中,芬蘭、加拿大、日本、中國香港和愛沙尼亞的學生家庭背景都對其成績影響微乎其微,展示了質(zhì)量與公平兼得的案例。
2. 學生對科學的態(tài)度
在國際學生測評項目中,學生對于科學的態(tài)度,以及是否意識到掌握科學會有助于把握生活中的很多機會一直是測評學生個人科學能力的一個重要方面。此次測評主要以問卷的形式收集了學生對科學調(diào)查(scientific enquiry)的支持、對學習科學的自信、對科學的興趣以及對資源和環(huán)境的責任意識等方面的信息。
在對科學調(diào)查的支持方面,學生普遍認同科學的重要性,但對科學與自身生活的關(guān)系以及科學帶來的社會效益認識不足。調(diào)查結(jié)果顯示,93%的學生認為科學對于理解自然世界至關(guān)重要,92%的學生認為在科技方面領(lǐng)先通常能改善人們的生活條件,75%的學生認為科學有助于理解周邊事務(wù),但只有57%的學生認為科學與他們的個人生活密切相關(guān)。在對科學會產(chǎn)生廣泛的社會效益方面,學生的認同度更是大幅度減少,世界經(jīng)合發(fā)展組織國家中,25%的學生(在愛爾蘭和丹麥,這個比例高達40%)不同意這一陳述:科學進步通常帶來社會效益。在韓國、泰國、中國香港、中國澳門和中國臺北,同意該陳述的學生比例卻高于90%。
在對學習科學的自信度方面,大多數(shù)學生表示能完成一些科學任務(wù),例如在世界經(jīng)合發(fā)展組織國家中,有76%的學生表示他們能夠解釋地震發(fā)生的原因,有64%的學生表示能夠預測環(huán)境的變化會給某些物種的生存帶來哪些影響,但這個比例存在地區(qū)差異。只有47%的學生認為學校的科學課程很容易。
問卷中設(shè)計了有關(guān)科學能力的問題來了解學生能否有效處理問題并克服困難,還設(shè)計了有關(guān)科學概念的問題來了解學生的學術(shù)能力。在前一個方面,波蘭、美國、加拿大、葡萄牙和約旦等國學生的能力最高,日本、韓國、意大利、印度尼西亞、阿塞拜疆和羅馬尼亞等國的學生能力最低。問卷結(jié)果表明,學生有效處理問題并克服困難的能力與學業(yè)成績有著密切的關(guān)系,但是成績最好的學生并不必然是能力最強的學生。
大多數(shù)學生報告說他們愿意學習科學,但只有很少學生對與科學有關(guān)系的職業(yè)感興趣:72%的學生認為學好科學課對他們很重要;67%的學生表示他們樂于學到新的科學知識;56%的學生認為科學對自己有用處;但只有37%的人表示他們想從事與科學有關(guān)的職業(yè),21%的人愿意終身研究先進科學。此外,只有21%的學生定期觀看科學類的電視節(jié)目,13%的學生經(jīng)常瀏覽科學網(wǎng)站,8%的學生經(jīng)常借閱科學類書籍。在每個國家中,那些喜歡學習科學的學生常常會取得較高的科學課成績。測評還發(fā)現(xiàn),學生對科學的興趣受家庭因素影響很大,家庭社會經(jīng)濟背景較好的學生更容易對科學感興趣,愛爾蘭、法國、比利時和瑞士的學生在這方面表現(xiàn)最為突出。父母從事科學職業(yè)的孩子中有1/3的人表示以后也會從事與科學有關(guān)的職業(yè)。
對國際學生測評項目結(jié)果的研究發(fā)現(xiàn),科學成績好的學生通常對環(huán)境問題更為關(guān)心,對環(huán)境的未來也更為悲觀。在世界經(jīng)合發(fā)展組織國家中,平均有73%的學生意識到了砍伐森林的后果,58%的學生意識到大氣層中的溫室氣體正在增加;35%的學生意識到了轉(zhuǎn)基因產(chǎn)品的用途。同時,學生們對自然環(huán)境的未來有一定程度的悲觀情緒。在世界經(jīng)合發(fā)展組織國家中,平均只有21%的學生認為能源短缺的問題將在未來20年內(nèi)得到改善;認為水資源匱乏、空氣污染、核浪費、動植物的滅絕和砍伐森林等問題能夠在未來20年內(nèi)得到解決的學生比例分別為18%、16%、15%、14%和13%。
在科學態(tài)度方面,性別之間的差異各國不盡相同,有些國家?guī)缀鯖]有差異,而德國、愛爾蘭、日本、韓國、荷蘭、英國、中國臺北、中國香港和澳門的學生在科學態(tài)度方面呈現(xiàn)出特別顯著的性別差異,男生的科學態(tài)度在至少五個方面表現(xiàn)出比女生更為積極的特征。國際學生測評項目態(tài)度測試中,最大的性別差異表現(xiàn)在學生的學術(shù)能力即對科學的自我概念方面。30個世界經(jīng)合發(fā)展組織國家中,有22個國家的男生認為自己的科學能力強,這個比例明顯高于女生。
3. 閱讀成績
盡管不是測評的主要內(nèi)容,閱讀也是2006年的國際學生測評項目的一個組成部分。測評結(jié)果顯示,韓國學生以556分高居榜首,芬蘭學生以547分緊隨其后,中國香港學生以536分位居第三。除了上述三個國家和地區(qū),加拿大和新西蘭學生的表現(xiàn)也不錯,平均閱讀分數(shù)在520分~530分之間。此外,愛爾蘭、澳大利亞、波蘭、瑞典、荷蘭、比利時和瑞士,以及列支敦士登、愛沙尼亞和斯洛文尼亞等國學生的閱讀平均分都顯著高于世界經(jīng)合發(fā)展組織的平均分492分。
與科學成績不同,閱讀成績的性別差異最為顯著。2006年的國際學生測評項目的閱讀測評中,所有世界經(jīng)合發(fā)展組織國家的女生平均成績都要好于男生,有12個國家男女學生的分數(shù)差異在50分以上。希臘和芬蘭的女生成績分別高出男生57分和51分,在卡塔爾、保加利亞、約旦、泰國、阿根廷、斯洛文尼亞、列支敦士登、塔吉克斯坦、拉脫維亞和克羅地亞,女生和男生的分數(shù)相差高達50分~66分。
閱讀測評是2000年國際學生測評項目的測評重點,2006年國際學生測評項目的成績提供了與2000年成績進行對比的條件。世界經(jīng)合發(fā)展組織國家的國際學生測評項目閱讀成績在2000年和2006年基本持平,如果結(jié)合2000年至2006年世界經(jīng)合發(fā)展組織國家教育經(jīng)費顯著增加的背景來看,這個成績不是十分令人滿意。在閱讀方面,韓國和波蘭的成績有顯著提高。韓國2006年的國際學生測評項目閱讀成績比2000年提高了31分;波蘭主要通過提高低端人群的成績來提高平均成績。和自身相比,下列國家和地區(qū)在2000年至2006年之間閱讀成績有了顯著提高;智利、列支敦士登、印度尼西亞、拉脫維亞,中國香港。與此同時,有9個世界經(jīng)合發(fā)展組織國家的學生在測評項目的閱讀成績中比2000年有所下降,它們是西班牙、日本、愛爾蘭、挪威、意大利、法國、澳大利亞、瑞士和墨西哥。其他參與國家和地區(qū)中,阿根廷、羅馬尼亞、保加利亞、俄國和泰國學生的閱讀成績也低于2000年的水平。
4. 數(shù)學成績
在2006年的測評中,芬蘭、韓國、中國臺北和中國香港的學生表現(xiàn)最為優(yōu)異。荷蘭、瑞士、加拿大、日本、新西蘭、比利時、澳大利亞、丹麥、捷克共和國、愛爾蘭、奧地利、中國澳門、列支敦士登、愛沙尼亞和斯洛文尼亞的學生的表現(xiàn)也不錯,數(shù)學平均得分明顯高于世界經(jīng)合發(fā)展組織國家學生的平均分。
如果用六個能力等級衡量,在世界經(jīng)合發(fā)展組織國家平均只有13%的學生達到五級和六級的情況下,中國臺北、韓國各有32%和27%的學生達到了最高兩個能力等級,芬蘭、瑞士、比利時和荷蘭達到最高兩個能力等級的學生也都超過了20%。芬蘭、韓國、中國香港達到二級標準的學生比例超過90%,世界經(jīng)合發(fā)展組織國家除了墨西哥、土耳其、意大利和葡萄牙之外,達到二級標準的學生比例也達到了70%。
和自己2003年的成績相比,下列四國學生的數(shù)學成績有了顯著提高:墨西哥、希臘、印度尼西亞、巴西。與此同時,下列國家學生在2006年測評項目中數(shù)學成績顯著下降:法國、日本、愛爾蘭、比利時、列支敦士登。
數(shù)學成績的性別差異介于科學成績和閱讀成績之間,而且與2003年相比沒有變化。
5. 學校因素對學生成績的影響
前面提到,家庭因素和學校因素是影響學生學業(yè)成績的兩個主要因素。2006年國際學生測評項目比較詳細地分析了學校層面的因素,審視了學校在招生、選拔和分班,學校管理和撥款,父母壓力和選擇,問責政策,學校自主權(quán)和學校資源等方面的政策和實踐,試圖從學校和制度層面上分析如何能夠有效提高學生的學習成績并減少社會經(jīng)濟背景對學生的影響。
對測評結(jié)果的分析顯示,學生成績與下列因素有關(guān):第一,分班標準。在多數(shù)國家實行就近入學的情況下,有27%的世界經(jīng)合發(fā)展組織國家的15歲學生是按學業(yè)成績由學校錄取的,有的是按所有學科成績分班,更多的是按某些學科的成績分班。按所有學科成績分班的學生成績比沒有實行能力分班或按照某些學科成績分班的學生成績要低4.5分。第二,錄取標準。對照發(fā)現(xiàn),在根據(jù)學生學業(yè)成績或輸送學校推薦來錄取學生的學校中,學生學業(yè)成績比其他學校的成績高14.4分;也就是說,在按學業(yè)成績招生的學校就讀的學生成績要好一些。第三,是否公布學生成績。數(shù)據(jù)顯示,在其他條件相同的情況下,公布學生成績的學校,其學生成績要比不公布的學校高3.5分。第四,學生用于學習的時間。學生每周在學校多花一個小時上課,成sIx0N8C7Q3yJGbWoq0KaLg==績要高出8.8分;多花一個小時自習,成績要高出3.1分。第五,學校是否舉辦提高學生科學學習能力的相關(guān)活動。每個單元的活動平均會將學生的成績提高2.9分。第六,學校的自治程度。在經(jīng)費自治的學校中,學生成績比非自治學校學生高出25.7分。第七,政府撥款數(shù)額的多寡。公共經(jīng)費增加10%,學生的平均分提高2分。第八,是否有其他學校競爭學生。如果在同一地區(qū)有兩所以上的學校競爭生源,那么學生成績要高出6分。第九,是否缺乏合格教師。學校該指數(shù)每增加一個單位,學生分數(shù)就要降低3.5分。第十,教育資源的質(zhì)量。該指數(shù)每增加一個單位,學生的成績要高3.9分。分析表明,世界經(jīng)合發(fā)展組織國家學生成績的差別中有三分之一是由以上各因素造成的。值得注意的是,上述因素不是單獨發(fā)揮作用,而往往是兩個以上的因素同時發(fā)揮作用,進而對學生成績產(chǎn)生影響。
三、2006年國際學生測評項目科學知識和技能測評的啟示
閱讀和數(shù)學一直是所有國家義務(wù)教育階段的主要學科,成為國際學生測評項目2000年和2003年的測評重點理所當然??茖W測評成為第三次大規(guī)模國際學生測評項目的主題,反映了科學知識和技能的重要性以及人們在經(jīng)濟發(fā)展依賴科技進步的當代社會對科學教育的日益關(guān)注和重視。
在國際學生測評項目選擇科學課作為測評重點的同時,其他國家的研究人員也在積極關(guān)注科學教育。最近,挪威研究人員對20個國家的中學生進行了有關(guān)科學教育的調(diào)查,了解學生對科學教育相關(guān)性的認識和對科學教育的喜歡程度。調(diào)查發(fā)現(xiàn),中學生對科學感興趣的程度與所在國家的經(jīng)濟發(fā)展水平呈現(xiàn)明顯的負相關(guān),也就是說,發(fā)達國家的學生更傾向于在大學階段選擇社會科學和人文科學,而不是科學和工程學。這一現(xiàn)象已經(jīng)引起了有關(guān)政策研究人員的擔心和焦慮。
對于我國在新一輪的課程改革中將小學一、二年級原有的自然課改為科學課的做法,一些資深教育家已經(jīng)表達了自己的擔憂。希望本文介紹的2006年的國際學生測評項目測評情況會給中國的教育政策制定者和教育工作者提供一個新的視角,以便全面思考科學教育在整個教育體系中的定位,以及在科教興國、建設(shè)創(chuàng)新型國家中的作用,并進一步思考如何從改進教師質(zhì)量等環(huán)節(jié)入手,改進中國的科學教育課程,使越來越多的學生具有科學素養(yǎng),使更多的科技拔尖人才能夠從中國的科學教育課堂上脫穎而出。
參考資料
1 OECD. PISA2006,Science Competencies for Tomorrow’s World
2 Alex Usher. Smarten Up!,EPI’s Week in Review.2008.1.25
3 韋鈺.從PISA2006年對科學教育的評測看科學教育的評測問題,http://www.handsbrain.com/weiyu/entry/266277
(作者單位:教育部教育發(fā)展研究中心)
責任編輯 鄧明茜