李忠堂++閻智力++張磊
摘 要:在我國,《國家學生體質(zhì)健康標準》測試正扮演著“高利害測驗項目”的角色。國家,各級教育、體育行政部門,學校,校長,教師,學生等作為測試的利害相關(guān)者,其利害性卻不一致。從利害所指對象與利害性來看,測試結(jié)果對于學生本人而言是“個體的利害”,表現(xiàn)為“無關(guān)緊要”;對于學校、校長、教師而言是“團體的利害”,表現(xiàn)為“隔靴撓癢”;而對于國家、社會而言則是“社會的利害”,測試結(jié)果對國家、社會而言意義重大,其利害性也最為重要。當前,測試仍存在公平性與有效性問題。其公平性問題主要表現(xiàn)在“以形式的平等掩蓋了事實上的不平等”以及以教育結(jié)果公平表征教育公平等兩個方面。測試的有效性問題則主要表現(xiàn)為測試分數(shù)的可信度、測試者的內(nèi)部信度、測量工具與測量結(jié)果之間的可信度問題。
關(guān) 鍵 詞:學校體育;國家學生體質(zhì)健康標準;高利害測驗項目;體質(zhì)健康標準測評
中圖分類號:G807 文獻標志碼:A 文章編號:1006-7116(2015)04-0089-06
A study of the fairness and effectiveness of evaluation by
National Student Physical Health Standard
——Based on inspirations from American High Stakes Test Items
LI Zhong-tang1,2,YAN Zhi-li2,ZHANG Lei2
(1.School of Physical Education,Mudanjiang Normal Uinversity,Mudanjiang 157012,China;
2.School of Physical Education and Health,East China Normal University,Shanghai 200241,China)
Abstract: In China, the testing by National Student Physical Health Standard is playing the role of “High Stakes Test Items”. The nature of interests of the state, education and sport administration department at various levels, schools, school principals, teachers and students as interest related parties in the testing, is inconsistent. From the perspective of objects targeted by interests and nature of interests, as for a student, the test results are “individual interests”, showing the “insignificant” nature of interests; as for a school, a school principal or a teacher, the test results are “collective interests”, showing the “remotely relevant” nature of interests; as for the state or society, the test results are “social interests”, significant for the state and society, their nature of interests is the most important. There are still some fairness and effectiveness problems with the testing right now. Fairness problems with the testing mainly show in two aspects: formal equality covers up factual inequality; education result fairness represents education fairness. Effectiveness problems with the testing mainly show in such problems as test score credibility, tester internal credibility, credibility between measurement tools and measurement results.
Key words: school physical education;National Student Physical Health Standard;high stakes test items;constitutional health criterion evaluation
“在如今的美國,除了《不讓一個孩子掉隊》法案以外,沒有哪個話題能比高利害測驗在教育界激起更多的熱議,對它的討論早已超出了教育界,家長、各州和地方的校董會、新聞媒體、商人和政治家都投入到這場爭論中”[1]。在我國,近些年來青少年的身體素質(zhì)問題受到了人們的廣泛關(guān)注,2013年,青少年的身體素質(zhì)問題也成了“兩會”關(guān)注的熱點話題之一,在相關(guān)文獻報道中更是出現(xiàn)了“學生體質(zhì)下降,主責不在學校”、“學生體質(zhì)下降,校長擔責”、“學生體質(zhì)下降,學校責無旁貸”、“學生體質(zhì)下降,責任在誰”、“學生體質(zhì)下降,主責在學?!钡认嚓P(guān)疑問與爭論。引起這些疑問與爭論的無疑是人們對于基于《國家學生體質(zhì)健康標準》(以下簡稱《標準》)測試所得到的近年來的國民體質(zhì)監(jiān)測結(jié)果。如果說“加強教育問責是美國近十年教育政策的核心理念,而進行問責的首要途徑就是推行高利害測驗項目(High Stake Testing Program)”[1]。那么,我國所進行的《標準》的測試結(jié)果則在“不期然間”成為人們進行教育問責的助推器與問責依據(jù),究其原因,便是《標準》的測試結(jié)果對于國家、社會等具有的“高利害性”,《標準》也在“無意間”扮演了“高利害測驗項目”的角色,從而使得人們有機會也有理由向?qū)W校教育、向?qū)W校體育工作者問責。但是,也應(yīng)該看到,由于人們,特別是家長與學生對于《標準》的利害性缺乏應(yīng)有的認識,以及《標準》本身作為“全國性測試所具有的權(quán)威性”,使得《標準》的公平性與有效性問題被遮蔽。
1 教育問責與高利害測驗
教育問責制最初發(fā)端于20世紀60年代美國,是針對當時中小學校培養(yǎng)的學生不能滿足家長和社會的要求而產(chǎn)生的?,F(xiàn)在,教育問責已成為世界主要發(fā)達國家和地區(qū)教育改革的重要內(nèi)容,引領(lǐng)著世界教育改革的潮流和趨勢。對于教育問責,如美國問責之父里昂·萊森格所言,教育問責是“學校系統(tǒng)內(nèi)對學生教育成就的評估,把學生取得成就的水平與州、社區(qū)的教育目標相聯(lián)系,與社區(qū)內(nèi)家長、教職工、納稅人及市民的期望相聯(lián)系?!盵2]由此可見,教育問責的目標便是通過問責,提高教育質(zhì)量,培養(yǎng)學生學業(yè)能力以達到一定的標準,并使教育的相關(guān)責任人對于教育結(jié)果承擔相應(yīng)的獎懲后果,這應(yīng)該是教育問責的應(yīng)有之意。進入21世紀,我國也逐漸加入到了這一進程中。2006年9月,新《義務(wù)教育法》頒布,其第九條規(guī)定:“任何社會組織或者個人有權(quán)對違反本法的行為向有關(guān)國家機關(guān)提出檢舉或者控告。發(fā)生違反本法的重大事件,妨礙義務(wù)教育實施,造成重大社會影響的,負有領(lǐng)導(dǎo)責任的人民政府或者人民政府教育行政部門負責人應(yīng)當引咎辭職。”這從法律上開了我國教育問責制的先河[3]。在2010年頒布的《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》,在第十五章管理體制改革中提出了要“加強教育監(jiān)督檢查,完善教育問責機制”的要求[4]??梢钥闯觯谖覈?,教育問責制已經(jīng)取得了法律地位。不可否認的是,“雖然公眾要求教育系統(tǒng)也能像政府系統(tǒng)那樣建立問責制,以解決我國教育系統(tǒng)目前存在的問題,但到現(xiàn)在為止,我國尚沒有成型的教育問責制度[5]。
進行教育問責,一個重要的問題便是依據(jù)什么進行問責。在美國,進行問責的首要途徑就是推行高利害測驗項目?!疤貏e是自2002年《不讓一個孩子掉隊》法案出臺以來,它已經(jīng)發(fā)展成為美國公立教育問責體系不可或缺的組成部分。高利害測驗的成績成為對各州、各學區(qū)和各公立學校的教育質(zhì)量進行問責和獎懲的主要依據(jù)”[1]。值得注意的是,我國古代的“科舉制”與現(xiàn)代的“高考”也是一種高利害測試項目,但是與美國高利害測試的目的不同。美國高利害測試項目主要是美國聯(lián)邦和各州政府為了對學區(qū)和學校進行教育問責所實施的州級統(tǒng)考,這種統(tǒng)考的利害性主要反映在學區(qū)或?qū)W校層面。而我國的“科舉制”或者“高考”,其利害性更多的與學生有關(guān)。但是,從現(xiàn)實情況來看,《標準》卻著實成為了國家、社會對學校體育進行問責的高利害測試項目,這種利害性也主要體現(xiàn)在國家層面。
2 《標準》測試的利害相關(guān)者與利害性
“每一個高利害測驗都有其特有的利害性和利害相關(guān)者,并且對不同的應(yīng)試者其利害性也是相對的”[1]。如果不能明晰這種利害性并辨明各種利害相關(guān)者,那么,問責不但起不了懲治的作用,反而會使問責的有效性受到質(zhì)疑,關(guān)于這一點將在后面專門論述。
2.1 《標準》測試的利害相關(guān)者
“利害相關(guān)者(stakeholders)就是指關(guān)乎誰的利害,通常情況下,考生都不會是惟一的利害相關(guān)者”[1]。《標準》作為一項國家級的學生體質(zhì)測試行為,其實施需要各方面的組織協(xié)調(diào),這便使得《標準》有著復(fù)雜的利害相關(guān)者。《標準》的實施“是在各地政府的統(tǒng)一領(lǐng)導(dǎo)下實行分級管理,要建立層層負責、級級承包、任務(wù)落實的管理制度”[6]?!霸趯嵤稑藴省返墓ぷ髦?,各級教育、體育行政部門要加強領(lǐng)導(dǎo),建立必要的檢查考核制度,認真進行檢查驗收,定期召開總結(jié)表彰會議,促進工作開展。學校要成立領(lǐng)導(dǎo)小組,由主管校長負責,明確分工,《標準》的組織實施工作應(yīng)計入教師工作量,要制定切實的工作計劃,建立獎懲制度,對學生加強宣傳教育,使《標準》測試工作落到實處”[6]?!盀楸WC這一工作落到實處,各部門都應(yīng)把實施《標準》的工作納入必須完成任務(wù)的指標,并規(guī)定沒完成任務(wù)的不能評選先進單位或個人”[6]。可以看出,《標準》中已經(jīng)規(guī)定了相應(yīng)的職責范圍,以及獎懲措施,與此相關(guān)的便是《標準》的利害相關(guān)者。如此一來,國家,各級教育、體育行政部門,學校,校長,教師,學生等都可以被認為是《標準》的利害相關(guān)者,其中也存在“個體的利害”(the individual stakes)、“團體的利害”(the group stakes)和“社會的利害”(the social stakes)。“個體的利害”主要是指測試結(jié)果對于考生本人的影響,這里主要是指在校學生本人。對于《標準》而言,更為重要的是,該測試結(jié)果對于國家、社會有著重要的意義。因為我們經(jīng)歷過“東亞病夫”的侮辱,有過“少年強則國強”的偉人警示,如果測試結(jié)果表明學生的體質(zhì)狀況不理想或者呈現(xiàn)下滑趨勢,那么,其危害性不言而喻。因此,正如《標準》所希冀的,“《標準》不僅是對學生的體質(zhì)健康狀況的個體評價,而且更重要的是促進學生體質(zhì)健康發(fā)展、激勵學生積極進行身體鍛煉的教育手段”[6]??梢姡龠M學生體質(zhì)健康發(fā)展是《標準》的宗旨所在,可以說,這是國家層面的價值訴求。此外,除了相對于國家、社會的“社會的利害”,以及相對于學生本人的“個體的利害”,《標準》還在實施環(huán)節(jié)對學校、校長以及教師制訂了相應(yīng)的職責以及獎懲措施,從問責的方式來看,這本身是一種“行政問責”,或者“管理問責”,因此,學校、校長、教師等便是介于學生與社會之間的利害相關(guān)者,即“團體的利害”。
2.2 《標準》測試的利害性
高利害測驗的利害性具有兩個特點,即高利害測驗的利害性(the stakes)是相對的,同一個高利害測驗對不同的利害相關(guān)者具有不同的利害性。需要指出的是,這些利害性并不是測驗本身具有的屬性,而是人們對測驗結(jié)果賦予的意義[1]。對于《標準》測試結(jié)果而言,這種利害性也是相對的,對于學生、教師、校長、學校與社會、國家而言,利害性是不同的。
1)個體的利害:無關(guān)緊要。
近年來,國民體質(zhì)監(jiān)測結(jié)果顯示,我國青少年學生的柔韌性、爆發(fā)力、肌力、耐力、肺活量均呈下降趨勢,超重和肥胖檢出率大幅提高,視力低下檢出率依然居高不下。這一結(jié)果對于學生、家長而言本來應(yīng)該具有重要的“警戒”作用,使其意識到學生體質(zhì)健康不樂觀的狀況,理應(yīng)在平時的學習、生活中加強體育鍛煉。而且《〈標準〉實施辦法》規(guī)定:“普通高中、中等職業(yè)學校和普通高等學校學生畢業(yè)時,《標準》測試的成績達不到50分者按肄業(yè)處理?!盵7]面對中考、高考的壓力,以及政策“在實施中形同虛設(shè),此項條款根本就經(jīng)不起實踐的考驗,其本身就不具有科學性、不切實際”[8],使得《標準》測試的結(jié)果對于學生而言可謂“無關(guān)緊要”,與此形成鮮明對比的便是人們對“體育中考”的重視。當前,體育在各省中考測試中都占一定的分數(shù),使得學校與家長對體育的重視程度空前。但是一方面,學校體育課因為中考而出現(xiàn)了體育的應(yīng)試傾向,“中考體育考什么,體育課便練什么”在當前的學校體育中已經(jīng)不足為奇;另一方面,家長對體育的重視程度則體現(xiàn)在社會中考體育培訓熱上。當學生的體育成績不理想時(大多數(shù)家長追求的是體育成績滿分),家長便把希望寄托在社會的體育中考培訓機構(gòu)上,學生似乎也意識到了體育的重要性,在培訓班上也是格外的賣力。可以說,相較于體育中考,《標準》測試結(jié)果的利害性對于學生、家長而言變得不那么重要了,從現(xiàn)狀來看,學生應(yīng)付、被動參與測試現(xiàn)象嚴重,經(jīng)常提出“測試有什么用”“怎么年年測”等疑問,學生被動參與,對測試滿不在乎,不按測試要求完成測試等問題嚴重。
2)團體的利害:隔靴撓癢。
從《標準》測試的實施過程來看,學校、校長、教師在《標準》測試中所扮演的角色是管理、協(xié)作,雖然《標準》中對于學校、校長、教師的職責、懲治措施有了明確的規(guī)定,但正如前面提到的,這是一種行政問責或管理問責,懲治的依據(jù)不是來自于《標準》測試的結(jié)果,而是測試過程的組織與實施是否盡到了責任。對于學校、校長、教師而言,他們最關(guān)心的還是中考、高考的升學率,一個學校的《標準》測試結(jié)果差,只要有著較高的升學率,學校便不會出現(xiàn)招生困難(更何況現(xiàn)在的情況是學生入學難),學校、校長、教師的根本利益便不會受到損害。雖然中央七號文件和53號文件上都指出,學生體質(zhì)健康連續(xù)3年下降,學校教育工作評優(yōu)評先“一票否決”[9-10],但是卻出現(xiàn)了“瞞報”、“重復(fù)上報”等問題。因此,《標準》的測試結(jié)果對于學校、校長、教師而言多少有些隔靴撓癢,《標準》測試結(jié)果未能真正觸及學校、校長、教師的“利害底線”。
3)社會的利害:意義重大。
作為高利害測試,其測試結(jié)果對于利害相關(guān)者的利害相關(guān)程度不同,但是總會對一個利害相關(guān)者具有高利害性,《標準》測試結(jié)果對于國家、社會而言便意義重大。早在1999年頒布的《中共中央國務(wù)院關(guān)于深化教育改革全面推進素質(zhì)教育的決定》中便提出了“健康體魄是青少年為祖國和人民服務(wù)的基本前提,是中華民族旺盛生命力的體現(xiàn)。學校教育要樹立健康第一的指導(dǎo)思想,切實加強體育工作”的目標。對于國家而言,需要一個評價手段來監(jiān)控學生的體質(zhì)健康狀況,進而加強對學校體育工作的管理與問責,《標準》測試有著這樣的反饋與激勵功能。《標準》測試結(jié)果對于國家、社會發(fā)展而言有著重要的意義。
3 關(guān)于《標準》的幾個需要深思的問題
3.1 公平性問題
1)以形式的平等掩蓋事實上的不平等。
美國引入高利害測試項目的一個出發(fā)點便是以成績向?qū)W校和教師問責,借以提高教育質(zhì)量,促進教育公平。為了保證測試的客觀公正,高利害測試多采用考試公司編制的標準化測試,即讓所有考生在相當一致的條件下參加同一個考試,以期這種標準化能給所有考生提供一個公正和公平的考試機會,實則是以形式的平等掩蓋了事實上的不平等。高利害測試只測量考生對某些知識和技能的精通程度,卻不考慮考生是否擁有公平的機會學習這些內(nèi)容。在許多情況下,學生考試欠佳是因為他們?nèi)狈美蠋熁蛘邲]有接受公平的教育[11]。這種情況一方面有違高利害測試項目引入時的出發(fā)點,另一方面加劇了美國的教育不公平。我國《標準》的制定初衷是切實加強學校體育工作,促進學生積極參加體育鍛煉,養(yǎng)成良好的鍛煉習慣,提高體質(zhì)健康水平[6]。這一初衷雖然與美國通過引入高利害測驗項目追求教育公平的初衷不一樣,共同點卻驚人的相似,我國的現(xiàn)實情況是,幾次測試結(jié)果與通過《標準》測試促進學生積極鍛煉,進而達到提高體質(zhì)健康的初衷相背離。其個中原因是否也與“以形式的平等掩蓋了事實上的不平等”有關(guān)呢?對于這一問題,已有研究者指出,“對于全體學生而言,整齊劃一地測試相同的項目,表面上是公平的、合理的,實質(zhì)極不公平、極不合理,亦體現(xiàn)不出‘以生為本?!盵8]我們知道,我國各地區(qū)經(jīng)濟發(fā)展不平衡,生活水平不同,教育經(jīng)費投入存在差距,在這種“事實上的不平等”的情況下,又如何保證不同地區(qū)的學生可以享受到公平的教育機會,我們可以做這樣的假設(shè),即一個經(jīng)濟欠發(fā)達地區(qū)的初中生仰臥起坐每分鐘40個是最好成績,但是經(jīng)濟相對發(fā)達地區(qū)的初中生仰臥起坐每分鐘60個是最好成績,如果按照全國統(tǒng)一的《標準》進行評定,可想而知,其測試的公平性便令人懷疑。美國學者科爾[12]指出:“一個問題是,人們指責標準化測驗繼續(xù)了對少數(shù)民族和其他群體的偏見?!痹谖覈稑藴省窚y試雖然不涉及對少數(shù)民族和其他群體的偏見問題,但是,如何保證這一測試的公平性卻是需要深思熟慮的。
2)以教育結(jié)果公平表征教育公平。
從教育公平的內(nèi)涵來看,教育公平包括教育起點的公平、教育過程的公平和教育結(jié)果的公平。教育起點的公平主要是指每個人享有平等的教育權(quán)利和均等的教育機會,這是實現(xiàn)教育公平的前提條件。教育過程公平是指個體受到平等的教育過程的對待,它是教育公平中的核心因素。教育結(jié)果公平可以作為一種客觀的政策評價和監(jiān)控的工具,也是教育公平的最終目標。在我國教育界,學者們都傾向于將教育結(jié)果公平作為一種終極的價值追求,認為教育起點和教育過程的公平是結(jié)果公平的實現(xiàn)前提[13]。在我國,如果說學生的受教育權(quán)利,也就是入學機會受到了《憲法》的保護,那么,教育過程的公平又當如何得以保障呢?有學者指出,“教育過程的公平,就是讓受教育者都有機會獲得適合個人特點的教育?!獙崿F(xiàn)教育過程的公平,做起來是很難的?!盵14]“最可行的辦法是將班級授課與個別化教學結(jié)合起來,以班級授課為基本框架,輔以個別化教學,使二者優(yōu)勢互補。”[15]可見,教育過程的公平實則指向了教師教學層面,也對教師教學提出了要求。班級授課制是人們對教育效率與教學規(guī)模要求下的產(chǎn)物,其最大的缺陷便在于對學生個體的忽視,隨著近代人本主義的盛行,尊重學生個體差異,促進其全面發(fā)展的呼聲越來越高,現(xiàn)階段如何彌合這兩種歷史產(chǎn)物之間巨大的鴻溝并非學界的疾呼所能填補。但是,認識到教學過程中這種教育過程的公平性問題卻是解決問題的開始,而承認教學過程中的這種不公平現(xiàn)象也是難能可貴的。對于體育教學而言,且不說在我國還大面積存在著“放羊式教學”的情況,體育教師能認識到這種公平性問題的又有多少呢?尊重學生個性發(fā)展既不是放任其發(fā)展,不管不問,也不是拋棄體育教學的本質(zhì),任由教師與學生“游戲課堂”。一言以蔽之,對于體育教育而言,其教育過程的公平性可謂受到了很大的挑戰(zhàn),在這種情況下,代表教育結(jié)果的公平——作為評價學生體質(zhì)狀況(如果非要把這一結(jié)果的責任讓渡給體育的話)的《標準》測試,其結(jié)果的公平性又如何保證。因此,在談及《標準》測試的公平性時,有必要考察作為其前提的入學受教育機會的情況以及體育教師的教學情況,不然《標準》測試結(jié)果在源頭便已經(jīng)偏離正軌了。
其次,就教育結(jié)果的公平而言,有學者指出:“教育結(jié)果公平的本質(zhì),并不是需要每個來自不同背景的學生在學業(yè)成績上完全的平等,而是將教育無法控制的那部分變量,如家庭背景、學生智力水平進行排除了之后,只考慮教育系統(tǒng)自身的變量對學習成績所造成的影響是平等的?!盵13]認識到這一點對于我們進行前面所提到的教育問責以及認清學生體質(zhì)下降的真實緣由是大有裨益的。這一問題本不必贅述,概因已有學者為學校體育工作與學生體質(zhì)健康之間的必然聯(lián)系提出質(zhì)疑,并為學校體育責任辯護,但是學校體育工作卻一再遭受非議著實令人費解。對于學校體育而言,其教育結(jié)果表現(xiàn)在學生體質(zhì)健康發(fā)展,運動技能發(fā)展,態(tài)度、情感、價值觀等方面,這些方面的發(fā)展也必然受到家庭背景、社會等方面的影響,但是,我們在評價學生體質(zhì)健康狀況時,并沒有也從未意識到(更多的是技術(shù)方面的原因)要把家庭、社會這些變量引起的學生體質(zhì)方面的影響排除掉,于是,由學校體育教育、家庭背景、社會等方面共同導(dǎo)致的學生體質(zhì)健康狀況的一切責任便由學校體育工作“一人承擔”,毋寧說學校體育人敢于攬責任,不如說他們無法也不知道該如何讓自己“逃脫”這一責任。我們所應(yīng)該期待的應(yīng)該是《標準》測試能夠準確地測量出學生體質(zhì)健康狀況中因為學校體育工作而變化的那部分,這也是《標準》測試,甚至整個社會需要意識到的對于學校體育工作的公平性問題。
3.2 有效性問題
這里的有效性是指通過測試結(jié)果所得推論的恰當與合理程度。前面提到,《標準》測試的利害相關(guān)者是多元的,包括了學生、家長、教師、學校、社會等,而對于這些利害相關(guān)者而言,《標準》測試有著不同的利害性。在這種情況下,作為測試的主要參與者——學生,教師卻由于利害性較低而有可能導(dǎo)致“測量誤差”以及“測試者內(nèi)部信度受到質(zhì)疑”等問題,這都將會影響測試所得到的結(jié)果,而基于這樣的結(jié)果上的推論便無疑會受到有效性的挑戰(zhàn)。
1)測試分數(shù)的可信度。
對于學生而言,《標準》測試結(jié)果不會影響其升學、就業(yè)等,那么,這種測試的利害性顯得無關(guān)緊要的,這樣一來,重要性或者意義得不到認識和內(nèi)化,學生在測試過程中便有可能不會把自己最真實的水平展現(xiàn)出來,從而無法使得測試得到一個“真實分數(shù)”,“測量誤差”便不可避免。當然,“真實分數(shù)與測量誤差都是假象概念,……我們無法直接對它們進行測量”[16]216。盡管如此,認識到測量誤差的存在可能性以及由此而受到影響的結(jié)果效度問題對于《標準》測試的完善是大有裨益的。例如如何保證學生在測試中都是盡力而為,而不是感到無關(guān)緊要便應(yīng)付了事這一問題,看似是學生認識不到《標準》測試的重要性,實則反映出《標準》作為一種評價方法而存在的缺陷。雖然《標準》中明確了達標的要求,但是對于未達標的和成績好的學生,卻沒有相應(yīng)的獎懲措施,成績好壞都一樣,只要通過了就行,學生在測試時提出“測試有什么用”“怎么年年測”等疑問便是情理之中了。雖然學生體質(zhì)測試結(jié)果被要求記入學生成長記錄或素質(zhì)報告,或作為學生畢業(yè)、升學的重要依據(jù),但是中考升學有體育中考作為評價學生身體狀況的依據(jù),高考中各高校并不將體育作為學生入學的參照維度,學生畢業(yè)時更不會因為體質(zhì)測試不通過而影響到學校的“就業(yè)率”。由此看來,針對學生的達標情況建立有效的獎懲制度至關(guān)重要。
2)測試者的內(nèi)部信度。
為了得到測驗分數(shù),需要有人實施測驗,有人對測驗進行評分,如果兩種類型的測驗工作人員未能完全按照預(yù)先設(shè)計的程序進行,就會引起測量誤差[16]218。這一指向測試實施人員即教師的問題在現(xiàn)實中也確實引起了人們的關(guān)注。有研究者指出,就測試的組織工作來講,缺少一個重要的環(huán)節(jié),即測試過程中的督查工作,導(dǎo)致出現(xiàn)不嚴格測試過程而出現(xiàn)部分學生多次測試、不經(jīng)測試直接填報數(shù)據(jù)等[17]。而“在《標準》統(tǒng)計上報過程中,學校在數(shù)據(jù)統(tǒng)計錄入上重視程度和監(jiān)督力度不夠,致使體育教師在數(shù)據(jù)統(tǒng)計上報中,為減輕自身工作量而出現(xiàn)‘編、造數(shù)據(jù)現(xiàn)象,使數(shù)據(jù)的真實性大大降低[18]。正如前面所言,從利害關(guān)系來講,《標準》的測試結(jié)果對于學校、校長、教師而言多少有些隔靴撓癢,《標準》測試結(jié)果未能真正觸及學校、校長、教師的“利害底線”。再加上有些學校對體育教師進行《標準》測試過程中的額外教學工作量沒有給予相應(yīng)的勞動報酬,挫傷了廣大體育教師積極性,便使得測試在組織、保障、上報等環(huán)節(jié)上存在著問題,從而直接導(dǎo)致了測試的實施成為一種應(yīng)付。針對這種情況,教育部、國家體育總局關(guān)于印發(fā)《國家學生體質(zhì)健康標準》及《〈國家學生體質(zhì)健康標準〉實施辦法》的通知中明確指出:“自2007年開始,國家體育總局和教育部每兩年組織一次對各地實施《標準》情況的檢查,并公布檢查結(jié)果。”可以看出,國家已經(jīng)意識到《標準》測試中存在的問題。這也從另一方面表明,《標準》在保證測試的準確性、促使測試順利進行等監(jiān)督、保障制度方面還需要進一步完善。
3)測量工具與測量結(jié)果之間的可信度問題。
高利害測驗經(jīng)常用于縱向研究。當縱向研究中每年所用測驗難度相當或具有連貫性時,跨年比較才有意義。當采用新標準時,新的測驗結(jié)果將不能與以前的結(jié)果進行比較[19]。從1985年以來,我國“學生體質(zhì)健康標準”一直在不斷修訂、完善,1975年頒布的《國家體育鍛煉標準》在1982和1990年進行了兩次修訂,2002年又研制了《學生體質(zhì)健康標準(試行方案)》,2007和2014年教育部、國家體育總局又對這一試行方案進行了修訂。從修訂的情況來看,首先,就《國家體育鍛煉標準》與試行方案而言,兩個文件在測試內(nèi)容、評分標準上存在較大差異。另外,試行方案中設(shè)置了許多可選側(cè)項目,如50 m跑、立定跳遠二選一;男生臺階試驗、1 000 m二選一,女生臺階試驗、800 m二選一;男生坐位體前屈、握力二選一,女生坐位體前屈、仰臥起坐、握力三選一等,但是這些所設(shè)置的選測項目間的相關(guān)度較差,替代兼容程度較低,很難較準確地反映學生體質(zhì)健康狀況[20]。再就試行方案與《標準》而言,有研究指出,《新標準》中測試內(nèi)容更加豐富,但選測項目仍然分類不清;權(quán)重的分配更加合理;評價等級的調(diào)整幅度較小,但評分標準大幅提高,學生的體質(zhì)健康測試數(shù)據(jù)反映出新老標準間的各等級通過率存在非常顯著的差異[21]。由此可見,作為評估學生體質(zhì)健康狀況的“標準”隨著時代的發(fā)展在不斷的修訂過程中,新舊“標準”之間在測試內(nèi)容以及評分標準上有著較大的差異,“標準”之間的難度以及連貫性也受到了較大的質(zhì)疑,在此情況下,測量工具變了,即使是同一測試對象,測試結(jié)果也是不同的。因此,通過不同時期的“標準”測試所進行的學生體質(zhì)健康狀況的縱向比較的結(jié)果也是值得商榷的。
美國高利害測試項目實施以來雖然取得了一些積極的效果,如促進了社會對學校問責,但是也導(dǎo)致了很多消極的結(jié)果,如學生對分數(shù)和學校的評價感到厭煩和抵觸等,這種情況在我國也存在著?!稑藴省窚y試作為對社會、國家評估學生的體質(zhì)健康狀況而言,具有高利害性,但是由于相關(guān)的制度不健全而導(dǎo)致這種高利害性在學生、教師、學校那里無法得到體現(xiàn),這種情況也使得《標準》促進學生積極鍛煉,進而促進學生體質(zhì)健康的愿景,因為缺乏制度規(guī)約而使得“當事人”無法體會到“利害相關(guān)性”,現(xiàn)實中出現(xiàn)種種問題也是在所難免。教育問責作為教育發(fā)展的方向,體現(xiàn)的是公平、民主的教育理念,但首要問題便是需要確保問責依據(jù)來源的有效性,否則不僅有傷體育教育工作者之心,更無益于國家在《標準》測試過程中的這種巨大投入。
參考文獻:
[1] 李欣. 美國高利害測驗項目解析[J]. 外國教育研究,2012,36(7):87-94.
[2] 吳清山. 教育績效責任研究[M]. 北京:九州出版社,2006:140.
[3] 尹力. 教育人權(quán)及其保障——新《義務(wù)教育法》何以落實和完善[J]. 教育研究,2007(8):39-46.
[4] 國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020)[EB/OL]. http://www.gov.cn/jrzg/2010-07/29/
content_1667143.htm.
[5] 司林波,孟衛(wèi)東. 教育問責制在中國的建構(gòu)[J]. 中國行政管理,2011(6):24-27.
[6] 《國家學生體質(zhì)健康標準解讀》編委會. 國家學生體質(zhì)健康標準解讀[M]. 北京:人民教育出版社,2007.
[7] 教育部,國家體育總局. 《國家學生體質(zhì)健康標準》實施辦法[Z]. 教體藝[2007]8號.
[8] 陳良業(yè). 《國家學生體質(zhì)健康標準》研究[J]. 體育文化導(dǎo)刊,2011(7):86-90.
[9] 中共中央國務(wù)院關(guān)于加強青少年體育增強青少年體質(zhì)的意見[Z]. 中發(fā)[2007]號文件,2007.
[10] 國務(wù)院辦公廳轉(zhuǎn)發(fā)教育部等部門關(guān)于進一步加強學校體育工作若干意見的通知[Z]. 國辦發(fā)[2012]53號,2012.
[11] 李欣. 隱喻視域中的美國高利害測驗[J]. 全球教育展望,2010(9):46-50.
[12] 科爾. 教育研究方法導(dǎo)論[M]. 許慶豫,等譯. 南京:江蘇教育出版社,2002:221.
[13] 辛濤,黃寧. 教育公平的終極目標:教育結(jié)果公平[J]. 教育研究,2009(8):24-27.
[14] 楊能生. 教育過程的公平是最大的公平[J]. 教育科學論壇,2007(6):73-74.
[15] 呂星宇. 論教育過程公平[J]. 教學與管理,2009(7):3-5.
[16] 科爾. 教育研究方法導(dǎo)論[M]. 許慶豫,等譯. 南京:江蘇教育出版社,2002.
[17] 王鳳仙. 《國家學生體質(zhì)健康標準》測試與數(shù)據(jù)上報存在的主要問題及其解決策略[J]. 體育學刊,2013,20(3):90-92.
[18] 黃彥軍,王道星. 《國家學生體質(zhì)健康標準》實施中形式主義傾向分析[J]. 山東體育科技,2011,33(4):60-63.
[19] 麥克米倫,舒馬赫. 教育研究:基于實證的探究[M]. 曾天山譯. 北京:教育科學出版社,2013:249.
[20] 肖國良,王冬梅,肖國棟. 對《學生體質(zhì)健康標準》的理性思考[J]. 西安體育學院學報,2006,23(6):106-109.
[21] 鄭殷玨,方愛蓮,蔡金明,等. 《國家學生體質(zhì)健康標準》與《學生體質(zhì)健康標準(試行方案)》的比較研究[J]. 體育科學,2009,29(7):92-96.