朱源+何小亞+蔡倩
1 前言
近十年來,隨著計算機科學的發(fā)展以及大數(shù)據(jù)時代的到來,算法、概率與統(tǒng)計等知識愈發(fā)受到基礎教育的重視,而獨立性檢驗作為一種重要的統(tǒng)計推斷方法更是如此.在2003年中國頒布的《普通高中數(shù)學課程標準(實驗)》中,獨立性檢驗被安排在選修1-2和選修2-3,具體要求如下:“通過對典型案例的探究(如“肺癌與吸煙有關嗎”等),了解獨立性檢驗(只要求2×2列聯(lián)表)的基本思想、方法及初步應用.”[1]然而在獨立性檢驗的實際教學中,學生的學習效果卻不盡如人意.黃華勝關于學生對統(tǒng)計推斷的理解研究發(fā)現(xiàn),絕大部分學生不認可獨立性檢驗和假設檢驗的說理方式,他們認為統(tǒng)計推斷的結論存在運氣成分,一次統(tǒng)計的結果不能說明問題[2].那么獨立性檢驗究竟難在何處?有什么教學對策?又有什么教學價值?本文將分別進行探討.
2 獨立性檢驗難在何處
2.1 具體內容方面
2.1.1 數(shù)值變量與分類變量
數(shù)值變量是由測量或計數(shù)所得到的量,如溫度、長度、速度等,其具有數(shù)值特征,也叫定量變量.分類變量則只有性質上的差異,具體分為有序變量和無序變量.有序變量即具有次序關系的變量,如將產品分為一等品、二等品和三等品;無序變量即不具有次序關系的變量,如性別(男、女)、人種(白人、黑人、黃種人)等.
學生過去在回歸分析和函數(shù)的學習中,所遇到的變量都是數(shù)值變量,因此缺乏有關分類變量的認知經驗.但現(xiàn)實生活中,分類變量是大量存在的,判斷兩個分類變量之間是否有關系,即獨立性檢驗要解決的問題.如“吸煙與患肺癌是否有關系”的問題中,所涉及的兩個分類變量分別是:是否吸煙(可取值“是”、“否”);是否患肺癌(可取值“是”、“否”),這兩個分類變量的數(shù)據(jù)統(tǒng)計要用列聯(lián)表的形式,而學生往往缺乏將兩者視為變量的意識.
2.1.2 如何選擇原假設H0
原假設H0是對所研究總體的一種假設,其目的應使后續(xù)所選的統(tǒng)計量在該假設之下,分布已知,進而通過實測樣本,計算出統(tǒng)計量的值,并根據(jù)預先設定的顯著性水平進行檢驗,做出拒絕或接受原假設的判斷.例如在“吸煙與患肺癌是否有關系”的問題中,在“吸煙與患肺癌沒有關系”的假設之下,統(tǒng)計量K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(當n充分大時)近似服從自由度為1的卡方分布.反之,若將“吸煙與患肺癌有關系”作為原假設,上述統(tǒng)計量的分布則未知,因而無法根據(jù)預先設定的顯著性水平做出判斷.這是獨立性檢驗的一大教學難點,學生即使學完該節(jié)內容,往往還很困惑:根據(jù)數(shù)據(jù),我們的直觀判斷明明是‘吸煙和患肺癌有關,為什么還要做出兩者無關的假設呢?假設兩者有關可行嗎?
2.1.3 如何理解P(A)、P(B)的含義
《數(shù)學選修2-3》用A表示不吸煙,B表示不患肺癌[3].那么P(A)是指的是什么,學生容易將其理解為:生活中任意一個人不吸煙的可能性.事實上這是一種誤解,因為針對具體的任意個體,其吸煙與否是確定事件,不吸煙概率要么為0,要么為1,隨著時間的推移,個體可能從不吸煙狀態(tài)轉變?yōu)槲鼰煚顟B(tài),這種轉換概率則屬于另一個概率空間.根據(jù)教材的意圖,P(A)應是我們在日常生活中隨意碰到一個不吸煙的人的概率,其精確值是吸煙人數(shù)與人口總數(shù)的比值.而根據(jù)統(tǒng)計數(shù)據(jù),利用頻率估計概率可得到其近似值,因此樣本的容量不能太小.
2.1.4 如何理解隨機變量K2
學生在對隨機變量K2的理解上,第一個難點即如何區(qū)分K2、k與k0.K2是一個隨機變量,隨實測數(shù)據(jù)的變化而變化,根據(jù)實測數(shù)據(jù)可計算其觀測值k,而k0是一個判斷規(guī)則的臨界值.
學生在對隨機變量K2的理解上,第二個難點即這個統(tǒng)計量是如何構造出來的.實際上,K2即在原假設H0下,每個格子實際頻數(shù)與理論頻數(shù)差值平方除以理論頻數(shù)的累加和:
K2=∑a,b,c,d(實際頻數(shù)-理論頻數(shù))2理論頻數(shù)=n(ad-bc)2(a+c)(b+d)(a+b)(c+d).
學生在對隨機變量K2的理解上,第三個難點即為什么要選擇這一統(tǒng)計量,而不是ad-bc.《數(shù)學選修2-3》[3]和《數(shù)學選修1-2》[4]的解釋是:為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標準,但學生容易將其誤解為:K2消除了樣本容量的差異,則選擇小樣本和大樣本對結果不會造成影響.對這句話的正確理解應是:與ad-bc相比,K2的優(yōu)勢在于無論樣本容量怎么改變,K2將近似服從同一個分布,即自由度為1的卡方分布,而樣本容量越大,近似程度越高.
2.1.5 如何理解“犯錯誤的概率不超過0.01”
為了避免使用顯著水平的概念,舊版的人教版教材在解釋獨立性檢驗的結果時,為“把握”賦予了特定的含義[5]:在實際應用中,我們把k≥k0解釋為有(1-PH0(K2≥k0))×100%的把握認為“兩個分類變量之間有關系”;把k
但現(xiàn)有的不少教輔或試卷仍然采用老教材的解釋方案,容易導致學生產生錯誤的理解.
2.1.6 能否構造其他統(tǒng)計量判斷兩個變量有關
答案是肯定的,只要該統(tǒng)計量的分布或近似分布已知即可.但為何幾乎所有獨立性檢驗都選擇K2作為統(tǒng)計量,其優(yōu)點是什么?對這個問題的解答至少應包括兩個方面:①只要樣本容量充分大,K2近似服從自由度為1的卡方分布,即是說K2提供了統(tǒng)一的評價標準;②如果一套統(tǒng)計規(guī)則已經成為解決某種問題的主流方法,那么在其他更優(yōu)秀的替代規(guī)則出現(xiàn)前,研究者更傾向于選擇現(xiàn)有的主流方法,既因為歷史已證明該規(guī)則的有效性,也因為這是研究成果能在同行間進行交流的保證.
2.2 宏觀認識方面
2.2.1 獨立性檢驗的思想
獨立性檢驗是考察兩個變量是否獨立的統(tǒng)計學方法,具體做法是:首先對兩個變量的關系作假設(一般假設其獨立),然后選取合適的統(tǒng)計量,根據(jù)實測樣本計算出該統(tǒng)計量的觀測值,最后根據(jù)預先設定的顯著性水平進行檢驗,做出接受或拒絕原假設的判斷.其本質即“小概率反證法”,是一種顯著性假設檢驗.然而已有研究表明,絕大部分學生不認可獨立性檢驗和假設檢驗的說理方式,他們認為統(tǒng)計推斷的結論存在運氣成分,一次統(tǒng)計的結果不能說明問題[2].
2.2.2 回歸分析與獨立性檢驗所研究的問題范疇
在統(tǒng)計學上,無論兩個或多個的數(shù)值變量還是兩個或多個的分類變量,都可以進行回歸分析與獨立性檢驗,并且這兩種統(tǒng)計分析是相輔的:回歸分析所得兩變量的相關系數(shù)只是刻畫了兩者的相關程度,但判斷其相關性是否顯著則需要進行顯著性檢驗.反之,獨立性檢驗對兩變量的相關性進行了顯著性檢驗,但其相關關系是線性的還是非線性的、相關性有多強,則需要通過回歸分析來解決.
囿于課程內容的統(tǒng)籌和學生的認知水平,在高中數(shù)學的統(tǒng)計案例一章中,回歸分析只研究“兩個具有相關關系的數(shù)值變量如何建立回歸方程、它們的相關性多大”的問題,這兩個數(shù)值變量要區(qū)分解釋變量與預報變量,前者是確定的普通變量,后者是隨機變量.而獨立性檢驗只解決“兩個分類變量之間是否相關,有多大把握做出判斷”的問題,這兩個分類變量都是隨機變量,不分自變量與因變量.
3 困難的原因分析
3.1 數(shù)學證明的負遷移
Belle將證明進行了以下分類:①個人的經驗;②權威的認可;③觀察到的實例;④舉不出反例;⑤結論的有效性;⑥數(shù)學的邏輯演繹推理[8].數(shù)學證明只是諸多證明方法中的一種,但學生所熟練的邏輯演繹推理的證明方式卻容易對其他證明方法產生負遷移效應.這種效應在獨立性檢驗的學習中突出表現(xiàn)為:從數(shù)學證明的角度(尤其是源于反證法的類比遷移)看待統(tǒng)計推斷,不認可獨立性檢驗的說理方式,認為既然小概率事件不是不可能事件,那么通過小概率事件的發(fā)生來拒絕原假設就有可能犯錯,因此這種推斷不可靠.除非在原假設之下,實測事件不可能發(fā)生,才能拒絕之.
3.2 認知圖式中缺乏起固定作用的經驗
奧蘇貝爾的有意義學習理論提供有意義學習得以發(fā)生的三個先決條件,其中之一則是學習者認知結構中具備適當?shù)挠^念.這一理論對解釋學生學習獨立性檢驗的認知困難具有重要意義,具體而言體現(xiàn)在以下兩個方面:①學生在進行獨立性檢驗的學習之前,缺乏運用“小概率反證法”的直觀經驗;②學生對獨立性檢驗原理圖式中所涉及的相關概念如分類變量、隨機變量等的理解不夠深刻、精確.
3.3 課標的界定不清楚
《普通高中數(shù)學課程標準(實驗)》對獨立性檢驗和假設檢驗的具體要求如下[1]:①通過對典型案例的探究(如“肺癌與吸煙有關嗎”等),了解獨立性檢驗(只要求2×2列聯(lián)表)的基本思想、方法及初步應用;②通過對典型案例的探究(如“質量控制”“新藥是否有效”等),了解實際推斷原理和假設檢驗的基本思想、方法及初步應用.但獨立性檢驗本質上就是假設檢驗,在課標中不應該將二者分開.參與人教版《數(shù)學選修1-2》和《數(shù)學選修2-3》編寫工作的李勇教授,一方面承認:“獨立性檢驗是一種特殊的假設檢驗”,另一方面又指出:“專家在審查教材時,認為‘假設檢驗的基本原理和‘聚類分析的基本思想不適應于高中的知識背景,建議刪除這兩方面的內容”[7],則未免有自相矛盾的嫌疑.
3.4 “考教悖論”
面對高考時,一線教師的態(tài)度是“考什么就教什么”,而命題專家的態(tài)度則是“教什么就考什么”,這一矛盾即所謂的“考教悖論”.一方面,由于課程標準對獨立性檢驗的要求只是“了解”,因此高考很少考查或者只考查獨立性檢驗的操作步驟;另一方面,高考的命題趨向又促使一線教師壓縮獨立性檢驗的教學時間,只教其操作步驟.
4 相關建議
4.1 課程標準的修正建議
將獨立性檢驗視為一種特殊的假設檢驗,對中國、新加坡、美國、澳大利亞、芬蘭的高中數(shù)學課程標準[9]~[13]中的假設檢驗內容進行對比,以期為中國后續(xù)新課標的制定提供有益建議.結果發(fā)現(xiàn):
(1)新加坡非常重視統(tǒng)計知識,將H1、H2課程分為純數(shù)學和統(tǒng)計兩個部分.其中假設檢驗的內容非常全面(表1),并且H1與H2水平的要求體現(xiàn)了一定的差異性.
(2)美國高中數(shù)學課標的統(tǒng)計與概率部分有四項內容:①解釋分類數(shù)據(jù)和度量數(shù)據(jù);②做出推斷與證明結論;③條件概率與概率規(guī)則;④利用概率做決策.每項內容之下還有若干具體的條目.雖然沒有特別提出假設檢驗的概念和相關術語,但在“做出推斷與證明結論”這一項中,共6個條目,其中2條(第2條和第5條)滲透了假設檢驗的思想:確定一個具體模型是否與給定數(shù)據(jù)產生過程的結果一致,例如一個模型認為拋一枚硬幣正面朝上的概率是0.5,那么拋5次硬幣全部反面朝上的結果會不會導致你懷疑上述模型;使用仿真推斷兩個參數(shù)是否存在顯著差異.
(3)澳大利亞和芬蘭的高中數(shù)學課程標準沒有涉及獨立性檢驗和假設檢驗的內容.
對比表明,五國對假設檢驗內容的重視程度有很大的差異.呈現(xiàn)這種差異的原因可理解為各國的數(shù)學理念和數(shù)學教育理念不同,但也從一個側面反映了假設檢驗的原理和思想未必是高中生所必須具備的統(tǒng)計知識和統(tǒng)計觀念.
反觀中國高中數(shù)學課標,將獨立性檢驗與假設檢驗的內容與聚類分析和回歸分析一并歸入統(tǒng)計案例一節(jié),利用少數(shù)案例介紹這些原理及其初步應用,一方面占用了學生的課時,另一方面又淺嘗輒止,使學生難以理解上述原理和其中的統(tǒng)計思想.為改變這一現(xiàn)狀提出兩點建議:一是參考新加坡,提高獨立性檢驗和假設檢驗內容的要求層次,并為此分配更多的學時;二則是參考澳大利亞及芬蘭,刪掉獨立性檢驗和假設檢驗的內容,使學生接受高等教育后再系統(tǒng)地學習這方面知識.另外,中、美兩國的高中課標在處理假設檢驗的內容上具有一定的相似性,但兩者的相異性則更為后續(xù)中國課標的制定提供有益啟示.具體體現(xiàn)在以下兩個方面:一、雖然同為滲透假設檢驗的思想,但美國課標沒有限定具體課時和教學方式,為相應教材的編寫和教學活動的開展保留了極大的自主性和靈活性.二、在具體要求的表述方面,美國課標更為清晰,因此具有較強的操作性.以上兩點不僅針對假設檢驗的內容,對于中國高中課標中其他內容標準的制定亦有同樣的啟發(fā)意義.
4.2 教師教學的建議
4.2.1 明確教學目標
在獨立性檢驗的實際教學中,有些教師受應試教育思想或相關專業(yè)知識所限,將本課的教學目標設定為:了解獨立性檢驗的操作規(guī)則,會套用公式對兩個分類變量的獨立性做出判斷.以這一教學目標指導教學,難免導致學生的上述認知障礙.為使學生達到更高層次的關系性理解,建議教師在本節(jié)內容的教學之前制定有效、可操作的教學目標,具體而言即根據(jù)授課對象的數(shù)學水平,確定其應突破上述認知障礙中的哪幾條,分別應達到什么層次.
4.2.2 激活直觀經驗作為先行組織者
先行組織者是先于學習任務呈現(xiàn)的一種引導性材料,對當前學習的內容起到定向、引導的作用.在正式教學之前,可呈現(xiàn)一些與獨立性檢驗有關的生活實例,以幫助學生積累或激活已有的“小概率反證法”的認知經驗,進而將其與反證法做比較,作為學習獨立性檢驗的先行組織者.如:①拋一枚硬幣連續(xù)5次均正面朝上會不會讓你懷疑其質地不均勻;②在轉盤抽獎中,中獎與不中獎的區(qū)域各占一半,但連續(xù)5次指針都指向不中獎區(qū)域,你會不會懷疑其中有貓膩;③有一名陌生人給你發(fā)來郵件,預測了某只股票連續(xù)五天的漲跌情況,經過你一周的檢驗,確實吻合!一周后陌生人又發(fā)來郵件,表示可以繼續(xù)為你提供預測信息,但需要收費,你愿意嗎?
4.2.3 提供數(shù)學建模的機會
歷史上,皮爾遜提出卡方檢驗的過程即根據(jù)實際問題建立統(tǒng)計模型進而解決問題的過程.而在實際教學中,讓學生經歷獨立性檢驗的再創(chuàng)造過程,既能加深其對這一原理的理解,亦能培養(yǎng)其數(shù)據(jù)收集、整理、觀察、分析與決策的能力.例如,選擇“性別與喜歡數(shù)學是否有關”作為教學素材[14],現(xiàn)場收集數(shù)據(jù)、制作列聯(lián)表、引導學生觀察列聯(lián)表判斷兩個變量是否有關、鼓勵其提出理性的判斷規(guī)則、選擇其中幾種較為典型的規(guī)則進行討論、形成獨立性檢驗的初步規(guī)則、教師補充部分知識完善規(guī)則.
5 教學價值
5.1 方法論層面
獨立性檢驗是一種很重要的統(tǒng)計學方法,體現(xiàn)了假設檢驗的思想,在很多研究領域中均有廣泛應用.該方法的教學貫徹了課程標準的總目標,即為學生適應現(xiàn)代社會的生產生活和進一步學習需要提供準備.
5.2 思維品質層面
學習獨立性檢驗,最有價值、最精彩的就是要學習其思維方式,即小概率反證法——在一次試驗中,若基于原假設的小概率事件發(fā)生了,則認為原假設不合理,推翻之.以上思維方式是很重要的統(tǒng)計素養(yǎng),但我國的高中課標僅僅將其列為“了解”層次!鑒于獨立性檢驗重要的思維訓練價值與廣泛應用,建議將相關目標提升到“理解”層次,并為具體教學提供更多課時.
5.3 情感領域目標的落實
三維目標包括知識與技能、過程與方法、情感態(tài)度價值觀,然而在實際教學中,一線教師最容易忽視的就是情感態(tài)度價值觀目標.具體原因有三:(1)情感態(tài)度價值觀目標是課程目標,一些專家認為沒必要在每節(jié)課的設計中撰寫該目標;(2)課程標準缺少對情感態(tài)度價值觀目標的內涵與外延的解讀,導致一線教師無法具體踐行;(3)教學任務重,在完成知識性和過程性目標之余,沒有時間進行落實情感領域的目標.
獨立性檢驗源于統(tǒng)計學家對生活直覺的總結和抽象化,其意義在于將變量間相關性的判斷由直覺水平上升到科學水平.學生對獨立性檢驗的深刻理解必將指引其體會原理中所蘊含的數(shù)理統(tǒng)計文化.
參考文獻
[1]中華人民共和國教育部.普通高中數(shù)學課程標準(實驗)[S].北京:人民教育出版社,2003.
[2]黃華勝.學生對統(tǒng)計推斷的理解[D].上海:華東師范大學,2014.
[3]普通高中課程標準實驗教科書.數(shù)學(選修2-3,A版)[M].北京:人民教育出版社,2009.
[4]普通高中課程標準實驗教科書.數(shù)學(選修1-2,A版)[M].北京:人民教育出版社,2009.
[5]普通高中課程標準實驗教科書.數(shù)學(選修2-3,A版)[M].北京:人民教育出版社,2006.
[6]何佐.獨立性檢驗應注意的問題[J].數(shù)學通報,2008(7):19-25.
[7]李勇.關于高中教材中獨立性檢驗知識呈現(xiàn)方式的思考[J].數(shù)學通報,2008(11):25-30.
[8]李士琦.PME:數(shù)學教育心理[M].上海:華東師范大學出版社,2001:129.
[9]Ministry of Education, Singapore.Mathematics Higher 1(syllabus8864)[PDF]. http://www.se-ab.gov.sg.
[10]Ministry of Education, Singapore. Mathematics Higher 2(syllabus9740)[PDF]. http://www.se-ab.gov.sg.
[11]NGA,CCSSO.Common Core State Standards for Mathematics[PDF]. http://www.corestandar-ds.org.
[12]ACARA.Senior Secondary Australian Curriculum:Mathematics [EB/OL]. http://www.australia-ncurriculum.edu.au/.Australian Curriculum.
[13]FNBE.National Core Curriculum for Upper Secondary Schools [EB/OL].http://www.oph.fi/do-wnload/47678_core_curricula_upper_secondary_education.
[14]余建國.獨立性檢驗的教學和反思[J].中小學數(shù)學(中學版),2010(Z2):49-51.