何本勝
一、教學(xué)目標
1.知識與技能:通過對典型案例的探究了解獨立性檢驗的基本思想,會對兩個分類變量進行獨立性檢驗,明確獨立性檢驗的基本步驟,能利用獨立性檢驗的基本思想來解決實際問題.
2.過程與方法:通過探究“吸煙是否與患肺癌有關(guān)系”引出對分類變量是否有關(guān)的獨立性檢驗問題.通過列聯(lián)表、等高條形圖直觀感覺到吸煙和患肺癌可能相關(guān),這一直覺來自于對數(shù)據(jù)的初步處理.我們需要知道通過樣本數(shù)據(jù)有多大把握認為兩個分類變量有關(guān),具體過程是讓學(xué)生在直觀感受的基礎(chǔ)上深入分析處理數(shù)據(jù),提高數(shù)據(jù)分析和處理的能力.
3.情感、態(tài)度與價值觀:讓學(xué)生通過本節(jié)課的學(xué)習(xí)認識到數(shù)學(xué)與實際生活是緊密相連的,學(xué)會直觀和客觀、粗略和精確地評估兩個分類變量是否相關(guān).培養(yǎng)學(xué)生處理實際問題的能力,提高學(xué)生自我思考的能力,讓學(xué)生體驗到統(tǒng)計方法的作用,體驗到統(tǒng)計方法的科學(xué)性和嚴謹性.
二、教學(xué)重、難點
重點:獨立性檢驗的基本思想及進行獨立性檢驗的基本步驟.
難點:獨立性檢驗的基本思想;隨機變量提出的背景和理論基礎(chǔ).
三、教學(xué)方法
以層層設(shè)問的方式引導(dǎo)學(xué)生逐步了解獨立性檢驗的理論基礎(chǔ)和基本應(yīng)用;結(jié)合講授法幫助學(xué)生掌握本節(jié)課的內(nèi)容和思想方法;用分組合作的方式引導(dǎo)學(xué)生對本節(jié)內(nèi)容進行總結(jié),全面提升學(xué)生的思想認識.
四、教學(xué)過程設(shè)計
1.創(chuàng)設(shè)情境,提出問題
PPT出示題為“韓國肺癌患者敗訴 狀告煙草公司賠償無果”“煙民患肺癌去世 煙草公司被判236億美元天價賠償”的新聞(具體內(nèi)容略).
問題1:韓國煙草公司反駁的理由是什么?
問題2:應(yīng)從哪幾方面數(shù)據(jù)研究吸煙與患肺癌的關(guān)系?
設(shè)計意圖:通過現(xiàn)實中的具體案例激發(fā)學(xué)生的好奇心,為引入本節(jié)課內(nèi)容——分類變量獨立性檢驗“吸煙與患肺癌是否有關(guān)”做好準備,通過引導(dǎo)學(xué)生回答問題引出分類變量、2×2列聯(lián)表等概念.
2.啟發(fā)引導(dǎo),探究新知
為研究吸煙是否對患肺癌有影響,某腫瘤研究所隨機地調(diào)查了9 965人.
問題1:觀察統(tǒng)計表格具有怎樣的結(jié)構(gòu)特點,核心數(shù)據(jù)在哪?
1.分類變量——變量的不同“值”表示個體所屬的不同類別,這樣的變量稱為分類變量
2.列聯(lián)表——像上表這樣列出的兩個分類變量的頻數(shù)表稱為列聯(lián)表.在高中階段我們只研究2×2列聯(lián)表.
設(shè)計意圖:引導(dǎo)學(xué)生從數(shù)學(xué)的角度觀察研究對象,自然生成本節(jié)課所要學(xué)習(xí)的新的概念:分類變量和2×2列聯(lián)表.
問題2:從表格中還能得到其他信息嗎?
在不吸煙者中患肺癌的比重是 ;在吸煙者中患肺癌的比重是 .
得出結(jié)論:吸煙者患肺癌的可能性大.
相對于表格,圖像能更直觀地看出差異.
等高條形圖:
在這個等高條形圖中,兩者之間的比重有明顯差異,所以吸煙與患肺癌很可能是有關(guān)的.
問題3:上述結(jié)論是否可靠?或者說我們有多大可能性認為它們有關(guān)?這在數(shù)學(xué)里屬于什么問題?
概率問題.
對所研究問題的數(shù)學(xué)表述:
“吸煙”記為事件A,“患肺癌”記為事件B,“吸煙與患肺癌有關(guān)”即事件A與事件B有關(guān).
問題的反面是:事件A與事件B相互獨立.
問題4:怎么判斷事件A與事件B相互獨立?
P(AB)=P(A)·P(B)
設(shè)計意圖:通過對統(tǒng)計表數(shù)據(jù)的初步處理和對等高條形圖的直接觀察,讓學(xué)生感受吸煙與是否患肺癌之間的聯(lián)系,在學(xué)生充分了解列聯(lián)表的數(shù)據(jù)信息后,引導(dǎo)學(xué)生運用概率知識分析吸煙與患肺癌是否有關(guān),由感性的直觀分析過渡到理性的精確分析.
問題5:驗證兩事件是否無關(guān),沒有概率如何處理?
以頻率來代替概率.
將“吸煙”記為事件A, “患肺癌”記為事件B.
P(AB)= P(A)= P(B)=
P(AB)≠P(A)·P(B)
左右兩邊不等,如果相差不多意味兩事件無關(guān)的可能性比較大,若相差較多意味著兩事件相關(guān)的可能性較大.不等式左邊是實際值,右邊是無關(guān)的前提下的理論值,從而得到一個研究兩事件相關(guān)的思路:通過研究樣本數(shù)據(jù)在無關(guān)的前提下對應(yīng)的理論值和實際值的差異的大小來判斷兩個分類變量是否相關(guān).
讓問題由特殊到一般,把表中數(shù)字用字母代替,得到如下用字母表示的列聯(lián)表:
在假設(shè)兩分類變量無關(guān)的前提下估算理論值和實際值的差異,由此估計吸煙且患肺癌人數(shù)約為 ,同理吸煙且不患病的人數(shù)約為 ,不吸煙且患病的人數(shù)約為 ,不吸煙且不患病的人數(shù)約為 .
問題6:如何表示實際和理論的差異?
類比回歸分析中表示殘差的方式,可以采用平方和形式.
問題7:如何求出樣本容量對差異的影響?
可以通過比例形式衡量偏差,回避容量對差異的影響.
為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標準,基于上面的分析,在統(tǒng)計學(xué)中構(gòu)造一個隨機變量K2=,其中n=a+b+c+d,為樣本容量.
在成立的前提下,即“吸煙與患肺癌沒有關(guān)系”,K2應(yīng)該很小.
計算得到的觀測值為:
k=≈56.632
卡方的觀測值越大,兩變量相關(guān)的可能性就越大,大與小需要看臨界值.
臨界值表:
設(shè)計意圖:假設(shè)兩個分類變量無關(guān),學(xué)生可以通過所學(xué)的概率公式對吸煙與患肺癌之間的關(guān)系在概率層面作出判斷,符合學(xué)生的認知規(guī)律,可以提高學(xué)生的思維能力,體現(xiàn)了特殊到一般的思維方法.通過分析總結(jié)差異產(chǎn)生的原因,類比回歸分析中殘差的處理思路,引導(dǎo)學(xué)生建立體現(xiàn)理論和實際差異的統(tǒng)計量卡方的表達式,突破了難點.解讀臨界值表,為獨立性檢驗做好準備.
假設(shè)H0:吸煙與患肺癌沒有關(guān)系.
K2的觀測值為
k=≈56.632
根據(jù)臨界值表可知,(K2≥6.635)≈0.01,
而56.632遠大于6.635,所以有理由判斷H0不成立,即有99%的把握認為吸煙與患肺癌有關(guān)系.
獨立性檢驗定義:這種利用隨機變量來判斷“兩個分類變量有關(guān)系”的方法,稱為兩個分類變量的獨立性檢驗.
判斷步驟:(1)提出假設(shè)H0:兩個分類變量沒有關(guān)系;(2)根據(jù)2×2列聯(lián)表與公式計算K2的觀測值k;(3)查對臨界值,作出判斷.
問題8:獨立性檢驗的原理和反證法的區(qū)別和聯(lián)系.
設(shè)計意圖:將獨立性檢驗與反證法對比,加深學(xué)生對獨立性檢驗思想方法的認識,同時幫助學(xué)生建立新舊知識的聯(lián)系,合理建構(gòu)思維體系.
3.鞏固新知,強化訓(xùn)練
問題1:在現(xiàn)實生活中,有人說禿頂與患心臟病有關(guān),我們?nèi)绾伪嫖稣婕伲?/p>
問題2:如果想調(diào)查禿頂與患心臟病是否相關(guān),需要從哪幾個方面調(diào)查數(shù)據(jù)?
例1:在某醫(yī)療機構(gòu)通過調(diào)查得到如下數(shù)據(jù):
利用獨立性檢驗法判斷有多大程度認為禿頂與患心臟病有關(guān).
設(shè)計意圖:通過鞏固練習(xí)強化學(xué)生自覺利用統(tǒng)計知識解決現(xiàn)實生活中的問題的習(xí)慣,提升學(xué)生自我思考能力.
4.總結(jié)提升
總結(jié)本節(jié)所學(xué)內(nèi)容、獨立性檢驗的步驟、獨立性檢驗的思想方法.
5.板書設(shè)計(略)