甘肅省天水市清水縣第六中學(xué)(741400) 何少杰
在人教A 版數(shù)學(xué)選修2-3 中學(xué)生分別學(xué)習(xí)了超幾何分布和二項(xiàng)分布兩節(jié)內(nèi)容,由于近年筆者在所在學(xué)校連續(xù)擔(dān)任高三復(fù)讀班數(shù)學(xué)教學(xué)工作,在接連幾年的??奸喚磉^程中發(fā)現(xiàn),對(duì)超幾何分布和二項(xiàng)分布發(fā)生混用的現(xiàn)象普遍存在.盡管是不同屆的學(xué)生,卻在同一類問題中栽了跟頭,這不由得引發(fā)了我的反思: 如何消除學(xué)生心中的疑惑,避免在這一類問題上重蹈覆轍,讓錯(cuò)誤不再重演! 為此我翻閱了不同教材中對(duì)兩種分布的定義,查閱了相關(guān)資料,對(duì)兩種分布的區(qū)別與聯(lián)系進(jìn)行了整理,并對(duì)為何錯(cuò)解中的結(jié)果正確進(jìn)行了說明.
題目1某精準(zhǔn)扶貧幫扶單位, 為幫助定點(diǎn)扶貧村真正脫貧, 堅(jiān)持扶貧與扶智相結(jié)合, 幫助精準(zhǔn)扶貧戶利用互聯(lián)網(wǎng)電商渠道銷售當(dāng)?shù)靥禺a(chǎn)蘋果.蘋果單果直徑不同單價(jià)不同,為了更好的銷售, 現(xiàn)從該精準(zhǔn)扶貧戶種植的蘋果樹上隨機(jī)摘下50個(gè)蘋果測(cè)量其直徑,經(jīng)統(tǒng)計(jì),其單果直徑分布在區(qū)間內(nèi)(單位mm),統(tǒng)計(jì)的莖葉圖如圖所示:
(Ⅰ)從單果直徑落在[72,80)的蘋果中隨機(jī)抽取3 個(gè),求這3 個(gè)蘋果單果直徑均小于76mm 的概率;
(Ⅱ)以此莖葉圖中單果直徑出現(xiàn)的頻率代表概率.直徑位于[65,90)內(nèi)的蘋果稱為優(yōu)質(zhì)蘋果,對(duì)于該精準(zhǔn)扶貧戶的這批蘋果,某電商提出兩種收購方案:
方案A:所有蘋果均以5 元/千克收購;
方案B:從這批蘋果中隨機(jī)抽取3 個(gè)蘋果,若都是優(yōu)質(zhì)蘋果,則按6 元/千克收購; 若有1 個(gè)非優(yōu)質(zhì)蘋果,則按5 元/千克收購;若有2 個(gè)非優(yōu)質(zhì)蘋果,則按4.5 元/千克收購;若有3個(gè)非優(yōu)質(zhì)蘋果,則按4 元/千克收購.
請(qǐng)你通過計(jì)算為該精準(zhǔn)扶貧戶推薦收益最好的方案.
題目2新冠疫情期間,停課不停學(xué),各學(xué)校組織上網(wǎng)課的同時(shí)為了解學(xué)生的課外學(xué)習(xí)時(shí)間,教育局從某所學(xué)校高二年級(jí)1000 名學(xué)生中隨機(jī)抽取了100 名學(xué)生,調(diào)查了一周的課外學(xué)習(xí)時(shí)間X.其中X ~N(9,1.32).
(Ⅰ)估計(jì)本周該高二年級(jí)學(xué)生課外學(xué)習(xí)時(shí)間在10.3 小時(shí)以上的人數(shù)(保留整數(shù));
(Ⅱ)從本校高二年級(jí)學(xué)生中隨機(jī)抽取5 人,求恰有3 人的課外學(xué)習(xí)時(shí)間超過10.3 小時(shí)的概率(結(jié)果保留兩位小數(shù)).
模考閱卷中發(fā)現(xiàn)不少學(xué)生在兩道題的第(Ⅱ)問出現(xiàn)了下面的錯(cuò)解:
題目1(Ⅱ)的錯(cuò)解方案B 中,50 個(gè)蘋果中有40 個(gè)優(yōu)質(zhì)蘋果,記Y為隨機(jī)抽取的3 個(gè)蘋果中優(yōu)質(zhì)蘋果的個(gè)數(shù),隨機(jī)變量Y的取值為0,1,2,3.則
方案A 中5 元/千克收購價(jià)相當(dāng)于B 方案中隨機(jī)抽取3個(gè)蘋果有2 個(gè)優(yōu)質(zhì)蘋果.因?yàn)镋Y=所以通過比較可知方案B 收益更好.
題目2 (Ⅱ)的錯(cuò)解由(Ⅰ)知在高二年級(jí)1000 名學(xué)生中, 課外學(xué)習(xí)時(shí)間在10.3 小時(shí)以上159 人, 不超過10.3小時(shí)共841 人, 記Y為隨機(jī)抽取的5 人中課外學(xué)習(xí)時(shí)間在10.3 小時(shí)以上的人數(shù), 則Y服從超幾何分布, 所以P(Y=3)=
為了分析錯(cuò)解,我們?cè)俳o出兩問的正解.
題目1(Ⅱ)的正確解法方案B 中,由題意以此莖葉圖中單果直徑出現(xiàn)的頻率代表概率,從這批蘋果中隨機(jī)抽取1 個(gè)蘋果,取出優(yōu)質(zhì)蘋果的概率為記Y為隨機(jī)抽取3 個(gè)蘋果中優(yōu)質(zhì)蘋果的個(gè)數(shù),則Y ~B(3,因此,得到
方案A 中5 元/千克收購價(jià)相當(dāng)于B 方案中隨機(jī)抽取3個(gè)蘋果有2 個(gè)優(yōu)質(zhì)蘋果.因?yàn)镋Y=所以通過比較可知方案B 收益會(huì)更好.
題目2(Ⅱ)的正確解法由(Ⅰ)知在高二年級(jí)1000 名學(xué)生中,任取1 人,學(xué)習(xí)時(shí)間超過10.3 小時(shí)的概率為0.1587,記Y為隨機(jī)抽取的5 人中課外學(xué)習(xí)時(shí)間在10.3 小時(shí)以上的人數(shù),則Y ~B(5,0.1587),所以P(Y=3)=C35·(0.1587)3·(1-0.1587)2≈0.03.
??家院笪覍?duì)這兩道題為何學(xué)生會(huì)出現(xiàn)誤判兩種分布的情況進(jìn)行了考查, 發(fā)現(xiàn)他們主要出現(xiàn)了下面的幾個(gè)問題:(1)第1 題中對(duì)“從這批蘋果中隨機(jī)抽取3 個(gè)蘋果”理解出現(xiàn)偏差,錯(cuò)解中一部分學(xué)生把“這批蘋果”錯(cuò)誤的理解為隨機(jī)摘下的50 個(gè)蘋果,屬于審題不嚴(yán)造成的錯(cuò)解.(2)兩道題中一部分學(xué)生看到“抽取”二字,不分青紅皂白馬上肯定地認(rèn)為考查的是超幾何分布,造成錯(cuò)解.(3)有一部分學(xué)生考慮到了抽取的方式是無放回抽取,符合超幾何分布的抽樣模型,所以他認(rèn)為一定是超幾何分布,而沒有考慮到盡管都是無放回抽樣,但總體數(shù)目都很大,抽取少量樣本時(shí)可以認(rèn)為每一次抽樣中條件都未發(fā)生改變,是典型的二項(xiàng)分布,屬于對(duì)兩種分布的概念不清造成的錯(cuò)解.那么這兩種分布的本質(zhì)區(qū)別是什么? 為何它們的數(shù)學(xué)期望一致呢? 如何在解題時(shí)避免誤判呢?
1.概念不同
超幾何分布 一般地, 在含有M(M≤N)件次品的N件產(chǎn)品中, 任取n(n≤N)件產(chǎn)品, 離散型隨機(jī)變量X表示這n件產(chǎn)品中的次品數(shù), 則事件{X=k}發(fā)生的概率P(X=k)=, (k= 0,1,2,··· ,m), 其中m= mⅰn{M,n}且n≤N,M≤N,n,M,N ∈N*,于是隨機(jī)變量X的分布列具有表1 的形式,則稱隨機(jī)變量X服從參數(shù)為n,M,N的超幾何分布,記作X ~H(n,M,N).
表1
二項(xiàng)分布 一般地, 若一次試驗(yàn)只有兩個(gè)可能的結(jié)果A或, 事件A發(fā)生的概率為p, 事件發(fā)生的概率為q=1-p,在n次獨(dú)立重復(fù)試驗(yàn)中,離散型隨機(jī)變量X表示這n次獨(dú)立重復(fù)試驗(yàn)中事件A出現(xiàn)的次數(shù),則事件{X=k}發(fā)生的概率P(X=k)=,其中k=0,1,2,··· ,n,0<p <1,于是隨機(jī)變量X的分布列具有表2 的形式,則稱隨機(jī)變量X服從參數(shù)為n,p的二項(xiàng)分布,記作X ~B(n,p)
表2
2.隨機(jī)試驗(yàn)的條件不同
超幾何分布在試驗(yàn)過程中必須給定總體數(shù),而且總體必須由數(shù)目明確的“正品”與“次品”兩類構(gòu)成.
二項(xiàng)分布進(jìn)行的試驗(yàn)無需知道總體數(shù).
3.隨機(jī)試驗(yàn)類型與特點(diǎn)不同
超幾何分布進(jìn)行的隨機(jī)試驗(yàn)是在含有M(M≤N)件次品的N件產(chǎn)品中,任取n(n≤N)件產(chǎn)品,它包含了n次試驗(yàn),是滿足古典概型的隨機(jī)試驗(yàn),即每個(gè)基本事件發(fā)生的可能性都相等,基本事件的總數(shù)是有限的.這n次試驗(yàn)中第一次是從N件產(chǎn)品中任取1 件,第二次從N -1 件產(chǎn)品中任取1 件,……,因此每一次試驗(yàn)都會(huì)相互影響,不是獨(dú)立重復(fù)試驗(yàn).
二項(xiàng)分布進(jìn)行的隨機(jī)試驗(yàn)是在同一條件下進(jìn)行的n次獨(dú)立重復(fù)試驗(yàn).
4.隨機(jī)試驗(yàn)的模型與結(jié)果不同
超幾何分布進(jìn)行的隨機(jī)試驗(yàn)是無放回抽樣模型,每一次試驗(yàn)的結(jié)果數(shù)較多,比如在有3 件次品的10 件產(chǎn)品中任取1件產(chǎn)品,不同的結(jié)果有種.
二項(xiàng)分布進(jìn)行的隨機(jī)試驗(yàn)是重復(fù)試驗(yàn),所以每次抽取條件不變,可以理解為有放回抽樣模型.而且每一次試驗(yàn)只有兩個(gè)對(duì)立的結(jié)果A或,稱為伯努利試驗(yàn).
5.隨機(jī)變量X表示的事件不同
超幾何分布中離散型隨機(jī)變量X表示抽取出的這n件產(chǎn)品中的次品數(shù).所以事件{X=k}表示抽取的n件產(chǎn)品中有k件次品,n-k件正品.
二項(xiàng)分布中離散型隨機(jī)變量X表示這n次獨(dú)立重復(fù)試驗(yàn)中事件A出現(xiàn)的次數(shù),即成功次數(shù).所以事件{X=k}表示n次獨(dú)立重復(fù)試驗(yàn)中事件A出現(xiàn)了k次,事件出現(xiàn)了n-k次.
6.隨機(jī)變量X表示的事件概率計(jì)算公式不同
超幾何分布進(jìn)行的隨機(jī)試驗(yàn)是滿足古典概型的隨機(jī)試驗(yàn),所以事件{X=k}發(fā)生的概率P(X=k)=其中k=0,1,2,··· ,m,m=mⅰn{M,n}.
二項(xiàng)分布中進(jìn)行的是獨(dú)立重復(fù)試驗(yàn), 滿足獨(dú)立事件的概率乘法公式, 所以事件{X=k}發(fā)生的概率P(X=k)=(1-p)n-k,其中k=0,1,2,··· ,n.
7.隨機(jī)變量X的概率計(jì)算條件不同
超幾何分布概率計(jì)算會(huì)在題設(shè)中給出抽樣個(gè)數(shù)n、總體數(shù)N,會(huì)給出或可求出總體中兩類產(chǎn)品中的“次品”數(shù)M.
二項(xiàng)分布概率計(jì)算會(huì)在題設(shè)中暗示給出或者可求出成功概率p.
8.隨機(jī)變量X的數(shù)學(xué)期望公式不同
(1)若X ~H(n,M,N),則EX=
證明由
則EX=為從含有M件次品的N件產(chǎn)品中取出一件次品以后, 抽取n -1 件產(chǎn)品的不同取法種數(shù), 故所以,證畢.
(2)若X ~B(n,p),則EX=np.
證明同①有則
所以EX=np,證畢.
因?yàn)樵趎次獨(dú)立重復(fù)試驗(yàn)中A事件發(fā)生的概率為p,所以可以理解為一次隨機(jī)試驗(yàn)中A事件平均發(fā)生p次,則在n次獨(dú)立重復(fù)試驗(yàn)中A事件平均發(fā)生np次.
9.兩種分布的相同點(diǎn)
(1)兩者都是離散型隨機(jī)變量分布,且隨機(jī)變量都只能取非負(fù)整數(shù)值.
(2)錯(cuò)解與正解中兩者的數(shù)學(xué)期望會(huì)相等.正因?yàn)槿绱?在抽樣問題中出現(xiàn)答案貌似“正確”, 但卻是錯(cuò)解的現(xiàn)象以后,有些同學(xué)甚至很堅(jiān)定地認(rèn)為自己的錯(cuò)解是正確的.究其原因是在題目中取到“次品”概率p=所以錯(cuò)誤的解法也會(huì)得到正確的期望值.
10.兩種分布之間的聯(lián)系
當(dāng)總體數(shù)N較小時(shí),無放回抽樣中按照超幾何分布計(jì)算的概率與有放回抽樣中按照二項(xiàng)分布計(jì)算的概率差異比較明顯,當(dāng)總體數(shù)N不斷變大時(shí)兩種分布計(jì)算的概率逐漸接近,當(dāng)總體數(shù)N無限或很大時(shí),此時(shí)無放回抽取少量樣品對(duì)次品率的影響很微小,次品率p此時(shí)是一個(gè)穩(wěn)定值,兩種分布計(jì)算的概率相等,即
證明因?yàn)?/p>
又n,k是常數(shù),則
因此判斷兩種分布時(shí), 不能機(jī)械地以抽樣方法來判定,對(duì)于總體數(shù)N很大的這種抽取,盡管是無放回抽樣,但超幾何分布已經(jīng)近似為二項(xiàng)分布了,我們都把它看成是n次獨(dú)立重復(fù)試驗(yàn),按照二項(xiàng)分布來解題.
要避免發(fā)生兩種分布的誤判,除了需要在知識(shí)方面強(qiáng)化對(duì)兩種分布概念的理解與辨析,理清概念的本質(zhì)區(qū)別,提高對(duì)兩種分布的辨識(shí)力之外,筆者發(fā)現(xiàn)學(xué)生還普遍存在審題不嚴(yán)的問題,由于概率統(tǒng)計(jì)題目包含文字較多,加之部分題目中條件可能會(huì)以圖表的形式給出,在緊張的考試過程中,他們就更加難以從繁冗的已知條件中找準(zhǔn)關(guān)鍵字句提取重要信息,往往憑借并不完善的經(jīng)驗(yàn)選取概率模型解題,但基于兩種分布在一定的條件下可以相互轉(zhuǎn)化的特點(diǎn),學(xué)生在解題時(shí)極易發(fā)生兩種分布的誤判,所以為了避免發(fā)生誤判還需培養(yǎng)良好的審題習(xí)慣,找準(zhǔn)題目中的關(guān)鍵字句進(jìn)行分析,跳出題目設(shè)置的“陷阱”,走出認(rèn)識(shí)誤區(qū).那么為了讓錯(cuò)誤不再重演,如何審題才能避免發(fā)生兩種分布的誤判? 通過以上對(duì)兩種分布的概念解讀,不難發(fā)現(xiàn)在判斷兩種分布時(shí)需要做到以下五“看”:
(1)看總體數(shù)是否給出,未給出或若給出總體數(shù)較大一般考查二項(xiàng)分布.
(2)看一次抽取抽中“次品”概率是否給出,若給出或可求出一般考查二項(xiàng)分布.
(3)看一次抽取的結(jié)果是否只有兩個(gè)結(jié)果,若只有兩個(gè)對(duì)立的結(jié)果A或,一般考查二項(xiàng)分布.
(4)看抽樣方法,如果是有放回抽樣,一定是二項(xiàng)分布;若是無放回抽樣,需要考慮總體數(shù)再確定.
(5)看每一次抽樣試驗(yàn)中,事件是否獨(dú)立,事件發(fā)生概率是否不變,若事件獨(dú)立且概率不變,一定考查二項(xiàng)分布,這也是判斷二項(xiàng)分布的最根本依據(jù).
概率統(tǒng)計(jì)本身是一部分既難教又難學(xué)的知識(shí),其中不乏一些似是而非又違背直觀感覺的易混內(nèi)容,就高中階段學(xué)生的認(rèn)知水平而言更加難以駕馭.而教材作為眾多專家智慧的結(jié)晶,是廣大教師與學(xué)生的第一手資料,其中的案例都是經(jīng)過仔細(xì)挑選,反復(fù)錘煉過的經(jīng)典案例,這些案例都承載著很強(qiáng)的教育功能,很多高考題目源于教材中的經(jīng)典案例,這就要求教師在教學(xué)中從教材出發(fā),緊扣概念,深入鉆研教材中的經(jīng)典案例,把握好不同知識(shí)之間的內(nèi)在聯(lián)系與本質(zhì)區(qū)別.
對(duì)于高中教材中出現(xiàn)的容易混淆的基本概念: 隨機(jī)性、確定性;頻率、概率;穩(wěn)定于、趨近于;古典概型、幾何概型;互斥事件、獨(dú)立事件等,作為新增教學(xué)內(nèi)容,初學(xué)概率統(tǒng)計(jì)時(shí)非常容易將新概念聯(lián)系到自己的生活經(jīng)驗(yàn)中,往往這些概念在生活中的定義與數(shù)學(xué)定義不完全一致,會(huì)有一定的偏差,從而產(chǎn)生認(rèn)識(shí)誤區(qū),所以教學(xué)時(shí)應(yīng)該結(jié)合具體實(shí)例對(duì)學(xué)生的認(rèn)知加以引導(dǎo),對(duì)錯(cuò)誤的認(rèn)知加以矯正,通過具體實(shí)例加深對(duì)概念的理解,最終走出誤區(qū),徹底吃透概念.事實(shí)上,概念教學(xué)應(yīng)該是數(shù)學(xué)教學(xué)的重中之重, 概率統(tǒng)計(jì)的教學(xué)也不例外,因?yàn)閿?shù)學(xué)概念是數(shù)學(xué)思維形成的起點(diǎn),對(duì)數(shù)學(xué)概念的理解與運(yùn)用是數(shù)學(xué)思維能力得以發(fā)展的核心.
對(duì)于高中教材中出現(xiàn)的三種離散型隨機(jī)變量服從的分布: 兩點(diǎn)分布、二項(xiàng)分布、超幾何分布,最關(guān)鍵的是要讓學(xué)生正確區(qū)分其對(duì)應(yīng)的隨機(jī)試驗(yàn)?zāi)P?理清概念的關(guān)鍵點(diǎn),讓他們意識(shí)到這三種分布的聯(lián)系.當(dāng)獨(dú)立重復(fù)試驗(yàn)中的試驗(yàn)次數(shù)n=1 時(shí),二項(xiàng)分布就會(huì)化為兩點(diǎn)分布,超幾何分布的極限分布是二項(xiàng)分布;對(duì)于概率模型的正確選擇,可以嘗試分類集中訓(xùn)練,讓學(xué)生通過具體的問題情境感知到它們之間的區(qū)別與聯(lián)系,在教師的指導(dǎo)下逐漸有所感悟.
對(duì)于高中教材中出現(xiàn)的連續(xù)型隨機(jī)變量分布——正態(tài)分布,可以在教學(xué)時(shí)指出當(dāng)二項(xiàng)分布中成功概率p= 0.5 時(shí),二項(xiàng)分布的分布圖是對(duì)稱的,這種情況下當(dāng)n逐漸增大時(shí),二項(xiàng)分布從分布圖可以看到會(huì)越來越接近于正態(tài)分布,也就是說二項(xiàng)分布的極限分布是正態(tài)分布,了解這些知識(shí)不僅可以讓他們更清楚地認(rèn)識(shí)概念的源與流,從而提高對(duì)幾種分布的辨識(shí)能力,避免發(fā)生模型混用的錯(cuò)誤,而且還能為以后學(xué)生的進(jìn)一步學(xué)習(xí)奠定良好的基礎(chǔ).