廣東省佛山市順德區(qū)第一中學(xué)高中部(528300) 楊志龍
人教A 版《選修2-3》P.58 的“探究與發(fā)現(xiàn)”中有這樣一個(gè)問題:“服從二項(xiàng)分布的隨機(jī)變量取何值時(shí),概率最大? ”課本先由具體實(shí)例出發(fā):如果某射手每次射擊擊中目標(biāo)的概率為0.8,那么他在10 次射擊中,最有可能擊中目標(biāo)幾次? 然后提出更一般性的思考:如果X ~B(n,p),其中0<p <1,那么當(dāng)k由0 增大到n時(shí),P(X=k)是怎樣變化的?k取何值時(shí),P(X=k)最大?[1]
我們知道P(X=k)=, 其中p+q=1,p,q ∈R+.上述問題可轉(zhuǎn)述為:已知0<p <1, 當(dāng)k由0 增大到n時(shí), 關(guān)于以k為自變量的離散型函數(shù)(數(shù)列)f(k)=是否存在最值,其最值是多少? (問題1)
如果n,k固定,將p視作自變量,再提出另一個(gè)問題:已知0<p <1,p+q= 1,P(X=k)=又可以看作一個(gè)關(guān)于p的連續(xù)型函數(shù)f(p)=那么當(dāng)p取不同值時(shí),f(p)是否存在最值,其最值是多少? (問題2)
問題1探究函數(shù)f(k)=(k=0,1,2,...,n),p+q=1,p,q ∈R+的最值取得情況,其中k為自變量.
問題1 的解答
(1)當(dāng)k1∈(0,1)時(shí),如圖1,f(k)為一個(gè)單調(diào)遞減數(shù)列,M=f(0),m=f(n);(結(jié)論1)當(dāng)k1=1 時(shí),如圖2,f(k)為從第二項(xiàng)起的單調(diào)遞減數(shù)列,M=f(0)=f(1),m=f(n).(結(jié)論2)
(2)當(dāng)k1∈(1,n)時(shí),若k1/∈Z 時(shí),如圖3,f(0)<f(1)<··· <f([k1]-1)<f([k1])>··· >f(n -1)>f(n),M=f([k1]),m= min{f(0),f(n)}.(結(jié) 論3)(注:[x]為取整函數(shù), 表示不大于x的最大整數(shù), 以下同)若k1∈Z 時(shí), 如圖4,f(0)<f(1)<··· <f(k1-1)=f(k1)>··· >f(n-1)>f(n),M=f(k1-1)=f(k1),m=min{f(0),f(n)}.(結(jié)論4)
圖1
圖2
圖3
(3)當(dāng)k1=n時(shí),如圖5,f(k)從第1 項(xiàng)到第n項(xiàng)為遞增數(shù)列,第n+1 項(xiàng)與第n項(xiàng)相等,M=f(n-1)=f(n),m=f(0).(結(jié)論5)當(dāng)k1>n時(shí),如圖6,f(k)為一個(gè)單調(diào)遞增數(shù)列,M=f(n),m=f(0);(結(jié)論6)
圖4
圖5
圖6
(筆者按:為了方便觀察, 上述圖象實(shí)際為將f(k)的圖象縱向拉伸10 倍,以n=7,p取不同情況下用GEOGEBRA軟件繪制, 其中n,p依次滿足:圖1:n= 7,p= 0.1; 圖2:n= 7,p= 0.125; 圖3:n= 7,p= 0.30; 圖4:n= 7,p=0.25;圖5:n=7,p=0.875;圖6:n=7,p=0.9.)
問題2探究函數(shù)f(p)=(k=0,1,2,··· ,n,n ∈Z+,0<p <1,p+q=1)的最值取得情況,其中p為自變量,n,k為常數(shù).
問題2 的解答 由
可知,
(1)當(dāng)k= 0 時(shí),f′(p)<0 恒成立,f(p)在(0,1)上單調(diào)遞減,f(p)無最值;(結(jié)論7)
(2)當(dāng)k=n時(shí),f′(p)>0 恒成立,f(p)在(0,1)上單調(diào)遞增,f(p)無最值;(結(jié)論8)
(3)當(dāng)k=1,2,··· ,n-1 時(shí),由于當(dāng)p <時(shí),f′(p)>0,f(p)單調(diào)遞增,當(dāng)p >時(shí),f′(p)<0,f(p)單調(diào)遞減,故當(dāng)p=時(shí),f(p)取得最大值,f(p)max=又當(dāng)p →0,f(p)→0,當(dāng)p →1 時(shí),f(p)→0,從而f(p)無最小值.(結(jié)論9)
上述兩個(gè)問題的解決運(yùn)用了函數(shù)與方程的思想.問題1中通過解不等式≥1 比較f(k)與f(k-1)的大小.問題2 中通過求導(dǎo)法判斷函數(shù)的單調(diào)性求出最值.出于實(shí)際意義,一般更關(guān)注概率的最大值點(diǎn)的取得情況.存在最大值點(diǎn)的前提下,若視k為自變量,最大值點(diǎn)為某個(gè)隨機(jī)變量,也可能是兩個(gè).若視p為自變量,f(p)=,n,k為常數(shù),相當(dāng)于以p為自變量的多項(xiàng)式函數(shù)在(0,1)求最大值,最大值點(diǎn)只有一個(gè).
下舉模擬題與高考題中,代數(shù)法求二項(xiàng)分布概率的最大值點(diǎn)的試題,例1 為自編題.
2.4.1 期望為整數(shù)時(shí)求最大值點(diǎn)k0
例1(自編題)已知X ~B(n,p),n ∈Z+,0<p <1,若E(X)∈Z, 記P(X=k)取最大值時(shí)的k為k0, 求證:k0=E(X).
證明因?yàn)镋(X)=np ∈Z,0<p <1,所以np≥1,且(n+1)p ∈(1,n),符合結(jié)論3 的前提,又(n+1)p/∈Z,且[(n+1)p]=np=E(X).所以由結(jié)論3 知k0=E(X).
評(píng)析例1 闡述了如下事實(shí):在二項(xiàng)分布中,若數(shù)學(xué)期望為整數(shù),則當(dāng)隨機(jī)變量k等于期望時(shí),概率最大.如本文起始處課本問題的答案為最可能擊中k=10×0.8=8 次.
2.4.2 期望不為整數(shù)時(shí)求最大值點(diǎn)k0
例2(2020年廣州市普通高中畢業(yè)班綜合測(cè)試(二)理科數(shù)學(xué)第20 題)當(dāng)今世界科技迅速發(fā)展,信息日新月異.為增強(qiáng)全民科技意識(shí),提高公眾科學(xué)素養(yǎng),某市圖書館開展了以“親近科技、暢想未來”為主題的系列活動(dòng),并對(duì)不同年齡借閱者對(duì)科技類圖書的情況進(jìn)行了調(diào)查.該圖書館從只借閱了一本圖書的借閱者中隨機(jī)抽取100 名,數(shù)據(jù)統(tǒng)計(jì)如下表:
借閱科技類圖書(人)借閱非科技類圖書(人)年齡不超過50 歲20 25年齡大于50 歲10 45
(1)是否有99%的把握認(rèn)為年齡與借閱科技類的圖書有關(guān)?
(2)該圖書館為了鼓勵(lì)市民借閱科技類圖書,規(guī)定市民每借閱一本科技類圖書獎(jiǎng)勵(lì)積分2 分,每借閱一本非科技類圖書獎(jiǎng)勵(lì)積分1 分,積分累計(jì)一定數(shù)量可以積分換購自己喜愛的圖書.用樣本中的頻率作為概率的估計(jì)值.
(i)現(xiàn)有3 名借閱者每人借閱一本圖書,記此3 人增加的積分總和為隨機(jī)變量,求的分布列和數(shù)學(xué)期望;
(ii)現(xiàn)從只借閱一本圖書的借閱者中選取16 人,則借閱科技類圖書最有可能的人數(shù)是多少?
簡(jiǎn)解(1)略; (2)(i)略; (ii)記16 人中借閱科技類圖書的人數(shù)為X,則隨機(jī)變量X ~B(16,).設(shè)借閱科技類圖書最有可能的人數(shù)是k(k= 0,1,2,··· ,16), 由結(jié)論3 知當(dāng)k=[(16+1)·]=5 時(shí),P(X=k)最大.
評(píng)析實(shí)際考試中,第2 問的第(ii)問,不少考生這樣解答:“由于E(X)= 16×= 4.8≈5, 故當(dāng)k= 5 時(shí), 概率最大.”他們的思路是先求數(shù)學(xué)期望,后四舍五入求k的值.這樣思考的邏輯是錯(cuò)誤的,如反例:若X ~B(1000,0.9773),E(X)=1000×0.9773=977.3≈977,按照上述思路,應(yīng)是當(dāng)k= 977 時(shí)概率P(X=k)最大,實(shí)際由結(jié)論3 可知,當(dāng)k=[(1000+1)×0.9773]=978 時(shí)概率P(X=k)才最大.
2.4.3 p 為自變量時(shí)求最大值點(diǎn)p0
例3(2018年高考全國(guó)Ⅰ卷理科第20 題)某工廠的某種產(chǎn)品成箱包裝,每箱200 件,每一箱產(chǎn)品在交付用戶之前要對(duì)產(chǎn)品作檢驗(yàn),如檢驗(yàn)出不合格品,則更換為合格品.檢驗(yàn)時(shí),先從這箱產(chǎn)品中任取20 件作檢驗(yàn),再根據(jù)檢驗(yàn)結(jié)果決定是否對(duì)余下的所有產(chǎn)品作檢驗(yàn),設(shè)每件產(chǎn)品為不合格品的概率都為p(0<p <1),且各件產(chǎn)品是否為不合格品相互獨(dú)立.
(1)記20 件產(chǎn)品中恰有2 件不合格品的概率為f(p),求f(p)的最大值點(diǎn)p0;(2)略.
簡(jiǎn)解(1)記20 件產(chǎn)品中的次品件數(shù)為X, 由題設(shè)知X ~ B(20,p)[2], 則問題可理解為求f(p)=的最大值,其中n= 20,k= 2,0<p <1,由結(jié)論9 可知, 當(dāng)時(shí),f(p)最大, 所以p0=0.1.
評(píng)析命題者以概率p為自變量,視角新穎.問題的解決蘊(yùn)含了函數(shù)與方程的思想.導(dǎo)數(shù)法看似常規(guī),但因在平時(shí)概率、統(tǒng)計(jì)試題訓(xùn)練中鮮有出現(xiàn),考生頗為生疏.另外,文中例1-3 中由于結(jié)論在前已證而直接運(yùn)用,在實(shí)際解題中學(xué)生應(yīng)將結(jié)論的推證過程推演一遍.
上述問題的解決中,二項(xiàng)分布函數(shù)f(k)圖象的中間大、兩邊小的特征與正態(tài)密度曲線的形狀非常接近,二項(xiàng)分布與正態(tài)分布之間會(huì)否存在關(guān)聯(lián)?
棣莫弗(De Moivre)-拉普拉斯(Laplace)定理(中心極限定理[3])設(shè)在獨(dú)立試驗(yàn)序列中,事件A在各次試驗(yàn)中發(fā)生的概率為p(0<p <1),隨機(jī)變量Yn表示事件A在n次試驗(yàn)中發(fā)生的次數(shù),則有
中心極限定理說明:當(dāng)n充分大時(shí), 服從二項(xiàng)分布B(n,p)的隨機(jī)變量Yn近似地服從正態(tài)分布N(np,npq).[3]當(dāng)n不是很大的時(shí)候,二項(xiàng)分布也可以近似地看成正態(tài)分布,圖象滿足中間大,兩邊小的規(guī)律.
圖7
圖8-1
問題1 中,用中心極限定理去理解,f(k)的圖象呈中間大,兩邊小的規(guī)律.特別地,當(dāng)數(shù)學(xué)期望的取值介于1 與n中間時(shí),圖象呈先增后減的趨勢(shì),類似于開口向下的二次函數(shù).當(dāng)np是整數(shù)時(shí),最大值點(diǎn)就是期望,如圖7;當(dāng)np不是整數(shù)的時(shí)候,由于f(k)的圖象并不一定關(guān)于k=np對(duì)稱,仍需比較與它相鄰的兩個(gè)隨機(jī)變量的概率,較大的就是最大值點(diǎn),如圖8-1,圖8-2;如果兩個(gè)相等,兩個(gè)都是最大值點(diǎn),如圖9.(注:圖7,圖8-1,圖8-2,圖9 均為二項(xiàng)分布的概率分布條形圖.)
圖8-2
圖9
問題2 中,f(p)=, 0<p <1,p+q= 1,n,k為常數(shù),p為變量.等價(jià)構(gòu)造有放回摸球試驗(yàn):f(p)=可理解為在有大小形狀相同的m個(gè)黑球,n-m個(gè)白球的n個(gè)球中, 其中m為變量, 有放回的隨機(jī)摸取n次, 恰好摸到了k個(gè)黑球的概率.事實(shí)上, 將摸到黑球的個(gè)數(shù)記為X, 則X ~B(n,p), 其中p=由中心極限定理知, 當(dāng)k在數(shù)學(xué)期望附近取值時(shí), 概率相對(duì)較大, 而E(X)=np=n·=m, 由于m為整數(shù), 故當(dāng)且僅當(dāng)m=k,即p=時(shí)最大.
不論是用“代數(shù)法”去推證, 還是用“中心極限定理”去描述,均旨在通過不同視角的研究去拓展學(xué)生的思維.相比而言,“代數(shù)法”多用于論證和試題的解答,“運(yùn)用概率、統(tǒng)計(jì)原理”去描述的方法可增強(qiáng)學(xué)生理解蘊(yùn)含在實(shí)際問題中的概率、統(tǒng)計(jì)規(guī)律.