江蘇省天一中學(xué) 孫承輝
獨立性檢驗是統(tǒng)計中的一個重要知識點,主要是根據(jù)2×2 列聯(lián)表計算K2的值,從而判斷兩個事件之間是相互獨立還是存在某種關(guān)聯(lián)性。考題的呈現(xiàn)形式多種多樣,一般與概率統(tǒng)計中的其他知識交匯,體現(xiàn)一定的綜合性。本文精選一些典型例題,希望對同學(xué)們的復(fù)習(xí)能有所幫助。
這類題目以頻率分布直方圖為背景,為檢驗事件的獨立性提供數(shù)據(jù)。解題的關(guān)鍵是讀懂頻率分布直方圖,明確各小長方形的面積表示相應(yīng)各組的頻率,從而求出相應(yīng)區(qū)間內(nèi)的樣本頻數(shù),并完善2×2 列聯(lián)表和計算K2的值。
例 1致敬百年,讀書筑夢,某學(xué)校組織全校學(xué)生參加“學(xué)黨史頌黨恩,黨史網(wǎng)絡(luò)知識競賽”活動,并從中抽取100 名學(xué)生的競賽成績作為樣本進(jìn)行統(tǒng)計,得到如圖1所示的頻率分布直方圖。規(guī)定:成績在[80,100]內(nèi)為優(yōu)秀,成績低于60分為不及格。
(1)求a的值,并用樣本估算總體,能否認(rèn)為該校參加本活動的學(xué)生成績符合“不及格的人數(shù)低于20%”的要求?
(2)根據(jù)以上數(shù)據(jù)完成表1所示的2×2列聯(lián)表,并判斷是否有99%的把握認(rèn)為此次競賽成績與性別有關(guān)。
表2
解析:(1)(0.004+a+0.011+0.036+0.023+0.014+a)×10=1,解得a=0.006,成績不及格的頻率為(0.004+0.006+0.011)×10=0.21,所以“成績不及格”的概率估計值為21%。
因為21%>20%,所以不能認(rèn)為該校參加本活動的學(xué)生成績符合“不及格的人數(shù)低于20%”的要求。
(2)由(1)可得,成績在[80,100]內(nèi)的人數(shù)為(0.014+0.006)×10×100=20,即樣本中成績優(yōu)秀的有20人,由此完成2×2 列聯(lián)表,如表3所示:
表3
假設(shè)H0:此次競賽成績與性別無關(guān),則
所以沒有99%的把握認(rèn)為此次競賽成績與性別有關(guān)。
點評:本題第(1)問先利用概率分布直方圖的性質(zhì)求出a=0.006,進(jìn)而求得60 分以下的概率估計值,即可判斷;第(2)問先根據(jù)第(1)問中的結(jié)論,求得優(yōu)秀的人數(shù),再填寫列聯(lián)表,進(jìn)而求出K2的值,查表后可以判斷得出沒有99%的把握。
樣本相關(guān)系數(shù)r可以反映成對樣本數(shù)據(jù)的變化特征,當(dāng)|r|越接近1 時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);當(dāng)|r|越接近0 時,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱。解決與相關(guān)系數(shù)有關(guān)的獨立性檢驗問題時,要理解r和K2的計算公式中各個數(shù)據(jù)的含義。
例2共享汽車,是指許多人合用一輛車,即開車人對車輛只有使用權(quán),而沒有所有權(quán),有點類似于在租車行業(yè)里的短時間的租車。它手續(xù)簡便,打個電話或通過網(wǎng)上就可以預(yù)約訂車。某市為了了解不同年齡的人對共享汽車的使用體驗,隨機(jī)選取了100 名使用共享汽車的體驗者,讓他們根據(jù)體驗效果進(jìn)行評分。
(1)設(shè)消費(fèi)者的年齡為x,對共享汽車的體驗評分為y。若根據(jù)統(tǒng)計數(shù)據(jù),用最小二乘法得到y(tǒng)關(guān)于x的線性回歸方程為1.5x+15,且年齡x的方差為,評分y的方差為。求y與x的相關(guān)系數(shù)r,并據(jù)此判斷對共享汽車使用體驗的評分與年齡的相關(guān)性強(qiáng)弱(當(dāng)|r|≥0.75時,認(rèn)為相關(guān)性強(qiáng),否則認(rèn)為相關(guān)性弱)。
(2)現(xiàn)將100名消費(fèi)者的年齡劃分為“青年”和“中老年”,評分劃分為“好評”和“差評”,整理得到表4的一些數(shù)據(jù),請將表4 所示的2×2 列聯(lián)表補(bǔ)充完整,并判斷是否有99.9%的把握認(rèn)為對共享汽車的評價與年齡有關(guān)。
臨界值表(表5):
表5
因為0.9>0.75,所以可判斷對共享汽車使用體驗的評分與年齡的相關(guān)性很強(qiáng)。
(2)根據(jù)題意可得完整的2×2 列聯(lián)表,如表6所示:
表6
點評:第(1)問根據(jù)公式求出相關(guān)系數(shù)r,計算過程中注意整體代入,再與0.75比較即可得出結(jié)論;第(2)問直接根據(jù)已有數(shù)據(jù)即可完成已知列聯(lián)表,再根據(jù)公式求出K2的值,然后對照臨界值表即可得出結(jié)論。
統(tǒng)計與概率的相關(guān)知識密不可分,獨立性檢驗問題經(jīng)常與概率交匯在一起,重點考查古典概型、隨機(jī)變量的概率分布、數(shù)學(xué)期望等知識。
例3某種疾病可分為A,B兩種類型,為了解該疾病的類型與患者性別是否相關(guān),在某地區(qū)隨機(jī)抽取了若干名該疾病的患者進(jìn)行調(diào)查,發(fā)現(xiàn)女性患者人數(shù)是男性患者的2倍,男性患A型疾病的人數(shù)占男性患者的,女性患A型疾病的人數(shù)占女性患者的
(1)若本次調(diào)查得出“在犯錯誤的概率不超過0.005的前提下認(rèn)為‘所患疾病的類型’與‘性別’有關(guān)”的結(jié)論,試問:被調(diào)查的男性患者至少有多少人?
(2)某團(tuán)隊進(jìn)行預(yù)防A型疾病的疫苗的研發(fā)試驗,試驗期間至多安排2 個周期接種疫苗,每人每個周期接種3次,每次接種費(fèi)用為m(m>0)元。該團(tuán)隊研發(fā)的疫苗每次接種后產(chǎn)生抗體的概率為p(0<p<1),如果一個周期內(nèi)至少2 次出現(xiàn)抗體,則該周期結(jié)束后終止試驗,否則進(jìn)入第二個周期。若,試驗人數(shù)為1 000 人,試估計該試驗用于接種疫苗的總費(fèi)用。
表7
解析:(1)設(shè)男性患者有x人,則女性患者有2x人,整理可得完整的2×2列聯(lián)表,如表8所示:
表8
假設(shè)H0:患者所患疾病類型與性別之間無關(guān)聯(lián),根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計算得到
要使在犯錯誤的概率不超過0.005的前提下認(rèn)為“所患疾病類型”與“性別”有關(guān),則,解得x>11.818 5。
(2)設(shè)該試驗每人的接種費(fèi)用為ξ元,則ξ的所有可能取值為3m,6m。
點評:第(1)問根據(jù)數(shù)據(jù)設(shè)男性患者有x人,則女性患者有2x人,即可得到2×2列聯(lián)表,計算出K2的值,從而得到不等式,求出x的取值范圍是x>11.818 5,同時注意到x必須是6 的倍數(shù),所以x的最小整數(shù)值為12。第(2)問設(shè)該試驗每人的接種費(fèi)用為ξ元,則ξ的可能取值為3m,6m,求出所對應(yīng)的概率,即可求出數(shù)學(xué)期望,再由和試驗人數(shù)為1 000人,求出總費(fèi)用的期望值。
中學(xué)生數(shù)理化(高中版.高考數(shù)學(xué))2023年3期