湖北省襄陽(yáng)市第五中學(xué) 王云龍
統(tǒng)計(jì)是高中數(shù)學(xué)中的重要知識(shí),也是高考命題的熱點(diǎn)內(nèi)容。涉及抽樣方法、用樣本估計(jì)總體、變量間的相關(guān)關(guān)系、回歸方程和獨(dú)立性檢驗(yàn)等知識(shí),主要考查同學(xué)們的分析數(shù)據(jù)、處理數(shù)據(jù)和運(yùn)算求解等能力。本文剖析了統(tǒng)計(jì)中的一些典型易錯(cuò)問(wèn)題,以饗讀者。
例1研究表明,季節(jié)變化引起的光照強(qiáng)度會(huì)影響人群的情緒,其主要原因是光照可以控制褪黑素的分泌,干擾正常的生物節(jié)律,進(jìn)而間接參與情緒的調(diào)節(jié),為了探究光照強(qiáng)度是否也會(huì)影響其他動(dòng)物褪黑素的分泌,科研人員將200 只小白鼠置于光照條件下,控制光照時(shí)長(zhǎng),將光照時(shí)長(zhǎng)按[0,4),[4,8),[8,12),[12,16),[16,20),[20,24]分組,繪制成如圖1所示的頻率分布直方圖。試驗(yàn)發(fā)現(xiàn),共有130 只小白鼠褪黑素分泌正常,其中光照時(shí)長(zhǎng)不小于8 h 的有90 只褪黑素分泌正常。
圖1
(1)填寫表1 所示的2×2 列聯(lián)表,并根據(jù)列聯(lián)表及α=0.05 的獨(dú)立性檢驗(yàn),能否認(rèn)為褪黑素分泌與光照時(shí)長(zhǎng)不小于8 h 有關(guān)聯(lián)? (單位:只)
表1
(2)以樣本中的頻率估計(jì)概率,計(jì)算光照時(shí)長(zhǎng)小于8 h 的條件下,小白鼠褪黑素分泌不正常的概率。
表2
解析:(1)(0.037 5+0.025)×4×200=50(只)。
依題設(shè),光照時(shí)長(zhǎng)小于8 h 的有50 只,不小于8 h 的有150 只,褪黑素分泌正常的有130只,其中光照時(shí)長(zhǎng)不小于8 h 的有90只,小于8 h 的有40 只,故列聯(lián)表如表3 所示:
表3
假設(shè)H0:褪黑素分泌與光照時(shí)長(zhǎng)不小于8 h 無(wú)關(guān)聯(lián)。根據(jù)列聯(lián)表3 中的數(shù)據(jù),得3.841,根據(jù)α=0.05 的獨(dú)立性檢驗(yàn),認(rèn)為褪黑素分泌與光照時(shí)長(zhǎng)不小于8 h 有關(guān)聯(lián),此推斷犯錯(cuò)誤的概率不超過(guò)0.05。
(2)令事件A=“小白鼠光照時(shí)長(zhǎng)小于8 h”,事件B=“小白鼠褪黑素分泌不正常”,則,所以在光照時(shí)長(zhǎng)小于8 h 的條件下,小白鼠褪黑素分泌不正常的概率為
易錯(cuò)點(diǎn)剖析:本題容易出現(xiàn)兩種錯(cuò)誤:①理解題意有困難,2×2列聯(lián)表的值填寫有誤,導(dǎo)致計(jì)算K2的值出錯(cuò);②獨(dú)立性檢驗(yàn)思想方法理解不到位,不會(huì)找α=0.05 對(duì)應(yīng)的參考數(shù)值k0,不能準(zhǔn)確解釋k0與K2大小關(guān)系對(duì)應(yīng)的統(tǒng)計(jì)含義。
圖2
例2多年來(lái),清華大學(xué)電子工程系黃翔東教授團(tuán)隊(duì)致力于光譜成像芯片的研究,2022年6 月研制出國(guó)際首款實(shí)時(shí)超光譜成像芯片,相比已有光譜檢測(cè)技術(shù),實(shí)現(xiàn)了從單點(diǎn)光譜儀到超光譜成像芯片的跨越,為制定下一年的研發(fā)投入計(jì)劃,該研發(fā)團(tuán)隊(duì)為了解年研發(fā)資金投入量x(單位:億元)對(duì)年銷售額y(單位:億元)的影響,結(jié)合近12年的年研發(fā)資金投入量x和年銷售額y的數(shù)據(jù)(i=1,2,…,12),該團(tuán)隊(duì)建立了兩個(gè)模型:①y=α+βx2,②y=eλx+t,其中α,β,λ,t為常數(shù),e為自然對(duì)數(shù)的底數(shù),對(duì)歷史數(shù)據(jù)的初步處理得到散點(diǎn)圖,如圖2所示,令12),計(jì)算得到表4中的數(shù)據(jù)。
表4
(1)設(shè)ui和yi的相關(guān)系數(shù)為r1,xi和vi的相關(guān)系數(shù)為r2,請(qǐng)從相關(guān)系數(shù)的角度,選擇一個(gè)擬合程度更好的模型。
(2)①根據(jù)(1)中的選擇及表中數(shù)據(jù),建立y關(guān)于x的回歸方程(系數(shù)精確到0.01);
②若下一年銷售額y需達(dá)到80億元,預(yù)測(cè)下一年的研發(fā)資金投入量x是多少億元?
易錯(cuò)點(diǎn)剖析:本題容易出現(xiàn)兩種錯(cuò)誤:①不理解相關(guān)系數(shù)r的含義:越接近于1,相關(guān)性越強(qiáng),不會(huì)根據(jù)相關(guān)系數(shù)的大小選擇回歸模型;②非線性回歸方程轉(zhuǎn)化為線性回歸方程后,不會(huì)合理利用參考數(shù)據(jù)求解模型參數(shù),導(dǎo)致回歸方程出錯(cuò)。
例3重慶軌道交通9號(hào)線一期已于2022年1 月25 日開(kāi)通運(yùn)營(yíng),全長(zhǎng)32.29 公里,從高灘巖站至興科大道站,一路經(jīng)過(guò)23座車站。沙坪壩站是目前客流量最大的站點(diǎn),某數(shù)學(xué)興趣小組在沙坪壩站做乘客流量來(lái)源地相關(guān)調(diào)查,從上車人群中隨機(jī)選取了100名乘客,記錄了他們從來(lái)源地到沙坪壩站所花費(fèi)時(shí)間t,得到表5:
表5
(1)估計(jì)所有在沙坪壩站上車的乘客花費(fèi)時(shí)間t的中位數(shù)。
(2)已知t∈[0,6)的6 人,其平均數(shù)和方差分別為5和1.5;t∈[6,12)的30人,其平均數(shù)和方差分別為8和9。請(qǐng)計(jì)算樣本數(shù)據(jù)中t∈[0,12)的平均數(shù)和方差。
總之,熟練掌握數(shù)據(jù)統(tǒng)計(jì)方法,深刻理解統(tǒng)計(jì)方法的含義,可以讓我們?cè)趯W(xué)習(xí)統(tǒng)計(jì)的過(guò)程中更加游刃有余。