■韓文美
統(tǒng)計(jì)內(nèi)容涉及統(tǒng)計(jì)的基本概念、抽樣方法、總體分布、總體特征數(shù)及回歸方程等,是每年高考的必考點(diǎn)。主要考點(diǎn)包括抽樣方法的選擇與計(jì)算,總體分布中的統(tǒng)計(jì)圖表的識(shí)別與應(yīng)用,總體特征數(shù)的計(jì)算與應(yīng)用,回歸方程的求解與應(yīng)用,以及統(tǒng)計(jì)知識(shí)的交匯與綜合應(yīng)用問(wèn)題等。
主要考查抽樣方法的概念和運(yùn)算,以及運(yùn)用統(tǒng)計(jì)知識(shí)解決實(shí)際問(wèn)題的能力。主要以分層抽樣為主。
例1(2018年全國(guó)卷Ⅲ文·14)某公司有大量客戶(hù),且不同年齡段的客戶(hù)對(duì)其服務(wù)的評(píng)價(jià)有較大差異。為了解客戶(hù)的評(píng)價(jià),該公司準(zhǔn)備進(jìn)行抽樣調(diào)查,可供選擇的抽樣方法有簡(jiǎn)單隨機(jī)抽樣法、分層抽樣法和系統(tǒng)抽樣法,則最合適的抽樣方法是____。
由于不同年齡段的客戶(hù)對(duì)其服務(wù)的評(píng)價(jià)有較大差異,根據(jù)抽樣方法的性質(zhì)知最合適的抽樣方法是分層抽樣法。
簡(jiǎn)單隨機(jī)抽樣是系統(tǒng)抽樣和分層抽樣的基礎(chǔ),三種抽樣方法都是等可能抽樣,體現(xiàn)了它們的客觀(guān)性和公平性。但各自又有各自的特點(diǎn),在實(shí)際應(yīng)用中要注意三種抽樣方法的區(qū)別。
總體分布的考查主要通過(guò)統(tǒng)計(jì)圖表的形式呈現(xiàn),包括統(tǒng)計(jì)中常用的頻率分布表、頻率分布直方圖、頻率分布折線(xiàn)圖、總體密度曲線(xiàn)、莖葉圖、扇形圖等。①圖表的比較信息,確定不同數(shù)據(jù)的結(jié)果情況。②圖表的數(shù)據(jù)信息與統(tǒng)計(jì)信息,通過(guò)識(shí)圖表、讀圖表,從圖表中獲取數(shù)據(jù)信息并加以統(tǒng)計(jì),從而通過(guò)這些統(tǒng)計(jì)圖表給出相應(yīng)的統(tǒng)計(jì)信息,或通過(guò)相應(yīng)的統(tǒng)計(jì)信息得出統(tǒng)計(jì)圖表。高考考查中主要以頻率分布表、頻率分布直方圖等為主,經(jīng)常出現(xiàn)在選擇題、填空題中,難度不大。
例2(2018年全國(guó)卷Ⅰ文、理·3)某地區(qū)經(jīng)過(guò)一年的新農(nóng)村建設(shè),農(nóng)村的經(jīng)濟(jì)收入增加了1倍。為更好地了解該地區(qū)農(nóng)村的經(jīng)濟(jì)收入變化情況,統(tǒng)計(jì)出該地區(qū)新農(nóng)村建設(shè)前后農(nóng)村的經(jīng)濟(jì)收入構(gòu)成比例,如圖1所示,則下面結(jié)論中不正確的是( )。
A.新農(nóng)村建設(shè)后,種植收入減少了
B.新農(nóng)村建設(shè)后,其他收入增加了1倍以上
C.新農(nóng)村建設(shè)后,養(yǎng)殖收入增加了1倍
D.新農(nóng)村建設(shè)后,養(yǎng)殖收入與第三產(chǎn)業(yè)收入的總和超過(guò)了經(jīng)濟(jì)收入的一半
假設(shè)建設(shè)前的經(jīng)濟(jì)收入為100,則建設(shè)后的經(jīng)濟(jì)收入為200??傻媒ㄔO(shè)前的種植收入為100×60%=60,建設(shè)后的種植收入為200×37%=74,A項(xiàng)錯(cuò)誤。建設(shè)前的其他收入為100×4%=4,建設(shè)后的其他收入為200×5%=10,B項(xiàng)正確。建設(shè)前的養(yǎng)殖收入為100×30%=30,建設(shè)后的養(yǎng)殖收入為200×30%=60,C項(xiàng)正確。建設(shè)后,養(yǎng)殖收入與第三產(chǎn)業(yè)收入所占比例之和為30%+28%=58%,超過(guò)了經(jīng)濟(jì)收入所占比例的一半,D項(xiàng)正確。故選A。
通過(guò)統(tǒng)計(jì)中扇形圖的識(shí)別與應(yīng)用、數(shù)據(jù)信息的處理來(lái)考查數(shù)據(jù)分析的數(shù)學(xué)核心素養(yǎng)。解決此類(lèi)統(tǒng)計(jì)圖表問(wèn)題,關(guān)鍵是從統(tǒng)計(jì)圖表中正確讀出對(duì)應(yīng)的數(shù)據(jù)信息,并加以正確轉(zhuǎn)化,從而合理地進(jìn)行數(shù)據(jù)分析與數(shù)據(jù)處理。
總體特征數(shù)中,眾數(shù)、中位數(shù)和平均數(shù)是三種最常用的特征數(shù),為我們提供了關(guān)于樣本數(shù)據(jù)的特征信息,從不同的側(cè)面反映數(shù)據(jù)的分布狀態(tài)。標(biāo)準(zhǔn)差、方差用來(lái)考查樣本數(shù)據(jù)分散程度的大小,標(biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度越大,標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越小。特別是在樣本數(shù)據(jù)的平均數(shù)相同的情況下,經(jīng)常通過(guò)考察標(biāo)準(zhǔn)差或方差來(lái)進(jìn)一步分析數(shù)據(jù)的分散程度。
例3(2018年江蘇卷·3)已知5位裁判給某運(yùn)動(dòng)員打出的分?jǐn)?shù)的莖葉圖如圖2所示,那么這5位裁判打出的分?jǐn)?shù)的平均數(shù)為_(kāi)___。
圖2
由莖葉圖中的數(shù)據(jù)知,這5位裁判打出的分?jǐn)?shù)分別為89,89,90,91,91,它們的平均數(shù)為
本題巧妙地把莖葉圖與平均數(shù)加以交匯進(jìn)行考查。平均數(shù)和中位數(shù)能反映一組數(shù)據(jù)的集中趨勢(shì),而標(biāo)準(zhǔn)差和方差能反映一組數(shù)據(jù)的穩(wěn)定程度。
變量之間的相關(guān)關(guān)系主要包括兩個(gè)變量之間關(guān)系的確定,以及當(dāng)兩個(gè)變量具有線(xiàn)性相關(guān)關(guān)系時(shí)回歸方程的求解及其應(yīng)用等。解答相關(guān)問(wèn)題時(shí),要厘清兩個(gè)變量之間的函數(shù)關(guān)系與相關(guān)關(guān)系的區(qū)別與聯(lián)系,以及準(zhǔn)確確定回歸直線(xiàn),根據(jù)回歸直線(xiàn)的系數(shù)公式正確地求出回歸方程,從而進(jìn)一步加強(qiáng)數(shù)學(xué)應(yīng)用意識(shí),培養(yǎng)運(yùn)用所學(xué)知識(shí)分析問(wèn)題和解決問(wèn)題的能力。
例4(2018年全國(guó)卷Ⅱ文、理·18)圖3是某地區(qū)2000年至2016年環(huán)境基礎(chǔ)設(shè)施投資額y(單位:億元)的折線(xiàn)圖。
圖3
為了預(yù)測(cè)該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額,建立了y與時(shí)間變量t的兩個(gè)線(xiàn)性回歸模型。根據(jù)2000年至2016年的數(shù)據(jù)(時(shí)間變量t的值依次為1,2,…,17)建立模型①:?y=—30.4+13.5t。根據(jù)2010年至2016年的數(shù)據(jù)(時(shí)間變量t的值依次為1,2,…,7)建立模型②:?y=99+17.5t。
(1)分別利用這兩個(gè)模型,求該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值。
(2)你認(rèn)為用哪個(gè)模型得到的預(yù)測(cè)值更可靠?并說(shuō)明理由。
(1)利用模型①,得該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值為?y=—30.4+13.5×19=226.1(億元);利用模型②,得該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值為?y=99+17.5×9=256.5(億元)。
(2)利用模型②得到的預(yù)測(cè)值更可靠。理由如下:
從折線(xiàn)圖可以看出,2000年至2016年的數(shù)據(jù)對(duì)應(yīng)的點(diǎn)沒(méi)有隨機(jī)散布在直線(xiàn)y=—30.4+13.5t上下,這說(shuō)明利用2000年至2016年的數(shù)據(jù)建立的線(xiàn)性模型①不能很好地描述該地區(qū)環(huán)境基礎(chǔ)設(shè)施投資額的變化趨勢(shì)。2010年相對(duì)2009年的環(huán)境基礎(chǔ)設(shè)施投資額有明顯增加,2010年至2016年的數(shù)據(jù)對(duì)應(yīng)的點(diǎn)位于一條直線(xiàn)的附近,這說(shuō)明從2010年開(kāi)始環(huán)境基礎(chǔ)設(shè)施投資額的變化規(guī)律呈線(xiàn)性增長(zhǎng)趨勢(shì),利用2010年至2016年的數(shù)據(jù)建立的線(xiàn)性模型②,可以較好地描述2010年以后該地區(qū)的環(huán)境基礎(chǔ)設(shè)施投資額的變化趨勢(shì)。因此利用模型②得到的預(yù)測(cè)值更可靠。
從計(jì)算結(jié)果來(lái)看,相對(duì)于2016年的環(huán)境基礎(chǔ)設(shè)施投資額220億元,由模型①得到的預(yù)測(cè)值226.1億元的增幅明顯偏低,而利用模型②得到的預(yù)測(cè)值256.5億元的增幅比較合理,說(shuō)明利用模型②得到的預(yù)測(cè)值更可靠。
本題主要考查線(xiàn)性回歸方程的特征及其應(yīng)用,考查對(duì)統(tǒng)計(jì)數(shù)據(jù)的分析與處理能力。數(shù)據(jù)的數(shù)學(xué)化分析是數(shù)學(xué)對(duì)自然科學(xué)的一大重要貢獻(xiàn),如線(xiàn)性回歸方程的預(yù)測(cè)與實(shí)際已有數(shù)據(jù)的比對(duì),統(tǒng)計(jì)中線(xiàn)性回歸模型必過(guò)數(shù)據(jù)中心點(diǎn)等,是判斷模型預(yù)測(cè)可靠性的重要依據(jù)。
在統(tǒng)計(jì)中,往往會(huì)把抽樣方法、總體分布、總體特征數(shù)、線(xiàn)性回歸方程等幾個(gè)相關(guān)的知識(shí)點(diǎn)加以綜合進(jìn)行考查。有時(shí)還會(huì)把相應(yīng)的代數(shù)、幾何、概率等知識(shí)加以交匯,綜合考查統(tǒng)計(jì)知識(shí)的應(yīng)用問(wèn)題,這類(lèi)試題是近幾年高考中的熱點(diǎn)試題之一,希望同學(xué)們能多加重視。
例5(2018年全國(guó)卷Ⅰ文·19)某家庭記錄了未使用節(jié)水龍頭50天的日用水量(單位:m3)和使用了節(jié)水龍頭50天的日用水量,得到的頻數(shù)分布表如表1、2所示。
表1
(1)畫(huà)出該家庭使用節(jié)水龍頭50天的日用水量的頻率分布直方圖。
(2)估計(jì)該家庭使用節(jié)水龍頭50天后,日用水量小于0.35m3的概率。
表2
(1)該家庭使用節(jié)水龍頭50天的日用水量的頻率分布直方圖如圖4所示。
圖4
(2)該家庭使用節(jié)水龍頭50天后,日用水量小于0.35m3的頻率為0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此該家庭使用節(jié)水龍頭50天后,日用水量小于0.35m3的概率的估計(jì)值為0.48。
本題巧妙地把統(tǒng)計(jì)中的數(shù)據(jù)處理、總體分布與總體特征數(shù)、頻率與概率等概念加以綜合,考查統(tǒng)計(jì)的數(shù)據(jù)處理能力、運(yùn)算求解能力和應(yīng)用意識(shí)等。