直擊高考，統(tǒng)計(jì)在線(xiàn)

2019-02-26 07:22韓文美

中學(xué)生數(shù)理化·高一版 2019年2期

■韓文美

統(tǒng)計(jì)內(nèi)容涉及統(tǒng)計(jì)的基本概念、抽樣方法、總體分布、總體特征數(shù)及回歸方程等，是每年高考的必考點(diǎn)。主要考點(diǎn)包括抽樣方法的選擇與計(jì)算，總體分布中的統(tǒng)計(jì)圖表的識(shí)別與應(yīng)用，總體特征數(shù)的計(jì)算與應(yīng)用，回歸方程的求解與應(yīng)用，以及統(tǒng)計(jì)知識(shí)的交匯與綜合應(yīng)用問(wèn)題等。

1.抽樣方法的考查

主要考查抽樣方法的概念和運(yùn)算，以及運(yùn)用統(tǒng)計(jì)知識(shí)解決實(shí)際問(wèn)題的能力。主要以分層抽樣為主。

例1（2018年全國(guó)卷Ⅲ文·14）某公司有大量客戶(hù)，且不同年齡段的客戶(hù)對(duì)其服務(wù)的評(píng)價(jià)有較大差異。為了解客戶(hù)的評(píng)價(jià)，該公司準(zhǔn)備進(jìn)行抽樣調(diào)查，可供選擇的抽樣方法有簡(jiǎn)單隨機(jī)抽樣法、分層抽樣法和系統(tǒng)抽樣法，則最合適的抽樣方法是____。

由于不同年齡段的客戶(hù)對(duì)其服務(wù)的評(píng)價(jià)有較大差異，根據(jù)抽樣方法的性質(zhì)知最合適的抽樣方法是分層抽樣法。

簡(jiǎn)單隨機(jī)抽樣是系統(tǒng)抽樣和分層抽樣的基礎(chǔ)，三種抽樣方法都是等可能抽樣，體現(xiàn)了它們的客觀(guān)性和公平性。但各自又有各自的特點(diǎn)，在實(shí)際應(yīng)用中要注意三種抽樣方法的區(qū)別。

2.總體分布的考查

總體分布的考查主要通過(guò)統(tǒng)計(jì)圖表的形式呈現(xiàn)，包括統(tǒng)計(jì)中常用的頻率分布表、頻率分布直方圖、頻率分布折線(xiàn)圖、總體密度曲線(xiàn)、莖葉圖、扇形圖等。①圖表的比較信息，確定不同數(shù)據(jù)的結(jié)果情況。②圖表的數(shù)據(jù)信息與統(tǒng)計(jì)信息，通過(guò)識(shí)圖表、讀圖表，從圖表中獲取數(shù)據(jù)信息并加以統(tǒng)計(jì)，從而通過(guò)這些統(tǒng)計(jì)圖表給出相應(yīng)的統(tǒng)計(jì)信息，或通過(guò)相應(yīng)的統(tǒng)計(jì)信息得出統(tǒng)計(jì)圖表。高考考查中主要以頻率分布表、頻率分布直方圖等為主，經(jīng)常出現(xiàn)在選擇題、填空題中，難度不大。

例2（2018年全國(guó)卷Ⅰ文、理·3）某地區(qū)經(jīng)過(guò)一年的新農(nóng)村建設(shè)，農(nóng)村的經(jīng)濟(jì)收入增加了1倍。為更好地了解該地區(qū)農(nóng)村的經(jīng)濟(jì)收入變化情況，統(tǒng)計(jì)出該地區(qū)新農(nóng)村建設(shè)前后農(nóng)村的經(jīng)濟(jì)收入構(gòu)成比例，如圖1所示，則下面結(jié)論中不正確的是（）。

A．新農(nóng)村建設(shè)后，種植收入減少了

B．新農(nóng)村建設(shè)后，其他收入增加了1倍以上

C．新農(nóng)村建設(shè)后，養(yǎng)殖收入增加了1倍

D.新農(nóng)村建設(shè)后，養(yǎng)殖收入與第三產(chǎn)業(yè)收入的總和超過(guò)了經(jīng)濟(jì)收入的一半

假設(shè)建設(shè)前的經(jīng)濟(jì)收入為100，則建設(shè)后的經(jīng)濟(jì)收入為200?？傻媒ㄔO(shè)前的種植收入為100×60%=60，建設(shè)后的種植收入為200×37%=74，A項(xiàng)錯(cuò)誤。建設(shè)前的其他收入為100×4%=4，建設(shè)后的其他收入為200×5%=10，B項(xiàng)正確。建設(shè)前的養(yǎng)殖收入為100×30%=30，建設(shè)后的養(yǎng)殖收入為200×30%=60，C項(xiàng)正確。建設(shè)后，養(yǎng)殖收入與第三產(chǎn)業(yè)收入所占比例之和為30%+28%=58%，超過(guò)了經(jīng)濟(jì)收入所占比例的一半，D項(xiàng)正確。故選A。

通過(guò)統(tǒng)計(jì)中扇形圖的識(shí)別與應(yīng)用、數(shù)據(jù)信息的處理來(lái)考查數(shù)據(jù)分析的數(shù)學(xué)核心素養(yǎng)。解決此類(lèi)統(tǒng)計(jì)圖表問(wèn)題，關(guān)鍵是從統(tǒng)計(jì)圖表中正確讀出對(duì)應(yīng)的數(shù)據(jù)信息，并加以正確轉(zhuǎn)化，從而合理地進(jìn)行數(shù)據(jù)分析與數(shù)據(jù)處理。

3.總體特征數(shù)的考查

總體特征數(shù)中，眾數(shù)、中位數(shù)和平均數(shù)是三種最常用的特征數(shù)，為我們提供了關(guān)于樣本數(shù)據(jù)的特征信息，從不同的側(cè)面反映數(shù)據(jù)的分布狀態(tài)。標(biāo)準(zhǔn)差、方差用來(lái)考查樣本數(shù)據(jù)分散程度的大小，標(biāo)準(zhǔn)差、方差越大，數(shù)據(jù)的離散程度越大，標(biāo)準(zhǔn)差、方差越小，數(shù)據(jù)的離散程度越小。特別是在樣本數(shù)據(jù)的平均數(shù)相同的情況下，經(jīng)常通過(guò)考察標(biāo)準(zhǔn)差或方差來(lái)進(jìn)一步分析數(shù)據(jù)的分散程度。

例3（2018年江蘇卷·3）已知5位裁判給某運(yùn)動(dòng)員打出的分?jǐn)?shù)的莖葉圖如圖2所示，那么這5位裁判打出的分?jǐn)?shù)的平均數(shù)為_(kāi)___。

圖2

由莖葉圖中的數(shù)據(jù)知，這5位裁判打出的分?jǐn)?shù)分別為89，89，90，91，91，它們的平均數(shù)為

本題巧妙地把莖葉圖與平均數(shù)加以交匯進(jìn)行考查。平均數(shù)和中位數(shù)能反映一組數(shù)據(jù)的集中趨勢(shì)，而標(biāo)準(zhǔn)差和方差能反映一組數(shù)據(jù)的穩(wěn)定程度。

4.回歸方程的考查

變量之間的相關(guān)關(guān)系主要包括兩個(gè)變量之間關(guān)系的確定，以及當(dāng)兩個(gè)變量具有線(xiàn)性相關(guān)關(guān)系時(shí)回歸方程的求解及其應(yīng)用等。解答相關(guān)問(wèn)題時(shí)，要厘清兩個(gè)變量之間的函數(shù)關(guān)系與相關(guān)關(guān)系的區(qū)別與聯(lián)系，以及準(zhǔn)確確定回歸直線(xiàn)，根據(jù)回歸直線(xiàn)的系數(shù)公式正確地求出回歸方程，從而進(jìn)一步加強(qiáng)數(shù)學(xué)應(yīng)用意識(shí)，培養(yǎng)運(yùn)用所學(xué)知識(shí)分析問(wèn)題和解決問(wèn)題的能力。

例4（2018年全國(guó)卷Ⅱ文、理·18）圖3是某地區(qū)2000年至2016年環(huán)境基礎(chǔ)設(shè)施投資額y（單位：億元）的折線(xiàn)圖。

圖3

為了預(yù)測(cè)該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額，建立了y與時(shí)間變量t的兩個(gè)線(xiàn)性回歸模型。根據(jù)2000年至2016年的數(shù)據(jù)（時(shí)間變量t的值依次為1，2，…，17）建立模型①：?y=—30.4+13.5t。根據(jù)2010年至2016年的數(shù)據(jù)（時(shí)間變量t的值依次為1，2，…，7）建立模型②：?y=99+17.5t。

（1）分別利用這兩個(gè)模型，求該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值。

（2）你認(rèn)為用哪個(gè)模型得到的預(yù)測(cè)值更可靠?并說(shuō)明理由。

（1）利用模型①，得該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值為?y=—30.4+13.5×19=226.1（億元）；利用模型②，得該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值為?y=99+17.5×9=256.5（億元）。

（2）利用模型②得到的預(yù)測(cè)值更可靠。理由如下：

從折線(xiàn)圖可以看出，2000年至2016年的數(shù)據(jù)對(duì)應(yīng)的點(diǎn)沒(méi)有隨機(jī)散布在直線(xiàn)y=—30.4+13.5t上下，這說(shuō)明利用2000年至2016年的數(shù)據(jù)建立的線(xiàn)性模型①不能很好地描述該地區(qū)環(huán)境基礎(chǔ)設(shè)施投資額的變化趨勢(shì)。2010年相對(duì)2009年的環(huán)境基礎(chǔ)設(shè)施投資額有明顯增加，2010年至2016年的數(shù)據(jù)對(duì)應(yīng)的點(diǎn)位于一條直線(xiàn)的附近，這說(shuō)明從2010年開(kāi)始環(huán)境基礎(chǔ)設(shè)施投資額的變化規(guī)律呈線(xiàn)性增長(zhǎng)趨勢(shì)，利用2010年至2016年的數(shù)據(jù)建立的線(xiàn)性模型②，可以較好地描述2010年以后該地區(qū)的環(huán)境基礎(chǔ)設(shè)施投資額的變化趨勢(shì)。因此利用模型②得到的預(yù)測(cè)值更可靠。

從計(jì)算結(jié)果來(lái)看，相對(duì)于2016年的環(huán)境基礎(chǔ)設(shè)施投資額220億元，由模型①得到的預(yù)測(cè)值226.1億元的增幅明顯偏低，而利用模型②得到的預(yù)測(cè)值256.5億元的增幅比較合理，說(shuō)明利用模型②得到的預(yù)測(cè)值更可靠。

本題主要考查線(xiàn)性回歸方程的特征及其應(yīng)用，考查對(duì)統(tǒng)計(jì)數(shù)據(jù)的分析與處理能力。數(shù)據(jù)的數(shù)學(xué)化分析是數(shù)學(xué)對(duì)自然科學(xué)的一大重要貢獻(xiàn)，如線(xiàn)性回歸方程的預(yù)測(cè)與實(shí)際已有數(shù)據(jù)的比對(duì)，統(tǒng)計(jì)中線(xiàn)性回歸模型必過(guò)數(shù)據(jù)中心點(diǎn)等，是判斷模型預(yù)測(cè)可靠性的重要依據(jù)。

5.統(tǒng)計(jì)綜合問(wèn)題的考查

在統(tǒng)計(jì)中，往往會(huì)把抽樣方法、總體分布、總體特征數(shù)、線(xiàn)性回歸方程等幾個(gè)相關(guān)的知識(shí)點(diǎn)加以綜合進(jìn)行考查。有時(shí)還會(huì)把相應(yīng)的代數(shù)、幾何、概率等知識(shí)加以交匯，綜合考查統(tǒng)計(jì)知識(shí)的應(yīng)用問(wèn)題，這類(lèi)試題是近幾年高考中的熱點(diǎn)試題之一，希望同學(xué)們能多加重視。

例5（2018年全國(guó)卷Ⅰ文·19）某家庭記錄了未使用節(jié)水龍頭50天的日用水量（單位：m3）和使用了節(jié)水龍頭50天的日用水量，得到的頻數(shù)分布表如表1、2所示。

表1

（1）畫(huà)出該家庭使用節(jié)水龍頭50天的日用水量的頻率分布直方圖。

（2）估計(jì)該家庭使用節(jié)水龍頭50天后，日用水量小于0.35m3的概率。

表2

（1）該家庭使用節(jié)水龍頭50天的日用水量的頻率分布直方圖如圖4所示。

圖4

（2）該家庭使用節(jié)水龍頭50天后，日用水量小于0.35m3的頻率為0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48，因此該家庭使用節(jié)水龍頭50天后，日用水量小于0.35m3的概率的估計(jì)值為0.48。

本題巧妙地把統(tǒng)計(jì)中的數(shù)據(jù)處理、總體分布與總體特征數(shù)、頻率與概率等概念加以綜合，考查統(tǒng)計(jì)的數(shù)據(jù)處理能力、運(yùn)算求解能力和應(yīng)用意識(shí)等。