文/萬廣磊
統(tǒng)計(jì)學(xué)是一門古老的科學(xué),與我們的生活息息相關(guān)。同學(xué)們打開電視、報(bào)紙、雜志、互聯(lián)網(wǎng)等,經(jīng)常會(huì)看到各種各樣的統(tǒng)計(jì)圖表,從而了解周圍世界。根據(jù)需要,我們也會(huì)選擇一些統(tǒng)計(jì)圖表,對(duì)其中的數(shù)據(jù)來源、描述數(shù)據(jù)的方法、得出的結(jié)論等進(jìn)行分析,以便做出合理的決策。
利用數(shù)據(jù)解決簡單問題的過程如下:
在實(shí)際生活中,我們會(huì)發(fā)現(xiàn)一些問題亟待解決。于是,我們?cè)O(shè)計(jì)調(diào)查問卷或者直接調(diào)查,收集相關(guān)信息,然后整理得到有效數(shù)據(jù),用常用的統(tǒng)計(jì)圖表描述數(shù)據(jù),多角度分析數(shù)據(jù),最后,提出方案,解決問題。
統(tǒng)計(jì)調(diào)查有普查和抽樣調(diào)查兩種方式。
普查通過調(diào)查總體中的每個(gè)個(gè)體來收集數(shù)據(jù),得到的調(diào)查結(jié)果比較準(zhǔn)確,但所費(fèi)人力、物力和時(shí)間較多;抽樣調(diào)查通過調(diào)查樣本中的每個(gè)個(gè)體來收集數(shù)據(jù),得到的調(diào)查結(jié)果不夠準(zhǔn)確,但是接近準(zhǔn)確結(jié)果,所費(fèi)人力、物力和時(shí)間較少。我們要根據(jù)不同的情況選擇合適的調(diào)查方式。
比如,調(diào)查長江的水質(zhì)、全國中學(xué)生的視力情況、某省居民的網(wǎng)上購物情況、某個(gè)節(jié)目的收視率等,因?yàn)檎{(diào)查范圍廣,適合采用抽樣調(diào)查方式;而調(diào)查某班級(jí)學(xué)生的身高、體重、閱讀的課外書數(shù)量、喜歡的體育活動(dòng)等,適合采用普查方式。
要學(xué)好統(tǒng)計(jì)方法,首先要理解這幾個(gè)概念:總體、個(gè)體、樣本、樣本容量。
總體是指考察對(duì)象的全體;個(gè)體是總體中的每一個(gè)考察對(duì)象;樣本是總體中所抽取的一部分個(gè)體;而樣本容量則是指樣本中個(gè)體的數(shù)目,注意沒有單位。
比如,2021 年某市有近56000 名考生參加中考,為了調(diào)查這些考生的數(shù)學(xué)成績,從中隨機(jī)抽取3000名考生的數(shù)學(xué)成績進(jìn)行統(tǒng)計(jì)分析。其中,3000名考生的數(shù)學(xué)成績是總體的一個(gè)樣本,每名考生的數(shù)學(xué)成績是個(gè)體,近56000名考生的數(shù)學(xué)成績是總體,3000是樣本容量。
在統(tǒng)計(jì)中,我們通常從總體中抽取樣本,通過樣本估計(jì)總體。為了使估計(jì)、推斷的總體特性更加準(zhǔn)確,抽樣時(shí)要注意樣本的代表性。
比如,要了解全校學(xué)生的課外作業(yè)負(fù)擔(dān)情況,比較有代表性的樣本是七、八、九三個(gè)年級(jí)各10%的學(xué)生或者七、八、九三個(gè)年級(jí)各班學(xué)號(hào)尾數(shù)為4 的學(xué)生,而不是七、八、九三個(gè)年級(jí)(1)班的學(xué)生或者全校的女生。
我們可以利用統(tǒng)計(jì)圖表整理、描述數(shù)據(jù),了解數(shù)據(jù)的分布特征和變化規(guī)律,從數(shù)據(jù)中獲取信息、做出決策。常見的統(tǒng)計(jì)圖表有扇形統(tǒng)計(jì)圖、條形統(tǒng)計(jì)圖、折線統(tǒng)計(jì)圖、頻數(shù)分布表。不同的統(tǒng)計(jì)圖表有不同的特點(diǎn),比如,扇形統(tǒng)計(jì)圖描述了由數(shù)據(jù)所表現(xiàn)出來的部分與整體的關(guān)系;折線統(tǒng)計(jì)圖描述了數(shù)據(jù)的變化過程與趨勢(shì);條形統(tǒng)計(jì)圖用寬度相等的“條形”的高度描述各個(gè)統(tǒng)計(jì)項(xiàng)目的頻數(shù)。隨著計(jì)算機(jī)技術(shù)和統(tǒng)計(jì)學(xué)的不斷發(fā)展,現(xiàn)在還出現(xiàn)了很多新穎、有趣的統(tǒng)計(jì)圖表。
我們可以根據(jù)統(tǒng)計(jì)圖表提供的信息進(jìn)行分析,利用樣本的某種特性估計(jì)總體的相應(yīng)特性,再做出合理的決策。
比如,我國古代數(shù)學(xué)名著《九章算術(shù)》中有一個(gè)“米谷粒分”的問題:糧倉開倉收糧,有人送來米1534 石,為檢驗(yàn)米內(nèi)夾谷多少,抽樣取米一把,數(shù)得254 粒內(nèi)夾谷28 粒,則這批米內(nèi)夾谷約為多少?求這批米內(nèi)夾谷多少,用的就是樣本估計(jì)總體的思想。
一些益智類節(jié)目或競賽活動(dòng)也會(huì)有類似的有趣問題。比如,某市的一次科普知識(shí)競賽中,有一道滿分為8 分的解答題,按評(píng)分標(biāo)準(zhǔn),所有選手的得分只有四種情況:0 分,3 分,5分,8分。為了了解學(xué)生的得分情況與題目的難易情況,從全市8000名選手的試卷中隨機(jī)抽取一部分,通過分析與整理,繪制了下面的統(tǒng)計(jì)圖。
得分情況統(tǒng)計(jì)圖
根據(jù)以上信息,我們可以估計(jì)該地區(qū)得滿分(即8 分)的學(xué)生有1600 人。如果已知難度系數(shù)的計(jì)算公式為L=,其中L為難度系數(shù),X為樣本平均得分,W為試題滿分值,根據(jù)試題的難度系數(shù)可將試題分為以下三類:當(dāng)0<L≤0.4時(shí),此題為難題;當(dāng)0.4<L≤0.7 時(shí),此題為中等難度試題;當(dāng)0.7<L<1 時(shí),此題為容易題。通過 計(jì) 算,X=0×10%+3×25%+5×45%+8×20%=4.6,L==0.575,結(jié)合難度系數(shù),0.4<0.575≤0.7,所以此題為中等難度試題。