張青云
在進行數(shù)據(jù)統(tǒng)計時,有時需要列出數(shù)據(jù)的頻數(shù)分布表,或是以條形統(tǒng)計圖直觀地呈現(xiàn)頻數(shù)分布情況,這些都涉及對數(shù)據(jù)進行分組的問題.數(shù)據(jù)分組的實質(zhì)就是將數(shù)據(jù)分類,關(guān)鍵在于不重不漏.出于降低問題難度的目的,有時對數(shù)據(jù)已預(yù)先確定好組距及組數(shù),但這個組距及組數(shù)是如何確定出來的,很多同學(xué)仍認識模糊.下面以蘇教版教材八年級下冊第24頁習題第2題為例,對此進行分析說明.
問題:小麗調(diào)查了她所在班級50名同學(xué)的身高,結(jié)果如下(單位:cm):
141、154、149、154、162、165、168、150、155、163、144、168、150、157、155、171、155、160、145、163、145、155、152、160、148、145、169、152、160、163、158、157、159、160、168、150、157、152、158、155、157、157、159、162、145、150、158、144、155、172
一、 分組的第一步:計算數(shù)據(jù)的極差
找出樣本數(shù)據(jù)中的最大值與最小值,求它們的差.比如該問題的極差是:172-141=31.
二、 第二步:決定組距與組數(shù)
組距是指各組的邊界值之差.比如有一組顯示為4.0≤x<4.3,則組距就是0.3. 通常在研究頻數(shù)分布時,采用的都是等距分組,即每一組的邊界值之差相等,其原因也是為了使后面畫的頻數(shù)分布直方圖更直觀.在頻數(shù)分布直方圖中,每一小組對應(yīng)一個長方形,并以小長方形面積的大小來表示各小組內(nèi)取值的頻率.容易知道,條形長方形的面積=組距×條形的高,所以,在組距相同的情況下,條形的高可以直接與小組的頻數(shù)相對應(yīng).頻數(shù)越大,條形越高;頻數(shù)越小,條形越低.
組距如何定?組距×組數(shù)≥極差.通常一組樣本容量在100左右的數(shù)據(jù),其組數(shù)適宜在7~12.比如:如果組距定為3,31÷3,那組數(shù)就定為11組;如果組距定為4,31÷4,那組數(shù)就定為8組;如果組距定為5,31÷5,那組數(shù)就定為7.具體選哪一種,要依問題的實際要求來定.本題樣本容量是50,組距可以為4或5.
三、 分組確定各組的邊界值
有兩種確定方法:一是直接從最?。ɑ蜃畲螅┲甸_始,每一組以a≤x
另一種方式,是以比樣本數(shù)據(jù)精確度更高一位的a
也可以以組距為4,采用上述兩種方式來列頻數(shù)分布表,讀者可自行完成.當頻數(shù)分布表完成后,畫頻數(shù)分布直方圖就很容易了.
在教材第28頁第2題,已經(jīng)給定組距為5,教材第34頁第8題要求更高,需要自行決定組數(shù)與組距,通過閱讀本文,大家可以再次研究這兩道題目.
(作者單位:廣東省東莞市東莞中學(xué)松山湖學(xué)校)