張明亮
摘要:統(tǒng)計(jì)學(xué)是一門重要的學(xué)科,在日常生活中有著極其廣泛的應(yīng)用。本文對(duì)統(tǒng)計(jì)學(xué)教學(xué)中幾個(gè)容易混淆的問題進(jìn)行闡明,旨在幫助學(xué)生對(duì)統(tǒng)計(jì)學(xué)中的一些概念有個(gè)正確的理解。
關(guān)鍵詞:統(tǒng)計(jì)學(xué);直方圖;總體;相關(guān)系數(shù)
中圖分類號(hào):C81 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2019)24-0188-02
統(tǒng)計(jì)學(xué)是一套處理和分析數(shù)據(jù)的方法和技術(shù),是一門數(shù)據(jù)分析的學(xué)科。統(tǒng)計(jì)學(xué)作為一門基礎(chǔ)課程,越來越受到人們的重視,呈現(xiàn)著新的發(fā)展趨勢(shì)及活力。但是,學(xué)生往往對(duì)一些概念產(chǎn)生模糊認(rèn)識(shí),甚至一些教科書中,也出現(xiàn)對(duì)一些概念表述不清的情況,這里就學(xué)生在學(xué)習(xí)中容易產(chǎn)生混淆的幾個(gè)問題進(jìn)行闡述,旨在幫助學(xué)生對(duì)一些概念有一個(gè)正確的理解。
一、直方圖與條形圖
直方圖是統(tǒng)計(jì)學(xué)中對(duì)數(shù)據(jù)描述的一個(gè)圖形,在高中教材中也有介紹,但有一部分學(xué)生對(duì)這個(gè)概念理解不清。曾對(duì)學(xué)習(xí)統(tǒng)計(jì)學(xué)一年以后的大三學(xué)生做過一項(xiàng)統(tǒng)計(jì)學(xué)方面的調(diào)查,班級(jí)共有68名學(xué)生,有36名學(xué)生對(duì)直方圖與條形圖不能很好地區(qū)分開來,約占53%。有的學(xué)生把二者混為一談,對(duì)于二者的應(yīng)用范圍分不清楚。條形圖是用寬度相同的條形的高來表示數(shù)據(jù)多少的圖形,每一矩形表示一個(gè)類別,其寬度沒有實(shí)際意義,每個(gè)小矩形不相連。條形圖有單式條形圖和復(fù)式條形圖之分,它一般適應(yīng)于品質(zhì)數(shù)據(jù)。
直方圖是用于展示定量數(shù)據(jù)分布的一種常用圖形,它是用矩形的寬度和高度來表示頻數(shù)的分布,矩形的寬度表示分組數(shù)據(jù)的組距,由于分組數(shù)據(jù)具有連續(xù)性,所以每個(gè)矩形是相連的,通過直方圖可以觀察數(shù)據(jù)分布的大致情況。一般用每個(gè)小區(qū)間內(nèi)的頻率比上組距來表示小矩形的高度,這樣做是為了使得直方圖圍成的面積為1,因?yàn)橐痪S連續(xù)型隨機(jī)變量的概率密度函數(shù)與x軸圍成的面積為1,通過對(duì)直方圖的折線近似擬合,觀察這條折線與已知分布的哪個(gè)概率密度函數(shù)擬合得比較好,可得出這組數(shù)據(jù)的大致分布。
但是,在有的教材中,往往把直方圖的高這一數(shù)據(jù)標(biāo)錯(cuò),給學(xué)生理解帶來困難。右圖為某公司電腦銷售額分布的直方圖,從圖中可以看出,縱坐標(biāo)標(biāo)出的高度都不是頻率與組距的比,直方圖圍成的面積自然也不能保證是1。
二、對(duì)總體的理解
總體是指研究的對(duì)象的全體或試驗(yàn)的全部可能的觀察值。由此可見,總體是指研究對(duì)象,一般是一些具體的數(shù)值。如,要考察一個(gè)班級(jí)《統(tǒng)計(jì)學(xué)》期末的考試成績(jī),不能把這個(gè)班的學(xué)生看作總體,而應(yīng)是每個(gè)學(xué)生的《統(tǒng)計(jì)學(xué)》成績(jī)組成的集合為總體,因?yàn)檫@里考察的僅僅是《統(tǒng)計(jì)學(xué)》的成績(jī),而不是其他學(xué)科的成績(jī)。有的學(xué)生對(duì)總體理解不到位,甚至一些教材上也犯有同樣的錯(cuò)誤。
三、方差與標(biāo)準(zhǔn)差的單位
隨機(jī)變量X的方差用D(X)或Var(X)表示,若E[X-E(X)]存在,則D(X)=E[X-E(X)]稱為隨機(jī)變量X的方差。它刻畫了隨機(jī)變量X的取值與其數(shù)學(xué)期望E(X)的偏離程度,若方差較小,意味著隨機(jī)變量X的取值比較集中在E(X)附近,反之,說明隨機(jī)變量X取值比較分散。方差的開平方稱為標(biāo)準(zhǔn)差或均方差。方差和標(biāo)準(zhǔn)差是否有單位,應(yīng)該怎樣定義單位呢?關(guān)于這個(gè)問題有很多人認(rèn)識(shí)不清,方差和標(biāo)準(zhǔn)差是否有單位,取決于“樣本數(shù)據(jù)”,若“樣本數(shù)據(jù)”有單位,那么方差和標(biāo)準(zhǔn)差均有單位;若“樣本數(shù)據(jù)”是沒有單位的數(shù)值,那么方差和標(biāo)準(zhǔn)差均沒有單位。由方差的定義知,一個(gè)隨機(jī)變量X的方差,是這個(gè)隨機(jī)變量與它的數(shù)學(xué)期望的差的平方的數(shù)學(xué)期望,若這個(gè)隨機(jī)變量X有單位,它的數(shù)學(xué)期望就與這個(gè)隨機(jī)變量具有相同的單位,二者差的平方的單位應(yīng)該是原單位的平方,再求數(shù)學(xué)期望則單位不變,因此,方差的單位應(yīng)該是“樣本數(shù)據(jù)”單位的平方,而標(biāo)準(zhǔn)差是由方差開方得到,所以標(biāo)準(zhǔn)差的單位與“樣本數(shù)據(jù)”的單位相同。如果數(shù)據(jù)的單位是千克,方差的單位就是千克的平方,標(biāo)準(zhǔn)差的單位就是千克;如果數(shù)據(jù)的單位是秒,方差的單位就是秒的平方,標(biāo)準(zhǔn)差的單位就是秒。只是現(xiàn)在教科書中對(duì)方差的單位比較淡化,一般考試中,所求的方差不要求寫單位。但是,在有的教材中仍會(huì)出現(xiàn)單位標(biāo)注錯(cuò)誤。有本教材給出的例題是這樣的:
例:根據(jù)例4.1的數(shù)據(jù),計(jì)算9名員工月工資收入的方差和標(biāo)準(zhǔn)差。
四、無限與不可數(shù)
可數(shù)和無窮多是兩個(gè)不同的概念。可數(shù)可以簡(jiǎn)單地認(rèn)為是可以按一定順序排列出來,所以也稱為可列。如所有自然數(shù){0,1,2,3,…}是可數(shù)個(gè),只要能與自然數(shù)一一對(duì)應(yīng)就是可數(shù)的,如所有奇數(shù)、所有偶數(shù)、所有有理數(shù)都是可數(shù)的。不可數(shù)就是沒有辦法一一排列出來,如區(qū)間[0,1]內(nèi)的所有實(shí)數(shù)就是不可數(shù)的。
五、相關(guān)系數(shù)及其含義
當(dāng)r=1時(shí),稱隨機(jī)變量X與Y正相關(guān);當(dāng)r=-1時(shí),稱隨機(jī)變量X與Y負(fù)相關(guān);當(dāng)r=0時(shí),稱隨機(jī)變量X與Y不相關(guān)。說明相關(guān)系數(shù)定量地刻畫了隨機(jī)變量X、Y的線性相關(guān)程度,這里需注意的是:相關(guān)系數(shù)為零,只能說明隨機(jī)變量X與Y不具有線性相關(guān)關(guān)系,未必沒有關(guān)系;相關(guān)系數(shù)為1,也只能說明隨機(jī)變量X與Y之間以概率1存在著線性關(guān)系,直觀來說,就是幾乎所有的點(diǎn)(X、Y)都在直線Y=aX+b上,允許個(gè)別點(diǎn)不在這條直線上,不在這條直線上的點(diǎn)的概率應(yīng)為0,但不能說二者具有函數(shù)關(guān)系。在有些教材中,把r=1與二者具有函數(shù)關(guān)系等同起來,此教材這樣描述相關(guān)系數(shù):“可以證明,相關(guān)系數(shù)的取值范圍在+1和-1之間,即-1 六、一元線性回歸模型 總之,有些概念在一些教科書中介紹不清,老師在講授時(shí)又不夠重視,使得學(xué)生對(duì)這些概念不能很好地掌握,這是造成學(xué)生錯(cuò)誤的根本原因,值得重視。 參考文獻(xiàn): [1]賈俊平.統(tǒng)計(jì)學(xué)基礎(chǔ)[M].第3版.北京:中國(guó)人民大學(xué)出版社,2013. [2]盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(jì)[M].第4版.北京:高等教育出版社,2011.