魏滿滿 李石虎 周勤
【摘要】本文主要探究了假設(shè)檢驗的基本思想和有關(guān)概念的教學(xué)設(shè)計.首先,通過“女士品茶”的故事引入,提煉出假設(shè)檢驗的基本思想;其次,通過分析項鏈含金量這一實際案例總結(jié)出假設(shè)檢驗的基本步驟,并介紹了假設(shè)檢驗的兩類錯誤和p值的概念;最后,融入思政的元素,豐富了課堂教學(xué)內(nèi)容.
【關(guān)鍵詞】假設(shè)檢驗;教學(xué)設(shè)計
【基金項目】 江蘇師范大學(xué)課程思政專項研究(KCSZY17);江蘇師范大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院思政示范課程(XYKCSZ01)
一、引 言
概率論與數(shù)理統(tǒng)計課程是各個高校理工科的基礎(chǔ)必修課,它在理工科及經(jīng)管類各專業(yè)被廣泛應(yīng)用.假設(shè)檢驗是概率論與數(shù)理統(tǒng)計中的重要知識點(diǎn),是統(tǒng)計推斷的主要方法之一,在概率統(tǒng)計的理論研究與實際應(yīng)用中都占有極其重要的地位.2019年3月18日,在學(xué)校思想政治理論課教師座談會上,習(xí)近平總書記明確提出[1]:要堅持灌輸性和啟發(fā)性相統(tǒng)一,注重啟發(fā)性教育,引導(dǎo)學(xué)生發(fā)現(xiàn)問題、分析問題、思考問題,在不斷啟發(fā)中讓學(xué)生水到渠成得出結(jié)論.近年來,各大高校都十分重視思政建設(shè),通過教師培訓(xùn)、專家講座、示范課程等多種方式來加深教師對課程思政的理解.教師是高校的“第一主角”,作為專業(yè)課教師,也有責(zé)任和義務(wù)認(rèn)真挖掘所授課程的“思政元素”.例如,2021年,李晨和陳麗萍[2]在研究概率統(tǒng)計的思政元素時,以概率學(xué)者的文化素養(yǎng)和科學(xué)治學(xué)精神為切入點(diǎn),通過多個實際案例剖析全概率公式的應(yīng)用,潛移默化地引入諸多思政元素來激發(fā)學(xué)生的學(xué)習(xí)興趣.受此啟發(fā),本文著重從概率論與數(shù)理統(tǒng)計課程中 “假設(shè)檢驗”這一角度思考,通過教學(xué)設(shè)計來探索課程思政理念進(jìn)概率統(tǒng)計課堂的實踐方法,目的就是同大家交流如何上好“假設(shè)檢驗”這一知識點(diǎn)的教學(xué)課.
首先,我們通過“女士品茶”這一廣為流傳且富有趣味性的故事引入,啟發(fā)學(xué)生思考,從中提煉出假設(shè)檢驗的基本思想.其次,我們通過分析項鏈含金量這一實際案例總結(jié)出假設(shè)檢驗的基本步驟.接著,我們介紹假設(shè)檢驗的兩類錯誤和p值的概念,并介紹假設(shè)檢驗的一些應(yīng)用.最后,我們?nèi)谌胨颊脑?,以我國著名?shù)學(xué)家嚴(yán)加安院士的《悟道詩》為結(jié)尾,闡述了概率統(tǒng)計的基本思想,同時激勵學(xué)生向老一輩科學(xué)家學(xué)習(xí),樹立正確的價值觀,從而豐富了課堂教學(xué)內(nèi)容.
二、教學(xué)過程
(一)問題引入
首先,我們從一個經(jīng)典故事出發(fā),來體會假設(shè)檢驗的基本思想.
例1[3] ?(女士品茶試驗)故事發(fā)生在英國劍橋大學(xué),那是20世紀(jì)20年代,一群大學(xué)精英們正在品茶.該茶是由牛奶和茶水混合而成的.在品茶過程中,一位女士宣稱:先加入牛奶還是先加入茶,不同的順序會使茶的口感不同.周圍人都認(rèn)為這位女士簡直是在胡言亂語,這是不可能的?。∪欢趫龅慕y(tǒng)計學(xué)家Fisher卻對這個話題很感興趣,他請人端來10杯調(diào)制好的茶讓該女士品嘗,其中有的是先加的牛奶,有的是先加的茶.結(jié)果,這位女士正確地鑒別出每一杯茶的制作順序.該如何判斷該女士是否有鑒別能力呢?
Fisher的想法:假設(shè)該女士沒有鑒別能力,這個時候她只能靠猜,從而她猜對的概率為1[]2.因此,她能同時判斷出10杯茶的概率為2-10<0.001,這個概率非常非常小,僅僅做一次試驗是幾乎不會發(fā)生的,可是,它卻發(fā)生了!這表明原假設(shè)不恰當(dāng),應(yīng)予以拒絕,認(rèn)為該女士有鑒別能力!
假設(shè)檢驗的基本思想:小概率反證法思想.先提出假設(shè),然后設(shè)計試驗,在原假設(shè)成立的條件下計算概率,依據(jù)小概率原理來判斷是否拒絕原假設(shè).那么多大的概率屬于小概率呢?對于不同的問題,會有不同的標(biāo)準(zhǔn),在統(tǒng)計學(xué)中,這個小概率稱為顯著性水平,常取0.05或0.01.
接下來,我們就通過生活中的一個實際案例來探索一下假設(shè)檢驗的奧秘.
(二)實例分析
在生活中,經(jīng)常會遇到一組數(shù)據(jù),我們來看下面的例子.
例2[4] 質(zhì)檢部門接到投訴后,對某金店進(jìn)行調(diào)查,從標(biāo)有18K的一批項鏈中抽取20條,測得其含金量如下:
問:如何判斷這批項鏈有沒有達(dá)到標(biāo)準(zhǔn)呢?(顯著性水平α=0.05)
分析:觀察表1中的數(shù)據(jù),我們可以發(fā)現(xiàn):有的含金量大于18K,有的含金量小于18K,還有的恰好等于18K.那么我們能否直接說和標(biāo)準(zhǔn)值18K有顯著差別呢?根據(jù)所學(xué)的統(tǒng)計學(xué)思想方法,我們已經(jīng)了解到答案是否定的,因為這里看到的只是樣本數(shù)據(jù),我們無法直接做出判斷.那么應(yīng)該如何判斷呢?
我們的思路如下:
首先,計算出這20條項鏈含金量的平均值為17.8,它與標(biāo)準(zhǔn)值18存在0.2的差值.這0.2的差值是由抽樣引起的誤差,還是有本質(zhì)的差別?我們利用上述思想來檢驗一下.
令ξ表示這批項鏈的含金量,由中心極限定理可知ξ~·N(μ,σ2),我們要檢驗均值是否為μ=18,具體步驟如下:
1.建立假設(shè).原假設(shè)H0:μ=18,表示這批項鏈符合標(biāo)準(zhǔn);與之對立的備擇假設(shè)H1:μ≠18,表示這批項鏈不符合標(biāo)準(zhǔn).
2.在H0成立時,由Fisher定理可知統(tǒng)計量
T=-μSn[]n~t(n-1)=t(19).
3.由T分布圖像(如圖1)可以看出:T的取值集中在零點(diǎn)附近.這表明:|T|越大,對應(yīng)的概率就越小.從而存在臨界值C,使得|T|大于或等于C是一個小概率事件,則C要滿足
P(|T|≥C|H0成立)=α,
再由T分布圖像的對稱性可知
C=t0.975(19)≈2.093.
從而,當(dāng)|T|≥2.093時,非常小的概率事件在此就發(fā)生了,只能拒絕原假設(shè)H0.
我們將W={(ξ1,ξ2,…,ξn)||T|≥2.093}這一集合稱為拒絕域,如果樣本的觀測值落到W中,則原假設(shè)應(yīng)被拒絕.
4.代入樣本均值和樣本標(biāo)準(zhǔn)差進(jìn)行計算,得到所觀測的樣本統(tǒng)計量t的值:
|t|=|17.8-18|0.40393[]20≈2.214>2.093,
其落到拒絕域W中,因此原假設(shè)被拒絕,故這批項鏈沒有達(dá)到標(biāo)準(zhǔn).
為了更直觀地理解拒絕域的含義,同學(xué)們可以參考T分布圖像.
小結(jié) 本案例利用假設(shè)檢驗思想得出了該金店項鏈的含金量不符合標(biāo)準(zhǔn)的結(jié)論,啟發(fā)我們對待任何事情都不要抱有僥幸心理,不要弄虛作假,要誠信做人做事,方能贏得大家的信任.項鏈含金量不達(dá)標(biāo)可能只是使消費(fèi)者金錢方面的利益受損.試想一下:如果是某大型嬰兒奶粉企業(yè)檢測出質(zhì)量不達(dá)標(biāo)的產(chǎn)品呢?再或者是嬰兒霜經(jīng)檢測含有毒物質(zhì)呢?抑或是我們服用的某種藥物檢測出有危害健康的成分呢?這些案例都不是捕風(fēng)捉影,均上過各大網(wǎng)站熱搜,引起了消費(fèi)者的恐慌.利用假設(shè)檢驗這個工具,有助于我們?nèi)娴卣J(rèn)識這類事件,既可以讓我們避免無謂的損失,又可以幫助我們找到有利的取舍依據(jù).
(三)假設(shè)檢驗的基本步驟
通過對上述案例的分析,我們可以歸納出求解假設(shè)檢驗的基本步驟:
第一步:從要研究的實際問題引入,先提出一個假設(shè),一般稱之為原假設(shè),記為H0,與其對立的假設(shè)稱為備擇假設(shè),記為H1.例如,在上述案例中,原假設(shè)為“這批項鏈符合標(biāo)準(zhǔn)”,備擇假設(shè)為“這批項鏈不符合標(biāo)準(zhǔn)”.
第二步:依據(jù)所研究總體服從的分布,我們來構(gòu)造合適的檢驗統(tǒng)計量,并通過所學(xué)知識來確定統(tǒng)計量服從的分布.
第三步:接下來,我們需要確定檢驗的拒絕域W使得
P((ξ1,ξ2,…,ξn)∈W|H0成立)≤α.
第四步:根據(jù)樣本數(shù)值計算統(tǒng)計量所對應(yīng)的觀測值.如果計算所得觀測值落進(jìn)了W中,則說明原假設(shè)不當(dāng),應(yīng)予以拒絕,否則原假設(shè)不可以被拒絕.
(四)假設(shè)檢驗的兩類錯誤
在“女士品茶”的例子中,如果該女士本來就沒有鑒別能力,但是她運(yùn)氣好,每次都猜對了,這時候我們的推斷就出錯了.事實上,在假設(shè)檢驗問題中,我們由樣本提供的信息來推斷總體信息,由于樣本只包含總體的一部分信息,這就不可能保證從來不會犯錯誤.假設(shè)檢驗可能犯的錯誤有如下兩類:
(Ⅰ)是否在 “拒絕假設(shè)H0” 時用了“小概率原理”.注意小概率事件并非不可能事件,如果原假設(shè)本為真,但由于樣本值落進(jìn)了拒絕區(qū)域內(nèi)而得出“拒絕”的結(jié)論,這里犯的錯誤為棄真錯誤,通常稱為第一類錯誤,記為α,即
P(拒絕H0|H0為真)=α.
(Ⅱ)反之,如果原假設(shè)H0本來是不成立的,卻由于樣本值未落進(jìn)拒絕區(qū)域而得出“不能拒絕”的結(jié)論.這里的錯誤是納偽錯誤,一般稱為第二類錯誤,記作β,即
P(接受H0|H0不真)=β.
根據(jù)檢驗法則知:當(dāng)H0成立時,拒絕H0的概率小于或等于顯著性水平α,但是顯著性水平α取得越小越好,因為此時拒絕域也會相應(yīng)地減小,從而導(dǎo)致犯第二類錯誤的概率增大.這是一個矛盾的雙方,類似于區(qū)間估計時的做法,我們需要先固定顯著性水平α,再選擇合理的檢驗統(tǒng)計量來適當(dāng)?shù)販p小β的值.
下面我們再結(jié)合一個實際例子來理解兩類錯誤:在新冠肺炎疫情發(fā)生初期,新聞報道中時常會出現(xiàn)“假陽”的檢測結(jié)果.我們可以從假設(shè)檢驗的兩類錯誤的角度來理解:事實上,任何檢驗方法都會存在犯錯誤的可能性,理想的試劑應(yīng)是“假陰”和“假陽”出現(xiàn)的概率都越小越好,但當(dāng)樣本量有限、檢測技術(shù)沒有明顯優(yōu)化提升時,一類錯誤概率的減少必會導(dǎo)致另一類錯誤概率的增加,因此處理原則是:人為限定犯第一類錯誤的概率α,為降低犯第二類錯誤的概率,我們可以增大樣本容量.所以,從統(tǒng)計學(xué)的觀點(diǎn)看,新聞報道中的“假陰”“假陽”患者出現(xiàn)并不奇怪.
啟發(fā):小概率事件雖然在一次試驗中不易發(fā)生,但絕非不可能事件,重復(fù)次數(shù)多了,發(fā)生的可能性也就增大了.這說明做任何事情都不要存在投機(jī)取巧的心理,俗話說“常在河邊走,哪有不濕鞋”“勿以惡小而為之,勿以善小而不為”.反之,再困難的事情,只要我們持之以恒,總是可以成功的,正所謂“鍥而不舍,金石為開”!
(五)假設(shè)檢驗的p值
可以看出,顯著性水平α變小,對應(yīng)的拒絕域也會變小;當(dāng)顯著性水平α取得足夠小時,使得樣本值不落在相應(yīng)的拒絕域中,從而在此顯著性水平α下不能拒絕假設(shè)H0.當(dāng)顯著性水平α由上述足夠小的值不斷增大時,對應(yīng)的拒絕域也會變大,當(dāng)顯著性水平α大到一定程度時,便可以使樣本值落入相應(yīng)的拒絕域中,從而在此顯著性水平α下可以拒絕假設(shè)H0.
對于一個確定的樣本值,存在一個實數(shù)p(0<p<1),當(dāng)顯著性水平α=p時可以拒絕H0,而當(dāng)α<p時原假設(shè)H0不可以被拒絕.可見,p是使依據(jù)給定樣本數(shù)值做出“拒絕H0”的最小的那個顯著性水平,我們稱之為檢驗的p值.
在例2中,我們也可以通過統(tǒng)計軟件計算t統(tǒng)計量的值和p值:
給定顯著性水平α為0.05,由表2可知p值0.039<0.05,原假設(shè)應(yīng)被拒絕,認(rèn)為項鏈含金量與18K之間有顯著的統(tǒng)計差異,從而得出“項鏈不符合標(biāo)準(zhǔn)”的結(jié)論.
(六)課堂小結(jié)與思政
本節(jié)課我們主要通過“女士品茶”的案例引入假設(shè)檢驗的基本思想,通過分析項鏈含金量這一實際案例總結(jié)出假設(shè)檢驗的基本步驟,也給出了假設(shè)檢驗的兩類錯誤和p值的含義,這為接下來進(jìn)一步學(xué)習(xí)不同類型的、具體的假設(shè)檢驗打下了必要的基礎(chǔ).
假設(shè)檢驗不僅是一種重要的統(tǒng)計方法,更是一種思維方式,告訴我們用數(shù)據(jù)來說話,理性地看待問題.正因為如此,假設(shè)檢驗在我們的現(xiàn)實生活中有著十分重要的應(yīng)用.比如,專家利用假設(shè)檢驗,結(jié)合臨床數(shù)據(jù)分析不同采樣點(diǎn)、人群、年齡的新冠病毒核酸檢測的結(jié)果,給有關(guān)部門的決策提供參考.假設(shè)檢驗的理論方法不僅被廣泛應(yīng)用于醫(yī)學(xué)檢驗、生物制藥等諸多領(lǐng)域,在我們的生產(chǎn)生活,特別是工業(yè)產(chǎn)品的質(zhì)量判斷中也有著十分廣泛的應(yīng)用[5],因為在工廠的實際生產(chǎn)過程中,產(chǎn)品的尺寸總是左右浮動的,存在一定的誤差,那么如何判斷這些誤差是否在允許的范圍內(nèi)?這就要用到假設(shè)檢驗的思想方法.不僅如此,假設(shè)檢驗的理論還可應(yīng)用于文學(xué)研究.例如,東南大學(xué)韋博成教授在2009年[6]利用假設(shè)檢驗的理論方法分析了《紅樓夢》前80回與后40回的某些文風(fēng)差異,得到的結(jié)論是“這兩部分內(nèi)容在寫作風(fēng)格方面存在明顯的差異”,給關(guān)于《紅樓夢》作者的論斷提供了一個強(qiáng)有力的證據(jù).在現(xiàn)實生活中,數(shù)據(jù)是無處不在的,學(xué)習(xí)假設(shè)檢驗的思想方法有助于我們正確地挖掘數(shù)據(jù)背后的規(guī)律,做出更客觀的判斷.
如今,我們身處一個大數(shù)據(jù)時代,通過學(xué)習(xí)假設(shè)檢驗,更重要的是培養(yǎng)透過現(xiàn)象看本質(zhì)這一統(tǒng)計思維.這里,調(diào)查得來的數(shù)據(jù)是現(xiàn)象,規(guī)律是從數(shù)據(jù)中探索出來的本質(zhì)屬性.我們需要借助數(shù)學(xué)模型,并結(jié)合統(tǒng)計方法來尋找這其中的規(guī)律和隨機(jī)性,在潛移默化中培養(yǎng)統(tǒng)計思維.正如我國著名的數(shù)學(xué)家嚴(yán)加安院士在《悟道詩》中所題:隨機(jī)非隨意,概率破玄機(jī);無序隱有序,統(tǒng)計解迷離.
注:課后同學(xué)們?nèi)粝脒M(jìn)一步了解統(tǒng)計學(xué)的發(fā)展歷程,可以讀一讀《20世紀(jì)統(tǒng)計怎樣變革了科學(xué):女士品茶》[7] 這一科普著作.
【參考文獻(xiàn)】
[1]習(xí)近平主持召開學(xué)校思想政治理論課教師座談會[N].新華社,2019-03-18,20:57.
[2]李晨,陳麗萍.概率論與數(shù)理統(tǒng)計課程教學(xué)中思政元素的挖掘與實踐[J].大學(xué)教育,2021(9):104-106.
[3]茆詩松,程依明,濮曉龍.概率論與數(shù)理統(tǒng)計教程:第3版[M].北京:高等教育出版社,2019.
[4] 朱元澤,李賢彬.概率論與數(shù)理統(tǒng)計[M].上海: 上海交通大學(xué)出版社,2015.
[5] 喬靜.假設(shè)檢驗在工業(yè)產(chǎn)品質(zhì)量判斷中的應(yīng)用[J].機(jī)電信息,2020(27):142-143.
[6] 韋博成.《紅樓夢》前80回與后40回某些文風(fēng)差異的統(tǒng)計分析(兩個獨(dú)立二項總體等價性檢驗的一個應(yīng)用)[J].應(yīng)用概率統(tǒng)計,2009(4):441-448.
[7] 薩爾斯伯格.20世紀(jì)統(tǒng)計怎樣變革了科學(xué):女士品茶[M].北京:中國統(tǒng)計出版社,2004.