◎黃娟娟
(空軍通信士官學(xué)校,遼寧 大連 116000)
上篇文章中我們還有幾個教學(xué)中應(yīng)該注意的問題沒有指明和解決,本文對正態(tài)總體參數(shù)假設(shè)檢驗進行的單元教學(xué)設(shè)計,指出了教師應(yīng)該注意的剩余七個問題,并給出實例加以說明
假設(shè)檢驗被著名的統(tǒng)計學(xué)家R.A.Fisher稱為統(tǒng)計推斷三大中心內(nèi)容之一,這是因為很多統(tǒng)計方法都與假設(shè)檢驗有關(guān)
目前,國內(nèi)各種數(shù)理統(tǒng)計教材都將其中的正態(tài)總體參數(shù)的假設(shè)檢驗作為基本內(nèi)容,課時安排為4~6學(xué)時,主要內(nèi)容包括假設(shè)檢驗的基本思想、基本問題、基本概念和一般步驟,單個正態(tài)總體參數(shù)的單邊檢驗,兩個正態(tài)總體參數(shù)的假設(shè)檢驗這部分內(nèi)容的特點是思想深刻、方法獨特、重點集中、難點突出、概念眾多、順序嚴(yán)格(緊湊)、邏輯嚴(yán)謹(jǐn)、步驟緊密,這使教師教學(xué)和學(xué)生學(xué)習(xí)容易遇到困難本文根據(jù)教學(xué)設(shè)計的原則對正態(tài)總體參數(shù)假設(shè)檢驗進行了單元教學(xué)設(shè)計,并指出了對于這部分內(nèi)容,教師在講授時應(yīng)注意的問題,以幫助教師提高教學(xué)質(zhì)量
第一,明確教案的主要內(nèi)容,并確立教學(xué)目標(biāo)教師在學(xué)生深刻理解假設(shè)檢驗的基本思想、基本概念和一般步驟的基礎(chǔ)上,使學(xué)生熟練地掌握正態(tài)總體參數(shù)假設(shè)檢驗的各種方法,并能正確使用其解決實際問題這樣就解決了課堂上學(xué)生要學(xué)什么的問題
第二,課堂教學(xué)設(shè)計基本上是提前計劃好教學(xué)模式,教師用創(chuàng)造性的策略達到預(yù)期的教學(xué)目標(biāo)因此,具體地給出教學(xué)設(shè)計方案就是解決怎樣教的問題根據(jù)本節(jié)內(nèi)容特點,筆者設(shè)計具體的教學(xué)方案如下:
(1)給出兩個淺顯的生活實例和與一個正態(tài)總體參數(shù)檢驗有關(guān)的實例,然后概括出假設(shè)檢驗的基本思想
(2)通過上述給出的例子明確假設(shè)檢驗的基本問題
(3)假設(shè)檢驗的基本概念和一般步驟要結(jié)合實例一起講解教師通過解決一個具體問題,理清假設(shè)檢驗的五個步驟,并在每個步驟里講解各個基本概念產(chǎn)生的背景條件、內(nèi)涵和需要注意的問題
(4)對于正態(tài)總體參數(shù)假設(shè)檢驗的具體方法,教師根據(jù)總體個數(shù)、檢驗的參數(shù)、已知條件以及檢驗的拒絕域是單側(cè)還是雙側(cè),每種情況講解一個實際問題,通過實例,明確檢驗應(yīng)使用的具體方法
第三,明確教學(xué)難點和重點,并提出解決問題的關(guān)鍵和策略我們認為這個單元的教學(xué)難點是正確認識假設(shè)檢驗的基本思想,深刻理解假設(shè)檢驗的基本概念和一般步驟,熟練掌握正態(tài)總體參數(shù)的假設(shè)檢驗方法
如果我們將假設(shè)檢驗的思想同具體問題一起講解,則容易造成混亂我們可以利用分散難點的教學(xué)原則解決這個問題上課之初,教師先講兩個簡單的日常生活中的例子,然后用一個統(tǒng)計實例來闡明假設(shè)檢驗的思想,指出基本思想的本質(zhì)特征由于這部分內(nèi)容的名詞概念有十多個,加之概念之間有明確的順序關(guān)系,教師講丟了不行,講亂了也不行,講解難度很大教師可以通過一個具體實例的解決過程來理清假設(shè)檢驗的每個步驟,以及我們在每個步驟中遇到的名詞概念隨著問題的解決,步驟逐漸清晰,各個概念在每個步驟中的意義、作用也都清楚了我們將假設(shè)檢驗視為一個具有系統(tǒng)性規(guī)模的工程,每一個步驟可以被看成這個工程中的一個子環(huán)節(jié),這些子環(huán)節(jié)按照排列組合的程序性特點,有序地進行等級排列,且前一個子環(huán)節(jié)影響著后面的子環(huán)節(jié),而后面的子環(huán)節(jié)又依存并制約前一個子環(huán)節(jié)所有內(nèi)容的漸進程序性要求課堂設(shè)計也應(yīng)體現(xiàn)類似計算機程序的規(guī)律性與聯(lián)系性,這樣的設(shè)計保證了課堂教學(xué)設(shè)計的科學(xué)性
正態(tài)總體參數(shù)假設(shè)檢驗的背景、場合、條件、要求各有不同,方法也是各式各樣,各種情況雖具有相對的獨立性,但他們之間又互相依存和制約,組成了一個有機的總體所以課堂的教學(xué)設(shè)計更要立足于整體,做到總體與各環(huán)節(jié)的辯證統(tǒng)一,并有機地把系統(tǒng)的分析結(jié)合起來,以達到整體化教學(xué)的目的據(jù)此,我們可采用如下的方法進行處理
當(dāng)明確問題是一個或兩個正態(tài)總體參數(shù)假設(shè)檢驗時,由于總體可以是一個或兩個,檢驗的參數(shù)可以是期望或方差另外的參數(shù)可以是已知或未知,檢驗可以是單側(cè)或雙側(cè),所以我們可按下列步驟進行
一看正態(tài)總體是一個還是兩個;二看檢驗的參數(shù)是什么;三看另外的參數(shù)是已知還是未知;四看檢驗是單側(cè)還是雙側(cè)只有這樣,我們才能明確這是參數(shù)假設(shè)檢驗的八類二十四種中的哪一種檢驗問題明確了問題的實質(zhì),我們就能正確使用方法進行檢驗了這樣就完全解決了正態(tài)總體參數(shù)的假設(shè)檢驗問題根據(jù)教學(xué)目標(biāo),假設(shè)檢驗的基本概念、一般步驟和各種檢驗方法,既是教學(xué)難點,也是教學(xué)重點在講解這部分內(nèi)容的過程中,教師要對其進行強調(diào),突破難點,解決重點這樣教師就能合理地運用系統(tǒng)方法設(shè)計出教學(xué)過程,提高學(xué)習(xí)者獲得知識、技能的效率和興趣,使教學(xué)成為一種具有操作性的程序,使教學(xué)效果最優(yōu)
下面本文對教學(xué)中教師應(yīng)該注意的十二個問題中的后七個做重點解釋說明
因為我們注重拒絕原假設(shè),所以可以將復(fù)合原假設(shè):≤簡寫為′:=在我們實際應(yīng)用這種方法時,對于一個正態(tài)總體的兩個正態(tài)總體參數(shù)的單側(cè)假設(shè)檢驗會有類似的情況出現(xiàn)
(1)如何正確理解假設(shè)檢驗的基本思想?
(2)什么作為原假設(shè)?什么作為備擇假設(shè)?
(3)拒絕假設(shè)和接受假設(shè)的含義
在拒絕假設(shè)和接受假設(shè)方面,我們對于拒絕原假設(shè)要給以特別的注意,在原假設(shè)為真時,樣本觀測值落入拒絕域是一個小概率事件根據(jù)實際推斷原理,在一次觀測中,小概率事件是幾乎不可能發(fā)生的,所以拒絕原假設(shè)的理由是充足的由于檢驗第二類錯誤的概率并沒有受到限制,僅要求它盡可能小,所以在備擇假設(shè)為真時,樣本觀測值沒有落入拒絕域可能不是一個小概率事件,因為接受原假設(shè)的理由可能是不充足的,正如在教學(xué)中我們不能用一個例子去說明一個結(jié)論一樣,用一個樣本不能證明一個命題是成立的,但可以用一個樣本推翻一個命題事實上,在“拒絕原假設(shè)”和“拒絕備擇假設(shè)”(從而接受原假設(shè))之間還有一個模糊域如今我們把它并入接受域,所以接受域是復(fù)雜的,我們將之稱為保留域也許更恰當(dāng),但人們習(xí)慣上已把它稱為接受域,沒有必要再進行改變,只是應(yīng)注意它的含義科學(xué)的說法是不拒絕原假設(shè)我們把“不拒絕原假設(shè)”說成“接受原假設(shè)”,這是為了使實際工作者能較快地熟悉和使用假設(shè)檢驗方法
(4)兩類錯誤的關(guān)系與N-P原則
在進行假設(shè)檢驗時,由于樣本的隨機性,我們可能做出正確的判斷,也可能做出錯誤的判斷,這時我們可能會犯兩類錯誤(棄真錯誤和納偽錯誤)一般地,在樣本容量固定時,要減小犯第一類錯誤的概率,必然導(dǎo)致增大犯第二類錯誤的概率;反之,若要減小犯第二類錯誤的概率,則會使犯第一類錯誤的概率增大換句話說,當(dāng)樣本容量固定時,不可能使得犯兩類錯誤的概率都減小,這一現(xiàn)象在一般的檢驗問題中都會出現(xiàn)基于這種情況,教師需要采用某種妥協(xié)方案J.Neyman和E.S.Pearson的假設(shè)檢驗理論的基本思想,就是使犯第一類錯誤的概率限制在某一范圍內(nèi),然后,尋求使犯第二類錯誤的概率盡可能小的檢驗,這就是N-P原則
(5)第一類錯誤和第二類錯誤的概率大小如何確定
犯第一類錯誤的概率是事先選定一個較小的常數(shù)我們經(jīng)常取1%、5%和10%作為的值,的選取也依賴于我們關(guān)于假設(shè)的先驗信息,依賴于我們對犯第二類錯誤的要求比如,我們根據(jù)以往的檢驗,非常相信原假設(shè)是真的,而犯第二類錯誤又不會造成大的影響后果,此時可以取小一點又如,第二類錯誤帶來的影響較大,需要嚴(yán)格控制犯第二類錯誤的概率,此時可以選大一些
例如,在醫(yī)藥行業(yè)中,某種藥品合格被錯判為不合格的影響不大,但若將不合格品錯判為合格品后用于臨床,問題就嚴(yán)重了因此我們要適當(dāng)減小犯第二類錯誤的概率,可以通過適當(dāng)放大犯第一類錯誤的概率來實現(xiàn)再如,生產(chǎn)紐扣的工廠,若將合格紐扣錯判為不合格品將浪費原料,而將不合格品錯判為合格品也能將就使用,問題不太大因此我們要適當(dāng)減小犯第一類錯誤的概率這說明我們確定第一類錯誤和第二類錯誤的概率大小要具體問題具體對待
(6)檢驗中處理復(fù)合原假設(shè)的方法
我們通過例子說明這個問題,當(dāng)正態(tài)總體的方差未知時,欲檢驗:≤(已知)vs:>,此時原假設(shè)是一個復(fù)合假設(shè),我們可以采用第一種檢驗法,討論如下:
當(dāng)′:=vs:>時,原假設(shè)′成立,選擇檢驗統(tǒng)計量:
給定顯著性水平,我們可以通過查(-1)表得到臨界值1-(-1)有(≥1-(-1))=,此時拒絕域為:
={≥1-(-1)}
拒絕域確定了,檢驗方法就已確定
當(dāng)′′:
∴>≥1-(-1)
在′成立時,落入拒絕域,一定有′′成立時,落入拒絕域
因為我們注重拒絕原假設(shè),所以可以將復(fù)合原假設(shè):≤簡寫為′:=
(7)Behrens-Fisher(貝倫斯-費歇爾)問題
(8)檢驗和檢驗的關(guān)系
如果遇到同時要檢驗兩個正態(tài)總體期望和方差是否對應(yīng)相等的問題,由于檢驗統(tǒng)計量分布的推導(dǎo)的必要條件是兩總體方差要求相等,又由于Behrens-Fisher問題的存在,因此我們一定要先用檢驗法檢驗兩個正態(tài)總體方差是否相等,只有兩個正態(tài)總體方差相等時,我們才能使用普通的檢驗法檢驗兩個正態(tài)總體期望是否相等
(9)假設(shè)檢驗與區(qū)間估計的關(guān)系
假設(shè)檢驗和區(qū)間估計這兩個統(tǒng)計推斷問題看似完全不同,而實際上兩者有著非常密切的聯(lián)系由參數(shù)假設(shè)檢驗問題的水平的檢驗,可以得到參數(shù)的置信水平為(1-)的置信區(qū)間,反之亦然具體地說,1減顯著性水平就是置信水平,置信區(qū)間就是一種接受域
(10)使用檢驗的值
在顯著性水平檢驗中常常會出現(xiàn)這樣的問題,在一個較大的顯著性水平下會得到拒絕原假設(shè)的結(jié)論,而在一個較小的顯著性水平下會得到相反的結(jié)論這是因為顯著性水平變小會導(dǎo)致檢驗的拒絕域變小,于是原來落到拒絕域的觀測值就可能落入接受域,這種情況在應(yīng)用中會帶來麻煩為了避免這種問題出現(xiàn),我們提倡拒絕域與檢驗的值并用的方法,這樣就可以避免人為設(shè)定檢驗水平的非議
(11)充分性原則
進行正態(tài)總體參數(shù)假設(shè)檢驗時,原假設(shè)成立,檢驗的統(tǒng)計量可能不唯一,原則上我們應(yīng)該選用充分統(tǒng)計量或充分統(tǒng)計量的函數(shù)作為檢驗統(tǒng)計量,這就體現(xiàn)了Neyman(耐曼)的充分性原則
(12)檢驗方法具有穩(wěn)定性
總體正態(tài)可進行參數(shù)的假設(shè)檢驗,如果總體非正態(tài),那么在樣本容量較大時,理論表明其可近似地看成正態(tài)總體參數(shù)假設(shè)檢驗,檢驗方法是具有穩(wěn)定性的
針對以上出現(xiàn)的問題,我們以兩個參數(shù)假設(shè)檢驗的應(yīng)用進行舉例說明:
1某調(diào)研小組的研究觀察數(shù)據(jù)表明,僅某一個小鎮(zhèn)每天夜間微信視頻通話時間的標(biāo)準(zhǔn)差為5分鐘,現(xiàn)在有一個由100個視頻通話時間構(gòu)成的簡單隨機樣本,它們的平均通話時間為14分鐘在置信水平為百分之九十五的條件下,如何利用樣本信息判斷該鄉(xiāng)鎮(zhèn)每晚微信視頻通話的平均通話時間的置信區(qū)間呢?
根據(jù)已知調(diào)查數(shù)據(jù)可以判斷,這是一個雙側(cè)置信區(qū)間問題
假設(shè)該鄉(xiāng)鎮(zhèn)原來每晚視頻通話時間為15分鐘,因為15?(1302,1498),所以總體均值并未落在置信區(qū)間中
2某調(diào)研小組的研究觀察數(shù)據(jù)表明,某一鄉(xiāng)鎮(zhèn)原來每天夜間微信視頻通話平均通話時間為15分鐘,其標(biāo)準(zhǔn)差為5分鐘現(xiàn)在由此小組跟蹤調(diào)查的100個微信視頻通話時間組成的簡單隨機樣本,平均通話時間為14分鐘如何在百分之五的顯著性水平條件下,利用已有的樣本信息,判斷每晚微信視頻通話時間是否發(fā)生變化呢?
根據(jù)已知調(diào)查數(shù)據(jù)可以判定,這是一個雙邊假設(shè)檢驗問題
提出假設(shè)::=15,:≠15
拒絕域?qū)?yīng)的是臨界值的外側(cè),不拒絕域?qū)?yīng)的是臨界值的內(nèi)側(cè)
例1和例2表明,如果總體參數(shù)未落入置信區(qū)間中,在進行假設(shè)檢驗時,檢驗統(tǒng)計量的值會落在拒絕域內(nèi),從而拒絕原假設(shè)無論進行區(qū)間估計還是參數(shù)假設(shè)檢驗,出現(xiàn)以上問題時,只需對號入座解決即可