唐志祥
摘要:學(xué)習(xí)假設(shè)檢驗(yàn)的第一步是建立原假設(shè)和備擇假設(shè),初學(xué)者對(duì)原假設(shè)和備擇假設(shè)如何建立理解不透。首先通過(guò)單側(cè)檢驗(yàn)的一個(gè)實(shí)例,采用建立不同的原假設(shè)和備擇假設(shè)會(huì)導(dǎo)致矛盾的結(jié)論;其次,分析了產(chǎn)生矛盾的原因;最后,給出了建立原假設(shè)和備擇假設(shè)的幾個(gè)原則。
關(guān)鍵詞:假設(shè)檢驗(yàn) 原假設(shè) 備擇假設(shè) 第一類(lèi)錯(cuò)誤
假設(shè)檢驗(yàn)包括參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)兩種情形,是統(tǒng)計(jì)學(xué)中的核心內(nèi)容之一。在學(xué)習(xí)假設(shè)檢驗(yàn)的這部分內(nèi)容時(shí),第一步根據(jù)資料對(duì)總體的參數(shù)或分布建立假設(shè),然后我們假定在原假設(shè)是正確的條件下,利用抽樣數(shù)據(jù)計(jì)算統(tǒng)計(jì)量對(duì)應(yīng)的數(shù)值以及計(jì)算更不利于原假設(shè)的概率,由此判斷是否拒絕原假設(shè)[1]。但對(duì)于假設(shè)如何建立的問(wèn)題,特別是對(duì)單側(cè)檢驗(yàn)的假設(shè)如何建立,目前仍然沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),但不同的建立方式有時(shí)會(huì)得到相互矛盾的結(jié)論[2]。這導(dǎo)致不少學(xué)習(xí)這門(mén)課程的大學(xué)生對(duì)此十分困惑,不知道究竟怎么建立假設(shè)檢驗(yàn)的假設(shè),影響了學(xué)生對(duì)這部分內(nèi)容的掌握。為此,結(jié)合教學(xué)中出現(xiàn)的問(wèn)題,探討如何建立假設(shè)的問(wèn)題非常有必要。
一、原假設(shè)建立不同導(dǎo)致的問(wèn)題
學(xué)習(xí)假設(shè)檢驗(yàn)這部分內(nèi)容時(shí),首先就是要依據(jù)問(wèn)題建立需要檢驗(yàn)的假設(shè),其次就是根據(jù)抽樣調(diào)查獲得的數(shù)據(jù)來(lái)檢驗(yàn)上述假設(shè)是否成立。實(shí)際教學(xué)中,我們發(fā)現(xiàn)對(duì)于同一組抽樣數(shù)據(jù),如果原假設(shè)和備擇假設(shè)設(shè)定不同,往往會(huì)得到不同的結(jié)果,甚至得到的結(jié)論相互矛盾,初學(xué)這部分內(nèi)容的經(jīng)管專(zhuān)業(yè)學(xué)生往往感覺(jué)到無(wú)所適從,不知道其中的原因是什么。具體我們以下面的例子進(jìn)行說(shuō)明。
例 某經(jīng)銷(xiāo)商準(zhǔn)備從廠家采購(gòu)一批蓄電池,合同規(guī)定該蓄電池的充電次數(shù)不能低于1000次。已知蓄電池的充電次數(shù)服從。從這批產(chǎn)品中隨機(jī)抽取64個(gè)蓄電池進(jìn)行檢測(cè),測(cè)得平均充電次數(shù)=990次,請(qǐng)問(wèn),經(jīng)銷(xiāo)商是否購(gòu)進(jìn)這批蓄電池()?
分析:這是一個(gè)單側(cè)假設(shè)檢驗(yàn)的問(wèn)題,我們可以采用不同的方法建立原假設(shè),檢驗(yàn)的統(tǒng)計(jì)量為。
方法一:設(shè),取顯著性水平,則臨界值。
檢驗(yàn)的統(tǒng)計(jì)量:。因?yàn)椋栽陲@著性水平為5%下,不拒絕原假設(shè),即樣本提供的證據(jù)還不能推翻原假設(shè),即該廠生產(chǎn)的蓄電池達(dá)到了規(guī)定的充電次數(shù)。
方法二:設(shè)。檢驗(yàn)的統(tǒng)計(jì)量為:。因?yàn)?,也不拒絕原假設(shè),該廠生產(chǎn)的蓄電池沒(méi)有到達(dá)合同規(guī)定的充電次數(shù)。
從上面例題看出,在進(jìn)行假設(shè)檢驗(yàn)時(shí),運(yùn)用同一組抽樣樣本,由于原假設(shè)的設(shè)定不同,導(dǎo)致了相互矛盾的結(jié)果。由于我們教授的學(xué)生來(lái)自不同的省份,在高中的學(xué)習(xí)時(shí)的數(shù)學(xué)基礎(chǔ)參差不齊,導(dǎo)致對(duì)這種看似矛盾的結(jié)論十分費(fèi)解。那么,出現(xiàn)相互矛盾結(jié)論的原因是什么?這主要涉及到兩個(gè)問(wèn)題,一是這兩種檢驗(yàn)方法是否都正確?二對(duì)同一個(gè)問(wèn)題,我們可以隨意設(shè)定原假設(shè)和備擇假設(shè)進(jìn)行檢驗(yàn)嗎?下面將對(duì)這兩個(gè)問(wèn)題進(jìn)一步進(jìn)行分析。
二、問(wèn)題的原因分析
上面的兩種檢驗(yàn)方法,單純從統(tǒng)計(jì)推斷的角度來(lái)說(shuō),兩種檢驗(yàn)方法都是沒(méi)有問(wèn)題的,區(qū)別在于方法一運(yùn)用的是左側(cè)檢驗(yàn),方法二運(yùn)用的是右側(cè)檢驗(yàn)。右側(cè)檢驗(yàn)的拒絕域,即時(shí)就拒絕原假設(shè),接受絕備擇假設(shè);相反,時(shí)就接受原假設(shè)。左側(cè)檢驗(yàn)的拒絕域,即時(shí)就拒絕原假設(shè),接受絕備擇假設(shè);相反,就接受原假設(shè)。通過(guò)上面左側(cè)檢驗(yàn)和右側(cè)檢驗(yàn)接受原假設(shè)的區(qū)域可以看出,左側(cè)檢驗(yàn)和右側(cè)檢驗(yàn)有個(gè)共同的接受原假設(shè)的區(qū)域,只要樣本觀測(cè)值落入該區(qū)域內(nèi),就都不拒絕原假設(shè)。由于上述問(wèn)題中,共同的接受域?yàn)?,而樣本觀測(cè)值恰好位于該區(qū)域內(nèi),因而在左側(cè)、右側(cè)檢驗(yàn)中都得出不拒絕原假設(shè)的結(jié)論,由于這個(gè)問(wèn)題中原假設(shè)相反,因此,得出了相互矛盾的結(jié)論。如果樣本觀測(cè)值落在共同的接受域之外的區(qū)域,兩種檢驗(yàn)方法是一致的。
在現(xiàn)有的部分《應(yīng)用統(tǒng)計(jì)學(xué)》教材中,涉及原假設(shè)和備擇假設(shè)如何建立的闡述比較模糊,導(dǎo)致學(xué)生誤以為假設(shè)的設(shè)置具有主觀性。例如,袁衛(wèi)等主編的《統(tǒng)計(jì)學(xué)》(第四版)中認(rèn)為,將“通常是研究者想收集證據(jù)予以反對(duì)的假設(shè)”設(shè)置為原假設(shè);將“通常是研究者想收集證據(jù)予以支持的假設(shè)” [3]設(shè)置為備擇假設(shè)。郝海等主編的《統(tǒng)計(jì)學(xué)》認(rèn)為,“在面對(duì)某一實(shí)際問(wèn)題時(shí),由于不同的研究者有不同的目的,即使對(duì)同一問(wèn)題也可能提出不同的假設(shè),無(wú)論怎樣確定假設(shè)的形式,只要它們符合研究者的最終目的便是合理的” [4]。當(dāng)然,這些關(guān)于原假設(shè)和備擇假設(shè)的闡述是正確的。
三、原假設(shè)和備擇假設(shè)建立的幾個(gè)原則
盡管研究者可以對(duì)同一個(gè)問(wèn)題,設(shè)置不同的原假設(shè),但不能因此認(rèn)為原假設(shè)的設(shè)置具有完全主觀性,事實(shí)上,原假設(shè)和備擇假設(shè)不是對(duì)等的,不能隨意調(diào)換[5]。假設(shè)檢驗(yàn)的目的是對(duì)備擇假設(shè)進(jìn)行檢驗(yàn)[6]。一般情況下,我們有1-α的概率拒絕原假設(shè)而接受備擇假設(shè),或者說(shuō)此時(shí)犯第一類(lèi)錯(cuò)誤的概率為α;當(dāng)我們不拒絕原假設(shè)時(shí),只能說(shuō)是根據(jù)樣本的數(shù)據(jù)還不足以推翻原假設(shè)。對(duì)如何建立原假設(shè),我們認(rèn)為可以遵循以下的一些原則。
(一)一般地,輕易不能否定的結(jié)論作為原假設(shè)
我們通常把成立可能性較大、只有獲得了足夠的證據(jù)支持才能推翻的結(jié)論作為原假設(shè)。例如,當(dāng)檢驗(yàn)新治療方法是否比原治療方法有效時(shí),我們一般是不能輕易否定原治療方法的有效性,因?yàn)榻?jīng)過(guò)長(zhǎng)期的臨床使用,原治療方法已經(jīng)被證明是有效的,只有充足的證據(jù)才能否定其有效性,因此,應(yīng)該把“原治療方法比新治療方法有效”作為原假設(shè)。
(二)拒絕時(shí)犯第一類(lèi)錯(cuò)誤后果更嚴(yán)重的結(jié)論作為原假設(shè)滿(mǎn)足
進(jìn)行假設(shè)檢驗(yàn)時(shí),無(wú)論是否拒絕原假設(shè),我們都會(huì)犯錯(cuò)誤。原假設(shè)是正確的,我們拒絕了是犯了第一類(lèi)錯(cuò)誤;原假設(shè)不正確,我們沒(méi)有拒絕則犯了第二類(lèi)錯(cuò)誤。例如:對(duì)于病人去看病,我們可以做出兩個(gè)對(duì)立假設(shè)“有病”和“無(wú)病”。那么我們?nèi)绾芜x擇原假設(shè)?很顯然,把有病當(dāng)作無(wú)病會(huì)耽誤治療的良機(jī),造成嚴(yán)重后果;反之,把無(wú)病當(dāng)作有病雖然給患者帶來(lái)精神負(fù)擔(dān),浪費(fèi)不必要的費(fèi)用,相比于前一種情況,后果相對(duì)不太嚴(yán)重。因此,我們應(yīng)該把設(shè)置為有病,這樣我們就控制了把有病當(dāng)作無(wú)病的概率,即,所以,:有病;:無(wú)病。通過(guò)此例說(shuō)明,設(shè)置在某些情況下是實(shí)際意義的。
(三)一般把有利于檢查者的結(jié)論作為原假設(shè)
假設(shè)檢驗(yàn)是服務(wù)于實(shí)踐活動(dòng)的,在實(shí)踐活動(dòng)中就不可避免的帶有主觀色彩。例如,產(chǎn)品質(zhì)量檢驗(yàn)問(wèn)題,消費(fèi)者和出廠抽檢產(chǎn)品質(zhì)量而建立原假設(shè)一般來(lái)說(shuō)不同。我們用X表示鋼索的承受力,u表示期望承受力,滿(mǎn)足條件時(shí),我們認(rèn)為是合格品。采購(gòu)商把作為原假設(shè),則拒絕原假設(shè)是將不合格的鋼索當(dāng)作合格產(chǎn)品,這類(lèi)錯(cuò)誤的概率可以控制,這將有利于采購(gòu)商;生產(chǎn)廠商把原假設(shè),則第一類(lèi)錯(cuò)誤是將合格鋼索當(dāng)作不合格鋼索,控制這類(lèi)錯(cuò)誤將對(duì)生產(chǎn)企業(yè)有利。
(四)一般把收集證據(jù)希望拒絕結(jié)論設(shè)置為原假設(shè)
不拒絕原假設(shè)一般無(wú)明確的結(jié)論,而拒絕原假設(shè)理由是比較充分的,因而在實(shí)際檢驗(yàn)時(shí),研究人員將希望拒絕的結(jié)論設(shè)為零假設(shè),希望肯定的命題設(shè)為備擇假設(shè)。例如,進(jìn)行某種纖維的生產(chǎn),該纖維的平均強(qiáng)度不超過(guò),現(xiàn)改進(jìn)生產(chǎn)工藝,希望通過(guò)改進(jìn)工藝來(lái)提高其平均強(qiáng)度,檢驗(yàn)新工藝是否提高產(chǎn)品的強(qiáng)度,則原假設(shè)設(shè)為,以便有足夠的理由來(lái)說(shuō)明新方法比原方法好。
(五)一般把已有的認(rèn)知、歷史狀態(tài)建立為原假設(shè)
假設(shè)檢驗(yàn)可以用來(lái)檢驗(yàn)先前的狀態(tài)是否發(fā)生了變化以及對(duì)變化的方向進(jìn)行定性判斷,一般把原來(lái)的狀態(tài)設(shè)置為原假設(shè),體現(xiàn)了“原”的含義,既容易理解也好記憶。例如,抽檢一批新能源汽車(chē)蓄電池的續(xù)航里程,國(guó)家規(guī)定標(biāo)準(zhǔn)是超過(guò)2000公里,假設(shè)續(xù)航里程服從正態(tài)分布,x表示續(xù)航里程,其中,均未知。那么如何設(shè)立原假設(shè)呢?我們可以根據(jù)該廠生產(chǎn)蓄電池的歷史情況進(jìn)行設(shè)置,如果該廠的產(chǎn)品質(zhì)量一直優(yōu)良,符合國(guó)家標(biāo)準(zhǔn),我們應(yīng)該把原假設(shè)設(shè)置為;反之,如果該廠產(chǎn)品質(zhì)量歷史表現(xiàn)比較差,我們應(yīng)該把原假設(shè)設(shè)置為。這兩種設(shè)置,反映了研究者對(duì)產(chǎn)品質(zhì)量的不同態(tài)度,第一種設(shè)置反映了研究者一開(kāi)始就對(duì)該產(chǎn)品比較信任,沒(méi)有充分的證據(jù)是不能輕易否定的;第二種設(shè)置反映了研究者一開(kāi)始就對(duì)該產(chǎn)品缺乏信任,沒(méi)有充分的證據(jù)也是不能輕易拒絕的。
參考文獻(xiàn):
[1]孫紅衛(wèi),董兆舉,趙擁軍.對(duì)統(tǒng)計(jì)假設(shè)檢驗(yàn)的誤解與誤用[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2012,29(1):147-148.
[2]李奇明,徐德義.參數(shù)估計(jì)與假設(shè)檢驗(yàn):原理、方法與誤區(qū)[J].大學(xué)教育,2018,(2):40-42.
[3]袁衛(wèi),龐皓,賈俊平,楊燦.統(tǒng)計(jì)學(xué)(第四版)[M].北京:高等教育出版社,2014.
[4]郝海,崔曉迪.統(tǒng)計(jì)學(xué)[M].北京:清華大學(xué)出版社,2015.
[5]張玉環(huán).淺談假設(shè)檢驗(yàn)中原假設(shè)和備擇假設(shè)的建立[J].大學(xué)數(shù)學(xué),2012,28(2):117-120.
[6]楊桂元,劉德志.參數(shù)假設(shè)檢驗(yàn)中的若干基本問(wèn)題研究[J].統(tǒng)計(jì)與決策,2012,372(24):13-15.
基金項(xiàng)目:2018年度安徽省高等學(xué)校省級(jí)質(zhì)量工程項(xiàng)目“《國(guó)標(biāo)》框架下地方應(yīng)用型大學(xué)管理類(lèi)專(zhuān)業(yè)實(shí)踐教學(xué)質(zhì)量標(biāo)準(zhǔn)研究”;項(xiàng)目編號(hào):2018jyxm0221。
作者單位:安徽師范大學(xué)經(jīng)濟(jì)管理學(xué)院