劉倩
(西安電子科技大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,陜西 西安 710071)
由古典概型引入貝葉斯公式的一種教學(xué)設(shè)計(jì)
劉倩
(西安電子科技大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,陜西 西安 710071)
對(duì)貝葉斯公式的教學(xué)方案進(jìn)行了設(shè)計(jì),通過(guò)引入簡(jiǎn)單實(shí)例,嘗試應(yīng)用學(xué)生熟悉的古典概型的計(jì)算公式導(dǎo)出貝葉斯定理.結(jié)合案例直觀解釋貝葉斯公式中所包含的先驗(yàn)信息和后驗(yàn)信息等概念,使學(xué)生更容易理解和掌握貝葉斯公式,并逐步理解貝葉斯公式在貝葉斯統(tǒng)計(jì)中的重要地位.
貝葉斯公式;古典概型;教學(xué)設(shè)計(jì)
貝葉斯公式作為概率論課程中的重要公式之一,不僅證明過(guò)程涉及條件概率和全概率公式,公式復(fù)雜,難于記憶,更因?yàn)槠湓诂F(xiàn)實(shí)生活中的應(yīng)用廣泛,而成為概率論課程教學(xué)中的一個(gè)重點(diǎn)和難點(diǎn)問(wèn)題.由于學(xué)生在高中階段利用排列組合計(jì)算的概率問(wèn)題都屬于古典概型的范疇,所以對(duì)古典概型的概率計(jì)算公式較為熟悉.本文就貝葉斯公式的教學(xué)設(shè)計(jì)給出新的嘗試,試圖通過(guò)引入簡(jiǎn)單實(shí)例,綜合應(yīng)用古典概型的計(jì)算公式,讓學(xué)生形成對(duì)新公式應(yīng)用的直觀性理解,在教學(xué)中取得了良好的效果.
先看一個(gè)鑒別次品來(lái)源的問(wèn)題:假設(shè)2個(gè)車間(分別稱為第1車間和第2車間)生產(chǎn)同一種產(chǎn)品,其產(chǎn)量分別占總產(chǎn)量的60%和40%,次品率分別為0.01和0.02.如果任取一件產(chǎn)品,該產(chǎn)品恰好為次品,問(wèn)這件產(chǎn)品較有可能是由哪個(gè)車間生產(chǎn)的.
設(shè)隨機(jī)事件A表示“任取一件產(chǎn)品,該產(chǎn)品恰好為次品”,已知2個(gè)車間的產(chǎn)量及其次品率這些信息,學(xué)生容易計(jì)算事件A發(fā)生的概率,這可以看作一個(gè)正向概率的計(jì)算問(wèn)題.然而,一個(gè)自然而然的反問(wèn)題就是:當(dāng)你買了該廠的一件產(chǎn)品,經(jīng)檢驗(yàn)為次品,但是由哪個(gè)車間生產(chǎn)的標(biāo)識(shí)已經(jīng)脫落,讓你判斷該產(chǎn)品的歸屬問(wèn)題.這個(gè)反問(wèn)題,可以形象地理解為逆概率的計(jì)算問(wèn)題.
即使學(xué)生不知道條件概率的計(jì)算公式,利用古典概型的概率計(jì)算公式,從頻率估計(jì)概率的思想出發(fā),也可以對(duì)這個(gè)問(wèn)題進(jìn)行判斷.
表示在任取一件產(chǎn)品為次品的附加條件下,該產(chǎn)品是由第i車間生產(chǎn)的概率.
在計(jì)算過(guò)程中,事實(shí)上建立了一個(gè)極為有用的公式
其中:事件A和互斥事件B1,B2可以指代一切事物,而該公式的實(shí)質(zhì)就是條件概率公式.
1763年,貝葉斯生前的朋友普賴斯將他的遺著《機(jī)遇理論中一個(gè)問(wèn)題的解》[1]推薦給皇家學(xué)會(huì)并發(fā)表在當(dāng)年的《哲學(xué)會(huì)報(bào)》上,后來(lái)的數(shù)學(xué)家將之簡(jiǎn)化為今天的貝葉斯公式.
稱式(4)為貝葉斯公式.
現(xiàn)在已知有一個(gè)結(jié)果A發(fā)生了,在眾多可能的原因中,到底是哪一個(gè)原因最有可能導(dǎo)致A的發(fā)生.這是一個(gè)在日常生活和科學(xué)技術(shù)中常遇到的問(wèn)題.因此,貝葉斯公式可以形象地理解為一個(gè)由結(jié)果到原因的過(guò)程,不妨稱為執(zhí)果尋因.貝葉斯公式認(rèn)為各個(gè)原因可能性大小與條件概率成比例.
從形式推導(dǎo)上看,貝葉斯公式平淡無(wú)奇,不過(guò)是條件概率與全概率公式的簡(jiǎn)單推論,那么看似平凡的貝葉斯公式,背后隱含著何種原理,有何實(shí)際意義呢.
這種情況在日常生活中是屢見(jiàn)不鮮的.伊索寓言中“狼來(lái)了”的故事大家都耳熟能詳,那個(gè)說(shuō)謊的孩子是怎樣一步步喪失村民的信任的呢,借助于貝葉斯公式可以給出故事的概率論解釋.誠(chéng)信之所以重要,就在于人們會(huì)根據(jù)與你交往過(guò)程中發(fā)生的事件去修正對(duì)你的印象,用概率代替,而且這種修正會(huì)一次一次地進(jìn)行,量化的工具就是貝葉斯公式.貝葉斯公式正是從數(shù)量上刻畫(huà)了這種變化,因此,它是從先驗(yàn)概率到后驗(yàn)概率的轉(zhuǎn)化公式.
(3)貝葉斯公式又稱為逆概率公式.
由于日常生活所觀察到的只是事物表面的現(xiàn)象A,這時(shí)必須提供一種猜測(cè),很可能有許多種乃至無(wú)數(shù)種猜測(cè)Bi都滿足目前的觀測(cè).那么需要計(jì)算并比較各種猜測(cè)可能性大小.對(duì)于不同的Bi,P( A)都是一樣的,所以在比較后驗(yàn)概率時(shí),完全可以忽略這個(gè)常數(shù),尤其當(dāng)P( A)難以求解時(shí).根據(jù)貝葉斯公式,只需要知道,這在實(shí)際應(yīng)用中是易于獲得的.在A給定的條件下,與成正比,這就是逆概率的思想.可見(jiàn),貝葉斯公式的結(jié)果在很大程度上依賴于先驗(yàn)概率,但不是完全接受或者拒絕先驗(yàn)假設(shè),只是在觀察到更多的信息A后,增大或者減小了這種假設(shè)的可能性.
基于這種思想,貝葉斯公式有很多有趣的應(yīng)用.如拼寫(xiě)糾錯(cuò),學(xué)生都有這樣的體會(huì),當(dāng)在Word文檔中輸入一個(gè)不在字典中的單詞時(shí),電腦會(huì)提供若干種可能的猜測(cè).類似的應(yīng)用還有統(tǒng)計(jì)機(jī)器的翻譯、圖像識(shí)別、參數(shù)的最大后驗(yàn)估計(jì)以及假設(shè)檢驗(yàn)等.可以說(shuō),凡是需要做出概率預(yù)測(cè)的地方都能見(jiàn)到貝葉斯公式的影子.
大多數(shù)概率統(tǒng)計(jì)教材對(duì)貝葉斯公式的探討和應(yīng)用都過(guò)于簡(jiǎn)單[3],所以有很多學(xué)者都對(duì)該公式的應(yīng)用問(wèn)題進(jìn)行了廣泛討論[4-6].
面對(duì)真陽(yáng)性率為95%的檢測(cè)結(jié)果,有多少信心接受“有病”的判斷呢.
由此可見(jiàn),平均1 000名具有陽(yáng)性反應(yīng)的人群中,真正患病的人還是很少的,大約只有107人.
學(xué)生可能會(huì)想,這個(gè)試驗(yàn)對(duì)于診斷一個(gè)人是否患病到底有沒(méi)有意義呢.如果不作試驗(yàn),抽查一個(gè)人,患病的概率為0.005,這是先驗(yàn)概率,俗稱為發(fā)病率.若在試驗(yàn)后,呈現(xiàn)陽(yáng)性反應(yīng),根據(jù)這個(gè)新的信息,患病的概率變?yōu)?.1066,大約增長(zhǎng)了21倍.因此,這個(gè)檢測(cè)試驗(yàn)還是有意義的.只是在實(shí)際應(yīng)用中,缺乏普遍執(zhí)行的理由.
究其原因,從貝葉斯公式可以得到解釋:盡管健康人呈現(xiàn)陽(yáng)性反應(yīng)的概率為0.04,但是由于發(fā)病率僅為0.005,實(shí)在太小,導(dǎo)致檢測(cè)結(jié)果為假陽(yáng)性的部分相對(duì)較大,從而造成值較小.所以通常情況下,醫(yī)生可以先采取其他簡(jiǎn)單易行的輔助手段進(jìn)行檢查,當(dāng)他高度懷疑某個(gè)對(duì)象時(shí),才會(huì)建議進(jìn)行該種檢測(cè),因?yàn)榇藭r(shí)發(fā)病率(先驗(yàn)概率)已經(jīng)顯著地增加了.可以通過(guò)貝葉斯公式(4)進(jìn)行說(shuō)明:當(dāng)先驗(yàn)概率時(shí),后驗(yàn)概率將達(dá)到0.96.此外,醫(yī)生還可以再進(jìn)行一次檢測(cè),一旦呈現(xiàn)陽(yáng)性結(jié)果,那么該對(duì)象患病的概率將上升至0.73;再做一次檢測(cè),還是呈現(xiàn)陽(yáng)性,那么基本上醫(yī)生就可以確診了,此時(shí)患病的概率達(dá)到0.985.
例2(信號(hào)識(shí)別)[8]將A, B, C3個(gè)字母之一輸入信道,輸出為原字母的概率為a,而輸出為其他一字母的概率都是.今將字母串AAAA,BBBB和CCCC之一輸入信道,輸入AAAA,BBBB,CCCC的概率分別為,已知輸出為ABCA,求輸入的是AAAA的概率(假設(shè)信道傳輸各個(gè)字母的工作相互獨(dú)立).
貝葉斯統(tǒng)計(jì)分析是處理信號(hào)識(shí)別問(wèn)題的一種有效手段,該例是一個(gè)比較簡(jiǎn)單的信號(hào)識(shí)別問(wèn)題,運(yùn)用貝葉斯公式就可以得到解答.
貝葉斯公式中滲透的執(zhí)果尋因的思想,是這節(jié)課的精髓.在統(tǒng)計(jì)學(xué)中,正是依靠收集的數(shù)據(jù)(相當(dāng)于事件A)去尋找所感興趣的問(wèn)題的答案,這就是一個(gè)執(zhí)果尋因的過(guò)程,因此貝葉斯公式具有重要的實(shí)用性.依據(jù)這個(gè)公式的思想,統(tǒng)計(jì)學(xué)家發(fā)展了一整套基于后驗(yàn)概率決策的統(tǒng)計(jì)推斷方法,冠以貝葉斯名字的學(xué)派,廣泛地應(yīng)用于社會(huì)生活的各個(gè)方面.
雖然貝葉斯當(dāng)時(shí)的論文僅僅是對(duì)逆概率問(wèn)題的一個(gè)直接的求解嘗試,不清楚他當(dāng)時(shí)是否已經(jīng)意識(shí)到其中包含的深刻思想.然而,后來(lái)貝葉斯方法席卷了概率論,并將其應(yīng)用延伸到各個(gè)問(wèn)題領(lǐng)域.這其中的原因就在于現(xiàn)實(shí)世界本身就是不確定的,而人類的觀察能力又是有局限性的.
在概率統(tǒng)計(jì)的世界中,到處都充滿著和直覺(jué)截然不同的事物,面對(duì)表象,人們應(yīng)該堅(jiān)持實(shí)事求是的態(tài)度和鍥而不舍的精神.
[1] 韋來(lái)生,張偉平.貝葉斯分析[M].合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社,2013:5-6
[2] 李賢平.概率論基礎(chǔ)[M].北京:高等教育出版社,2010:68-69
[3] 楊靜,陳冬.貝葉斯公式的幾個(gè)應(yīng)用[J].大學(xué)數(shù)學(xué),2011,27(2):166-169
[4] 周麗華.市場(chǎng)預(yù)測(cè)中的貝葉斯公式應(yīng)用[J].商業(yè)研究,2006(34):55-56
[5] 王麗.淺析貝葉斯公式及其在概率推理中的應(yīng)用[J].科技創(chuàng)新導(dǎo)報(bào),2010(24):136
[6] 廖杰.貝葉斯公式在河流水質(zhì)綜合評(píng)價(jià)中的應(yīng)用[J].四川師范大學(xué)學(xué)報(bào):自然科學(xué)版,2007,30(4):519-522
[7] 魏宗舒.概率論與數(shù)理統(tǒng)計(jì)教程[M].北京:高等教育出版社,2008:40-42
[8] 盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,2008:22
The design of teaching in Bayes rule introduced by classical probability model
LIU Qian
(School of Mathematics and Statistics,Xidian University,Xi'an 710071,China)
Gives a plan of teaching design in Bayes rule. By introducing a simple example and integrating the classical probability model with which students are familiar,Bayes theorem is obtained. Combining cases,some concepts such as the priori and the posteriori information are intuitively explained,which makes it easier for students to understand and master the Bayesian formula and understand Bayes rule's important position in Bayesian statistics gradually.
Bayes rule;classical probability model;teaching design
O211.9∶G642.0
A
10.3969/j.issn.1007-9831.2016.06.018
1007-9831(2016)06-0056-05
2016-03-20
國(guó)家自然科學(xué)基金資助項(xiàng)目(61105065);西安電子科技大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院概率論與數(shù)理統(tǒng)計(jì)精品開(kāi)放課程建設(shè)項(xiàng)目
劉倩(1979-),女,陜西西安人,副教授,博士,從事生物信息學(xué)和數(shù)理統(tǒng)計(jì)研究.E-mail:liuqian@xidian.edu.cn