李翰芳 羅幼喜
摘 要: 本文從信息加工的角度分析了貝葉斯公式的核心思想,闡述了公式如何將“歷史信息”和“當(dāng)前信息”相結(jié)合,并可以連續(xù)進(jìn)行“信息”加工的動(dòng)態(tài)過(guò)程.文章利用兩個(gè)實(shí)例進(jìn)行了詳細(xì)分析,不僅讓學(xué)生深刻理解了公式的內(nèi)涵,而且讓學(xué)生靈活掌握了公式的外延.
關(guān)鍵詞: 貝葉斯公式 歷史信息 當(dāng)前信息 信息加工器
1.引言
貝葉斯公式是英國(guó)數(shù)學(xué)家托馬斯·貝葉斯(ThomasBayes)在1763年最早發(fā)表的,但當(dāng)時(shí)其結(jié)果沒(méi)有受到應(yīng)有重視,后來(lái)法國(guó)數(shù)學(xué)家拉普拉斯在貝葉斯基礎(chǔ)上進(jìn)一步總結(jié),人們才逐漸認(rèn)識(shí)到這個(gè)公式的重要性.雖然這個(gè)公式形式上只不過(guò)是條件概率與乘法公式及全概率公式的推論,但理論本身蘊(yùn)含了深刻的思想,而且有重要的現(xiàn)實(shí)應(yīng)用.由該公式思想發(fā)展起來(lái)的“貝葉斯學(xué)派”在統(tǒng)計(jì)學(xué)歷史發(fā)展過(guò)程中占據(jù)著不可或缺的地位.
在傳統(tǒng)的教學(xué)過(guò)程中,大多是將該公式看做是一種計(jì)算概率的方法,沒(méi)有深層次地挖掘該公式所蘊(yùn)含的思想,故學(xué)生理解起來(lái)比較困難,因而不能夠靈活掌握并應(yīng)用.本文繞過(guò)貝葉斯公式繁雜的數(shù)學(xué)表達(dá)式,另辟蹊徑,從“信息加工”的角度理解貝葉斯,讓學(xué)生更直觀而深刻地理解此公式背后隱含的思想和功能.
2.貝葉斯公式
這個(gè)公式也稱為逆概率公式.
其中P(A)稱為先驗(yàn)概率,可以看成是人們對(duì)事件A發(fā)生概率的初步判斷或歷史經(jīng)驗(yàn)信息,P(A|B)稱為后驗(yàn)概率,是指在當(dāng)前某個(gè)事件B發(fā)生后,即有了“當(dāng)前信息”后對(duì)A發(fā)生概率的重新評(píng)估.從上式可以看到,P(A|B)是綜合了“歷史信息”和“當(dāng)前信息”之后得到的結(jié)果.貝葉斯方法的推斷正是基于后驗(yàn)概率進(jìn)行的,從而使該方法能夠有效地將歷史經(jīng)驗(yàn)和當(dāng)前數(shù)據(jù)相結(jié)合,做出更科學(xué)全面的決策.更難能可貴的是,該公式具有連續(xù)“信息”加工的能力,即我們可以進(jìn)一步將P(A|B)作為先驗(yàn),等到有另一個(gè)事件B′發(fā)生后對(duì)可以發(fā)生概率再做重新評(píng)估,從而一步一步地積累信息,不斷加深對(duì)事件的認(rèn)識(shí).下面,我們就從幾個(gè)生活中的實(shí)際例子闡述貝葉斯公式是如何對(duì)“歷史信息”和“當(dāng)前信息”進(jìn)行逐步加工的.
3.案例分析
例1:設(shè)某銀行根據(jù)客戶的還款情況及時(shí)調(diào)整對(duì)客戶的信用評(píng)價(jià)(信用良好的可信度).以往統(tǒng)計(jì)資料表明,信用良好的客戶按期還款率為95%,信用不足的客戶按照還款率為50%,某同學(xué)向銀行辦了張信用卡,辦卡時(shí)的信用評(píng)價(jià)為0.9,問(wèn)為什么該學(xué)生連續(xù)幾次刷卡不還款后,最后終身都不享受向銀行貸款的資格.
解:設(shè)事件A={信用良好},事件B={按期還款},根據(jù)題意分別有:
下面分別討論2次刷卡沒(méi)有按期還款的情況下,銀行對(duì)該學(xué)生的信用評(píng)價(jià).
第一次:
下面以0.47為銀行對(duì)學(xué)生的信用評(píng)價(jià),此學(xué)生第二次刷卡未按期還款,求銀行對(duì)此學(xué)生的信用評(píng)價(jià).
在上述例子中,辦卡時(shí)的信用評(píng)價(jià)為0.9,這個(gè)可以看做是銀行根據(jù)資料得到的客戶“歷史信息”.當(dāng)學(xué)生有一次刷卡沒(méi)有按期還款這個(gè)事件發(fā)生后,銀行就會(huì)根據(jù)“當(dāng)前信息”對(duì)學(xué)生信用作重新評(píng)價(jià),即上述第一次有貝葉斯公式得到的后驗(yàn)概率0.47.于是銀行將0.47作為學(xué)生的信用評(píng)價(jià)先驗(yàn)概率,等到如果有再次有刷卡未按期付款事件發(fā)生后,則可利用貝葉斯公式再次對(duì)學(xué)生信用進(jìn)行評(píng)價(jià),即第二次得到后驗(yàn)概率0.081.整個(gè)過(guò)程很好地體現(xiàn)了貝葉斯公式根據(jù)歷史和當(dāng)前資料,一步一步連續(xù)加工信息的能力.
從上面計(jì)算的結(jié)果我們也不難看出,第二次未還款后,銀行對(duì)該學(xué)生的信用評(píng)價(jià)非常小,幾乎為0,再經(jīng)過(guò)連續(xù)幾次故意不還款銀行會(huì)將此學(xué)生打入黑名單,在以后將不能申請(qǐng)銀行貸款.
例2:設(shè)根據(jù)往年調(diào)查資料表面,某地區(qū)患某種疾病的概率約為千分之一,假設(shè)患者對(duì)該種疾病化驗(yàn)反應(yīng)是陽(yáng)性的概率為0.95.正常人對(duì)該種疾病化驗(yàn)反應(yīng)是陽(yáng)性的概率為0.04,現(xiàn)抽查了一個(gè)人,其化驗(yàn)反應(yīng)呈陽(yáng)性,問(wèn)此人確患該疾病的概率有多大?如果要對(duì)此人是否患該疾病進(jìn)行確診,還是否需要做再次化驗(yàn)檢查?
此問(wèn)題中,如果不做化驗(yàn),抽查一人,那么他是患者該種疾病的概率P(A)=0.001,這個(gè)可以看成是先驗(yàn)信息,即根據(jù)歷史調(diào)查資料所獲得的信息.當(dāng)某次體檢化驗(yàn)呈陽(yáng)性反應(yīng)這個(gè)事件發(fā)生后,我們需要將“歷史調(diào)查信息”與“當(dāng)前化驗(yàn)信息”相結(jié)合,對(duì)此人患病概率進(jìn)行重新估計(jì),利用貝葉斯這個(gè)信息加工器,我們很容易計(jì)算出此人患該病的概率為P(A|B)≈0.023,從0.001增加到0.023,化驗(yàn)結(jié)果表明該人患病風(fēng)險(xiǎn)增加將近23倍,說(shuō)明當(dāng)前的化驗(yàn)對(duì)于診斷一個(gè)人是否患有該疾病非常有意義.
但從另一方面來(lái)看,此人患此疾病的概率也僅為P(A|B)≈0.023,這說(shuō)明即使化驗(yàn)呈陽(yáng)性,確實(shí)患此種疾病的可能性也只有2.3%.所以通常在這種情況下,醫(yī)生也不會(huì)立即給病人下結(jié)論,而是建議重新做化驗(yàn),下面我們來(lái)看如果此人接著做第二次化驗(yàn)后仍呈陽(yáng)性的話,他確患此病的概率.則此時(shí)我們可將P(A|B)≈0.023來(lái)代替原來(lái)的P(A)=0.001作為患該疾病的先驗(yàn)概率,于是在第二次檢測(cè)還呈陽(yáng)性的情況下該人確實(shí)患此疾病的概率:
這進(jìn)一步提高了檢測(cè)的準(zhǔn)確性,如果覺(jué)得還不精確,則可再化驗(yàn)一次,在進(jìn)行第三次化驗(yàn)還是陽(yáng)性的情況下該人確實(shí)患此疾病的概率:
這時(shí)醫(yī)生就已經(jīng)有很大的把握判定此人患有該疾病了,從上面的例子可以看到,醫(yī)學(xué)上對(duì)于病人患病的確診,就是借用貝葉斯公式這個(gè)“連續(xù)信息加工器”,將病人當(dāng)前化驗(yàn)檢查結(jié)果同歷史資料信息相結(jié)合,一步一步對(duì)病人患病概率進(jìn)行重新估計(jì),逐步確診.
4.結(jié)語(yǔ)
本文主要從信息加工的角度看待貝葉斯公式,分析了公式中先驗(yàn)概率即可看成是“歷史信息”,當(dāng)某個(gè)事件發(fā)生后,公式就將“歷史信息”與“當(dāng)前信息”相結(jié)合,對(duì)事件發(fā)生概率進(jìn)行重新估計(jì),得到后驗(yàn)概率,再通過(guò)后驗(yàn)概率做進(jìn)一步的統(tǒng)計(jì)推斷.并且,還分析了貝葉斯公式連續(xù)動(dòng)態(tài)處理信息的能力,即將上一次得到的后驗(yàn)概率作為下一次的先驗(yàn)概率,結(jié)合下一次事件的發(fā)生對(duì)問(wèn)題進(jìn)行重新評(píng)估以做出更準(zhǔn)確的決策.這樣逐步積累“歷史信息”,逐漸加深了解事物發(fā)生概率的過(guò)程符合人們的思維習(xí)慣.這樣的解析可以讓學(xué)生更容易、更清晰地理解和掌握貝葉斯公式.本文利用日常生活中常見(jiàn)的實(shí)例進(jìn)行分析,將知識(shí)性與趣味性相結(jié)合,既讓學(xué)生學(xué)到理論知識(shí),又讓學(xué)生學(xué)會(huì)理論知識(shí)在現(xiàn)實(shí)生活中的應(yīng)用,加深對(duì)貝葉斯公式的理解和靈活運(yùn)用.
參考文獻(xiàn):
[1]李子強(qiáng).概率論與數(shù)理統(tǒng)計(jì)教程(第三版)[M].2011.
[2]費(fèi)錫仙.概率論與數(shù)理統(tǒng)計(jì)習(xí)題集[M].國(guó)防科技大學(xué)出版社,2011.
[3]燕建梁.用貝葉斯公式解釋化驗(yàn)結(jié)果[J].大學(xué)數(shù)學(xué),2012,VOL28(3):111-113.