朱盛 陳春焦
【摘要】 根據(jù)條件概率與概率兩個概念的比較,指出條件概率也是概率,從而說明概率所具有的性質(zhì)對條件概率也成立.文中總結(jié)了與條件概率相關(guān)的三大重要公式,并給出計算條件概率的方法,最后運(yùn)用相關(guān)性質(zhì)解決現(xiàn)實(shí)生活中的具體問題.
【關(guān)鍵詞】 樣本空間;概率;條件概率
【基金項(xiàng)目】河南省高等學(xué)校精品在線開放課程項(xiàng)目,河南省研究生教育改革與質(zhì)量提升工程項(xiàng)目“研究生教育優(yōu)質(zhì)課程”(No:hnyjs2017kc09),河南理工大學(xué)研究生教育教學(xué)改革基金項(xiàng)目“融入課程思政的應(yīng)用統(tǒng)計教學(xué)改革”(No:2020YJ02).
一、引言
“概率論與數(shù)理統(tǒng)計”是高等院校多個學(xué)科本科專業(yè)的必修課程之一,也是相關(guān)專業(yè)碩士研究生入學(xué)考試的一門必考科目,更是本科學(xué)生運(yùn)用隨機(jī)思維模式解決本專業(yè)相關(guān)問題的實(shí)用課程[1].它在自然科學(xué)、社會科學(xué)、工程技術(shù)、工農(nóng)業(yè)生產(chǎn)領(lǐng)域中得到了越來越廣泛的應(yīng)用.作為一門應(yīng)用數(shù)學(xué)學(xué)科,“概率論與數(shù)理統(tǒng)計”具有高度的抽象性、嚴(yán)密的邏輯性、廣泛的應(yīng)用性,并且具有更獨(dú)特的思維方法[2].條件概率是“概率論與數(shù)理統(tǒng)計”課程中的一個重要概念.本文給出條件概率與概率兩個概念的定義,并對其作出比較,指出條件概率也是概率,從而進(jìn)一步說明概率所具有的性質(zhì)對條件概率也成立,最后運(yùn)用該性質(zhì)解決實(shí)際問題.
二、條件概率與概率的定義與比較
定義1設(shè)E是隨機(jī)實(shí)驗(yàn),S是它的樣本空間.對于E中每一個事件A賦予一個實(shí)數(shù),記為P(A),稱為A的概率,如果集合函數(shù)P(·)滿足下列條件[3]:
(1)非負(fù)性:對于每個事件A,有P(A)≥0;
(2)規(guī)范性:對于必然事件S,有P(S)=1;
(3)可列可加性:設(shè)A1,A2,…是兩兩互不相容的事件,則
P(∪∞i=1Ai)=∑∞i=1P(Ai).
定義2設(shè)A,B是兩個事件,且P(A)>0,則稱P(B|A)=P(BA)[]P(A)為在事件A發(fā)生的條件下事件B發(fā)生的概率[3].
定理1條件概率也是概率[3].
證明設(shè)E是隨機(jī)實(shí)驗(yàn),S是它的樣本空間.條件概率P(·|A)是集合函數(shù),對于E中每一個事件B,都有實(shí)數(shù)P(B|A)與之對應(yīng).
(1)非負(fù)性:對于每個事件B,顯然有P(B|A)≥0;
(2)規(guī)范性:對于必然事件S,有P(S|A)=P(SA)[]P(A)=1;
(3)可列可加性:設(shè)A1,A2,…是兩兩互不相容的事件,則
P(∪∞i=1Ai|A)=P{(∪∞i=1Ai)A}P(A)=P{∪∞i=1(Ai∩A)}P(A).
由于Ai∩A,i=1,2,…兩兩互不相容,故
P(∪∞i=1Ai|A)=∑∞i=1P(AiA)P(A)=∑∞i=1P(AiA)P(A)
=∑∞i=1P(Ai|A).
綜上可知,條件概率P(·|A)滿足概率定義的條件,因此條件概率也是概率.
三、條件概率的性質(zhì)
由定理1可知,條件概率也是概率,因此概率具有的性質(zhì),條件概率也具有.這與“白馬是馬”一樣,白馬一定具有馬所具有的生活習(xí)性和生理特征.我們知道概率有很多性質(zhì),比如:有限可加性、加法公式、減法公式等.根據(jù)定理1可知,條件概率也應(yīng)該具有概率的相應(yīng)性質(zhì).在我們的教材中已經(jīng)給出條件概率的有限可加性、加法公式和減法公式了.下面我們通過幾個定理來進(jìn)一步說明如何將概率的性質(zhì)類推到條件概率上.
定理2[4]設(shè)A1,A2,…,An是樣本空間S中的一組事件,則
P(∪ni=1Ai)≤∑1≤i1≤nP(Ai1)-∑2≤i1≤nP(A1Ai1).
定理3[4]設(shè)A1,A2,…,An是樣本空間S中的一組事件,則
∑1≤i1≤nP(Ai1)-∑1≤i1 ≤P(∪ni=1Ai). 定理2與定理3的證明見文獻(xiàn)[4]. 上面兩個定理可以認(rèn)為是概率的兩個性質(zhì),由于條件概率也是概率,故條件概率也有類似的性質(zhì). 定理4設(shè)A1,A2,…,An是樣本空間S中的一組事件,則對于樣本空間S中的任一事件A,若P(A)>0,則 P(∪ni=1Ai|A)≤∑1≤i1≤nP(Ai1|A)-∑2≤i1≤nP(A1Ai1|A). 證明取Bi=AiA,根據(jù)定理2可得 P(∪ni=1AiA)≤∑1≤i1≤nP(Ai1A)-∑2≤i1≤nP(A1Ai1A), 于是, P(∪ni=1Ai|A)=P(∪ni=1AiA)P(A) ≤∑1≤i1≤nP(Ai1A)-∑2≤i1≤nP(A1Ai1A)P(A) ≤∑1≤i1≤nP(Ai1A)P(A)-∑2≤i1≤nP(A1Ai1A)P(A) ≤∑1≤i1≤nP(AiA)-∑2≤i1≤nP(A1Ai1|A). 定理5設(shè)A1,A2,…,An是樣本空間S中的一組事件,則對于樣本空間S中的任一事件A,若P(A)>0,則 ∑1≤i1≤nP(Ai1|A)-∑1≤i1 ∑2≤i1 定理5的證明與定理4類似. 四、條件概率相關(guān)的三大公式 在本節(jié),我們主要探討與條件概率相關(guān)的三大重要公式,分別是:乘法公式,全概率公式,貝葉斯公式.該三大公式在相關(guān)的“概率論與數(shù)理統(tǒng)計”教材中均有闡述,本文主要討論乘法公式,全概率公式以及貝葉斯公式之間的關(guān)系,通過比較說明不同公式在實(shí)際應(yīng)用中的運(yùn)用場景.為便于相關(guān)分析的闡述,我們在下面先總結(jié)一下相關(guān)的結(jié)論[3]. 設(shè)A,B是兩個事件,且P(A)>0,則P(AB)=P(A)·P(B|A),該等式稱為概率的乘法公式.類似地,若P(B)>0,則P(AB)=P(B)P(A|B),該等式也稱為概率的乘法公式.乘法公式可推廣到有限多個事件的情形,比如,若A1,A2,…,An是樣本空間S中的一組事件,且P(A1A2…An)>0,則 P(A1A2…An)=P(A1)P(A2|A1)…P(AnA1A2…An). 設(shè)B1,B2,…,Bn是一組完備事件組,且P(Bi)>0,則對于任意事件A,有P(A)=∑ni=1P(Bi)P(ABi).另外,若P(A)>0,則 P(Bi|A)=P(ABi)P(Bi)∑nj=1P(Bj)P(ABj). 以上兩個公式分別稱為全概率公式和貝葉斯公式.關(guān)于乘法公式、全概率公式與貝葉斯公式的進(jìn)一步分析以及相關(guān)性質(zhì),有興趣的讀者可進(jìn)一步閱讀參考文獻(xiàn)[2][3]. 下面,我們重點(diǎn)闡述乘法公式、全概率公式以及貝葉斯公式之間的聯(lián)系.從數(shù)學(xué)史的角度來說,它們的產(chǎn)生順序是不同的.首先有乘法公式的定義,在乘法公式的基礎(chǔ)上獲得全概率公式,然后進(jìn)一步推導(dǎo)出貝葉斯公式.這樣的關(guān)系也體現(xiàn)在各個公式的證明中,比如,在證明全概率公式時需要用到乘法公式,而在證明貝葉斯公式時需要用到全概率公式.乘法公式通常應(yīng)用于求積事件的概率;全概率公式通常應(yīng)用于已知某事件在完備事件組下的條件概率,求該事件的概率;而貝葉斯公式主要用于解決條件概率問題.在區(qū)分何時用全概率公式、何時用貝葉斯公式時,我們可采用以下判別方法:“由因求果”用全概率公式,而“執(zhí)果求因”用貝葉斯公式.所謂“由因求果”指的是,經(jīng)過一系列的原因,最后求結(jié)果的概率;“執(zhí)果求因”意味著已知結(jié)果,求由某個原因造成該結(jié)果的概率.我們可以用一個具體的例子來分析一下. 某數(shù)據(jù)調(diào)查公司調(diào)研得出,投保的汽車司機(jī)按性格可分為三類,分別是性格謹(jǐn)慎、性格溫和以及性格急躁三類人群,我們分別將其稱為第一類投保人,第二類投保人以及第三類投保人.經(jīng)統(tǒng)計發(fā)現(xiàn),三類人群的比例分別為30%,40%,30%.已知第一類投保人在保險合同期內(nèi)發(fā)生事故的概率為0.03,第二類投保人在保險合同期內(nèi)發(fā)生事故的概率為0.04,第三類投保人相應(yīng)的事故概率為0.02.現(xiàn)從所有投保人中任意選擇一位,(1)此人在保險合同期內(nèi)發(fā)生事故的概率是多少?(2)如果某投保人在保險合同期內(nèi)發(fā)生事故,則此人來自第三類投保人的概率是多少?解決這個問題,我們首先可以將相關(guān)事件用數(shù)學(xué)符號表示出來.設(shè)事件“此人在保險合同期內(nèi)發(fā)生事故”為A,Bi(i=1,2,3)表示此人為第i類投保人.于是前面所提的問題可轉(zhuǎn)化成如下形式:問題(1)實(shí)質(zhì)上指的是求事件A發(fā)生的概率P(A);問題(2)可轉(zhuǎn)化為求條件概率P(B3|A).我們首先考慮問題(1),投保人的性格類型不同使得他們在保險合同期內(nèi)發(fā)生事故的概率各不相同,不同類型的投保人占總投保人群的比例也不同.基于這樣的原因,我們需要探討隨機(jī)選擇一名投保者,此人在保險合同期內(nèi)發(fā)生事故的概率.“在保險合同期內(nèi)發(fā)生事故”是一種結(jié)果,所以問題(1)實(shí)質(zhì)上是“由因求果”的問題.“由因求果”用全概率公式,故問題(1)可用全概率公式解決,即 P(A)=∑3i=1P(Bi)P(ABi). 由已知條件,可知P(B1)=0.3,P(B2)=0.4,P(B3)=0.3,P(AB1)=0.03,P(AB2)=0.04,P(AB3)=0.02.將上述條件代入全概率公式可得事件A的概率,即 P(A)=0.3×0.03+0.4×0.04+0.3×0.02=0.031. 接下來,我們來探討問題(2),在這一問題中,我們已經(jīng)知道了結(jié)果,即某投保人在保險合同期內(nèi)發(fā)生事故,求在這種條件下,該投保人是第三類投保人,也就是急躁型投保人的概率.顯然,這是一個已知結(jié)果求原因的概率,即“執(zhí)果求因”,所以我們可以運(yùn)用貝葉斯公式來求解問題(2).由貝葉斯公式,可得 P(B3|A)=P(AB3)P(B3)∑3j=1P(Bj)P(ABj)=631. 我們通過上面的例子給大家介紹了如何運(yùn)用全概率公式,以及如何運(yùn)用貝葉斯公式.這兩個公式可用來解決很多現(xiàn)實(shí)生活中的實(shí)際問題. 五、計算條件概率的方法 在本節(jié),我們主要介紹計算條件概率的方法.在學(xué)習(xí)“概率論與數(shù)理統(tǒng)計”的過程中,條件概率是一個重要的知識點(diǎn).對于從事隨機(jī)現(xiàn)象方面問題研究的科研工作者來說,這一概念是最基本的知識.那么,如何計算條件概率呢?在這里,我們介紹以下三種方法. (一)利用條件概率定義 根據(jù)定義2,設(shè)A,B是兩個事件,且P(A)>0,則稱P(B|A)=P(BA)[]P(A)為在事件A發(fā)生的條件下事件B發(fā)生的概率.若求條件概率P(B|A),可先求出A,B積事件發(fā)生的概率,然后再算出事件A發(fā)生的概率,最后計算兩者的比值即可.這一方法通常適用于求解較為簡單的問題.下面給出一個簡單的例題. 某橋梁在設(shè)計過程中執(zhí)行如下標(biāo)準(zhǔn):使用壽命達(dá)到80年的概率為0.95,使用壽命達(dá)到100年的概率為0.82.假設(shè)該橋梁施工時嚴(yán)格按照設(shè)計標(biāo)準(zhǔn)執(zhí)行,現(xiàn)已知該橋梁已經(jīng)使用了80年,試求該橋梁在未來的20年內(nèi)損毀的概率. 設(shè)A為事件“該橋梁使用壽命達(dá)到80年”,B表示事件“該橋梁使用壽命達(dá)到100年”.于是,P(A)=0.95,P(B)=0.82.根據(jù)題意可知,該題可轉(zhuǎn)化為求條件概率P(B-|A).由條件概率的性質(zhì),可知P(B-|A)=1-P(B|A).再根據(jù)條件概率的定義可得 P(B-|A)=1-P(AB)P(A)=1395. (二)利用乘法公式求解 我們知道,當(dāng)P(A)>0,P(B)>0時,以下兩個乘法公式均滿足: P(AB)=P(A)P(B|A), P(AB)=P(B)P(A|B). 于是,若求解條件概率P(B|A),可利用上述兩個條件概率公式,即P(A)P(B|A)=P(B)P(A|B),則 P(B|A)=P(B)P(A|B)P(A). 利用這一等式,先求出P(A),P(B),P(A|B),然后即可計算獲得P(B|A). (三)利用貝葉斯公式求解 在前文中,我們已經(jīng)總結(jié)分析了貝葉斯公式.設(shè)B1,B2,…,Bn是一組完備事件組,對于任意事件A,若P(A)>0,P(Bi)>0,則 P(Bi|A)=P(ABi)P(Bi)∑nj=1P(Bj)P(ABj). 上述公式可用于解決較為復(fù)雜的條件概率問題.利用這一公式時,可先根據(jù)題意計算P(A|Bi),P(Bi),i=1,2,…,n,然后代入貝葉斯公式即可計算獲得P(Bi|A). 六、生活中的條件概率 綜上,我們給出了條件概率的定義,比較分析了條件概率與概率的關(guān)系,并總結(jié)了與條件概率密切相關(guān)的三大公式.在本節(jié)中,我們將從現(xiàn)實(shí)生活中遇到的實(shí)際問題出發(fā)闡述條件概率的現(xiàn)實(shí)應(yīng)用. (一)新冠病毒試劑實(shí)驗(yàn)中的條件概率 2020年新冠疫情在全球暴發(fā).由于快速有力的防控措施,我國疫情得到有效控制.在疫情防控過程中,我國的科學(xué)家們也在積極研發(fā)應(yīng)對新冠病毒的疫苗.要判斷新型冠狀病毒檢測試劑是否有效,通常需要做如下兩類實(shí)驗(yàn): (1)對新冠肺炎病人的實(shí)驗(yàn).通過這個實(shí)驗(yàn)對新冠肺炎病人進(jìn)行檢測,得出呈陽性的概率. (2)對未患有新冠肺炎病人的實(shí)驗(yàn).通過這個實(shí)驗(yàn)對非新冠肺炎病人進(jìn)行檢測,得出呈陰性的概率. 基于這些實(shí)驗(yàn)的結(jié)果,分析某人經(jīng)過該新型冠狀病毒檢測試劑的檢測能否正確判斷其是否患有新冠肺炎.前述實(shí)驗(yàn)實(shí)際上是對條件概率的統(tǒng)計實(shí)驗(yàn).比如,若我們設(shè)A=“某人患有新冠肺炎”,B=“某人做此實(shí)驗(yàn)結(jié)果為陽性”,則對新冠肺炎病人的實(shí)驗(yàn),檢測后呈陽性的概率可寫成P(B|A).另外,對非新冠肺炎病人的實(shí)驗(yàn),檢測后呈陰性的概率可寫成P(B-|A-). (二)蒙提霍爾問題 蒙提霍爾問題源于美國一檔游戲節(jié)目,選手面對三扇關(guān)閉的門,在每扇門后有不同等級的獎品.獎品分別是汽車和山羊,其中一扇門后面是汽車,而另外兩扇門后面是山羊.主持人知道門后的獎品情況.當(dāng)選手選擇一扇門后,先不打開.主持人打開另外兩扇門中后面藏有山羊的那扇門.然后,選手被詢問是否要變更之前的選擇.這意味著,此時選手有機(jī)會從剩下兩扇關(guān)閉的門中任選一扇作為最終選擇的結(jié)果.在這樣的游戲中,請問該選手是否應(yīng)該變更自己的選擇,或者說換一扇門是否會提高其獲得汽車的概率呢[5]. 這個問題,實(shí)際上也是個條件概率的問題.我們將三扇門編上序號,分別將其稱為1號門,2號門,3號門.假設(shè)選手第一次選擇時選擇1號門,而主持人打開3號門.我們記“主持人打開3號門”的事件為事件A.事件Bi= “第i號門后是汽車,i=1,2,3”.要判斷換一扇門是否能提高其獲得汽車的概率.我們可把這兩扇門后有汽車的概率算出來.需要注意的是,這個概率是有條件的,因?yàn)橹鞒秩艘呀?jīng)打開了3號門.顯然,在主持人打開了3號門的條件下,汽車在1號門后的概率為P(B1|A);在主持人打開3號門的條件下,汽車在2號門后的概率為P(B2|A).根據(jù)貝葉斯公式,能得到P(B1|A)=1[]3以及P(B2|A)=2[]3.在這里,我們忽略了具體的計算.通過比較,我們發(fā)現(xiàn)P(B2|A)>P(B1|A),故換一扇門可以提高其獲得汽車的概率. (三)工業(yè)流水線中的條件概率問題 某工廠有三條流水線,各自獨(dú)立生產(chǎn)相同的產(chǎn)品,比如節(jié)能燈.生產(chǎn)出來的節(jié)能燈都放在工廠的倉庫中,并向不同地區(qū)的銷售商發(fā)售.根據(jù)之前的統(tǒng)計,這三條流水線生產(chǎn)的節(jié)能燈合格率是不同的,分別是0.98,0.99,0.97.現(xiàn)某人購買了該工廠生產(chǎn)的節(jié)能燈,發(fā)現(xiàn)是次品,請問該次品來自哪一條流水線.在這個問題中,我們可以記A為“節(jié)能燈是次品”,Bi=“該節(jié)能燈是第i條流水線所生產(chǎn)的,i=1,2,3”.于是,在某人購買的節(jié)能燈是次品的條件下,該次品來自第1條流水線的概率可寫為P(B1|A).顯然這也是個條件概率問題.要計算這一條件概率需要用到貝葉斯公式.實(shí)際上,在求解有關(guān)條件概率的實(shí)際問題時,經(jīng)常使用貝葉斯公式. 類似這樣的例子,生活中還有很多.火箭發(fā)射時,如發(fā)射失敗,就需要探討是由某部件導(dǎo)致的概率;在信號傳輸過程中,原信息為A,求經(jīng)過傳輸后接收方收到的是信號B的概率等.因此,只要我們認(rèn)真觀察,就會在生活中發(fā)現(xiàn)很多關(guān)于條件概率的例子. 七、總結(jié) 本文首先給出了概率和條件概率的定義.通過對兩者進(jìn)行比較分析發(fā)現(xiàn),條件概率也是概率.基于這一結(jié)論可知,概率所具有的性質(zhì),條件概率也都具有.文中總結(jié)了與條件概率密切相關(guān)的三大公式,通過例題進(jìn)一步闡述條件概率的性質(zhì).最后,本文結(jié)合新冠病毒試劑實(shí)驗(yàn)中的條件概率、蒙提霍爾問題,以及工業(yè)流水線中的條件概率問題,進(jìn)一步說明了生活中的條件概率問題無處不在. 【參考文獻(xiàn)】 [1]徐雅靜,段清堂,汪遠(yuǎn)征.概率論與數(shù)理統(tǒng)計[M].北京:科學(xué)出版社,2009. [2]河南理工大學(xué)概率論與數(shù)理統(tǒng)計教研組.概率論與數(shù)理統(tǒng)計[M].北京:高等教育出版社,2013. [3]盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(第四版)[M].北京:高等教育出版社,2008. [4]林正炎,白志東.概率不等式[M].北京:科學(xué)出版社,2006. 數(shù)學(xué)學(xué)習(xí)與研究2021年30期