呂文華,韓慧霞
概率統(tǒng)計(jì)是高校理工科專業(yè)學(xué)生的一門基礎(chǔ)課程,而條件分布是概率論中一個(gè)重要的概念,是研究變量之間相依關(guān)系的一個(gè)有力工具,在工程計(jì)算、金融保險(xiǎn)等領(lǐng)域都有廣泛的應(yīng)用,也是教學(xué)的一個(gè)難點(diǎn)。因此,如何使學(xué)生深刻理解條件數(shù)學(xué)分布的概念、熟練掌握其計(jì)算方法是概率統(tǒng)計(jì)教學(xué)的一個(gè)重要問(wèn)題。
在條件分布的教學(xué)中,常通過(guò)對(duì)一個(gè)簡(jiǎn)單例子的分析指出條件分布的重要性,并使學(xué)生明確在已知Y=y(tǒng)的條件下,X的條件分布與X的無(wú)條件分布是不同的。
例1 考慮一大群人,從其中隨機(jī)抽取一個(gè),分別以X和Y記其身高和體重,則X和Y都是隨機(jī)變量,各自都有一定的概率分布。如限制1.8≤X≤1.9,在此條件下去求體重Y的條件分布,這就意味著從這一大群人中,把身高在1.8米和1.9米之間的人挑出來(lái),然后在挑出的人群中求其體重的分布。由于身高和體重會(huì)有一定的正相依關(guān)系,這個(gè)分布與不設(shè)這個(gè)條件時(shí)的分布會(huì)很不一樣。所以有必要研究把一個(gè)變量限制在一定條件下另一個(gè)隨機(jī)變量的條件分布。
由于離散型隨機(jī)變量常用分布列表示其分布,而連續(xù)型常用其密度函數(shù),所以我們分別考慮條件分布列與條件分布函數(shù)。設(shè)(X,Y)為一個(gè)二維離散型隨機(jī)向量,聯(lián)合分布列為P(X=xi,Y=y(tǒng)j)=pij,i,j=1,2,…,考慮Y=y(tǒng)j的條件下X的條件分布,即是要找條件概率P(X=xi|Y=y(tǒng)j)由條件概率的定義,可得若P(Y=y(tǒng)j)>0,則
此即為在給定Y=y(tǒng)j的條件下X的條件分布列。
為加深學(xué)生對(duì)概念的理解,應(yīng)進(jìn)一步補(bǔ)充說(shuō)明,在Y=y(tǒng)j條件不變的情況下,條件分布列仍是分布列,即滿足:
在連續(xù)場(chǎng)合中,因?qū)θ我鈟,P(Y=y(tǒng))=0,故P(X=xi|Y=y(tǒng)j)沒(méi)有意義,首先考慮Y=y(tǒng)時(shí)X的條件分布函數(shù)的概念.設(shè)二維連續(xù)隨機(jī)變量(X,Y)的聯(lián)合分布函數(shù)和密度函數(shù)分別為F(x,y),p(x,y),邊際密度函數(shù)為pX(x),pY(y),則Y=y(tǒng)時(shí)X的條件分布函數(shù)可以寫(xiě)成
分子分母各除以h,并分別取極限,則上式化為
上式表明條件分布也是連續(xù)分布,并且在pY(y)>0時(shí),給定Y=y(tǒng)條件下X的條件密度函數(shù)為
為加深學(xué)生對(duì)條件密度的理解,應(yīng)強(qiáng)調(diào)兩點(diǎn):
1.條件密度函數(shù)仍然是概率密度,即滿足概率密度的兩點(diǎn)基本性質(zhì)。2.(1)式可改寫(xiě)為:
類似可得,
即兩個(gè)隨機(jī)變量的聯(lián)合密度等于其中之一的概率密度乘以在給定這一個(gè)之下另一個(gè)的條件概率密度,這個(gè)公式與條件概率的公式P(AB)=P(B)P(A/B)類似 。
由于條件分布列仍是分布列,條件密度函數(shù)仍然是條件概率密度,所以在此基礎(chǔ)上可以求條件期望。其計(jì)算公式如下,若(X,Y)為二維離散型,
若(X,Y)為二維離散型,
條件期望E(X|Y=y(tǒng))是y的函數(shù),它與無(wú)條件期望E(X)是有區(qū)別的。進(jìn)一步指出若以E(X|Y)記Y的如下函數(shù):當(dāng)Y=y(tǒng)時(shí)它取值E(X|Y=y(tǒng)),這樣定義的E(X|Y)是一個(gè)隨機(jī)變量,對(duì)它求期望可得有趣的結(jié)果。
例2 (重期望公式)設(shè)(X,Y)是二維隨機(jī)變量,且E(X)存在,則
證:在此僅對(duì)連續(xù)場(chǎng)合給出證明,而離散場(chǎng)合可類似證明。設(shè)(X,Y)有聯(lián)合密度p(x,y),
由Y的函數(shù)的期望公式,有
重期望公式是概率論中較為深刻的結(jié)果,它在實(shí)際中很有用.譬如,要求在一個(gè)取值于很大范圍上的指標(biāo)X的均值E(X),會(huì)遇到計(jì)算上的許多困難.為此可換一種思維方式:尋求一個(gè)與X有關(guān)的量Y,以Y的不同取值把大范圍劃分成若干個(gè)小區(qū)域,先在小區(qū)域上求X的平均,再對(duì)此類平均求加權(quán)平均,即可得到大范圍上X的平均E(X).
例3 一個(gè)礦工被困在有兩個(gè)門的礦井里,第一個(gè)門通一坑道,沿此坑道走3小時(shí)可到達(dá)安全區(qū);第二個(gè)門通一坑道,沿此坑道5小時(shí)又回到原處。假定此礦工總是等可能地在兩個(gè)門中選擇一個(gè),試求他平均要用多少時(shí)間才能到達(dá)安全區(qū)。
解:設(shè)該礦工需要X小時(shí)到達(dá)安全區(qū),Y表示第一次所選的門。
由題設(shè)條件知,
例4 (隨機(jī)個(gè)隨機(jī)變量之和的期望)設(shè)X1,X2,…為一列獨(dú)立同分布的隨機(jī)變量,隨機(jī)變量N只取正整數(shù)值,且N與{Xn}獨(dú)立,則有
對(duì)此例子不要求學(xué)生掌握其證明,而是強(qiáng)調(diào)其在實(shí)際中的應(yīng)用。如設(shè)一天內(nèi)到達(dá)商場(chǎng)的顧客數(shù)N是僅取非負(fù)整數(shù)值的隨機(jī)變量,且E(N)=35000.又設(shè)進(jìn)入此商場(chǎng)的第i個(gè)顧客的購(gòu)物金額為Xi,可以認(rèn)為諸Xi是獨(dú)立同分布的隨機(jī)變量,且E(Xi)=82(元).假設(shè)N與Xi相互獨(dú)立是合理的,則此商場(chǎng)一天的平均營(yíng)業(yè)額為
僅考慮(X,Y)為連續(xù)型,一般p(x|y)隨y的變化而變化,這反映了X與Y有相依關(guān)系,如果p(x|y)不依賴于y,只是x的函數(shù),由(1)式易得,p(x|y)=pX(x),則表示X的分布情況與Y的取值完全無(wú)關(guān),這時(shí)就稱X與Y這兩個(gè)隨機(jī)變量獨(dú)立。
定義:設(shè)二維隨機(jī)向量(X,Y)的聯(lián)合密度函數(shù)為p(x,y),X與Y的邊際密度分別為pX(x),pY(y),如果
則稱X與Y相互獨(dú)立。
進(jìn)一步解釋之所以沒(méi)有采用p(x|y)=pX(x)來(lái)定義X與Y的獨(dú)立性,原因有如下兩點(diǎn)
(1)式(5)總是有意義的,而用條件密度去定義時(shí),可能碰到在個(gè)別點(diǎn)無(wú)法定義的情況,而在一般情況下可以用p(x|y)=pX(x)來(lái)驗(yàn)證其獨(dú)立性。
(2)式(5)式在形式上關(guān)于兩個(gè)變量對(duì)稱,便于推廣到對(duì)多個(gè)變量定義獨(dú)立性。
證:由二維正態(tài)分布的密度形式可得,從而 當(dāng)且僅當(dāng)ρ=0時(shí),p(x|y)=pX(x),即X與Y獨(dú)立。
隨著我國(guó)的高等教育由“精英型教育”向“大眾化教育”轉(zhuǎn)變,像我校這樣的應(yīng)用型本科院校,學(xué)生數(shù)學(xué)基礎(chǔ)知識(shí)不夠扎實(shí),學(xué)習(xí)的主動(dòng)性不足,以上教學(xué)方法在做法上淡化理論證明,強(qiáng)調(diào)對(duì)知識(shí)的應(yīng)用。目的是使學(xué)生對(duì)概率統(tǒng)計(jì)這門課程感興趣、克服畏難心理,對(duì)條件分布理論有一個(gè)較系統(tǒng)的把握。
[1]茆詩(shī)松,程依明,濮曉龍.概率論與數(shù)理統(tǒng)計(jì)教程[M].北京:高等教育出版社,2010.
[2]陳希孺.概率論與數(shù)理統(tǒng)計(jì)[M].合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社,2002.
[3]徐洪香.概率論的緣起、發(fā)展及其應(yīng)用[J].遼寧工學(xué)院學(xué)報(bào),2001,21(3):62-63.
[4]張克軍.關(guān)于條件概率及其應(yīng)用的教學(xué)研究[J].徐州教育學(xué)院學(xué)報(bào),2008,23(3):134-135.
[5]沙秀艷,辛 杰.概率論與數(shù)理統(tǒng)計(jì)教學(xué)實(shí)踐與探索[J].大學(xué)數(shù)學(xué),2013,29(4):9-12.