李瑞閣,萬冰蓉,許洪范
(1.南陽理工學(xué)院應(yīng)用數(shù)學(xué)系,河南 南陽 473006;2.南昌工程學(xué)院 理學(xué)系,南昌 330099)
(1)設(shè) X1,X2,…,Xniid~U(0,1)當(dāng) x∈[k,k+1]時(shí),
對(duì)于其他x上式等于0。
(1)在數(shù)學(xué)上,數(shù)形結(jié)合的思想,不僅能從直覺上給我們以啟示,常常能借助變化的趨勢(shì),發(fā)現(xiàn)事物的客觀規(guī)律性。
用正態(tài)分布去擬合fn(x)主要有兩種方法:
②用曲線擬合最小二乘法,用數(shù)學(xué)軟件編程實(shí)現(xiàn):如n=5,N(2.5,0.4489)。
這里用第二種方法。用Matlab分別畫出當(dāng)n=2,3,4,5時(shí)的和分布密度圖及相應(yīng)的正態(tài)分布圖 (見圖1,圖2,圖 3,圖 4)。
③用Matlab分別畫出當(dāng)n=2,3,4,5時(shí)的相應(yīng)和分布密度與正態(tài)密度的差的絕對(duì)值在 [0,3],[0,5],[0,6],[0,8]內(nèi),依次取 100,100,150,200 個(gè)等分點(diǎn)的差值圖(見圖 5,圖 6,圖 7,圖 8),并計(jì)算出對(duì)區(qū)間盡可能細(xì)分情況下,和密度函數(shù)與相應(yīng)正態(tài)分布函數(shù)的差的絕對(duì)值的最大值。
其中,當(dāng) x∈[k,k+1]時(shí),
當(dāng) n=2,3,…,31 時(shí),an在[0,n+2]上的最大值(見表 1),并畫出前24個(gè)值對(duì)應(yīng)的差的絕對(duì)值最大值趨勢(shì)圖(見圖9)。
(1)由圖1,圖2,圖3,圖4可觀察到:隨著服從均勻分布的多個(gè)獨(dú)立隨機(jī)變量個(gè)數(shù)n不斷增大,這些變量和的密度函數(shù)與對(duì)應(yīng)的正態(tài)分布的擬合程度愈來愈好。
(2)由圖5,圖6,圖7,圖8觀察發(fā)現(xiàn),和密度函數(shù)與正態(tài)分布密度函數(shù)差的絕對(duì)值最大值,分別在和密度函數(shù)不為零的區(qū)間[0,2],[0,3],[0,4],[0,5]上達(dá)到,且從右端點(diǎn)開始,在擴(kuò)大的區(qū)間[0,3],[0,5],[0,6],[0,8]上,隨著自變量的增大,差的絕對(duì)值越來越小,這個(gè)趨勢(shì)可隨區(qū)間的繼續(xù)增大而無限趨近于0;同理,由正態(tài)分布的對(duì)稱性,在左端點(diǎn)以外,和密度函數(shù)為零區(qū)間上,可以預(yù)見,隨著自變量的減小,差的絕對(duì)值越來越小,無限趨近于0。
(3)由圖9,表1很清楚的看到隨著變量個(gè)數(shù)的增加,分段函數(shù)在放大區(qū)間上,和密度函數(shù)與正態(tài)密度函數(shù)的差絕對(duì)值的最大值,隨著n增大,逐漸減小,越來越趨近于零,分布密度與正態(tài)分布密度隨著n的增大,逼近速度越來越快。
表1 差絕對(duì)值的最大值數(shù)據(jù)
(4)利用Matlab考察和密度函數(shù)與正態(tài)分布密度函數(shù)差絕對(duì)值的最大值an隨n的變化趨勢(shì)。利用逐步回歸法,并根據(jù)常識(shí)確定an與及n-1的關(guān)系為
復(fù)相關(guān)系數(shù)R為0.997,且以此方程預(yù)測(cè)an的值與實(shí)際值差趨近于0,因此認(rèn)為該方程適合統(tǒng)計(jì)學(xué)理論Edgeworth展開理論。不僅有統(tǒng)計(jì)學(xué)意義,且有實(shí)際意義。當(dāng)n→∞,an→0。
綜上,當(dāng)服從均勻分布的獨(dú)立隨機(jī)變量個(gè)數(shù)很多時(shí),均勻分布和分布無限逼近正態(tài)分布,它們和的分布可近似看成正態(tài)分布,這個(gè)結(jié)論符合中心極限定理。
由于上述的特性以及下面理論上的原因,均勻分布U(0,1)在隨機(jī)模擬中起著特殊的作用。通過產(chǎn)生大量相互獨(dú)立的U(0,1)的隨機(jī)數(shù),經(jīng)過一些相應(yīng)的變換可得到其他形式(正態(tài)分布、指數(shù)分布、Gamma分布等)的隨機(jī)數(shù)。
命題1:若隨機(jī)變量Y有嚴(yán)格單調(diào)上升連續(xù)的分布函數(shù)F(y),X=F(Y),則 X 為隨機(jī)變量。
證明:∵Y為隨機(jī)變量,
∴?一維β集,及σ代數(shù)F,使得 Y-1(-∞,w)∈F
∴對(duì)于一維 β 集(-∞,η)有
X-1((-∞,η))=(F(Y))-1(-∞,η)=Y-1(F-1(-∞,η))∈F (F-1(-∞,η)∈β)
∴X為隨機(jī)變量。
命題2 若隨機(jī)變量Y有嚴(yán)格單調(diào)上升連續(xù)的分布函數(shù) F(y),X=F(Y)則 X~U(0,1), 反 之 ,若 Z~U(0,1),F為任一嚴(yán)格單調(diào)上升連續(xù)的分布函數(shù),F(xiàn)-1為它的反函數(shù),則 W=F-1(Z)的分布函數(shù)為 F(w)。
表2 均勻分布隨機(jī)數(shù)
證明:對(duì)任一 0≤x≤1有
P(X≤x)=P(F(Y)≤x)=P(Y≤F-1(x))=F(F-1(x))=x
∴X~U(0,1)
反之,若Z~(0,1),F(xiàn)為任一嚴(yán)格單調(diào)上升連續(xù)的分布函數(shù),F(xiàn)-1為它的反函數(shù),則W=F-1(Z)的分布函數(shù)為F(w)。
P(W≤w)=P(F-1(Z)≤w)=P(Z≤F(w))=F(w)
∴W的分布函數(shù)為F(w)。
利用上述關(guān)系,可以產(chǎn)生各種常見分布F(x)的隨機(jī)數(shù)。所謂某個(gè)分布F(x)的隨機(jī)數(shù),是指從分布F(x)的總體中隨機(jī)地抽取一個(gè)大樣本的數(shù)值,借助適當(dāng)運(yùn)算得到。
用機(jī)器來模擬抽樣比實(shí)際抽樣不僅成本低,而且可以有效地防止一些不必要的干擾,從而廣泛地應(yīng)用于各個(gè)領(lǐng)域中。
在(0,1)中產(chǎn)生n個(gè)均勻分布的隨機(jī)數(shù)X1,X2,…,Xn即設(shè)X1,X2,…,Xn獨(dú)立同分布,由于
由中心極限定理知
故Y為所求的N(0,1)的隨機(jī)數(shù)。
例:今用Matlab軟件,取得的均勻分布隨機(jī)數(shù)(見表2)。進(jìn)而計(jì)算正態(tài)隨機(jī)數(shù)為
[1]李瑞閣,黃堯.服從均勻分布的多個(gè)獨(dú)立隨機(jī)變量和的密度函數(shù)公式[J].南陽師范學(xué)院學(xué)報(bào),2007,(6)3.
[2]梁之舜,鄧集賢,楊維權(quán)等.中山大學(xué)數(shù)學(xué)系.概率論及數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,2003.
[3]沈鴻.一類U統(tǒng)計(jì)量函數(shù)的Edgeworth展開[J].中國計(jì)量學(xué)院學(xué)報(bào),2005,16(2).
[4]高惠璇.統(tǒng)計(jì)計(jì)算[M].北京:北京大學(xué)出版社,2005.[5]方開泰等.統(tǒng)計(jì)分布[M].北京:科學(xué)出版社,1987.