国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

R語(yǔ)言在概率統(tǒng)計(jì)課堂教學(xué)中的應(yīng)用
——中心極限定理隨機(jī)模擬

2022-11-16 13:34普映娟
保山學(xué)院學(xué)報(bào) 2022年5期
關(guān)鍵詞:落點(diǎn)釘子直方圖

吳 婷 普映娟

(保山學(xué)院 大數(shù)據(jù)學(xué)院,云南 保山 678000)

概率統(tǒng)計(jì)課本里的理論知識(shí)雖可以為學(xué)生提供理論基礎(chǔ),但卻缺乏圖形表達(dá)和模擬來(lái)增強(qiáng)理解與動(dòng)手實(shí)踐能力。在教學(xué)實(shí)踐中,學(xué)生普遍認(rèn)為中心極限理論晦澀難懂,教學(xué)效果不理想[1]。傳統(tǒng)的黑板教學(xué)無(wú)法再滿足學(xué)生課堂教學(xué)的需求[2]。因此,在概率論教學(xué)中,利用R語(yǔ)言的隨機(jī)模擬和可視化將抽象概念轉(zhuǎn)化為具體形象的圖像,實(shí)驗(yàn)?zāi)M的動(dòng)態(tài)過(guò)程不僅可以加深學(xué)生對(duì)知識(shí)的理解,激發(fā)他們的想象力,從而促進(jìn)反思,最終掌握知識(shí),還可以提高課堂效率,使概率學(xué)習(xí)更具操作和動(dòng)手空間,提高學(xué)生的實(shí)踐能力。

1 中心極限定理

中心極限定理是相互獨(dú)立的隨機(jī)變量之和用正態(tài)分布近似的一類定理。直到20世紀(jì)30年代,中心極限定理的研究曾是概率論的中心內(nèi)容。至今其仍是一個(gè)活躍的方向,推廣的方向如獨(dú)立不同分布乃至非獨(dú)立的情形,由中心極限定理而引起的誤差的估計(jì),以及與之相關(guān)聯(lián)的問(wèn)題如大偏差問(wèn)題之類[3]。最為著名的相互獨(dú)立同分布情形下的中心極限定理,又稱為列維-林德伯格中心極限定理。列維(1886-1971年)是法國(guó)數(shù)學(xué)家,對(duì)極限理論和隨機(jī)過(guò)程理論做出杰出的貢獻(xiàn)。林德伯格(1876-1932年)是芬蘭數(shù)學(xué)家,因中心極限定理而聞名于世[4]。

定理1(列維-林德伯格中心極限定理)設(shè)隨機(jī)變量序列X1,X2,…Xn中心相互獨(dú)立同分布,若E(Xi)=μ,D(Xi)=σ2,且0<σ2< +∞,i=1,2,…,則對(duì)任意實(shí)數(shù)x,有

這個(gè)定理的直觀意義是,當(dāng)n足夠大時(shí),可以近似地認(rèn)為。在實(shí)際問(wèn)題中,若n較大,可以利用正態(tài)分布近似求得概率。

傳統(tǒng)的教學(xué)就是列出不同條件下的中心極限定理,簡(jiǎn)單說(shuō)明在樣本量充分大時(shí)依分布收斂到正態(tài)分布。而證明過(guò)程在大多公共基礎(chǔ)課的教材基本沒(méi)有涉及到。即使教材給出了證明,作為公共基礎(chǔ)課的學(xué)生也很少對(duì)其繁瑣的推導(dǎo)過(guò)程感興趣。故在講授這項(xiàng)重要的知識(shí)點(diǎn)的時(shí)候,除理論說(shuō)明和推導(dǎo)之外,還可以結(jié)合統(tǒng)計(jì)軟件R進(jìn)行教學(xué),讓學(xué)生切實(shí)體會(huì)到中心極限定理的魅力[4]。

本文將利用R軟件生成n(n=1,2,3,4,30)個(gè)相互獨(dú)立的均勻分布X~U(0,1)之和的模擬數(shù)據(jù),繪制其直方圖和密度函數(shù)圖形。觀察隨著n的增大,n個(gè)相互獨(dú)立的變量之和是否能用正態(tài)分布近似。本文將通過(guò)2種數(shù)據(jù)模擬的思路,來(lái)說(shuō)明中心極限定理。一是進(jìn)行隨機(jī)采樣,然后求和生成新的數(shù)據(jù)列,再查看和數(shù)據(jù)的分布情況;二是通過(guò)卷積推導(dǎo)出和變量的密度函數(shù),然后分別繪制密度函數(shù)線,查看分布情況。設(shè){}Xi為獨(dú)立同分布的隨機(jī)變量序列,其分布為區(qū)間(0,1)上的均勻分布,即Xi~U(0,1),i=1,2,…,30,且Xi之間相互獨(dú)立。記,由中心極限定理可知,Yn~N(nμ,nσ2)。

2 R語(yǔ)言隨機(jī)采樣模擬

R語(yǔ)言是一款免費(fèi)、開(kāi)源的程序軟件。它由新西蘭奧克蘭大學(xué)的Robert Gentleman和Ross Ihaka等人員共同開(kāi)發(fā),主要用于統(tǒng)計(jì)分析、數(shù)據(jù)挖掘以及數(shù)據(jù)可視化[2]。它不僅支持?jǐn)?shù)據(jù)分析相關(guān)的多種算法,而且其語(yǔ)法也十分簡(jiǎn)明易懂,運(yùn)行速度也可以接受,適合在教學(xué)和科研中使用。因此本文將利用R語(yǔ)言把概率論中的中心極限定理可視化,輔助教學(xué)。

隨機(jī)采樣模擬的思路:利用R語(yǔ)言中的隨機(jī)數(shù)采樣命令runif隨機(jī)生成容量為10 000的30組數(shù)據(jù),然后得到30組的模擬值,最后使用hist命令繪制每組數(shù)據(jù)的直方圖,并增加其密度函數(shù)線。接下來(lái)運(yùn)用R軟件對(duì)其進(jìn)行統(tǒng)計(jì)模擬并加以驗(yàn)證。

2.1 隨機(jī)采樣模擬的步驟

(1)隨機(jī)生成容量為10 000的30組數(shù)據(jù)

(2)依次構(gòu)造和變量Yn模擬數(shù)據(jù)

(3)繪制和變量Yn(n=1,2,3,30)的直方圖和分布圖

2.2 繪制直方圖和分布圖

圖1 均勻分布隨機(jī)采樣生成 Yn(n=1,2,3,30)的直方圖

圖2 二項(xiàng)分布隨機(jī)采樣生成Yn(n=1,2,3,30)的直方圖

3 R語(yǔ)言密度函數(shù)模擬

除可以通過(guò)采樣的方式生成隨機(jī)數(shù),然后加和模擬,還可以通過(guò)卷積公式嚴(yán)格地推導(dǎo)出和變量的密度函數(shù),用R軟件直接繪制密度函數(shù)來(lái)觀察分布情況。但隨著變量的增多,計(jì)算會(huì)相當(dāng)復(fù)雜,不易實(shí)現(xiàn)。

3.1 卷積公式

設(shè)(X,Y)是二維連續(xù)型隨機(jī)變量,它們具有概率密度(fx,y),則Z=X+Y仍為連續(xù)型隨機(jī)變量,其概率密度為。若X和Y相互獨(dú)立,設(shè)(X,Y)關(guān)于X,Y的邊緣概率密度分別為fX(x),fY(y),則上式化為

3.2 和變量的密度函數(shù)

設(shè){Xi}為獨(dú)立同分布的隨機(jī)變量序列,其分布為區(qū)間(0,1)上的均勻分布,即Xi~U(0,1),i=1,2,3,4,且Xi之間相互獨(dú)立。記,由中心極限定理可知,Yn~N(nμ,nσ2),令pn(y)為Yn的密度函數(shù)。根據(jù)卷積公式,可以依次求出Yn(n=1,2,3,4)的密度函數(shù)pn(y),n=1,2,3,4,如下公式(3.1)所示。

3.3 數(shù)據(jù)模擬的步驟和R代碼

3.3.1 利用R語(yǔ)言依次構(gòu)造Yn的密度函數(shù)pn

3.3.2 繪制Y1,Y2,Y3,Y4的密度圖

根據(jù)構(gòu)造Yn(n=1,2,3,4)的密度函數(shù),利用R語(yǔ)言的curve函數(shù)繪制x∈[0,4]密度函數(shù)圖。

3.4 模擬結(jié)果

根據(jù)上述步驟,將Yn(n=1,2,3,4)地密度函數(shù)p1(y),p2(y),p3(y),p4(y)表示在圖3中。由圖3可知:隨著n的增加,pn(y)的圖形愈來(lái)愈光滑,且越來(lái)越接近正態(tài)曲線,符合中心極限定理。

圖3 Yn(n=1,2,3,4)的密度函數(shù)圖

4 課堂教學(xué)案例(高爾頓釘板實(shí)驗(yàn))

在《概率論與數(shù)理統(tǒng)計(jì)》學(xué)習(xí)中,在闡釋完中心極限定理的基本定義后,增加中心極限定理的應(yīng)用案例。高爾頓釘板實(shí)驗(yàn)常常作為應(yīng)用實(shí)例,利用中心極限定理來(lái)進(jìn)行解釋。在課上展示環(huán)節(jié),主要基于R軟件,對(duì)高爾頓實(shí)驗(yàn)進(jìn)行模擬,模擬多種情況,比如釘子層數(shù)的不同、實(shí)驗(yàn)小球的個(gè)數(shù)對(duì)于實(shí)驗(yàn)結(jié)果的影響等。

4.1 高爾頓釘板實(shí)驗(yàn)

有一個(gè)板上面有n排釘子,每排相鄰的兩個(gè)釘子之間的距離均相等。上一排釘子的水平位置恰巧位于下一排緊鄰的兩個(gè)釘子水平位置的正中間。從上端入口放入小球,在下落過(guò)程中小球碰到釘子后相等的可能性向左或向右偏離,碰到下一排相鄰的兩個(gè)釘子中的一個(gè)。如此繼續(xù)下去,直到落入底部隔板中的一格,如圖4所示。問(wèn)當(dāng)有大量的小球從上端依次放入,任其自由下落,小球最終在底板中堆積的形態(tài)。設(shè)釘子有16排,即n=16。

圖4 高爾頓釘板

在街頭賭博中,莊家會(huì)在高爾頓鋼板的底板兩端距離原點(diǎn)超出8格的位置放置了值錢的東西來(lái)吸引顧客,而在原點(diǎn)附近則放置相對(duì)便宜的東西或者不放置任何。一般在賭博游戲中,大多都是莊家贏,而這個(gè)游戲也不例外。我們可以用中心極限定理來(lái)揭穿這個(gè)街頭賭博中的騙術(shù)。

若要考察小球堆積的形態(tài),就需要考察小球最終下落在底部隔板的位置的分布。則設(shè)隨機(jī)變量X為“小球最終下落在底部隔板中的位置”,同時(shí)引入隨機(jī)變量Xi服從伯努利分布,分布律如表1所示。則μ=E(Xi)=0,σ2=D(Xi)=1。

表1 隨機(jī)變量Xi的分布律

為揭穿這個(gè)街頭賭博中的騙術(shù),需要計(jì)算中大獎(jiǎng)概率,即下落小球超出8格的位置的概率。設(shè)釘子有16排,即n=16。由于,此時(shí)X~N( )0,16,有

此時(shí)計(jì)算中大獎(jiǎng)的概率不到5%,這說(shuō)明顧客中大獎(jiǎng)的可能性微乎其微。

4.2 R語(yǔ)言模擬實(shí)驗(yàn)

接下來(lái)通過(guò)軟件模擬的方式,來(lái)模擬高爾頓釘板實(shí)驗(yàn)。

4.2.1 模擬生成落點(diǎn)數(shù)據(jù)

設(shè)定生成落點(diǎn)數(shù)據(jù)函數(shù)的輸入、輸出參數(shù),如表2和表3所示。

表2 輸入?yún)?shù)

表3 輸出參數(shù)

下面是模擬生成落點(diǎn)數(shù)據(jù)的R函數(shù)實(shí)現(xiàn)。

4.2.2 繪制落點(diǎn)數(shù)據(jù)的直方圖

由上述構(gòu)造的R函數(shù)可以得到每個(gè)點(diǎn)的下落位置y,對(duì)下落位置繪制其直方圖hist,同時(shí)增加臨界位置8和-8,標(biāo)識(shí)出中大獎(jiǎng)的概率P(|X|>8)。

4.3 實(shí)驗(yàn)結(jié)果

根據(jù)上述步驟進(jìn)行實(shí)驗(yàn),得到在n=16排釘子下投擲分別M=10,100,1 000,10 000次落點(diǎn)的位置數(shù)據(jù),可以得到結(jié)果如圖5所示。在本次模擬下,僅投擲10次,此時(shí)獲取大獎(jiǎng)(P(|X|>8))的概率為0。當(dāng)投擲次數(shù)達(dá)到100及以上,獲取大獎(jiǎng)的概率穩(wěn)定在2%附近。同時(shí),隨著次數(shù)的增加,落點(diǎn)位置的分布更接近于正態(tài)分布。

圖5 在16排釘子下投擲分別10,100,1 000,10 000次落點(diǎn)分布

但同時(shí)也注意到隨著投擲次數(shù)的增加,獲取大獎(jiǎng)的概率穩(wěn)定在2%附近,與上節(jié)正態(tài)分布計(jì)算出的概率4.56%存在差異。原因是層數(shù)n僅為16不足夠大,正態(tài)近似程度不高。雖然能在一定程度上說(shuō)明賭博問(wèn)題,得到近似概率,但精確概率仍然需要通過(guò)卷積公式來(lái)求n重二項(xiàng)分布的和分布函數(shù)。

由此可以得到如下結(jié)論:

(1)試驗(yàn)測(cè)試較少時(shí),一次性命中大獎(jiǎng)幾乎不可能。

(2)隨著次數(shù)的增加,落點(diǎn)位置的分布接近于正態(tài)分布,符合中心極限定理。

(3)通過(guò)數(shù)據(jù)模擬得到的概率值與中心極限定理利用正態(tài)近似得到的概率相比,仍有差異。原因是層數(shù)n不足夠大。但作為近似的判斷也足夠了,不影響對(duì)此賭博問(wèn)題得到近似概率,精確概率仍然需要通過(guò)卷積公式來(lái)求n重二項(xiàng)分布的和分布函數(shù)。

5 結(jié)語(yǔ)

中心極限定理作為概率論與數(shù)理統(tǒng)計(jì)課程教學(xué)中的重點(diǎn)和難點(diǎn)之一,在教學(xué)過(guò)程中選擇使用R語(yǔ)言隨機(jī)模擬抽樣和概率分布情況,不僅可以使學(xué)生能夠較好地理解和掌握中心極限定理的本質(zhì),也能夠訓(xùn)練學(xué)生的編程能力,增強(qiáng)其動(dòng)手能力[6]。

在計(jì)算技術(shù)快速發(fā)展的今天,編程和數(shù)據(jù)模擬也是一項(xiàng)必備技能。大學(xué)課堂教學(xué)也應(yīng)該與時(shí)俱進(jìn),充分利用現(xiàn)代化的教學(xué)工具和手段,讓學(xué)生在學(xué)習(xí)傳統(tǒng)知識(shí)的同時(shí),領(lǐng)略現(xiàn)代科技的發(fā)展對(duì)一些學(xué)科的促進(jìn)作用,從而激發(fā)學(xué)生的學(xué)習(xí)興趣,培養(yǎng)學(xué)生利用現(xiàn)代技術(shù)手段解決問(wèn)題的能力[5]。

猜你喜歡
落點(diǎn)釘子直方圖
符合差分隱私的流數(shù)據(jù)統(tǒng)計(jì)直方圖發(fā)布
當(dāng)釘子邂逅毛線
少了顆釘子
釘子
基于空間分層組合設(shè)計(jì)的火箭落點(diǎn)實(shí)時(shí)計(jì)算模型
用直方圖控制畫(huà)面影調(diào)
中考頻數(shù)分布直方圖題型展示
美火星軌道器拍到歐洲著陸器落點(diǎn)圖像
拼搶第二落點(diǎn)新聞打好新聞競(jìng)爭(zhēng)戰(zhàn)
探訪江蘇地方立法:百姓關(guān)切成立法落點(diǎn)
柏乡县| 乃东县| 图木舒克市| 昆明市| 泌阳县| 宁乡县| 景洪市| 五台县| 龙井市| 海宁市| 平邑县| 襄城县| 长沙县| 济宁市| 祁东县| 合肥市| 翼城县| 太谷县| 萨迦县| 新兴县| 乌审旗| 施甸县| 淮阳县| 高阳县| 信丰县| 墨竹工卡县| 东方市| 彩票| 宁海县| 隆安县| 塔城市| 铜陵市| 来凤县| 清新县| 桑日县| 南华县| 营山县| 宁陵县| 安图县| 轮台县| 祥云县|