国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

淺析概率論與數(shù)理統(tǒng)計(jì)在生活中的應(yīng)用

2021-01-29 02:28許欣蘭寶安中學(xué)
消費(fèi)導(dǎo)刊 2021年1期
關(guān)鍵詞:二項(xiàng)分布數(shù)理統(tǒng)計(jì)概率論

許欣蘭 寶安中學(xué)

一、引言

概率論及數(shù)理統(tǒng)計(jì)是數(shù)學(xué)世界中較新的成員。概率是由兩位法國人Blaise Pascal和Pierre Fermat于1654年發(fā)明的。統(tǒng)計(jì)學(xué)的誕生則與著名的數(shù)學(xué)家高斯(Gauss)和拉普拉斯(Laplace)有關(guān)。在19世紀(jì)初,這兩位偉大的數(shù)學(xué)家在工作中意識到統(tǒng)計(jì)的重要性,不過,由于當(dāng)時(shí)他們?nèi)狈τ辛Φ臄?shù)學(xué)工具,因此,他們并沒有深入研究統(tǒng)計(jì)學(xué)及相關(guān)的數(shù)理知識。后來,經(jīng)過數(shù)學(xué)家近半個(gè)世紀(jì)的努力,統(tǒng)計(jì)理論才得到了發(fā)展[1]。在生產(chǎn)及生活中,統(tǒng)計(jì)學(xué)有著十分廣泛的應(yīng)用。在研究工程、商業(yè)、醫(yī)學(xué)問題時(shí),我們都會用到統(tǒng)計(jì)學(xué)知識。幾乎每一個(gè)較為復(fù)雜的社會科學(xué)和自然科學(xué)問題,都離不開統(tǒng)計(jì)學(xué)。醫(yī)生可能會依賴?yán)酶怕史椒ǖ挠?jì)算機(jī)程序,來解釋某些醫(yī)學(xué)測試的結(jié)果;預(yù)拌公司的工人在混合混凝土?xí)r,也需要使用基于概率論的圖表;稅務(wù)人員在確定房屋的價(jià)值時(shí),需要使用計(jì)算機(jī)上的統(tǒng)計(jì)軟件。科學(xué)與技術(shù)的發(fā)展是相輔相成的。隨著信息技術(shù)的發(fā)展,概率論與數(shù)理統(tǒng)計(jì)的應(yīng)用將更加廣泛。

二、概率論與數(shù)理統(tǒng)計(jì)

作為數(shù)學(xué)的一個(gè)重要分支,概率論與數(shù)理統(tǒng)計(jì)在許多領(lǐng)域都有著廣泛的應(yīng)用。概率論主要研究隨機(jī)事件的發(fā)生規(guī)律,而數(shù)理統(tǒng)計(jì)則是根據(jù)與概率相關(guān)的知識,解釋統(tǒng)計(jì)結(jié)果,或?qū)傮w的特征進(jìn)行預(yù)測。在研究與概率論、數(shù)理統(tǒng)計(jì)相關(guān)的問題的過程中,我們需要首先分析數(shù)據(jù)的特征,選擇合適的模型,對數(shù)據(jù)的特征進(jìn)行深入的分析,從而研究隨機(jī)事件的發(fā)生規(guī)律或某一指標(biāo)的發(fā)展趨勢[2]。

三、正態(tài)分布及其在生活中的應(yīng)用

(一)正態(tài)分布及其特征

正態(tài)分布是最重要的連續(xù)概率分布之一,在自然科學(xué)、工程學(xué)、醫(yī)學(xué)等領(lǐng)域都有著十分廣泛的應(yīng)用。正態(tài)分布是描述生活及生產(chǎn)中一系列連續(xù)概率分布的最常用描述方式。當(dāng)我們以相應(yīng)的統(tǒng)計(jì)值為橫坐標(biāo),以概率為縱坐標(biāo)時(shí),就可以得到這些變量的概率密度函數(shù)圖像。統(tǒng)計(jì)學(xué)研究表明,對于符合正態(tài)分布的變量而言,其概率密度函數(shù)圖像的位置(即平均值)和參數(shù)(即標(biāo)準(zhǔn)差)可能是不同的,但是其一般形狀是幾乎相同的,典型的正態(tài)分布曲線是對稱的鐘形曲線。

正態(tài)分布有著近300年的歷史,一般認(rèn)為,正態(tài)分布的理論發(fā)展始于棣莫弗(de Moivre)。在對二項(xiàng)分布進(jìn)行研究的過程中,棣莫弗對一些情況進(jìn)行了近似。然而,正態(tài)分布理論的發(fā)展較為緩慢,在之后的一個(gè)世紀(jì)中,許多著名的數(shù)學(xué)科學(xué)家嘗試進(jìn)一步探索正態(tài)分布的特征。但是囿于當(dāng)時(shí)的研究條件,他們始終沒有取得較大的進(jìn)展[3]。不過,在不懈的探索中,科學(xué)家已經(jīng)逐漸意識到,生活及生產(chǎn)中的許多變量都服從正態(tài)分布,正態(tài)分布在生物學(xué)、醫(yī)學(xué)、工程學(xué)、經(jīng)濟(jì)學(xué)、金融學(xué)等學(xué)科的研究中都有著十分廣泛的應(yīng)用。根據(jù)正態(tài)分布理論得出的模型非常可靠,能夠解決許多在實(shí)際應(yīng)用中遇到的不確定性問題。

當(dāng)連續(xù)隨機(jī)變量X服從一個(gè)數(shù)學(xué)期望(即均值)為μ、方差為σ^2的正態(tài)分布時(shí),我們可以將其記作X~N(μ,σ^2)。數(shù)學(xué)期望μ決定了其概率密度函數(shù)圖像的位置,其標(biāo)準(zhǔn)差σ決定了分布的幅度,也就是圖像的“高矮胖瘦”。一般而言,從總體采樣時(shí),概率密度函數(shù)圖像的位置與圖像的“高矮胖瘦”沒有必然聯(lián)系。

實(shí)際上,很多研究對象的多項(xiàng)特征都是服從正態(tài)分布的,正態(tài)分布在解釋實(shí)驗(yàn)和觀察結(jié)果中具有不可估量的價(jià)值。正態(tài)分布模型可以很好地對數(shù)據(jù)進(jìn)行擬合,能夠滿足大多數(shù)情況下的統(tǒng)計(jì)學(xué)需求。

拉普拉斯進(jìn)一步發(fā)展了正態(tài)分布理論,他很好地解釋了正態(tài)分布的形成原因。拉普拉斯認(rèn)為,大量的獨(dú)立隨機(jī)變量相加時(shí),會產(chǎn)生一個(gè)量,這個(gè)量一般服從正態(tài)分布。因此,一群人的身高可能是服從正態(tài)分布的。首先,我們可以這樣認(rèn)為,每個(gè)人都是他各個(gè)部分的總和。他的頭顱、軀干、腿腳,共同構(gòu)成了他的身高。如果我們對頭顱、軀干、腿腳本身的長度或高度進(jìn)行研究,就會發(fā)現(xiàn),這些變量可能服從正態(tài)分布,也可能不服從正態(tài)分布,但是,當(dāng)我們將這些隨機(jī)變量相加時(shí),它們的總和往往會具有正態(tài)分布的特征。其次,我們還可以從影響發(fā)育的因素,對身高的正態(tài)分布特征進(jìn)行分析。每個(gè)人的身高都與遺傳因素及環(huán)境因素(如生活習(xí)慣、經(jīng)濟(jì)狀況)相關(guān),在發(fā)育的每個(gè)階段,與其他階段的事件基本不相關(guān)的事件,會對特定個(gè)體的最終身高產(chǎn)生負(fù)面或正面的影響。這些相互獨(dú)立的事件,都有可能影響個(gè)體的身高,因?yàn)槊總€(gè)事件的影響都不太大,這些事件本身的特征幾乎不會體現(xiàn)在身高這一“總和變量”的分布特征中[4]。

由于將總和的各個(gè)分量相加后,變量的“正態(tài)性”更強(qiáng),因此確保總和變量服從正態(tài)分布的條件,比確保各個(gè)變量服從正態(tài)分布的條件更寬松。不過,只有總和的分量具備一定的正態(tài)分布特征,總和才可能具備正態(tài)分布的特征。因此,只能在嚴(yán)格限制的條件下,總和變量才嚴(yán)格服從正態(tài)分布。

(二)正態(tài)分布在生活中的應(yīng)用

我們以生活中的常見場景為例,說明正態(tài)分布在生活中的應(yīng)用。王經(jīng)理承包了一片魚塘,在這片魚塘中,他養(yǎng)了約20000條鯉魚。最近,王經(jīng)理想要統(tǒng)計(jì)魚塘中鯉魚的重量分布情況,從而決定是否進(jìn)行捕撈。他隨機(jī)捕撈了100條鯉魚,并一一稱出了這些鯉魚的重量,并對得到的數(shù)據(jù)進(jìn)行了簡單的分析與處理。經(jīng)過計(jì)算,這100條鯉魚的平均重量是2.5kg,標(biāo)準(zhǔn)差為0.5kg。如何通過這100條鯉魚的重量分布情況,初步估計(jì)池塘中所有鯉魚的重量分布情況呢?在這個(gè)問題中,我們需要首先對自然條件下鯉魚的重量分布規(guī)律進(jìn)行基本的估計(jì),由于池塘中幾乎所有鯉魚都處于完全相同的生長條件下,其重量服從正態(tài)分布。對被抽到的100條鯉魚的重量數(shù)據(jù)進(jìn)行分析時(shí),我們得到了正態(tài)分布的兩個(gè)十分關(guān)鍵的特征數(shù)據(jù)——鯉魚重量的平均值是2.5kg,標(biāo)準(zhǔn)差是0.5kg。如果我們用m表示鯉魚重量這一變量,則我們可以根據(jù)前述分析得到m~N(2.5,0.5^2),因此,我們可以根據(jù)正態(tài)分布的3σ原則,得到池塘中所有鯉魚的重量分布情況:重量介于2 ~ 3kg之間的鯉魚約占總數(shù)的68.27%,也就是約13654條,重量介于1.5 ~ 3.5kg之間的鯉魚約占總數(shù)的95.45%,也就是約19090條,重量介于1 ~ 3kg之間的鯉魚約占總數(shù)的99.73%,也就是約19946條。根據(jù)正態(tài)分布,如果我們隨機(jī)從魚塘中捕一條鯉魚,這條鯉魚的重量應(yīng)介于1.5 ~ 3.5kg之間。

測量誤差也是服從正態(tài)分布的[5]。假設(shè)老師有一個(gè)長度為10cm的零件,他要求同學(xué)們用刻度尺測量零件的長度。多數(shù)同學(xué)得到的結(jié)果都會非常接近10cm,部分同學(xué)的結(jié)果可能有一定的偏差。如果老師要求100個(gè)同學(xué)測量零件的長度,這些同學(xué)的測量誤差應(yīng)當(dāng)服從平均值為0cm的正態(tài)分布,如果這些同學(xué)非常粗心,則測量誤差的標(biāo)準(zhǔn)差較大,其概率分布曲線較為“矮胖”;如果這些同學(xué)較為細(xì)心,則測量誤差的標(biāo)準(zhǔn)差較小,其概率分布曲線較為“高瘦”。

此外,一些氣象學(xué)、工程學(xué)、醫(yī)學(xué)中的變量,也服從正態(tài)分布。需要注意的是,正態(tài)分布模型中的隨機(jī)變量的取值范圍應(yīng)當(dāng)為(-∞,+∞),而這些領(lǐng)域中的變量,如年降水量、血紅蛋白水平等都是非負(fù)值。此外,正態(tài)分布要求變量關(guān)于均值對稱,而與水文相關(guān)的統(tǒng)計(jì)數(shù)據(jù)可能會出現(xiàn)一定程度的偏倚,如果應(yīng)用上述公式直接進(jìn)行處理,可能得不到可靠的結(jié)果。在處理這類數(shù)據(jù)時(shí),我們可能需要應(yīng)用改良的正態(tài)分布模型進(jìn)行分析,才能更好地把握數(shù)據(jù)的規(guī)律,提高分析結(jié)果的準(zhǔn)確性[6]。

四、二項(xiàng)分布及其在生活中的應(yīng)用

二項(xiàng)分布是n個(gè)獨(dú)立的是非試驗(yàn)中成功的次數(shù)的離散型概率分布,也是一種生活中十分常見的概率分布。我們需要特別注意二項(xiàng)分布的應(yīng)用條件。只有這些實(shí)驗(yàn)可以在相同的情況下任意重復(fù)多次,且每次試驗(yàn)都可能得到兩種結(jié)果、每次試驗(yàn)得到這兩種結(jié)果的概率都完全相同時(shí),才能運(yùn)用二項(xiàng)分布的知識對問題進(jìn)行求解。一個(gè)十分典型的例子就是擲硬幣問題。在拋硬幣時(shí),我們只會得到兩種結(jié)果——正面朝上或反面朝上。計(jì)算擲n次硬幣時(shí),有m次正面朝上的概率時(shí),我們就需要應(yīng)用與二項(xiàng)分布相關(guān)的知識。首先,在擲硬幣時(shí),正面、反面朝上的概率均為0.5,即 p = 1-p = 0.5。因此,我們在計(jì)算有m次正面朝上的結(jié)果的概率時(shí),可以這樣進(jìn)行計(jì)算:P (m) = C_n^m*pm*(1-p)n-m = C_n^m*0.5n。在計(jì)算新生兒出生率、彩票中獎率時(shí),我們都需要用到二項(xiàng)分布的知識。需要注意的是,如果各次試驗(yàn)結(jié)果之間并不是相互獨(dú)立的,而是有著一定的聯(lián)系,那么我們不能應(yīng)用正態(tài)分布來分析出現(xiàn)某一結(jié)果的概率。

五、概率論與數(shù)理統(tǒng)計(jì)的局限性

目前,概率論及數(shù)理統(tǒng)計(jì)的計(jì)算方法已經(jīng)非常成熟,其在許多領(lǐng)域的應(yīng)用都十分廣泛。不過,目前,我們對概率論的認(rèn)識實(shí)際上是非常有限的。在預(yù)測隨機(jī)過程的結(jié)果的過程中,我們實(shí)際上很難高效地得出可靠的結(jié)論。在實(shí)踐中,許多依照當(dāng)前理論得出的計(jì)算結(jié)果并不可信。即使應(yīng)用計(jì)算機(jī)技術(shù)輔助計(jì)算或模擬隨機(jī)過程,也可能得不到非常貼合實(shí)際的模型。如何提高理論模型的準(zhǔn)確性及預(yù)測性,是數(shù)學(xué)家面臨的十分關(guān)鍵的問題。例如,混合模型一直是統(tǒng)計(jì)學(xué)家的挑戰(zhàn),無論是初學(xué)者,實(shí)踐者還是理論家,都無法很好地解釋這個(gè)模型的原理。此外,我們很難根據(jù)實(shí)際情況改造混合模型,使之更符合應(yīng)用的要求。其實(shí),還存在許多類似的“未知模型”,我們雖然了解這些模型的表達(dá)式,卻幾乎無法將其應(yīng)用于實(shí)際生活中,這是一個(gè)非常嚴(yán)重的問題。如何提高模型的預(yù)測性,是一個(gè)十分關(guān)鍵的問題。我們應(yīng)當(dāng)注意將理論與實(shí)踐相結(jié)合。在建立模型后,應(yīng)當(dāng)根據(jù)實(shí)際結(jié)果,進(jìn)行回歸分析,關(guān)注統(tǒng)計(jì)數(shù)據(jù)與模型預(yù)測值之間的差異,從而不斷調(diào)整模型,使模型更加貼合實(shí)際。這是非常重要的。只有不斷調(diào)整所建立的模型,才有可能突破概率論的局限性,使得到的結(jié)論更加可靠。

結(jié)語:概率論與數(shù)理統(tǒng)計(jì)是分析隨機(jī)事件及隨機(jī)過程的利器。許多研究人員從理論和應(yīng)用的角度對其進(jìn)行了研究。他們不斷發(fā)展概率理論,改進(jìn)數(shù)理統(tǒng)計(jì)方法,使模型更加貼合實(shí)際。利用這些模型,我們可以高效地對隨機(jī)事件及隨機(jī)過程的結(jié)果進(jìn)行預(yù)測,從而得到可靠的結(jié)論。在應(yīng)用概率論及數(shù)理統(tǒng)計(jì)知識的過程中,我們可能需要首先分析實(shí)際情況的特征,從而應(yīng)用適合這一情況的模型進(jìn)行預(yù)測,否則,預(yù)測的結(jié)果將不夠可靠。

猜你喜歡
二項(xiàng)分布數(shù)理統(tǒng)計(jì)概率論
二項(xiàng)分布與超幾何分布的區(qū)別與聯(lián)系
深度剖析超幾何分布和二項(xiàng)分布
概率與統(tǒng)計(jì)(1)——二項(xiàng)分布與超幾何分布
淺談《概率論與數(shù)理統(tǒng)計(jì)》課程的教學(xué)改革
二項(xiàng)分布參數(shù)的E-Bayes估計(jì)及其應(yīng)用
論《概率論與數(shù)理統(tǒng)計(jì)》教學(xué)改革與學(xué)生應(yīng)用能力的培養(yǎng)
財(cái)經(jīng)類院校概率論與數(shù)理統(tǒng)計(jì)教學(xué)改革的探索
多媒體技術(shù)在《概率論與數(shù)理統(tǒng)計(jì)》教學(xué)中的應(yīng)用
包头市| 民丰县| 舞钢市| 都江堰市| 徐闻县| 珲春市| 凉城县| 美姑县| 文成县| 思茅市| 宝山区| 马尔康县| 宁晋县| 邳州市| 开平市| 五家渠市| 芜湖县| 治县。| 贞丰县| 吉隆县| 类乌齐县| 普定县| 郸城县| 三明市| 东乌珠穆沁旗| 上虞市| 香港 | 巩义市| 遵义县| 永泰县| 铜梁县| 鲜城| 保康县| 云南省| 浦江县| 曲水县| 大庆市| 西峡县| 鄄城县| 鹿邑县| 濮阳县|