国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

改進二項分布的性質(zhì)及其應(yīng)用

2016-02-11 06:37徐鵬鵬蘇本躍
關(guān)鍵詞:二項分布泊松安慶

徐鵬鵬,蘇本躍

(安慶師范大學計算機與信息學院安徽省智能感知與計算重點實驗室,安徽安慶246133)

改進二項分布的性質(zhì)及其應(yīng)用

徐鵬鵬,蘇本躍

(安慶師范大學計算機與信息學院安徽省智能感知與計算重點實驗室,安徽安慶246133)

二項分布是一種具有廣泛用途的離散型隨機變量的概率分布。針對二項分布應(yīng)用的局限性,提出一種基于二項分布的改進模型,即通過引入控制參數(shù),擴展了二項分布的適用范圍,使其處理的數(shù)據(jù)來源既能滿足二項分布的特點,又能滿足數(shù)據(jù)集自身的相關(guān)特性。最后通過構(gòu)造矩方程和極大似然方程可求出估計參數(shù)。

計數(shù)模型;離散型概率分布;改進二項分布;過離散現(xiàn)象

在對計數(shù)模型的探究中,經(jīng)常會遇到計數(shù)資料符合二項分布的特點,但計數(shù)值中卻存在大量零值,使數(shù)據(jù)的期望小于方差值。此時,二項分布對該計數(shù)資料的分析就存在局限性,需在二次項分布的基礎(chǔ)上構(gòu)建改進分布模型。

1 二項分布

隨機變量X在n次試驗中,每次試驗有且僅有兩種對立結(jié)果A與A,且每次A出現(xiàn)的概率為P(A)=p,P(A)=1-p=q,那么在n次獨立試驗中,該事件發(fā)生k次的概率為

當X~B(n,p)中參數(shù)n很大,p很小,而np大小適中(np≤10)時,二項分布可用泊松分布近似[1],即

當n→∞時,近似效果越佳。

當np≥5且np(1-p)≥5時,通常使用正態(tài)分布(Normal Distribution)來替代二項分布,即

(2)式就是著名的棣莫弗-拉普拉斯中心極限定理。當n→∞時,二項分布可以用正態(tài)分布來近似,即二項分布的正態(tài)逼近。由于是用正態(tài)分布近似二項分布,即用連續(xù)分布來近似離散分布,為減少近似誤差,通常將區(qū)間由[a,b]增加到[a-0.5,b+0.5]來替代[2],即

在(3)式中p∈(0.1,0.9)時,近似效果較為理想。

當n很大時,一般都用正態(tài)分布來近似計算二項分布,但是當np又較?。ū绕餹來說很?。?,那么用泊松分布近似計算更簡單些,畢竟泊松分布跟二項分布一樣都是離散型分布[3]。

2 改進的二項分布

設(shè)離散型隨機變量K服從的分布為

為方便計算,通常選擇將[n+αk]取整,參數(shù)α為全局參數(shù),且p∈[0,1]。當α=0時,改進二項分布就退化為二項分布;當α=p時,改進二項分布即變?yōu)樨摱椃植?。由概率的正則性公理可知

二項分布的期望np大于方差np(1-p),一般只適用于分布較為集中的數(shù)據(jù)集[4]。改進的二項分布通過引入?yún)?shù)α增加了概率分布的彈性,在其期望np(1-αp)-1,方差np(1-p)(1-αp)-3中得以體現(xiàn),通過調(diào)節(jié)參數(shù)α,可以應(yīng)對不同數(shù)據(jù)結(jié)構(gòu),拓寬了應(yīng)用場景。

實驗表明,一般當p<0.1時,甚至n很小,都會有很好的近似效果。例如當p=0.1,n=2,α<<0.1時,如表1所示。

表1 改進二項分布與泊松的擬合逼近

2.1 構(gòu)造矩方程

2.2 構(gòu)造極大似然方程

設(shè)隨機變量X服從(4)式定義的改進二項分布,從總體X中選取一個大小為m的樣本x1,x2,…xm,則其對數(shù)似然函數(shù)為

3 結(jié)束語

綜上所述,在構(gòu)造的改進二項分布中,當參數(shù)α=0時,該模型就退化成二項分布,此時E(X)=np,方差Var(X)=np(1-p),全局參數(shù)α不僅可以控制分布的期望與方差,同時還可用來刻畫數(shù)據(jù)結(jié)構(gòu)。當α<或α>1時,則E(X)≥Var(X),此時就可以處理分布相對集中的數(shù)據(jù)結(jié)構(gòu),即處理存在欠離散(Under-Dispersion)現(xiàn)象的數(shù)據(jù);當α時,則E(X)<Var(X),此時改進分布就可以處理存在過離散[5](Over-Dispersion)現(xiàn)象的數(shù)據(jù)了。最后,通過構(gòu)造適當?shù)木胤匠袒驑O大似然方程可估計出參數(shù)α的值。

針對數(shù)據(jù)源本身符合二項分布的特點,但數(shù)據(jù)集內(nèi)部隱含的信息(如期望,方差)又不滿足二項分布的特征,此時使用二項分布來處理顯然不合理。通過構(gòu)造改進二項分布,使其處理的數(shù)據(jù)既能滿足二項分布的特點,又能滿足數(shù)據(jù)自身的分布特性。所以,通過參數(shù)的調(diào)節(jié)可以增加模型的使用范圍和廣度,同時也拓展了應(yīng)用的空間與場合。

[1]周概容.概率論與管理統(tǒng)計基礎(chǔ)[M].上海:復旦大學出版社,2004.

[2]魏振軍.概率論與數(shù)理統(tǒng)計三十三講[M].北京:中國統(tǒng)計出版社,2013.

[3]于洋.淺析二項分布、泊松分布和正態(tài)分布之間的關(guān)系[J].企業(yè)科技與發(fā)展,2008(20):108-110.

[4]范文正,梁亞民.集中與離散是數(shù)據(jù)集合的本質(zhì)[J].統(tǒng)計教育, 2006(2):27-28.

[5]BAKSH M F,B?HNING D,LERDSUWANSRIR.An extension of an over-dispersion test for countdata[J].Computational Statistics& Data Analysis,2011,55(1):466-474.

Improved Binomial Distribution Modeland Its Properties

XU Peng-peng,SU Ben-yue
(School of Computer and Information,University Key Laboratory of Intelligent Perception and Computing of Anhui Province,Anqing Normal University,Anqing,Anhui246133,China)

Probability of binomial distribution is a broad use of discrete distribution of random variables.Aiming at the limitations for application of the binomial distribution,an improved model is proposed,which is based on binomial distribution. The scope of binomial distribution is expanded by introducing the control parameters,which makes the processed data source meet the binomial distribution characteristics as well as their own relevant characteristics of the data sets.Finally,the values of the parameters are obtained by constructing themoment equation or themaximum likelihood parameter estimation equation.

count model;the discrete probability distribution;improved binomial distribution;over-dispersion phenomenon

TP3

A

1007-4260(2016)04-0011-03

時間:2017-1-3 17:19

http://www.cnki.net/kcms/detail/34.1150.N.20170103.1719.004.html

2016-04-19

國家自然科學基金(11471093),安徽省教育廳自然科學研究項目(KJ2014A142),國家統(tǒng)計局計劃項目(2013LY080)和安徽省高??蒲衅脚_創(chuàng)新團隊項目。

徐鵬鵬,男,安徽六安人,安慶師范大學計算機與信息學院碩士研究生,研究方向為統(tǒng)計學習與預(yù)測、數(shù)據(jù)挖掘等。

E-mail:1273611645@qq.com

10.13757/j.cnki.cn34-1150/n.2016.04.004

猜你喜歡
二項分布泊松安慶
基于泊松對相關(guān)的偽隨機數(shù)發(fā)生器的統(tǒng)計測試方法
安慶師范大學優(yōu)秀校友
二項分布與超幾何分布的區(qū)別與聯(lián)系
魚殤
一類帶有兩個參數(shù)的臨界薛定諤-泊松方程的多重解
安慶師范大學優(yōu)秀校友
深度剖析超幾何分布和二項分布
概率與統(tǒng)計(1)——二項分布與超幾何分布
帶有雙臨界項的薛定諤-泊松系統(tǒng)非平凡解的存在性
二項分布參數(shù)的E-Bayes估計及其應(yīng)用
合作市| 武功县| 北安市| 宁德市| 榆树市| 砀山县| 寿阳县| 古浪县| 马尔康县| 新化县| 乌拉特后旗| 郎溪县| 太白县| 竹溪县| 珲春市| 贞丰县| 延吉市| 象州县| 久治县| 巴彦县| 贵溪市| 茶陵县| 宁都县| 井冈山市| 陆川县| 安顺市| 当阳市| 凤阳县| 扎兰屯市| 高碑店市| 娱乐| 乃东县| 广州市| 营口市| 五峰| 醴陵市| 白沙| 宁武县| 泰安市| 南木林县| 淮安市|