国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

次序統(tǒng)計(jì)量概率分布近似計(jì)算

2020-01-09 04:58王芝皓侯震梅竇燕
關(guān)鍵詞:次序直方圖概率

王芝皓, 侯震梅, 竇燕

(1.新疆財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)與信息學(xué)院, 新疆 烏魯木齊 830012 2.新疆財(cái)經(jīng)大學(xué) 新疆社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)研究中心, 新疆 烏魯木齊 830012)

通過(guò)樣本對(duì)總體進(jìn)行推斷時(shí), 次序統(tǒng)計(jì)量[1]是常用的統(tǒng)計(jì)量之一, 其不僅是充分統(tǒng)計(jì)量, 而且樣本的分位數(shù)、極差等統(tǒng)計(jì)量都是由次序統(tǒng)計(jì)量得出的, 因此研究次序統(tǒng)計(jì)分布問(wèn)題很有意義。 但次序統(tǒng)計(jì)量的分布不易計(jì)算, 同時(shí)在討論次序統(tǒng)計(jì)量時(shí)往往會(huì)忽略隨機(jī)變量的類型, 即是離散型還是連續(xù)型。 注意到離散型次序統(tǒng)計(jì)量的觀測(cè)會(huì)出現(xiàn)有結(jié)的現(xiàn)象, 而連續(xù)型次序統(tǒng)計(jì)量一般不會(huì)出現(xiàn)結(jié), 因此估計(jì)分布的方法應(yīng)該有所區(qū)別。

直方圖估計(jì)、核密度估計(jì)及MC算法是現(xiàn)階段應(yīng)用較廣的估計(jì)方法[2-4], 本文采用該方法研究次序統(tǒng)計(jì)量分布的估計(jì)。 首先, 本文回顧了不同類型次序統(tǒng)計(jì)量分布的常用形式。 其次, 給出次序統(tǒng)計(jì)量分布函數(shù)的經(jīng)驗(yàn)分布估計(jì)。 當(dāng)隨機(jī)變量是離散時(shí), 給出概率質(zhì)量的直方估計(jì)量; 當(dāng)隨機(jī)變量是連續(xù)時(shí), 給出概率密度的核密度估計(jì), 并對(duì)三種估計(jì)量的無(wú)偏性及估計(jì)精度進(jìn)行了討論, 即研究了估計(jì)量的期望、偏差和方差。 最后, 為避免復(fù)雜的計(jì)算, 根據(jù)推導(dǎo)的估計(jì)量, 給出了基于MC算法的次序統(tǒng)計(jì)量分布近似計(jì)算的算法, 并以Poisson與Gamma分布為例給出了模擬結(jié)果。

1 次序統(tǒng)計(jì)量的分布

樣本數(shù)據(jù)有離散與連續(xù)之分, 在樣本觀測(cè)過(guò)程中, 離散型次序統(tǒng)計(jì)量在某一次序上的觀測(cè)值可能會(huì)與其他次序的相同, 但連續(xù)型次序統(tǒng)計(jì)量幾乎處處保證每一個(gè)次序上的觀測(cè)都不相同, 根據(jù)此特點(diǎn)分別討論離散與連續(xù)兩種類型次序統(tǒng)計(jì)量的分布。

定理1[1]設(shè)X1,X2,…,Xn是來(lái)自某總體容量為n的樣本, 總體的分布函數(shù)為FX(x), 則第k個(gè)次序統(tǒng)計(jì)量X(k)的分布函數(shù)FX(k)(x)為

FX(k)(x)=P(X(k)≤x)=

當(dāng)隨機(jī)變量為離散型時(shí),其概率質(zhì)量函數(shù)為

P(X(k)=xi)=

[FX(xi-1)]j[1-FX(xi-1)]n-j}

當(dāng)隨機(jī)變量為連續(xù)型時(shí),其概率密度函數(shù)為

上述定理表明在研究次序統(tǒng)計(jì)量分布時(shí)可從分布函數(shù)、概率質(zhì)量函數(shù)或概率密度函數(shù)三個(gè)方面進(jìn)行討論, 本文將對(duì)應(yīng)定理1的內(nèi)容給出一種新的對(duì)應(yīng)每種分布的估計(jì)方法。

2 次序統(tǒng)計(jì)量分布的估計(jì)及其性質(zhì)

假設(shè)某一研究對(duì)象的總體中能夠獲得任意多的偽隨機(jī)數(shù), 那么在估計(jì)次序統(tǒng)計(jì)的分布時(shí),就可用頻率逼近概率的過(guò)程去獲得第k個(gè)次序統(tǒng)計(jì)量分布的估計(jì)。 具體地, 經(jīng)驗(yàn)分布函數(shù)作為分布函數(shù)的估計(jì), 離散型隨機(jī)變量可用直方圖去估計(jì)其概率質(zhì)量函數(shù), 連續(xù)型隨機(jī)變量可用核密度去估計(jì)其概率密度函數(shù)。

2.1 次序統(tǒng)計(jì)量分布函數(shù)的估計(jì)

對(duì)任意類型的隨機(jī)變量, 記第k個(gè)次序統(tǒng)計(jì)量的分布函數(shù)為

FX(k)(x)=E[I(X(k)≤x)]

那么X(k)的經(jīng)驗(yàn)分布函數(shù)的矩估計(jì)為

其期望與方差分別為:

m→

2.2 離散型次序統(tǒng)計(jì)量概率質(zhì)量的估計(jì)

當(dāng)X為離散隨機(jī)變量, 可能取值x1

fX(k)(xi)=P(X(k)=xi)

直方圖估計(jì)量[5-6]為

m→

2.3 連續(xù)型次序統(tǒng)計(jì)量概率密度的估計(jì)

當(dāng)X為連續(xù)隨機(jī)變量, 記X(k)的概率密度函數(shù)為fX(k)(x), 核密度估計(jì)量[5-6]為

式中:h表示窗寬[7-8];K(·)是核函數(shù), 本文選用Gaussian核, 即

將fX(k)(u) 在x點(diǎn)二階Taylor展開(kāi)可得

那么偏差可分為三個(gè)部分計(jì)算:

因此:

同理, 在計(jì)算偏差中運(yùn)用Taylor展開(kāi)可得

mh→

在上述計(jì)算過(guò)程中, 對(duì)于窗寬的選取文獻(xiàn)[8-9]有更多的討論, 本文選用Silverman's Rule of Thumb[4]的方法確定窗寬:

易知, 當(dāng)模擬樣本容量m→時(shí), 估計(jì)量的方差會(huì)收斂到0, 核密度的偏差也會(huì)收斂到0,表明核密度估計(jì)是概率密度函數(shù)的相合估計(jì)。 因此只要m足夠大就可以得到精度很高的估計(jì), 而且在MC算法中是較為容易實(shí)現(xiàn)的。

3 次序統(tǒng)計(jì)量分布計(jì)算的MC算法

根據(jù)第2節(jié)得到三種估計(jì)量的期望、方差及偏差可知, 在可獲得重復(fù)隨機(jī)樣本時(shí), 運(yùn)用MC算法去近似計(jì)算X(k)分布, 不但可以得到較高精度的估計(jì)量而且還避免了復(fù)雜推導(dǎo)與抽象的理解。 次序統(tǒng)計(jì)量分布估計(jì)的MC算法為:

設(shè)X~FX(x|θ) ,固定θ=θ0,則對(duì)j=1,2,…,m:

(2)離散時(shí),直方圖估計(jì)量為

(3)連續(xù)時(shí),核密度估計(jì)量為

為進(jìn)一步說(shuō)明該算法的有效性, 分別以Possion與Gamma分布為例給出具體的結(jié)果。

例1 設(shè)X1,…,X20是來(lái)自總體Possion(λ=3)容量為20的樣本,由式(1)知第3次序統(tǒng)計(jì)量的分布函數(shù)為

那么第3次序統(tǒng)計(jì)量的概率質(zhì)量為

fX(3)(x)=FX(3)(x)-FX(3)(x-1)=

例2 設(shè)X1, …,X20是來(lái)自總體為Gamma(α=3,λ=0.3)容量為20的樣本,密度函數(shù)為

那么第3次序量的分布函數(shù)與概率密度函數(shù)如下:

圖1 Possion經(jīng)驗(yàn)分布估計(jì)(ECDF)與真實(shí)分布(CDF)比較Fig.1 Comparison between estimators of CDF(ECDF)and real CDF of Possion(CDF)

圖2 Possion直方圖估計(jì)(hist)與真實(shí)概率質(zhì)量(prob mass)比較Fig.2 Comparison between estimators of histogram (hist) and real PMF of Possion (prob mass)

圖3 Gamma經(jīng)驗(yàn)分布估計(jì)(ECDF)與真實(shí)分布(CDF)比較Fig3 Comparison between estimators of CDF (ECDF)and real CDF of Gamma(CDF)

圖4 Gamma核密度估計(jì)(KDE)與真實(shí)概率密度(PDF)比較Fig.4 Comparison between kernel density estimation (KDE) and real probability density function(PDF) of Gamma

4 結(jié)論

在次序統(tǒng)計(jì)量分布的討論中, 隨機(jī)變量的類型很重要, 本文針對(duì)不同類型的隨機(jī)變量,給出了次序統(tǒng)計(jì)量分布函數(shù)、概率質(zhì)量函數(shù)及概率密度函數(shù)的相合估計(jì),在此基礎(chǔ)上給出了便于計(jì)算的MC算法。 結(jié)果表明: 首先, MC算法可以避免復(fù)雜的推導(dǎo),若可以得到原始分布的偽隨機(jī)數(shù),那么任意次序統(tǒng)計(jì)量的分布就可估計(jì); 其次,該算法的收斂速度較快而且是穩(wěn)健的, 通過(guò)例子可以看出估計(jì)量具有良好的精度; 最后,該方法可為次序統(tǒng)計(jì)量的其他研究提供一個(gè)可供參考的分布估計(jì)方法。

猜你喜歡
次序直方圖概率
符合差分隱私的流數(shù)據(jù)統(tǒng)計(jì)直方圖發(fā)布
概率統(tǒng)計(jì)中的決策問(wèn)題
概率統(tǒng)計(jì)解答題易錯(cuò)點(diǎn)透視
漢語(yǔ)義位歷時(shí)衍生次序判定方法綜觀
概率與統(tǒng)計(jì)(1)
概率與統(tǒng)計(jì)(2)
Bp-MRI灰度直方圖在鑒別移行帶前列腺癌與良性前列腺增生中的應(yīng)用價(jià)值
基于差分隱私的高精度直方圖發(fā)布方法
生日謎題
中考頻數(shù)分布直方圖題型展示