国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

兩個(gè)廣義伽瑪分布之間的相對(duì)熵及其性質(zhì)

2018-01-13 01:57朱成蓮
統(tǒng)計(jì)與決策 2017年24期
關(guān)鍵詞:伽瑪指數(shù)分布概率密度函數(shù)

朱成蓮

0 引言

1951年,統(tǒng)計(jì)學(xué)家Kullback和Leibler提出了相對(duì)熵的概念,用來(lái)度量?jī)蓚€(gè)分布之間的差異程度,也稱為Kullback-Leibler距離。在數(shù)理統(tǒng)計(jì)中,統(tǒng)計(jì)推斷的一個(gè)重要方面就是從已知樣本去估計(jì)母體的分布,或者推斷分布的特征,對(duì)于同樣的母體分布,當(dāng)用幾種不同的統(tǒng)計(jì)方法獲得了母體的不同估計(jì)分布后,人們往往要對(duì)所求得的分布進(jìn)行比較,為此,統(tǒng)計(jì)學(xué)上引入了許多度量?jī)蓚€(gè)分布差異的方法,如相對(duì)熵,Pearson-χ2距離和全變差距離等,相對(duì)熵應(yīng)用于許多領(lǐng)域,從相對(duì)熵的定義看出,它已經(jīng)不滿足傳統(tǒng)的距離中對(duì)稱性、三角不等式性等條款。盡管如此,由于它確實(shí)能夠在某種程度上刻畫(huà)兩個(gè)密度函數(shù)的差異程度,近年來(lái),概率密度函數(shù)的相對(duì)熵在學(xué)術(shù)界備受關(guān)注,人們?cè)谟懻摌O值分布的大樣本問(wèn)題、分布函數(shù)估計(jì)的收斂性、用不同算法借補(bǔ)有缺失數(shù)據(jù)的分布估計(jì)的收斂速度等問(wèn)題時(shí),都使用相對(duì)熵[1-5]。本文將相對(duì)熵定義進(jìn)行了推廣,定義了最小相對(duì)熵。從定義形式上看,并不難理解,最小相對(duì)熵是將兩個(gè)概率密度函數(shù)間的相對(duì)熵求較小值,但它的意義在于克服了相對(duì)熵沒(méi)有對(duì)稱性的缺陷。本文計(jì)算了兩個(gè)廣義伽瑪分布之間相對(duì)熵及最小相對(duì)熵。作為廣義伽瑪分布的特例,推導(dǎo)出兩個(gè)伽瑪分布、Weibull分布、Rayleigh分布、正態(tài)分布、指數(shù)分布之間的相對(duì)熵及最小相對(duì)熵。

1 相關(guān)定義及其性質(zhì)

則稱隨機(jī)變量X服從廣義伽瑪分布,記為GΓ()α,β,λ。

由定義1可知,當(dāng)α,β取一些特殊值時(shí),得到以下一些特例:

定義1[6]:如果隨機(jī)變量X的概率密度函數(shù)為:

一般記為Γ(α,λ)。伽瑪分布中,若α為整數(shù)就是Erlang分布;伽瑪分布中,α=n(1)當(dāng)β=1時(shí),得到伽瑪分布,密度函數(shù)為:2,λ=2就是 χ2分布。(2)當(dāng)α=1時(shí),得到Weibull分布,密度函數(shù)為:

一般記為W(β,λ)。

(3)當(dāng) α=1,β=2,λ=2σ 時(shí),得到 Rayleigh分布,密度函數(shù)為:

一般記為 R(σ)。

(4)當(dāng)α=1,β=1時(shí),得到指數(shù)分布,密度函數(shù)為:

一般記為 E(λ)。

一般記為 N(0,σ2)。

定義 2[7]:設(shè) f(x),g(x)是兩個(gè)密度函數(shù),Sf和Sg分f(x) dx<+∞時(shí),則稱這個(gè)值是g(x)到f(x)的相對(duì)熵,又稱為Kullback-Leibler距離,記為d( f ,g )。

當(dāng)f(x),g(x)都是離散型隨機(jī)變量分布時(shí),定義2中的積分需換成相應(yīng)的求和記號(hào)。

定義3:設(shè)兩個(gè)隨機(jī)變量 X1,X2的概率密度函數(shù)分別為 f(x)、g(x),并且 f(x)>0,g(x)>0,若 d( f ,g ) 和d(g,f)都存在,記 dmin(f,g)=min{d(f,g),d(g,f)} ,則稱dmin(f,g)為 f(x),g(x)兩個(gè)密度函數(shù)之間的最小相對(duì)熵。

由定義2和定義3易得以下有關(guān)相對(duì)熵的性質(zhì)。

性質(zhì)1:設(shè) f(x)>0,g(x)>0是兩個(gè)概率密度函數(shù),則:

(1)非負(fù)性 d(f,g)≥0

(3)d(f,g)=0?E(lnf(x))=E(lng(x))?f(x)=g(x)=0

(4)d(f,g1)-d(f,g2)=

從性質(zhì)1的(1)、(3)知相對(duì)熵確實(shí)能刻畫(huà)兩個(gè)分布g(x)與Sf之間的差異程度,但是相對(duì)熵對(duì)稱性,三角形不等式未必成立。

性質(zhì)2:設(shè) f(x)>0,g(x)>0是兩個(gè)概率密度函數(shù),

則:

從性質(zhì)2可以看出,最小相對(duì)熵與相對(duì)熵相比較,最小相對(duì)熵除了具有相對(duì)熵的性質(zhì)外,還具有對(duì)稱性、三角不等式性質(zhì)。

引理1:如果隨機(jī)變量X的概率密度函數(shù)為:

則:

證明:計(jì)算積分

由式(1)可得隨機(jī)變量X的K階矩為:

當(dāng)式(1)中 s=0時(shí),得到:

對(duì)式(2)兩邊關(guān)于α求導(dǎo)得:

因此:

2 兩個(gè)廣義伽瑪分布之間的相對(duì)熵

定理 1:設(shè) f(x)、g(x)分別是廣義伽瑪分布GΓ(α,β,λ1) 、GΓ(α,β,λ2)的密度函數(shù),則:

證明:根據(jù)定義2可得:

所以:

從上式可看出,當(dāng) λ1→λ2時(shí),d(f,g)→0

定理 2:設(shè)f(x ) 、g(x)分別是廣義伽瑪分布GΓ(α,β,λ1) 、GΓ(α,β,λ2)的密度函數(shù),則:

定理 3:設(shè)f(x ) 、g(x)分別是廣義伽瑪分布GΓ(α,β,λ1) 、GΓ(α,β,λ2)的密度函數(shù),則:

證明:由定理1和定理2可知:

構(gòu)造函數(shù):

可得:

易知 f(t)為(0,+∞ )單調(diào)遞增函數(shù)。且當(dāng)t=1時(shí):

故:

因此:

且當(dāng) λ1→λ2時(shí),d(f,g)→0 。

定理4:設(shè) f(x)、g(x)分別是廣義伽瑪分布GΓ(α1,β,λ)、GΓ(α2,β,λ)的密度函數(shù),則:′

證明:根據(jù)相對(duì)熵的定義得:

根據(jù)引理1結(jié)論可得:

所以:

由上式可知,d( f ,g )與λ、β無(wú)關(guān),兩個(gè)密度函數(shù)的相近程度由參數(shù)α決定,當(dāng)α1→α2時(shí),d( f ,g )→0。

定理 5:設(shè) f(x)、g(x)分別是廣義伽瑪分布GΓ(α1,β,λ)、GΓ(α2,β,λ)的密度函數(shù),當(dāng) β ,λ確定時(shí),

且當(dāng)α1→α2時(shí),d( f ,g )→0。

定理 6:設(shè) f(x)、g(x)分別是廣義伽瑪分布GΓ(α,β1,λ)、GΓ(α,β2,λ)的密度函數(shù),當(dāng) α ,λ確定時(shí),

證明:根據(jù)相對(duì)熵的定義可得:

分別計(jì)算上式三個(gè)積分,根據(jù)引理1結(jié)論可得:

所以:

從上式可看出,d( f ,g ) 與 λ無(wú)關(guān),當(dāng) β1→β2時(shí),d(f,g)→0 。

定理 7:設(shè)f(x ) 、g(x)分別是廣義伽瑪分布GΓ(α,β1,λ)、GΓ(α,β2,λ)的密度函數(shù),當(dāng) α ,λ確定時(shí),則:

且當(dāng) β1→β2時(shí),d(f,g)→0 。

由以上定理可得以下推論:

推論1:設(shè) f(x)、g(x) 分別是伽瑪 Γ(α,λ1) Γ(α,λ2)的密度函數(shù),則:

且當(dāng) λ1→λ2時(shí),d(f,g)→0

推論2:設(shè) f(x)、g(x) 分別是伽瑪 Γ(α,λ1) Γ(α,λ2)的密度函數(shù),則:

且當(dāng) λ1→λ2時(shí),d(f,g)→0

推論3:設(shè) f(x)、g(x )分別是Weibull分布W(β,λ1)、W(β,λ2)的密度函數(shù),則:

且當(dāng) λ1→λ2時(shí),d(f,g)→0。

推論4:設(shè) f(x)、g(x )分別是Weibull分布W(β,λ1)、W(β,λ2)的密度函數(shù),則:

且當(dāng) λ1→λ2時(shí),d(f,g)→0 。

推論5:設(shè) f(x)、g(x) 分別是 Rayleigh分布 R(σ1)、R(σ2)的密度函數(shù),則:

且當(dāng)σ1→σ2時(shí),d(f,g)→0。

推論6:設(shè) f(x)、g(x) 分別是 Rayleigh分布 R(σ1)、R(σ2)的密度函數(shù),則:

且當(dāng)σ1→σ2時(shí),d(f,g)→0。

且當(dāng)σ1→σ2時(shí),d(f,g)→0。

且當(dāng)σ1→σ2時(shí),d(f,g)→0。

推論9:設(shè) f(x)、g(x) 分別是指數(shù)分布 E(λ1)、E(λ2)的密度函數(shù),則:

且當(dāng) λ1→λ2時(shí),d(f,g)→0 。

推論10:設(shè) f(x)、g(x) 分別是指數(shù)分布 E(λ1)、E(λ2)的密度函數(shù),則:且當(dāng) λ1→λ2時(shí),d(f,g)→0 。

3 幾個(gè)距離間的關(guān)系

定義4[7]:設(shè) f(x),g(x)是兩個(gè)密度函數(shù),Sf和Sg分離,記為 d2(f,g)。

定義 5[7]:設(shè) f(x),g(x)是兩個(gè)密度函數(shù),稱V2(f,g)=suAp|F(A)-G(A)|是f(x)到g(x)的全變差距離,其中

定理8[7]:以下討論的距離都存在,則:

(1)當(dāng) f(x)≥g(x)時(shí),d(f,g)≤d2(g,f)。

(2)V2(f,g)≤ d2(f,g)。

有 d(f,g),d(g,f)及 min{d(f,g),d(g,f)} 的定義易得如下定理。

定理9:若以下討論的距離都存在,則:

(1)min{d(f,g),d(g,f)} ≤d(f,g)≤ max{d(f,g),d(g,f)} ;

(2)當(dāng) f(x)≥g(x)時(shí) d(f,g)≥d(g,f),且 d(f,g)≥(d(f,g)+d(g,f))≥d(g,f) ;當(dāng)f(x)≤g(x) 時(shí) d(f,g)≤d(g,f),且 d(f,g)≤(d(f,g)+d(g,f))≤d(g,f)。

從定理 9中的式(1)還可以看出,當(dāng) min{d(f,g),d(g,f)}充分小時(shí),必有d(f,g)充分小。用最小Kullback-Leibler距離min{d(f,g),d(g,f)} 來(lái)比較兩個(gè)密度函數(shù)比用d(f,g)刻畫(huà)要合理。

4 結(jié)束語(yǔ)

相對(duì)熵用來(lái)度量?jī)蓚€(gè)分布之間的差異程度,相對(duì)熵越小,表示兩個(gè)分布之間越接近,反之,相差越大,當(dāng)兩個(gè)分布相同時(shí),相對(duì)熵為零。本文計(jì)算了兩個(gè)廣義伽瑪分布之間的相對(duì)熵,得到了公式。根據(jù)參數(shù)的大小,非常容易度量?jī)蓚€(gè)廣義伽瑪分布之間接近程度,或根據(jù)兩個(gè)廣義伽瑪分布之間接近程度的要求,由公式快捷選擇參數(shù)。從相對(duì)熵的定義看出,它不滿足傳統(tǒng)的距離中對(duì)稱性、三角不等式性等條款。本文定義了最小相對(duì)熵。從定義形式上看,并不難理解,最小相對(duì)熵是將兩個(gè)概率密度函數(shù)間的相對(duì)熵求較小值,但它的意義在于克服了相對(duì)熵沒(méi)有對(duì)稱性的缺陷。并且最小相對(duì)熵充分小時(shí),必有相對(duì)熵充分小。用最小相對(duì)熵來(lái)度量?jī)蓚€(gè)密度函數(shù)比用相對(duì)熵刻畫(huà)更為合理。本文還推導(dǎo)出兩個(gè)伽瑪分布、Weibull分布、Rayleigh分布、正態(tài)分布、指數(shù)分布之間的相對(duì)熵及最小相對(duì)熵。為實(shí)際應(yīng)用,提供許多方便。

[1]Robert G O,Shau S K.Updating Schemes,Correlation Structure,Blocking and Parameterization for the Gibbs Sampler[J].J R Statist Soc B,1997,(59).

[2]Liu S J,Wong W H,Kong A.Correlation Structure and Convergence Rate of the Gibbs Sampler with Various Scans[J].J R Statist Soc B,1995,(57).

[3]Reiss R D.Approximate Distributions of Order Statistics[M].New York:Springer,1980.

[4]Whittaker J.Graphical Models in Applied Multivariate Statistics[M].Wiley:Chichester,1990.

[5]李開(kāi)燦,孟朝玲.χ2分布、t分布和F分布的一致漸進(jìn)正態(tài)性[J].北京印刷學(xué)院學(xué)報(bào),2004,12(3).

[6]金秀巖.廣義Γ分布的Pearson-χ2距離及其漸近性[J].西南師范大學(xué)學(xué)報(bào):自然科學(xué)版,2008,33(4).

[7]李開(kāi)燦.Pearson-χ2距離的若干性質(zhì)[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2003,33(1).

猜你喜歡
伽瑪指數(shù)分布概率密度函數(shù)
冪分布的有效估計(jì)*
數(shù)字傳媒研究(2021年1期)2021-03-06
指數(shù)分布的現(xiàn)實(shí)意義
已知f(x)如何求F(x)
基于變構(gòu)模型的概率密度函數(shù)的教學(xué)探索
伽瑪能譜測(cè)量中Nal(Tl)探測(cè)器的性能測(cè)試
廣義逆指數(shù)分布元件的可靠性分析?
特征函數(shù)在概率論及數(shù)理統(tǒng)計(jì)中的簡(jiǎn)單應(yīng)用
伽瑪射束立體定向放射治療質(zhì)量控制
非高斯隨機(jī)分布系統(tǒng)自適應(yīng)控制算法的研究