国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

經(jīng)驗(yàn)特征函數(shù)在偏正態(tài)分布中的應(yīng)用

2019-10-14 05:34侯格格
關(guān)鍵詞:估計(jì)值樣本量正態(tài)分布

侯格格

(溫州大學(xué)數(shù)理與電子信息工程學(xué)院,浙江溫州 325035)

在實(shí)際問題處理中,會(huì)經(jīng)常遇到大量非對(duì)稱數(shù)據(jù),若簡(jiǎn)單地假設(shè)這些數(shù)據(jù)的模型誤差服從正態(tài)分布,通過數(shù)據(jù)分析,往往會(huì)發(fā)現(xiàn)這些數(shù)據(jù)具有多峰性、有偏性,并不完全服從正態(tài)分布.此時(shí),可以使用偏正態(tài)分布處理非對(duì)稱數(shù)據(jù).偏正態(tài)分布是正態(tài)分布的一種推廣,最早出現(xiàn)于文獻(xiàn)[1],由Azzalini[2]命名,它既具有正態(tài)分布的特殊性質(zhì)又含有偏度的分布.設(shè)X是服從一元偏正態(tài)分布的隨機(jī)變量,其密度函數(shù)為:fX(x;α)=2 ?φ(x) ?Φ(αx),其中φ(x), Φ(x)分別是標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)和標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù),α為任意實(shí)數(shù),被稱為形狀參數(shù),它控制密度函數(shù)的形狀.當(dāng)α=0時(shí),分布函數(shù)偏度為零,X~N(0,1),分布函數(shù)的偏度隨著α的增加而增加,當(dāng)α→∞時(shí),分布函數(shù)收斂于半正態(tài)密度函數(shù),在實(shí)際應(yīng)用時(shí),需要加入位置與尺度函數(shù).考慮線性變換Y=ωX+ξ,Y的密度函數(shù)為:

稱Y服從偏正態(tài)分布,記為Y~SN(ξ,ω2,α),ξ,ω,α分別是位置參數(shù)、尺度參數(shù)、形狀參數(shù),令θ=(ξ,ω,α)為待估參數(shù).α=0時(shí),Y~N(ξ,ω2).

常見參數(shù)估計(jì)方法有矩估計(jì)、極大似然估計(jì)、M-估計(jì)等.對(duì)于單參數(shù)或者兩個(gè)參數(shù)估計(jì)問題,容易求出穩(wěn)定解.盡管一元偏正態(tài)分布族具有良好的性質(zhì),但由于其具有三個(gè)參數(shù),求得穩(wěn)定的估計(jì)值較為困難,這是由于:1)當(dāng)α→0時(shí),F(xiàn)isher 信息陣是奇異的;2)α=0是α的輪廓似然函數(shù)的一個(gè)駐點(diǎn),獨(dú)立于觀測(cè)樣本.對(duì)于一元偏正態(tài)分布的三個(gè)參數(shù)的估計(jì)問題,使用極大似然估計(jì)求解時(shí),遇到?jīng)]有顯式解的情況,尤其在小樣本時(shí),極大似然估計(jì)穩(wěn)定性較差,矩估計(jì)與M-估計(jì)求出的估計(jì)值也較差.Azzalini 和Arellano[3]提出了含有懲罰項(xiàng)極大似然估計(jì)的方法,選擇合適的懲罰函數(shù)對(duì)參數(shù)進(jìn)行估計(jì),此估計(jì)方法,當(dāng)樣本量大于200時(shí),參數(shù)估計(jì)值穩(wěn)定,由于形狀參數(shù)α難以估計(jì),當(dāng)n<200,即為小樣本量時(shí),含有懲罰項(xiàng)的極大似然估計(jì)算法是不穩(wěn)定的.

經(jīng)驗(yàn)特征函數(shù)算法最早由Feuerverger 和Mureika[4]與Heathcote[5]提出,Tran[6]將其應(yīng)用于參數(shù)估計(jì)問題中.這個(gè)方法與文獻(xiàn)[7-8]提出的矩母函數(shù)方法類似,使用特征函數(shù)代替矩母函數(shù).使用特征函數(shù)進(jìn)行估計(jì)具有一些優(yōu)點(diǎn).特征函數(shù)是一致有界,因此由其所求出的解具有數(shù)值穩(wěn)定性.對(duì)于厚尾分布,當(dāng)它的矩母函數(shù)不存在時(shí),使用特征函數(shù)是恰當(dāng)?shù)模?jīng)驗(yàn)特征函數(shù)算法的穩(wěn)定性受到{tm}的取值影響,對(duì)于此問題,文獻(xiàn)[8-9]進(jìn)行了分析.

本文第一部分首先對(duì)經(jīng)驗(yàn)特征函數(shù)算法進(jìn)行敘述,并對(duì)經(jīng)驗(yàn)特征函數(shù)算法的有效性進(jìn)行討論.由于算法受到固定網(wǎng)格點(diǎn){tm}的影響,進(jìn)而對(duì){tm}的選取進(jìn)行討論,對(duì)如何選取最優(yōu)的網(wǎng)格點(diǎn){tm}使得算法獲得高漸進(jìn)有效性進(jìn)行說明.第二部分進(jìn)行模擬,取不同的固定樣本量的小樣本,使用經(jīng)驗(yàn)特征函數(shù)算法對(duì)一元偏正態(tài)分布三個(gè)參數(shù)進(jìn)行估計(jì),并與懲罰極大似然估計(jì)進(jìn)行對(duì)比.

1 經(jīng)驗(yàn)特征函數(shù)算法

本文我們將經(jīng)驗(yàn)特征函數(shù)算法應(yīng)用于一元偏正態(tài)分布中.假設(shè)一個(gè)樣本容量為n隨機(jī)樣本y1,y2,…,yn來(lái)自于一元偏正態(tài)分布,其概率密度函數(shù)為(1)式.定義yi的特征函數(shù)為:

定義經(jīng)驗(yàn)特征函數(shù)為:

其中i為虛數(shù),{tm}是一系列固定的網(wǎng)格點(diǎn),可以是連續(xù)的,也可以是離散的.現(xiàn)將φ(y;θ)和Cn(t)的實(shí)部與虛部分別分離出來(lái),則它們?cè)趍個(gè)網(wǎng)格點(diǎn)t1,t2,…,tm的估計(jì)為:

其中,

它的分割中的元素是與tp和tq相關(guān),可以表示為(為了定義方便,假設(shè)θ在φ(t,θ)中):

進(jìn)一步,定義

式(5)可以被看作是一個(gè)協(xié)方差矩陣為非標(biāo)量的非線性回歸,其中Zn(t)可以被看作是響應(yīng)變量,F(xiàn)(t,θ)可以被看作是解釋變量.因此,對(duì)于給定的互不相同的網(wǎng)格點(diǎn)t1,t2,…,tm,其中m必須大于等于待估參數(shù)的個(gè)數(shù),θ的有效估計(jì),即經(jīng)驗(yàn)特征函數(shù)算法的估計(jì)值,可以通過最小化

其中,

根據(jù)文獻(xiàn)[8]對(duì)于的漸進(jìn)有效性,有如下命題成立:

命題1 令t1,t2,…,tm為一系列取值不同的固定網(wǎng)格點(diǎn),θ的經(jīng)驗(yàn)特征函數(shù)算法的估計(jì)值是θ的強(qiáng)相合估計(jì),并且服從漸進(jìn)正態(tài)分布,其均值為θ,協(xié)方差為:

由命題1 可知經(jīng)驗(yàn)特征函數(shù)算法的漸進(jìn)有效性依賴于固定網(wǎng)格點(diǎn){tm}的選擇.文獻(xiàn)[8]指出,對(duì)某些估計(jì)問題,經(jīng)驗(yàn)特征函數(shù)算法可達(dá)到充分的漸進(jìn)有效性(以達(dá)到Cramer-Rao 下界為標(biāo)準(zhǔn)).

根據(jù)文獻(xiàn)[8-9]的分析,{tm}必須是互不相同的.對(duì)于固定的m,為了方便起見,使用相等的區(qū)間間隔τ,則網(wǎng)格點(diǎn)為tj=j?τ,j=1,2,…,m,而τ可以是任何實(shí)數(shù)常數(shù),通過最小化(8)的大?。ɡ缧辛惺剑┣蟪鲎顑?yōu)的區(qū)間間隔τ.在最小化(8)式時(shí)會(huì)出現(xiàn)一個(gè)依賴待估參數(shù)的估計(jì)值,但待估參數(shù)未知的難題.解決此問題,一種方法是代入待估參數(shù)的初始值進(jìn)行計(jì)算.值得注意的是當(dāng)t的個(gè)數(shù)接近待估參數(shù)個(gè)數(shù)時(shí),{tm}的選擇對(duì)算法的有效性影響是非常大的.當(dāng)m達(dá)到某個(gè)值之后,經(jīng)驗(yàn)特征函數(shù)算法的漸進(jìn)有效性并不隨著t的個(gè)數(shù)增加而增加(或減小).為驗(yàn)證此結(jié)論成立,假設(shè)有k個(gè)網(wǎng)格點(diǎn)t1,t2,…,tk,此時(shí)其漸進(jìn)協(xié)方差矩陣為現(xiàn)假設(shè)前k個(gè)網(wǎng)格點(diǎn)值不變,增加一個(gè)或多個(gè)網(wǎng)格點(diǎn),此時(shí)漸進(jìn)協(xié)方差矩陣為其中由此看出,在最初的網(wǎng)格點(diǎn)的基礎(chǔ)上增加若干個(gè)點(diǎn),只是增加了矩陣A的列,矩陣Ω的行與列.為了說明矩陣是正定矩陣,首先我們先說明它是半正定矩陣.對(duì)于分塊矩陣的逆正則化,則有:

2 模 擬

樣本量n分別取50、 1 00、200,ξ固定等于0,ω固定等于1,α分別取-3、-2、-1、1、2、3等六個(gè)不同的值,分別使用經(jīng)驗(yàn)特征函數(shù)算法和含有懲罰項(xiàng)的極大似然估計(jì)算法對(duì)三個(gè)參數(shù)重復(fù)進(jìn)行500次估計(jì),以絕對(duì)偏差和均方誤差(MSE)為標(biāo)準(zhǔn),對(duì)比兩種算法的穩(wěn)定性.

當(dāng)樣本量n=50時(shí),根據(jù)多次重復(fù)計(jì)算的結(jié)果,求出兩種算法所對(duì)應(yīng)的絕對(duì)偏差和MSE.為更佳直觀的分析,現(xiàn)畫出不同α值下三個(gè)參數(shù)所對(duì)應(yīng)的絕對(duì)偏差和MSE 的圖像,如圖1 所示.

圖1 當(dāng)n=50,α取不同值時(shí),兩種不同方法所得估計(jì)值的絕對(duì)偏差和MSEFig 1 The Absolute Deviation and MSE of the Estimated Value through Two Different Methods Whenn=50andαChooses Different Values

由圖1 可以看出兩種算法關(guān)于α的估計(jì)值的絕對(duì)偏差都較大,但與含有懲罰項(xiàng)的極大似然估計(jì)算法相比,經(jīng)驗(yàn)特征函數(shù)算法關(guān)于α的估計(jì)值的絕對(duì)偏差要小些,說明經(jīng)驗(yàn)特征函數(shù)算法求得的估計(jì)值偏離真實(shí)值的程度更小,求得的α估計(jì)值的平均值更接近于真實(shí)值.兩種算法對(duì)于位置、尺度兩個(gè)參數(shù)估計(jì)的MSE 都很小,由于形狀參數(shù)難以估計(jì),經(jīng)驗(yàn)特征函數(shù)算法對(duì)于α的估計(jì)容易受到初始值的影響,所以形狀參數(shù)的MSE 出現(xiàn)很大的波動(dòng),因此兩種算法都是不穩(wěn)定的.從整體上看,當(dāng)樣本量很小時(shí),經(jīng)驗(yàn)特征函數(shù)算法略優(yōu)于含有懲罰項(xiàng)的極大似然估計(jì)算法.

當(dāng)樣本量n=100時(shí),根據(jù)多次重復(fù)計(jì)算的結(jié)果,求出兩種算法所對(duì)應(yīng)的絕對(duì)偏差和MSE.為更佳直觀的分析,現(xiàn)畫出不同α值下三個(gè)參數(shù)所對(duì)應(yīng)的絕對(duì)偏差和MSE 的圖像,如圖2 所示.

圖2 當(dāng)n=100,α取不同值時(shí),兩種不同方法所得估計(jì)值的絕對(duì)偏差和MSEFig 2 The Absolute Deviation and MSE of the Estimated Value through Two Different Methods Whenn=100andαChooses Different Values

由圖2 可以看出,兩種算法的絕對(duì)偏差都較小,但與含有懲罰項(xiàng)的極大似然估計(jì)算法相比,經(jīng)驗(yàn)特征函數(shù)算法對(duì)于三個(gè)參數(shù)估計(jì)的絕對(duì)偏差要小些,說明經(jīng)驗(yàn)特征函數(shù)算法求得的估計(jì)值偏離真實(shí)值的程度更小,求得的估計(jì)值的平均值在真實(shí)值附近.兩種算法對(duì)于位置、尺度兩個(gè)參數(shù)估計(jì)的MSE 都很小.由于樣本量較小,兩種算法對(duì)于α的估計(jì)出現(xiàn)一些波動(dòng),使得形狀參數(shù)的MSE 大于1,兩者間的差距不大,因此兩種算法有效性一般.從整體上看,經(jīng)驗(yàn)特征函數(shù)算法優(yōu)于含有懲罰項(xiàng)的極大似然估計(jì)算法.

當(dāng)樣本量n=200時(shí),根據(jù)多次重復(fù)計(jì)算的結(jié)果,求出兩種算法所對(duì)應(yīng)的絕對(duì)偏差和MSE.為更佳直觀的分析,現(xiàn)畫出不同α值下三個(gè)參數(shù)所對(duì)應(yīng)的絕對(duì)偏差和MSE 的圖像,如圖3 所示.

圖3 當(dāng)n=200,α取不同值時(shí),兩種不同方法所得估計(jì)值的絕對(duì)偏差和MSEFig 3 The Absolute Deviation and MSE of the Estimated Value through two Different Methods Whenn=200andαChooses Different Values

由圖3 可以看出,兩種算法的絕對(duì)偏差都較小,但與含有懲罰項(xiàng)的極大似然估計(jì)算法相比,經(jīng)驗(yàn)特征函數(shù)算法對(duì)于三個(gè)參數(shù)估計(jì)的絕對(duì)偏差要小些,說明經(jīng)驗(yàn)特征函數(shù)算法求得的估計(jì)值偏離真實(shí)值的程度更小,求得的估計(jì)值平均值在真實(shí)值附近.兩種算法對(duì)于位置、尺度兩個(gè)參數(shù)估計(jì)的MSE 都很?。捎谛螤顓?shù)難以估計(jì),經(jīng)驗(yàn)特征函數(shù)算法對(duì)于α的估計(jì)容易受到初始值的影響,所以形狀參數(shù)的MSE 出現(xiàn)波動(dòng),但兩者對(duì)于形狀參數(shù)α的估計(jì)的MSE 都小于0.8,兩者間的差距不大,因此兩種算法都是穩(wěn)定的.從整體上看,經(jīng)驗(yàn)特征函數(shù)算法優(yōu)于含有懲罰項(xiàng)的極大似然估計(jì)算法.因此,從整體上看,當(dāng)n≤200時(shí),經(jīng)驗(yàn)特征函數(shù)算法對(duì)一元偏正態(tài)分布的參數(shù)估計(jì)的有效性好于含有懲罰項(xiàng)的極大似然估計(jì)算法.

3 結(jié) 論

本文介紹了經(jīng)驗(yàn)特征函數(shù)算法,并對(duì)一元偏正態(tài)分布的位置、尺度、形狀三個(gè)參數(shù)進(jìn)行了估計(jì),畫出了由估計(jì)值擬合出來(lái)的概率密度函數(shù)圖像,以絕對(duì)偏差、MSE 為標(biāo)準(zhǔn),與現(xiàn)存的含有懲罰項(xiàng)的極大似然估計(jì)算法進(jìn)行了對(duì)比,結(jié)果表明本文所給算法優(yōu)于含有懲罰項(xiàng)的極大似然估計(jì)算法.

猜你喜歡
估計(jì)值樣本量正態(tài)分布
一種基于進(jìn)化算法的概化理論最佳樣本量估計(jì)新方法:兼與三種傳統(tǒng)方法比較*
云上黑山羊生長(zhǎng)曲線擬合的多模型比較
網(wǎng)絡(luò)Meta分析研究進(jìn)展系列(二十):網(wǎng)絡(luò)Meta分析的樣本量計(jì)算及精確性評(píng)估
地震動(dòng)非參數(shù)化譜反演可靠性分析
樣本量對(duì)云南松苗木生物量特征的影響
關(guān)于n維正態(tài)分布線性函數(shù)服從正態(tài)分布的證明*
家系抽樣大小對(duì)云南松遺傳力估算的影響
EM算法在閃爍噪聲分布參數(shù)估計(jì)中的應(yīng)用
生活常態(tài)模式
如何快速判讀指針式壓力表