国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

廣義雙曲線分布在概化理論偏態(tài)數(shù)據(jù)方差分量估計中的應(yīng)用

2013-07-23 11:09:12黎光明張敏強
統(tǒng)計與決策 2013年7期
關(guān)鍵詞:偏態(tài)偏度方差

黎光明,張敏強

(1.華南師范大學(xué)心理應(yīng)用研究中心,廣州510631;2.廣州大學(xué)教育學(xué)院心理系,廣州510006)

0 引言

廣義雙曲線分布(簡稱GH分布),是Barndorff-Nielsen(1977)在研究丹麥海岸風(fēng)積沙礫顆粒大小的分布時首次提出的,GH分布的密度函數(shù)(Eberlein&Hammerstein,2003;Mena&Walker,2007)[1,2]如下:

在公式(1)中,各參數(shù)的定義域如下:當(dāng)λ<0時,δ>0, ||β ≤α;當(dāng) λ=0時,δ>0, ||β <α;當(dāng) λ>0時,δ≥0, ||β<α。其中,Kv()是具有λ指數(shù)校正的Bessel函數(shù),其函數(shù)可表達成:

上述GH分布的密度函數(shù)也可表達成:

從公式(2)可知,GH分布的性質(zhì)主要由5個參數(shù)決定,α和β分別決定分布的峰度和偏度,μ和δ分別決定密度函數(shù)的位置和形狀,λ決定分布的尾部厚度[3]。

利用GH分布的性質(zhì),可以模擬不同分布的數(shù)據(jù),包括偏態(tài)分布數(shù)據(jù)。對于偏態(tài)分布數(shù)據(jù),在實踐中具有常見性,這是因為隨著社會的發(fā)展,心理與教育測量的應(yīng)用領(lǐng)域發(fā)生了較大變化,被測群體的知識和能力等特質(zhì)在一定程度上不再服從偏度為0的分布[4]。Othman(1995,p.8)[5]研究表明,許多測驗數(shù)據(jù)的分布呈弱偏態(tài),如CAP(California Assessment Program)和UCSB(University of California Santa Barbara),這兩個測驗數(shù)據(jù)的分布偏度值介于-0.91~+0.85,如表1所示。

表1 飛行員表現(xiàn)性評價測驗分?jǐn)?shù)的偏度

概化理論(Generalizability Theory,GT)是關(guān)于行為測量可靠性的統(tǒng)計理論(Shavelson&Webb,1991,p.1)[6]。概化理論結(jié)合測量的情境關(guān)系(context of measurement situation)對CTT的籠統(tǒng)誤差進行探查和分解,辨明不同的誤差來源,并且在一定范圍內(nèi)變動測量的情境關(guān)系,以考察這種變動引起的誤差的相對變化,從而達到對誤差方差進行控制(Shavelson&Webb,1991),因此概化理論又稱為方差分量模型(Brennan,2000)[7]。

數(shù)據(jù)分布對概化理論方差分量估計可能產(chǎn)生影響。特別地,當(dāng)數(shù)據(jù)為偏態(tài)分布時,適合于正態(tài)分布數(shù)據(jù)的方差分量估計方法不一定適合于偏態(tài)分布數(shù)據(jù)。雖然Othman(1995)已經(jīng)考慮到數(shù)據(jù)分布具有(弱)偏態(tài),但是Othman并沒有進行偏態(tài)分布數(shù)據(jù)的方差分量估計的研究,顯得不足。本文旨在探討如何利用GH分布性質(zhì)模擬生成偏態(tài)分布數(shù)據(jù),其偏度如何影響概化理論的方差分量估計。

1 方法

1.1 數(shù)據(jù)產(chǎn)生

基于p×i設(shè)計概化理論模型,根據(jù)GH分布的性質(zhì)使用蒙特卡洛數(shù)據(jù)模擬技術(shù)產(chǎn)生偏態(tài)分布數(shù)據(jù)。數(shù)據(jù)模擬所使用的軟件為R軟件。產(chǎn)生偏態(tài)分布數(shù)據(jù)過程如下:

第一,在R軟件中調(diào)用Hyperbolic Dist軟件包,使用hyperb Change Pars和rhy perb函數(shù)生成服從某種偏度的偏態(tài)數(shù)據(jù)。在使用rhyperb函數(shù)前,需要先用hyperb Change-Pars對參數(shù)進行轉(zhuǎn)換,主要是因為GH分布有不同量綱系統(tǒng),轉(zhuǎn)換成能夠識別的量綱系統(tǒng)是必需的,服從某種偏態(tài)的廣義雙曲線分布數(shù)據(jù)才能夠正常產(chǎn)生(Scott,2009)[8]。

第二,因為僅需要產(chǎn)生服從一定偏度的偏態(tài)數(shù)據(jù),所以對GH分布的參數(shù)進行控制,令 λ=1,μ=0,δ=1,α=3,僅改變 β 值,β 僅選取五個點:-2、-1、0、1、2。編制的程序證明,β具有以0為軸的對稱性,即β=-2與β=+2的結(jié)果相近,β=-1與β=+1的結(jié)果相近,如表2所示。

表2 不同偏態(tài)分布數(shù)據(jù)估計的方差分量及其標(biāo)準(zhǔn)誤

在表2中,為了保持β值的連續(xù)性,β的取值為9個,即 β 為-2.0、-1.5、-1.0、-0.5、0、+0.5、+1.0、+1.5、+2.0。根據(jù)表2的數(shù)據(jù)結(jié)果,可得到圖1。

圖1 不同偏態(tài)數(shù)據(jù)估計的方差分量及其標(biāo)準(zhǔn)誤

從圖1可以明顯看出,方差分量具有以β=0為軸的對稱性,這種對稱性非常明顯。因此,僅需生成β為-2、-1和0三種偏度的數(shù)據(jù),并且令β為-2表示“高偏”,β為-1表示“中偏”,β為0表示“無偏”。

第三,在概化理論p×i設(shè)計下,將rhyperb函數(shù)生成的某個偏度下的三組偏態(tài)分布數(shù)據(jù)相加,即Xpi=μ+GH(p)+GH(i)+GH(pi),這樣,在概化理論模型下服從某種偏度的GH分布數(shù)據(jù)就可以產(chǎn)生。

第四,沒有公式可以直接計算出偏態(tài)分布數(shù)據(jù)的三個方差分量參數(shù),參考 Tong和 Brennan(2006,2007)[9,10]的做法,模擬5000批次數(shù)據(jù),求取5000批次三個方差分量的平均數(shù),用這兩個估計值表示三個方差分量參數(shù)。

第五,針對某一個偏度值,生成的偏態(tài)分布模擬數(shù)據(jù)為矩陣數(shù)據(jù)(p×i),模擬次數(shù)為1000,這樣可產(chǎn)生1000批次100×20的偏態(tài)分布模擬矩陣數(shù)據(jù)。β有三個偏度值(-2、-1和0),可以產(chǎn)生3×1000批次100×20的偏態(tài)分布模擬矩陣數(shù)據(jù)。

1.2 比較標(biāo)準(zhǔn)

1.3 分析工具

分析工具為R軟件、WinBUGS軟件、R2WinBUGS軟件包、Coda軟件包和HyperbolicDist軟件包。借助這些軟件或軟件包,自編完成研究程序。

2 結(jié)果

2.1 三種偏態(tài)分布數(shù)據(jù)估計的人的方差分量

對β=-2、β=-1和β=0三種偏態(tài)分布數(shù)據(jù),分別計算Traditional方法、Jackknife方法、Bootstrap方法和MCMC方法估計的人的方差分量,結(jié)果如表3所示。

表3 三種偏態(tài)分布數(shù)據(jù)估計的人的方差分量

在表3中,vc.p_2、vc.p_1和vc.p_0分別表示 β=-2、β=-1和β=0偏態(tài)分布數(shù)據(jù)四種方法估計的人的方差分量。trad表示Traditional方法。Jackknife方法估計方差分量及其變異量時,需要考慮再抽樣策略,這里僅使用jack-p、jack-i和jack-pi三種策略。Bootstrap方法也需要考慮再抽樣策略,所考慮Bootstrap再抽樣策略包括boot-p、boot-i、boot-pi、boot-pr、boot-ir和boot-pir??梢詫ootstrap方法進行校正,用后綴adj來表示校正的Bootstrap策略。MCMC inf表示有先驗信息的MCMC方法,而MCMC non-inf則表示無先驗信息的MCMC方法。的方差分量。其它表示符號及解釋同表3。

2.2 三種偏態(tài)分布數(shù)據(jù)估計的題目的方差分量

對β=-2、β=-1和β=0的偏態(tài)分布數(shù)據(jù),分別計算Traditional方法、Jackknife方法、Bootstrap方法和MCMC方法估計的題目的方差分量,結(jié)果如表4所示。

表4 三種偏態(tài)分布數(shù)據(jù)估計的題目的方差分量

在表4中,vc.i_2、vc.i_1和vc.i_0分別表示 β=-2、β=-1和β=0偏態(tài)分布數(shù)據(jù)四種方法估計的題目的方差分量。其它表示符號及解釋同表3。

2.3 三種偏態(tài)分布數(shù)據(jù)估計的人與題目交互的方差分量

對β=-2、β=-1和β=0的偏態(tài)分布數(shù)據(jù),分別計算Traditional方法、Jackknife方法、Bootstrap方法和MCMC方法估計的人與題目交互的方差分量,結(jié)果如表5所示。

表5 三種偏態(tài)分布數(shù)據(jù)估計的人與題目交互的方差分量

在表5中,vc.pi_2、vc.pi_1和vc.pi_0分別表示β=-2、β=-1和β=0偏態(tài)分布數(shù)據(jù)四種方法估計人與題目交互

3 分析與討論

3.1 三種偏態(tài)分布數(shù)據(jù)估計的人的方差分量偏差分析

根據(jù)表3中每種方法(或策略)估計的方差分量與參數(shù)的差值(bias),可以繪出三種不同偏態(tài)分布數(shù)據(jù)四種方法估計的方差分量偏差圖,如圖2所示。

圖2 三種偏態(tài)分布數(shù)據(jù)四種方法估計p的方差分量偏差

從圖2可以看出,三種偏態(tài)分布數(shù)據(jù)四種方法估計p的方差分量偏差主要體現(xiàn)在未校正的Bootstrap方法和MCMC non-inf上,而Traditional方法、Jackknife方法(包括jack-p、jack-i和jpi)、校正的Bootstrap方法和MCMC inf方法偏差相對較小。特別地,當(dāng)β=-2.0時,未校正的boot-pi、boot-pir、boot-ir、boot-i、boot-pr、boot-p 對應(yīng)的絕對 偏 差 分 別 為 0.0587、0.0587、0.0760、0.0759、0.0587、0.0234,偏差相對較大,而校正的boot-pi、boot-pir、boot-ir、boot-i、boot-pr、boot-p 對應(yīng)的絕對偏差分別為 0.0068、0.0068、0.0069、0.0070、0.0068、0.0068,偏 差 較 小 。 當(dāng)β=-2、β=-1和β=0時,MCMC inf對應(yīng)的絕對偏差值分別為0.0223、0.0087、0.0015,MCMC non-inf對應(yīng)的絕對偏差值分別為0.0307、0.0118、0.0150,前者的偏差小于后者。從圖2也可知,隨著偏度由高偏趨于低偏過程中,偏差間距有逐漸縮小的趨勢,且表現(xiàn)為先快后慢。當(dāng)β=-2、β=-1和β=0時,各種估計方法的絕對偏差平均值分別為0.2464、0.0963、0.1738。對于三種不同偏態(tài)分布數(shù)據(jù)的vc.p,僅MCMC non-inf方法在個別方差分量估計出現(xiàn)不一致,但從總的趨勢看,隨著偏度值的減小,方差分量絕對偏差逐漸減小。

3.2 三種偏態(tài)分布數(shù)據(jù)估計的題目的方差分量偏差分析

根據(jù)表4中每種方法(或策略)估計的方差分量與參數(shù)的差值(bias),可以繪出三種不同偏態(tài)分布數(shù)據(jù)四種方法估計的題目的方差分量偏差圖,如圖3所示。

從圖3可以看出,三種偏態(tài)分布數(shù)據(jù)四種方法估計i的方差分量偏差主要體現(xiàn)在MCMC non-inf上,而Traditional方法、Jackknife方法、Bootstrap方法和MCMC inf方法偏差相對較小。當(dāng) β=-2、β=-1和 β=0時,MCMC inf對應(yīng)的絕對偏差值分別為0.0221、0.0080、0.0066,MCMC non-inf對應(yīng)的絕對偏差值分別為0.2201、0.0660、0.0518,后者的絕對偏差是前者的9.96倍、8.25倍和7.84倍,可見MCMC inf的偏差是相當(dāng)大,具有明顯的“翹尾”。

圖3 三種偏態(tài)分布數(shù)據(jù)四種方法估計i的方差分量偏差

從圖3也可知,當(dāng)β=-2、β=-1和β=0時,各種估計方法的絕對偏差平均值分別為0.3093、0.1683、0.1512,隨著偏度值的減小,方差分量絕對偏差有逐漸減小的趨勢。對于三種不同偏態(tài)分布數(shù)據(jù)的vc.i,未出現(xiàn)“倒序”現(xiàn)象,方差分量絕對偏差有逐漸減小的趨勢,也是先快后慢。

3.3 三種偏態(tài)分布數(shù)據(jù)估計的人與題目交互的方差分量偏差分析

根據(jù)表5中每種方法(或策略)估計的方差分量與參數(shù)的差值(bias),可以繪出三種不同偏態(tài)分布數(shù)據(jù)四種方法估計的人與題目交互的方差分量偏差圖,如圖4所示。

圖4 三種偏態(tài)分布數(shù)據(jù)四種方法估計pi的方差分量偏差

從圖4可以看出,三種偏態(tài)分布數(shù)據(jù)四種方法估計pi的方差分量偏差主要體現(xiàn)在未校正的Bootstrap方法上,而Traditional方法、Jackknife方法、校正的Bootstrap方法和MCMC方法偏差相對較小。當(dāng) β=-2.0時,未校正的boot-pi、boot-pir、boot-ir、boot-i、boot-pr、boot-p 對應(yīng)的偏差分別為0.1020 、0.1019、0.1019、0.0862、0.1019、0.0199 ,偏差相對較大,而校正的boot-pi、boot-pir、boot-ir、boot-i、boot-pr、boot-p對應(yīng)的偏差分別為0.0033、0.0033、0.0033、0.0033、0.0033、0.0033,偏差較小。當(dāng) β=-1.0 時,未校正的 boot-pi、boot-pir、boot-ir、boot-i、boot-pr、boot-p對應(yīng)的偏 差 分 別 為 0.0390、0.0389、0.0389 、0.0329、0.0389、0.0069,偏差相對較大,而校正的boot-pi、boot-pir、boot-ir、boot-i、boot-pr、boot-p對應(yīng)的偏差分別為0.0004、0.0003、0.0003、0.0004、0.0003、0.0004,偏差較小。 β=0 的情況類似。

從圖4也可知,當(dāng)β=-2、β=-1和β=0時,各種估計方法的絕對偏差平均值分別為0.5514、0.1988、0.1480,這表明偏度由大變小過程中,偏差減小的幅度前段速度較快,后段速度卻較慢。對于三種不同偏態(tài)分布數(shù)據(jù)的vc.pi,從總的趨勢看,隨著偏度值的減小,方差分量絕對偏差逐漸減小。

4 結(jié)論

(1)利用廣義雙曲線分布性質(zhì)可以有效模擬生成概化理論所需要的偏態(tài)分布數(shù)據(jù)。通過HyperbolicDist軟件包的hyperbChangePars和rhyperb函數(shù)能夠模擬生成偏態(tài)分布數(shù)據(jù),根據(jù)估計偏態(tài)分布數(shù)據(jù)的方差分量及方差分量標(biāo)準(zhǔn)誤,表明其具有對稱性。利用GH分布性質(zhì)模擬生成偏態(tài)分布數(shù)據(jù),使得概化理論探討偏態(tài)分布數(shù)據(jù)的方差分量估計,成為可能。

(2)廣義雙曲線分布模擬的偏態(tài)分布數(shù)據(jù)對概化理論各種方法估計方差分量有影響。分析三種模擬的偏態(tài)分布數(shù)據(jù)的vc.p、vc.i和vc.pi偏差,發(fā)現(xiàn)未校正的Bootstrap方法和MCMC non-inf方法偏差較大,而Traditional方法、Jackknife方法、校正的Bootstrap方法和MCMC inf方法偏差相對較小。從總的趨勢看,隨著偏度值減小,各種方法估計的方差分量偏差逐漸減小。

[1]Eberlein,E.,Hammerstein,E.A.Generalized Hyperbolic and Inverse Gaussian Distributions:Limiting Cases and Approximation of Process?es[M].University of Freiburg[Z].Nr.80,2003.

[2]Mena,R.H.,Walker,S.G.On the Stationary Version of the General?ized Hyperbolic ARCH Model.AISM,2007,59.

[3]任軍峰.廣義雙曲線分布族下的金融市場風(fēng)險度量[D].浙江工商大學(xué)碩士學(xué)位論文,2007.

[4]焦璨,張敏強,黃慶均,張文怡,黎光明.非正態(tài)分布測量數(shù)據(jù)對克倫巴赫信度α系數(shù)的影響[J].應(yīng)用心理學(xué),2008,14(3).

[5]Othman,A.R.Examining Task Sampling Variability in Science Perfor?mance Assessments[C].Unpublished Doctoral Dissertation,University of California,Santa Barbara,1995.

[6]Shavelson,R.J.,Webb,N.M.Generalizability Theory:a Primer[M].Newbury Park,CA:Sage,1991.

[7]Brennan,R.L.(Mis)Conceptions about Generalizability Theory[J].Ed?ucational Measurement:Issues and Practice,2000,19(1).

[8]Scott,D.The HyperbolicDist[EB/OL].http://www.r-project.org,2009.

[9]Tong,Y.,Brennan,R.L.Bootstrap Techniques for Estimating in Gener?alizability Theory(CASMA Research Report No 15).Iowa City,IA:Center for Advanced Studies in Measurement and Assessment,Uni?versity of Iowa[EB/OL].http://www.education.uiowa.edu/casma,2006.

[10]Tong,Y.,Brennan,R.L.Bootstrap Estimates of Standard Errors in Generalizability theory[J].Educational and Psychological Measure?ment,2007,67(5).

猜你喜歡
偏態(tài)偏度方差
方差怎么算
概率與統(tǒng)計(2)——離散型隨機變量的期望與方差
對稱分布的矩刻畫
考試成績轉(zhuǎn)換成偏態(tài)分布量化成績的算法
計算方差用哪個公式
隧穿量子點分子的Wigner-Yanase偏態(tài)信息
方差生活秀
基于偏度的滾動軸承聲信號故障分析方法
考慮偏度特征的動態(tài)多響應(yīng)穩(wěn)健參數(shù)設(shè)計與優(yōu)化
基于偏度、峰度特征的BPSK信號盲處理結(jié)果可信性評估
電子器件(2015年5期)2015-12-29 08:42:56
贵州省| 泗阳县| 赣州市| 土默特左旗| 奈曼旗| 买车| 博爱县| 呼玛县| 长顺县| 永济市| 连城县| 乐安县| 江口县| 屏东县| 新巴尔虎左旗| 林芝县| 清水县| 交城县| 湖北省| 德江县| 石河子市| 呼伦贝尔市| 宁德市| 宁海县| 额敏县| 洪湖市| 颍上县| 阜新市| 安宁市| 新郑市| 庄河市| 喜德县| 将乐县| 萨嘎县| 晋中市| 定远县| 嘉祥县| 隆安县| 灵川县| 华安县| 泰来县|