張建軍, 喬松珊
(1.河南農(nóng)業(yè)大學(xué) 信息與管理科學(xué)學(xué)院 河南 鄭州 450002;2.中原工學(xué)院 信息商務(wù)學(xué)院 河南 鄭州 450007)
?
中位數(shù)排序集抽樣下總體均值的比率估計(jì)方法
張建軍1, 喬松珊2
(1.河南農(nóng)業(yè)大學(xué) 信息與管理科學(xué)學(xué)院 河南 鄭州 450002;2.中原工學(xué)院 信息商務(wù)學(xué)院 河南 鄭州 450007)
分析了中位數(shù)排序集抽樣下總體均值的比率估計(jì)方法,證明了該估計(jì)量具有漸進(jìn)無偏性,并討論了兩種抽樣方法下估計(jì)量的相對效率.算例表明,在總體分布為正態(tài)分布的情況下,基于中位數(shù)排序集樣本的比率估計(jì)比隨機(jī)抽樣下的比率估計(jì)效率高.
中位數(shù); 排序集抽樣; 比率估計(jì); 相對精度
排序集抽樣方法(簡記RSS)最初由McIntyre于1952年提出,并被證明在估計(jì)總體均值方面比隨機(jī)抽樣要優(yōu)良很多[1],具體抽樣過程為:從總體中一次抽出n2個(gè)隨機(jī)樣本,分為n組,每組n個(gè),對每組分別由小到大排序,從第i組抽出秩為i的樣本用于精確測量,類似過程重復(fù)m次,得到mn個(gè)樣本,記為X(i)l,i=1,2,…,n;l=1,2,…,m,即為排序集樣本.
近年來,排序集抽樣方法在廣泛應(yīng)用中出現(xiàn)一些改進(jìn)方法,其中Muttlk提出了中位數(shù)排序集抽樣(簡記為MRSS)[2],目前該方法在國內(nèi)外應(yīng)用較多[3-7],具體抽樣過程為:從總體中隨機(jī)抽取n2個(gè)樣本,隨機(jī)劃分為n組,每組n個(gè),對每組分別由小到大進(jìn)行排序,若n為奇數(shù),則從每組抽出秩為p=(n+1)/2的樣本,記為Xi(p),i=1,2,…,n, 類似過程重復(fù)m次,得到mn個(gè)樣本,記為
{Xi(p)j,i=1,2,…,n, j=1,2,…,m}.
如果n為偶數(shù),則從前n/2組抽出秩為n/2的樣本,后n/2組抽出秩為n/2+1的樣本,這樣得到n個(gè)樣本,類似過程重復(fù)m次,得到mn個(gè)樣本,記為
{Xi(r1)j,i=1,2,…,n/2, j=1,2,…,m}∪{Xi(r2)j,i=n/2+1,…,n, j=1,2,…,m},
其中r1=n/2, r2=n/2+1.
比率估計(jì)是利用輔助信息提高估計(jì)量效率的有效方法, 文獻(xiàn)[8]將輔助信息應(yīng)用到了抽樣設(shè)計(jì)和估計(jì)量設(shè)計(jì)兩個(gè)階段,基于排序集抽樣方法研究了總體均值的比率估計(jì)問題,證明了該抽樣方法提高了比估計(jì)效率.隨后,文獻(xiàn)[9]基于排序集樣本通過增加比率系數(shù),改進(jìn)比估計(jì)量,并證明了改進(jìn)的比率估計(jì)效率更高.文獻(xiàn)[10]根據(jù)刀切法理論,基于排序集樣本也進(jìn)行了改進(jìn)比率估計(jì)量的研究.然而,利用排序集進(jìn)行抽樣時(shí),排序錯(cuò)誤通常無法避免,因此,基于RSS構(gòu)造比率估計(jì)量,排序誤差會對估計(jì)的結(jié)果產(chǎn)生一定偏倚,而中位數(shù)排序抽樣較好地解決了這一問題,為此,文章基于中位數(shù)排序集抽樣方法研究了總體均值的比率估計(jì)問題,分析了估計(jì)量的無偏性和均方誤差,并比較了兩種抽樣下均值比率估計(jì)的效率,最后,通過實(shí)例說明了兩種抽樣方法下比估計(jì)量的相對效率.
1.1 簡單隨機(jī)抽樣下均值的比率估計(jì)
(1)
(2)
1.2 中位數(shù)排序集抽樣下均值的比率估計(jì)
設(shè)(Xij,Yij),i,j=1,2,…,n為來自上述總體(X,Y)的簡單隨機(jī)樣本,利用來自總體X的輔助變量,對該組簡單隨機(jī)樣本進(jìn)行中位數(shù)排序集抽樣,得到一組MRSS樣本.當(dāng)n為奇數(shù)時(shí),記為
(X1((n+1)/2),Y1((n+1)/2)),(X2((n+1)/2),Y2((n+1)/2)),…,(Xn((n+1)/2),Yn((n+1)/2)),
當(dāng)n為偶數(shù)時(shí),記為
(X1(n/2),Y1(n/2)),(X2(n/2),Y2(n/2)),…,(X(n/2)(n/2),Y(n/2)(n/2)),(X((n+2)/2)( (n+2)/2),Y((n+2)/2)((n+2)/2)),…,
(Xn((n+2)/2),Yn((n+2)/2)).
類似式(1),MRSS下總體均值μY的比率估計(jì)量可構(gòu)造為:
(3)
(4)
證明由于
(5)
利用泰勒展開式,注意到
代入式(5),得到
下面,計(jì)算MRSS下對總體均值進(jìn)行比率估計(jì)的均方誤差.
當(dāng)n為偶數(shù)時(shí),用類似的方法同理可證.
1.3 兩種估計(jì)量精度的比較
(6)
(7)
這說明,當(dāng)排序集容量n為奇數(shù)時(shí),若β滿足式(7),則基于MRSS的比率估計(jì)的精度要優(yōu)于SRS的估計(jì)量.n為偶數(shù)時(shí)可以得出類似結(jié)論.
注意,具體計(jì)算相對效率時(shí),若總體方差未知,公式中的總體方差可以用樣本方差代替.
表1 兩種估計(jì)方法的相對效率Tab.1 Relative precision of the two estimators
從計(jì)算結(jié)果中不難發(fā)現(xiàn),基于MRSS總體均值的比率估計(jì)效率整體上要優(yōu)于隨機(jī)抽樣下對均值的估計(jì).對于給定的相關(guān)系數(shù),隨著排序集容量n的增加,估計(jì)的相對效率不斷增大,但是為了方便排序,n也不能過大,一般取3~6比較合適.另外,隨著兩個(gè)變量相關(guān)性的增大,估計(jì)的效率也不斷提高,這說明與目標(biāo)變量高度相關(guān)的輔助變量能夠較好地提高比率估計(jì)的精度.
中位數(shù)排序集抽樣是對排序集抽樣方法的改進(jìn),文中基于中位數(shù)排序集樣本對總體均值構(gòu)造了比率估計(jì)量,證明了該估計(jì)量的漸進(jìn)無偏性,并討論了相對于簡單隨機(jī)抽樣下均值估計(jì)的相對效率.最后,通過實(shí)際例子進(jìn)一步分析了估計(jì)效率與相關(guān)系數(shù)和排序集容量之間的關(guān)系.
[1] McIntyre G A. A method for unbiased selective sampling, using ranked sets[J]. Australian Journal of Agricultural Research,1952,3(4):385-390.
[2] Muttlak H A. Median ranked set sampling[J].Journal of Applied Statistical Scinece,1997,6(4):245-255.
[3] Ozturk O,Wolfe D A. An improved ranked set two-sample Mann-Whitney-Wilcoxon test[J].Can J Statist,2000,28(2):123-135.
[4] Muttlak H A. Investigating the use of quartile ranked set samples for estimating the population mean[J].Appl Math Comput,2003,146(4):437-443.
[5] Shaibu A B,Muttlak H A. A comparison of the maximum likelihood estimators under ranked set sampling some of its modifications[J]. Appl Math Comput,2002,129(2):441-453.
[6] 張建軍,喬松珊.正態(tài)總體下參數(shù)的優(yōu)化極大似然估計(jì)方法[J].統(tǒng)計(jì)與決策,2012(2):16-18.
[7] 董曉芳,張良勇.基于中位數(shù)排序集抽樣的非參數(shù)估計(jì)[J].數(shù)理統(tǒng)計(jì)與管理,2013,32(3):462-467.
[8] Samawi H M, Muttlak H A. Estimation of ratio using rank set sampling[J]. The Biometrical Journal,1996,38(6):753-764.
[9] Kadilar C, Unyazici Y, Cingi H. Ratio estimation for the population mean using ranked set sampling[J]. Stat Papers,2009,50(2):301-309.
[10]Jozani M J, Majidi S. Unbiased and almost unbiased ratio estimators of the population mean in ranked set sampling[J].Stat Papers,2012,53(3):719-737.
[11]杜子芳.抽樣技術(shù)及其應(yīng)用[M].北京:清華大學(xué)出版社,2005.
Ratio Estimation of the Population Mean under Median Ranked Set Sampling
ZHANG Jian-jun1, QIAO Song-shan2
(1.CollageofInformationandManagementScienceofHenanAgriculturalUniversity,Zhengzhou450002,China;2.CollegeofInformationandBusiness,ZhongyuanInstituteofTechnology,Zhengzhou450007,China)
A ratio estimation of the population mean was processed based on median ranked set sampling. It was proved that the estimator was almost unbiased by using median ranked sampling. And the relative precision of the estimation under two sampling methods were compared. Example showed that the estimator was more efficient by using median ranked set sampling than the ratio estimator by using random set sampling in normal distribution.
median; ranked set sampling; ratio estimation; the relative precision
2014-04-14
河南省教育廳科學(xué)技術(shù)研究重點(diǎn)項(xiàng)目,編號13B110057.
張建軍(1980-),男,河南開封人,講師,碩士,主要從事數(shù)理統(tǒng)計(jì)研究,E-mail:zhangjianjunbox@163.com.
O212.2
A
1671-6841(2015)01-0046-04
10.3969/j.issn.1671-6841.2015.01.010