殷航
摘要:本文通過對(duì)我國(guó)31省市自治區(qū)的國(guó)際旅游收入進(jìn)行不等概率抽樣,抽取了12個(gè)對(duì)象作為樣本,預(yù)測(cè)了2012我國(guó)國(guó)際旅游收入總額以及抽樣方差,通過與簡(jiǎn)單隨機(jī)抽樣的結(jié)果進(jìn)行對(duì)比,發(fā)現(xiàn)當(dāng)總體單元之間差異較大時(shí),PPS抽樣方法能夠取得較好的估計(jì)效果。
關(guān)鍵詞:PPS抽樣;簡(jiǎn)單隨機(jī)抽樣;國(guó)際旅游收入
引言
改革開放以來,中國(guó)旅游業(yè)迅猛發(fā)展,2007年到中國(guó)旅游的外國(guó)游客就已達(dá)到了5470萬人,我國(guó)的國(guó)際旅游收入不斷增長(zhǎng),從2007 年的3723.3億美元到2012年的6644.7億美元,增長(zhǎng)接近兩倍。據(jù)世界旅游組織的預(yù)測(cè),至2020年,中國(guó)將成為全世界主要的旅游目的地國(guó)家,據(jù)估計(jì)屆時(shí)將有1.3億旅客前往中國(guó)。我國(guó)已經(jīng)逐漸發(fā)展成為一個(gè)世界級(jí)的旅游大國(guó),而旅游業(yè)也不可或缺的成為了我國(guó)國(guó)民經(jīng)濟(jì)的重要增長(zhǎng)點(diǎn)。從2005年起,我國(guó)匯率制度有所調(diào)整,新的匯率制度使得人民幣的波動(dòng)性有所增加,這一變動(dòng)將相應(yīng)的對(duì)我國(guó)國(guó)際旅游收入有所影響。本文通過運(yùn)用PPS抽樣方法,對(duì)我國(guó)國(guó)際旅游收入進(jìn)行預(yù)測(cè),為保障我國(guó)宏觀經(jīng)濟(jì)平穩(wěn)增長(zhǎng)的政策制定提供了借鑒意義。
一、PPS抽樣方法簡(jiǎn)介
1.不等概率抽樣
在簡(jiǎn)單隨機(jī)抽樣中,總體中的每一個(gè)單元都是等概率入樣,而分層隨機(jī)抽樣中,對(duì)每一個(gè)層中的抽樣也是簡(jiǎn)單隨機(jī)抽樣,所以層內(nèi)抽樣也是等概率的。等概率抽樣的實(shí)質(zhì)就是把每個(gè)單元平等對(duì)待,但如果總體單元相差較大時(shí),等概率抽樣得到的效果不好。為了取得較好的預(yù)測(cè)效果,采用不等概率抽樣,即在抽樣中將總體中的每個(gè)單元的入樣概率與單元規(guī)模大小結(jié)合起來,這樣每個(gè)單元就被賦予了不同的入樣概率。假設(shè)總體的第i個(gè)單元的規(guī)模度量為Mi,總規(guī)模度量為M0=∑ni=1Mi,那么i單元的入樣概率則為Zi=MiM0。我們把這種抽樣方法簡(jiǎn)稱PPS抽樣。
2.PPS抽樣的操作方法
PPS抽樣的操作方法較多,本文選擇規(guī)模累積等距抽選法,該方法的操作具體如下:
設(shè)總體單元數(shù)為N,其規(guī)模度量分別為M1,M2,…,MN,將規(guī)模度量不斷累積至M0=∑ni=1Mi。假設(shè)需要抽取容量為n的樣本,那么就必須先求出等距抽樣的間隔K=M0n,然后在1~K中隨機(jī)一個(gè)整數(shù),將該數(shù)記做a,則a所在的單元代碼區(qū)間對(duì)應(yīng)的單元就為選中的單元。之后每隔K個(gè)度量值,即a+K,a+2K,……a+(n-1)K等數(shù)字所在的單元代碼區(qū)間的相應(yīng)單元,即為被抽中的單元。
3.Hansen-Hurwitz估計(jì)量
1)總體總量的估計(jì)
Hansen-Hurwitz提出對(duì)總體總和Y的估計(jì)量為:
Y∧HH=12∑ni=1YiZi
Yi表示第i個(gè)入樣單元的變量值,Zi是第i單元的規(guī)模大小的入樣概率,Zi=MiM0。且Y∧HH是總體總量的一個(gè)無偏估計(jì)。
2)方差估計(jì)量為:
V∧(Y∧HH)=1n(n-1)∑ni=1yizi-Y∧HH2
二、實(shí)證分析
1.PPS抽樣估計(jì)
1)數(shù)據(jù)收集與處理
本文選取2012年與2013年我國(guó)31個(gè)省市自治區(qū)國(guó)際旅游收入的原始數(shù)據(jù),針對(duì)2012年國(guó)際旅游收入總額,本文采用PPS抽樣方法,共抽取了12個(gè)省市作為入樣樣本,以2012年國(guó)際旅游收入總額為規(guī)模度量并同時(shí)進(jìn)行累積。計(jì)算得M0=∑Mi=59682,樣本容量n=12,抽樣間隔K=M0n=5968212=4974。在1-K間抽取隨機(jī)數(shù)a=351,隨機(jī)數(shù)a處于北京的代碼范圍之內(nèi),所以北京作為抽中的樣本,按照PPS抽樣的實(shí)施方法,繼續(xù)抽取剩余省市,即為遼寧省、上海市、江蘇省、浙江省、福建省、山東省、廣東省、重慶市。其中,北京市被重復(fù)抽中兩次,記入樣2次,廣東省被重復(fù)抽中三次,記入樣3次。本次抽樣總共由9個(gè)省市。
2)總體總量估計(jì)
根據(jù)抽樣概率的公式為Zi=MiM0,可以得到入樣的10個(gè)省市的被抽選的概率。
根據(jù)漢森-赫維茨對(duì)總體總量的估計(jì)式,由公式可得:
Y∧HH=1n∑ni=1YiZi=112
51490.09075+32640.04546+…+11680.01622=61322
所以,根據(jù)估計(jì)結(jié)果可以推斷出全國(guó)31個(gè)省市2012年國(guó)際旅游收入總額為6132.2億美元
抽樣方差:
V∧(Y∧HH)=1n(n-1)∑ni=1yizi-Y∧HH2=3860531
在置信度95%下,2012年國(guó)際旅游收入總額的置信區(qū)間為:
Y∧HH±Za2V∧(Y∧HH)=(57470~65173)
在2012年,根據(jù)統(tǒng)計(jì)年鑒數(shù)據(jù),實(shí)際的31個(gè)省市國(guó)際旅游收入總額為6466.7億美元,處于計(jì)算所得的置信區(qū)間之內(nèi)。
2.簡(jiǎn)單隨機(jī)抽樣估計(jì)
根據(jù)隨機(jī)數(shù),抽取12個(gè)地區(qū)作為樣本,各入樣省份即為天津市、河北省、青海省、上海市、福建省、四川省、廣東省、湖南省、云南省、甘肅省、山西省、新疆省。
總體總量估計(jì):Y∧=Nn∑12i=1yi=87751
總體方差估計(jì):V∧(Y∧)=N(N-n)n(n-1)∑ni=1(yi-y)2=932490842
置信度為95%的置信區(qū)間為:(27899~147603)
三、小結(jié)
本文采用PPS抽樣方法對(duì)我國(guó)31個(gè)省市自治區(qū)2012年的國(guó)際旅游收入進(jìn)行抽樣,估算得我國(guó)國(guó)際旅游收入2012年總額為6132.2億美元,置信區(qū)間為(57470~65173) ,而2012年我國(guó)國(guó)際旅游收入總額為6466.7億美元,處于置信區(qū)間中。本文通過實(shí)踐,對(duì)PPS抽樣方法、簡(jiǎn)單隨機(jī)抽樣方法這兩種方法進(jìn)行比較,得出在總量估計(jì)值、方差估計(jì)值這兩種計(jì)算結(jié)果上,PPS抽樣方法的計(jì)算精度都優(yōu)于簡(jiǎn)單隨機(jī)抽樣方法。所以,針對(duì)總體單元差異很大的情況,選取PPS抽樣方法能更準(zhǔn)確的預(yù)測(cè)國(guó)際旅游收入總額,預(yù)測(cè)精度更高。(作者單位:南京財(cái)經(jīng)大學(xué))
參考文獻(xiàn):
[1]馮士雍.抽樣調(diào)查理論與方法[M].北京:中國(guó)統(tǒng)計(jì)出版社,1998.3
[2]倪家勛,張勇.調(diào)查內(nèi)比估計(jì)效果的數(shù)據(jù)模擬分析———關(guān)于簡(jiǎn)單抽樣設(shè)計(jì)與 PPS 系統(tǒng)抽樣設(shè)計(jì)的比較[J].統(tǒng)計(jì)研究,2005,(11):32-35.