朱淑娟 葛建軍 令狐雨薇
[摘要]采用年齡移算法分別利用貴州省第六次普查的數(shù)據(jù)和《2005年貴州省1%人口抽樣調(diào)查資料》對(duì)2000年貴州省第五次普查的人口進(jìn)行漏報(bào)估計(jì)及回填,通過兩種方法進(jìn)行對(duì)比,貴州省“五普”數(shù)據(jù)均存在漏報(bào)情況,而且在0~9歲年齡段表現(xiàn)尤其明顯。但是總?cè)丝诘穆﹫?bào)率卻差異較大,用“六普”數(shù)據(jù)估算的漏報(bào)率為1.55%,而用《2005年貴州省1%人口抽樣調(diào)查資料》估算的漏報(bào)率達(dá)8.64%。漏報(bào)情況在性別差異上,兩種估計(jì)結(jié)果一致,女性漏報(bào)情況與男性相比較為明顯。
[關(guān)鍵詞]人口普查;人口漏報(bào);年齡移算法;線性插值;人口統(tǒng)計(jì)
[中圖分類號(hào)]C921.2[文獻(xiàn)標(biāo)識(shí)碼]A
1 引言
到目前為止,我國進(jìn)行了六次人口普查和三次人口1%的抽樣調(diào)查,基于對(duì)人口普查數(shù)據(jù)質(zhì)量的質(zhì)疑,對(duì)人口普查數(shù)據(jù)質(zhì)量進(jìn)行檢驗(yàn)是十分必要的。利用兩次普查的數(shù)據(jù)來檢驗(yàn)前一次普查數(shù)據(jù)的質(zhì)量,是評(píng)價(jià)普查數(shù)據(jù)質(zhì)量的一個(gè)重要方法。由于近年來,我國人口普查十年為一個(gè)周期,故也可以利用這十年中的人口1%抽樣調(diào)查資料對(duì)人口的漏報(bào)情況進(jìn)行估計(jì)。本文就是在這兩種數(shù)據(jù)基礎(chǔ)上,對(duì)貴州省第五次人口普查(以下簡稱“五普”)存在的漏報(bào)情況進(jìn)行估計(jì)和評(píng)價(jià)。
“五普”數(shù)據(jù)顯示:截至2000年11月1日零時(shí),貴州省總?cè)丝跒?5247695人,男性人口占52.38%,女性人口占47. 62 %,性別比(以女性為100,男性對(duì)女性的比例)為110.02∶100,略高于106~108此正常比例范圍 ,同時(shí)也高于全國106.74的平均水平。
2 用貴州省“六普”數(shù)據(jù)來檢驗(yàn) “五普”人口漏報(bào)率的情況分析
2010年貴州省第六次人口普查(以下簡稱“六普”)數(shù)據(jù)顯示:截至2010年11月1日零時(shí),全省常住人口為34746468人,其中,男性人口為17951451人,占51.66%;女性人口為16795017人,占48.34%。2010年總?cè)丝谛詣e比由2000年第五次人口普查的110.02下降為106.89。
2.1 方法與模型
本次對(duì)人口漏報(bào)檢驗(yàn)的方法主要來自于田雪原等提出的多區(qū)域離散人口發(fā)展模型中對(duì)人口普查數(shù)據(jù)的回填方法及處理方式,并且本文未考慮現(xiàn)役軍人的情況,利用2010“六普”數(shù)據(jù)對(duì)2000年的“五普”結(jié)果進(jìn)行漏報(bào)分析,以檢驗(yàn)“五普”數(shù)據(jù)的質(zhì)量。
采用的公式如下:
公式中的符號(hào)分別表示:
Pm(2000,x)、Pf(2000,x):2000年x歲男性、女性人口數(shù)
EPm(2000,x)、EPf(2000,x):倒推回去的2000年x歲男性、女性人口數(shù)
△Pm(2000,x)、△Pf(2000,x):估計(jì)得到的 “五普”人口中x歲男性、女性的誤報(bào)量。
當(dāng)△值為正時(shí),表示不能確定2000年該年齡是否存在漏報(bào);而當(dāng)△值為負(fù)時(shí),確定該年齡存在漏報(bào)。
2.2 所需數(shù)據(jù)的處理
由于“五普”和“六普”數(shù)據(jù)反映的時(shí)點(diǎn)一致,故可以直接用于比較計(jì)算。將貴州省“五普”和“六普”中分性別、分年齡的人口死亡率進(jìn)行線性插值,分別計(jì)算從2000年到2010年各年間分性別、分年齡的死亡率。
利用上述公式計(jì)算回填后貴州省2000年分性別、分年齡的人口數(shù),與2000年普查數(shù)據(jù)進(jìn)行對(duì)比,計(jì)算分性別、分年齡的漏報(bào)量和漏報(bào)率。
2.3 用“六普”數(shù)據(jù)估計(jì)得到的2000年分性別、各年齡段人口的漏報(bào)情況
估計(jì)的“五普”數(shù)據(jù)中,人口總的漏報(bào)量為54.6萬人,其中男性漏報(bào)24.6萬人,女性漏報(bào)30.0萬人。從各個(gè)年齡組來看,0~4歲、30~49歲、50歲以上三個(gè)年齡組的男性、女性誤報(bào)量均為負(fù)數(shù),確定這三個(gè)組均存在漏報(bào),其中0~4歲年齡組是漏報(bào)現(xiàn)象最嚴(yán)重的組別,漏報(bào)規(guī)模最小的是30~49歲年齡組。在5~9歲、10~17歲年齡組誤報(bào)量的估計(jì)值為正,不能確定是否存在漏報(bào)。而18~29歲年齡組中只能確定女性漏報(bào)規(guī)模較大。從漏報(bào)量在性別上的分布來看,女性的漏報(bào)情況較為突出,在漏報(bào)現(xiàn)象最嚴(yán)重的0~4歲年齡組,女性漏報(bào)量為23.3萬人,比男性多2.7萬人。估計(jì)得到的總?cè)丝诼﹫?bào)率為 1.55%。
3 利用《2005年貴州省1%人口抽樣調(diào)查資料》估計(jì)2000年“五普”人口漏報(bào)情況
《2005年貴州省1%人口抽樣調(diào)查資料》的數(shù)據(jù)顯示,此次調(diào)查的總?cè)丝跒?4.2萬人,男性22.8萬人,女性21.4萬人。男女性別比為106.2。在此次抽樣過程中,樣本容量達(dá)到69萬人,占全省總?cè)丝诘?.85%。對(duì)2000年人口數(shù)據(jù)的估計(jì),具體步驟如下。
3.1 方法與模型
此方法是在上述模型和方法的基礎(chǔ)上,根據(jù)2005年的1%普查數(shù)據(jù),進(jìn)行改進(jìn)的結(jié)果。同樣可以去估計(jì)“五普”數(shù)據(jù)的質(zhì)量。采用的計(jì)算方法如下:
同樣地,當(dāng)△值為正時(shí),表示不能確定2000年該年齡是否存在漏報(bào);而當(dāng)△值為負(fù)時(shí),確定該年齡存在漏報(bào)。
3.2 所需要數(shù)據(jù)處理
3.2.1 2005年抽樣調(diào)查得到的人口為44.2萬人,占2005年貴州省總?cè)丝诘谋壤秊?.19%。按照這樣的比例,將各年齡的人口分別進(jìn)行回填。
3.2.2 采用線性插值法估計(jì)2000~2005年之間各年齡死亡概率。公式如下:
0歲人口死亡概率,其中r取經(jīng)驗(yàn)值0.25。
其他年齡組死亡概率
其中,mx表示x歲人口的死亡率。
2001~2004年各年齡別死亡概率的計(jì)算,是根據(jù)2000年和2005年死亡概率,采用線性插值法得到。
3.3 2000年按年齡分組的漏報(bào)情況
利用2005年貴州省1%人口抽樣調(diào)查資料》估計(jì)得到的2000年“五普”人口漏報(bào)結(jié)果顯示,總?cè)丝诘穆﹫?bào)量為304.6萬人,其中男性漏報(bào)144.7萬人,女性漏報(bào)159.9萬人。 從各個(gè)年齡組來看, 0~9歲、30~49歲和50歲以上年齡組的漏報(bào)規(guī)模都較大,最為嚴(yán)重的是0~9歲年齡組;10~17歲年齡組誤報(bào)量為正,不能由此確定是否存在漏報(bào);18~29歲組女性存在漏報(bào)。從性別上來看,女性漏報(bào)情況較男性突出,但在各個(gè)年齡組表現(xiàn)不同。漏報(bào)情況最嚴(yán)重的0~9歲年齡組,男性漏報(bào)64.6萬人多于女性4.8萬人,占0~9歲原始人口的15.27%;而30~49歲年齡段女性漏報(bào)多于男性19萬人???cè)丝诼﹫?bào)率為8.64%。
4 兩種估計(jì)結(jié)果對(duì)貴州省“五普”漏報(bào)情況分析
兩種估計(jì)結(jié)果顯示,貴州省“五普”數(shù)據(jù)均存在漏報(bào)情況,而且在0~9歲年齡段表現(xiàn)尤其明顯。但是總?cè)丝诘穆﹫?bào)率卻差異較大,用“六普”數(shù)據(jù)估算的漏報(bào)率為1.55%,而用《2005年貴州省1%人口抽樣調(diào)查資料》估算的漏報(bào)率達(dá)8.64%。漏報(bào)情況在性別差異上,兩種估計(jì)結(jié)果一致,女性漏報(bào)情況較突出。
用“六普”數(shù)據(jù)估算的漏報(bào)率為何遠(yuǎn)低于《2005年貴州省1%人口抽樣調(diào)查資料》估算結(jié)果?分析其中原因,本文認(rèn)為與如下因素有關(guān)。
與抽樣調(diào)查這一統(tǒng)計(jì)調(diào)查的組織方式有關(guān)。人口的1%抽樣調(diào)查采用分層、多階段、整群、概率比例多種抽樣方法進(jìn)行,所以會(huì)和普查的結(jié)果存在一定的差異。
在用1%人口抽樣數(shù)據(jù)去估計(jì)2005年各年齡組分性別的人口數(shù)時(shí),各年齡人口是按相同的比例1.19%進(jìn)行的回填,即各年齡人口數(shù)均勻分布的假設(shè)不是很合理。
第六次人口普查數(shù)據(jù)的質(zhì)量尚未進(jìn)行檢驗(yàn)。如果用一個(gè)質(zhì)量不好的數(shù)據(jù)去檢測另一個(gè)數(shù)據(jù),其準(zhǔn)確性也會(huì)受到一定的質(zhì)疑。
總之,貴州省第五次人口普查的數(shù)據(jù)存在一定程度的漏報(bào)情況,而且漏報(bào)現(xiàn)象在低年齡組的表現(xiàn)較為明顯,從性別來看,男性和女性的漏報(bào)情況也存在一定的差異。
[參考文獻(xiàn)]
[1] 田雪原,等.21世紀(jì)中國人口發(fā)展戰(zhàn)略研究[M].北京:社會(huì)科學(xué)文獻(xiàn)出版社,2007.
[2] 曾毅等.21世紀(jì)中國人口與經(jīng)濟(jì)發(fā)展[M].北京:社會(huì)科學(xué)文獻(xiàn)出版社,2006.
[3] 溫勇、尹勤.人口統(tǒng)計(jì)學(xué)[M].江蘇:東南大學(xué)出版社,2006.
[4] 貴州省統(tǒng)計(jì)局.貴州省2010年人口普查資料[M].北京:中國統(tǒng)計(jì)出版社,2012.
[5] 貴州省統(tǒng)計(jì)局.貴州省2000年人口普查資料[M].北京:中國統(tǒng)計(jì)出版社,2002.
[6] 貴州省統(tǒng)計(jì)局.2005年貴州省1%人口抽樣調(diào)查資料[M].北京:中國統(tǒng)計(jì)出版社,2007.
[7] 朱淑娟. 貴州省勞動(dòng)力供求狀況分析及預(yù)測[D].貴陽:貴州財(cái)經(jīng)大學(xué),2011.