国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人口普查凈覆蓋誤差估計(jì)

2022-02-28 05:11葉寶紅胡桂華
關(guān)鍵詞:人口數(shù)方差普查

葉寶紅,胡桂華

人口普查凈覆蓋誤差估計(jì)

*葉寶紅,胡桂華

(重慶工商大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶 400067)

針對(duì)我國(guó)和其它許多國(guó)家的政府統(tǒng)計(jì)部門(mén)在應(yīng)用雙系統(tǒng)估計(jì)量時(shí),忽視對(duì)總體人口等概率分層、未考慮人口移動(dòng),以及未采取科學(xué)有效的方法計(jì)算雙系統(tǒng)估計(jì)量抽樣方差的問(wèn)題,提出建立基于捕獲-再捕獲模型的雙系統(tǒng)估計(jì)量及分層刀切抽樣方差估計(jì)量的研究目標(biāo)。為實(shí)現(xiàn)目標(biāo),采取現(xiàn)場(chǎng)調(diào)查、抽樣估計(jì)及文獻(xiàn)解讀相結(jié)合的方法研究全面登記和抽樣登記的雙系統(tǒng)估計(jì)量及其方差估計(jì)。研究發(fā)現(xiàn),雙系統(tǒng)估計(jì)量須在等概率人口層建立及使用,否則產(chǎn)生異質(zhì)性偏差,低估總體實(shí)際人口數(shù)及凈覆蓋誤差。研究創(chuàng)新在于,在對(duì)美國(guó)人口移動(dòng)處理方法深入研究的基礎(chǔ)上,構(gòu)造出適合于在我國(guó)應(yīng)用的人口移動(dòng)的、抽樣登記的雙系統(tǒng)估計(jì)量。研究?jī)r(jià)值在于,所建立的雙系統(tǒng)估計(jì)量有望應(yīng)用于我國(guó)2030年人口普查凈覆蓋誤差估計(jì)。

事后計(jì)數(shù)調(diào)查;捕獲-再捕獲模型;分層刀切抽樣方差估計(jì)量

0 引言

在每次人口普查中,有些人漏報(bào),有些人多報(bào)。漏報(bào)人口數(shù)可能多于或小于多報(bào)人口數(shù)。如果漏報(bào)人口數(shù)多于多報(bào)人口數(shù),就是凈漏報(bào);反之就是凈多報(bào)。凈多報(bào)或凈漏報(bào),統(tǒng)稱為凈普查覆蓋誤差。凈漏報(bào)或凈多報(bào)既可以表現(xiàn)為普查漏報(bào)與多報(bào)人口數(shù)之差,也可以表現(xiàn)為總體實(shí)際人口數(shù)與總體普查登記人口數(shù)之差。除加拿大等少數(shù)國(guó)家外,包括我國(guó)和美國(guó)在內(nèi)的許多國(guó)家通過(guò)估計(jì)總體實(shí)際人口數(shù),再將其減去普查登記人口數(shù),得到人口普查凈覆蓋誤差[1]。人口統(tǒng)計(jì)分析模型和雙系統(tǒng)估計(jì)量是估計(jì)總體實(shí)際人口數(shù)的主流方法。人口行政記錄健全的發(fā)達(dá)國(guó)家同時(shí)采用這兩種方法估計(jì)凈覆蓋誤差。發(fā)展中國(guó)家大多采用雙系統(tǒng)估計(jì)量估計(jì)凈覆蓋誤差。本研究采用雙系統(tǒng)估計(jì)量估計(jì)凈覆蓋誤差[2]。雙系統(tǒng)估計(jì)量依據(jù)同一樣本普查小區(qū)的事后計(jì)數(shù)調(diào)查人口名單和普查人口名單構(gòu)造,其理論基礎(chǔ)是最初估計(jì)野生動(dòng)物總體規(guī)模的捕獲-再捕獲模型。事后計(jì)數(shù)調(diào)查在人口普查登記工作結(jié)束后實(shí)施,屬于抽樣調(diào)查,抽樣單位通常是較小范圍的地理區(qū)域,如我國(guó)的普查小區(qū),平均含250人。

雙系統(tǒng)估計(jì)量經(jīng)歷了四個(gè)研究階段。經(jīng)歷了這四個(gè)研究階段,才研發(fā)了用于人口總體規(guī)模估計(jì)的雙系統(tǒng)估計(jì)量。

第一個(gè)階段是其起源,即捕獲-再捕獲模型[3]。該模型等于對(duì)同一總體兩次捕獲的動(dòng)物數(shù)目的乘積除以同時(shí)在兩次捕獲中同時(shí)捕獲到的動(dòng)物數(shù)目。丹麥的Petersen(1896)和美國(guó)的Lincoln(1930)是捕獲-再捕獲模型的創(chuàng)始人[4-5]。正是由于他們兩人的研究,才產(chǎn)生了捕獲-再捕獲模型,稱之為L(zhǎng)incoln-Petersen估計(jì)量。

第二階段是將捕獲-再捕獲模型移植到人類總體構(gòu)造全面登記的雙系統(tǒng)估計(jì)量[6]。捕獲-再捕獲模型要求兩次捕獲均是對(duì)同一總體的全面捕獲。然而,在事后計(jì)數(shù)調(diào)查中,我們無(wú)法得到總體的全面信息。這就需要首先假設(shè)事后計(jì)數(shù)調(diào)查是對(duì)總體的全面登記。另外,還需要對(duì)總體人口按照人口統(tǒng)計(jì)特征變量和地理位置變量交叉分層,形成若干等概率人口層[7],在每個(gè)等概率人口層建立雙系統(tǒng)估計(jì)量。如果直接在總體中構(gòu)造雙系統(tǒng)估計(jì)量,會(huì)產(chǎn)生異質(zhì)性偏差,即由于總體人口在普查中登記概率不同而增大雙系統(tǒng)估計(jì)量的分母,從而造成雙系統(tǒng)估計(jì)量低估總體實(shí)際人口數(shù)。

第三階段是構(gòu)造人口移動(dòng)的全面登記的雙系統(tǒng)估計(jì)量[8-12]。在事后計(jì)數(shù)調(diào)查期間不可避免地會(huì)有人口移動(dòng)。移動(dòng)的人口共分為三種,即無(wú)移動(dòng)人口(non-movers,縮寫(xiě)為)、向外移動(dòng)人口(out-movers,縮寫(xiě)為)和向內(nèi)移動(dòng)人口(in-movers,縮寫(xiě)為)。向外移動(dòng)人口是指人們從普查時(shí)居住的小區(qū)搬到了另外的普查小區(qū)。向內(nèi)移動(dòng)人口指的是人們事后計(jì)數(shù)調(diào)查時(shí)從原來(lái)的普查小區(qū)搬到了現(xiàn)在的普查小區(qū)居住。美國(guó)普查局提出了三種處理人口移動(dòng)的方法,即A方法、B方法和C方法。其中C方法使用最為普遍。美國(guó)在2000年普查試點(diǎn)調(diào)查中測(cè)試了方法C,并且應(yīng)用于2000年事后計(jì)數(shù)調(diào)查。方法C是指,使用向內(nèi)移動(dòng)者數(shù)目作為移動(dòng)者數(shù)目,這是可靠的數(shù)據(jù),因?yàn)樗鼇?lái)自向內(nèi)移動(dòng)者本身。使用向外移動(dòng)者匹配率估計(jì)移動(dòng)者匹配率,以避免比對(duì)向內(nèi)移動(dòng)者出現(xiàn)的困難。

第四階段是構(gòu)造人口移動(dòng)的抽樣登記的雙系統(tǒng)估計(jì)量[13-16]。在考慮人口移動(dòng)情況下,雙系統(tǒng)估計(jì)量公式中含有下列7個(gè)指標(biāo):人口普查登記人數(shù)、人口普查正確登記人數(shù)、無(wú)移動(dòng)人數(shù)、向內(nèi)移動(dòng)人數(shù)、向外移動(dòng)人數(shù)、無(wú)移動(dòng)者中匹配人數(shù)、向外移動(dòng)者中匹配人數(shù),這里說(shuō)的這7個(gè)指標(biāo)都是總體值。在對(duì)人口有限總體實(shí)施概率抽樣的條件下,須依據(jù)所用的抽樣方法構(gòu)造7個(gè)指標(biāo)的估計(jì)量,用以代替公式中的7個(gè)指標(biāo),這樣就是雙系統(tǒng)估計(jì)量的估計(jì)量。

本研究創(chuàng)新體現(xiàn)在三個(gè)方面。一方面,從捕獲-再捕獲模型推導(dǎo)出雙系統(tǒng)估計(jì)量,解析了它們之間內(nèi)在的邏輯關(guān)系。另一方面,深入解讀了美國(guó)普查局提出的處理人口移動(dòng)的A方法、B方法和C方法。最后一方面,通過(guò)實(shí)際案例,全面演示了雙系統(tǒng)估計(jì)量及其抽樣方差估計(jì)量的詳細(xì)計(jì)算過(guò)程,從而有助于雙系統(tǒng)估計(jì)量在我國(guó)的推廣應(yīng)用。

1 捕獲-再捕獲模型

如果一次全面捕獲無(wú)法得到滿意的總體動(dòng)物數(shù)目時(shí),需要采取全面捕獲-再捕獲模型估計(jì)總體中的動(dòng)物數(shù)目。全面捕獲-再捕獲模型的基本思想是,對(duì)總體進(jìn)行第一次全面捕獲,對(duì)捕獲的動(dòng)物做上記號(hào),放回總體。等待幾天,讓做上記號(hào)的動(dòng)物和在第一次全面捕獲中沒(méi)有捕獲到的動(dòng)物混合均勻。再次捕獲同一總體的動(dòng)物。如果這兩次捕獲相互獨(dú)立,那么在第一次捕獲中做上記號(hào)的動(dòng)物數(shù)目比例就等于第二次捕獲做上記號(hào)的動(dòng)物比例。解這個(gè)方程,即可以得到總體動(dòng)物數(shù)目的估計(jì)值。

表1 全面捕獲-再捕獲模型

Table 1 Full capture-recapture model

捕獲情況在第二次捕獲不在第二次捕獲 在第一次捕獲 不在第一次捕獲

由表1得到:

在上述的假設(shè)(尤其是獨(dú)立性假設(shè))下,如果一個(gè)個(gè)體在第一次全面捕獲中捕獲,則該個(gè)體在第二次全面捕獲中捕獲的概率為:

以及在第一次全面捕獲中沒(méi)有捕獲而在第二次全面捕獲中捕獲的概率為:

式(2)和式(3)相同,故

由式(4)可以得到:

2 雙系統(tǒng)估計(jì)量及其方差估計(jì)

2.1 雙系統(tǒng)估計(jì)量

依據(jù)式(6)可得:

鑒于中國(guó)在歷次人口普查質(zhì)量評(píng)估中一直采取B處理方法,且找到向外移動(dòng)者難度較大,以及向內(nèi)移動(dòng)者在本樣本普查小區(qū)和了解向內(nèi)移動(dòng)者普查時(shí)點(diǎn)的登記地和登記情況不會(huì)遇到太大困難,于是采取B處理方法。此時(shí)事后計(jì)數(shù)調(diào)查人口由無(wú)移動(dòng)人口和向內(nèi)移動(dòng)人口構(gòu)成。相應(yīng)地,事后計(jì)數(shù)調(diào)查匹配人口由無(wú)移動(dòng)人口的匹配人口和向內(nèi)移動(dòng)人口的匹配人口構(gòu)成。匹配人口指同時(shí)登記在普查名單與事后計(jì)數(shù)調(diào)查名單的人口。在事后計(jì)數(shù)調(diào)查比對(duì)實(shí)踐中發(fā)現(xiàn),有些人只登記在事后計(jì)數(shù)調(diào)查名單或普查名單。對(duì)事后計(jì)數(shù)調(diào)查的無(wú)移動(dòng)人口,其普查名單和事后計(jì)數(shù)調(diào)查名單均在本樣本普查小區(qū),比對(duì)工作在同一樣本小區(qū)內(nèi)進(jìn)行。向內(nèi)移動(dòng)人口,其普查名單在其他小區(qū),事后計(jì)數(shù)調(diào)查在本樣本小區(qū)。通過(guò)函證可以獲悉向內(nèi)移動(dòng)者在普查中的登記情況。如果在本樣本小區(qū)登記,在其他小區(qū)又進(jìn)行了普查登記,那么向內(nèi)移動(dòng)者就是本樣本小區(qū)的匹配人口。據(jù)此分析,式(8)變?yōu)槭剑?):

如果采取A構(gòu)成法,那么式(8)變?yōu)槭剑?0):

在事后計(jì)數(shù)調(diào)查日,向外移動(dòng)者已經(jīng)不在本樣本普查小區(qū),找到其本人難度不小,由其鄰居提供其信息有誤差。因此本文采取式(9)構(gòu)造的雙系統(tǒng)估計(jì)量。

分層二重抽樣適合于包括美國(guó)和中國(guó)在內(nèi)的許多國(guó)家的人口普查質(zhì)量評(píng)估的現(xiàn)實(shí)情況[17-20]。美國(guó)采用的抽樣單位是街區(qū)群,中國(guó)采用的是普查小區(qū)。美國(guó)街區(qū)群規(guī)模差異大,在第一重抽樣中需要按照街區(qū)群規(guī)模分層,在各個(gè)抽樣層抽取第一重樣本。在第二重抽樣中,美國(guó)對(duì)第一重樣本按照街區(qū)群地址誤差率進(jìn)一步分層,在各個(gè)新層抽取第二重樣本。中國(guó)雖然普查小區(qū)規(guī)模差異小,但城鄉(xiāng)普查小區(qū)存在較大差異,在抽取第一重樣本前,需要對(duì)全國(guó)或?。ㄗ灾螀^(qū)、直轄市)的普查小區(qū)按照城鄉(xiāng)分層,在城市層和鄉(xiāng)村層分別抽取第一重樣本。對(duì)從城市層和鄉(xiāng)村層抽取的第一重樣本,按照調(diào)查難度再分層,在每個(gè)新層抽取第二重樣本。

需要說(shuō)明的是,本文采用的分層二重抽樣與國(guó)內(nèi)外出版的抽樣調(diào)查專著有本質(zhì)區(qū)別。區(qū)別在于,前者無(wú)論在第一重抽樣,還是在第二重抽樣之前,均對(duì)抽樣對(duì)象進(jìn)行了分層,并且兩次分層采用的分層變量不同。

式(11)中的每一個(gè)估計(jì)量采取式(12)統(tǒng)一表示為:

將式(12)代入式(11),即可以得到抽樣登記的雙系統(tǒng)估計(jì)量。

2.2 雙系統(tǒng)估計(jì)量的抽樣方差估計(jì)量

在構(gòu)造雙系統(tǒng)估計(jì)量后,還要構(gòu)造其抽樣方差估計(jì)量。從式(11)可以看出,雙系統(tǒng)估計(jì)量是一個(gè)很復(fù)雜的估計(jì)量。對(duì)于復(fù)雜估計(jì)量,無(wú)法精確計(jì)算其抽樣方差,只能近似估計(jì)。刀切法是近似計(jì)算復(fù)雜估計(jì)量方差的重要方法之一。刀切法是復(fù)制方法之一,復(fù)制方差估計(jì)在復(fù)雜抽樣調(diào)查中十分受歡迎[21]。復(fù)制方法不需要計(jì)算泰勒展開(kāi)式的偏導(dǎo)數(shù),用戶可以較為輕易得到方差估計(jì)值,而無(wú)需知道用于收集數(shù)據(jù)的抽樣設(shè)計(jì)方案。提供復(fù)制權(quán)數(shù)后,用戶分析數(shù)據(jù)結(jié)構(gòu)不需要諸如層標(biāo)識(shí)符之類的設(shè)計(jì)信息。

(21)

在式(23)中,

3 凈覆蓋誤差估計(jì)

4 實(shí)證分析

4.1 資料來(lái)源及樣本數(shù)據(jù)

實(shí)證對(duì)象是廣西南寧市西鄉(xiāng)塘區(qū)一個(gè)城鄉(xiāng)交匯處,實(shí)證資料是第六次人口普查標(biāo)準(zhǔn)時(shí)點(diǎn)(2010年11月1日零時(shí))上的普查人口名單及其事后計(jì)數(shù)調(diào)查人口名單。實(shí)證目標(biāo)是估計(jì)這個(gè)城鄉(xiāng)交匯處該時(shí)點(diǎn)的實(shí)際人口數(shù)及其凈覆蓋誤差。獲取資料的辦法,是在與當(dāng)?shù)赜嘘P(guān)機(jī)構(gòu)簽訂數(shù)據(jù)使用保密協(xié)議的情況,通過(guò)該機(jī)構(gòu)調(diào)查取得數(shù)據(jù)。

表2 - 表9中的數(shù)據(jù)是樣本微觀個(gè)人數(shù)據(jù),是計(jì)算總體雙系統(tǒng)估計(jì)值及其抽樣方差估計(jì)值、協(xié)方差估計(jì)值、凈覆蓋誤差估計(jì)值,以及小區(qū)域凈覆蓋誤差估計(jì)值的基礎(chǔ)。

表2 抽樣層及樣本量

Table 2 Sampling layer and sample size

層h層h小區(qū)總數(shù)層h樣本小區(qū)總數(shù)層g層hg小區(qū)總數(shù)層hg樣本小區(qū)總數(shù)

表3 樣本普查小區(qū)抽樣權(quán)數(shù)

Table 3 Sampling weights of the sample census

60071,1421,1,1√171 60071,1421,1,2√171 60071,1421,1,3171 60071,1421,1,4171 60071,2321,2,5√129 60071,2321,2,6√129 60071,2321,2,7129 40062,1322,1,8√100 40062,1322,1,9√100 40062,1322,1,10100 40062,2322,2,11√100 40062,2322,2,12√100 40062,2322,2,13100

注意:√表示第一重樣本普查小區(qū)進(jìn)入第二重樣本,即1、2、5、6、8、9、11、12為第二重樣本普查小區(qū)。

表4 等概率人口層“男、0-14歲”未加權(quán)樣本人口數(shù)

Table 4 Unweighted sample population of “male, 0-14 years old” in equal probability population strata

樣本小區(qū)普查登記人口數(shù)目標(biāo)總體普查人口數(shù)無(wú)移動(dòng)者人口數(shù)向內(nèi)移動(dòng)者人口數(shù)無(wú)移動(dòng)匹配者人口數(shù)向內(nèi)移動(dòng)者匹配人口數(shù) 12922314243 22721293222 53023346253 62723315253 82819325213 93124333263 112822304233 123022356254

表5 等概率人口層“男、15-59歲”未加權(quán)樣本人口數(shù)

Table 5 Unweighted sample population of "male, 15-59 years old" in equal probability population strata

樣本小區(qū)普查登記人口數(shù)目標(biāo)總體普查人口數(shù)無(wú)移動(dòng)者人口數(shù)向內(nèi)移動(dòng)者人口數(shù)無(wú)移動(dòng)匹配者人口數(shù)向內(nèi)移動(dòng)者匹配人口數(shù) 18369898747 27866858687 58771937745 67765815684 88170844723 98873936775 118067868716 1285699310738

表6 等概率人口層“男、60歲及以上”未加權(quán)樣本人口數(shù)

Table 6 Unweighted sample population of "male, 60 years old and above" in equal probability population strata

樣本小區(qū)普查登記人口數(shù)目標(biāo)總體普查人口數(shù)無(wú)移動(dòng)者人口數(shù)向內(nèi)移動(dòng)者人口數(shù)無(wú)移動(dòng)匹配者人口數(shù)向內(nèi)移動(dòng)者匹配人口數(shù) 11513173142 21411152122 51713215154 61412164133 81512184133 91611205144 111510205124 121614194152

表7 等概率人口層“女、0-14歲”未加權(quán)樣本人口數(shù)

Table 7 Unweighted sample population of “female, 0-14 years old” in equal probability population strata

樣本小區(qū)普查登記人口數(shù)目標(biāo)總體普查人口數(shù)無(wú)移動(dòng)者人口數(shù)向內(nèi)移動(dòng)者人口數(shù)無(wú)移動(dòng)匹配者人口數(shù)向內(nèi)移動(dòng)者匹配人口數(shù) 12421274233 22320253223 52623305243 62218266194 82419296215 92622326255 112320275213 122621305234

表8 等概率人口層“女、15-59歲”未加權(quán)樣本人口數(shù)

Table 8 Unweighted sample population of “female, 15-59 years old” in equal probability population strata

樣本小區(qū)普查登記人口數(shù)目標(biāo)總體普查人口數(shù)無(wú)移動(dòng)者人口數(shù)向內(nèi)移動(dòng)者人口數(shù)無(wú)移動(dòng)匹配者人口數(shù)向內(nèi)移動(dòng)者匹配人口數(shù) 17768838706 27266799697 58170845724 67158755614 87563797666 98271899757 117461796656 127969869737

表9 概率人口層“女、60歲及以上”未加權(quán)樣本人口數(shù)

Table 9 Unweighted sample population of "female, 60 years old and above" in equal probability population strata

樣本小區(qū)普查登記人口數(shù)目標(biāo)總體普查人口數(shù)無(wú)移動(dòng)者人口數(shù)向內(nèi)移動(dòng)者人口數(shù)無(wú)移動(dòng)匹配者人口數(shù)向內(nèi)移動(dòng)者匹配人口數(shù) 11715193162 21613182142 51816203152 61511173132 81613172141 91815214173 111614183152 121715182161

4.2 計(jì)算等概率人口層的實(shí)際人口數(shù)及凈覆蓋誤差

首先依據(jù)式(12),以及表2 - 表9數(shù)據(jù)計(jì)算各個(gè)等概率人口層每個(gè)單元的加權(quán)人口數(shù),見(jiàn)表10;然后獲得各個(gè)等概率人口層的普查數(shù)據(jù)定義人口數(shù),見(jiàn)表11;最后使用式(11)、式(22)、式(25)和表10數(shù)據(jù),計(jì)算等概率人口層及總體的雙系統(tǒng)估計(jì)值、凈覆蓋誤差估計(jì)值,見(jiàn)表12。

表10 各個(gè)等概率人口層雙系統(tǒng)估計(jì)量單元的加權(quán)人口數(shù)

Table 10 Weighted population of the dual system estimator units of each equal probability population strata

等概率層加權(quán)普查登記人口數(shù)加權(quán)目標(biāo)總體普查人數(shù)加權(quán)無(wú)移動(dòng)者人口數(shù)加權(quán)向內(nèi)移動(dòng)者人口數(shù)加權(quán)無(wú)移動(dòng)匹配者人口數(shù)加權(quán)向內(nèi)移動(dòng)者匹配人口數(shù) v=12862921987316454416238162929 v=28208768529878007084719005755 v=31515812029179453816134582887 v=42412920500279164816222423629 v=57608765826815137297688265855 v=61660013971185002729149421900

從表10可以看出,各等概率人口層的雙系統(tǒng)估計(jì)量單元包括普查登記人數(shù)、目標(biāo)總體普查人數(shù)、無(wú)移動(dòng)人數(shù)、向內(nèi)移動(dòng)人數(shù)、無(wú)移動(dòng)者匹配人數(shù)和向內(nèi)移動(dòng)者匹配人數(shù)。各單元人口數(shù)乘以相應(yīng)層抽樣權(quán)數(shù)可得各個(gè)等概率人口層雙系統(tǒng)估計(jì)量單元的加權(quán)人口數(shù)。在表10中,以層=2為例,加權(quán)普查登記人口數(shù)為82087,加權(quán)目標(biāo)總體普查人數(shù)為68529,加權(quán)無(wú)移動(dòng)者人口數(shù)87800,加權(quán)向內(nèi)移動(dòng)者人口數(shù)7084,加權(quán)無(wú)移動(dòng)匹配者人口數(shù)71900,加權(quán)向內(nèi)移動(dòng)者匹配人口數(shù)5755。

表11 各個(gè)等概率人口層的普查數(shù)據(jù)定義人口數(shù)()

表11列示了各個(gè)等概率人口層的普查數(shù)據(jù)定義人口數(shù)。這些數(shù)據(jù)是已知數(shù),是估計(jì)普查目標(biāo)總體普查登記人口數(shù)的基礎(chǔ)數(shù)據(jù)。須知,不能使用普查登記人口數(shù)作為估計(jì)普查目標(biāo)總體普查登記人口數(shù)的基礎(chǔ)數(shù)據(jù)。

表12 實(shí)際人口數(shù)、凈覆蓋誤差估計(jì)值

Table 12 Actual population and estimated net coverage error

等概率人口層普查登記人口數(shù)實(shí)際人口數(shù)凈覆蓋誤差 絕對(duì)數(shù)相對(duì)數(shù)(%) 男、0 - 14歲28973293854121.40 男、15 - 59歲800548164815941.95 男、60歲及以上1768917732430.24 女、0 - 14歲2699927026270.09 女、15 - 59歲79898801352370.29 女、60歲及以上1756417609450.26 總體25117725353523580.93

從表12可以看出:總體凈覆蓋誤差為2358人,表明剔除普查多報(bào)人口數(shù)后在普查登記中凈漏報(bào)2358人,凈漏報(bào)率為0.93%。從各個(gè)等概率人口層的凈覆蓋誤差率來(lái)看,“男、15 - 59歲”的凈覆蓋誤差率最大,為1.95%,而凈覆蓋誤差率最小的是“0 - 14歲”,為0.09%。這表明,前者在普查中的漏報(bào)嚴(yán)重,普查登記質(zhì)量差;而后者的漏報(bào)情況最低,普查登記質(zhì)量好。

4.3 計(jì)算等概率人口層及總體的抽樣方差與協(xié)方差

雙系統(tǒng)估計(jì)量復(fù)雜,抽樣方差采取分層刀切抽樣方差估計(jì)量近似計(jì)算。先使用式(16)和表3數(shù)據(jù)來(lái)計(jì)算復(fù)制權(quán)數(shù),尤其是進(jìn)入第二重樣本的樣本普查小區(qū)的復(fù)制權(quán)數(shù),見(jiàn)表13。然后依據(jù)復(fù)制權(quán)數(shù),使用式(18)、(19)、(21)和表4-表9數(shù)據(jù)計(jì)算等概率人口層的抽樣方差和協(xié)方差,見(jiàn)表14。

表13 第二重樣本普查小區(qū)的復(fù)制權(quán)數(shù)

Table 13 The replication weights of the second sample census

剔除小區(qū)1256891112 10300200200171171171171 23000200200171171171171 3150150200200171171171171 4150150200200171171171171 51501500200129129129129 61501502000129129129129 7150150100100129129129129 81001001001000160120120 91001001001001600120120 101001001001008080120120 111001001001001201200160 121001001001001201201600 131001001001001201208080

表14 等概率人口層及總體的抽樣方差及協(xié)方差

Table 14 Sampling variance and covariance of equal probability population strata and population

等概率層男、0-14歲男、15-59歲男、60歲以上女、0-14歲女、15-59歲女、60歲以上總體 男、0-14歲247993 220090 86950 41093 -205035 -2133 388958 男、15-59歲220090 499853 -85491 -187728 89271 19455 555450 男、60歲上86950 -85491 355883 125904 -244963 -4299 233984 女、0-14歲41093-187728 125904 552817 -798298 106502 -159710 女、15-59歲-205035 89271 -244963 -798298 144156 -22092 -1036961 女、60歲上-2133 19455 -4299 106502-22092 240456 337889 總體388958555450233984-159710-1036961337889319610

表14為六個(gè)等概率人口層的抽樣方差及協(xié)方差,該抽樣方差及協(xié)方差矩陣是以各等概率人口層抽樣方差為對(duì)稱軸的對(duì)稱矩陣。各個(gè)等概率人口層的抽樣方差及該層與其他各等概率人口層的協(xié)方差之和即為總體的抽樣方差及協(xié)方差。如表14中“女、0-14歲”層的抽樣方差為552817 ,其與“男、0-14歲”、“男、15-59歲”、“男、60歲以上”、“女、15-59歲”、“女、60歲以上”層的協(xié)方差分別為41093、-187728、125904、-798298、106502。總體方差為319610。

5 結(jié)論

1)構(gòu)造雙系統(tǒng)估計(jì)量須滿足的兩個(gè)重要條件是:人口普查與事后計(jì)數(shù)調(diào)查相互獨(dú)立;人口總體中的每一個(gè)人有同樣的概率在普查中登記或者在事后計(jì)數(shù)調(diào)查中登記。在實(shí)際工作中,通過(guò)對(duì)人口普查質(zhì)量評(píng)估工作進(jìn)行一系列的制度規(guī)定來(lái)滿足第一個(gè)條件。至于第二個(gè)條件,則是通過(guò)對(duì)總體進(jìn)行登記概率同質(zhì)性分層來(lái)滿足。具體來(lái)說(shuō),就是尋找適當(dāng)?shù)娜丝诮y(tǒng)計(jì)特征變量和地理位置變量對(duì)總體人口分層。這些分層變量應(yīng)當(dāng)能夠做到,把人口普查登記概率大致相同人口放在同一個(gè)層,把登記概率不同的人口放在不同的層。對(duì)這些選定的分層變量可以有兩種使用方式。一種是用這些分層變量對(duì)總體分層(在實(shí)際操作中用抽樣后分層來(lái)實(shí)現(xiàn)),分別在各層構(gòu)造雙系統(tǒng)估計(jì)量,然后將各層的估計(jì)量在整個(gè)總體(全國(guó))進(jìn)行合成;另一種是把選定的分層變量作為回歸自變量,分別構(gòu)造以人口的普查正確登記概率的Logistic變換為因變量,以及事后計(jì)數(shù)調(diào)查登記與普查登記匹配概率的Logistic變換為因變量的兩個(gè)Logistic回歸模型,對(duì)普查登記全國(guó)名單中每個(gè)人的普查正確登記概率預(yù)測(cè)值除以事后計(jì)數(shù)調(diào)查登記與普查登記匹配概率預(yù)測(cè)值的商求和,將其作為全國(guó)人口數(shù)目的估計(jì)量??梢宰C明,如果這里使用的回歸自變量與前一種方式使用的分層變量相同,那么這里構(gòu)造的估計(jì)量與前者的全國(guó)合成估計(jì)量相等。

2)人口普查質(zhì)量評(píng)估中所使用的抽樣方法屬于復(fù)雜抽樣設(shè)計(jì),所以雙系統(tǒng)估計(jì)量的估計(jì)量方差不能用數(shù)學(xué)解析式直接計(jì)算,而需要選擇適當(dāng)?shù)慕品椒▉?lái)估計(jì)。使用“大折刀”方法。它是把第一步樣本中的各個(gè)抽樣單元(普查小區(qū))逐一重置輪換切掉,每刀切一個(gè)單元之后,用樣本中余下的其他抽樣單元,按雙系統(tǒng)估計(jì)量的估計(jì)量計(jì)算程序,計(jì)算切掉該單元的切斷后復(fù)制估計(jì)量。每個(gè)樣本單元的切斷后復(fù)制估計(jì)量,與無(wú)切斷估計(jì)量的差平方的平均值即為所需要的“大折刀”估計(jì)方差。在這里,各個(gè)切斷后復(fù)制估計(jì)量與無(wú)切斷估計(jì)量相比,除了丟失掉一個(gè)樣本單元之外,余下的各個(gè)抽樣單元的抽樣權(quán)數(shù),也會(huì)隨著它們各自與被切掉單元之間關(guān)系的不同情況,而發(fā)生不同的改變。

[1] 馮乃林,李希如,武潔,等.人口普查的事后質(zhì)量抽查 [R]. 國(guó)家統(tǒng)計(jì)局人口和就業(yè)統(tǒng)計(jì)司, 2012.

[2] 胡桂華.人口普查凈誤差估計(jì)綜述 [J]. 數(shù)理統(tǒng)計(jì)與管理, 2018, 37 (5): 796-814.

[3] 楊貴軍,徐文哲,林意智. 關(guān)于捕獲-再捕獲抽樣的置信區(qū)間 [J]. 統(tǒng)計(jì)與信息論壇, 2013, 28 (7): 9-14.

[4] Petersen C G. The yearly immigration of young plaice into the limfjord from the german sea [R].Danish Biological Station, 1896.

[5] Lincoln F. Calculating Waterfowl Abundance on the Basis of Banding Returns [J].Circular of the Department of Agriculture,1930,118 (6): 1-4.

[6] Sekar C C, Deming W E. On a method of estimating birth and death rates and extent of registration [J]. Journal of the American Statistical Association, 1949, 44 (5): 101-115.

[7] 胡桂華.人口普查質(zhì)量評(píng)估中抽樣后分層變量的選擇 [J]. 數(shù)理統(tǒng)計(jì)與管理,2015, 34 (2): 254-263.

[8] 遲璐婕,胡桂華. 人口數(shù)目估計(jì)的多來(lái)源方法 [J]. 徐州工程學(xué)院學(xué)報(bào), 2021, 36 (2): 84-92.

[9] 胡桂華,莫錦萍,涂火年. 基于捕獲-再捕獲模型的雙系統(tǒng)估計(jì)量模型式框架[J]. 徐州工程學(xué)院學(xué)報(bào):自然科學(xué)版, 2012, 27(4):23-29.

[10] 胡桂華,孫曉宇,康穎,等.人口抽樣調(diào)查方案設(shè)計(jì)研究[J].徐州工程學(xué)院學(xué)報(bào), 2017, 32(4): 24-29.

[11] 胡桂華,武潔. 人口普查質(zhì)量評(píng)估理論與實(shí)踐[M].北京: 中國(guó)社會(huì)科學(xué)出版社, 2016.

[12] 胡桂華,丁宣浩,陳義安,等.人口普查覆蓋誤差估計(jì)量研究 [J]. 數(shù)理統(tǒng)計(jì)與管理, 2018, 37(1):1-12.

[13] Statistics South Africa. Census 2011 Post-enumeration Survey: Results and Methodology [R]. Statistics South Africa, 2012.

[14] U.S. Census Bureau. 2020 Census detailed operational plan for: Post-enumeration survey operation [M]. Washington: U.S. Census Bureau, 2020.

[15] U.S. Bureau of the Census. Accuracy and coverage evaluation of census 2000: Design and methodology [R]. U.S. Census Bureau, 2004.

[16] Patrick J. Cantwell. Dual-system estimation [M]. Springer:Springer Nature, 2015.

[17] 金勇進(jìn).抽樣:理論與應(yīng)用[M]. 2版.北京:高等教育出版社, 2016.

[18] 胡桂華.人口普查凈誤差構(gòu)成部分的估計(jì)[J].統(tǒng)計(jì)研究,2011, 28( 3): 90-100.

[19] 胡桂華,武潔. 人口普查質(zhì)量評(píng)估中Logistic回歸模型的應(yīng)用 [J]. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2015(4):106-122.

[20] 胡桂華,吳東晟. 人口普查質(zhì)量評(píng)估調(diào)查的抽樣設(shè)計(jì)[J]. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2014(4):113-129.

[21] 胡桂華,杜艾卿. 基于單系統(tǒng)估計(jì)量的人口普查內(nèi)容誤差估計(jì) [J]. 數(shù)理統(tǒng)計(jì)與管理, 2018, 37(6): 951-963.

ESTIMATION FOR NET CENSUS COVERAGE ERROR

*YE Bao-hong, HU Gui-hua

(School of Mathematics and Statistics, Chongqing Technology and Business University, Chongqing 400067, China)

In view of the problems that the government statistical departments of our country and many other countries ignore the equal probability stratification of the overall population, do not consider population movement, and fail to adopt scientific and effective methods to calculate the sampling variance of dual-system estimator, when applying dual-system estimator, the research objective on constructing the dual-system estimator and the stratified Jack-Knife sampling variance estimator based on the capture-recapture model is proposed. In order to achieve the goal, a combination of field survey, sampling estimation and literature interpretation is adopted to study the dual-system estimator with complete enumerations and sampling enumerations and its variance estimation. The study finds that the dual-system estimator must be established and used in the equal-probability population stratum, otherwise a heterogeneous bias will occur, which will underestimate the overall actual population and net coverage error. The research innovation lies in the establishment of a dual-system estimator with population movement and sample enumerations, which is suitable for the application in our country based on the in-depth study of the US population movement processing methods. The value of the research is that the established dual-system estimator is expected to be applied to the net coverage error estimation of the 2030 census in our country.

post-count survey; capture-recapture model; stratified Jack-knife sampling variance estimator

1674-8085(2022)01-0008-12

O212

A

10.3969/j.issn.1674-8085.2022.01.002

2021-07-17;

2021-09-25

全國(guó)統(tǒng)計(jì)科學(xué)研究重點(diǎn)項(xiàng)目(2019LZ28);教育部人文社會(huì)科學(xué)研究規(guī)劃基金項(xiàng)目(20YJ910002)

*葉寶紅(1996-),女,重慶璧山人,碩士生,主要從事人口普查質(zhì)量評(píng)估研究(E-mail:820462824@qq.com).

猜你喜歡
人口數(shù)方差普查
立即全面普查 警惕二代粘蟲(chóng)發(fā)生
確定代表名額按戶籍人口數(shù)還是常住人口數(shù)
基于BP神經(jīng)網(wǎng)絡(luò)的吉林省GDP預(yù)測(cè)研究
2018年中國(guó)將開(kāi)展第四次全國(guó)經(jīng)濟(jì)普查
方差生活秀
“陳”姓為臺(tái)灣第一大姓
揭秘平均數(shù)和方差的變化規(guī)律
方差越小越好?
方差在“三數(shù)兩差”問(wèn)題中的妙用
學(xué)習(xí)調(diào)查要“四會(huì)”
长武县| 洪洞县| 汉川市| 泸水县| 田东县| 封开县| 潜山县| 囊谦县| 南溪县| 敖汉旗| 太白县| 通化县| 淮北市| 衡南县| 兰州市| 芮城县| 辽中县| 溧水县| 肥西县| 开原市| 滦平县| 临泽县| 勐海县| 武穴市| 金湖县| 肥东县| 拜泉县| 贵定县| 浦县| 东阳市| 额尔古纳市| 晋中市| 宾阳县| 平泉县| 武胜县| 凤山市| 济宁市| 桂平市| 廉江市| 南江县| 福泉市|