国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人口普查漏報(bào)估計(jì)研究

2020-11-04 03:06胡桂華廖金盆范署姍葉寶紅
關(guān)鍵詞:估計(jì)量漏報(bào)普查

胡桂華, 廖金盆, 范署姍, 葉寶紅, 吳 婷

(重慶工商大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院 經(jīng)濟(jì)社會(huì)應(yīng)用統(tǒng)計(jì)重慶市重點(diǎn)實(shí)驗(yàn)室,重慶 400067)

1 引言

2020 年,中國(guó)、美國(guó)和其他許多國(guó)家將進(jìn)行人口普查及其質(zhì)量評(píng)估.普查漏報(bào)是評(píng)估目標(biāo)之一.為指導(dǎo)各國(guó)政府統(tǒng)計(jì)部門(mén)開(kāi)展普查漏報(bào)評(píng)估工作,聯(lián)合國(guó)統(tǒng)計(jì)司組織世界人口普查質(zhì)量評(píng)估專家撰寫(xiě)人口普查質(zhì)量評(píng)估工作指南.該指南中的未匹配估計(jì)量只是包括了在質(zhì)量評(píng)估調(diào)查中登記而未在普查中登記的漏報(bào)人口,從而低估總體普查漏報(bào)人口數(shù).

為解決上述問(wèn)題,本文在對(duì)現(xiàn)行普查漏報(bào)估計(jì)方法研究的基礎(chǔ)上,提出普查漏報(bào)合成估計(jì)量.該估計(jì)量由兩部分構(gòu)成.第一部分是三個(gè)線性漏報(bào)估計(jì)量,估計(jì)未登記在普查人口名單但至少登記在質(zhì)量評(píng)估調(diào)查人口名單及行政記錄人口名單之一的人數(shù).第二部分是缺失單元漏報(bào)估計(jì)量,估計(jì)未登記在任何名單的人數(shù).

創(chuàng)新體現(xiàn)在兩個(gè)方面.第一,相比目前國(guó)內(nèi)外采用的估計(jì)普查漏報(bào)的逆記錄檢查估計(jì)量、未匹配估計(jì)量和平衡推算估計(jì)量,普查漏報(bào)合成估計(jì)量通過(guò)引入人口行政記錄,可以找到更多的普查漏報(bào)人口.首先,逆記錄檢查,需要在本次全國(guó)人口普查微觀數(shù)據(jù)庫(kù)搜索漏報(bào)人口,這是一項(xiàng)十分艱難的工作,而普查漏報(bào)合成估計(jì)量,只需要比對(duì)同一樣本普查小區(qū)的普查人口名單、質(zhì)量評(píng)估調(diào)查人口名單及行政記錄人口名單,便可以獲得樣本漏報(bào)人口,工作難度小許多.其次,未匹配估計(jì)量,未包括同時(shí)遺漏于普查人口名單及質(zhì)量評(píng)估調(diào)查人口名單的漏報(bào)人口,而普查漏報(bào)合成估計(jì)量同時(shí)包括遺漏于上述三份人口名單的人口.再次,平衡推算估計(jì)量,只能算出普查漏報(bào)人口數(shù),而不能解釋形成漏報(bào)的原因及其漏報(bào)的程度,而普查漏報(bào)合成估計(jì)量,在比對(duì)三份人口名單后,可查明普查漏報(bào)的原因、程度及漏報(bào)在總體中的分布情況.探索普查漏報(bào)的發(fā)生機(jī)制,是漏報(bào)估計(jì)的主要目的.相比中國(guó)2010 年采用的未匹配估計(jì)量計(jì)算的樣本普查漏報(bào)率,普查漏報(bào)合成估計(jì)量,利用抽樣權(quán)數(shù)將樣本擴(kuò)張到總體,估計(jì)總體的普查漏報(bào)率,并且采取刀切法近似計(jì)算抽樣方差.第二,在有限總體概率抽樣條件下,普查漏報(bào)的總體指標(biāo)需要用樣本來(lái)估計(jì).本文給出估計(jì)量的構(gòu)造方法以及估計(jì)量的方差估計(jì)方法.

2 文獻(xiàn)綜述

普查覆蓋誤差包括普查凈誤差、普查多報(bào)與漏報(bào)[1].凈誤差定義為總體實(shí)際人數(shù)與普查登記人數(shù)之差.各國(guó)目前通行的做法是,用基于“捕獲-再捕獲”模型的雙系統(tǒng)估計(jì)量[2]構(gòu)造總體實(shí)際人數(shù)估計(jì)量,把這個(gè)估計(jì)量與普查登記人口數(shù)之差當(dāng)作人口普查凈誤差.未來(lái)可能用基于三次捕獲模型[3,4]的三系統(tǒng)估計(jì)量[5-7]來(lái)取代雙系統(tǒng)估計(jì)量[8-10].

凈誤差估計(jì)的研究成果多于普查漏報(bào)與多報(bào).政府統(tǒng)計(jì)部門(mén)在其所發(fā)布的人口普查質(zhì)量評(píng)估工作報(bào)告中只是簡(jiǎn)單提及普查漏報(bào)的估計(jì)方法或估計(jì)結(jié)果.研究普查漏報(bào)估計(jì)的學(xué)術(shù)論文甚少.漏報(bào)有兩個(gè)特點(diǎn).一是漏報(bào)人口未登記在普查表中,從普查表中得不到漏報(bào)人口信息,要構(gòu)造漏報(bào)估計(jì)量,需要采取間接估計(jì)方法.二是各國(guó)人口普查質(zhì)量評(píng)估結(jié)果顯示,普查漏報(bào)比多報(bào)嚴(yán)重.

逆記錄檢查估計(jì)量、未匹配估計(jì)量和平衡推算估計(jì)量,是估計(jì)總體普查漏報(bào)人口的傳統(tǒng)方法[11].采用逆記錄檢查估計(jì)量的國(guó)家包括加拿大、丹麥、芬蘭、危地馬拉、洪都拉斯、以色列、意大利、荷蘭、挪威、瑞典和美國(guó).逆記錄檢查抽樣框由上次普查登記人口、上次普查漏報(bào)人口、上次到本次普查出生及遷入人口組成.樣本由人構(gòu)成.對(duì)每一個(gè)樣本個(gè)人,在本次全國(guó)普查微觀數(shù)據(jù)庫(kù)搜索,尋找與其相同的人.如果找到,就稱該樣本個(gè)人為匹配人口,否則稱為未匹配人口,即普查漏報(bào)人口.逆記錄檢查估計(jì)量為樣本個(gè)人與其抽樣權(quán)數(shù)的線性估計(jì)量.其優(yōu)勢(shì)是,由于逆記錄檢查與本次普查獨(dú)立,因而避免了因這兩項(xiàng)調(diào)查不獨(dú)立引起的交互作用偏差而低估或高估普查漏報(bào)人口數(shù).其劣勢(shì)是自上次普查之后,樣本個(gè)人可能已經(jīng)離開(kāi)原來(lái)居住的地方,或者死亡、更改了姓名,找到他們有困難,難以判斷這些人是在本次普查中登記,還是漏報(bào),或不屬于應(yīng)該在本次普查中登記的人.這增加了逆記錄檢查實(shí)施的難度和錯(cuò)誤判斷樣本個(gè)人在普查中登記情況的風(fēng)險(xiǎn).

未匹配估計(jì)量為質(zhì)量評(píng)估調(diào)查未匹配人口與其抽樣權(quán)數(shù)的線性估計(jì)量,或者質(zhì)量評(píng)估調(diào)查人口數(shù)估計(jì)量與其匹配人口數(shù)估計(jì)量之差.匹配人口指,同時(shí)登記在質(zhì)量評(píng)估調(diào)查名單與普查名單的人口.未匹配人口指,只登記在質(zhì)量評(píng)估調(diào)查名單的人口.聯(lián)合國(guó)統(tǒng)計(jì)司建議各國(guó)使用未匹配估計(jì)量.中國(guó)在2010 年使用該漏報(bào)估計(jì)量估計(jì)現(xiàn)有人口、戶籍人口及常住人口的漏報(bào)率[12].未匹配估計(jì)量?jī)?yōu)勢(shì)在于,容易理解和實(shí)施.其劣勢(shì)是未包括同時(shí)遺漏于這兩份名單的人口,從而低估總體普查漏報(bào)人口數(shù).如果樣本中的未匹配人口過(guò)少甚至為零,該漏報(bào)估計(jì)量提供的總體漏報(bào)人口數(shù)估計(jì)值可能?chē)?yán)重偏離真值.

平衡推算估計(jì)量,依據(jù)公式“估計(jì)的凈誤差+估算的普查登記人口數(shù)=估計(jì)的普查漏報(bào)人數(shù)-估計(jì)的普查多報(bào)人數(shù)”間接推出總體普查漏報(bào)人口數(shù)[13].在人口普查中,有些住戶拒絕填寫(xiě)普查表,或拒絕普查員上門(mén)登記.這類(lèi)住戶的人口數(shù)一般通過(guò)鄰居,或其他熟悉情況的人估算.美國(guó)普查局把估算的普查登記人數(shù),計(jì)入普查登記人口總數(shù).美國(guó)在2010 年普查漏報(bào)估計(jì)中,在獲得凈誤差估計(jì)值(-3.6 萬(wàn)人)、估算的普查登記人口數(shù)(599.2 萬(wàn)人),以及估計(jì)的普查多報(bào)人口數(shù)(1004.2 萬(wàn)人)后,得到估計(jì)的普查漏報(bào)人口數(shù)為1599.8 萬(wàn)人(Vincent Thomas Mule, 2012).平衡推算估計(jì)量的優(yōu)勢(shì)是,可以很方便地推出普查漏報(bào)人口數(shù).其缺陷有4 個(gè):

① 不能提供本次普查登記過(guò)程中的漏報(bào)人口信息,不利于下次普查及其質(zhì)量評(píng)估工作方案的改進(jìn);

② 凈誤差與普查多報(bào)估計(jì)對(duì)普查正確登記位置認(rèn)定標(biāo)準(zhǔn)不一致,即前者要求每個(gè)人登記在其所屬的樣本小區(qū),或其周?chē)鷧^(qū)域內(nèi),而后者可以登記在研究區(qū)域的任何地方.這種不一致影響普查漏報(bào)估計(jì)精度;

③ 內(nèi)含交互作用偏差的雙系統(tǒng)估計(jì)量估計(jì)的凈誤差存在一定程度的偏誤,這種偏誤造成疊加效應(yīng),影響普查漏報(bào)估計(jì)精度;

④ 估算的普查登記人口數(shù)存在一定程度的估算誤差,降低普查漏報(bào)估計(jì)精度.

從對(duì)普查漏報(bào)合成估計(jì)量創(chuàng)新情況的論述,以及對(duì)現(xiàn)有普查漏報(bào)估計(jì)量利弊的分析,不難看出,普查漏報(bào)合成估計(jì)量是一種相對(duì)較為理想的普查漏報(bào)估計(jì)方法,有望應(yīng)用于人口普查漏報(bào)估計(jì).中國(guó)計(jì)劃在2020 年首次使用普查漏報(bào)合成估計(jì)量.

3 普查漏報(bào)合成估計(jì)量理論

為構(gòu)造普查漏報(bào)合成估計(jì)量,在獲得普查人口名單、質(zhì)量評(píng)估調(diào)查人口名單及行政記錄人口名單后,要做好五項(xiàng)工作.第一,每份名單只能登記普查目標(biāo)總體的人.如果有的名單重復(fù)登記或登記普查標(biāo)準(zhǔn)時(shí)點(diǎn)不存在的人,就予以剔除.行政記錄人口名單要利用多個(gè)來(lái)源的人口名單建立,并剔除其中的重復(fù)人口.對(duì)名單中存在但懷疑可能已經(jīng)死亡的人,在現(xiàn)場(chǎng)核實(shí)的基礎(chǔ)上決定剔除還是保留.第二,分析普查漏報(bào)的可能情形,即只登記在質(zhì)量評(píng)估調(diào)查或行政記錄的人口(共3 種),未登記在任何名單的人口(1 種).其中,前3 種漏報(bào)人口數(shù)使用線性漏報(bào)估計(jì)量估計(jì),后1 種漏報(bào)人口數(shù)采用缺失單元漏報(bào)估計(jì)量估計(jì).普查漏報(bào)合成估計(jì)量為三個(gè)線性漏報(bào)估計(jì)量與一個(gè)缺失單元漏報(bào)估計(jì)量[14-16]的總和.第三,比對(duì)三份人口名單,為構(gòu)造三個(gè)線性漏報(bào)估計(jì)量及一個(gè)缺失單元漏報(bào)估計(jì)量提供數(shù)據(jù).假定不存在比對(duì)誤差,否則要測(cè)算比對(duì)誤差對(duì)普查漏報(bào)合成估計(jì)量的影響.第四,采用加權(quán)優(yōu)比排序法[17],選擇對(duì)總體人口等概率分層的變量,例如,性別、年齡、房屋所有權(quán)、居住地點(diǎn)、民族,把登記概率大致相等的人口放在同一層.顯然,變量越多,交叉層的層數(shù)也越多,分配到每一個(gè)交叉層的樣本人口就越少,普查漏報(bào)估計(jì)值的抽樣誤差就越大[18].為控制交叉層數(shù)目,分層變量的數(shù)目應(yīng)該減少.分層變量的選擇是一項(xiàng)復(fù)雜的工作,超出本文研究范圍.對(duì)此問(wèn)題有興趣的讀者,請(qǐng)見(jiàn)參考文獻(xiàn)[17].把每一個(gè)交叉層稱之為等概率人口層.在每個(gè)等概率人口層,建立普查漏報(bào)合成估計(jì)量及其抽樣方差估計(jì)量.匯總所有等概率人口層的普查漏報(bào)合成估計(jì)量,得到總體的普查漏報(bào)合成估計(jì)量.匯總所有等概率人口層的普查漏報(bào)合成估計(jì)量的抽樣方差及等概率人口層之間的協(xié)方差,得到總體的普查漏報(bào)合成估計(jì)量的抽樣方差.等概率人口層之間的協(xié)方差可能為正或?yàn)樨?fù).第五,構(gòu)造三份名單全面登記、抽樣登記、人口移動(dòng)和無(wú)人口移動(dòng)的缺失單元漏報(bào)估計(jì)量、線性漏報(bào)估計(jì)量及普查漏報(bào)合成估計(jì)量.

用v 表示任意等概率人口層,V 為總層數(shù).為了敘述方便,在下面的式(1)-(26)省去v.在構(gòu)造總體普查漏報(bào)估計(jì)量時(shí),在式(27)-(30)添加v 和V.

用xcqa表示等概率人口層的人口登記在三份名單的人口數(shù),下標(biāo)c, q, a 分別表示普查、質(zhì)量評(píng)估調(diào)查和人口行政記錄,取值1 或0.c=1 表示等概率人口層的人口在普查人口名單,c=0 表示等概率人口層的人口不在普查人口名單.q =1 表示等概率人口層的人口在質(zhì)量評(píng)估調(diào)查人口名單,q =0 表示層v 的人口不在質(zhì)量評(píng)估調(diào)查人口名單.a=1 表示等概率人口層的人口在行政記錄人口名單,a = 0 表示層v 的人口不在行政記錄人口名單.用這些記號(hào)寫(xiě)出如下有關(guān)的估計(jì)量.

3.1 等概率人口層的缺失單元漏報(bào)估計(jì)量

我們分三個(gè)層次討論問(wèn)題.第一層次,假定普查人口名單、質(zhì)量評(píng)估調(diào)查人口名單及行政記錄人口名單是對(duì)總體人口的全面登記,并且三份名單所登記的是各小區(qū)普查時(shí)點(diǎn)的同一常住人口總體.第二層次,仍假定三份名單對(duì)總體全面登記,并考慮普查日與質(zhì)量評(píng)估調(diào)查日之間的人口移動(dòng).第三層次,用有限總體概率樣本資料,構(gòu)造上面兩個(gè)層次的缺失單元漏報(bào)估計(jì)量的構(gòu)成元素的估計(jì)量[19].

3.1.1 全面登記且無(wú)人口移動(dòng)的缺失單元漏報(bào)估計(jì)量

缺失單元漏報(bào)估計(jì)量,依據(jù)普查人口名單、質(zhì)量評(píng)估調(diào)查人口名單及行政記錄人口名單的統(tǒng)計(jì)關(guān)系建立.三份名單可能的統(tǒng)計(jì)關(guān)系分為四類(lèi).第一類(lèi)是三份名單條件獨(dú)立.例如,普查與質(zhì)量評(píng)估調(diào)查相關(guān),質(zhì)量評(píng)估調(diào)查與人口行政記錄相關(guān),普查與行政記錄獨(dú)立.這類(lèi)關(guān)系共有3 種.第二類(lèi)是三份名單聯(lián)合獨(dú)立.例如,普查與質(zhì)量評(píng)估調(diào)查相關(guān),這兩項(xiàng)調(diào)查與行政記錄獨(dú)立.這類(lèi)關(guān)系也有3 種.第三類(lèi)是三份名單兩兩相關(guān),這類(lèi)關(guān)系有1 種.第四類(lèi)為三份名單相互獨(dú)立,這類(lèi)關(guān)系有1 種.

構(gòu)造缺失單元漏報(bào)估計(jì)量有兩個(gè)方法.第一個(gè)方法是,用三系統(tǒng)估計(jì)量構(gòu)造三份名單的缺失單元漏報(bào)估計(jì)量.由于三系統(tǒng)估計(jì)量在三個(gè)名單統(tǒng)計(jì)關(guān)系不同的情況下有不同的計(jì)算公式,所以需要先使用對(duì)數(shù)線性模型,判斷三份名單屬于何種統(tǒng)計(jì)關(guān)系,然后使用該種統(tǒng)計(jì)關(guān)系下的三系統(tǒng)估計(jì)量計(jì)算公式.第二個(gè)方法是,根據(jù)先驗(yàn)信息分析三份名單最可能形成的統(tǒng)計(jì)關(guān)系,并只構(gòu)造這種統(tǒng)計(jì)關(guān)系的缺失單元估計(jì)量.普查與質(zhì)量評(píng)估調(diào)查相關(guān),但它們與人口行政記錄獨(dú)立,這種統(tǒng)計(jì)關(guān)系的可能性大.事實(shí)上,這兩項(xiàng)調(diào)查由政府統(tǒng)計(jì)部門(mén)組織實(shí)施,而人口行政記錄來(lái)源于不同于政府統(tǒng)計(jì)部門(mén)的行政部門(mén).另外,這兩項(xiàng)調(diào)查的目的是為了獲得人口數(shù),而人口行政記錄是行政工作的副產(chǎn)品,用于行政管理.例如,我國(guó)戶籍資料本身并不是為了提供人口數(shù),而是為了實(shí)現(xiàn)對(duì)人的管理,控制人口向大城市流動(dòng),合理布局全國(guó)人口分布.基于此種分析,只構(gòu)造該種統(tǒng)計(jì)關(guān)系的缺失單元漏報(bào)估計(jì)量.為構(gòu)造缺失單元普查漏報(bào)估計(jì)量,需要把普查和質(zhì)量評(píng)估調(diào)查合并在一起當(dāng)作第一個(gè)來(lái)源,把人口行政記錄當(dāng)作第二個(gè)來(lái)源.由于數(shù)據(jù)來(lái)源的特點(diǎn),它們合并后獨(dú)立于人口行政記錄.不在第一個(gè)來(lái)源但在第二個(gè)來(lái)源的人口數(shù)用x001表示,在第一個(gè)來(lái)源不在第二個(gè)來(lái)源的人口數(shù)用(x110+x100+x010)表示,同時(shí)在兩個(gè)來(lái)源的人口數(shù)用(x111+x101+x011)表示,未登記在任何來(lái)源的人口數(shù)用x000表示,其估計(jì)量稱為缺失單元漏報(bào)估計(jì)量,用^x000表示.把這四項(xiàng)填寫(xiě)在表1.

表1 兩來(lái)源的等概率人口層數(shù)量

式(1)中的n=x111+x101+x011+x110+x100+x010+x001.總體中的人至少在兩個(gè)來(lái)源之一的概率為[1-(1-π1+)(1-π+1)].單元(i,j)人數(shù)的另外一種表達(dá)式為概率函數(shù)的二項(xiàng)分布為

如果給出π1+, π+1, Nv,那么π1+, π+1的最大似然估計(jì)量分別為

式(3)中,n+1=n11+n01, n1+=n11+n10.

由于N =n+x000,所以

將式(4)及n 代入式(5)得到

式(6)是三份名單對(duì)總體全面登記的缺失單元估計(jì)量.

3.1.2 全面登記且人口移動(dòng)的缺失單元漏報(bào)估計(jì)量

在人口普查質(zhì)量評(píng)估中,質(zhì)量評(píng)估調(diào)查通常滯后于人口普查半個(gè)月左右.在這期間,會(huì)有人從其他普查小區(qū)移動(dòng)到本小區(qū),也有人從本小區(qū)移動(dòng)到其他小區(qū),還有人一直居住在本小區(qū).把這三種情況的人分別稱為向內(nèi)移動(dòng)人口、向外移動(dòng)人口和無(wú)移動(dòng)人口.質(zhì)量評(píng)估調(diào)查人口名單的人口有兩種構(gòu)成方式.一是無(wú)移動(dòng)人口和向外移動(dòng)人口,簡(jiǎn)稱質(zhì)量評(píng)估調(diào)查-A.另外一種方式是無(wú)移動(dòng)人口和向內(nèi)移動(dòng)人口,簡(jiǎn)稱質(zhì)量評(píng)估調(diào)查-B.質(zhì)量評(píng)估調(diào)查-A 的優(yōu)勢(shì)是實(shí)現(xiàn)了人口普查質(zhì)量評(píng)估追溯普查標(biāo)準(zhǔn)時(shí)點(diǎn)的人口及其人數(shù)的目的,缺點(diǎn)是找到向外移動(dòng)人口有難度,其有關(guān)信息只能通過(guò)鄰居或估算方法獲得,誤差較大.質(zhì)量評(píng)估調(diào)查-B 的優(yōu)勢(shì)是向內(nèi)移動(dòng)人口在本小區(qū),獲取其質(zhì)量評(píng)估調(diào)查時(shí)信息較容易,劣勢(shì)是獲得其普查標(biāo)準(zhǔn)時(shí)點(diǎn)在其他普查小區(qū)的信息有一定困難.如果采用質(zhì)量評(píng)估調(diào)查-A,那么式(6)中的每項(xiàng)人口數(shù)要更改為無(wú)移動(dòng)人口數(shù)與向外移動(dòng)人口數(shù)的和.如果采用質(zhì)量評(píng)估調(diào)查-B,那么式(6)中的每個(gè)人口數(shù)要更改為無(wú)移動(dòng)人口數(shù)與向內(nèi)移動(dòng)人口數(shù)的和.用n, i, o 分別表示無(wú)移動(dòng)人口、向內(nèi)移動(dòng)人口和向外移動(dòng)人口.

如果采取質(zhì)量評(píng)估調(diào)查-A,那么式(6)變?yōu)?/p>

對(duì)本小區(qū),向外移動(dòng)人口在質(zhì)量評(píng)估調(diào)查標(biāo)準(zhǔn)時(shí)點(diǎn)前已經(jīng)離開(kāi)了本小區(qū),不可能登記在本小區(qū)的質(zhì)量評(píng)估調(diào)查人口名單中,因此式(7)變?yōu)?/p>

如果采用質(zhì)量評(píng)估調(diào)查-B,那么式(6)變?yōu)?/p>

同樣,對(duì)本小區(qū),向內(nèi)移動(dòng)人口無(wú)法登記在本小區(qū)的行政記錄人口名單,因此式(9)變?yōu)?/p>

3.1.3 抽樣登記且人口移動(dòng)的缺失單元漏報(bào)估計(jì)量

在質(zhì)量評(píng)估調(diào)查為全面調(diào)查情況下,以上各式等號(hào)右邊的每一數(shù)據(jù)項(xiàng)都是層v 的總?cè)丝跀?shù)指標(biāo).為了節(jié)約成本、時(shí)間,減少非抽樣誤差,各國(guó)政府統(tǒng)計(jì)部門(mén)的質(zhì)量評(píng)估調(diào)查實(shí)際上是從全國(guó)或各省或各行政區(qū)的普查小區(qū)總體中抽取樣本普查小區(qū)來(lái)進(jìn)行的.在質(zhì)量評(píng)估調(diào)查為抽樣調(diào)查及考慮人口移動(dòng)情況下,式(8)和式(10)的每一數(shù)據(jù)項(xiàng)要用估計(jì)量來(lái)表示,用有限總體概率樣本來(lái)構(gòu)造,即先將每一樣本小區(qū)的人口數(shù)與其抽樣權(quán)數(shù)相乘,然后相加.如果對(duì)樣本小區(qū)人口100%抽樣,而且不存在無(wú)答復(fù),那么樣本普查小區(qū)的抽樣權(quán)數(shù)等于其中每人的抽樣權(quán)數(shù).此時(shí)式(8)變?yōu)?/p>

式(10)變?yōu)?/p>

3.2 等概率人口層的線性漏報(bào)估計(jì)量

3.3 等概率人口層的普查漏報(bào)合成估計(jì)量

式(11)-(16)等號(hào)右邊的每一個(gè)估計(jì)量,依據(jù)質(zhì)量評(píng)估調(diào)查樣本數(shù)據(jù)來(lái)計(jì)算.在人口普查質(zhì)量評(píng)估抽樣調(diào)查中,樣本的抽取方法有分層整群抽樣、分層多階段抽樣和分層多重抽樣[20-22].中國(guó)自1982 年人口普查質(zhì)量評(píng)估起,一直采用分層整群抽樣方法抽取普查小區(qū)樣本.本著研究服務(wù)于應(yīng)用的原則,本文采取分層整群抽樣.在該抽樣法下,式(11)-(16)的每一個(gè)估計(jì)量統(tǒng)一用式(17)來(lái)表示.

式(17)中,H 表示對(duì)總體全部普查小區(qū)所分的層數(shù),例如按照普查小區(qū)規(guī)模將總體中的所有普查小區(qū)分在三層,每一層h 的樣本規(guī)模記為nh, h = 1,2,··· ,H,yhi為小區(qū)hi 在等概率人口層的人數(shù).在分層整群等概率抽樣下,樣本普查小區(qū)hi 的抽樣權(quán)數(shù)whi為

3.4 等概率人口層的普查漏報(bào)合成估計(jì)量的抽樣方差估計(jì)量

式(11)和(12),以及式(15)和(16)的復(fù)制估計(jì)量分別為

式(15)和(16)的分層刀切抽樣方差(variance, 縮寫(xiě)為var)估計(jì)量分別為

為了正確理解及使用式(25)和式(26),需要注意兩點(diǎn).第一,刀切法僅在樣本內(nèi)操作.切掉一個(gè)單位,只不過(guò)是這個(gè)切掉的單位不在樣本中,并不意味著它不在總體中.如果把這個(gè)單位從總體中切掉,調(diào)查對(duì)象就改變了,就不再是原來(lái)的總體了,與現(xiàn)在的調(diào)查任務(wù)就不一樣,所以從樣本中切掉一個(gè)單位,只不過(guò)是假定了一個(gè)虛擬樣本,即切掉的那個(gè)單位沒(méi)有進(jìn)入這個(gè)虛擬樣本.就未分層整群抽樣來(lái)說(shuō),假定從單位數(shù)為N 的總體中簡(jiǎn)單隨機(jī)抽取單位數(shù)n.現(xiàn)在從該樣本中切掉1 個(gè)單位,在計(jì)算其它(n-1)個(gè)單位各自的復(fù)制權(quán)數(shù)時(shí),應(yīng)該是從N 個(gè)單位中簡(jiǎn)單隨機(jī)抽取(n-1)個(gè)單位概率的倒數(shù),此時(shí)總體單位數(shù)目不改變,只是樣本單位數(shù)目減去1.即這(n-1)個(gè)單位此時(shí)各自的復(fù)制權(quán)數(shù)是N/(n-1).第二,同計(jì)算復(fù)雜總體參數(shù)估計(jì)量抽樣方差的泰勒線性方差估計(jì)量相比[25,26],刀切法操作便利,容易實(shí)施,在計(jì)算了樣本普查小區(qū)的復(fù)制權(quán)數(shù)及總體參數(shù)估計(jì)量的復(fù)制估計(jì)量后,將樣本數(shù)據(jù)代入其中即可算出結(jié)果.

3.5 總體普查漏報(bào)合成估計(jì)量及其抽樣方差估計(jì)量

在構(gòu)造了每個(gè)等概率人口層(用v 表示)的普查漏報(bào)估計(jì)量后,下一步要做的工作是匯總所有等概率人口層(用V 表示總層數(shù))的普查漏報(bào)合成估計(jì)量及其抽樣方差估計(jì)量,得到總體的普查漏報(bào)合成估計(jì)量及抽樣方差估計(jì)量.

4 未匹配估計(jì)量

為了比對(duì)普查漏報(bào)合成估計(jì)量與傳統(tǒng)普查漏報(bào)估計(jì)量在數(shù)據(jù)估計(jì)精度上的優(yōu)勢(shì),以及考慮進(jìn)行這種比對(duì)所需數(shù)據(jù)資料的可得性,我們現(xiàn)在討論未匹配估計(jì)量.除美國(guó)等少數(shù)幾個(gè)國(guó)家外,其他國(guó)家都是使用這種估計(jì)量.與普查漏報(bào)合成估計(jì)量相比,未匹配估計(jì)量不用對(duì)總體人口等概率分層,直接在總體人口內(nèi)構(gòu)造及使用.

未匹配估計(jì)量建立的關(guān)鍵是獲得匹配人口.對(duì)樣本普查小區(qū)的普查人口名單及質(zhì)量評(píng)估調(diào)查人口名單,如果后者名單中的某人出現(xiàn)在普查人口名單,就稱其為質(zhì)量評(píng)估調(diào)查人口名單的匹配人口,如果后者名單中的某人未在普查人口名單中出現(xiàn),就稱為后者的未匹配人口[27].未匹配人口為普查漏報(bào)人口.做出上述判斷的一個(gè)假定條件是,質(zhì)量評(píng)估調(diào)查人口名單中的每一個(gè)人屬于普查目標(biāo)總體,應(yīng)該在普查中登記.在人口普查質(zhì)量評(píng)估中,各國(guó)政府統(tǒng)計(jì)部門(mén)默認(rèn)質(zhì)量評(píng)估調(diào)查人口名單完美無(wú)缺.

為區(qū)別普查漏報(bào)合成估計(jì)量的總體P,這里用U 表示總體的未匹配估計(jì)量.

4.1 總體未匹配估計(jì)量

式(31)和(32),PhiA和MhiA分別表示質(zhì)量評(píng)估調(diào)查-A 的無(wú)移動(dòng)人口和向外移動(dòng)人口的數(shù)目之和,以及它們的匹配無(wú)移動(dòng)人口和向外移動(dòng)人口的數(shù)目之和;PhiB和MhiB有同樣的相應(yīng)解釋.whi依據(jù)式(18)計(jì)算.

4.2 總體未匹配估計(jì)量的抽樣方差估計(jì)量

雖然式(31)和式(32)有方差數(shù)學(xué)表達(dá)式計(jì)算其抽樣方差,但為了與普查漏報(bào)合成估計(jì)量的抽樣方差進(jìn)行數(shù)據(jù)上的可比性比較,我們使用分層刀切法近似計(jì)算其抽樣方差.文獻(xiàn)[19]指出,線性估計(jì)量的抽樣方差可以用分層刀切法計(jì)算.

式(34)和(36)中的whi(gt)根據(jù)式(19)計(jì)算.不難看出,未匹配估計(jì)量的抽樣方差計(jì)算,無(wú)需在等概率人口層內(nèi)進(jìn)行,可以直接在總體內(nèi)計(jì)算.

5 實(shí)證分析

實(shí)證對(duì)象為廣西南寧市邕寧區(qū),資料所屬時(shí)間是2010 年11 月1 日零時(shí),目標(biāo)是估計(jì)邕寧區(qū)普查漏報(bào).在樣本抽取前,將邕寧區(qū)所有普查小區(qū)劃分在三層:蒲津社區(qū)層;那樓社區(qū)和新江社區(qū)合并層;百濟(jì)社區(qū)和中和社區(qū)合并層.在每層,以普查小區(qū)為抽樣單位,從邕寧區(qū)的1038 個(gè)普查小區(qū)中簡(jiǎn)單隨機(jī)抽取7 個(gè),并獲得了樣本小區(qū)的普查人口名單、質(zhì)量評(píng)估調(diào)查人口名單和行政記錄人口名單.通過(guò)比對(duì),獲得同時(shí)登記在三份名單、兩份名單及一份名單的人口數(shù).對(duì)每個(gè)樣本小區(qū)的人口,按照性別分在兩個(gè)等概率人口層,即男性層和女性層.在這兩個(gè)層計(jì)算普查漏報(bào)估計(jì)值.

5.1 基于普查漏報(bào)合成估計(jì)量的估計(jì)結(jié)果及數(shù)據(jù)分析

5.1.1 樣本資料

樣本普查小區(qū)及樣本人口數(shù)資料見(jiàn)表2 至表5.

5.1.2 加權(quán)人數(shù)計(jì)算

利用表2 至表5 樣本數(shù)據(jù),使用式(17)計(jì)算式(11)和(12),以及式(15)和(16)每項(xiàng)的加權(quán)人數(shù),見(jiàn)表6.

表2 分層及樣本

表3 樣本普查小區(qū)人口數(shù)

表4 樣本普查小區(qū)男性在三份名單登記的人數(shù)(人)

表5 樣本普查小區(qū)女性在三份名單登記的人數(shù)(人)

續(xù)表5 樣本普查小區(qū)女性在三份名單登記的人數(shù)(人)

表6 等概率人口層在三份人口名單每項(xiàng)的加權(quán)人數(shù)(人)

5.1.3 普查漏報(bào)計(jì)算

使用式(22)-(24),利用表6 數(shù)據(jù),計(jì)算男性層和女性層的普查漏報(bào)人數(shù).利用式(27)-(29)計(jì)算總體普查漏報(bào)人口數(shù).計(jì)算結(jié)果見(jiàn)表7.

表7 表明,如果采取質(zhì)量評(píng)估調(diào)查-A,男性層和女性層的普查漏報(bào)人口數(shù)分別為5107 人和6339 人.如果采取質(zhì)量評(píng)估調(diào)查-B,男性層和女性層的普查漏報(bào)人口數(shù)分別為4477 人和4707 人.如果采取質(zhì)量評(píng)估調(diào)查-A 或-B,總體普查漏報(bào)人口數(shù)分別為11446 人或9184 人.因此,無(wú)論男性層、女性層,還是總體,質(zhì)量評(píng)估調(diào)查-A 的普查漏報(bào)人口數(shù)均大于質(zhì)量評(píng)估調(diào)查-B.這一現(xiàn)象表明,所選取的樣本普查小區(qū)的向外移動(dòng)人口多于向內(nèi)移動(dòng)人口.由于樣本小區(qū)是隨機(jī)選取的,所以邕寧區(qū)的向外移動(dòng)人口比向內(nèi)移動(dòng)人口多.“六普”數(shù)據(jù)分析顯示,廣西南寧市邕寧區(qū)的一些中青年去廣東、北京、上海、浙江、深圳打工,而來(lái)邕寧區(qū)打工的很少.在普查與質(zhì)量評(píng)估調(diào)查之間,邕寧區(qū)人口也是以向外移動(dòng)為主.可見(jiàn),本文計(jì)算結(jié)果與“六普”結(jié)果一致.

表7 普查漏報(bào)人數(shù)(人)

5.1.4 普查漏報(bào)估計(jì)值的抽樣方差計(jì)算

在計(jì)算了男性和女性及總體的普查漏報(bào)估計(jì)值之后,還要使用分層刀切法計(jì)算其抽樣方差估計(jì)值.這包括三個(gè)步驟.第一步,使用式(19)計(jì)算每刀切掉每一層的每一個(gè)樣本普查小區(qū)后,所有樣本普查小區(qū)的復(fù)制權(quán)數(shù),計(jì)算結(jié)果見(jiàn)表8.在分層整群抽樣下,刀切對(duì)象是每一層的所有樣本普查小區(qū).如果采取整群二重抽樣,刀切的對(duì)象是第一重樣本的所有普查小區(qū),而不是第二重樣本的所有普查小區(qū).第二步,依據(jù)式(20)計(jì)算式(21)-(24)每一個(gè)數(shù)據(jù)項(xiàng)的復(fù)制估計(jì)量,例如刀切第一層的第一個(gè)樣本普查小區(qū)A1 后的每一個(gè)數(shù)據(jù)項(xiàng)的復(fù)制估計(jì)量,計(jì)算結(jié)果見(jiàn)表9.為節(jié)省篇幅,省去依次刀切A2-A7 樣本普查小區(qū)后得到的每個(gè)數(shù)據(jù)項(xiàng).利用表9 數(shù)據(jù),使用式(21)-(24)計(jì)算“缺失單元人數(shù)復(fù)制值及漏報(bào)復(fù)制值”,計(jì)算結(jié)果見(jiàn)表10.為了計(jì)算普查漏報(bào)抽樣方差,寫(xiě)出依次刀切A1-A7 的普查漏報(bào)復(fù)制估計(jì)值及普查漏報(bào)估計(jì)值,見(jiàn)表11.第三步,利用表11 數(shù)據(jù),使用式(25)、式(26)、式(28)、式(30)計(jì)算男性層、女性層,以及總體的抽樣方差與協(xié)方差.結(jié)果請(qǐng)見(jiàn)表12.

表8 樣本普查小區(qū)的復(fù)制權(quán)數(shù)

從表8 可以看出,無(wú)論剔除哪一個(gè)樣本普查小區(qū),所有樣本普查小區(qū)的復(fù)制權(quán)數(shù)之和與未剔除任何小區(qū)的所有樣本小區(qū)的抽樣權(quán)數(shù)之和相等.這說(shuō)明,剔除某個(gè)樣本小區(qū)后,總權(quán)數(shù)不變,但有些樣本小區(qū)的權(quán)數(shù)變大,也有的樣本小區(qū)權(quán)數(shù)變小,還有的小區(qū)權(quán)數(shù)不變.利用這些規(guī)律可以驗(yàn)證復(fù)制權(quán)數(shù)的計(jì)算是否正確.復(fù)制權(quán)數(shù)功能有三個(gè).一是計(jì)算式(11)和(12),以及式(15)和(16)每一個(gè)估計(jì)量的復(fù)制值.二是計(jì)算普查漏報(bào)復(fù)制估計(jì)值.三是計(jì)算普查漏報(bào)估計(jì)值的抽樣方差.

表9 等概率人口層在三份名單的復(fù)制加權(quán)人數(shù)(人)(剔除t=A1)

表10 普查漏報(bào)復(fù)制人數(shù)(人)(剔除t=A1)

表11 普查漏報(bào)及復(fù)制漏報(bào)人數(shù)(人)

表12 抽樣誤差與協(xié)方差

表12 括號(hào)里面的數(shù)據(jù)為抽樣標(biāo)準(zhǔn)誤差.從表12 可以看出,采用質(zhì)量評(píng)估調(diào)查-A,男性、女性和總體的抽樣標(biāo)準(zhǔn)誤差分別為352 人、272 人和171 人,即所估計(jì)的男性、女性和總體的普查漏報(bào)人數(shù)5107 人、6339 人和11446 人,與實(shí)際的男性、女性和總體的普查漏報(bào)人數(shù)平均相差352 人、272 人和171 人.采用質(zhì)量評(píng)估調(diào)查-B,除女性外,男性和總體的抽樣標(biāo)準(zhǔn)誤差大一些.這說(shuō)明,質(zhì)量評(píng)估調(diào)查的人口構(gòu)造方法對(duì)普查漏報(bào)估計(jì)的精度有影響.質(zhì)量評(píng)估調(diào)查-A 使男性層和女性層呈負(fù)相關(guān)關(guān)系,協(xié)方差為負(fù)84238,降低普查漏報(bào)估計(jì)值的抽樣誤差,而質(zhì)量評(píng)估調(diào)查-B 使男性層和女性層呈正相關(guān)關(guān)系,增加總體普查漏報(bào)估計(jì)值的抽樣誤差.因此,在普查漏報(bào)估計(jì)中,質(zhì)量評(píng)估調(diào)查-A 提供精度更高的漏報(bào)估計(jì)值.

5.2 基于未匹配估計(jì)量的估計(jì)結(jié)果及數(shù)據(jù)分析

未匹配估計(jì)量,需要的樣本資料是普查人口名單、質(zhì)量評(píng)估調(diào)查人口名單及其匹配人口名單,以及樣本普查小區(qū)的抽樣權(quán)數(shù).樣本資料見(jiàn)表13 和表14.

使用表13 和表14 樣本數(shù)據(jù),按照式(31)和(32),以及式(33)-(36),我們得到總體普查漏報(bào)估計(jì)值及抽樣方差.其中,質(zhì)量評(píng)估調(diào)查-A 下的普查漏報(bào)估計(jì)值及抽樣標(biāo)準(zhǔn)誤差分別為9956 人和679 人,而質(zhì)量評(píng)估調(diào)查-B 下的普查漏報(bào)估計(jì)值及抽樣標(biāo)準(zhǔn)誤差分別為8304 人和822 人.

表14 質(zhì)量評(píng)估調(diào)查-B 樣本普查小區(qū)人口資料(人)

5.3 普查漏報(bào)合成估計(jì)量與未匹配估計(jì)量的抽樣方差數(shù)據(jù)比較

在對(duì)比普查漏報(bào)合成估計(jì)量與未匹配估計(jì)量估計(jì)精度之前,首先把它們估計(jì)的結(jié)果列示在表15 中,然后根據(jù)表15 進(jìn)行數(shù)據(jù)對(duì)比分析.

表15 兩種估計(jì)量的估計(jì)值(人)

在表15 中,從兩種普查漏報(bào)估計(jì)量的比對(duì)來(lái)看:采用質(zhì)量評(píng)估調(diào)查-A,普查漏報(bào)合成估計(jì)量提供的漏報(bào)人數(shù)及抽樣標(biāo)準(zhǔn)誤差的估計(jì)值分別為11446 人和171 人,而未匹配估計(jì)量給出的相應(yīng)估計(jì)值分別為9956 人和679 人;使用質(zhì)量評(píng)估調(diào)查-B,普查漏報(bào)合成估計(jì)量提供的漏報(bào)人數(shù)及其抽樣標(biāo)準(zhǔn)誤差估計(jì)值分別為9184 人和566 人,而依據(jù)未匹配估計(jì)量得到的估計(jì)值分別為8304 人和822 人.這表明,一方面,不論采用質(zhì)量評(píng)估調(diào)查-A,還是質(zhì)量評(píng)估調(diào)查-B,普查漏報(bào)合成估計(jì)量的漏報(bào)估計(jì)值都大于未匹配估計(jì)量給出的漏報(bào)估計(jì)值.這與后者未包括同時(shí)被普查名單和質(zhì)量評(píng)估調(diào)查名單遺漏的人口,而前者包括同時(shí)被三份名單漏報(bào)的人口有直接關(guān)系.這也是提出普查漏報(bào)合成估計(jì)量的原因之一;另一方面,在質(zhì)量評(píng)估調(diào)查-A 和-B 兩種情況下,未匹配估計(jì)量的抽樣方差大于普查漏報(bào)合成估計(jì)量,說(shuō)明后者的有效性強(qiáng)于前者.從對(duì)比質(zhì)量評(píng)估調(diào)查-A 或-B 來(lái)看:無(wú)論是普查漏報(bào)合成估計(jì)量,還是未匹配估計(jì)量,采用質(zhì)量評(píng)估調(diào)查-A,所得到的抽樣標(biāo)準(zhǔn)誤差估計(jì)值,比質(zhì)量評(píng)估調(diào)查-B 的都要小一些.

6 結(jié)論與建議

第一,相比普查凈誤差估計(jì)及普查多報(bào)估計(jì),普查漏報(bào)估計(jì)尚未受到各國(guó)政府統(tǒng)計(jì)部門(mén)及相關(guān)學(xué)者應(yīng)有的重視.建議政府統(tǒng)計(jì)部門(mén)將凈誤差估計(jì)、多報(bào)估計(jì)及漏報(bào)估計(jì)放在同等重要的位置,加強(qiáng)漏報(bào)估計(jì)基礎(chǔ)理論研究,提高普查漏報(bào)估計(jì)精度.

第二,在判斷質(zhì)量評(píng)估調(diào)查-A 還是B 哪個(gè)更優(yōu)時(shí),要同時(shí)考慮三個(gè)因素:是否對(duì)普查標(biāo)準(zhǔn)時(shí)點(diǎn)人口的追溯登記;資料的可得性;抽樣方差大小.質(zhì)量評(píng)估調(diào)查-A 是對(duì)普查時(shí)點(diǎn)的追溯登記,符合人口普查質(zhì)量評(píng)估的目標(biāo),抽樣方差較小,但獲取向外移動(dòng)人口是否在普查時(shí)點(diǎn)登記有困難.只有在找到向外移動(dòng)人口較容易的情況下,質(zhì)量評(píng)估調(diào)查-A 才優(yōu)于質(zhì)量評(píng)估調(diào)查-B.建議政府統(tǒng)計(jì)部門(mén)在構(gòu)造人口移動(dòng)普查漏報(bào)合成估計(jì)量時(shí),謹(jǐn)慎選擇質(zhì)量評(píng)估調(diào)查-A 或B.

第三,現(xiàn)行普查漏報(bào)估計(jì)方法存在覆蓋漏報(bào)不全等缺陷.普查漏報(bào)合成估計(jì)量能夠規(guī)避這些缺陷.該估計(jì)量需要在等概率人口層建立.這需要確定對(duì)總體人口分層的變量.在每一層,先構(gòu)造全面登記的普查漏報(bào)合成估計(jì)量,再依據(jù)有限總體概率樣本數(shù)據(jù)構(gòu)造抽樣登記的普查漏報(bào)合成估計(jì)量.匯總所有等概率人口層的普查漏報(bào)合成估計(jì)量,得到省、自治區(qū)、直轄市以及全國(guó)的普查漏報(bào)合成估計(jì)量.建議政府統(tǒng)計(jì)部門(mén)在2020 年前后使用普查漏報(bào)合成估計(jì)量;研究三份名單不同統(tǒng)計(jì)關(guān)系的缺失單元漏報(bào)估計(jì)量;加強(qiáng)對(duì)總體人口分層變量選擇的研究,根據(jù)樣本規(guī)模確定最終分層變量及其數(shù)目和等概率人口層的層數(shù),盡可能減少普查漏報(bào)估計(jì)值的抽樣誤差.

第四,普查漏報(bào)估計(jì)量替代現(xiàn)行普查漏報(bào)估計(jì)量是必然趨勢(shì).首先,它包括了總體全部普查漏報(bào)人口.其次,它不受普查人口名單、質(zhì)量評(píng)估調(diào)查人口名單和行政記錄人口名單是否獨(dú)立的限制.再次,它理論前沿.然而這種替代需要時(shí)間.建議政府統(tǒng)計(jì)部門(mén)與高校學(xué)者合作開(kāi)展人口普查質(zhì)量評(píng)估研究,尤其是前沿理論研究.

猜你喜歡
估計(jì)量漏報(bào)普查
立即全面普查 警惕二代粘蟲(chóng)發(fā)生
胡春華強(qiáng)調(diào):確保脫貧攻堅(jiān)普查取得圓滿成功
最小二乘估計(jì)量?jī)?yōu)于工具變量估計(jì)量的一個(gè)充分條件
某市死因監(jiān)測(cè)漏報(bào)的調(diào)查報(bào)告
淺談估計(jì)量的優(yōu)良性標(biāo)準(zhǔn)
各類(lèi)氣體報(bào)警器防誤報(bào)漏報(bào)管理系統(tǒng)的應(yīng)用
關(guān)于農(nóng)業(yè)文化遺產(chǎn)普查與保護(hù)的思考
臨床乳腺檢查篩查乳腺癌中降低病灶漏報(bào)率的探討
學(xué)習(xí)調(diào)查要“四會(huì)”
歷次人口普查中低年齡組人口漏報(bào)研究
甘孜县| 和龙市| 永丰县| 蒙阴县| 新乡县| 宁波市| 夏河县| 福清市| 昌宁县| 濮阳县| 麻江县| 南宫市| 齐齐哈尔市| 荃湾区| 乌兰察布市| 玉田县| 耒阳市| 界首市| 开原市| 巩义市| 通许县| 洮南市| 华坪县| 始兴县| 林州市| 交城县| 宜兰市| 胶州市| 大城县| 禹城市| 崇信县| 南郑县| 金乡县| 格尔木市| 开封县| 富平县| 林芝县| 松潘县| 德阳市| 得荣县| 高州市|