黃榮清 曾憲新
摘?要:死亡數(shù)據(jù)質量的評估是人口死亡分析的第一步。本文從分析人口死亡率隨年齡變化的特征著手,提出了分年齡死亡率數(shù)據(jù)質量的判斷方法和指標。運用此方法,對我國自1982年以來四次人口普查的人口死亡率質量進行了分析。研究結果顯示,1981年人口死亡數(shù)據(jù)質量存在比較明顯的缺陷;隨著年代推移,人口死亡數(shù)據(jù)質量有所改善;我國人口死亡率在青年期和高齡期普遍存在質量問題;特定尾數(shù)年齡的觀測死亡率與實際死亡率存在偏離;兒童期數(shù)據(jù)質量在2010年變差而且城市地區(qū)尤為明顯。
關鍵詞:數(shù)據(jù)質量評估;人口普查;死亡率
中圖分類號:C92-03?文獻標識碼:A?文章編號:1000-4149(2019)05-0018-11
DOI:10.3969/j.issn.1000-4149.2019.00.021
一、引言
人口科學往往是從人口死亡的分析開始的,人口死亡水平及其變動一直是人口學研究的核心問題之一。由于數(shù)據(jù)所限的原因,關于我國人口死亡的研究大都是圍繞著幾次人口普查數(shù)據(jù)展開的[1]。為了使人口分析和研究建立在數(shù)據(jù)可靠的基礎上,首先需要對所利用的觀測數(shù)據(jù)的質量進行評估,并對有質量問題的數(shù)據(jù)作出具體修正。對于人口普查死亡數(shù)據(jù)質量的研究最早是針對1982年第三次人口普查進行的,研究表明1981年的嬰兒死亡數(shù)據(jù)和老年數(shù)據(jù)均存在問題[2-3]。之后的研究大多認為總體上來講第三次人口普查的數(shù)據(jù)質量比較好,可以直接使用[4-7]。1990年、2000年、2010年的第四、五、六次人口普查數(shù)據(jù)均存在不同程度的死亡漏報[8-14]。
人口死亡的質量評估可以歸納為兩個方面:①總體水平的評估。報告(登記)的死亡人口數(shù)有無漏報,導致觀測死亡率低于實際死亡率,觀測的預期壽命高于實際預期壽命,現(xiàn)有絕大部分死亡數(shù)據(jù)質量評估的研究屬于這一類。②局部數(shù)據(jù)的評估。觀測的死亡率在全年齡或局部年齡是否異常?現(xiàn)有這方面的研究多集中于老年和嬰幼兒死亡數(shù)據(jù)的分析。事實上這兩方面是相互聯(lián)系的,只是由于研究者的視角和所借助的手段不同,通常只對人口死亡數(shù)據(jù)質量的某一方面進行判斷。
從1982年第三次人口普查以來,全國和各地區(qū)人口的分年齡死亡率主要是由人口普查結果計算得到的。對死亡率數(shù)據(jù)的質量,現(xiàn)有研究都只是關于總體水平和嬰兒死亡率誤差的研究,而對各個年齡死亡率數(shù)據(jù)的質量做系統(tǒng)深入研究的很少。究其原因,主要是由于方法的限制?,F(xiàn)有研究進行人口死亡數(shù)據(jù)質量評估的基本思路大體上有以下三個:其一是通過人口死亡與經濟發(fā)展水平的關系來判定所利用數(shù)據(jù)是否存在質量問題。這種方法比較適用于評估死亡水平和嬰兒死亡率數(shù)據(jù)是否有問題。其二是利用死亡率死亡模式規(guī)律以及生命表方法來進行檢驗和調整。標準生命表通常選擇根據(jù)1981年死亡數(shù)據(jù)構造的生命表。其三是通過各次人口普查隊列人口的存活關系來判斷是否存在死亡漏報的問題。這些方法的缺點是無法對單次普查的死亡數(shù)據(jù)進行系統(tǒng)地評估?,F(xiàn)有關于死亡數(shù)據(jù)的評估實質是假定某一次的死亡數(shù)據(jù)質量可以接受(或假定我國的人口死亡符合某一模式),在此基礎上對新普查數(shù)據(jù)進行評估。
本項研究的基本思路是:人口學死亡研究的一個重要結論是人口死亡隨年齡變化是有規(guī)律可循的。因此,拋開死亡模型和死亡模式,人口死亡數(shù)據(jù)所反映出來的人口死亡隨年齡的變動在方向上應該符合一定的規(guī)律。如果數(shù)據(jù)所反映的人口死亡隨年齡的變動違背規(guī)律則說明死亡數(shù)據(jù)存在系統(tǒng)性的質量問題。這一思路的優(yōu)點在于,它不依賴于其他數(shù)據(jù)同時也避開了對死亡模式和模型生命表的依賴。
二、人口死亡率的年齡變化
1.死亡率年齡變化的方向
死亡率大小隨年齡變化,在高死亡力的場合,嬰幼兒死亡率和老年死亡率都很高,死亡率曲線的圖形由高到低,再由低升高,所以可以用“U”型來概括;而在低死亡力的場合,嬰幼兒死亡率已經不高,但老年死亡率仍舊很高,死亡率曲線的圖形開始就不太高,但隨年齡增加還是先降低,后升高,可以用“J”型來描述。但這只是從大的變化來說,實際上,在年齡別死亡率由低到高的變化過程中,中間還有一個“波動”存在,這個“波動”的峰值位置和高低在不同時期和地區(qū)雖然會有所不同,但根據(jù)對現(xiàn)有人口數(shù)據(jù)的觀察,這個“波動”總是存在的,死亡率大小的年齡變化大致呈如下形狀(見圖1)。
對人口死亡率隨年齡變動趨勢的模擬顯示,死亡率隨年齡的變動有3次方向的改變,而數(shù)據(jù)所呈現(xiàn)的波動現(xiàn)象恰恰說明數(shù)據(jù)存在系統(tǒng)性的誤差。這樣,我們可以用Δx出現(xiàn)負號次數(shù)的多少來判定死亡率數(shù)據(jù)變化是否穩(wěn)定,并把它作為判定死亡率觀測數(shù)據(jù)質量的標準。
從第三次人口普查以來全國人口死亡率的觀測數(shù)據(jù)在全年齡上改變方向的次數(shù)如表1所示。
由表1可以知道,全國人口死亡率觀測數(shù)據(jù)改變方向的次數(shù)都遠不止3次,最多的是由1982年人口普查資料算出的1981年的死亡率,次數(shù)較少的是2010年的結果。從男女合計、男性和女性的三個死亡率來看,1990年人口普查的結果死亡率改變方向的次數(shù)似乎最少。但由于1990年人口普查公布的死亡人口的最大年齡是截止到90歲,所以只能計算出0—90歲的死亡率。其他三次人口普查死亡人口的最大年齡是截止到100歲。而90—99歲年齡段往往是死亡率改變方向較頻繁的區(qū)間。若都以90歲作為截止年齡,1981年、2000年、2010年Δx<0的次數(shù)分別為20次、13次和7次。所以,從死亡率年齡變化的穩(wěn)定性來說,死亡率數(shù)據(jù)的質量是在提高的,2010年人口普查的死亡率質量較高。
這里應該注意的是,男女合計的死亡率改變方向的次數(shù)可以小于或大于單獨的男性或女性死亡率改變方向的次數(shù),或介于這兩者之間。
2.死亡率改變方向的年齡
仍以1981年男女合計的觀測死亡率為例,來說明判定觀測死亡率改變方向的年齡特征。表2中“+”號表示Δx>0,“-”號表示Δx<0。
由表2可知,在年齡區(qū)間1—19歲和35—85歲,Δx符號改變的次數(shù)很少,在1—19歲,“-”號只在12歲上出現(xiàn)了一次,說明從12歲開始,死亡率由從高到低轉到從低到高,完全符合死亡率大小隨年齡變化的規(guī)律。從35歲以后,死亡率應該單調上升,所以應該是“+”號,這也是基本符合的?!?”號出現(xiàn)在幾個以“0”為尾數(shù)的年齡上,說明在這些年齡上,死亡率數(shù)據(jù)還是有問題的。表2顯示“-”號主要分布在20—34歲和85歲以上,即在青年期(見圖2)和高齡期(見圖3)這兩個年齡區(qū)間,數(shù)據(jù)變化很不穩(wěn)定,數(shù)據(jù)質量不好。
由表2的縱向來看,“-”號次數(shù)在各個年齡尾數(shù)上并不是均勻分配的。 出現(xiàn)“-”號次數(shù)最多的是以“1”和“0”為尾數(shù)的年齡,其次是以“2”、“3”、“8”、“9”為尾數(shù)的年齡。這說明,數(shù)據(jù)質量出現(xiàn)問題是以“0”、“1”年齡尾數(shù)為中心展開的。
3.死亡率大小改變的速度
我們再換一個角度來討論死亡率隨年齡變化的特征。令:
由表3可以發(fā)現(xiàn),在1—13歲,δx>0, 表示死亡率加速下降,與理論相符。在以后的年齡,δx幾乎是正負相間,即加速后減速再加速。在“0”、“2”、 “8”的尾數(shù)上,δx<0分別出現(xiàn)了8次、7次、7次,說明這些年齡是死亡率速度變化的分界,死亡率常常大于它左右兩邊的平均值。在“1”、“7”、“9”的尾數(shù)上,δx>0分別出現(xiàn)了10次、9次和8次,說明死亡率往往小于它左右兩邊的平均值。再從數(shù)值上看,以“0”、“9”、“1”為尾數(shù)的年齡的絕對值大,說明在這些尾數(shù)年齡上,死亡率大小的變化最顯著。
從理論上說,如果一條曲線在區(qū)間內是連續(xù)光滑(二階可導)的話,函數(shù)的圖形會保持一致,年齡x的函數(shù)值與它左右兩邊函數(shù)平均值之差應該保持同一符號,當δx>0時為上凹,當δx<0時為上凸,在符號改變時會出現(xiàn)拐點。死亡率函數(shù)雖然不是連續(xù)函數(shù),但從死亡率的變化規(guī)律和圖形上可以知道,在兒童年齡段,它會保持加速下降,圖形上凹,而在成年(35歲)后,幾乎呈直線,其實也是上凹。
只是在青年期,才出現(xiàn)上凸的情形,這個年齡期的δx小于0(參考圖1)。
當然,人口死亡數(shù)據(jù)只是死亡率的統(tǒng)計值而非實際死亡率,而統(tǒng)計值一定會出現(xiàn)隨機誤差。但由于中國人口的基數(shù)極大,死亡率的隨機誤差極小,變化幅度極小關于死亡率與調查人口的關系、隨機誤差的計算,參見:蔣慶瑯.壽命表及其應用[M].上海:上海翻譯公司,1984:49-50。 。而δx的觀測值的符號出現(xiàn)這樣的年齡分布規(guī)律,且有較大幅度的變化(在5%以上),就是以說明觀察數(shù)據(jù)存在系統(tǒng)誤差,同時可以推斷,出現(xiàn)δx<0并且在“0”、“2”、“8”的尾數(shù)年齡上,觀測死亡率通常會大于實際死亡率。而在“1”、“7”、“9”的尾數(shù)年齡上,觀測死亡率通常會小于實際死亡率。
δx的符號變化和分布可以用來表示死亡率曲線的形狀變化,所以它也可以用來判斷死亡率觀測數(shù)據(jù)的質量。一般來說,在一定的年齡區(qū)間內,δx的符號變化越多,圖形就越不規(guī)則。出現(xiàn)δx<0的年齡,是死亡率隨年齡變化速度的轉折點,我們把全年齡δx<0 出現(xiàn)的次數(shù)作為判斷數(shù)據(jù)質量的指標。由表3的數(shù)據(jù)可知,δx<0 共出現(xiàn)了41次,說明觀測年齡死亡率與實際死亡率存在誤差比較普遍。
綜上所述,我們提出可分別用Δx出現(xiàn)負數(shù)的次數(shù)和δx的分布來檢驗年齡別死亡率觀測值的質量。雖然檢驗的目標只有一個,即檢驗觀測值是否和實際值(或者說真值)之間存在系統(tǒng)偏差,但由于Δx和δx 表示的意義不同,檢驗的側重點和適用范圍也不同。
從本質上來說,Δx和δx分別通過檢驗死亡率隨年齡變動的方向和變動的凸凹特性是否吻合規(guī)律來判定數(shù)據(jù)的質量。一般來說,死亡率變化方向及其改變次數(shù)在理論上是比較確定的。Δx小于0出現(xiàn)一次,就意味著死亡率變化方向改變一次,所以用Δx檢驗比較可靠。但是這種方法的缺點是不夠靈敏,只有觀測死亡率誤差達到一定程度才會改變實際死亡率原來的方向。另外,Δx的符號是根據(jù)連續(xù)三個年齡的變化來設的,所以,它比較適合于一定的年齡區(qū)間。理論上,青年期和高齡期人口死亡率的變動都有可能出現(xiàn)凸凹性的改變,即δx 小于0的情況。而且這兩個時期區(qū)間的端點也不確定,所以δx出現(xiàn)負數(shù)的理論次數(shù)并不確定。因此,我們就不能單純地根據(jù)δx出現(xiàn)負數(shù)的次數(shù)來確定數(shù)據(jù)的質量。但相鄰年齡的死亡率變動波動(凸凹性)比死亡率變動方向的改變更為頻繁,因此δx 對數(shù)據(jù)比較敏感。盡管凸凹性改變沒有理論上的次數(shù)可以參照,但有一點是確定的,凸凹性的改變不應該有系統(tǒng)的年齡尾數(shù)特征,因此它在檢驗是否存在年齡尾數(shù)的指向上比較有效。兩個指標各有所長,可以用于不同目的數(shù)據(jù)質量的甄別。
以下我們主要以Δx來判斷某個年齡區(qū)間,或全年齡的觀測數(shù)據(jù)的質量,而以δx來判斷年齡尾數(shù)上的數(shù)據(jù)質量問題。
三、各次普查觀測死亡率的質量比較
根據(jù)Δx出現(xiàn)“-”號的次數(shù)和分布,δx的符號、分布及絕對值大小,對各次普查死亡率的年齡誤差可做如下歸納。
1.各次普查的比較
上面已詳細列舉了1981年死亡率數(shù)據(jù)的質量情況,這里不再重復,下面是1982年以后各次普查死亡率數(shù)據(jù)的質量情況。
1990年與1981年死亡率數(shù)據(jù)類似,Δx<0主要出現(xiàn)在青年期(21—30歲),共出現(xiàn)了8次(全部為11次),說明在這一時期的年齡數(shù)據(jù)質量是有問題的。從δx的值來看,“+”、“-”號在各年齡尾數(shù)上也沒有太大的偏離,說明年齡別死亡率數(shù)據(jù)質量尚好。但應注意的是,1990年普查沒有對90歲及以上的死亡作分年齡統(tǒng)計,而這個年齡段的數(shù)據(jù)質量往往是最容易出問題的。
2000年,Δx<0主要出現(xiàn)在25—36歲,共出現(xiàn)了8次(全部為21次),在高齡期96—98歲的3個年齡上,Δx的符號都為負,說明95歲以上的死亡率數(shù)據(jù)質量有明顯問題。在年齡尾數(shù)上,以“0”為尾數(shù)的δx值都小于0,而以“1”、“9”為尾數(shù)的年齡δx值都大于0??梢酝茰y以“0”為尾數(shù)的觀測死亡率大于實際死亡率,而以“1”、“9”為尾數(shù)的年齡觀測死亡率可能要小于實際死亡率。
2010年,總的來說,Δx<0出現(xiàn)的次數(shù)較少,只有9次,但出現(xiàn)的年齡與以往不同,主要出現(xiàn)在7—12歲,共出現(xiàn)了5次,說明在兒童期觀測死亡率的質量有問題。另外4次,Δx<0的年齡為25歲、26歲、96歲、98歲。從δx的符號看,在以“0”、“2”為尾數(shù)的年齡上,δx大多為負,而在以“1”、“9”為尾數(shù)的年齡上,δx大都為正??梢哉J為在這些年齡,死亡率數(shù)據(jù)的質量有問題。
2.性別差異
從表1可知,1981年Δx<0出現(xiàn)的次數(shù),女性多于男性,說明女性死亡率的數(shù)據(jù)質量比男性要差,但以后幾次普查,Δx出現(xiàn)負號的次數(shù),男性和女性就比較接近,說明兩者的數(shù)據(jù)質量已比較接近。
從1981年的數(shù)據(jù)看,男性死亡率Δx出現(xiàn)負號主要在20—31歲,共出現(xiàn)了10次,其次是88—97歲,出現(xiàn)了8次;女性死亡率Δx出現(xiàn)負號主要在20—33歲,共出現(xiàn)了12次,其次是88—98歲,出現(xiàn)了9次;從尾數(shù)指向上看,男性δx出現(xiàn)負號主要是在 “8”、“0”、“2”的尾數(shù)上。在“7”、“9”、“1”的尾數(shù)上δx大多大于0,從絕對值來看,以尾數(shù)“0”和“1”為大。
1990年,男性和女性Δx出現(xiàn)負號都主要在21—38歲,共出現(xiàn)了10次(全部為11次),說明在這個年齡段,死亡率的大小變化反復,數(shù)據(jù)質量有問題。但δx的符號沒有明顯的尾數(shù)指向。這個特征和1981年有明顯的不同。
2000年,男性和女性Δx<0主要出現(xiàn)在21—39歲,分別出現(xiàn)了10次和11次。
從δx值來看,在“0”和“2”的尾數(shù)上,δx的值小于0,而在“9”、“1”和“3”的尾數(shù)上,δx的值較多的大于0,且在“0”和“1”尾數(shù)上δx的絕對值大于臨近年齡δx的絕對值。
2010年,男性Δx出現(xiàn)負號的年齡區(qū)間主要在5—13歲,共出現(xiàn)了7次。女性在7—10歲出現(xiàn)了4次,在14—19歲出現(xiàn)了5次,在25—28歲出現(xiàn)了4次,以上三個年齡段出現(xiàn)負號共13次,占了負號出現(xiàn)次數(shù)的大部分(共15次)。從δx的值來看,男性和女性都在“0”、“5”的年齡尾數(shù)上多數(shù)為負,在“1”、“6”、“9”尾數(shù)上則大多為正。
3.城鄉(xiāng)差別
對1982年、1990年、2000年三次人口普查的數(shù)據(jù)檢驗結果顯示,縣(鄉(xiāng))人口死亡數(shù)據(jù)的Δx出現(xiàn)負號要多于市鎮(zhèn),說明縣(鄉(xiāng))人口死亡率的質量要比市鎮(zhèn)差,這似乎也很好解釋;而在2010年,卻出現(xiàn)了逆轉,市鎮(zhèn)人口死亡率的Δx<0出現(xiàn)的次數(shù)多于縣(鄉(xiāng)),其原因需要進一步解釋。
1981年,市鎮(zhèn)人口死亡率的Δx出現(xiàn)“-”號的次數(shù)主要在20—33歲,出現(xiàn)了10次,在93歲及以上出現(xiàn)了5次(全部共16次)??h(鄉(xiāng))人口死亡率的Δx出現(xiàn)“-”號的次數(shù)主要在20—33歲,出現(xiàn)了12次,在88歲及以上出現(xiàn)了9次(全部共26次)??梢姡青l(xiāng)人口死亡率數(shù)據(jù)在青年期、高齡期質量有問題,但縣(鄉(xiāng))人口死亡數(shù)據(jù)在老年期問題更大一些。從δx的符號和數(shù)值來看,市鎮(zhèn)人口死亡率有明顯的尾數(shù)指向,在“0”為尾數(shù)年齡上都是負數(shù),在“1”、“9”的尾數(shù)年齡,大多為正值??h(鄉(xiāng))人口死亡率尾數(shù)指向更明顯,在“0”、“2”、“8”為尾數(shù)年齡上大多是負數(shù),在“1”、“7”、“9”的尾數(shù)年齡,大多為正值,與市鎮(zhèn)相比,δx的絕對值也更大,說明偏離更為嚴重。
1990年,市鎮(zhèn)人口死亡率的Δx出現(xiàn)“-”號的次數(shù)主要在20—33歲,出現(xiàn)了8次(全部共9次)??h(鄉(xiāng))人口死亡率的Δx出現(xiàn)“-”號的次數(shù)主要在21—33歲,出現(xiàn)了10次,(全部共13次)。從δx的值來看,尾數(shù)指向不顯著。但在“0”、“9”的尾數(shù)上,負數(shù)出現(xiàn)略多一些,而在“1”、“4”、“6”的尾數(shù)上,正數(shù)要多一些。
2000年,市鎮(zhèn)人口死亡率的Δx出現(xiàn)“-”號的次數(shù)主要分布在6—10歲(4次),25—33歲出現(xiàn)了6次,在95歲及以上出現(xiàn)了4次(全部共19次)??h(鄉(xiāng))人口死亡率的Δx出現(xiàn)“-”號的次數(shù)在9—12歲(3次),在19 —37歲出現(xiàn)了12次,在93歲及以上出現(xiàn)了6次(全部共25次)。可見,城鄉(xiāng)人口死亡率質量問題主要在青年期和高齡期。從δx的符號和數(shù)值上來看,市鎮(zhèn)人口死亡率有明顯的尾數(shù)指向,在“0”為尾數(shù)年齡上都是負數(shù),在“1”,“9”的尾數(shù)年齡,都為正值??h(鄉(xiāng))人口死亡率在“0”、“2”、“5”為尾數(shù)年齡上大多是負數(shù),在“1”、“6”、“9”的尾數(shù)年齡,大多為正值。
2010年,市鎮(zhèn)人口死亡率的Δx出現(xiàn)“-”號的次數(shù)主要分布在6—9歲(3次),12—19歲出現(xiàn)了6次,24—30歲出現(xiàn)了4次,在95歲及以上出現(xiàn)了2次(全部共15次)??h(鄉(xiāng))人口死亡率的Δx出現(xiàn)“-”號的次數(shù)主要在8—13歲(3次),19—26歲出現(xiàn)了5次,在96歲及以上出現(xiàn)了2次(全部共11次)??梢?,城鄉(xiāng)人口死亡率的數(shù)據(jù)質量問題在兒童期、青年期、高齡期都有。從δx的符號和數(shù)值來看,市鎮(zhèn)人口死亡率有一定的尾數(shù)指向,在“0”為尾數(shù)年齡上大多是負數(shù),在“1”、“9”的尾數(shù)年齡,大多為正值??h(鄉(xiāng))人口死亡率的尾數(shù)指向與市鎮(zhèn)類似, 比較城鄉(xiāng)Δx的符號分布可以看出,在兒童期和青年期,市鎮(zhèn)出現(xiàn)負號次數(shù)要明顯地多于縣(鄉(xiāng))。這大概是由于城鄉(xiāng)人口遷移和流動加速,死亡報告在居住地和戶籍所在地不明確造成的。
四、誤差的產生來源
由以上的分析我們知道,中國人口死亡率的觀測數(shù)據(jù)普遍存在以下問題:
①在青年期和高齡期,死亡率數(shù)據(jù)高低變化不穩(wěn)定;②死亡率變化有特定期尾數(shù)指向,以 “0”為尾數(shù)的年齡觀測死亡率往往高于實際死亡率,以“1”、“9”為尾數(shù)的年齡觀測死亡率常常低于實際死亡率。
對于第一個問題,似乎可以用被調查者的年齡誤報來解釋。在20—30歲期間,是個人面臨升學、就業(yè)、婚姻等重要人生大事的關鍵時期, 而年齡通常和人的利益有關,因而導致了這一時期的年齡誤報;到老年期,尤其是高齡期,一些老年人因記不清自己的確切年齡而出現(xiàn)誤報。
死亡率大小的年齡尾數(shù)指向顯然也是和被調查者的年齡尾數(shù)指向有關。但對各次人口普查數(shù)據(jù)質量檢驗表明,人口年齡數(shù)據(jù)并沒有明顯的尾數(shù)指向。那么,如何解釋死亡率的觀測數(shù)據(jù)出現(xiàn)的這種尾數(shù)指向呢?
這可以從我國人口死亡率數(shù)據(jù)的獲取途徑來解釋。
在發(fā)達國家,人口死亡率是個動態(tài)指標,它的數(shù)據(jù)獲取主要是基于人口登記資料計算得到的。 而在我國,人口死亡率是根據(jù)人口普查資料計算得到的。
死亡率Mx是同期的死亡人口 Dx與平均人口Px之比,死亡率的數(shù)據(jù)質量通常取決于人口報告數(shù)據(jù)和死亡人口報告數(shù)據(jù)的質量。但在實際統(tǒng)計工作中,無論是人口登記還是人口普查,其數(shù)據(jù)總會存在一定的誤差,即使通過了“無特定的年齡尾數(shù)指向”檢驗,也并不表明人口報告數(shù)據(jù)的“年齡尾數(shù)指向”完全不存在,只是說明存在的“年齡尾數(shù)指向”問題可能并不顯著罷了。
當死亡率是基于人口登記資料計算得到時,死亡人口與人口的年齡在時間上是一致的,即使有一定的年齡指向存在,由于是比的關系,算出的死亡率可能也不會受太大的影響。如假定死亡人口和人口在某個年齡同時多登記了5%。因為Mx=Dx/Px, 所以計算的死亡率不會受影響。
當死亡率是基于人口普查資料得到時,就會出現(xiàn)不同的情況:同年齡的死亡人口與人口在時間上是不一致的,例如在1982年的第三次人口普查時,調查的是1981年的死亡人口。為了確定1981年死于x歲的人口死亡率,需要根據(jù)普查(1982)時x+1歲人口來推算。即在測定死亡率時,分子和分母用的是相鄰的兩個不同年齡尾數(shù)的對象人口,而相鄰的年齡尾數(shù)指向的方向往往是相反的。例如,在“0”的尾數(shù)上,人口往往出現(xiàn)多報的現(xiàn)象,造成報告人口多于實際人口,而相鄰的“1”的尾數(shù)上,人口往往存在少報的問題,造成報告人口少于實際人口。作為分子的死亡人口多報(或少報),而作為分母的人口少報(或多報)時,這就使原來不顯著的誤差得到了加強,例如以“0”為尾數(shù)的年齡的死亡人口多報了5%,以“1”為尾數(shù)的年齡的人口少報了5%,在計算以“0”為尾數(shù)的人口死亡率時,觀測死亡率的誤差就會擴大到10%。
已有研究普遍認為第三次(1982年)的人口普查質量要高于后幾次人口普查。但從年齡別死亡率上說,上面的研究表明,由第三次人口普查資料計算的死亡率要比后面幾次普查的質量要差。這是因為第三次普查計算的1981年某年齡(x歲)的人口死亡率,是根據(jù)普查(1982年)x+1歲的人口死亡率來推算的。而后幾次人口普查,計算的是普查前1年的x歲死亡率,但用作推算的x歲的平均人口,一半是和死亡人口同年齡同期的人口,這大概就是年齡別死亡率誤差相對較小的原因。
五、結論與建議
本文通過分析死亡率年齡變化的特征,從死亡率變化方向和變化速度兩個方面提出了判定數(shù)據(jù)質量的方法和檢驗指標。對四次人口普查死亡率的觀測數(shù)據(jù)的檢驗結果表明:①我國人口死亡率在青年期和高齡期普遍存在質量問題,表現(xiàn)為死亡率常改變方向;在以“0”為尾數(shù)的年齡,觀測死亡率往往會高于實際死亡率,而在以“1”、“9”為尾數(shù)的年齡,觀測死亡率往往會低于實際死亡率。②隨著年代推移,死亡數(shù)據(jù)的質量有所改善,城鄉(xiāng)、男女之間的差別縮小。③出現(xiàn)了新問題。兒童期數(shù)據(jù)質量在2010年以前較好,2010年數(shù)據(jù)明顯變差,尤其是在城市。
死亡數(shù)據(jù)質量問題的產生,主要源于我國獲得死亡人口數(shù)據(jù)的途徑。由于死亡人口是由普查數(shù)據(jù)獲得的,在計算死亡率時同一年齡的人口和死亡人口不同期,需要用下一個年齡的人口來估計,從而導致原來并不顯著的年齡尾數(shù)誤報被擴大。而兒童期和青年期死亡數(shù)據(jù)質量問題的產生,部分原因是流動人口的戶籍地和常住地不一致,從而導致了漏報和誤報的產生。
人口死亡本來是人口動態(tài)統(tǒng)計,其數(shù)據(jù)應該由人口日常登記資料來獲得。我國現(xiàn)在主要依靠人口調查來獲得,導致了許多問題的產生。所以,改變現(xiàn)行的統(tǒng)計方法,完備人口統(tǒng)計制度是提高人口死亡率數(shù)據(jù)質量的最有效途徑。
這里要說明的是,文中討論的年齡別死亡率的誤差,從絕對值來說,其實是很小的(參考圖1)。
但從理論上以及實際應用時(特別是在類似于保險等精算研究中),對有問題的數(shù)據(jù)進行修正是必要的。
參考文獻:
[1]游允中.人口死亡研究和死亡數(shù)據(jù)[J].市場與人口分析,2006(6):19-21.
[2]達德利·鮑思頓. 中國嬰兒死亡率模式[J]. 人口研究,1991(3): 29-35.
[3]COALE A J, ?LI S. The effect of age misreporting in China on the calculation of mortality rates at very high ages[J]. Demography, 1991,28(2):293-301.
[4]游允中.1982 年中國人口普查的可信度[J].人口與經濟,1984(6):11-18.
[5]李樹茁. 80年代中國人口死亡水平和模式的變動分析——兼論對1990年人口普查死亡水平的調整[J]. 人口研究,1994(2):37-44.
[6]黃榮清. 中國80 年代死亡水平研究[J].中國人口科學,1994(3):1-11.
[7]張二力,路磊. 對中國1990年人口普查成年人口死亡登記完整率的估計[J]. 中國人口科學,1992(3):27-29.
[8]翟振武. 1990年嬰兒死亡率的調整及生命估計[J]. 人口研究,1993(2):9-16.
[9]李南,孫福濱. 死亡漏報的一種新的估計方法[J]. 人口研究,1994(5): 38-43.
[10]黃榮清,曾憲新.“六普”報告的嬰兒死亡率誤差和實際水平的估計[J]. 人口研究,2013(2): 3-16.
[11]馬京奎. 2000 年人口普查國家級重點課題研究報告[M]. 北京: 中國統(tǒng)計出版社,2005:240-249.
[12]王金營,戈艷霞. 2010年人口普查數(shù)據(jù)質量評估以及對以往人口變動分析校正[J]. 人口研究,2013(1):22-33.
[13]趙夢晗,楊凡. 六普數(shù)據(jù)中嬰兒死亡率及兒童死亡概率的質疑與評估[J]. 人口研究,2013(5): 68-80.
[14]孫福濱,李樹茁,李南. 中國第四次人口普查全國及部分省區(qū)死亡漏報研究[J]. 中國人口科學,1993(2):20-25.
[責任編輯?武?玉]