王志剛 王曉軍 張學(xué)斌
摘要:由不同組別人群組成封閉人群整體生存人數(shù)的預(yù)測(cè)是相關(guān)經(jīng)濟(jì)、社會(huì)問(wèn)題研究的基礎(chǔ)?,F(xiàn)有文獻(xiàn)在研究相關(guān)問(wèn)題時(shí),使用的方法為:首先根據(jù)動(dòng)態(tài)死亡率模型對(duì)其中具有相同特征不同部分的生存人數(shù)進(jìn)行預(yù)測(cè),之后通過(guò)加總得到整體人數(shù)的預(yù)測(cè)(簡(jiǎn)稱現(xiàn)有方法)。由于現(xiàn)有方法忽略了不同特征人群死亡率變動(dòng)間相關(guān)性的影響,會(huì)低估生存人數(shù)的波動(dòng)性。本文使用Lee-Carter模型,在將封閉人群按性別分組的基礎(chǔ)上,給出了構(gòu)建生存人數(shù)整體預(yù)測(cè)模型的過(guò)程和實(shí)例。并通過(guò)理論分析和數(shù)值模擬兩個(gè)視角對(duì)現(xiàn)有方法和新方法做了比較。比較結(jié)果指出:在死亡率波動(dòng)具有廣泛相關(guān)性的現(xiàn)實(shí)世界中,只有在均值預(yù)測(cè)時(shí),現(xiàn)有方法才可以達(dá)到預(yù)期效果,因此筆者建議在對(duì)整體人數(shù)(特別是涉及方差和分布函數(shù))預(yù)測(cè)時(shí),使用本文介紹的整體生存人數(shù)預(yù)測(cè)模型。
關(guān)鍵詞:生存人數(shù):Lee-Caner模型:整體預(yù)測(cè)
中圖分類號(hào):C921
文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1000-4149(2016)04-0010-11
DoI:10.3969/j.issn.1000-4149.2016.04.002
一、引言
對(duì)于不考慮人口流動(dòng)的封閉人群生存人數(shù)預(yù)測(cè)是相關(guān)經(jīng)濟(jì)、社會(huì)問(wèn)題研究的基礎(chǔ)。封閉群體人數(shù)的變動(dòng)主要來(lái)自于死亡所引發(fā)的成員退出。封閉人群通常是由不同特征(例如不同性別、不同地域)人群構(gòu)成。在對(duì)封閉人群生存人數(shù)進(jìn)行預(yù)測(cè)時(shí),現(xiàn)有文獻(xiàn)中主要根據(jù)某一特征對(duì)人群進(jìn)行分組,在對(duì)每一組生存人數(shù)預(yù)測(cè)的基礎(chǔ)上,通過(guò)加總得到整體人數(shù)的預(yù)測(cè)。簡(jiǎn)單加總的前提條件是不同特征人群死亡率變動(dòng)間不具有相關(guān)性。而實(shí)際經(jīng)驗(yàn)和數(shù)據(jù)都顯示,不同特征人群死亡率變動(dòng)是具有相關(guān)性的。簡(jiǎn)單地忽略人群死亡率變動(dòng)間相關(guān)性的影響,雖然在對(duì)生存人數(shù)期望研究時(shí)可以得到比較滿意的效果,但對(duì)方差、特定分位數(shù)和分布函數(shù)的預(yù)測(cè)就變得不再適合了。而隨著社會(huì)問(wèn)題研究的深入,一些領(lǐng)域(例如保險(xiǎn)精算)的研究不僅需要獲得生存人數(shù)的期望值,還需要獲得生存人數(shù)波動(dòng)方差和分布函數(shù)。在現(xiàn)有研究方法無(wú)法滿足對(duì)方差、分位數(shù)和分布函數(shù)度量的情況下,本文將以動(dòng)態(tài)死亡率模型為基礎(chǔ),將不同組別問(wèn)相關(guān)性納入到模型中,建立新的生存人數(shù)預(yù)測(cè)模型,以滿足實(shí)際問(wèn)題研究的需要。
建立一個(gè)整體生存人數(shù)預(yù)測(cè)模型,需要完成兩方面的工作:一是將影響人口變動(dòng)的死亡率模型由一維擴(kuò)展為多維;在由一維擴(kuò)展到多維時(shí),就必須考慮不同組別間死亡率變動(dòng)時(shí)體現(xiàn)出的相關(guān)性,因此第二項(xiàng)工作就是在分組的基礎(chǔ)上,準(zhǔn)確度量不同組間死亡率變動(dòng)的相關(guān)性,并將相關(guān)性研究結(jié)果納入到前面建立的多維死亡率模型中。
由于一組人群可以按不同指標(biāo)分為不同組,作為整體生存人數(shù)預(yù)測(cè)實(shí)例,本文按照性別將相同年齡人群分為兩組。在展開(kāi)具體問(wèn)題研究時(shí),與前面提及的邏輯順序不同,本文首先對(duì)不同性別死亡率變動(dòng)過(guò)程中表現(xiàn)出的相關(guān)性進(jìn)行深入研究:然后,將得到的相關(guān)性度量結(jié)果納入多維Lee-Carter動(dòng)態(tài)死亡率模型中,進(jìn)而得到按性別分組的整體生存人數(shù)預(yù)測(cè)模型;最后對(duì)現(xiàn)有研究方法和本文方法的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比研究。
二、男性和女性死亡率的相關(guān)性
剔除了人口再生產(chǎn)引發(fā)的成員增加和人口遷移引發(fā)的成員數(shù)的變動(dòng),此時(shí)封閉人群生存人數(shù)變動(dòng)主要來(lái)自成員由于死亡而引發(fā)的退出。本節(jié)將對(duì)引發(fā)成員退出的(男性和女性)死亡率變動(dòng)過(guò)程中體現(xiàn)出的相關(guān)性進(jìn)行研究。為了后面陳述方便,先對(duì)需要使用的符號(hào)、數(shù)據(jù)和死亡率模型進(jìn)行簡(jiǎn)要的
(2)數(shù)據(jù)。本文建模使用的數(shù)據(jù)來(lái)源于國(guó)家統(tǒng)計(jì)局公布的1995-2006年《中國(guó)人口統(tǒng)計(jì)年鑒》、2007-2012年《中國(guó)人口和就業(yè)統(tǒng)計(jì)年鑒》和2010年人口普查數(shù)據(jù)中的全國(guó)分年齡、分性別死亡人口狀況表,進(jìn)而根據(jù)式(1)計(jì)算得到1995-2012年各年度分年齡(0-85歲五歲一組)、分性別的中心死亡率。為了更清晰地描述這些數(shù)據(jù),圖1給出了我國(guó)1995-2012年連續(xù)16年0-85歲的男性和女性對(duì)數(shù)死亡率的三維圖。圖1顯示中國(guó)男性和女性對(duì)數(shù)死亡率變動(dòng)具有很強(qiáng)的相似性,這種相似性體現(xiàn)了內(nèi)在相近的生理特征和共同的社會(huì)、醫(yī)療水平對(duì)男性和女性死亡率改善的內(nèi)在規(guī)律,這提示我們?cè)诮⒄w生存人數(shù)估計(jì)時(shí)應(yīng)該考慮相關(guān)性的影響。
2.動(dòng)態(tài)死亡率預(yù)測(cè)模型
在將男性和女性死亡率波動(dòng)過(guò)程中的相關(guān)性納入死亡率模型之前,首先需要選取一個(gè)合適的死亡率模型。常用的死亡率模型可以分為靜態(tài)和動(dòng)態(tài)死亡率模型兩種,由于靜態(tài)死亡率模型不包含時(shí)間項(xiàng)所以無(wú)法用于預(yù)測(cè),因此為了能夠?qū)ξ磥?lái)的生存人數(shù)進(jìn)行預(yù)測(cè),需要使用動(dòng)態(tài)死亡率模型。
近30年來(lái),動(dòng)態(tài)死亡率模型在理論上取得了豐富的研究成果,其中包括:李(Lee)和卡特(Carter)1992年提出的Lee-Carter模型,倫肖(Renshaw)和哈伯曼(Haberman)2006年提出的Lee-Caner改進(jìn)模型——RH模型,以及凱恩斯(Cairns)等人2006年提出的CBD模型。王曉軍、黃順林匯總介紹了包括以上模型在內(nèi)的8個(gè)動(dòng)態(tài)死亡率模型。王志剛指出一個(gè)較為理想的形態(tài)應(yīng)該包含年齡項(xiàng)、時(shí)間和年齡交互影響項(xiàng),以及出生年因素項(xiàng)。為了減少待估參數(shù),一個(gè)較好的
動(dòng)態(tài)死亡率模型中雖然沒(méi)有將社會(huì)、醫(yī)療等變量直接納入到模型中,但死亡率的變動(dòng)綜合體現(xiàn)了這些因素對(duì)死亡率的影響,因此模型中的三組參數(shù)(αx,βx,Kt)估計(jì)結(jié)果體現(xiàn)了多種因素對(duì)不同年份、年齡人群的影響合力。間接體現(xiàn)了社會(huì)、醫(yī)療等因素變動(dòng)的影響,并且在實(shí)際問(wèn)題中取得了較好的擬合效果,其參數(shù)含義清晰。因此,動(dòng)態(tài)死亡率模型受到了廣泛關(guān)注,其中Lee-Carter模型就被聯(lián)合國(guó)人口署和美國(guó)人口普查局等眾多機(jī)構(gòu)使用,后面就以Lee-Carter模型為例,建立能夠反映男性和女性死亡率變動(dòng)相關(guān)性的封閉人群生存人數(shù)整體預(yù)測(cè)模型。
三、建立生存人數(shù)預(yù)測(cè)模型
1.建立男性和女性整體死亡率預(yù)測(cè)模型
李和卡特提出的一維Lee-Carter模型最早用于美國(guó)男性人口死亡率建模,之后學(xué)者在引用該方法時(shí),也都只限于對(duì)某一組別人群進(jìn)行研究。國(guó)內(nèi)研究也體現(xiàn)出相同特點(diǎn)。本文需要使用二維Lee-Carter模型對(duì)男性和女性生存人數(shù)進(jìn)行整體建模,這就需要對(duì)前面選取的一維Lee-Carter模型進(jìn)行擴(kuò)展,建立一個(gè)能夠體現(xiàn)死亡率變動(dòng)內(nèi)在相關(guān)性的死亡率聯(lián)合模型,以使模型能夠更好體現(xiàn)中國(guó)男性人口和女性人口死亡率隨年齡波動(dòng)的自然規(guī)律及人口死亡率改善進(jìn)程中的同步性。
根據(jù)二維Lee-Carter模型中參數(shù)含義可知,式(3)和(4)中的αxG項(xiàng)取值序列已經(jīng)體現(xiàn)了死亡率隨年齡變動(dòng)的規(guī)律和相關(guān)性,此時(shí)直接在模型中使用估計(jì)值便可以滿足要求,不需要在模型中再引入新的約束。
建立新舊兩種方法的預(yù)測(cè)模型后,作為實(shí)例,下面以社會(huì)養(yǎng)老保障和(養(yǎng)老)保險(xiǎn)公司關(guān)注的老年群體為例,假設(shè)2012年初始年齡為60歲的男性和女性各10000人為例,使用前面給出的整體生存人數(shù)預(yù)測(cè)方法,對(duì)未來(lái)45年生存人數(shù)進(jìn)行預(yù)測(cè),并建立分布函數(shù),計(jì)算均值、標(biāo)準(zhǔn)差和分位數(shù)。
(1)均值估計(jì)比較。圖4中分別繪制了使用分性別估計(jì)和整體估計(jì)得到的未來(lái)45年內(nèi)男性、女性和總體生存人數(shù)均值預(yù)測(cè)值(共計(jì)6個(gè)預(yù)測(cè)值)。但在圖4中,只能清晰辨別出三條曲線,這是因?yàn)槭褂脙煞N不同方法分別得到三個(gè)期望的估計(jì)值完全一致,所以其繪制出的曲線黏合在一起,無(wú)法清晰辨別。其中(由下向上第一、二)兩(實(shí)際是四條線)條曲線,分別體現(xiàn)了兩種方法估計(jì)得到的男性和女性期望的預(yù)測(cè)結(jié)果,由于相關(guān)性對(duì)不同組別生存人數(shù)的估計(jì)是不產(chǎn)生影響的,所以兩個(gè)估計(jì)結(jié)果一致是情理之中的。另一條曲線描述了整體生存人數(shù)的期望值,由于相關(guān)性對(duì)于期望求和不產(chǎn)生影響,所以兩個(gè)計(jì)算結(jié)果也是一樣的,圖形上也顯示為兩條曲線黏合在一起(由下向上第三條線)。
(2)標(biāo)準(zhǔn)差和分布函數(shù)估計(jì)結(jié)果比較。對(duì)于期望估計(jì)結(jié)果,兩種方法完全一致的效果,可能會(huì)讓使用者誤認(rèn)為原有方法是有效的工具(但事實(shí)上這只是一個(gè)巧合,而不是正確的路徑)。在需要生存人數(shù)的方差等相關(guān)數(shù)值時(shí),現(xiàn)有的方法就沒(méi)有這樣幸運(yùn)了。圖5中依然分別繪制了使用分性別估計(jì)和整體估計(jì)得到未來(lái)45年內(nèi)男性、女性和總體生存人數(shù)方差的估計(jì)值(共計(jì)6個(gè)估計(jì)值)。但在圖5中,能夠清晰辨別出四條曲線,比圖4中多一條可以辨識(shí)的曲線。
圖5中(由下向上第一、二)兩條曲線,分別體現(xiàn)了兩種方法估計(jì)得到的男性和女性方差的預(yù)測(cè)結(jié)果(共計(jì)4條線)。由于相關(guān)性對(duì)單個(gè)組別的估計(jì)并不產(chǎn)生影響,所以使用兩種不同方法得到男性和女性生存人數(shù)預(yù)測(cè)值的波動(dòng)方差相同,據(jù)此繪制出的四條曲線黏合在一起,只能清晰辨別出兩條。另外的兩條曲線就體現(xiàn)了使用兩種不同方法對(duì)整體方差估計(jì)結(jié)果的不同,其中使用獨(dú)立估計(jì)得到的男性和女性方差估計(jì)結(jié)果之和(由下向上第三條線)明顯低于對(duì)整體生存人數(shù)進(jìn)行預(yù)測(cè)得到的方差值(由下向上第四條線),體現(xiàn)了分別估計(jì)方法對(duì)方差可能產(chǎn)生低估的負(fù)面影響。
標(biāo)準(zhǔn)差的不同也會(huì)引發(fā)兩種方法對(duì)生存人數(shù)分布函數(shù)的預(yù)測(cè)結(jié)果的不同,在獨(dú)立假設(shè)下較小的標(biāo)準(zhǔn)差意味著生存人數(shù)預(yù)測(cè)結(jié)果更加集中,體型更加“輕盈”;相對(duì)應(yīng)的,整體生存人數(shù)預(yù)測(cè)模型的標(biāo)準(zhǔn)差較大,得到的分布函數(shù)則會(huì)更加“豐滿”(詳見(jiàn)圖6)。
依據(jù)模擬得到的結(jié)果還可以進(jìn)一步估計(jì)該組人群的余壽,計(jì)算結(jié)果參見(jiàn)表3。估計(jì)結(jié)果顯示:兩種情形假設(shè)下余壽估計(jì)值是相同的,但是現(xiàn)有方法對(duì)于余壽波動(dòng)方差的估計(jì)是明顯低于考慮相關(guān)情形下的估計(jì)結(jié)果。在兩種不同假設(shè)下,表3中給出的余壽90%置信區(qū)間分別為(14.28,15.36)和(14.05,15.54),現(xiàn)有方法得到的估計(jì)區(qū)間更窄,區(qū)間上限和下限差為1.18歲,而在考慮相關(guān)情形下得到的區(qū)間寬度為1.49歲,比現(xiàn)有方法高0.41歲。可見(jiàn),現(xiàn)有的方法低估了余壽的波動(dòng)范圍。
五、結(jié)論
通過(guò)上述分析可以得到以下結(jié)論,現(xiàn)有方法和本文介紹的建模方法內(nèi)含了兩種不同的假設(shè)條件,本文介紹的整體生存人數(shù)預(yù)測(cè)方法更符合實(shí)際情況。雖然以Lee-Carter為代表的動(dòng)態(tài)死亡率模型并沒(méi)有明確包含人口生理特征和社會(huì)、醫(yī)療條件等因素項(xiàng),但體現(xiàn)了這些因素對(duì)死亡率變動(dòng)的綜合影響?,F(xiàn)有方法中在分別對(duì)男性和女性死亡率波動(dòng)進(jìn)行建模,并進(jìn)而通過(guò)加總得到男性和女性生存人數(shù)之和的預(yù)測(cè)值時(shí),對(duì)男性和女性死亡率分別獨(dú)立建模,隱含假設(shè)這些因素是分別獨(dú)立作用于男性和女性的。而現(xiàn)實(shí)生活中,由于內(nèi)在相近的生理特征和社會(huì)、醫(yī)療等條件發(fā)生的改變同時(shí)影響男性和女性人群,使得男性和女性人群死亡率波動(dòng)具有內(nèi)在的關(guān)聯(lián)性,因此,在進(jìn)行整體生存人數(shù)建模時(shí),假設(shè)生理特征和社會(huì)、醫(yī)療條件對(duì)男性和女性死亡率影響具有相關(guān)性,更加符合實(shí)際。本文介紹的方法能夠很好地將這種相關(guān)性納入到模型中,所以使用整體的生存人數(shù)模型進(jìn)行建模將更接近實(shí)際情況。
同時(shí)理論和數(shù)值計(jì)算結(jié)果顯示:本文給出的方法能夠更加有效地估計(jì)整體生存人數(shù)的期望、方差和分布函數(shù)。人口估計(jì)的期望值,可以理解為在未來(lái)社會(huì)和醫(yī)療條件中性變動(dòng)條件下預(yù)測(cè)生存人數(shù)。此時(shí)現(xiàn)有方法和本文介紹的方法將基于相同的假設(shè)條件下進(jìn)行計(jì)算,所以得到的結(jié)果是一致的,但這種一致應(yīng)該理解為一種巧合性的一致,不能代表現(xiàn)有的方法是正確的。標(biāo)準(zhǔn)差體現(xiàn)了死亡率改善中受到社會(huì)和醫(yī)療等因素的影響,而引發(fā)的生存人數(shù)的平均波動(dòng)。分別對(duì)男性和女性死亡率波動(dòng)進(jìn)行建模,就意味著假設(shè)這些因素是分別作用于男性和女性。這就有可能獲得假設(shè)男性人口發(fā)生死亡率改善而女性死亡率惡化的模擬結(jié)果,或是男性人口發(fā)生死亡率惡化而女性死亡率改善的模擬結(jié)果。當(dāng)將男性和女性人口加總獲得整體人口研究結(jié)果時(shí),就會(huì)對(duì)沖掉生存人數(shù)的波動(dòng),使得整體波動(dòng)偏差變小,從而低估風(fēng)險(xiǎn)。本文給出的研究框架,有效地納入了死亡率變動(dòng)中體現(xiàn)的相關(guān)性,能夠更加準(zhǔn)確地預(yù)測(cè)生存人數(shù)的變動(dòng)幅度和分布函數(shù)。
本文以性別分組為例,給出了利用動(dòng)態(tài)死亡率模型構(gòu)建生存人數(shù)整體預(yù)測(cè)路徑和實(shí)例,該框架也可以適用于其他二維分組和多維情況。死亡率變動(dòng)體現(xiàn)的相關(guān)性不僅體現(xiàn)在一個(gè)地區(qū)內(nèi)的不同組別的人群上。根據(jù)HMD(世界人口死亡率)數(shù)據(jù)庫(kù)中的數(shù)據(jù)顯示,不同地區(qū)的人群死亡率也具有很強(qiáng)的相關(guān)性,因此在對(duì)整體人群生存人數(shù)進(jìn)行預(yù)測(cè)時(shí),不同地域、組別人群間具有的相關(guān)性是必須應(yīng)該考慮的問(wèn)題,在研究這些問(wèn)題時(shí),可以參考本文的研究框架構(gòu)建相應(yīng)的整體生存人數(shù)預(yù)測(cè)模型。
由于經(jīng)典的Lee-Carter模型被世界上多個(gè)政府、金融機(jī)構(gòu)作為死亡率預(yù)測(cè)模型,本文以Lee-Carter模型為例給出的生存人數(shù)整體預(yù)測(cè)模型,有助于和國(guó)外現(xiàn)有相關(guān)研究成果銜接。但本文所討論的研究思路并不局限于該模型,可以擴(kuò)展到其他動(dòng)態(tài)死亡率模型中,以建立相應(yīng)的生存人數(shù)整體預(yù)測(cè)模型。