任國強(qiáng),王于丹,周云波
(1.天津理工大學(xué) 管理學(xué)院,天津 300384;2. 南開大學(xué) 經(jīng)濟(jì)學(xué)院,天津 300071)
健康不僅是人類的普遍愿望和基本需求,而且作為人力資本的重要組成部分,對(duì)個(gè)體、家庭和社會(huì)都會(huì)產(chǎn)生重要的影響。從個(gè)體角度來看,健康可以促進(jìn)教育水平的提高和社會(huì)資本的形成,從而影響就業(yè)狀態(tài)、就業(yè)類型,進(jìn)而影響就業(yè)收入和社會(huì)階層地位;從家庭角度來看,健康可以增加家庭的收入,減少醫(yī)療費(fèi)用的支出,促進(jìn)家庭幸福;從社會(huì)經(jīng)濟(jì)角度來看,健康有利于促進(jìn)勞動(dòng)力供給,延長就業(yè)者的工作年限,促進(jìn)勞動(dòng)生產(chǎn)率,從而促進(jìn)經(jīng)濟(jì)增長。正是由于健康的重要性,對(duì)健康的研究一直是學(xué)術(shù)界研究的熱點(diǎn),以“all in title: health”作為搜索條件,用谷歌學(xué)術(shù)進(jìn)行搜索,搜索結(jié)果達(dá)到142萬余條,再加上以各種疾病研究為論文標(biāo)題的文獻(xiàn)就更多。我們?cè)赪eb of Science數(shù)據(jù)庫中,在標(biāo)題、摘要、關(guān)鍵詞中搜索“causal & health”,然后再分別檢索各個(gè)因果推斷方法和健康(例如:“Propensity Score & health”),共得到了七萬余條檢索記錄,盡管其中可能有重復(fù)文獻(xiàn),但即使剔除這些文獻(xiàn)仍有大量檢索記錄。不難看出,因果推斷方法在健康領(lǐng)域得到了廣泛的應(yīng)用。該領(lǐng)域的研究早在20世紀(jì)90年代就進(jìn)入大眾視野,2010年前后得到了更多的關(guān)注,如今更是蓬勃發(fā)展,研究范圍也逐步從公共環(huán)境衛(wèi)生、臨床醫(yī)學(xué)、生物學(xué)等領(lǐng)域,開始擴(kuò)大至經(jīng)濟(jì)學(xué)、社會(huì)學(xué)的范疇,而影響個(gè)體健康的相關(guān)因素除了作為控制異質(zhì)性的個(gè)體人口學(xué)特征以外,還包括了教育、工作、收入和社會(huì)資本等個(gè)人因素,以及遷移、退休和保險(xiǎn)等政策性因素。本文就是從經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、人口學(xué)等領(lǐng)域入手,從多角度考慮各領(lǐng)域因素對(duì)個(gè)體健康的影響。
盡管健康研究很重要,研究的成果又非常豐富,但是由于其內(nèi)在復(fù)雜性,健康研究仍然存在很多問題,主要表現(xiàn)在以下幾個(gè)方面:一是被解釋變量——健康的測量誤差,很多研究采用自評(píng)健康作為研究對(duì)象,對(duì)健康狀態(tài)的回答主要根據(jù)個(gè)體主觀判斷,而個(gè)體由于認(rèn)知能力的差別,往往做不到完全理性,因此回答的結(jié)果和自己真實(shí)的健康狀況通常有一定的差別;二是遺漏變量的存在會(huì)對(duì)結(jié)果造成干擾,使得解釋變量的估計(jì)結(jié)果不準(zhǔn)確,例如在研究教育對(duì)健康的影響時(shí),由于無法準(zhǔn)確衡量身體稟賦這一不可觀測變量,回歸時(shí)往往遺漏該變量,從而過高估計(jì)了教育對(duì)健康的影響;三是解釋變量和被解釋變量之間可能互為因果,比如工作時(shí)間過長可能會(huì)導(dǎo)致健康狀況下降,反之良好的健康狀況又會(huì)讓勞動(dòng)者有更多的精力投身于工作;四是存在同時(shí)影響解釋變量和結(jié)果的第三方變量,比如教育水平越高相應(yīng)的收入水平也越高,健康狀況可能也越好,而收入對(duì)健康也有直接的影響,所以教育就是影響收入和健康的共同原因;五是樣本自選擇偏差,以遷移對(duì)健康的影響為例,遷移的個(gè)體往往比不遷移個(gè)體更健康,但是這個(gè)結(jié)果并不一定是遷移政策造成的,可能是遷移個(gè)體的健康狀況往往更好,因?yàn)閭€(gè)人健康狀況的好壞決定著其流動(dòng)機(jī)會(huì)和流動(dòng)決策。
為了解決上述健康研究中存在的問題,學(xué)者們采用了相應(yīng)的因果推斷方法作為分析工具。例如在研究退休對(duì)健康的因果效應(yīng)時(shí),工具變量的方法可以最大限度地減少對(duì)測量誤差的擔(dān)憂;與之類似,庫魯克利斯(Kourouklis)等人在研究收入對(duì)健康的影響時(shí),使用工具變量方法更好地處理了因?yàn)檫z漏變量所帶來的潛在偏差;阿塔萊(Atalay)等人為解決雙向因果關(guān)系和測量誤差,使用固定效應(yīng)模型研究了妻子退休對(duì)丈夫心理健康的影響;龍翠江等人利用傾向得分匹配與雙重差分相結(jié)合的方法對(duì)遷移和健康之間的因果關(guān)系展開了深入研究,解決了選擇性偏差和互為因果帶來的問題。這些方法已經(jīng)被廣泛應(yīng)用于個(gè)體健康研究,用來解決研究過程中產(chǎn)生的一系列問題。當(dāng)然對(duì)同一類問題的研究根據(jù)數(shù)據(jù)特征和研究背景的不同,可以采用多種因果推斷的方法。
在個(gè)體健康研究文獻(xiàn)中,由于采用的研究方法存在缺陷,許多文獻(xiàn)所指出的影響因素與健康之間的關(guān)系是相關(guān)而非因果關(guān)系,而影響因素與健康之間的因果關(guān)系對(duì)政策的制定和實(shí)施至關(guān)重要。盡管很多學(xué)者采用了因果推斷的方法來研究影響因素和健康之間的因果關(guān)系,也有學(xué)者從公共健康的角度對(duì)相關(guān)研究進(jìn)行歸納,但是鮮有研究從健康的社會(huì)經(jīng)濟(jì)決定方面對(duì)個(gè)體健康研究中的因果推斷問題進(jìn)行總結(jié)。本文的目的在于通過識(shí)別個(gè)體健康研究中的常見問題,評(píng)價(jià)常用的因果推斷方法及其在個(gè)體健康研究中的應(yīng)用。由于現(xiàn)有個(gè)體健康研究的文獻(xiàn)過多,因此我們選擇近十年的文獻(xiàn)進(jìn)行分析,盡可能涵蓋多個(gè)方面,但研究文獻(xiàn)中未包括臨床醫(yī)學(xué)方面的研究。
個(gè)體健康研究中常見的問題主要來源于被解釋變量、解釋變量、解釋變量和被解釋變量關(guān)系、混雜因素以及研究樣本的選擇性五個(gè)方面。
在進(jìn)行健康研究時(shí),作為被解釋變量的健康除了可以采用發(fā)病率指數(shù)、身體質(zhì)量指數(shù)BMI和特定疾病診斷等客觀指標(biāo)外,還會(huì)采用自評(píng)健康(Self-Reported Health,SRH)和心理健康等主觀指標(biāo)。當(dāng)使用像SRH這樣有序的主觀測量作為客觀健康的代理時(shí),研究者必須假設(shè)SRH是對(duì)個(gè)體健康狀態(tài)的真實(shí)反映。無論我們是根據(jù)性別、種族、年齡還是社會(huì)經(jīng)濟(jì)地位來定義群體,當(dāng)不同的群體以不同的方式自我報(bào)告他們的健康狀況時(shí),都有可能會(huì)造成較大的測度誤差。SRH的測度誤差可能會(huì)對(duì)研究結(jié)果產(chǎn)生不利的影響,一方面是影響結(jié)果的可靠性,另一方面對(duì)自評(píng)健康的過高評(píng)價(jià)可能導(dǎo)致風(fēng)險(xiǎn)健康行為。盡管對(duì)報(bào)告偏差和解釋存在擔(dān)憂,但是由于其易于收集的特點(diǎn),SRH仍然是研究人員最常用的健康衡量標(biāo)準(zhǔn),一些研究結(jié)果也表明SRH不僅與客觀健康指標(biāo)具有較強(qiáng)的相關(guān)性,而且確實(shí)可以預(yù)測未來的客觀健康狀況。雖然學(xué)術(shù)界對(duì)SRH是不是可靠的健康指標(biāo)并沒有達(dá)成一致,學(xué)者們還是希望SRH越可靠越好,一個(gè)可選擇的方案是對(duì)自我健康狀況進(jìn)行多次評(píng)估。以中國健康與養(yǎng)老追蹤調(diào)查(CHARLS)數(shù)據(jù)為例,CHARLS問卷有兩次關(guān)于自評(píng)健康狀況的調(diào)查,第一次受訪者未經(jīng)任何準(zhǔn)備直接被詢問健康狀況,回答可能過于主觀,第二次則是在被詢問有關(guān)慢性病等客觀指標(biāo)的相關(guān)問題之后,一部分受訪者的自評(píng)健康水平發(fā)生了變化,所以受訪者第二次的自評(píng)答案更加真實(shí)可靠。
個(gè)體健康研究中解釋變量方面存在的問題主要是由遺漏變量所造成的。遺漏變量使得殘差項(xiàng)與解釋變量相關(guān),導(dǎo)致解釋變量的回歸系數(shù)是有偏的。但是在進(jìn)行計(jì)量分析時(shí),很難做到不遺漏變量,一方面很難判斷哪些變量要加入控制變量集,即使知道某個(gè)變量應(yīng)該加入控制變量中,實(shí)際上也可能無法測度(如天賦和能力),另一方面是可能存在未知的控制變量。以保險(xiǎn)和健康的關(guān)系為例,有學(xué)者指出,保險(xiǎn)與健康之間存在一些不可觀察的變量,主要包括:①個(gè)人的健康意識(shí)。個(gè)人的健康意識(shí)越強(qiáng),越可能擁有健康的生活方式,也越可能參加醫(yī)療保險(xiǎn)以預(yù)防和治療疾病。②個(gè)人的風(fēng)險(xiǎn)偏好。風(fēng)險(xiǎn)規(guī)避者往往傾向于參加醫(yī)療保險(xiǎn),同時(shí)更注重采取預(yù)防保健措施和避免危害健康的行為,這些無法度量的變量使得研究者很難建立起醫(yī)療保險(xiǎn)與健康狀況之間真正的因果關(guān)系。
被解釋變量與解釋變量之間可能會(huì)存在雙向因果關(guān)系。如果兩個(gè)變量互為因果,任何一方都可以作為對(duì)方的解釋變量,那么任何一個(gè)單方面的回歸都可能帶來內(nèi)生性問題。許多健康的影響因素和健康之間存在雙向因果關(guān)系,例如收入與健康之間的關(guān)系、工作時(shí)長與健康之間的關(guān)系等。以收入與健康之間的關(guān)系為例,很多學(xué)者認(rèn)為較高的收入會(huì)帶來較高的健康水平,較好的健康也會(huì)使得收入增加,但這并不能說明二者之間的因果關(guān)系,要分析收入對(duì)健康的因果影響,一定要保證收入變量是外生的,但在實(shí)證研究中卻很難做到:一方面,可以有力預(yù)測收入的因素往往也直接影響健康,如教育水平、失業(yè)和工作經(jīng)驗(yàn);另一方面,存在不可觀測的因素,如遺傳、風(fēng)險(xiǎn)偏好和社會(huì)背景等,可能與收入和健康有關(guān)。為此諸多文獻(xiàn)已經(jīng)轉(zhuǎn)向使用各種類型的收入沖擊來估計(jì)收入對(duì)健康變動(dòng)的影響,例如有學(xué)者利用彩票中獎(jiǎng)金額的隨機(jī)變化來估計(jì)家庭收入對(duì)自我報(bào)告健康狀況的因果影響,確實(shí)發(fā)現(xiàn)了收入和健康之間的因果關(guān)系。與收入對(duì)健康的影響類似,健康對(duì)收入的影響也可能由于存在諸如教育、能力、工作經(jīng)驗(yàn)等混雜因素而嚴(yán)重偏離。那么什么樣的變量既與健康密切相關(guān),又是外生的呢?有些學(xué)者嘗試用和遺傳有關(guān)的變量作為工具變量來分析健康對(duì)收入的影響,采用孟德爾隨機(jī)化研究分析表明健康和收入之間確實(shí)存在因果關(guān)系。
個(gè)體健康研究中還有一個(gè)常見問題是存在混雜因素同時(shí)影響解釋變量(也叫處理或暴露)和結(jié)果,因此也被稱為處理和結(jié)果的共同原因。混雜因素可能會(huì)導(dǎo)致解釋變量對(duì)健康的有偏估計(jì)。例如前面分析收入對(duì)健康的因果關(guān)系時(shí),教育往往就是一個(gè)混雜因素。人力資本理論認(rèn)為教育會(huì)對(duì)收入產(chǎn)生顯著的正向影響,受教育水平越高的個(gè)體相應(yīng)的收入水平也越高;很多實(shí)證分析也表明教育和健康之間有顯著的因果關(guān)系,所以教育水平會(huì)同時(shí)影響收入和健康的變動(dòng)。而減少混雜的策略是側(cè)重于打破混雜因素與結(jié)果的關(guān)聯(lián)(如回歸調(diào)整);打破混雜因素與處理的關(guān)聯(lián)(例如基于傾向分?jǐn)?shù)的匹配、調(diào)整或加權(quán));或者同時(shí)打破與處理和結(jié)果的關(guān)聯(lián)(例如雙重穩(wěn)健方法)。
樣本的自選擇偏差在個(gè)體健康研究中也頗為常見。在自選擇問題中,被解釋變量在每個(gè)子樣本中都可觀測,但此時(shí)個(gè)體的選擇行為存在非隨機(jī)性。例如是否選擇遷移,是否選擇購買醫(yī)療保險(xiǎn),或者是否繼續(xù)接受高等教育等行為都是內(nèi)生的,因?yàn)椴豢捎^測的因素(如個(gè)人意識(shí)偏好、天賦智力等)會(huì)影響人們的決定,這是自我選擇的結(jié)果。格拉夫娃(Grafova)等人重點(diǎn)關(guān)注了鄰里環(huán)境的自我選擇對(duì)健康影響的估計(jì)為何產(chǎn)生向下偏差的問題,具體來說,健康每況愈下的老人更有可能會(huì)選擇改變他們的生活方式,改善生活環(huán)境,以便為自己的健康投資,這就可能會(huì)導(dǎo)致鄰里環(huán)境對(duì)健康影響的結(jié)果偏差。
學(xué)者們采用了很多方法來解決個(gè)體健康研究中存在的上述問題,這些方法有些是因果推斷的方法,有些是常用的計(jì)量經(jīng)濟(jì)學(xué)方法。我們歸納了個(gè)體健康研究中的諸多文獻(xiàn),包括準(zhǔn)自然實(shí)驗(yàn)以及混雜控制等方面,還有一些雖然研究對(duì)象不是個(gè)體健康,但是涉及內(nèi)生性問題處理的文獻(xiàn),最終得到個(gè)體健康研究中常見問題及解決辦法的綜合圖,詳見圖1。
圖1 個(gè)體健康研究中的常見問題及解決方法注:由克雷格(Craig)等人[26]、馬泰(Matthay)等人[9]、希爾(Hill)等人[27]的研究內(nèi)容綜合整理得到。
上述分析表明,個(gè)體健康研究中存在的問題往往并不是單一的,可能涉及上述問題中的多個(gè),各類問題綜合作用的結(jié)果使得探究個(gè)體健康研究中的因果關(guān)系變得尤為困難。由圖1可知,對(duì)個(gè)體健康研究中出現(xiàn)的同一問題,可以采用不同的因果推斷方法,那么如何根據(jù)研究主題、背景和數(shù)據(jù)等條件選擇合適的因果推斷方法,也是研究者亟待解決的問題。因此有必要對(duì)個(gè)體健康研究中常用的因果推斷方法進(jìn)行歸納、總結(jié),對(duì)未來研究提供有益的幫助。
很多學(xué)者致力于探討變量之間的因果關(guān)系并估計(jì)因果效應(yīng),以期根據(jù)因果關(guān)系給出合理的政策建議。下面主要介紹潛在結(jié)果模型和因果效應(yīng),以便為后續(xù)分析個(gè)體健康研究中的因果推斷建立更好的理論基礎(chǔ)。
1. 潛在結(jié)果和因果效應(yīng)
PO模型是因果推斷重要的理論模型之一,其有三個(gè)基本的要素:潛在結(jié)果、個(gè)體處理穩(wěn)定性假設(shè)(Stable Unit Treatment Value Assumption,SUTVA)以及分配機(jī)制(Assignment Mechanism)。考慮一個(gè)二值處理(treatment)變量,=1代表處理組,0代表控制組,那么對(duì)于接受處理的研究對(duì)象而言,不接受處理時(shí)的狀態(tài)就是一種“反事實(shí)”狀態(tài),反之亦然,所以PO框架又被一些研究者稱之為反事實(shí)框架(Counter Factual Framework)。我們用表示假如接受處理=后的結(jié)果,稱之為潛在結(jié)果;對(duì)于每一個(gè)值,潛在結(jié)果都是一個(gè)分布在總體的隨機(jī)變量,而且每個(gè)特定個(gè)體的實(shí)際結(jié)果僅取決于該個(gè)體的處理值,這樣就排除了個(gè)體之間的干擾,這種假設(shè)通常被稱為個(gè)體處理穩(wěn)定性假設(shè)(SUTVA);在滿足SUTVA 的前提條件下,分配機(jī)制就直接決定了個(gè)體被分配到處理組或控制組的狀態(tài),從而觀察到對(duì)應(yīng)的潛在結(jié)果。
在實(shí)際應(yīng)用中,因果推斷理論是基于因果效應(yīng)來體現(xiàn)的,總體的平均因果效應(yīng)(Average Causal Effect,ACE)指的是,假設(shè)該總體中所有個(gè)體都接受處理平均結(jié)果[=1]與假設(shè)該總體中所有個(gè)體都不接受處理的平均結(jié)果[=0]之差,即=[=1-=0]=[=1]-[=0]。
2. 隨機(jī)控制實(shí)驗(yàn)
統(tǒng)計(jì)學(xué)家費(fèi)舍爾(Fisher)提出在所有個(gè)體中將處理進(jìn)行隨機(jī)分配,使得每個(gè)個(gè)體只接受處理或者只接受不處理有且僅有在對(duì)應(yīng)處理下的一種結(jié)果。除了處理的隨機(jī)化分配外,還需設(shè)定隨機(jī)分配下的處理與潛在結(jié)果以及其他協(xié)變量的取值表現(xiàn)無關(guān),即滿足(=1,=0)⊥,這就是著名的“隨機(jī)控制實(shí)驗(yàn)(Randomized Controlled Trials,RCT)”。在RCT中,處理的隨機(jī)性為項(xiàng)目評(píng)估提供了最成功和最廣泛的科學(xué)研究設(shè)計(jì)基礎(chǔ)。在隨機(jī)化分配下,平均因果作用表示為觀測到的結(jié)果變量在處理組=1與對(duì)照組=0的期望之差,不再含有潛在結(jié)果變量=1和=0,這就極大地解決了因果推斷中的不可識(shí)別性。
伊本斯(Imbens)強(qiáng)調(diào)了隨機(jī)實(shí)驗(yàn)證據(jù)的優(yōu)勢,從某種意義上講,隨機(jī)控制實(shí)驗(yàn)是最可信的一種政策評(píng)估方法,通過隨機(jī)化,使得已知和未知的混雜因素在處理組和控制組都可以平衡分布,也就是說,隨機(jī)化所帶來的最大好處就在于,它消除了混雜偏倚,使研究者能夠量化不確定性。因此,隨機(jī)對(duì)照實(shí)驗(yàn)通常被稱為臨床實(shí)驗(yàn)的黃金標(biāo)準(zhǔn),在自然科學(xué)以及美國、歐洲和其他地方的藥物批準(zhǔn)過程中發(fā)揮著中心作用。
隨機(jī)控制實(shí)驗(yàn)在健康干預(yù)對(duì)健康的影響研究方面也有廣泛的使用,主要包括工作場所的健康干預(yù)、收入轉(zhuǎn)移或現(xiàn)金激勵(lì)干預(yù)以及直接的健康干預(yù)。工作場所的健康干預(yù)措施包括管理人員的心理健康培訓(xùn)、工作場所福利項(xiàng)目提供和心理健康意識(shí)培訓(xùn)等,通常把研究對(duì)象隨機(jī)分配到干預(yù)組和對(duì)照組,干預(yù)實(shí)施一定階段后,再分析健康干預(yù)政策的效果,分析結(jié)果表明工作場所的健康干預(yù)有利于提高勞動(dòng)者的健康。收入轉(zhuǎn)移或現(xiàn)金激勵(lì)分為三種情況:一種情況是對(duì)處理組給予現(xiàn)金激勵(lì),對(duì)照組不給;另一種是分為多個(gè)組,每組給予的現(xiàn)金激勵(lì)不同;第三種是總的激勵(lì)數(shù)額相同,但是分發(fā)的頻率不同。實(shí)驗(yàn)結(jié)果表明給予現(xiàn)金激勵(lì)對(duì)健康有積極的影響,給得多比給得少的健康結(jié)果要好,激勵(lì)金額支付頻率高比支付頻率低對(duì)健康的影響要大。直接的健康干預(yù)則是通過健康訪談和基于網(wǎng)絡(luò)的健康指導(dǎo)來提升干預(yù)組的心理健康。
雖然隨機(jī)實(shí)驗(yàn)的說服力強(qiáng),但是迪頓(Deaton)和卡特萊特(Cartwright)對(duì)隨機(jī)實(shí)驗(yàn)在科學(xué)證據(jù)層次的突出地位提出了質(zhì)疑,因?yàn)镽CT有其自身的局限性:①實(shí)驗(yàn)的樣本容量可能很小,而個(gè)體間又可能存在較大差異,所以估計(jì)量的精確度不足;②在理想隨機(jī)實(shí)驗(yàn)中,可以隨機(jī)分配處理組和對(duì)照組的成員,但是在實(shí)際的研究中,人們往往可以自由選擇是否參加,存在自我選擇效應(yīng);③實(shí)驗(yàn)要求控制組完全不受政策的影響,但實(shí)際中很難排除政策的溢出效應(yīng)和替代效應(yīng);④可能存在實(shí)驗(yàn)效應(yīng),當(dāng)人們知道自己處于實(shí)驗(yàn)中時(shí),自我心理和行為就可能發(fā)生變化,從而影響實(shí)驗(yàn)結(jié)果;⑤隨機(jī)實(shí)驗(yàn)的系統(tǒng)誤差是無法完全避免的,比如處理組和控制組可能在不同的地點(diǎn)被觀察,在同一天的不同時(shí)間被觀察,或者由不同的觀察員所觀察,這些因素都有可能會(huì)造成實(shí)驗(yàn)結(jié)果的偏差?;谝陨显颍m然隨機(jī)控制實(shí)驗(yàn)在實(shí)證研究的各個(gè)領(lǐng)域都有廣泛應(yīng)用,但是由于其過高的實(shí)驗(yàn)成本且需花費(fèi)大量時(shí)間,所以很多學(xué)者越來越熱衷于使用說服力類似且?guī)缀鯚o成本的準(zhǔn)自然實(shí)驗(yàn)來替代隨機(jī)實(shí)驗(yàn)進(jìn)行研究。
3. 準(zhǔn)自然實(shí)驗(yàn)
英國醫(yī)學(xué)研究委員會(huì)(Medical Research Council,MRC)將準(zhǔn)自然實(shí)驗(yàn)(Natural Experiment,NE)定義為:一項(xiàng)適用于利用處理變化來分析其影響的研究,其中引起處理的事件、干預(yù)措施或政策不受研究者控制。即在準(zhǔn)自然實(shí)驗(yàn)中,“干預(yù)不是為了研究目的而進(jìn)行的”,而是“采用一種試圖得出因果關(guān)系的推斷方法來分析處理和結(jié)果的變化”。給定的準(zhǔn)自然實(shí)驗(yàn)對(duì)健康研究的價(jià)值取決于一系列因素,包括受影響人口的規(guī)模、可能影響的時(shí)間、產(chǎn)生處理差異的過程以及數(shù)據(jù)收集的實(shí)用性等。如果樣本數(shù)量足夠大,則可將樣本范圍內(nèi)的處理人群和未處理人群(或處理水平不同的人群)進(jìn)行比較,并可獲得關(guān)于處理、結(jié)果和潛在混雜因素的準(zhǔn)確數(shù)據(jù),從而利用準(zhǔn)自然實(shí)驗(yàn)進(jìn)行分析研究。但是,如果缺乏充分的調(diào)查數(shù)據(jù),或?qū)μ幚砗徒Y(jié)果的評(píng)估不準(zhǔn)確,那么就必須根據(jù)干預(yù)實(shí)施的背景謹(jǐn)慎選擇準(zhǔn)自然實(shí)驗(yàn)評(píng)估方法,還應(yīng)該進(jìn)行假設(shè)檢驗(yàn)和公開透明的報(bào)告,提供對(duì)干預(yù)和分配過程的清晰描述,并且最大限度地減少偏差,提高外部有效性。
準(zhǔn)自然實(shí)驗(yàn)的方法已應(yīng)用于許多領(lǐng)域的經(jīng)驗(yàn)研究,如公共衛(wèi)生、經(jīng)濟(jì)學(xué)和社會(huì)科學(xué)等。評(píng)估方法包括傾向得分匹配法、工具變量法、雙重差分法、斷點(diǎn)回歸法、固定效應(yīng)模型等,如何根據(jù)研究主題和數(shù)據(jù)背景選擇合適的評(píng)估方法,也就成為研究人員需要重視的問題。
近年來,準(zhǔn)自然實(shí)驗(yàn)在社會(huì)科學(xué)研究中占有越來越重要的地位。相較于隨機(jī)實(shí)驗(yàn)而言,其在實(shí)驗(yàn)倫理上具有極為重要的優(yōu)勢,如在研究吸煙對(duì)健康影響的過程中,實(shí)驗(yàn)者明知吸煙行為具有成癮性與危害性,強(qiáng)行從樣本中選取個(gè)體要求其接受處理(即吸煙)是不道德的;但可以選取準(zhǔn)自然實(shí)驗(yàn)的方式,從社會(huì)中選取吸煙者群體與不吸煙者群體,研究其健康差異,但要考慮到兩個(gè)群體間是否具有樣本自選擇問題,如是否較低健康水平的群體更傾向于不吸煙以維護(hù)自身健康。準(zhǔn)自然實(shí)驗(yàn)的常用評(píng)估方法及其在健康領(lǐng)域的經(jīng)典研究總結(jié)如下。
1. 傾向得分匹配
早在1983年羅森鮑姆(Rosenbaum)和魯賓(Rubin)就提出了傾向得分匹配(Propensity Score Methods,PSM)方法,作為一種近似實(shí)驗(yàn)的方法,PSM常被用于克服橫截面樣本數(shù)據(jù)的非隨機(jī)問題,尤其是在臨床生物醫(yī)學(xué)領(lǐng)域應(yīng)用更為廣泛。它的基本原理是,對(duì)于接受處理的個(gè)體,找到具有相同可觀測特征的未被處理的個(gè)體,通過逆概率加權(quán)、偏差矯正匹配等方法,比較他們觀測結(jié)果的差異,達(dá)到估計(jì)處理效應(yīng)的目的。使用PSM有一個(gè)關(guān)鍵的前提限制,即“強(qiáng)可忽略性處理分配”,該方法假定控制協(xié)變量之后,具有相同特征的個(gè)體對(duì)政策具有相同的反應(yīng)。換句話說,不可觀測因素不影響個(gè)體是否接受政策干預(yù)的決策,只有在估計(jì)傾向得分的回歸方程中包含的可觀測變量才能影響被暴露于政策的概率。
如果存在樣本選擇偏差,一般可以采用PSM方法來估計(jì)因果效應(yīng),該方法廣泛應(yīng)用于研究遷移、退休、收入、低保參與、工作場所的健康促進(jìn)措施等多方面因素對(duì)健康的影響。PSM估計(jì)因果效應(yīng)分為三個(gè)步驟:首先用所有匹配的協(xié)變量估計(jì)處理變量的傾向得分,估計(jì)方法為二元或多元logit回歸;然后根據(jù)得分進(jìn)行匹配;最后根據(jù)研究目的計(jì)算平均處理效應(yīng),或者對(duì)剔除未匹配樣本后的新數(shù)據(jù)集進(jìn)行回歸分析。我們以遷移和低保參與對(duì)健康的影響為例加以說明。有學(xué)者以遷移作為處理變量,采用二元logit回歸計(jì)算傾向得分,然后利用局部線性回歸匹配方法進(jìn)行傾向得分匹配,同時(shí)使用近鄰匹配和半徑匹配作為穩(wěn)健性檢驗(yàn),最終的平均處理效應(yīng)表明遷移者的健康狀況要優(yōu)于未遷移者。霍萱等人采用PSM方法,研究了低保參與和青少年心理健康之間的因果關(guān)系,處理變量是享受低保的狀態(tài):進(jìn)入、離開和保持。研究分為三個(gè)階段,首先使用青少年的個(gè)人和家庭等特征以及心理健康得分,采用多元logit模型來預(yù)測獲得相應(yīng)福利狀態(tài)的概率,即傾向得分;然后使用半徑匹配方法將每一個(gè)在特定處理組的青少年與未接受低保但有相同傾向分?jǐn)?shù)的人進(jìn)行匹配;最后使用PSM過程中產(chǎn)生的權(quán)重回歸調(diào)整模型來估計(jì)各種低保參與狀態(tài)對(duì)心理健康的可能影響。這樣的處理過程很好地解決了選擇偏差問題。
但是由于PSM沒有處理未觀察到的混雜因素,該方法有可能導(dǎo)致有偏差的效果估計(jì)。與此同時(shí),如果在使用匹配方法時(shí)把樣本局限在共同支撐域范圍,匹配方法得到的結(jié)論僅適用于共同支撐域范圍里的樣本,而不適用于所有樣本。如果共同支撐域樣本比較小,那么得到的結(jié)論普遍性就相對(duì)較差。
2. 工具變量估計(jì)
由此我們發(fā)現(xiàn),工具變量法雖然是一個(gè)相對(duì)簡單的估計(jì)方法,但是只有當(dāng)個(gè)體對(duì)政策反應(yīng)的異質(zhì)性不影響決策時(shí),工具變量才是有效的,而且,如何選擇合適的工具變量也是研究者們急需解決的一大問題。
3. 雙重差分法
雙重差分(Difference In Difference,DID)方法是用來估計(jì)政策干預(yù)和事件處理效應(yīng)的一個(gè)常用方法,被廣泛應(yīng)用于公共衛(wèi)生政策研究。這些政策或事件的特點(diǎn)是,它們并不在同一時(shí)間影響所有個(gè)體,或者對(duì)個(gè)體的影響并不相同。DID方法評(píng)估政策效果的基本思想是通過比較受到影響的群體(處理組)和未受到影響的群體(對(duì)照組)的差異來評(píng)估政策效果。假設(shè)模型為=+++·+,設(shè)定表示結(jié)果變量,分組虛擬變量=1或0分別表示是否對(duì)該組樣本進(jìn)行了“處理”;時(shí)間虛擬變量=1或0分別表示“政策實(shí)施后”和“政策實(shí)施前”;·為分組虛擬變量和時(shí)間虛擬變量的交互項(xiàng),其系數(shù)反映了政策實(shí)施的凈效應(yīng)。使用DID方法的前提條件主要有兩點(diǎn),一是需要使用面板數(shù)據(jù),二是需要滿足平行趨勢假設(shè),即在政策未實(shí)施時(shí),處理組和控制組的結(jié)果變量隨時(shí)間變化的路徑平行。
在遷移對(duì)健康影響的研究中,學(xué)者們通常把農(nóng)村移民設(shè)置為處理組,非移民代表對(duì)照組,利用DID來估計(jì)內(nèi)部遷移的健康影響,同時(shí)控制觀察到的特征和未觀察到不隨時(shí)間變化的因素,這兩個(gè)群體共有的因素可能與內(nèi)部遷移和健康結(jié)果相關(guān)。當(dāng)退休政策發(fā)生改變時(shí),可以用雙重差分模型來分析退休政策變動(dòng)對(duì)健康影響的因果效應(yīng),退休政策有兩種變化:一個(gè)是延長退休年限,一個(gè)是降低退休年限。對(duì)于前者,卡里諾(Carrino)等人把因最低養(yǎng)老金計(jì)劃改變而無法領(lǐng)取國家養(yǎng)老金的婦女作為處理組,把年齡和特征相似的婦女作為對(duì)照組,研究了女性領(lǐng)取國家養(yǎng)老金年齡增加6年的健康效應(yīng),結(jié)果表明提高領(lǐng)取國家養(yǎng)老金年齡會(huì)導(dǎo)致抑郁癥狀的概率增加12個(gè)百分點(diǎn),同時(shí)在較低職業(yè)等級(jí)的女性中,自我報(bào)告的醫(yī)學(xué)診斷抑郁癥的概率也會(huì)增加。關(guān)于降低退休年限的研究,鮑爾(Bauer)和艾興伯格(Eichenberger)研究了瑞士建筑業(yè)養(yǎng)老金領(lǐng)取資格的政策變化對(duì)健康的影響,該變化將退休年齡從65歲降至60歲,實(shí)證分析時(shí)采用了兩種處理方法,一種是將建筑工人作為處理組,其他藍(lán)領(lǐng)工人作為對(duì)照組,另一種是令歲數(shù)大的建筑工人作為處理組,年輕的建筑工人作為對(duì)照組,研究結(jié)果表明降低退休年齡并沒有改善工人的健康;但是哈爾伯格(Hallberg)等人對(duì)于瑞典軍人退休年齡由60歲降低到55歲這一政策的研究卻得到了相反的結(jié)論,該研究以軍人為處理組,政府的其他雇員為對(duì)照組,研究結(jié)果表明提前退休有助于降低死亡率和住院護(hù)理比例;結(jié)論的差異可能源于行業(yè)特點(diǎn)的差異。養(yǎng)老金收入政策變化對(duì)健康的影響也可以采用雙重差分的方法進(jìn)行分析。施納爾岑貝格(Schnalzenberger)研究了養(yǎng)老金降低對(duì)死亡率的影響,處理組為在公共養(yǎng)老金體系中繳費(fèi)年限超過40年的退休人員,對(duì)照組由早期60歲的正常退休人員組成,他們不受這些改革的影響,研究結(jié)果表明養(yǎng)老金降低對(duì)死亡率沒有影響。工作時(shí)間政策的變化對(duì)健康的影響也適用雙重差分方法。法國1998年通過一個(gè)法案,規(guī)定從2002年1月起所有私人企業(yè)把每周工作時(shí)間由39小時(shí)降低為35小時(shí),但保持收入不變,伯尼爾(Berniell)和比滕貝克(Bietenbeck)研究了該政策對(duì)個(gè)體健康的影響,處理變量是2002年雇主是否采用35小時(shí)工作制,是取值為1,否則為0,研究結(jié)果表明減少工作時(shí)間的政策可能會(huì)帶來重要的健康益處。除了降低工作時(shí)間外,保持收入不變的工作量降低制度,也會(huì)對(duì)就業(yè)者的健康帶來有益的影響。布拉特貝格(Bratberg)等人研究了減少55歲以上教師的工作量,但保持相同的工資這一政策對(duì)教師健康的影響,處理組為55歲以上的教師,對(duì)照組是年齡稍小的教師,不符合減少工作量的條件,研究結(jié)果表明工作量的減少會(huì)導(dǎo)致男性患病缺勤的減少和心理健康的改善。稅收抵免政策作為收入的外源性變化來源,可以消除或顯著減少因與收入相關(guān)的沖擊而導(dǎo)致的遺漏變量偏差,并可以用來估計(jì)接受收入增加對(duì)接受處理者的健康處理效果,為收入對(duì)健康的因果效應(yīng)提供了證據(jù)。如倫哈特(Lenhart)研究了1996年美國的稅收抵免政策對(duì)個(gè)體健康的影響,該政策使有兩個(gè)或兩個(gè)以上子女家庭的最高福利增加了一倍多,而有一個(gè)合格子女家庭的福利僅略有增加,以兩孩以上家庭為處理組,其他家庭為對(duì)照組,采用雙重差分方法的分析結(jié)果表明收入使受影響的戶主報(bào)告健康狀況極佳或非常好的可能性提高了6.9至8.9個(gè)百分點(diǎn)。
不容忽視的是,DID 方法同樣有一定的局限性:①DID 方法以面板數(shù)據(jù)模型為基礎(chǔ),對(duì)數(shù)據(jù)要求更加苛刻;②由于存在個(gè)體時(shí)點(diǎn)效應(yīng),所以平行趨勢假設(shè)很難滿足;③DID 方法假定環(huán)境因素沖擊對(duì)處于相同環(huán)境中的個(gè)體會(huì)產(chǎn)生相同的影響,但實(shí)際中,處理組和對(duì)照組個(gè)體可能因?yàn)槟承┎豢捎^測因素的影響,使得其在面臨相同的環(huán)境因素沖擊時(shí)做出不同的反應(yīng);④還有一點(diǎn)限制因素是溢出效應(yīng)的風(fēng)險(xiǎn),即處理組群體可能會(huì)影響到對(duì)照組群體。
4. 斷點(diǎn)回歸設(shè)計(jì)
斷點(diǎn)回歸設(shè)計(jì)(Regression Discontinuity Design,RDD)早在 1960 年就已被提出,主要應(yīng)用于醫(yī)學(xué)領(lǐng)域,直到20世紀(jì)90年代末之后才被國外大量應(yīng)用于經(jīng)濟(jì)學(xué)研究。RDD是一種類似于隨機(jī)實(shí)驗(yàn)的方法,李(Lee)認(rèn)為在隨機(jī)實(shí)驗(yàn)不可得的情況下,斷點(diǎn)回歸能夠避免參數(shù)估計(jì)的內(nèi)生性問題,從而真實(shí)反映出變量之間的因果關(guān)系。通過RDD來估計(jì)因果效應(yīng)主要分為兩部分:首先是圖形分析,這一步驟的完成需要滿足一些前提條件。①RDD的數(shù)據(jù)需要包含三個(gè)基本變量,分別為驅(qū)動(dòng)變量、斷點(diǎn)和觀測結(jié)果。驅(qū)動(dòng)變量是個(gè)體的一個(gè)連續(xù)特征變量,匹配變量的值是否大于斷點(diǎn)將決定個(gè)體是否接受處理;斷點(diǎn)用于決定個(gè)體是否接受處理的閾值;而觀測結(jié)果則是個(gè)體接受處理或未接受處理的觀測結(jié)果。②驅(qū)動(dòng)變量的值在斷點(diǎn)附近無法被準(zhǔn)確操作。③斷點(diǎn)的選擇不受驅(qū)動(dòng)變量的影響。④除了處理狀態(tài)在斷點(diǎn)處發(fā)生跳躍式變化外,其他未處理的個(gè)體特征變量在斷點(diǎn)處沒有顯著差異。其次是估計(jì)因果效應(yīng)。如果是精確斷點(diǎn)回歸,可以利用局部線性回歸來識(shí)別平均處理效應(yīng),如果是模糊斷點(diǎn)回歸,則可以結(jié)合工具變量,利用兩階段最小二乘法(2SLS)來估計(jì)因果效應(yīng)。此外,在斷點(diǎn)回歸分析中進(jìn)行全局高階多項(xiàng)式回歸往往會(huì)受到階數(shù)敏感性、置信區(qū)間覆蓋率等因素的影響,因此更建議研究人員基于局部多項(xiàng)式或二次多項(xiàng)式進(jìn)行估計(jì)。作為RDD方法的擴(kuò)展,回歸拐點(diǎn)設(shè)計(jì)(Regression Kink Design,RKD)同樣受到學(xué)者的關(guān)注,尤其適用于福利政策相關(guān)的因果效應(yīng)研究。在RKD方法中,被干預(yù)可能性的斜率在拐點(diǎn)處發(fā)生了變化,從而導(dǎo)致賦值函數(shù)的一階導(dǎo)數(shù)不連續(xù)。該模型使用也具有一定的前提要求,即在拐點(diǎn)處不存在對(duì)驅(qū)動(dòng)變量的操縱,而且其他協(xié)變量在拐點(diǎn)處的斜率不應(yīng)該發(fā)生變化。
在個(gè)體健康研究領(lǐng)域采用斷點(diǎn)回歸分析方法最多的是退休對(duì)健康的影響,通常是以法定退休年齡作為斷點(diǎn),研究內(nèi)容包括退休對(duì)自己健康的影響和伴侶的健康溢出效應(yīng)。大部分研究表明退休對(duì)健康有積極的影響,減輕與工作相關(guān)的壓力和緊張、增加睡眠時(shí)間、更頻繁的體育鍛煉和戶外運(yùn)動(dòng)似乎是退休影響健康的關(guān)鍵機(jī)制;但有些研究表明退休對(duì)健康有不利的影響,可能是由不良的健康行為所引起的,雷曉燕等則是認(rèn)為正常年齡退休對(duì)男性有顯著的負(fù)面影響,對(duì)女性沒有明顯影響,可能是因?yàn)榕员饶行愿子谡{(diào)整心態(tài)。伴侶間溢出效應(yīng)表明男性配偶的退休改善了女性的心理健康,很可能是通過增加社交和鍛煉的頻率來實(shí)現(xiàn)的,但也有個(gè)別文獻(xiàn)認(rèn)為主觀健康受到配偶退休的負(fù)面影響,原因是隨著伴侶退休,飲酒頻率和強(qiáng)度顯著增加,適度體育活動(dòng)顯著減少。也有部分學(xué)者采用模糊斷點(diǎn)回歸設(shè)計(jì),分析了義務(wù)教育法改革帶來的額外學(xué)校教育年限對(duì)心理健康的影響,如阿文達(dá)諾(Avendano)等人以改革后的義務(wù)教育年限作為斷點(diǎn),研究結(jié)果表明改革并沒有直接改善心理健康,延長義務(wù)教育的持續(xù)時(shí)間會(huì)通過增加教育程度以外的渠道影響心理健康;揚(yáng)克(Janke)等以最低離校年齡改革前后的出生年月作為驅(qū)動(dòng)變量,以1957年9月該出生年份為斷點(diǎn),研究結(jié)果表明額外的一年學(xué)校教育對(duì)大多數(shù)慢性健康狀況的患病率沒有統(tǒng)計(jì)上可識(shí)別的影響。還有學(xué)者研究了教育質(zhì)量對(duì)健康的影響,如鐘海認(rèn)為對(duì)教育質(zhì)量產(chǎn)生重大沖擊的典型事件是“文化大革命”,對(duì)于1947年之前出生的人,在1966年“文化大革命”開始時(shí)普遍已經(jīng)高中畢業(yè),不會(huì)受到“文化大革命”的巨大沖擊,1959年之后出生的人在1976年“文化大革命”結(jié)束時(shí)正處在初高中階段,教育制度已經(jīng)恢復(fù),同樣不會(huì)被“文化大革命”所影響,因此,鐘海以出生年份作為驅(qū)動(dòng)變量,以1947和1960年作為斷點(diǎn),分別對(duì)應(yīng)“文化大革命”開始年份和結(jié)束年份,研究結(jié)果表明更好的教育會(huì)改善自我評(píng)估健康狀況,降低殘疾的可能性,但對(duì)身體功能不佳或身體不適沒有顯著影響。梅內(nèi)塞斯-菲略(Menezes-Filho)和波利蒂(Politi)在研究私人健康保險(xiǎn)的因果效應(yīng)時(shí),以所得稅收入上限作為扭結(jié)點(diǎn),收入取對(duì)數(shù)作為驅(qū)動(dòng)變量,因?yàn)槭杖敫哂谂そY(jié)點(diǎn)的個(gè)人往往會(huì)增加私人保險(xiǎn)購買金額,從而降低自己的稅收等級(jí),所以私人保險(xiǎn)持有率在扭結(jié)點(diǎn)附近有明顯的斜率變化,而這一變化會(huì)進(jìn)一步影響個(gè)人的健康行為和健康結(jié)果,最終研究表明私人保險(xiǎn)對(duì)預(yù)防服務(wù)的使用、健康結(jié)果、體育鍛煉和戒煙都有積極影響。另外有學(xué)者研究了健康保險(xiǎn)在年輕人心理健康保健中的作用,由于健康保險(xiǎn)狀況在26歲左右呈離散變化,因此作者以26歲作為斷點(diǎn),26歲左右的月份作為驅(qū)動(dòng)變量,研究結(jié)果表明健康保險(xiǎn)增加了年輕人的心理健康保健。還有學(xué)者以貧困線作為斷點(diǎn),研究了最低生活保障制度對(duì)健康的影響,發(fā)現(xiàn)該制度產(chǎn)生了顯著的福利污名化效應(yīng),對(duì)受助者的心理健康和福祉產(chǎn)生了負(fù)面影響。
雖然RDD是準(zhǔn)實(shí)驗(yàn)方法中最具有可信性的方法,但是RDD方法并不能完美地模擬隨機(jī)實(shí)驗(yàn)的普遍性。之所以如此首先是閾值的選擇問題,閾值必須是一個(gè)真正的隨機(jī)因素,一個(gè)本身與結(jié)果無關(guān)的因素。其次,斷點(diǎn)回歸只使用了接近處理臨界值的個(gè)體數(shù)據(jù),即估計(jì)了局部的平均處理效果,因此與隨機(jī)實(shí)驗(yàn)相比,由于樣本量減少,RDD方法的作用是有限的。對(duì)于RKD方法而言,通常需要比RDD更大的樣本量才能保證估計(jì)值的準(zhǔn)確,但是與RDD類似,RKD只能估計(jì)拐點(diǎn)附近的因果效應(yīng),無法簡單地推廣至總體。
5. 個(gè)體固定效應(yīng)模型
個(gè)體固定效應(yīng)模型(Fixed Effects Model)分析比較了某一時(shí)間段內(nèi)同一個(gè)人或群體內(nèi)的多個(gè)觀察結(jié)果,認(rèn)為不可觀測且不隨時(shí)間變化的變量存在,且與其他可觀測的解釋變量通常是相關(guān)的。因此不能把這一變量當(dāng)作干擾項(xiàng)的一部分,而必須將其等同于其他解釋變量進(jìn)行處理。假設(shè)固定效應(yīng)方程為=++++,其中,表示不隨時(shí)間變化的不可觀測個(gè)體特征,為時(shí)間效應(yīng),是處理變量,為控制變量,為殘差項(xiàng),表示個(gè)體,表示時(shí)間。以=0和=1對(duì)上式做差就可以消除個(gè)人特征,得到1-0=-+(1-0)+(1-0)+1-0。從這一方程可以看出,個(gè)體固定效應(yīng)控制住了所有個(gè)人層面不隨時(shí)間變化的異質(zhì)性,這樣就解決了不隨時(shí)間而變但隨個(gè)體而異的遺漏變量問題。
個(gè)體固定效應(yīng)模型在健康研究中得到了廣泛的應(yīng)用。一些學(xué)者采用個(gè)體固定效應(yīng)模型,通過控制未觀察到的和不隨時(shí)間變化的因素,研究遷移對(duì)個(gè)體健康的影響,研究結(jié)果揭示了農(nóng)村人口向城市遷移對(duì)中年人而非老年人自評(píng)健康的積極影響。還有學(xué)者采用個(gè)體固定效用模型研究了退休對(duì)健康的影響,除了把年齡、年齡平方、受教育年限、婚姻狀況、家庭規(guī)模和波度作為控制變量外,未觀察到的不隨時(shí)間變化的異質(zhì)性由個(gè)體固定效應(yīng)控制,研究結(jié)果表明退休狀態(tài)對(duì)婦女自我報(bào)告的健康、身體和精神健康結(jié)果有積極和顯著的影響,較長的退休時(shí)間會(huì)帶來明顯的額外健康福利。沃森(Watson)和奧斯伯格(Osberg)在研究收入預(yù)期和收入焦慮對(duì)心理健康的沖擊時(shí),使用個(gè)體固定效應(yīng)和工具變量相結(jié)合的方法,以失業(yè)率作為工具變量,同時(shí)控制了教育、關(guān)系壓力、家庭規(guī)模、居住地區(qū)和年齡等可能與心理痛苦有關(guān)的因素,研究結(jié)果表明,經(jīng)濟(jì)損失對(duì)心理痛苦的影響要大于同等規(guī)模的收益,而且隨著損失規(guī)模的增加對(duì)心理健康的邊際影響會(huì)逐漸遞減。哈洛寧(Halonen)等人使用瑞典縱向職業(yè)健康調(diào)查研究,在模型設(shè)計(jì)中加入了性別、遺傳特征和個(gè)性這些不隨時(shí)間變化的因素,利用條件Logistic回歸進(jìn)行固定效應(yīng)分析,研究結(jié)果表明,如果一個(gè)人每周工作時(shí)間超過正常時(shí)間,那么長時(shí)間的通勤會(huì)導(dǎo)致身體缺乏活動(dòng),增加睡眠問題的風(fēng)險(xiǎn)。通常我們認(rèn)為受教育年限越長身體越健康,但是這種關(guān)聯(lián)很可能會(huì)被未觀察到的因素所混淆,為此,藤原(Fujiwara)和川內(nèi)(Kawachi)使用雙固定效應(yīng)模型來確定教育對(duì)健康和健康行為的因果影響,在這一模型中,因?yàn)闃颖具x擇全部為有共同生活環(huán)境的雙胞胎,就可以排除遺傳能力、性格或早期家庭環(huán)境等可能影響教育和健康的未知共同因素,研究結(jié)果表明,從個(gè)體層面考慮,教育與健康結(jié)果正向相關(guān),但是在固定效應(yīng)分析中,盡管二者仍然相關(guān),結(jié)果卻并不顯著,這也就意味著,個(gè)體層面對(duì)教育和健康關(guān)系的研究確實(shí)存在著某些未知變量的干擾。
雖然個(gè)體固定效應(yīng)模型優(yōu)于PSM,可以控制未觀察到的不隨時(shí)間變化的個(gè)體特征,但是仍然有一定的局限性。為了達(dá)到控制個(gè)體不可觀測且不隨時(shí)間變化的因素,個(gè)體固定效應(yīng)模型使用了個(gè)體內(nèi)變化的信息。如果變量有充分的個(gè)體內(nèi)變化信息,固定效應(yīng)模型能夠有效地處理缺失個(gè)體固定效應(yīng)造成的缺失變量誤差;但如果變量個(gè)體內(nèi)變化很少,其系數(shù)的估計(jì)方差就可能很大且不顯著。因此在使用面板數(shù)據(jù)前,對(duì)于每個(gè)變量,尤其是所關(guān)注的變量的信息來源要有充分的了解,如果變量的系數(shù)在加入固定效應(yīng)后變得不顯著,不能簡單地推斷它沒有因果影響,而是要具體情況具體分析。
我們對(duì)以上各個(gè)典型方法的適用條件、優(yōu)缺點(diǎn)及應(yīng)用于健康領(lǐng)域研究的典型文獻(xiàn)進(jìn)行了總結(jié),見表1。
6. 多方法的綜合使用
在前面的內(nèi)容中,我們總結(jié)出了個(gè)體健康研究中針對(duì)不同問題的具體解決方法,但是,一些研究往往涉及個(gè)體健康研究中存在的多個(gè)問題,只使用某一種方法可能只能解決某一類問題,不能解決研究中存在的多個(gè)問題,存在一定的局限性,并不能給出可靠的因果結(jié)論,因此有必要把多種方法結(jié)合使用。
表1 個(gè)體健康研究中常用的因果推斷方法
另一種常用的結(jié)合方式是PSM與DID相結(jié)合,即PSM-DID,用DID進(jìn)行因果推斷有一個(gè)基本假設(shè):平行趨勢假設(shè),即組間不同的混雜變量不隨時(shí)間改變,隨時(shí)間改變的混雜變量在各組之間完全相同。進(jìn)行實(shí)證分析時(shí)“平行趨勢假設(shè)”檢驗(yàn)并不一定能通過,如果不能通過則需要先進(jìn)行PSM。PSM-DID模型的實(shí)現(xiàn)主要包括兩個(gè)步驟:第一步,使用PSM模型,依據(jù)傾向得分為處理組尋找相似度盡可能高的控制組個(gè)體,使得控制組與處理組滿足平行趨勢假設(shè);第二步,使用DID模型,通過兩次差分處理個(gè)體效應(yīng)和時(shí)間效應(yīng),從而識(shí)別政策沖擊帶來的凈效應(yīng)。PSM-DID在個(gè)體健康研究中同樣應(yīng)用廣泛,主要應(yīng)用于遷移、醫(yī)保政策、就業(yè)對(duì)健康的因果效應(yīng)研究中。例如一些學(xué)者認(rèn)為遷移組和非遷移組的混雜變量并不滿足“平行趨勢假設(shè)”,因此首先采用傾向得分匹配來減輕選擇性偏差,并獲得更具可比性的處理組和對(duì)照組,然后通過比較遷移組和非遷移組之間的健康變化來估計(jì)遷移對(duì)健康的平均處理效果。醫(yī)保政策對(duì)健康的影響主要包括“流動(dòng)人口基本公共衛(wèi)生和計(jì)劃生育服務(wù)均等化計(jì)劃”對(duì)遷移者健康的影響,城鄉(xiāng)居民醫(yī)療保險(xiǎn)一體化對(duì)居民醫(yī)療服務(wù)利用的影響和政府健康干預(yù)政策對(duì)老年人健康影響。上述研究均采用PSM-DID方法研究了健康相關(guān)政策的影響;斯蒂芬(Stephan)等人則是利用PSM-DID對(duì)工作和健康之間的因果關(guān)系展開了深入研究,首先使用PSM來創(chuàng)建可比較的個(gè)體經(jīng)營者和員工群體,然后采用雙重差分方法來估計(jì)個(gè)體就業(yè)者和員工群體間的健康差異。
根據(jù)以上總結(jié)不難發(fā)現(xiàn),由于健康影響因素的多樣化和因果推斷方法的普及,基于不同的研究數(shù)據(jù)和背景,選擇合適的研究方法解決問題就顯得極為重要。
7. 基于主題的個(gè)體健康因果推斷方法概括
因果推斷在個(gè)體健康研究領(lǐng)域被廣泛應(yīng)用,以評(píng)估政策干預(yù)和其他處理效應(yīng),而個(gè)體健康水平的變動(dòng)通常是社會(huì)資本、收入、教育、保險(xiǎn)、遷移、退休、工作等多重因素作用的結(jié)果,所以我們從影響健康的相關(guān)因素考慮,對(duì)各個(gè)不同因素的適用方法進(jìn)行總結(jié)概括。表2展示了個(gè)體健康研究領(lǐng)域不同影響因素常用的因果推斷方法。
表2 各方法涉及的健康影響因素
收入作為影響健康的主要因素,同時(shí)涵蓋了所有的因果推斷方法。許多學(xué)者利用隨機(jī)控制實(shí)驗(yàn)研究現(xiàn)金轉(zhuǎn)移/激勵(lì)對(duì)個(gè)體健康的影響;施納爾岑貝格使用PSM-DID方法研究了養(yǎng)老金收入降低對(duì)死亡率的影響;有學(xué)者以中國新農(nóng)村養(yǎng)老金計(jì)劃(NRPS)的推出時(shí)間作為工具變量,避免了反向因果與遺漏變量偏差所帶來的內(nèi)生性問題;也有學(xué)者使用RDD方法,研究了最低生活保障制度對(duì)健康的影響;沃森和奧斯伯格則是使用個(gè)體固定效應(yīng)和工具變量相結(jié)合的方法分析了收入變動(dòng)和健康之間的因果關(guān)系。
關(guān)于工作對(duì)健康的影響,主要涉及工作場所的健康干預(yù)和工作政策變化兩個(gè)方面。許多學(xué)者利用RCT或者PSM方法分析健康干預(yù)政策的效果;一些學(xué)者使用工具變量方法來解決工作時(shí)間對(duì)健康影響的內(nèi)生性問題,伯尼爾和比滕貝克利用DID方法研究了法國工作時(shí)間政策變化對(duì)個(gè)體健康的影響,而哈洛寧等人使用固定效應(yīng)模型證明了長時(shí)間通勤的消極作用。
研究退休對(duì)健康的影響時(shí)最常用的是RDD方法,通常是以法定退休年齡作為斷點(diǎn),研究退休對(duì)自己健康的影響和伴侶溢出效應(yīng)。還可以采用法定退休年齡或養(yǎng)老金領(lǐng)取資格年齡作為退休的工具變量或者采用個(gè)體固定效用模型進(jìn)行分析。當(dāng)退休政策發(fā)生改變時(shí),則可以用雙重差分模型來分析退休政策變動(dòng)對(duì)健康影響的因果效應(yīng)。
此外,關(guān)于社會(huì)資本、教育、保險(xiǎn)、遷移等因素對(duì)健康的影響研究也十分廣泛。在研究社會(huì)資本對(duì)健康的影響時(shí),梁航等人采用工具變量解決了社會(huì)資本和健康之間可能存在的雙向因果關(guān)系,而格拉夫娃等人則是通過使用雙重差分方法分析了社區(qū)環(huán)境對(duì)健康的影響。在教育對(duì)健康的影響研究中,通常我們認(rèn)為受教育年限越長身體越健康,但是藤原和川內(nèi)使用雙固定效應(yīng)模型研究發(fā)現(xiàn),個(gè)體層面對(duì)教育和健康關(guān)系的研究確實(shí)存在著某些未知變量的混淆。為此,學(xué)者們大多采用義務(wù)教育法規(guī)定的義務(wù)教育年限作為教育的工具變量,并結(jié)合RDD進(jìn)行研究。在保險(xiǎn)對(duì)健康的影響方面,很多學(xué)者采用工具變量解決保險(xiǎn)狀態(tài)的內(nèi)生性問題,并結(jié)合斷點(diǎn)回歸設(shè)計(jì)研究保險(xiǎn)對(duì)健康水平的影響,而程令國等則是采用固定效應(yīng)模型控制了不可觀測的個(gè)人、家庭層面的異質(zhì)性,并使用PSM-DID進(jìn)一步減少估計(jì)偏差,證明了新農(nóng)合政策對(duì)參保者健康水平的積極效應(yīng)。在遷移對(duì)健康的影響研究中,學(xué)者們常采用遷移者的社會(huì)網(wǎng)絡(luò)作為遷移的工具變量,還有學(xué)者采用雙重差分模型,或者利用PSM方法分析遷移者的健康狀況,還可以采用個(gè)體固定效應(yīng)模型控制未觀察到的不隨時(shí)間變化的因素,以此來研究遷移對(duì)個(gè)體健康的影響。
通過對(duì)以上基于主題的個(gè)體健康因果推斷方法的總結(jié)概括可以發(fā)現(xiàn),對(duì)收入、退休、工作等因素的分析幾乎涵蓋了所有常用的因果推斷方法,而很少有因果推斷方法涉及對(duì)社會(huì)資本的研究??赡艿脑蛑饕谟谝蚬茢喾椒ū粡V泛用于評(píng)估政策干預(yù)和其他處理效應(yīng),有相當(dāng)多關(guān)于收入、退休和工作變動(dòng)的政策,卻很少有社會(huì)資本的相關(guān)政策,而且,社會(huì)資本是一個(gè)過于寬泛的概念,表現(xiàn)為個(gè)體在一定的社會(huì)關(guān)系網(wǎng)絡(luò)中獲取信息和資源的能力,包括了鄰里關(guān)系、社區(qū)參與等多個(gè)方面,很難判斷社會(huì)資本這一因素對(duì)個(gè)體健康的具體因果效應(yīng),但是這也為我們以后的研究提供了新的發(fā)展方向,或許可以進(jìn)一步擴(kuò)展個(gè)體健康因果推斷的研究領(lǐng)域。
自21世紀(jì)以來,以“實(shí)驗(yàn)”思想為基礎(chǔ)的定量實(shí)證分析方法已經(jīng)成為健康研究領(lǐng)域的前沿?zé)狳c(diǎn)。不管是建立有針對(duì)性設(shè)計(jì)的“隨機(jī)控制實(shí)驗(yàn)”,還是對(duì)基于政策變動(dòng)或外生事件所產(chǎn)生的“準(zhǔn)自然實(shí)驗(yàn)”進(jìn)行的研究,其共同目標(biāo)都是對(duì)健康相關(guān)政策的有效性和科學(xué)性作出準(zhǔn)確的評(píng)估,這一類典型的因果推斷研究方法也進(jìn)一步證實(shí)了諸多影響因素與個(gè)體健康之間的因果關(guān)系并非簡單的相關(guān)關(guān)系。從Web of Science的檢索結(jié)果和本文的研究分析中可以看出,因果推斷方法在現(xiàn)今及未來較長的時(shí)間內(nèi),仍然是主流的健康政策評(píng)估方法,這一點(diǎn)也得到了眾多學(xué)者的肯定。
盡管因果推斷方法在個(gè)體健康研究中得到了廣泛的應(yīng)用,但是該方法在實(shí)際應(yīng)用階段仍然存在一定的局限性,主要表現(xiàn)在兩個(gè)方面:一方面是由樣本數(shù)據(jù)的質(zhì)量和數(shù)量帶來的可靠性和外部有效性問題。無論是隨機(jī)控制實(shí)驗(yàn),還是準(zhǔn)自然實(shí)驗(yàn),都需要滿足一定的前提條件,例如樣本的隨機(jī)分配、平行趨勢假設(shè)、共同支撐假設(shè)等,但是現(xiàn)有的數(shù)據(jù)未必能滿足這些條件,即使變量之間存在因果關(guān)系,也未必能得到驗(yàn)證,或者盡管可以在樣本范圍內(nèi)得到明確的因果關(guān)系,也通過了異質(zhì)性和穩(wěn)健性檢驗(yàn),由于樣本數(shù)量較小,估計(jì)結(jié)果的外部有效性也會(huì)令人質(zhì)疑。另一方面是分析過程中存在的問題。在實(shí)證研究中,通常是假設(shè)某一因素和健康之間存在因果關(guān)系,然后使用因果推斷的方法進(jìn)行驗(yàn)證,這些因果關(guān)系可能源于學(xué)者們已有的研究經(jīng)驗(yàn),然而可能還存在一些經(jīng)驗(yàn)之外的因果關(guān)系,也就是說,因果推斷方法更側(cè)重于驗(yàn)證因果關(guān)系。因此,未來研究中首先要著重關(guān)注數(shù)據(jù)的質(zhì)量和數(shù)量,為研究奠定堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ),然后采用機(jī)器學(xué)習(xí)與因果推斷相結(jié)合的方法,解決傳統(tǒng)因果推斷中存在的問題。
現(xiàn)有的研究一般基于調(diào)查數(shù)據(jù),樣本量往往只有幾千或者幾萬,十幾萬的數(shù)據(jù)集都比較少見,但是一個(gè)政策可能會(huì)涉及幾千萬,甚至上億人,通過少量樣本推斷出的因果效應(yīng)在整個(gè)受眾群體上未必是成立的,也就是說很難滿足外部有效性。隨著信息技術(shù)和大數(shù)據(jù)技術(shù)的發(fā)展,居民健康相關(guān)的信息正以前所未有的速度產(chǎn)生和儲(chǔ)存,這些信息可能來自醫(yī)療、社會(huì)保險(xiǎn)、就業(yè)和收入、稅收、社交數(shù)據(jù)等,還有政府和機(jī)構(gòu)組織的各種調(diào)查和普查數(shù)據(jù),每類數(shù)據(jù)只包含健康及健康影響因素的某一局部方面,例如稅務(wù)局掌控著每個(gè)納稅人的納稅記錄,是研究個(gè)人所得稅改革對(duì)健康影響的理想解釋變量來源,但是納稅人的健康數(shù)據(jù)由醫(yī)療部門管理,這兩者沒有交集,因此不能合并為一個(gè)可供研究的數(shù)據(jù)集,只能通過問卷調(diào)查進(jìn)行分析,使研究的可靠性大大降低。由于這些數(shù)據(jù)分別被不同的機(jī)構(gòu)儲(chǔ)存,各機(jī)構(gòu)之間的信息相互獨(dú)立,沒有形成有效的數(shù)據(jù)共享機(jī)制,使得不同的人只能看到健康及其影響因素的某個(gè)側(cè)面,難以對(duì)健康及健康相關(guān)因素進(jìn)行全局把握。為此,政府應(yīng)該在保障居民個(gè)人信息安全性、私密性的前提下,合理整合居民健康及影響因素的相關(guān)數(shù)據(jù),形成健康大數(shù)據(jù)系統(tǒng),為科學(xué)研究提供數(shù)據(jù)支持,通過研究諸多影響因素和健康之間的因果效應(yīng),為政府出臺(tái)科學(xué)的健康政策提供依據(jù)。
如果有健康大數(shù)據(jù)作為支持,那么很多機(jī)器學(xué)習(xí)的分析方法就可以應(yīng)用于個(gè)體健康研究中的因果推斷。不同于傳統(tǒng)因果推斷方法需要基于反事實(shí)的潛在結(jié)果來定義因果關(guān)系,機(jī)器學(xué)習(xí)以數(shù)據(jù)為基礎(chǔ),通過精準(zhǔn)的預(yù)測或干預(yù),將“非隨機(jī)化”的觀測樣本盡可能向“隨機(jī)化”實(shí)驗(yàn)靠攏,由此可以從傳統(tǒng)數(shù)據(jù)中發(fā)現(xiàn)不易察覺的因果關(guān)系。另外,機(jī)器學(xué)習(xí)還具有優(yōu)秀的樣本和變量選擇能力,例如:①在處理組和對(duì)照組之間建立平衡,包括三種方法:傾向得分匹配方法,平衡處理組和對(duì)照組之間的分布混雜;逆概率加權(quán),即直接優(yōu)化觀察值的權(quán)重,從而使處理組和對(duì)照組的協(xié)變量平均值相同;直接生成處理組和對(duì)照組,并使其協(xié)變量自動(dòng)平衡,其算法包括“遺傳匹配”算法、整數(shù)規(guī)劃優(yōu)化算法。②評(píng)估所謂的干擾模型(如傾向得分,或結(jié)果的條件期望),用機(jī)器學(xué)習(xí)方法可以分別估計(jì)傾向得分或潛在結(jié)果,還可以采用雙穩(wěn)健方法把條件結(jié)果期望的估計(jì)與傾向得分的估計(jì)相結(jié)合,以及將條件結(jié)果期望的估計(jì)與協(xié)變量平衡相結(jié)合。③在具有大量協(xié)變量的情況下使用機(jī)器學(xué)習(xí)進(jìn)行變量選擇,貝洛尼(Belloni)等人提出了一種提供原則性變量選擇的解決方案——“雙重套索”,同時(shí)考慮了協(xié)變量結(jié)果和協(xié)變量處理分配關(guān)聯(lián)。除此之外,還可以利用機(jī)器學(xué)習(xí)交叉驗(yàn)證的思想,將數(shù)據(jù)集分為訓(xùn)練集和測試集,在訓(xùn)練集中使用傳統(tǒng)因果推斷方法識(shí)別因果效應(yīng),然后在測試集中進(jìn)行多次重復(fù)測試,進(jìn)一步驗(yàn)證識(shí)別結(jié)果的外部有效性。
雖然目前機(jī)器學(xué)習(xí)技術(shù)尚未成為經(jīng)濟(jì)學(xué)研究的主流方法,對(duì)整個(gè)社會(huì)科學(xué)因果識(shí)別研究范式的沖擊有限,但隨著未來經(jīng)濟(jì)研究領(lǐng)域的發(fā)展,可提供樣本量的增多,將機(jī)器學(xué)習(xí)方法引入因果關(guān)系推斷,不僅可以改進(jìn)因果推斷的計(jì)量方法,其在分類、預(yù)測、驗(yàn)證等方面的優(yōu)異表現(xiàn)也將會(huì)進(jìn)一步豐富研究者的分析手段和研究范疇,使得機(jī)器學(xué)習(xí)和因果推斷互相補(bǔ)充,相互促進(jìn)。
本文以個(gè)體健康研究為主題,通過對(duì)已有文獻(xiàn)的分析和總結(jié),發(fā)現(xiàn)個(gè)體健康研究中存在著測量偏誤、遺漏變量、互為因果、共同原因和選擇偏差等諸多問題,隨機(jī)控制實(shí)驗(yàn)、傾向得分匹配、工具變量、雙重差分、斷點(diǎn)回歸設(shè)計(jì)、固定效應(yīng)模型等因果推斷方法,在社會(huì)資本、收入、教育、保險(xiǎn)、遷移、退休、工作等因素對(duì)個(gè)體健康的因果效應(yīng)研究中均得到了廣泛的應(yīng)用,每一種方法都有其優(yōu)缺點(diǎn),在實(shí)證研究中應(yīng)根據(jù)研究主題和應(yīng)用條件進(jìn)行合理選擇,有時(shí)需要綜合應(yīng)用多種因果推斷方法。本研究為健康政策制定者提供了更加科學(xué)合理的決策依據(jù),對(duì)于提高居民健康水平具有十分重要的社會(huì)意義,還有助于研究者在個(gè)體健康研究領(lǐng)域中選擇合適的因果推斷方法,或綜合應(yīng)用已有的方法。隨著大數(shù)據(jù)技術(shù)的發(fā)展,在未來的研究中,應(yīng)加強(qiáng)機(jī)器學(xué)習(xí)和因果推斷方法的結(jié)合,豐富已有的因果推斷工具,以保障研究結(jié)果的穩(wěn)健性。