孫玲莉,楊貴軍
(天津財經(jīng)大學 統(tǒng)計學院,天津300222;天津財經(jīng)大學 中國經(jīng)濟統(tǒng)計研究中心,天津300222)
在社會經(jīng)濟領(lǐng)域,處理效應的估計是制定相關(guān)政策及判斷政策實施效果的重要基礎(chǔ)(Tu 等,2000;胡吉祥等,2011;紀園園等,2020)[1-3]。例如,在制定吸引和留住流動人口的政策時,家庭消費水平是評價流動人口生活質(zhì)量的重要方面。根據(jù)消費理論和人力資本理論,消費依賴個人收入水平,而個人收入水平主要取決于受教育程度(Keynes,1936;Schultz,1961)[4,5]。因此,合理測算流動人口受教育程度對家庭消費的影響程度具有重要的現(xiàn)實意義。在其他條件完全相同的假定下,受教育程度不同的家庭消費差異被視為教育對家庭消費的處理效應。
在因果推斷中,處理變量取不同水平時的結(jié)果變量平均差值被稱為處理效應(Treatment effect)。處理效應的估計常選用Rubin 因果模型(Rubin,1978)[6]。假設(shè)個體接受處理,則其屬于處理組,標記T=1;個體未接受處理作為對照,屬于控制組,標記T=0。兩組個體的潛在結(jié)果分別記為Y1、Y0,處理效應τ=E(Y1-Y0)。在完全隨機化的可控實驗中,處理組與控制組的個體具有同質(zhì)性,處理效應τ=E(Y1-Y0)=E(Y1∣T=1)-E(Y0∣T=0)。在非隨機化實驗中,每個個體只能觀測到一個潛在結(jié)果,未觀測到的結(jié)果被稱為反事實(Counterfactuals)(Paul and Rubin,1983;Rubin and Thomas,1996)[7,8]?,F(xiàn)實中一些不可控的影響因素往往會使處理組與控制組產(chǎn)生個體選擇偏誤(Lalonde,1986)[9],導致處理效應估計的可信度降低。此時,處理效應τ=E(Y1-Y0)≠E(Y∣T=1)-E(Y∣T=0)。經(jīng)濟問題研究中常出現(xiàn)這類問題,其原因是存在客觀成本和人倫道德的約束,完全的隨機化實驗難以實施(韓鋒和隋福民,2015)[10]。為了消除個體選擇偏誤,學者們主要采用了兩類方法。(1)傾向得分匹配法(Propensity score matching)。傾向得分是指給定協(xié)變量的情形下個體屬于處理組的條件概率(Paul and Rubin,1983)[7]。分別來源于處理組和控制組的兩個個體的傾向得分若相近或相等,則兩者匹配,對應的處理組為反事實匹配組。利用處理組和反事實匹配組估計處理效應,能夠有效消除個體選擇偏誤對處理效應的影響。傾向得分匹配法易于使用,其對高維協(xié)變量匹配的效率高,故該方法現(xiàn)已得到廣泛應用(盧闖等,2015;胡宏偉等,2012)[11,12]。(2)斷點回歸方法和雙重差分法。斷點回歸方法是按是否接受處理將觀測數(shù)據(jù)劃分出臨界點,觀測數(shù)據(jù)即處于斷點的兩側(cè),根據(jù)斷點兩側(cè)的樣本數(shù)據(jù)就可以估計處理效應(Thistlethwaite and Campbell,1960)[13]。雙重差分法主要是估計分組變量與時間變量的交叉項(Abadie,2005)[14]。
在現(xiàn)有研究中,有關(guān)處理效應的估計主要存在兩個缺陷。首先,斷點回歸的估計結(jié)果依賴預先設(shè)定的模型,結(jié)果變量是否受到其他處理因素的影響是很難識別的(余靜文和王春超,2011)[15]。雙重差分法的假設(shè)條件較為嚴格,平行趨勢假定(Parallel trend)難以得到滿足(陳林和伍海軍,2015)[16]。其次,傾向得分匹配法是根據(jù)接受處理分組的示性變量建立模型,擬合模型容易受到處理組和控制組樣本差異的影響,從而導致模型無法收斂。此外,如果不能較好地平衡處理組和控制組協(xié)變量與響應變量的相關(guān)性,處理效應估計的系統(tǒng)偏差就會增大。
基于此,本文在傾向得分匹配法的基礎(chǔ)上引入一種新的方法——響應傾向得分匹配法(Response Propensity Score Matching)(楊貴軍等,2018)[17]。相應地,本文將原來的傾向得分匹配法稱為類別傾向得分匹配法(Categorical Propensity Score Matching),以示區(qū)別。響應傾向得分匹配法最早是用于處理調(diào)查數(shù)據(jù)中的無回答問題,本文借鑒該思路,將處理效應中的控制組和處理組分別視為回答組和無回答組,用于處理效應的估計。
響應傾向得分匹配法的基本思想是將控制組的結(jié)果變量觀測值按大小進行排列并取秩,對結(jié)果變量的秩計算累計概率,再與協(xié)變量建立響應傾向得分模型,尋找控制組的反事實匹配組,利用反事實匹配組估計處理效應。響應傾向得分匹配法不嚴格要求處理組和控制組的樣本容量,這就彌補了類別傾向得分匹配法的不足。此外,利用結(jié)果變量觀測值的秩變換與協(xié)變量建立模型,可以保持協(xié)變量與響應變量之間的相關(guān)性一致,減少個體選擇偏誤,提高處理效應估計的可信性。相比于斷點回歸和雙重差分法,響應傾向得分匹配法的限制更少,更便于操作。
若記T為個體接受處理的示性變量,則T=1 代表個體接受處理,T=0 代表個體未接受處理。X=(X1,X2,…Xk)′為k維協(xié)變量,Y表示個體的結(jié)果變量。其中,(X0,i,Y0,i)(i=1,…,nc)為控制組,(X1,j,Y1,j)(j=1,…,nt)為處理組,樣本量分別為nc、nt,樣本均值分別為每個個體只有一個觀測結(jié)果,或者屬于處理組,或者屬于控制組。若個體不存在選擇偏誤,則處理效應如下:
在多數(shù)情況下,個體是存在選擇偏誤的,則處理效應為:
顯然,直接使用樣本均值之差估計處理效應τ,則會出現(xiàn)系統(tǒng)偏差。
在非隨機實驗中,保證處理組和控制組個體協(xié)變量盡可能相同是估計處理效應τ 的前提。Paul和Rubin(1983)[7]提出了傾向得分匹配法(本文稱其為類別傾向得分匹配法),將類別傾向得分定義為給定協(xié)變量X條件下個體接受處理的條件概率,即有:
如果類別傾向得分相同或近似相等,兩個個體就是匹配的,相應的控制組個體被稱為處理組的反事實匹配個體。處理組與反事實匹配組個體之間的協(xié)變量相似,可以直接估計處理效應。類別傾向得分匹配法需要滿足兩個基本假定(Caliendo and Kopeinig,2008)[18]。
假定1:給定協(xié)變量X,個體接受處理與否都和結(jié)果Y相互獨立。
假定2:給定協(xié)變量X,個體接受處理與否的概率均為正。
在類別傾向得分匹配法的實際應用中,處理組與控制組樣本容量差異過大會導致Logistic 模型參數(shù)估計無法收斂,而且類別傾向得分匹配法不能保證處理組與控制組中協(xié)變量與響應變量的相關(guān)性一致。因此,響應傾向得分匹配法改進的基本思路是,將控制組結(jié)果變量觀測值按從小到大的順序排列取秩,對秩計算累計概率,再與協(xié)變量建立響應傾向得分模型,利用擬合的響應傾向得分模型分別計算處理組與控制組個體的響應傾向得分,并將與處理組個體響應傾向得分差異小的控制組個體作為處理組的反事實匹配組個體。這樣做就能在很大程度上保持匹配個體的協(xié)變量與結(jié)果變量之間的一致相關(guān)性。
響應傾向得分匹配法的創(chuàng)新之處在于引入了秩統(tǒng)計量,而秩統(tǒng)計量不受分布影響,應用更加廣泛(Spearman,1904;Torra 等,2006)[19,20]。統(tǒng)計模型的建立若考慮分類變量的有序性,則可以彌補連續(xù)變量假定的缺陷。引入秩變換保證了結(jié)果變量觀測值的大小不發(fā)生錯序,對秩計算累計概率使得結(jié)果變量觀測值保持在0 至1 區(qū)間,傾向得分模型的擬合效果以及控制組與處理組的匹配效果都得到了改進。相比于傾向得分匹配法,響應傾向得分匹配法是基于控制組數(shù)據(jù)建立模型,避免了控制組與處理組樣本量差異對模型的影響。具體而言,響應傾向得分匹配法的使用主要包括四個步驟。
將控制組(T=0)的結(jié)果變量Y的觀測值y0,i(i=1,2,…nc)按從小到大的順序排列,我們得到:y0,1′<y0,2′<…,y0,n′c。記觀測值y0,i(i=1,2,…nc)的秩為R0,i(y0,i),則響應變量Y取R0,i(y0,i)的概率為:
累計概率為:
根據(jù)樣本觀測值,選擇觀測值秩序的累計概率估計如下:
本文以樣本結(jié)果變量觀測值秩序的累計概率值為被解釋變量,以協(xié)變量X0,i(i=1,2,…nc)為解釋變量,建立響應傾向得分logit 模型:
將式(3)代入式(4),則有:
響應傾向得分為:
其中,0≤P(Y≤R0,i(y0,i)∣X0,i)≤1。將全部個體的協(xié)變量代入擬合模型,我們分別得到控制組和處理組個體的響應傾向得分。
本文定義響應傾向得分的距離為絕對值距離,即處理組個體j與控制組個體i若匹配,則計算它們的響應傾向得分距離:
假定處理組個體j與控制組nc個個體的響應傾向得分距離滿足:
處理組個體j與控制組中的第一個個體的響應傾向得分距離最小,控制組中的第一個個體就作為處理組個體j的匹配個體。將處理組個體y1,j(j=1,2,…nt)依次與控制組個體y′0,j(j=1,2,…nt)相匹配,則與處理組相匹配的控制組為反事實匹配組。
本文利用處理組和反事實匹配組個體估計處理效應,處理效應為:
相應的估計量為:
響應傾向得分匹配法保留了類別傾向得分匹配法的優(yōu)勢,具有較高的個體匹配計算效率。此外,響應傾向得分匹配法具有較好的Logistic 模型擬合效果,其不需對處理組和控制組的樣本量差異大小進行嚴格規(guī)定,處理效應估計的可靠性更高。
本文利用模擬的方法研究響應傾向得分匹配法及處理效應估計量的統(tǒng)計性質(zhì),并與類別傾向得分匹配法進行比較,模擬方法參考楊貴軍等(2016)[21]的研究。在實際的經(jīng)濟問題研究中,多元線性回歸模型的應用是最為廣泛的,故本文也選擇如下線性回歸模型:
其中,X1、X2為連續(xù)變量,X3、X4、X5、X6為離散變量,T為處理變量??紤]到后文的實證數(shù)據(jù),這里設(shè)定處理效應τ=0.5,同時選取ε 為服從正態(tài)分布N(0,0.15)的隨機誤差項。對于處理組T=1,本文分別從正態(tài)分布N(1 500,250)、N(4 800,600)及兩點分布B(1,0.4)、B(1,0.6)、B(1,0.8)、B(1,0.05)中獨立隨機抽取nt=600 個隨機數(shù)作為協(xié)變量X1、X2、X3、X4、X5、X6的觀測值,系數(shù)分別為β0=0.6,β1=0.6,β2=0.2,β3=0.03,β4=0.12,β5=-0.03,β6=-0.05。對于控制組T=0,本文分別從正態(tài)分布N(1 200,200)、N(4 000,630)及 兩 點 分 布B(1,0.2)、B(1,0.6)、B(1,0.2)、B(1,0.85)中獨立隨機抽取nc=4 500 個隨機數(shù)作為變量X1、X2、X3、X4、X5、X6的觀測值,系數(shù)分別設(shè)定為β0=0.6,β1=0.6,β2=0.2,β3=0.03,β4=0.05,β5=0.03,β6=0.05,并對連續(xù)協(xié)變量取對數(shù)。利用線性回歸模型,本文計算出處理組600 個個體的結(jié)果變量觀測值和控制組4 500 個個體的結(jié)果變量觀測值。
本文分別采用類別傾向得分匹配法和響應傾向得分匹配法估計處理效應τ。為了保證估計結(jié)果的穩(wěn)定性,上述模擬過程重復了200 次。對于類別傾向得分匹配法和響應傾向得分匹配法,每次重復模擬的處理效應估計值記為和并取處理效應200 估計值平均代表處理效應估計的期望。本文選擇處理效應估計的偏差和均方誤差作為方法應用優(yōu)劣的評價指標。偏差是指處理效應估計值的期望與真值τ=0.5 之差,即,處理效應估計值與真值τ=0.5 差值平方的平均數(shù)為均方誤差,偏差和均方誤差越小越好。
為了比較樣本量對兩種傾向得分匹配法的影響,本文采用不重復匹配法,選取與處理組個體響應傾向得分距離最小的控制組中K個不同個體進行匹配,得到K個反事實匹配組。第一個反事實匹配組與處理組個體響應傾向得分距離最小,第K個反事實匹配組與處理組個體響應傾向得分距離最大,即處理組每個個體與其反事實匹配組個體的響應傾向得分距離滿足dj,1≤dj,2≤dj,3…≤dj,k-1≤dj,k。這里,本文選擇K=7。
表1 給出了利用處理組與第k(k=1,2,…7)個反事實匹配組數(shù)據(jù)及處理效應的估計結(jié)果,其中,第三列是處理效應估計的期望,第四列是處理效應估計的偏差,第五列是處理效應估計的均方誤差??傮w來看,類別傾向得分匹配法和響應傾向得分匹配法的處理效應估計偏差和均方誤差均較小,兩種方法對處理效應的估計都較好。處理效應估計的統(tǒng)計性質(zhì)與處理組和反事實匹配組之間傾向得分的距離有關(guān),隨著反事實匹配組號k的增加,類別傾向得分匹配法和響應傾向得分匹配法的處理效應估計偏差和均方誤差都呈現(xiàn)遞增趨勢。因此,隨著處理組與反事實匹配組之間傾向得分差異的增大,處理效應估計的偏差和均方誤差也在增大。表1 的結(jié)果顯示,當k≤3 時,響應傾向得分匹配法的處理效應估計偏差和均方誤差都小于類別傾向得分匹配法的處理效應估計偏差和均方誤差。當k≥4 時,響應傾向得分匹配法的處理效應估計偏差和均方誤差都大于類別傾向得分匹配法的處理效應估計偏差和均方誤差。當k=1 時,兩種傾向得分匹配法的處理效應估計偏差和均方誤差都為最小。相對來說,響應傾向得分匹配法的處理效應估計要優(yōu)于類別傾向得分匹配法,其更接近于處理效應的真值。因此,響應傾向得分匹配法的處理效應估計更優(yōu),利用與處理組響應傾向得分距離最小的k=1 反事實匹配組估計處理效應是最好的。
表1 處理效應估計的偏差和均方誤差
各地區(qū)要想加快經(jīng)濟發(fā)展,必須制定吸引和留住流動人口的政策,保證流動人口的生活質(zhì)量,而家庭消費是評價流動人口生活質(zhì)量的重要方面。近年來,消費發(fā)展趨勢問題受到學者們的高度關(guān)注(殷俊茹等,2016)[22]。影響消費的因素有很多,教育是其中的一個重要因素(Song,2008;楊碧云等,2014)[23,24]。在其他條件完全相同的假定下,受教育程度不同的家庭消費差異可以視作教育對家庭消費的處理效應,合理測算流動人口家庭消費的教育效應具有重要的現(xiàn)實意義。
國內(nèi)外的研究者多是基于調(diào)查數(shù)據(jù)測算受教育程度對消費的影響,認為教育對消費具有正向作用。由于調(diào)查數(shù)據(jù)往往存在自選擇偏誤,這種自選擇偏誤容易使分析結(jié)論產(chǎn)生偏差。自選擇偏誤是指非完全隨機化樣本所導致的分析結(jié)論偏差,其產(chǎn)生的根源是調(diào)查數(shù)據(jù)中的居民受教育程度并不是完全隨機的。在完全隨機的調(diào)查數(shù)據(jù)中,除教育程度是不同質(zhì)的,居民家庭狀況、工作環(huán)境和收入等變量則具有同質(zhì)性,即家庭狀況、工作環(huán)境和收入等變量對家庭消費的整體影響作用相同,這些變量可以稱為協(xié)變量。受客觀成本和人倫道德的約束,完全的隨機化調(diào)查是難以實施的(韓鋒和隋福民,2015)[10]。在非完全隨機的調(diào)查數(shù)據(jù)中,受教育程度不同居民的協(xié)變量不具有同質(zhì)性(Lalonde,1986)[9],生活習慣、工作狀況和收入都不一致。因此,流動人口受教育程度對家庭消費的影響應該包括兩個部分:一部分是在居民生活、工作狀況和收入等協(xié)變量相同條件下兩類家庭的平均消費支出差值,是居民家庭狀況、工作環(huán)境和收入等協(xié)變量同質(zhì)時,僅由受教育程度不同所導致的家庭消費差異;另一部分是教育通過改變生活習慣、工作狀況和收入等協(xié)變量,間接影響家庭消費支出。因此,研究協(xié)變量相同條件下兩類居民家庭的平均消費支出差值,對于揭示流動人口受教育程度影響家庭消費的機制具有重要意義?,F(xiàn)有文獻沒有區(qū)分受教育程度對家庭消費所產(chǎn)生的不同影響,本文則利用響應傾向得分匹配法分析流動人口受教育程度對家庭消費所產(chǎn)生的處理效應,以期減少居民個體選擇偏誤,得到更合理的估計結(jié)果。
有關(guān)教育對消費影響的研究多是基于家庭生產(chǎn)理論(Becker,1964;Becker,1978)[25,26],認為教育水平高的個人消費水平較高,對新產(chǎn)品的購買意愿也較強(Michael,1972)[27]。Hettich(1972)[28]研究發(fā)現(xiàn),教育水平高的女性購買行為效率更高。Wang(1995)[29]基于美國消費者支出數(shù)據(jù)的研究顯示,戶主受教育程度高的家庭在飲食消費上的支出也更多。Wagner等(1988)[30]、Tansel 等(2006)[31]分別使用美國和土耳其的調(diào)查數(shù)據(jù)進行了分析,發(fā)現(xiàn)夫妻二人的受教育程度對消費具有正向影響。國內(nèi)的研究顯示,居民受教育程度對消費影響的結(jié)論與國外的研究基本一致,即教育對消費具有正向作用。劉曦子等(2018)[32]認為,居民受教育程度對消費具有顯著影響,動態(tài)面板分位數(shù)回歸給出的受教育程度系數(shù)為0.3~0.5,即某地區(qū)大專以上學歷(含大專)的人口占比每提高1 百分點,該地區(qū)的消費就增加0.3%~0.5%。劉子蘭等(2018)[33]將受教育程度作為人力資本的代理變量,使用混合OLS 模型測算了教育對居民消費的影響,發(fā)現(xiàn)戶主受教育年限每增加1 年,家庭消費性支出、生存性消費、享受性消費分別增長1.71%、1.42%、2.47%。王弟海等(2017)[34]的面板回歸模型分析結(jié)果顯示,生產(chǎn)部門中人均受教育年限每增加1 年,人均GDP 增長率平均提高0.7~1.4 百分點。楊碧云等(2014)[24]研究發(fā)現(xiàn),戶主受教育程度與服務性消費負相關(guān),與其他支出正相關(guān)。
目前,有關(guān)流動人口家庭消費影響因素的研究大多集中于戶籍制度、醫(yī)療社會保障、居住意愿、個人收入等方面(譚蘇華等,2015;周明海和金樟峰,2017;張義等,2020;孫文浩,2020;趙錦春等,2019)[35-39]?;诖?,本文選擇流動人口的家庭平均月總支出水平測度家庭消費,即將上年家庭在本地的平均月總支出作為結(jié)果變量,將流動人口受教育程度作為處理變量。本文將居民受教育程度分為兩類,即大學??埔韵?、大學??萍耙陨?。大學專科以下包括未上過學、小學、初中、高中/中專,大學??萍耙陨习ù髮W專科、大學本科和研究生。每個居民的教育程度是已知的,其只能屬于上述分類中的某一類,而不能同時屬于兩個類別。借鑒譚蘇華等(2015)[35]的研究,本文的協(xié)變量主要考慮經(jīng)濟、家庭和社會三個方面。經(jīng)濟變量包括上年家庭在本地的平均月總食品支出和個人上月收入,家庭變量包括性別和婚姻狀況,社會變量包括就業(yè)單位的性質(zhì)(是否為集體企業(yè)、個體工商戶或港澳臺獨資企業(yè))和戶主的就業(yè)身份(是否為雇主或自營勞動者),婚姻狀況包括已婚和單身(已婚包括初婚和再婚,單身包括未婚、離婚和喪偶)。對于其他影響家庭消費的變量,鑒于數(shù)據(jù)的可得性及研究目的,本文暫不考慮。
本文選取2015 年全國流動人口衛(wèi)生計生動態(tài)監(jiān)測調(diào)查戶籍人口問卷(A 卷)中天津市的調(diào)查數(shù)據(jù)進行研究,其基本信息見表2。流動人口衛(wèi)生計生動態(tài)監(jiān)測調(diào)查中的天津市樣本容量為5 116 個,其中,大學??萍耙陨项悇e中有574 個,大學專科以下類別中有4 542 個。
表2 變量描述
表3 報告了全部樣本均值、574 個教育程度高的樣本均值、4 542 個教育程度低的樣本均值以及教育程度不同居民樣本均值的差值??梢钥闯觯逃潭雀撸╡du=1)的家庭消費(t_exp)均值高于教育程度低(edu=0)的家庭消費均值,教育程度高的居民收入(inc)均值也普遍高于教育程度低的居民收入均值。從離散變量來看,除單位是否為港澳臺獨資(I.hmt)外,其他變量中教育程度高的居民大部分均值低于教育程度低的居民均值。在兩個類別的協(xié)變量中,除了性別比例差異不大外,其他協(xié)變量的均值差異都較大,容易形成自選擇偏誤,可能影響教育對家庭消費支出的處理效應。直接用兩類家庭消費支出的差值1 016.287 9 元作為家庭消費的匹配教育效應估計可能會產(chǎn)生系統(tǒng)偏差,因為這個差值是兩類家庭消費的教育效應,不僅包括家庭消費的匹配教育效應,還包括其他協(xié)變量不同質(zhì)的非匹配教育效應。因此,只有利用教育程度不同居民的協(xié)變量進行匹配,減少樣本自選擇偏誤的影響,家庭消費差值才能更好地反映家庭消費的匹配教育效應。
表3 不同教育類別的變量均值比較
本文采用響應傾向得分匹配法估計流動人口受教育程度對家庭消費的處理效應。edu=1 的個體為處理組,edu=0 的個體為控制組,為edu=1 處理組個體匹配edu=0 控制組個體,即可得到反事實匹配組,用于計算教育對家庭消費的處理效應。
首先,本文計算響應變量秩的累計概率。將edu=0 控制組中4 542 個觀測t_exp0按從小到大的順序排列,得到t_exp0,1,…,t_exp0,4542,取秩分別為R0,i(y0,i)(i=1,…,4542),則每個控制組響應變量秩序的累計概率為:
其次,本文采用響應傾向得分模型,基于edu=0控制組的4 542 個觀測數(shù)據(jù)建立Logistic 模型。其中為被解釋變量,解釋變量分別為平均月總食品支出f_exp、個人上月收入inc、性別sex、婚姻狀況status、所在單位是否為集體企業(yè)I_col、是否為個體工商戶I_ind、所在單位是否為港澳臺獨資企業(yè)I_hmt,就業(yè)身份是否為雇主I_mas、是否為自營勞動者I_own。本文使用Logistic 回歸擬合模型,依據(jù)模型計算控制組中4 542 個個體的響應傾向得分,將edu=1 處理組中574 個個體的協(xié)變量代入擬合模型,即可得到處理組個體的響應傾向得分。從edu=0 控制組的4 542 個個體中分別找出與edu=1 處理組574 個個體響應傾向得分距離盡可能接近0 的匹配個體,其即構(gòu)成反事實匹配組。
為了進一步分析響應傾向得分匹配法的有效性,本文進行了匹配后樣本的平衡性檢驗,主要比較處理組與反事實匹配組的樣本均值差和樣本方差比率。處理組與反事實匹配組之間樣本均值的差值越小,方差比率越接近于1,處理組與反事實匹配組的樣本差異就越小。
從表4 基于響應傾向得分匹配法的處理組與反事實匹配組平衡性檢驗結(jié)果來看,連續(xù)變量匹配后的均值差明顯降低。平均月食品支出f_exp未匹配時的均值差為300.860 1 元,匹配后的均值差僅為31.829 3 元,方差比率為1.063 8。個人月收入inc未匹配前的均值差為775.263 2 元,匹配后的均值差為297.020 9 元,方差比率為1.004 1。離散變量除了單位是否為港澳臺獨資I.hmt和就業(yè)身份是否為雇主I.mas外,其他離散變量匹配后的均值差值都顯著小于匹配前的均值差值,特別是所在單位是否為集體企業(yè)I.col匹配前的均值差為-0.054 3,匹配后的均值差為-0.008 7,而就業(yè)身份是否為自營勞動者I.own匹配前的均值差為-0.218 7,匹配后的均值差為-0.101 0。從方差比率來看,匹配后幾乎所有變量的方差比率都更接近于1??傊憫獌A向得分匹配法可以有效降低教育程度不同的兩類居民的樣本自選擇偏誤,兩類居民的協(xié)變量差異更小,分布也更加接近。
表4 響應傾向得分匹配法的協(xié)變量平衡性檢驗結(jié)果
利用處理組和反事實匹配組,本文估計了流動人口受教育程度對家庭消費的處理效應。本文將處理組的每個家庭消費支出t_exp1與其反事實匹配樣本家庭消費支出t_exppipei做差并取均值,即可得到在控制其他協(xié)變量匹配條件下教育對家庭消費t_exp的處理效應。
若將處理組的574 個觀測全部考慮在內(nèi),不考慮重復抽取多次,且設(shè)定K=1,則響應傾向得分匹配法的處理效應為:
家庭消費的匹配教育效應占家庭消費教育效應(1 016.287 9)的48.02%,非匹配教育效應占家庭消費教育效應的51.98%,二者的占比約為1∶1。
類別傾向得分匹配法估計的處理效應為:
本文采用類別傾向得分匹配法計算得到天津市流動人口家庭消費的匹配教育效應占家庭消費教育效應(1 016.287 9)的26.67%,非匹配教育效應占家庭消費教育效應的73.33%,二者的占比約為1∶3。在計算處理效應的過程中,本文剔除了異常值。
為了檢驗處理效應估計的可信度,本文采用Bootstrap 抽樣方法,重復抽取處理組574 中的450個觀測值,共重復抽取200 次,分別得到200 個處理效應的估計值,并取200 個估計值的均值代表處理效應的期望。本文選擇控制組中與處理組響應傾向得分距離最小K個單元作為K個反事實匹配單元,得到K個反事實匹配組,這里設(shè)定K=3。由于不知道處理效應的真值,無法評價偏差與均方誤差,本文僅給出估計結(jié)果和標準差。從表5 重復抽取處理組的估計結(jié)果來看,整體而言,標準差和變異系數(shù)要比類別傾向得分匹配法的估計結(jié)果更小,說明響應傾向得分匹配法的估計值更為穩(wěn)定。隨著K的增加,響應傾向得分匹配法的估計值和標準差遞增幅度都在減小。
表5 重復抽取處理組450 個觀測得到的結(jié)果
從圖1 給出的使用類別傾向得分匹配法和響應傾向得分匹配法得出的處理效應估計值箱線圖來看,類別傾向得分匹配法處理效應估計值的最小值、下四分位數(shù)、中位數(shù)、上四分位數(shù)、最大數(shù)分別為98、194、222、259、355,響應傾向得分匹配法相應的值分別為271、321、341、363、416。可見,式(8)的處理效應估計結(jié)果均在合理的范圍之內(nèi),而且響應傾向得分匹配法的處理效應估計值要比類別傾向得分匹配法的處理效應估計值更大。
圖1 兩種處理效應估計值的箱線圖
從以上天津市流動人口監(jiān)測數(shù)據(jù)的分析結(jié)果來看,流動人口受教育程度對家庭消費確實具有顯著的影響,受教育程度有助于提高家庭消費水平,這與已有文獻的結(jié)論一致。在使用響應傾向得分匹配法消除樣本自選擇偏誤之后,教育程度對家庭消費的匹配教育效應估計值占家庭消費教育效應的48.02%,該值顯著大于類別傾向得分匹配法下教育效應占家庭消費教育效應的26.67%,二者的占比約為2∶1。可見,響應傾向得分匹配法消除了處理組和反事實控制組中協(xié)變量與響應變量之間相關(guān)性的差異,可以更好地估計教育對家庭消費水平的處理效應。
在社會經(jīng)濟問題研究中,社會經(jīng)濟因素的不可控性使得樣本收集存在自選擇偏誤,降低了處理效應估計的可信度。為了平衡處理組和控制組協(xié)變量的分布,縮小處理組與反事實控制組之間變量相關(guān)性的差異,本文提出響應傾向得分匹配法。響應傾向得分匹配法是將控制組的觀測值按從小到大的順序排列取秩,對秩的累計概率和協(xié)變量建立響應傾向得分匹配模型,依據(jù)擬合模型計算出樣本個體的響應傾向得分,并構(gòu)造反事實匹配組,利用處理組和反事實匹配組樣本就可以估計處理效應。響應傾向得分匹配法既具有類別傾向得分匹配法的優(yōu)點,又能有效降低處理組與反事實匹配組之間協(xié)變量相關(guān)性的影響程度。
模擬結(jié)果顯示,隨著處理組與反事實匹配組之間傾向得分差值的增加,類別傾向得分匹配法和響應傾向得分匹配法處理效應估計的偏差和均方誤差都呈現(xiàn)遞增趨勢。相比于類別傾向得分匹配法,響應傾向得分匹配法的處理效應估計偏差和均方誤差更小。如果利用響應傾向得分匹配法估計處理效應,本文建議使用最近鄰匹配構(gòu)造處理組和反事實匹配組。
本文考察了流動人口受教育程度對家庭消費的影響,即針對調(diào)查數(shù)據(jù)存在的自選擇偏誤問題,采用響應傾向得分匹配法,構(gòu)造教育程度高的居民的反事實匹配組,估計家庭消費的匹配教育效應?;?015 年全國流動人口衛(wèi)生計生動態(tài)監(jiān)測調(diào)查戶籍人口問卷(A 卷)中天津市調(diào)查數(shù)據(jù)的實證研究顯示:在消除樣本自選擇偏誤之后,天津市流動人口受教育程度對家庭消費的匹配教育效應為488,約占家庭消費教育效應的48.02%,說明受教育程度確實提高了家庭消費水平,響應傾向得分匹配法可以更好地消除樣本自選擇偏誤;其他協(xié)變量不同質(zhì)所引致的非匹配教育效應約占家庭消費教育效應的51.98%,家庭消費的匹配教育效應與非匹配教育效應占比約為1∶1。以上結(jié)果說明,教育確實改變了人們的消費觀念和消費習慣,提高了個人家庭平均月總支出水平。需要說明的是,本文所得的結(jié)論雖是基于天津市流動人口動態(tài)監(jiān)測的調(diào)查數(shù)據(jù),但其對其他省市乃至全國也具有參考價值,響應傾向得分匹配法同樣適用于處理其他調(diào)查數(shù)據(jù)的自選擇偏誤問題。