王永欽
約書亞·安格里斯特。圖/法新
今年10月11日,《精通計量:因果之道》一書的作者約書亞·安格里斯特(Joshua Angrist),以及大衛(wèi)·卡德(David Card)、吉多·因本斯(Guido Imbens)一同獲得了2021年度諾貝爾經濟學獎。他們對自然實驗和因果識別方法的探索與推廣,極大地改變了社會科學的實證研究范式,瑞典皇家科學院評價道,“自然實驗可助我們回答社會的重大問題”。
如今,基于自然實驗的因果識別方法已成為經濟學者工具箱里的必備實證工具。如何學好用好這個工具,用來回答更多有趣有意義的社會問題,最好的路徑就是從安格里斯特這位被中國經濟學界稱為“安神”的這本書開始學習。
科學研究是一個不斷從現(xiàn)象中尋找理論、驗證理論,再用理論解釋現(xiàn)象、指導實踐的認知過程,因此,對理論的檢驗是至關重要的??茖W大致分為自然科學和社會科學,自然科學的研究對象是自然界,主要是人類之外的主體。自然科學的理論相對來說更具有可被驗證的條件,因為科學家們可以在實驗室里做實驗,可以控制諸多因素。而社會科學主要研究人,而對人很難做實驗,因此社會科學研究有很大的限制。對人做實驗起碼有兩方面的困難,一方面是倫理問題,舉例來說,我們不能讓社會中一半人接受教育,讓另一半的人沒有教育機會,然后來分析教育的效果如何,這顯然不符合倫理道德,不符合公平的考慮。另一方面,哲學方法上也使得社會科學很難做實驗。在自然科學里,可以把一塊石頭切成兩半去分別做實驗,因為切分不會改變石頭的物理和化學性質,且切分后的對比觀察有利于分析不同實驗的效果。但在社會科學研究中,無論如何我們都無法找到兩個行為模式完全一樣的個體,人有主觀能動性,即使雙胞胎也會有別。這造成了社會科學中“因果推斷的基本問題”:同一個個體要么在實驗組里,要么不在實驗組里,不可能同時“在”和“不在”。比如中國改革,我們現(xiàn)在處于“改革”的狀態(tài)中,就看不到“不改革”的狀態(tài),從而無法同時直接比較“改革”和“不改革”的結果。時間之箭是不停流逝的,只有一條實現(xiàn)路徑,數(shù)據(jù)上我們永遠觀察不到其他的可能路徑,即所謂的“反事實”(Counterfactuals);所以,在社會科學中做因果推斷是非常困難的。
那么,一個理想的實驗是什么樣的呢?舉醫(yī)學的雙盲實驗為例,如果我們要檢驗一種新冠的藥有沒有效果,可以把人群隨機分成兩組,一組使用新冠藥物(處理組),另一組使用看似一樣的安慰劑(控制組),過后觀察這兩組人的差別。實驗室和隨機實驗是自然科學里的一個黃金規(guī)則。經濟學也在越來越多地使用隨機實驗,兩年前的諾獎得主阿比吉特·巴納吉(Abhijit Banerjee)、埃絲特·迪弗洛(Esther Duflo)和邁克爾·克雷默(Michael Kremer)對此作出了很大貢獻(有意思的是,安格里斯特是迪弗洛在MIT讀博士時的導師)。但大規(guī)模地開展社會實驗有困難,在回答許多重大社會問題時,隨機實驗方法有不小的局限。
由于因果識別技術的不足,經濟學長期一直以理論研究為主。因為實證中用觀測數(shù)據(jù)得出的結果,通常是相關關系,而非因果關系,對這些結果的解釋尤其需要先有理論依據(jù)。值得慶幸的是,上世紀90年代后,經濟學因果識別的“可信度革命”開始了。代表人物就是包括本書作者在內的今年三位諾獎經濟學家。大衛(wèi)·卡德和2019年不幸早逝的經濟學家艾倫·克魯格(Alan Krueger)開創(chuàng)性地借助自然實驗研究最低工資、教育和移民等問題,約書亞·安格里斯特與吉多·因本斯系統(tǒng)地構建了識別“局部平均處理效應”(LATE)的框架。由此迎來的這一場“可信度革命”(Credibility Revolution)使經濟學具備更高的科學性;從社會科學方法史的角度看,這場革命堪比自然科學領域的“哥白尼革命”。
因果識別方法的精巧,從幾個具體的例子中可見一斑。第一個例子是大衛(wèi)·卡德與艾倫·克魯格關于最低工資法的著名研究。在美國,最低工資法是很重要的政治議題,民主黨一般主張?zhí)岣咦畹凸べY,保守派的共和黨通常認為政府不應干預勞動市場,反對提高最低工資,他們認為盡管政府本意是好的,但提高最低工資反而會害了工人。在上世紀90年代之前,經濟學理論大多認為提高最低工資會導致企業(yè)減少雇傭工人,最終增加失業(yè),這似乎毋庸置疑。
但這兩位學者開展了一個讓所有人驚訝的研究。他們選擇了美國兩個相鄰州:新澤西州和賓夕法尼亞州。其中,新澤西州在1992年4月把每小時最低工資從4.25美元提高到了5.05美元,賓州則沒有變化。然后用問卷調查收集了兩個州的快餐業(yè)勞動就業(yè)數(shù)據(jù)。由于兩個州相鄰,快餐店所處的經濟和市場環(huán)境相似,主要區(qū)別在于這兩個州的最低工資政策。因此對新澤西州快餐店在1992年4月前后的就業(yè)作差,差值來自提高最低工資的影響和其他的經濟社會等因素,對賓州前后作差,差值則只來自與新澤西州相似的經濟社會等因素,沒有最低工資的影響。那么兩個差值之間再作一次差,得到的就是提高最低工資對就業(yè)的影響了。這種奇妙的方法就是著名的雙重差分法??ǖ潞涂唆敻窠淌诘倪@一研究有重要的社會意義。他們發(fā)現(xiàn),與沒有提高最低工資的賓州相比,新澤西提高最低工資之后,就業(yè)非但沒有下降,還略有上升。這一發(fā)現(xiàn)顛覆了經濟學家和政治家的成見,對經濟學研究方法的發(fā)展和政策研究都產生了巨大的影響。
結合中國的情況再介紹一個雙重差分法在中國的應用研究。該項研究的作者是西北大學教授錢楠筠(Nancy Qian),也是安格里斯特在MIT指導過的學生。她的問題是,性別失衡的原因是什么。男女性別失衡是一個很重要的社會現(xiàn)象,這個現(xiàn)象導致了一系列社會經濟問題,如哥倫比亞大學魏尚進老師的一系列研究發(fā)現(xiàn)性別失衡是高房價、高儲蓄和收入差距等問題的重要原因,所謂“丈母娘經濟”。對性別失衡的成因有很多可能的理論假說,譬如認為中國儒家傳統(tǒng)重男輕女,這是文化現(xiàn)象;譬如男女掙錢能力不一樣,這是經濟原因。其他的假說可能還有100種,但重要的是我們需要用因果關系識別出什么是最重要的原因。
錢教授用雙重差分方法找到了答案。她運用中國的市場化改革作為自然實驗。市場化改革之后,部分商品價格由物價局定價轉變?yōu)槭袌龆▋r。錢教授選擇了兩類農村地區(qū),一類農村地區(qū)適合于種茶葉,如像浙江一些山區(qū);另外一類地區(qū)適合種水果,如山東的平原地區(qū)。男性與女性在兩種作物種植采摘中具備不同的比較優(yōu)勢:女性心細,往往更適合采茶;男性體力好且擅長攀爬,更適合果園的勞動。市場化改革由市場定價之后,在不同地區(qū),男孩和女孩的經濟重要性差別拉大。在茶葉種植區(qū),由于茶葉價格市場化,女孩相對于男孩經濟重要性提升,反之在果園地區(qū)男孩經濟重要性強。結果她發(fā)現(xiàn),市場化改革之后,產茶區(qū)性別失衡下降了,而果園區(qū)性別失衡加劇了。這一發(fā)現(xiàn)表明經濟原因導致了性別失衡。
如今中國的很多問題都可以通過類似的方式來回答。例如中國當前債務違約問題比較嚴峻,健全法治制度是否能幫助解決?追溯到2007年前后,為了解決鋼鐵煤炭產能過剩、部分地區(qū)經濟下行違約破產增多的問題,中國在部分地區(qū)實行了破產法庭試點,并在此后推廣至多個城市。最近美國西北大學的查克伯·龐提切利(Jacopo Ponticelli)與中國清華大學的李波教授運用該事例,他們比較破產法庭試點地區(qū)與非試點地區(qū)的差別,發(fā)現(xiàn)引入破產法庭之后,地區(qū)破產案件執(zhí)法效率大幅提高,時間大幅縮短。并且,由于破產程序效率的提高,破產對企業(yè)構成了更強的事后約束,借款人更敢于借錢給民營企業(yè),降低民營企業(yè)融資成本。再者,破產效率提升使僵尸企業(yè)數(shù)量有所下降。
大衛(wèi)·卡德。圖/法新
吉多·因本斯。圖/法新
上述幾項研究都是通過比較兩類群體受某一外部政策沖擊(自然實驗)的影響差異,來研究這項沖擊的影響。除此之外還有其他使用自然實驗的方法,例如,勞動經濟學里最重要的問題之一是研究教育對收入的影響。這個問題看似簡單,卻不易回答。筆者任教于復旦大學,如果我們看到復旦畢業(yè)生相對于一般學校畢業(yè)生收入更高,是否可以認為高收入來自高質量的復旦教育?答案不盡然,因為一些考進復旦的學生可能本來更聰明,我們看到的復旦畢業(yè)生的高收入,可能其實來自這些與復旦無關的個人特質。由安格里斯特等學者運用推廣的“斷點回歸法”則很巧妙地回答了這類問題。舉例來說,假如我們擁有所有人的高考分數(shù)數(shù)據(jù)庫,當年復旦錄取分數(shù)線是600分,那么我們選取600分上下的,如600-605區(qū)間內的學生(處理組)和595-599區(qū)間內的考生(控制組)做對比研究,前者剛剛好考入復旦,后者則因幾分之憾沒有考進。由于分數(shù)十分接近,平均意義上這兩組人在其他維度上沒什么差別,是否進入復旦基本上是運氣使然。那么,比較兩組人之后的收入差距(或者其他有意思的變量),得到的就是純粹的復旦教育對收入或者其他方面的因果性影響。
還有一種十分重要的經典方法叫工具變量法,依然舉例說明。收入怎么影響儲蓄,這個問題其實不好研究,因為儲蓄對收入很可能存在反向因果關系,即收入會影響儲蓄,但儲蓄反過來也會影響收入,好比“雞生蛋、蛋生雞”的關系。1989年諾獎得主特里夫·哈維默(Trygve Haavelmo)提出了工具變量的思想,這一思想是說,我們想研究x因素對y因素的影響,可以先找一個z,z只影響x,不直接影響y,那么z就是x的一個工具變量。通過z造成x的變化,進而研究引起的y的變化,這就構成一個因果鏈條。在上面的例子里,經濟學家發(fā)現(xiàn),可以用降雨量作為一些地區(qū)農民收入的工具變量。因為在很多地方農民是靠天吃飯的,干旱會導致農作物減產和收入下降,而天氣相對于農業(yè)生產活動是外生變量,不會直接對儲蓄行為產生影響。因此用天氣變化引起的收入變化,可以得到收入對儲蓄的因果影響。安格里斯特和因本斯將這一思想進一步正式化,給出了工具變量方法的一般框架(即LATE)。
借助自然實驗的方法,經濟學家可以在使用觀測數(shù)據(jù)的情況下,回答很多重要的問題。從這個意義上說,整個世界就是經濟學家的實驗室,經濟學的研究范圍大大拓展了。
什么因素造成了國家間的貧富差異?有的人說地理位置決定經濟發(fā)展,如法國思想家孟德斯鳩。這種觀點帶有“宿命”的意味,位于熱帶的國家是否因為天氣熱、疾病多就不容易發(fā)展了?國家越靠近赤道越落后,這個是因果關系嗎?第二種觀點認為文化重要,如馬克斯·韋伯,認為宗教影響到經濟發(fā)展,新教倫理的國家經濟發(fā)展比較快,天主教國家差一些,其他的更差;也有人說儒家思想很重要,中國、東亞四小龍的經驗則是證據(jù)。還有一種觀點認為,制度決定了經濟發(fā)展,例如保護產權、法治等因素。眾說紛紜,如何檢驗呢?
MIT的阿西莫格魯(Acemoglu)教授跟他的同事約翰遜(Johnson)、羅賓遜(Robinson)用工具變量法給出了一種解釋。他們用歷史上殖民地的死亡率做制度的工具變量。背后的道理在于,非洲有些地區(qū)歷史上因為瘧疾、自然條件惡劣等因素,不適合居住,殖民者不愿意在此長期定居,而是建立掠奪性的殖民政府,把石油、金屬等資源運回歐洲去。在生存環(huán)境比較好的地區(qū),殖民者更愿意長治久安,因而也帶去了歐洲的制度。作者用死亡率作為制度的工具變量,進而再研究制度對經濟發(fā)展的長期影響,這樣就得到了因果關系。他們發(fā)現(xiàn),制度是影響經濟發(fā)展的重要因素。歷史不能假設,但是他們的研究告訴我們,在“逝者如斯夫”的歷史長河中,也可以通過自然實驗的方法打開歷史的“黑匣子”,重構歷史的反事實,找到其中的因果規(guī)律。
再舉一則離我們較近的例子。2008年的全球金融危機造成美國經濟大衰退。這次危機的原因是什么,為什么會導致如此劇烈的衰退,這是一個典型的宏觀問題。2008年金融危機爆發(fā)前后,美國的房地產泡沫很大,可沒人能說清楚原因是什么。國內關于房地產泡沫的解釋可謂眾說紛紜,有人說貨幣超發(fā),有人認為剛需使然,城市化導致住房購買需求上升,也有人認為地方政府采取土地財政,導致地方政府有動機推高房價,擠牙膏式的供給土地。美國學者對此的解釋同樣莫衷一是,其中一種觀點認為是信貸供給過多,創(chuàng)造了大量住房抵押貸款;另一種觀點認為是人的非理性因素,市場參與者對房地產共同抱有樂觀態(tài)度,越漲越買,水漲船高。問題是如何進行因果性檢驗來識別哪種機制在發(fā)揮作用呢?
來自芝加哥大學的印度裔教授蘇菲(Sufi),和另一位來自普林斯頓大學的巴基斯坦裔教授米安(Mian)用雙重差分的方法研究了這個問題。在聯(lián)邦制的獨特背景下,美國國內每個州都可以自己制定一些法律。在1980年之前,美國的銀行是受管制的,法律規(guī)定一個州的本地銀行不能在州外,或州內其他市設立分行,好比上海的銀行不能在北京設分行。但自1980年起,銀行管制逐漸放松,有的州開始允許別的州的銀行來設分行,每個州放開的時間是不一樣的。這兩位學者利用這一自然實驗,發(fā)現(xiàn)在早放開管制的州,銀行信貸供給增多,居民融資更加容易,這個地方的房地產價格隨之暴漲。他們還發(fā)現(xiàn),在危機爆發(fā)前五年,家庭債務積累最多的那些州,在危機后幾年里遭受的經濟衰退也更嚴重。因此他們的研究既說明了信貸擴張帶來房價上漲、家庭債的增加,還證明了家庭債務積累和地區(qū)衰退的關系,回答了為什么這次金融危機對實體經濟沖擊如此巨大的問題。此項著名研究對探究中國房地產問題非常有啟發(fā)意義。
所以,我們可以用精巧微觀的自然實驗方法來研究一些非常宏大的問題,包括經濟周期、經濟衰退、金融危機,也包括歷史上的重大問題,如制度如何決定經濟發(fā)展,等等。
對于希望了解因果識別的方法、認識現(xiàn)代實證經濟學的研究范式和方法論的讀者來說,本書絕對是不二之選。這既因為本書作者功力深厚、知識權威,也因為作者安格里斯特本人幽默風趣,使得本書的可讀性非常之強。由于筆者的私人經歷,可提供一二則安格里斯特教授的趣聞逸事以證此言不虛。筆者在哈佛大學做富布萊特訪問學者時,去上過安格里斯特教授的課,他上課特別有趣,他在每個學生的桌子上放著學生的名字卡片,方便他隨時叫出同學的名字來回答問題,目的就是要挑戰(zhàn)同學們。他年輕時做過軍人,所以走起路來昂首挺胸,非常有個性。他號稱自己是Master,中文叫“大師”,他喜歡中國的功夫片,特別喜歡中國的文化。安格里斯特教授早年另一本關于計量方法的教科書,也是筆者最早介紹給格致出版社的。那是2008年,我在耶魯大學做博士后,第一次看到他那本Mostly Harmless Econometrics尚未正式出版的PDF書稿,當時看到覺得特別神奇,既寫得通俗易懂,又將因果關系的相關方法總結得非常清楚,語言也幽默詼諧,于是馬上就推薦給格致出版社。后來那本書的中文版也很流行,叫《基本無害的計量經濟學》。從事經濟學研究的同學或老師們幾乎人手一冊。同樣的,我相信這本更深入淺出的《精通計量:因果之道》也會為中國的讀者們帶來不一般的學習樂趣,也會人手一冊。其實,自從這本書出版以來,我都將其推薦給每屆新生。在我看來,如果不懂因果識別的思想,就很難進行科學思維,會影響到對世界的認識和思考;而本書則是最佳的入門教材。
站在當下的時點,中國問題需要更多更扎實的經濟學實證研究。中國有很多重要的問題亟待回答:如中國房地產泡沫的原因到底是什么,中國2012年以后的經濟增長減速的原因究竟是什么,老齡化的原因何在,中國收入差距大的原因何在,中國環(huán)境問題的原因何在,等等。對這些問題的回答,有利于推動中國的高質量發(fā)展。
從國際學術界來看,經濟學研究愈發(fā)引人入勝,伴隨著這場“可信度革命”,經濟學研究的政策意義也愈加重要。好的實證研究可以幫助我們理解世界,厘清背后的因果關系,在此基礎上制定出更加有效的政策,來應對當前中國和世界的諸多挑戰(zhàn)。如果用醫(yī)學類比,經濟學者和政策制定者要首先找到“病因”,在此基礎上提出“治療方案”,然后可以檢驗“療效”。自然實驗的方法有助于我們解釋這個世界,并使世界變得更好。
對于經濟學和其他社會科學而言,這個大千世界就是我們的實驗室,有待研究的重要問題比比皆是;為此,讓我們來讀“大師”之作,循因果之道,覓自然實驗,啟智慧之旅吧!
(作者為復旦大學經濟學教授;編輯:蘇琦)