張浩然
(廣東財(cái)經(jīng)大學(xué) 經(jīng)濟(jì)學(xué)院,廣東 廣州)
回歸分析是《計(jì)量經(jīng)濟(jì)學(xué)》《統(tǒng)計(jì)學(xué)》《社會(huì)調(diào)查(研究)方法》《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》等課程的核心內(nèi)容,它在自然科學(xué)、經(jīng)濟(jì)學(xué)、管理學(xué)等領(lǐng)域的定量分析中有著廣泛的應(yīng)用[1]。同時(shí),經(jīng)濟(jì)學(xué)、管理學(xué)、法學(xué)、理學(xué)、工學(xué)、醫(yī)學(xué)等多個(gè)學(xué)科門(mén)類(lèi)的課程也應(yīng)用到回歸分析。例如,國(guó)內(nèi)權(quán)威的城市規(guī)劃教材,同濟(jì)大學(xué)吳志強(qiáng)主編的《城市規(guī)劃原理(第四版)》專(zhuān)門(mén)介紹了回歸分析,用于預(yù)測(cè)規(guī)劃期末城市人口規(guī)模,作為規(guī)劃城市建設(shè)用地的依據(jù)。在社會(huì)科學(xué)領(lǐng)域中,經(jīng)濟(jì)學(xué)、管理學(xué)、社會(huì)學(xué)和心理學(xué)都是基于數(shù)據(jù)的學(xué)科,回歸分析無(wú)疑是最重要的分析工具之一。在循證醫(yī)學(xué)(Evidence-Based Medicine)方面,作為國(guó)際公認(rèn)的腫瘤治療規(guī)范標(biāo)準(zhǔn)NCCN 指南(National Comprehensive Cancer Network,美國(guó)國(guó)立綜合癌癥網(wǎng)絡(luò))參考了很多基于隨機(jī)對(duì)照試驗(yàn)和回歸分析的文獻(xiàn)。讀懂醫(yī)學(xué)領(lǐng)域四大頂刊:新英格蘭醫(yī)學(xué)雜志(NEJM)、美國(guó)醫(yī)學(xué)會(huì)雜志(JAMA)、柳葉刀(Lancet)、英國(guó)醫(yī)學(xué)期刊(BMJ)也需要必要的回歸分析方法,由此可見(jiàn)回歸分析在教學(xué)和研究中的重要性。
就回歸分析的教學(xué)而言,最好采用計(jì)量經(jīng)濟(jì)學(xué)的教學(xué)體系。計(jì)量經(jīng)濟(jì)學(xué)是數(shù)學(xué)、統(tǒng)計(jì)學(xué)和經(jīng)濟(jì)學(xué)三者結(jié)合[2]的一門(mén)文理滲透的方法論課程,也被一些數(shù)學(xué)出身的學(xué)者稱(chēng)為經(jīng)濟(jì)計(jì)量學(xué)。如果采用合適的教學(xué)手段,本科的計(jì)量經(jīng)濟(jì)學(xué)教學(xué)可以使學(xué)生讀懂《美國(guó)社會(huì)學(xué)評(píng)論》等權(quán)威期刊多數(shù)論文的回歸分析部分,而社會(huì)學(xué)普遍使用的教材艾爾巴比的《社會(huì)研究方法》則無(wú)法實(shí)現(xiàn)這一目的[3]。 鑒于此,本文從回歸分析教學(xué)中存在的實(shí)際問(wèn)題出發(fā),進(jìn)一步提出相應(yīng)的對(duì)策,為回歸分析的教學(xué)實(shí)踐提供參考。
現(xiàn)有回歸分析教學(xué)和經(jīng)驗(yàn)研究存在較大的距離[4]。比如,在社會(huì)科學(xué)和醫(yī)學(xué)的經(jīng)驗(yàn)研究中,因果關(guān)系的識(shí)別處于核心地位,但傳統(tǒng)的回歸分析教學(xué)并沒(méi)有將因果推斷作為核心,對(duì)于魯賓因果模型和各種識(shí)別方法關(guān)注較少,基本沒(méi)有涉及倍差法、斷點(diǎn)回歸等現(xiàn)代專(zhuān)題?,F(xiàn)有教學(xué)內(nèi)容花費(fèi)了很多篇幅介紹異方差、自相關(guān)的檢驗(yàn)與修正,卻沒(méi)有介紹大樣本條件下普遍采用的異方差、聚類(lèi)穩(wěn)健標(biāo)準(zhǔn)誤,不利于學(xué)生掌握實(shí)用的統(tǒng)計(jì)方法。實(shí)際上,現(xiàn)代經(jīng)濟(jì)學(xué)中的因果推斷方法對(duì)于學(xué)生理解經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、教育心理學(xué)、管理學(xué)和醫(yī)學(xué)等方面的教材和論文有很大幫助。比如,格里格和津巴多主編的本科層次普通心理學(xué)經(jīng)典教科書(shū)《心理學(xué)與生活(第19 版)》第3 章的案例就基于雙重差分方法探討了后葉催產(chǎn)激素與信任的關(guān)系。
在本科教學(xué)階段,學(xué)生花費(fèi)了大量時(shí)間進(jìn)行給定假設(shè)條件下的數(shù)學(xué)證明,但對(duì)于假設(shè)的含義及其與因果識(shí)別的關(guān)系缺乏直觀的理解。財(cái)經(jīng)類(lèi)專(zhuān)業(yè)的本科生學(xué)習(xí)了統(tǒng)計(jì)學(xué)和計(jì)量經(jīng)濟(jì)學(xué)課程,雖然掌握了一定的矩陣推導(dǎo)技巧,卻不能夠基于理論的指導(dǎo)建立合適的回歸模型,缺乏實(shí)際應(yīng)用能力。
國(guó)內(nèi)教材選擇的一些案例大多基于宏觀或自編數(shù)據(jù),缺少生動(dòng)有趣的案例,難以把機(jī)制說(shuō)清楚,不利于激發(fā)學(xué)生的學(xué)習(xí)興趣。國(guó)外較為流行的《基本無(wú)害的計(jì)量經(jīng)濟(jì)學(xué)》在探討選擇性偏誤時(shí)選擇的案例是否曾因病在醫(yī)院過(guò)夜與自評(píng)健康水平的關(guān)系,雖然不是狹義的經(jīng)濟(jì)學(xué)問(wèn)題,但非常直觀,有助于培養(yǎng)社會(huì)科學(xué)直覺(jué),加深對(duì)問(wèn)題的理解。
財(cái)經(jīng)類(lèi)專(zhuān)業(yè)本科層次的回歸分析課程應(yīng)在正確理解現(xiàn)代統(tǒng)計(jì)學(xué)和經(jīng)濟(jì)計(jì)量學(xué)分析框架和方法的前提下,合理設(shè)計(jì)教學(xué)體系和教學(xué)內(nèi)容,基于大城市的生產(chǎn)率優(yōu)勢(shì)、婚前同居與離婚率、大氣污染與預(yù)期壽命等典型案例,盡可能避免(或緩解)由內(nèi)生性問(wèn)題所產(chǎn)生的估計(jì)偏誤,結(jié)合Stata 等統(tǒng)計(jì)軟件的使用,系統(tǒng)介紹和探討社會(huì)科學(xué)研究方法,展現(xiàn)社會(huì)科學(xué)的定量研究邏輯體系,引導(dǎo)學(xué)生以科學(xué)思維思考社會(huì)問(wèn)題。具體來(lái)說(shuō),應(yīng)該在以下幾個(gè)方面有所突破:
在教材方面,最好結(jié)合中國(guó)的實(shí)際情況,選擇經(jīng)典教材。通過(guò)教學(xué)實(shí)踐,斯托克和沃森、伍德里奇以及安格里斯特的經(jīng)典教材被國(guó)內(nèi)外高校普遍采用。哥倫比亞大學(xué)經(jīng)濟(jì)系本科生的計(jì)量經(jīng)濟(jì)學(xué)教材選擇的是斯托克(Stock)和沃森(Watson)的Introduction to Econometrics,該教材結(jié)構(gòu)較為完整,國(guó)內(nèi)已有漢語(yǔ)翻譯版,是合適的選擇。同時(shí),2021 年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者安格里斯特(Angrist)的《精通計(jì)量:從原因到結(jié)果的探尋之旅》體系新穎,但不夠全面,該教材將因果推斷作為本科計(jì)量經(jīng)濟(jì)學(xué)教學(xué)的核心重新構(gòu)建了本科計(jì)量經(jīng)濟(jì)學(xué)的教學(xué)體系,可以與其他經(jīng)典教材互為補(bǔ)充。在國(guó)內(nèi)教材方面,葉阿忠的《計(jì)量經(jīng)濟(jì)學(xué)》(中國(guó)人民大學(xué)出版社,2021 年出版)由于是初版,有一些小錯(cuò)誤,但結(jié)構(gòu)相對(duì)新穎,也有較為豐富的案例。在課外讀物方面,邱嘉平的《因果推斷實(shí)用計(jì)量方法》縮短了計(jì)量經(jīng)濟(jì)學(xué)理論學(xué)習(xí)與經(jīng)驗(yàn)研究的距離,為學(xué)生畢業(yè)論文的撰寫(xiě)提供了有益的指導(dǎo);李井奎著的《大偵探經(jīng)濟(jì)學(xué)》則提供了豐富有趣的教學(xué)案例。
就回歸分析的教學(xué)內(nèi)容而言,應(yīng)在第一節(jié)課就介紹隨機(jī)對(duì)照試驗(yàn)和因果推斷,并貫穿教學(xué)過(guò)程始終。教學(xué)應(yīng)以實(shí)驗(yàn)和準(zhǔn)實(shí)驗(yàn)作為基準(zhǔn),將與因果效應(yīng)密切相關(guān)的內(nèi)生性問(wèn)題的處理作為教學(xué)的核心。課程內(nèi)容側(cè)重于對(duì)微觀尺度的信息建模,利用現(xiàn)代統(tǒng)計(jì)和計(jì)量方法識(shí)別變量之間的因果關(guān)系。為了保證統(tǒng)計(jì)推斷的有效性,課程應(yīng)考慮引入異方差穩(wěn)健標(biāo)準(zhǔn)誤和聚類(lèi)穩(wěn)健標(biāo)準(zhǔn)誤,刪減異方差檢驗(yàn)等相關(guān)內(nèi)容,即不再將異方差作為一種需要解決的問(wèn)題,而是在模型設(shè)定時(shí)就允許異方差存在,并采用異方差穩(wěn)健標(biāo)準(zhǔn)誤。
課程體系可以依次包括以下內(nèi)容:(1)隨機(jī)實(shí)驗(yàn);(2)多元線(xiàn)性回歸模型;(3)多元回歸專(zhuān)題(介紹對(duì)數(shù)模型、交互項(xiàng)模型等本質(zhì)線(xiàn)性回歸模型);(4)實(shí)踐中的工具變量;(5)斷點(diǎn)回歸設(shè)計(jì);(6)面板數(shù)據(jù)、固定效應(yīng)和雙重差分方法;(7)非標(biāo)準(zhǔn)的標(biāo)準(zhǔn)誤問(wèn)題;(8)數(shù)據(jù)來(lái)源與預(yù)處理;(9)Stata 或R 軟件操作與案例。與傳統(tǒng)教學(xué)內(nèi)容不同,課程將工具變量、斷點(diǎn)回歸和雙重差分等現(xiàn)代計(jì)量方法納入教學(xué)體系。
在回歸模型的應(yīng)用中,無(wú)論是總體回歸模型的設(shè)定、內(nèi)生性處理還是結(jié)果的解釋都需要經(jīng)濟(jì)學(xué)、政治學(xué)、社會(huì)學(xué)和管理學(xué)等相關(guān)理論的指導(dǎo)。專(zhuān)業(yè)學(xué)術(shù)論文不僅需要干凈的識(shí)別,還要闡述內(nèi)在影響機(jī)制,這些都需要理論的指導(dǎo)。因而在進(jìn)行課堂教學(xué)時(shí)需要對(duì)涉及的理論進(jìn)行適度的回顧和討論。在課堂教學(xué)中,還應(yīng)該結(jié)合學(xué)術(shù)論文引導(dǎo)學(xué)生掌握回歸分析結(jié)果的呈現(xiàn)方式,能夠根據(jù)表格信息對(duì)影響程度和顯著性水平進(jìn)行解讀。對(duì)于跨學(xué)科問(wèn)題,回歸分析的教學(xué)不僅僅需要統(tǒng)計(jì)學(xué)和經(jīng)濟(jì)計(jì)量學(xué)的支撐,而且需要經(jīng)濟(jì)學(xué)、政治學(xué)、社會(huì)學(xué)、心理學(xué)、管理學(xué)、人文地理學(xué)等學(xué)科基礎(chǔ)的支持,因而需要教師根據(jù)學(xué)生所在專(zhuān)業(yè)進(jìn)行自主學(xué)習(xí),拓寬知識(shí)面。
教學(xué)過(guò)程應(yīng)該注重理論與應(yīng)用相結(jié)合,全面系統(tǒng)地對(duì)回歸分析的理論和方法進(jìn)行介紹,不僅涵蓋多元回歸分析等基本的回歸方法,而且也應(yīng)將面板數(shù)據(jù)回歸方法納入教學(xué)體系。在授課過(guò)程中應(yīng)重點(diǎn)討論經(jīng)驗(yàn)研究中面臨的內(nèi)部有效應(yīng)和外部有效問(wèn)題,如遺漏變量、雙向因果關(guān)系、函數(shù)形式誤設(shè)、變量測(cè)量誤差、選擇偏誤等。由于本科生數(shù)學(xué)基礎(chǔ)參差不齊,因此在回歸分析教學(xué)過(guò)程中除了必要的數(shù)學(xué)推導(dǎo),還應(yīng)對(duì)統(tǒng)計(jì)思想進(jìn)行直觀的講授[5]。
回歸分析是應(yīng)用性課程,為了引導(dǎo)學(xué)生基于社會(huì)經(jīng)濟(jì)現(xiàn)象構(gòu)建合適的回歸模型,需要學(xué)生熟練使用統(tǒng)計(jì)軟件[6]。目前,國(guó)內(nèi)高校普遍采用的Eviews 軟件更擅長(zhǎng)時(shí)間序列模型,擴(kuò)展性不足。哥倫比亞大學(xué)經(jīng)濟(jì)系、中大嶺南學(xué)院等國(guó)內(nèi)外知名院系普遍采用Stata 或R??紤]到Stata 功能全面[7],在社會(huì)科學(xué)和醫(yī)學(xué)領(lǐng)域普遍應(yīng)用,較R 更容易掌握,筆者推薦采用Stata 進(jìn)行實(shí)驗(yàn)教學(xué)。為了彌補(bǔ)Stata 在大數(shù)據(jù)處理和數(shù)據(jù)抓取方面的不足,網(wǎng)絡(luò)爬蟲(chóng)部分內(nèi)容可以采用Python 進(jìn)行教學(xué),為學(xué)生未來(lái)的深造和就業(yè)打下更堅(jiān)實(shí)基礎(chǔ)。
近年來(lái),回歸分析方法在政治學(xué)、社會(huì)學(xué)等其他社會(huì)科學(xué)和醫(yī)學(xué)領(lǐng)域得到了廣泛的應(yīng)用。因而在教學(xué)過(guò)程中,案例可以不完全來(lái)源于狹義的經(jīng)濟(jì)學(xué)。比如在因果推斷方面,可以舉一些有趣的現(xiàn)實(shí)案例:婚前同居與離婚率;離婚與子女發(fā)展;父母入獄與子女發(fā)展;讀書(shū)與賺錢(qián);學(xué)區(qū)房溢價(jià);就業(yè)的性別歧視等等。通過(guò)以上案例的分析增強(qiáng)學(xué)生對(duì)內(nèi)生性問(wèn)題的理解,取得更好的教學(xué)效果。
教學(xué)案例的選擇最好來(lái)源于重要的學(xué)術(shù)刊物或領(lǐng)域杰出學(xué)者的工作論文,并根據(jù)學(xué)生所在學(xué)校和專(zhuān)業(yè)進(jìn)行適當(dāng)取舍。例如,對(duì)于地理科學(xué)學(xué)院的學(xué)生,斷點(diǎn)回歸部分的案例可以采用2020 年克拉克獎(jiǎng)獲得者哈佛大學(xué)經(jīng)濟(jì)系Dell教授基于地理斷點(diǎn)回歸(spatial regression discontinuity)的系列研究,如非法交易網(wǎng)絡(luò)與墨西哥毒品戰(zhàn)爭(zhēng)[8]等。自然地理與資源環(huán)境、人文地理與城鄉(xiāng)規(guī)劃、地理信息科學(xué)等專(zhuān)業(yè)的學(xué)生先期學(xué)習(xí)過(guò)地理信息系統(tǒng)理論和軟件等相關(guān)課程,熟悉Arcgis 空間分析功能,能夠從專(zhuān)業(yè)的角度更好地理解回歸方法。
對(duì)于二本財(cái)經(jīng)院校的財(cái)經(jīng)類(lèi)專(zhuān)業(yè)學(xué)生,斷點(diǎn)回歸的案例可以選擇賈瑞雪和李宏彬的工作論文“The Value of Elite Education in China”,該文章利用了高考一本線(xiàn)提供的自然實(shí)驗(yàn),發(fā)現(xiàn)一流大學(xué)教育可以使工資提升30%-40%。二本財(cái)經(jīng)院校財(cái)經(jīng)類(lèi)專(zhuān)業(yè)學(xué)生高考時(shí)的分?jǐn)?shù)線(xiàn)有些達(dá)到了一本線(xiàn),但是最終進(jìn)入二本院校,對(duì)與自身經(jīng)歷息息相關(guān)的研究主題感興趣。從高考錄取分?jǐn)?shù)線(xiàn)切入講授斷點(diǎn)回歸,更加清晰易懂,又能夠兼顧對(duì)工具變量排他性約束的討論,能夠獲得較好的教學(xué)效果。對(duì)于非洲留學(xué)生的教學(xué),Nunn 關(guān)于非洲奴隸貿(mào)易的長(zhǎng)期影響的系列文章以及Acemoglu 關(guān)于《發(fā)展差異的殖民地起源》的經(jīng)典文獻(xiàn)都是較好的選擇。筆者在教學(xué)的過(guò)程中發(fā)現(xiàn)所在學(xué)校非洲留學(xué)生學(xué)習(xí)意愿普遍不足,漢語(yǔ)水平無(wú)法滿(mǎn)足學(xué)習(xí)需要,但英文水平較佳,采用非洲主題的經(jīng)典英文文獻(xiàn)能夠便于學(xué)生理解教學(xué)內(nèi)容,取得較好的教學(xué)效果。對(duì)于社會(huì)學(xué)和社會(huì)心理學(xué)專(zhuān)業(yè)的學(xué)生,文章可以取材于較新的社會(huì)學(xué)權(quán)威刊物,如《American Sociological Review》以及《社會(huì)學(xué)研究》。二本院校社會(huì)學(xué)相關(guān)專(zhuān)業(yè)本科生對(duì)于以費(fèi)孝通為代表的人類(lèi)學(xué)民族學(xué)研究范式較為熟悉,但統(tǒng)計(jì)訓(xùn)練普遍不足。一個(gè)學(xué)期的回歸分析課程應(yīng)該可以使本科生較好地理解多數(shù)采用回歸分析方法的社會(huì)學(xué)學(xué)術(shù)論文。
倍差法的案例選擇可以來(lái)自“雙重差分小公主”錢(qián)楠筠(Nancy Qian)關(guān)于消失的女性與茶葉價(jià)格等相關(guān)研究,能夠兼顧嚴(yán)謹(jǐn)性和趣味性,并加深學(xué)生對(duì)發(fā)展中國(guó)家男女性別失衡問(wèn)題的理解。另外一些研究,如發(fā)表在《經(jīng)濟(jì)研究》上的《香煙、美酒和收入》采用微觀入戶(hù)調(diào)查數(shù)據(jù)發(fā)現(xiàn)飲酒對(duì)收入具有顯著的提升作用,使個(gè)體收入提升7%,且飲酒對(duì)女性收入的影響大于男性。而吸煙對(duì)收入的影響較小,且在統(tǒng)計(jì)上不顯著[9]。該研究采用家庭成員吸煙和飲酒比例作為工具變量,可能無(wú)法滿(mǎn)足工具變量的外生性假設(shè),從而無(wú)法干凈地識(shí)別吸煙、飲酒對(duì)收入的因果效應(yīng),在嚴(yán)謹(jǐn)性方面有不足之處,但其研究主題具有重要的現(xiàn)實(shí)意義和一定的趣味性,也可以作為案例來(lái)源,需在授課過(guò)程中適當(dāng)討論工具變量的識(shí)別假設(shè)是否得到滿(mǎn)足,如果不滿(mǎn)足將對(duì)估計(jì)結(jié)果產(chǎn)生怎樣的影響等問(wèn)題。
在數(shù)據(jù)選擇方面,應(yīng)根據(jù)學(xué)生所學(xué)專(zhuān)業(yè)進(jìn)行篩選。比如,對(duì)會(huì)計(jì)學(xué)和金融學(xué)專(zhuān)業(yè)的學(xué)生,應(yīng)多采用工業(yè)企業(yè)數(shù)據(jù)庫(kù)、上市公司等企業(yè)數(shù)據(jù),關(guān)注公司金融等領(lǐng)域的研究主題,對(duì)人力資源、勞動(dòng)和社會(huì)保障專(zhuān)業(yè)的學(xué)生,應(yīng)多采用中國(guó)家庭追蹤調(diào)查(CFPS)、中國(guó)勞動(dòng)力動(dòng)態(tài)調(diào)查(CLDS)等微觀調(diào)查數(shù)據(jù),對(duì)經(jīng)濟(jì)學(xué)專(zhuān)業(yè)的學(xué)生,應(yīng)多采用統(tǒng)計(jì)和普查數(shù)據(jù),對(duì)數(shù)學(xué)和計(jì)算機(jī)專(zhuān)業(yè)的學(xué)生,應(yīng)引導(dǎo)學(xué)生多通過(guò)網(wǎng)絡(luò)爬蟲(chóng)方法獲取數(shù)據(jù)。
就非社會(huì)科學(xué)專(zhuān)業(yè)的學(xué)生而言,可以加強(qiáng)回歸預(yù)測(cè)方面的教學(xué),應(yīng)該盡可能獲取來(lái)自真實(shí)產(chǎn)業(yè)環(huán)境的數(shù)據(jù)[10],如二手房掛牌價(jià)格、五星級(jí)酒店掛牌價(jià)格、電影票房數(shù)據(jù)等,在回歸分析的教學(xué)過(guò)程中適當(dāng)融入機(jī)器學(xué)習(xí)方法。在教學(xué)內(nèi)容和案例的選擇方面,不應(yīng)將視角局限于傳統(tǒng)的經(jīng)濟(jì)學(xué)領(lǐng)域,而應(yīng)適當(dāng)補(bǔ)充一點(diǎn)有趣的醫(yī)學(xué)、心理學(xué)、政治學(xué)、社會(huì)學(xué)和管理學(xué)高質(zhì)量期刊的案例以及真實(shí)的商業(yè)數(shù)據(jù),加深學(xué)生對(duì)于回歸分析基本方法的理解,提高學(xué)生的學(xué)習(xí)興趣和社會(huì)科學(xué)的分析能力,拓展學(xué)生的就業(yè)渠道。