馮帥帥 羅教講
(武漢大學(xué)社會學(xué)院,湖北 武漢 430072)
無論是自然科學(xué)還是社會科學(xué),只要冠之以科學(xué)之名,大都以探究變量關(guān)系、揭示現(xiàn)象或事物背后的因果機制,總結(jié)自然和社會的因果規(guī)律作為自身的核心任務(wù)。從方法角度出發(fā),追求這一目標的關(guān)鍵在于能夠識別、隔離和控制那些干擾因素,即可能同時對解釋變量和目標變量產(chǎn)生作用的其他相關(guān)變量,學(xué)術(shù)界將這種現(xiàn)象稱作“內(nèi)生性問題”(endogeneit),[1-4]將這種變量叫做“混沌因子”(confounding variable)。只有在有效控制這些混沌因子的基礎(chǔ)上,研究者才可能做到凈化變量關(guān)系中的混沌/內(nèi)生效應(yīng),更準確地評估解釋變量與目標變量之間的因果關(guān)系,排除分析結(jié)果的替代性解釋,最終得出科學(xué)和有價值的研究結(jié)論。[5-7]到目前為止,研究者用以應(yīng)對“混沌因子”或“內(nèi)生性問題”的方式主要兩種:實驗或準實驗法(experimental or quasi-experimental)和統(tǒng)計隔離法(statistical mechanisms)。[8]在化學(xué)、生物等自然科學(xué)以及心理科學(xué)研究中,實驗法或準實驗法的應(yīng)用非常廣泛。美國心理學(xué)家費斯汀格和卡爾史密斯的認知失調(diào)實驗是典型案例之一,他們在實驗設(shè)計中故意向被試者隱瞞真實的實驗?zāi)康模捎门懦ǎ╡limination method)隔離被試者的主觀預(yù)期對實驗結(jié)果的影響。[9]遺憾的是,受制于可操作性、變量關(guān)系復(fù)雜、研究倫理等諸多因素,社會學(xué)、政治學(xué)和管理學(xué)等社會科學(xué)領(lǐng)域?qū)W者無法或很難借助實驗方法開展研究,使用統(tǒng)計隔離的方法在實踐上更為可行。借助統(tǒng)計隔離法可以在數(shù)學(xué)上有效消除與非核心變量相關(guān)的方差,[10]幫助研究者接近更加真實的因果關(guān)系。統(tǒng)計隔離的具體方法有很多,被廣為使用的方法包括工具變量(instrumental variable)、雙重差分方法(difference-indifferences method)、傾向值匹配(propensity score matching)、固定效應(yīng)模型(fixed effects model)、同胞效應(yīng)(sibling effects),以及在很多社會學(xué)量化研究者看起來最為初級,但使用率卻是最高的控制變量法(control variable)。
控制變量法是指研究者基于常識經(jīng)驗、理論設(shè)想和文獻分析等基礎(chǔ)上,對影響核心變量(解釋變量和目標變量)的其它因素或條件加以控制,使其按照特定要求發(fā)生變化或者保持恒定,以幫助研究者探尋核心變量真實因果關(guān)系的一種方法。在具體方法使用中,研究者不是通過實驗或準實驗設(shè)計使相關(guān)因素在樣本或環(huán)境中保持恒定,而是測量可能與核心變量有關(guān)系的變量[11]或標準,[12]并將其包含在后續(xù)分析中。研究者一般會在量化研究中設(shè)置多個模型,并將他們所選擇的控制變量置入模型I中,然后采用逐步納入的方法將核心解釋變量逐步置入余下模型(模型II、模型III等),通過ΔR2評估混沌因子的效應(yīng),基于此分析在混沌因子控制下解釋變量與目標變量之間的關(guān)系,這已經(jīng)成為了一種標準化操作模式。[13]
近年來,控制變量使用規(guī)范問題得到西方研究者的重點關(guān)注,如Becker通過分析2000-2002年三年發(fā)表在管理學(xué)院學(xué)報(AMJ)、《行政科學(xué)季刊》(ASQ)、《應(yīng)用心理學(xué)期刊》(JAP)和《人員心理學(xué)》(PPsych)四大期刊中的60篇文獻樣本發(fā)現(xiàn),大約63%使用控制變量法的研究沒有為控制變量提供明確的理由;[5]在Becker研究的基礎(chǔ)上,Atinc等人分析了四大期刊更長時間內(nèi)、更多文獻樣本的控制變量使用情況;[12]Bernerth和 Aquinis 回顧了2003至2012年發(fā)表在頂級管理學(xué)期刊上的580篇實證研究,發(fā)現(xiàn)2003年只有5%的研究為控制變量提供了充分的理論基礎(chǔ),2012 年這一數(shù)據(jù)下降為 3%。[14]相關(guān)建議也已經(jīng)加入Academy of Management Journal(AMJ)和 Journal of Organizational Behavior(JOB)的審稿標準中。[15]
相較而言,國內(nèi)學(xué)者對控制變量用法的理論和經(jīng)驗討論明顯不足,僅曹江雨等人[16]的《組織管理研究中的控制變量使用:問題與策略》一文對組織研究中的控制變量使用規(guī)范問題展開討論。他們通過對2016—2018年刊登在四本管理學(xué)和心理學(xué)權(quán)威中文期刊(《管理世界》《南開管理評論》《心理學(xué)報》《心理科學(xué)》)上的 113 篇組織行為學(xué)文獻分析發(fā)現(xiàn),雖然有69%的研究者為至少一個控制變量的使用提供了一定依據(jù),但是其中只有 3 篇研究是基于明確的理論依據(jù)來選擇控制變量的,且在2018年發(fā)表的研究中該數(shù)值為0。目前尚未發(fā)現(xiàn)社會學(xué)領(lǐng)域有學(xué)者展開相關(guān)研究。基于此,本研究在分析2010—2019年發(fā)表在《社會學(xué)研究》雜志上的149篇定量文獻的基礎(chǔ)上,總結(jié)社會學(xué)量化研究中的控制變量使用情況和其存在的問題,并借助因果圖示和案例分析的方式討論社會學(xué)量化研究控制變量使用規(guī)范的重要意義。上述內(nèi)容將主要圍繞以下幾個問題展開:第一,控制變量法要解決什么問題?如何實現(xiàn)?第二,控制變量是否越多越好?第三,如何規(guī)范控制變量方法的使用?
當(dāng)一個變量同時影響到選擇處理的對象(自變量X)和目標對象(因變量Y),偏誤就產(chǎn)生了。對社會學(xué)研究而言,困難之處在于這類混沌因子有些是已知的(通過常識或者相關(guān)文獻研究),但更多是未知或者是疑似的。以因果圖示的方式可以清晰地向我們展示混沌因子的作用形式。在圖1中,變量Z即自變量X和因變量Y的混沌因子。從該因果圖可知,真正的因果效應(yīng)X→Y與由X←Z→Y誘導(dǎo)的偽相關(guān)混合在一起,這造成的后果有兩種:其一,X與Y確實存在真正的因果關(guān)系,但該因果關(guān)系受到外生變量Z的部分影響;其二,X與Y之間沒有因果關(guān)聯(lián),統(tǒng)計模型呈現(xiàn)的顯著性相關(guān)是因Z變量導(dǎo)致的偽相關(guān)。比如研究教育與收入的關(guān)系,假如我們收集了北京大學(xué)1000名畢業(yè)生的教育—收入數(shù)據(jù),分析發(fā)現(xiàn),教育與收入存在顯著的正向關(guān)系。但是我們忽略了一個重要變量——家庭資本。相較而言,與農(nóng)村家庭學(xué)生相比,城市家庭學(xué)生的家庭資本更豐富,具體體現(xiàn)在知識面、社會關(guān)系網(wǎng)、技能掌握、經(jīng)濟支撐等方面,而這些因素實際上對學(xué)生教育機會獲得和收入狀況同時起到一定作用,也即我們提到的Z變量,因果圖示如圖2所示。那么教育與收入之間的相關(guān)關(guān)系究竟是真實因果還是Z變量(家庭資本)下的虛假因果呢?如果缺失關(guān)于家庭資本的數(shù)據(jù),顯然我們將無法從教育的效果中區(qū)分和“提純”真實因果。反之,如我們掌握了Z變量(家庭資本)的數(shù)據(jù)并將其控制住,那我們就可以很輕易的識別教育與收入之間的真實因果,并計算出相應(yīng)的影響系數(shù)。
圖1 混沌因子圖示
圖2 教育-收入回報混沌圖示
理解控制變量的作用機理需要掌握統(tǒng)計學(xué)的兩個基本概念:偏相關(guān)(partial correlation)和半偏相關(guān)(semi-partial correlation)。[17]如圖3所示,偏相關(guān)是指同時從X和Y中移除Z與X、Y的共同變異(c + d + g)后,剩余X(b + e)能夠解釋的剩余Y(a + b)中的變異,偏相關(guān)系數(shù)的平方(即決定系數(shù) R2)為 b /(a + b)。半偏相關(guān)是指單獨移除Z與X的共同變異(c + g)或單獨移除Z與Y的共同變異(c + d)后X與Y的相關(guān)。研究者在分步回歸分析中實際討論的,是移除了Z與X的共同變異(c + g)后,剩余X(b + e)能夠解釋的Y(a + b + c + d)中的變異。移除了Z對X的影響后的半偏相關(guān)系數(shù)的平方為b /(a + b + c + d),與研究者經(jīng)常使用的ΔR2等價。使用統(tǒng)計方法對額外變量的影響進行控制后,研究者在假設(shè)檢驗中實際使用的前因變量X已經(jīng)不再是原始的X(b + c + e + g), 而是移除了前因變量X和額外變量Z的共同變異(c + g)后的剩余前因變量X(b + e)。這一對概念對于理解控制變量使用相關(guān)問題非常重要。[16]
圖3 自變量、因變量與混沌因子關(guān)系圖
偏相關(guān)系數(shù)和半偏相關(guān)系數(shù)的計算公式如下:
公式1(偏相關(guān)系數(shù)):
公式2(半偏相關(guān)系數(shù)):
控制變量用法背后有三個條件假設(shè):其一,混沌因子會污染核心變量之間的真實性關(guān)系,如果事先未對混沌因子施加干預(yù)或控制,那么分析得出的解釋變量與目標變量之間的關(guān)系就是虛假或夸大的。結(jié)果是,盡管常常缺乏事實依據(jù),但普遍認為控制變量的加入會凈化結(jié)果并揭示“真實”的關(guān)系;[10]其二,與不包括控制變量相比,那些包括控制變量(尤其是多個控制變量)的分析模型是一種更安全、統(tǒng)計上更為可靠的方法,研究者可以通過在分析中控制混雜變量來消除預(yù)測標準污染;[13]第三條隱藏的假設(shè)是,控制變量的測量通常是可靠的。相較于核心變量的操作化測量,研究者很少關(guān)注控制變量測量的信度和效度問題。重要的是,當(dāng)事實情況違反這一假定時——即控制變量測量存在偏誤,模型所解析出的方差可能表示控制變量和核心變量之間的共享方差(共享方差=真實方差+誤差方差),如果此類情況發(fā)生,那么就算控制住了混沌因子,也無法完全凈化混沌因子所帶來的混雜效應(yīng)。實際上,上述三條假設(shè)中的每一條都依賴于相當(dāng)大的推論性飛躍,況且即使在三個假設(shè)統(tǒng)統(tǒng)滿足的情況下也會存在許多潛在問題。一方面,包含控制變量的模型不僅會降低可用的自由度和統(tǒng)計能力,而且有可能減少有價值結(jié)果中可解釋的方差量。[8]也就是說,當(dāng)控制變量與預(yù)測變量相關(guān)時,結(jié)果可能看起來像預(yù)測變量與目標變量不相關(guān)或意外方向的相關(guān),而實際上對零階相關(guān)性的分析——不納入控制變量情況下——可能出現(xiàn)完全相反的結(jié)果;另一方面,過多強調(diào)和排除控制變量模型的可解釋方差量也可能導(dǎo)致錯誤的結(jié)論,即預(yù)測變量與結(jié)果變量的相關(guān)性實際上不存在。因此,控制變量的納入或篩選對理論和實踐都具有重要意義,因為這樣的決定會對研究結(jié)果造成實質(zhì)性的改變,[18]并限制了復(fù)制、概括和延展研究結(jié)果的能力。[19]
控制變量方法以成本低廉、操作方便等優(yōu)勢而深得研究者青睞,被學(xué)者廣泛應(yīng)用于各類量化研究中。但奇怪的是,在社會學(xué)定量研究中,研究者對控制變量方法是既重視又輕視的,重視體現(xiàn)在,使用控制變量方法來解決內(nèi)生問題幾乎成為不會被質(zhì)疑且使用比例最為廣泛的統(tǒng)計隔離方法;而輕視體現(xiàn)在,較少有研究者關(guān)注和討論控制變量的合法性問題,關(guān)于控制變量的選擇、控制變量的數(shù)量、控制變量與核心變量的復(fù)雜關(guān)系等問題往往被研究者一筆帶過,或者避而不談??刂谱兞烤拖褚粋€任人打扮的小姑娘,放什么、放哪里、什么時候放,全憑研究者喜好。出現(xiàn)這種現(xiàn)象的可能原因是研究者把控制變量僅僅當(dāng)作研究設(shè)計和數(shù)據(jù)分析中的次要部分,并且控制變量對研究結(jié)果的影響不容易被發(fā)現(xiàn)。但是,選擇不恰當(dāng)?shù)目刂谱兞坎粌H會影響不同數(shù)據(jù)分析結(jié)果的比較,還會降低研究結(jié)果的信度與效度。[16]
我們?nèi)砸陨衔奶峒暗摹敖逃杖搿毖芯繛榘咐?,假如只有大學(xué)教育與收入兩個變量,我們完全可以基于兩組數(shù)據(jù)的收集,借助回歸模型擬合出一條回歸直線,典型的線性回歸公式可表達為:Y=β0+ βX + ε。但事實卻沒有這么簡單,已有研究發(fā)現(xiàn),性別、年齡、政治身份、家庭資本(包括經(jīng)濟資本、文化資本、政治資本、社會資本)、戶口等多個因素同時與收入和大學(xué)教育存在某種變量關(guān)系,同樣可以用數(shù)學(xué)公式表達:Y=β0+ β1X1+ β2X2+ … + βiXi+ ε。我們當(dāng)然可以將上述所有混沌因子給“控制”起來,但這種做法存在一定的風(fēng)險。誠如國內(nèi)學(xué)者胡安寧[20]所做的總結(jié):
首先,如果將這些混沌因子作為自變量放進回歸模型,我們就潛在假定了這些混沌因子對收入的效果與大學(xué)教育對收入的效果之間存在一種線性關(guān)系,然而這種線性假定缺乏理論和實踐依據(jù)。[21]也就是說,我們不能簡單認為性別對收入的影響與大學(xué)教育對收入的影響是累加的。其次,大學(xué)教育的回歸系數(shù)代表的是一種“平均”效果。這個系數(shù)所回答的問題是:在人口中任意選取一個人,如果他接受的是大學(xué)教育,他的收入會是什么水平。然而,在探索因果關(guān)系時我們所關(guān)心的問題則是:1)一個任意選取的大學(xué)生如果一開始沒上大學(xué)的話會是什么收入水平;2)一個任意選取的非大學(xué)生如果上大學(xué)的話會是什么收入水平。這是兩個不同的問題,而回歸模型則沒有區(qū)分它們,只是取了它們的平均水平,這樣做無疑會帶來誤差。最后,由于混沌因子與我們關(guān)心的自變量之間存在相關(guān)性,簡單的將混沌因子納入多元回歸模型有可能產(chǎn)生共線性問題。
這就意味著控制變量法并非我們所設(shè)想的那么可靠,在控制變量法廣泛使用的今天,我們需要予以重新認識和反思?!渡鐣W(xué)研究》雜志是社會學(xué)領(lǐng)域的權(quán)威期刊,在該期刊發(fā)表的論文在一定程度上被視為評判社會學(xué)學(xué)者專業(yè)素養(yǎng)的標準之一。就投稿角度而言,《社會學(xué)研究》雜志對稿件的方法使用沒有明確限制,所刊論文包括理論研究、定性研究、定量研究、新興的計算社會科學(xué)研究等多個類別。借助中國知網(wǎng)平臺,筆者對《社會學(xué)研究》2010-2019年10年間刊發(fā)的149篇量化研究論文進行了量化分析。研究發(fā)現(xiàn),其一,在全部的149篇定量文獻中,有132篇文獻控制了至少一個變量,控制變量方法使用率為88.59%;其二,社會學(xué)定量研究在控制變量的使用中存在失范問題,包括變量納入的濫用化、變量選擇的趨同化和變量分析的淺薄化。具體分析內(nèi)容如表1和圖4~6所示。
表1 《社會學(xué)研究》實證文獻發(fā)表控制變量使用特征總結(jié)(2010 — 2019)
圖4 控制變量納入數(shù)量
第一,變量納入的濫用化(越來越多)。如圖4所示,在132篇使用控制變量法的定量文獻中,控制變量數(shù)量在1~3個的頻次為18,占比13.64%;控制變量數(shù)量在4~6個的頻次最高,為63,占比47.73%;控制變量數(shù)量在7~9個的頻次為39,占比29.55%;10~12個的頻次為9,占比6.82%;13個及以上的頻次為3,占比2.27%。并且,其中一篇研究文獻的控制變量竟高達21個。越來越多的量化研究者無時無刻都處于精神緊張狀態(tài),總是擔(dān)心自己的研究因無法窮盡所有混沌因子而得到錯誤的模型和結(jié)論,[22]于是陷入一種“過度控制”(over-control)的失范路徑中。美國政治媒體人埃茲拉·克萊因曾公開指出社會科學(xué)量化研究的這種“過度控制”問題,指責(zé)他們經(jīng)常對過多的變量進行控制,甚至控制了不該控制的變量,“你在各種研究中都能看到它?!覀兛刂屏恕缓笠粡堦P(guān)于被控制的變量的列表就開始了,而且這個列表往往被認為越長越好:收入、年齡、種族、宗教、身高、頭發(fā)顏色、性取向、健身頻率、父母的愛、偏好可口可樂還是百事可樂……就好像你能控制的東西越多,你的研究就越有說服力,或者至少看起來如此??刂瓶梢詭韺R恍院途_感……但有時,你控制的東西過多了,以至于在某些時候,你最終控制了你真正想要測量的東西”。[23]克萊因提出了一個合理的擔(dān)憂,研究者對于應(yīng)該控制和不應(yīng)該控制哪些變量感到非常困惑,所以默認的做法是控制他們所能測量的一切。目前絕大多數(shù)研究都采用這種做法,這的確是一種可輕松遵循的、便捷的、簡單的程序,但它既浪費資源又錯誤百出。
第二,變量選擇的趨同化(越來越像)。筆者將132篇使用控制變量方法的定量文獻中的控制變量文本摘取出來,合并創(chuàng)建了“控制變量選擇文本庫”,總字數(shù)為3534,并借助Python3.0的文本分析(中文分詞、詞頻統(tǒng)計和文本詞云)功能進行了相關(guān)分析,結(jié)果如圖5和圖6所示。圖5是“控制變量選擇文本庫”中出現(xiàn)頻次排名前十的變量名稱,其中,性別、教育和年齡三個變量出現(xiàn)的次數(shù)均在90次以上,也就是說,在社會學(xué)量化研究中,該三個變量出現(xiàn)在研究者控制變量列表中的頻率高達74.24%、69.70%和68.94%,顯然是典型的“萬金油”式的控制變量。我們不禁要質(zhì)疑,社會學(xué)量化研究的主題那么廣泛,內(nèi)容涵蓋社會資本、階層感知、幸福感、信任、不平等、健康、風(fēng)險感知等諸多議題,何以性別、教育和年齡有這么大的“能耐”竟得到學(xué)者如此鐘愛。類似的,美國學(xué)者Bernerth 和Aguinis收集了2003-2012年發(fā)表在AMJ、ASQ、JAP、JOM和Ppsych四大人力資源管理和應(yīng)用心理學(xué)領(lǐng)域權(quán)威期刊的580篇定量文獻,分析發(fā)現(xiàn),在具有明顯不同理論基礎(chǔ)的研究領(lǐng)域中,絕大多數(shù)研究都將一些簡單的人口統(tǒng)計學(xué)因素,即性別、年齡、任期,作為研究的控制變量,也很少有學(xué)者對控制變量與核心變量之間的關(guān)系做出明確解釋,并且控制變量的做法在過去十年中變化不大。[14]控制變量選擇趨同化的原因可能是:其一,凸顯研究科學(xué)性。變量的內(nèi)生性問題已然成為量化研究本身的內(nèi)生性問題,在這種情況下,如果缺失統(tǒng)計控制方法,可能會降低分析結(jié)論的科學(xué)性;其二,降低研究者負擔(dān),當(dāng)研究者未對混沌因子做深入考察和理論分析時,“隨大流”式的控制變量選取就成為部分研究者的合適選擇。
圖5 控制變量詞頻分析(前十)
圖6 控制變量詞云
第三,變量分析淺薄化(忽略內(nèi)在關(guān)系)。該現(xiàn)象主要體現(xiàn)在控制變量選取和變量解釋兩個過程中。其一,由表1內(nèi)容可知,在132篇使用控制變量法的定量文獻中,只有四成(40.15%)左右的文獻有對控制變量的選擇和使用提供一定的理由,理由主要包括文獻資源(即通過綜述以后文獻)、理論假設(shè)(藉由研究者理論假設(shè)推導(dǎo))、研究慣例(明確提到“根據(jù)研究慣例控制XX變量”)和數(shù)據(jù)驅(qū)動(通過一定的統(tǒng)計方法或數(shù)據(jù)特征進行選擇),其中,文獻資源(71.7%)和理論假設(shè)(33.96%)是控制變量選擇理由出現(xiàn)頻率最多的類型。其二,只有約三成(30.3%)的研究者在模型結(jié)果分析中對控制變量進行了除基本描述外的進一步闡釋,包括討論控制變量對模型效果的影響、控制變量與核心解釋變量或目標變量的關(guān)系、回應(yīng)已有文獻等。在社會學(xué)量化研究中,控制變量通常被視為“從屬變量”而受到研究者的輕視,在一篇典型的社會學(xué)定量論文中,研究者一般將主要篇幅拿來討論核心解釋變量的選擇及其與目標變量的關(guān)系,很少或幾乎不去關(guān)注控制變量。但是模型不會自主篩選哪些是控制變量,哪些是核心解釋變量,在統(tǒng)計模型中控制變量的地位與其它解釋變量是一致的。研究者輕視控制變量的可能結(jié)果就是,控制變量方法不僅沒有起到凈化和隔離混沌因子對核心變量“污染”的作用,反而會出現(xiàn)模型中控制變量解釋的方差超過核心解釋變量的情況,使得核心變量的關(guān)系更加模糊,令研究者無法準確解釋研究結(jié)果。
在圖1中我們以因果圖示的方式展示了混沌因子的作用機制,混沌因子Z是同時指向核心變量X和Y的。正如我們對混沌因子所做的界定那樣:當(dāng)且只有當(dāng)Z變量同時作用于解釋變量X和目標變量Y時,變量Z才可以被稱為混沌因子,需要被控制和隔離。那么,是否能夠保證我們控制變量列表中的變量全部是混沌因子呢?或者說,是否所有同時與核心變量X和Y具有關(guān)聯(lián)的第三方變量都是混沌因子呢?參考波爾和麥肯齊的貝葉斯網(wǎng)絡(luò)模型,[23]我們可以嘗試對有別于核心變量X和Y的Z變量做一個簡要分類,見圖7。
圖7 第三方變量(Z變量)類別示意圖
根據(jù)Z變量的作用機制我們可以總結(jié)出第三方Z變量的三種基本類型或形式,分別是中介因子、混沌因子、對撞因子。
(1)中介因子:X→Z1→Y。這種形似“鏈條”式的變量關(guān)系形式在心理學(xué)、社會學(xué)、管理學(xué)和經(jīng)濟學(xué)等領(lǐng)域的定量研究中很常見,一般被研究者稱為“中介效應(yīng)模型”(mediation effect model)。在具體研究中,人們通常將Z1視作某種機制或中介物,它將解釋變量X的效應(yīng)傳遞給目標變量Y。一個簡單的例子是:“橘子汁→維生素C→壞血病”。壞血病曾是歷史上對人類健康威脅最大的疾病之一,過去幾百年間曾在海員、探險家及軍隊中廣為流行,特別是在遠航海員中尤為嚴重,故有“水手的恐懼”和“海上兇神”之稱。1753年,蘇格蘭海軍軍醫(yī)詹姆斯·林德偶然發(fā)現(xiàn)此病與飲食有關(guān),并經(jīng)由英格蘭探險家詹姆斯·庫克進一步引證下,發(fā)現(xiàn)飲用橘子汁、檸檬汁后,可有效治療和預(yù)防壞血病。實際上,橘子汁中包含多種成分,而真正對壞血病起作用的是“維生素C”,假如剔除橘子汁中的維生素C成分,那么“喝橘子汁可以治療與預(yù)防壞血病”的結(jié)論將無法成立。這個例子引出了中介效應(yīng)的一個重要概念點:中介因子Z1會“屏蔽”從X到Y(jié)的信息。假如我們將中介因子Z1“控制”起來,那么雖然我們成功阻斷X通過Z1向Y傳遞信息的路徑,但是也削弱了(若Z1是部分中介)或可能完全隔絕了(若Z1是完全中介)X與Y的因果效應(yīng)。
(2)混沌因子:X←Z2→Y?;煦缫蜃覼2通常被視作解釋變量X和目標變量Y的共同因子(common cause),它既影響X,同時也對Y施加作用?;煦缫蜃拥拇嬖诳赡茉斐稍緵]有因果關(guān)系的X和Y在統(tǒng)計學(xué)上發(fā)生關(guān)聯(lián),也就是我們在上文提到的內(nèi)生性問題。如前面提到的“教育←家庭資本→收入”案例,畢業(yè)生的家庭資本既影響個體的教育習(xí)得機會,同時也影響畢業(yè)生的工資水平(如通過找關(guān)系),統(tǒng)計學(xué)上顯著的“教育—收入”正向關(guān)聯(lián)可能在事實上并不存在——即偽相關(guān)。如果缺失關(guān)于家庭資本的數(shù)據(jù),顯然我們將無法區(qū)分和“提純”真實因果。反之,如我們掌握了Z變量(家庭資本)的數(shù)據(jù)并將其控制住,那我們就可以很輕易地識別教育與收入之間的真實因果,消除虛假相關(guān)的可能性,并計算出相應(yīng)的影響系數(shù)。發(fā)現(xiàn)和找出混沌因子,并將其以合適的統(tǒng)計方法予以隔離是開展量化研究、提升研究結(jié)果內(nèi)部效度和外部效度的必要措施。
(3)對撞因子:X→Z3←Y。就目前的研究文獻而言,對撞(colider)形式的變量關(guān)系是研究者很少關(guān)注的一類Z變量作用機制。它實際上是兩條路徑的結(jié)合:X→Z3和Y→Z3。例如,有才華→找女朋友←有容貌。在日常生活中,有才華的男孩子找到女朋友的幾率比較大(正相關(guān)),同樣,帥氣的男孩子也比較容易受到女孩子待見(同樣是正相關(guān)),但是在一般情況下,“有才華”和“帥氣”并不存在相關(guān)關(guān)系(X與Y是獨立的)。從變量控制角度,對撞因子的運作方式與中介因子和混沌因子正好相反,如將Z3變量控制起來,那不僅起不到“隔斷”作用,反而會以“架橋”的方式使原本獨立的X和Y產(chǎn)生關(guān)聯(lián)。假如我們現(xiàn)在掌握了有女朋友群體的數(shù)據(jù)(換言之,我們只分析“找女朋友=1”的樣本),那么我們將會看到“有才華”和“有容貌”之間出現(xiàn)了負相關(guān),這種負相關(guān)可以解釋為:發(fā)現(xiàn)某個男孩子沒有容貌這一事實,會使我們更相信他富有才華。這種負相關(guān)被稱為對撞偏倚或“辯解”效應(yīng)(explainaway effect)。[23]
簡言之,在三種Z變量的基本類別中,混沌因子適合或需要采用控制變量方法,并借以實現(xiàn)研究者準確評估核心變量之間真實因果關(guān)系的目的;對撞因子則不適合,予以強行控制的結(jié)果是會造成虛假因果;而對中介因子的控制是否合適需要視具體情況而定,假如是完全中介,控制中介因子的后果是完全阻斷X到Y(jié)的信息傳遞路徑,導(dǎo)致兩者不相關(guān),而如果是部分中介,則可以通過控制中介因子評估X與Y的直接因果效應(yīng),如表2所示。
表2 第三方變量(Z變量)類別與變量控制
我們或可通過幾個案例來展示假如控制變量不夠規(guī)范(不經(jīng)思索的控制所有變量)所造成的影響。
圖8 案例一因果圖示
根據(jù)我們上文所做的界定,案例一實際上包含了三種第三方變量的作用類型,分別為:(1)X←Z1→Y的混沌因子作用機制;(2)X→Z 2→Y的中介因子作用機制;(3)X→Z3←Y的對撞因子作用機制。正如上面所講到的,如果我們不假思索的將Z1、Z2和Z3同時“控制”起來,那將對我們分析和評估核心變量X和Y的關(guān)系造成非常不好的影響。其一,Z1變量是混沌因子,控制Z1變量將會幫助研究者解決一部分混沌效應(yīng),有利于真實因果關(guān)系的發(fā)現(xiàn),這是我們期望看到的結(jié)果;其二,Z2變量是中介因子,控制Z2變量可能有兩種情況,即完全中介條件下的路徑隔離和部分中介條件下的因果削弱,對控制該變量的效果要視具體情況而定;其三,Z3變量是對撞因子,控制Z3變量將引發(fā)災(zāi)難,人為架構(gòu)起核心變量X與Y之間的關(guān)系橋梁,引發(fā)虛假關(guān)聯(lián)。我們不妨找一個案例加以論證:X為教育,Y為收入,Z1為家庭資本,Z2為職業(yè)類型,Z3為慈善意愿。根據(jù)常識可以判斷:“教育←家庭資本→收入”、“教育→職業(yè)類型→收入”和“教育→慈善意愿←收入”都是成立的。
圖9 案例二因果圖示
與案例一相比,案例二看起來比較簡化,只存在兩種第三方變量的作用類型:(1)X←Z1→Y的混沌因子作用機制;(2)X→Z2←Z1的對撞因子作用機制。研究者可以通過控制Z1變量實現(xiàn)對混沌因子的阻斷,準確估計X對Y的因果效應(yīng)。但這里需要關(guān)注的是Z2變量,對撞因子Z2與核心變量X有關(guān)聯(lián),但與Y并沒有直接聯(lián)系,假如Z1變量和Z2變量皆可觀測(可獲得數(shù)據(jù)),那么是否控制Z2變量對模型結(jié)果不會產(chǎn)生任何影響:一方面,假設(shè)不控制Z2變量,對撞因子本身就會起到隔離作用;另一方面,假設(shè)控制Z2變量,那么人工構(gòu)建的橋梁是核心變量X與混沌因子Z1之間的,而Z1變量已經(jīng)被控制了,因此不會對核心變量Y具有實質(zhì)性影響。復(fù)雜的地方在于,當(dāng)Z1變量無法觀測(數(shù)據(jù)缺失)時,一些研究者可能會將Z2變量作為Z1變量的替代變量(操作化)納入模型中并控制起來,但這種做法只能部分消除混沌偏倚,并引入新的對撞偏倚?,F(xiàn)實案例:X為教育,Y為收入,Z1為家庭資本,Z2為藏書量。
圖10 案例三因果圖示
案例三所展示的是一種叫做“M偏倚”[23]的偏倚類型。在這個案例中存在三個第三方變量的作用類型,分別為:(1)X←Z1→Z3的混沌因子作用機制;(2)Z3←Z2→Y的混沌因子作用機制;(3)Z1→Z3←Z2的對撞因子作用機制。在這個案例中,雖然Z1和Z2都是混沌因子,但是在該案例中我們其實不需要控制任何變量即可實現(xiàn)X到Y(jié) 的第三方路徑隔離。原因是對撞因子Z3的存在已經(jīng)實現(xiàn)了對路徑的隔斷:X←Z1→Z3←Z2→Y。事實上,假如未對第三方變量的類型作深入思考的話,可能會得出“Z3變量是混沌因子”的結(jié)論。因為它既與核心變量X相關(guān)聯(lián)(X←Z1→Z3),也與核心變量Y相關(guān)聯(lián)(Z3←Z2→Y)。但假如我們真的控制了Z3變量,它才會真正成為“混沌因子”。理解M偏倚非常重要,因為它讓我們意識到對第三方變量作用機制進行分類的重要意義,不能僅僅因為某個變量同時與核心變量X和Y都有影響就認為它是混沌因子而加以控制,方向也是重要的考量標準。例如,X為教育,Y為收入,Z1為家庭資本,Z2為關(guān)系網(wǎng)絡(luò),Z3為初職工作。
無論是自然科學(xué)還是社會科學(xué),研究者們在做的全部努力就是試圖發(fā)現(xiàn)和總結(jié)事物背后的因果機制,但混沌因子的存在讓這一過程變得更加艱難。自然科學(xué)家一般借助實驗或準實驗的方法實現(xiàn)對混沌因子的隔離,而受制于可操作性、變量關(guān)系復(fù)雜、研究倫理等諸多條件的限制,社會科學(xué)無法或很難借助實驗方法開展相關(guān)研究,因此,使用統(tǒng)計隔離的方法貌似在實踐上更為可行。其中,控制變量法以其成本低廉、操作方便的優(yōu)勢成為研究者最常使用的方法。本研究在文獻回顧的基礎(chǔ)上概括了控制變量方法的內(nèi)在機制和先在假設(shè),并基于對近十年發(fā)表于社會學(xué)權(quán)威雜志《社會學(xué)研究》上的149篇定量文獻進行的相關(guān)分析,總結(jié)了社會學(xué)量化研究中控制變量方法使用的特征和問題。研究發(fā)現(xiàn),其一,即使是在工具變量、傾向值匹配、雙重差分等高階統(tǒng)計控制方法引入之后,控制變量法仍是社會學(xué)量化研究者使用率最高的統(tǒng)計控制方法。其二,社會學(xué)定量研究在控制變量的使用中存在如下失范趨勢,包括變量納入的濫用化(越來越多)、變量選擇的趨同化(越來越像)和變量分析的淺薄化(忽略內(nèi)在關(guān)系)。定量研究總在被人詬病研究結(jié)論的一般性意義弱,同樣的理論假設(shè),使用不同的數(shù)據(jù)竟然得到截然相反的研究結(jié)論,甚至同樣的數(shù)據(jù),也可能因為變量納入的順序不同造成前后分析結(jié)論的云泥之別,控制變量方法的使用不規(guī)范可能是造成該結(jié)果的重要因素。
我們認為,對第三方變量作用機制的分析、總結(jié)和歸類是規(guī)范控制變量方法使用的首要步驟。根據(jù)Z變量的作用機制我們可以總結(jié)出第三方Z變量的三種基本類型或形式,分別是:形式為X→Z1→Y的中介因子、形式為X←Z2→Y混沌因子和形式為X→Z3←Y對撞因子。在三種Z變量的基本類別中,混沌因子適合并需要采用控制變量方法,以實現(xiàn)研究者準確評估核心變量間真實因果關(guān)系的目的;對撞因子則不適合,強行控制的結(jié)果是造成虛假因果;而對中介因子的控制是否合適需要視具體情況而定,假如是完全中介,控制中介因子的后果是完全阻斷X到Y(jié)的信息傳遞路徑,導(dǎo)致兩者不相關(guān),而如果是部分中介,則可以通過控制中介因子評估X與Y的直接因果效應(yīng)。不能僅僅因為某個變量同時與核心變量X和Y都有影響就認為它是混沌因子而加以控制,方向性是判定混沌因子的重要考量標準,控制中介因子和對撞因子可能不僅沒有降低反而增加了模型的混沌效應(yīng)。
無論如何,社會學(xué)量化研究者需要以謹慎的態(tài)度對待控制變量,不能不假思索的隨意納入控制變量,更不能把控制變量當(dāng)作為了讓數(shù)據(jù)結(jié)果更“漂亮”的工具。[14]在使用控制變量時,研究者需要高標準、嚴要求選擇變量,時刻警惕所選變量是否具備堅實的理論基礎(chǔ),通過分析變量的作用機制識別和篩選出合適的混沌因子并加以控制。關(guān)于如何推進控制變量使用的規(guī)范化,國內(nèi)學(xué)者曹江雨等人給出的“控制變量應(yīng)用決策樹”可供參考。[16]除此之外,在計算機和編程技術(shù)的推動下,計算社會科學(xué)范式逐步得到學(xué)術(shù)界認可,新型計算工具為社會科學(xué)研究者開展科學(xué)研究提供了豐富的手段和方法,如機器學(xué)習(xí)的機器選元和建模功能。發(fā)展到今天,機器學(xué)習(xí)技術(shù)在識別核心變量、剔除無關(guān)變量、篩選混沌因子、辨別工具變量等多個方面具有相當(dāng)優(yōu)勢,并且機器學(xué)習(xí)建模甚至不需要過多考慮理論——體現(xiàn)為算法驅(qū)動。[24]在傳統(tǒng)最小二乘法(OLS)多元回歸模型中,自變量、控制變量、中介變量等的選擇主要仰仗于研究者的理論素養(yǎng)——體現(xiàn)為理論驅(qū)動,但是不可避免地總會引入一些與模型無關(guān)甚至增加模型復(fù)雜性的變量,降低模型解釋力。基于正則化方法(regularization method)的機器學(xué)習(xí)自主建模技術(shù)則可以為研究者提供擬合效果更好地統(tǒng)計模型。和OLS模型相比,正則化模型在回歸系數(shù)上加入了懲罰項(penalty term),可以通過引入偏差來減少方差和降低整體誤差,從而提升模型的預(yù)測精度,[25]代表方法如嶺回歸、Lasson回歸等。