国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

因果推理?

2020-09-03 08:16況琨李廉耿直徐雷張坤廖備水黃華新丁鵬苗旺蔣智超
工程 2020年3期
關(guān)鍵詞:變量樣本文獻

況琨*,李廉,耿直,徐雷,張坤,廖備水,黃華新,丁鵬,苗旺,蔣智超

a College of Computer Science and Technology, Zhejiang University, Hangzhou 310058, China

b Department of Computer Science and Technology, HeFei University of Technology, Hefei 230009, China

c School of Mathematical Science, Peking University, Beijing 100871, China

d Department of Computer Science and Engineering, Shanghai Jiao Tong University, Shanghai 200240, China e Department of Philosophy, Carnegie Mellon University, Pittsburgh, PA 15213, USA

f School of Humanities, Zhejiang University, Hangzhou 310058, China

g University of California Berkeley, Berkeley, CA 94720, USA

h Guanghua School of Management, Peking University, Beijing 100871, China

i Department of Government and Department of Statistics, Harvard University, Cambridge, MA 02138, USA

1. 平均因果效應評估—簡要回顧及展望

機器學習方法已在許多領(lǐng)域取得了巨大成功,但其中大部分都缺乏可解釋性。因果推理是一種強有力的建模工具,可用于解釋性分析,其可能使當前的機器學習能夠做出可解釋的預測。本文回顧了兩個用于估計因果效應的經(jīng)典算法,并討論了實際應用中因果效應評估存在的挑戰(zhàn)。此外,我們提出了一種可能的方法,通過將因果推理與機器學習相結(jié)合來開發(fā)可解釋的人工智能(explainable artificial intelligence, XAI)算法。

1.1. 問題和符號

基于潛在的結(jié)果模型[1],我們研究的問題是如何準確地評估治療變量的因果效應。對于每個樣本i (i = 1, 2,…, n),我們觀測到其治療變量Ti、結(jié)果變量Yi和特征變量Xi?;谥委熥兞康娜≈担═ = 1和T = 0),結(jié)果變量存在兩個潛在結(jié)果Yi(1)和Yi(0)。實際觀測到的結(jié)果Yiobs可表示為:

基于樣本的潛在結(jié)果,我們可以定義治療變量的評估因果效應為:

也可以定義在治療樣本(T = 1)上的平均因果效應為:

為了準確評估因果效應τ和τt,我們假設(shè)無混淆性Ti⊥[Yi(1), Yi(0)]|Xi和重疊性0 < p(Ti= 1|Xi) < 1。

1.2. 兩類因果評估算子

在這里,我們簡要介紹評估因果效應的兩類常用方法,并討論它們面對高維變量的擴展和應用。

1.2.1. 傾向值倒數(shù)加權(quán)

在完全隨機的實驗中,治療隨機分配到樣本,意味著Ti⊥ Xi。然而,在觀測數(shù)據(jù)中,治療Ti是基于樣本特征Xi指定的。為了消除Xi導致的混雜效應,傾向值表示為e(Xi)= (Ti= 1|Xi)來加權(quán)樣本?;趦A向值,τ可以通過以下方式估算:

通過結(jié)合傾向加權(quán)和回歸,我們還可以用雙穩(wěn)健方法估計治療效果[2]。在高維情況下,并非所有觀察到的變量都是混淆變量。為了解決這個問題,Kuang等[3]建議將所有觀察到的變量分為兩部分:混淆變量用于評估傾向值,調(diào)整變量用于減少估計因果效應方差。

1.2.2. 混淆變量平衡

消除混淆偏差的另一種常用的方法是通過直接樣本加權(quán)來平衡治療組(T = 1)和對照組(T = 0)之間混淆變量的分布,并將τt估計為:

式中,樣本權(quán)重W可以通過混淆變量直接平衡[4]學習得到,如下:

在高維情況下,不同的混淆變量可能導致不同的混淆偏差。因此,Kuang等[5]建議聯(lián)合學習混淆變量權(quán)重用于區(qū)分不同的混淆變量,以及樣本權(quán)重用于平衡混淆變量分布,并提出混淆變量區(qū)分性(differentiated confounder balancing, DCB)算法來評估因果效應。

1.3. 存在的挑戰(zhàn)

最近,很多有效的方法用于在觀察性研究中評估因果效應,但如何使這些方法在實踐中變得有用仍然存在許多挑戰(zhàn),主要挑戰(zhàn)表現(xiàn)在以下幾個方面。

1.3.1. 治療變量從二值到連續(xù)

現(xiàn)有算法主要用于評估二值治療變量的因果效應,并在實際中實現(xiàn)良好的性能。但是在許多實際應用中,我們不僅關(guān)心二值治療變量(治療與否)的因果效應,更關(guān)心連續(xù)治療變量的因果效應。

1.3.2. 多維治療變量的相互作用

實際上,治療可以由多個變量及其相互作用組成。在社交營銷中,人們可能對不同廣告策略的綜合因果效應感興趣。在支持治療組合的因果分析方面還需要做更多的工作。

1.3.3. 未觀察到的混淆變量

未觀察到的混淆變量等同于違反非混淆性假設(shè),并且它是不可測試的。控制高維變量可能使非混淆性假設(shè)更加合理,但對傾向值估計和混淆變量平衡提出了新的挑戰(zhàn)。

1.3.4. 重疊性假設(shè)的限制

盡管重疊性假設(shè)是可測試的,但它在實踐中會引起很多問題,包括如何檢測變量分布中是否缺乏重疊,以及如何處理這種缺陷,特別是在高維度環(huán)境中。此外,估計因果效應僅適用于重疊性假設(shè)成立的樣本區(qū)域。

為了解決上述挑戰(zhàn),最近,很多相關(guān)工作和算法被相繼提出,包括連續(xù)治療變量[6]、治療變量的相互作用[7]、未觀測到的混淆變量[8]以及重疊性假設(shè)的限制[9,10]。

1.4. 走向因果和穩(wěn)定的預測

大多數(shù)預測算法缺乏可解釋性,這使得它們在許多實際應用中缺乏吸引力,特別是那些需要決策的應用。此外,大多數(shù)現(xiàn)有機器學習算法都是關(guān)聯(lián)驅(qū)動的,這導致它們在測試數(shù)據(jù)中的性能不穩(wěn)定,因為測試數(shù)據(jù)的分布可能與訓練數(shù)據(jù)不同。因此,開發(fā)可解釋的并對來自未知測試數(shù)據(jù)的分布變化保持穩(wěn)定預測的預測算法非常有用。

假設(shè)因果關(guān)系在數(shù)據(jù)集之間是不變的,那么合理的方法是探索因果和穩(wěn)定預測的因果知識來實現(xiàn)可解釋的穩(wěn)定預測。受到來自因果推理文獻中混淆變量平衡技術(shù)的啟發(fā),Kuang等[11]提出了實現(xiàn)因果和穩(wěn)定預測的可能解決方案。他們提出了一個全局變量平衡正則約束項,以隔離每個預測變量的影響,從而恢復每個預測變量和結(jié)果變量之間的因果關(guān)系,用于指導機器學習算法的學習,實現(xiàn)在未知數(shù)據(jù)集中進行可解釋的穩(wěn)定預測。

總體而言,如何將因果推理與機器學習深入結(jié)合以開發(fā)可解釋的人工智能算法是通往第二代人工智能[12,13]的關(guān)鍵,目前還存在很多問題、挑戰(zhàn)和機遇。

2. 反事實推理的歸因問題

本節(jié)中,原因變量x和結(jié)果變量y都是二值的。

反事實推理是因果推理的重要部分,簡單地說,反事實推理是在事件x已經(jīng)出現(xiàn)(x = 1),并且事件y發(fā)生(y = 1)的前提下,反過來推理如果事件x不出現(xiàn)(x = 0),則事件y不發(fā)生(y = 0)的概率,用公式表示為:

式中,yx=0是反事實推理的一個記號,表示如果x = 0時y的取值,與條件概率P(y|x = 0)是不同的概念。這個公式反映了沒有事件x則沒有事件y的概率,即原因的必要性(x作為y的原因)。這在社會科學或者邏輯科學中稱為歸因問題(attribution problem),在法律學上稱為“若無準則”(but-for criterion)。歸因問題已經(jīng)有了比較長的研究歷史了,但是以往的方法主要是社會科學的方法,如案例調(diào)查、統(tǒng)計分析、實驗設(shè)計等,基本是定性的,且依賴于經(jīng)驗和直覺。隨著大數(shù)據(jù)的出現(xiàn),數(shù)據(jù)驅(qū)動的研究歸因問題的定量化方法出現(xiàn)了,從而使得推理過程更加科學與合理。

歸因問題另一個孿生的說法:在原因x未出現(xiàn)(x = 0),且事件y也未發(fā)生(y = 0)的前提下,如果原因x出現(xiàn),那么事件y出現(xiàn)的概率為:

該公式反映了原因x導致事件y發(fā)生的概率,即原因的充分性。

在基于數(shù)據(jù)的推理研究中,原因的必要性和充分性是因果關(guān)系的不同側(cè)面,盡管在計算公式上有所不同,但其基本精神是一致的。

反事實推理與人類的反思行為相對應,反思是智能活動的重要特征。推理使得人們在采取某個動作時,預測相應的結(jié)果,而反思卻是在已有的結(jié)果面前,思考如何改進結(jié)果。反思雖然不能改變已經(jīng)發(fā)生的結(jié)局,卻可以為以后的行為提供修正,是用過去的知識指導未來行動的數(shù)學模型,只有具備了反思能力的智能才稱得上是真正的智能。

反思在人類的日常生活中也是很重要的,例如,張某和李某同時做了癌癥手術(shù),張某又接受了放化治療,結(jié)果兩人都得到康復。因此張某就會反思,如果不做放化治療,是否也能得到康復,顯然我們不能因為李某的康復,就認為張某不做放化治療也能康復。這類問題在醫(yī)療、法院審判等場合是大量存在的。我們關(guān)心對于具體的個案而言,當結(jié)果已經(jīng)發(fā)生時,其原因究竟是什么。這時,一般的統(tǒng)計數(shù)據(jù),如放療成功率、交通事故率等并不能說明問題。通過歸因推理計算某些原因的必要性在這些領(lǐng)域有著關(guān)鍵的意義[14]。

社會科學研究中有一個很有影響的關(guān)于因果分析的理論,即澳大利亞哲學家Mackie于20世紀60年代提出的INUS理論,INUS是Insufficient but Necessary part of a Unnecessary but Sufficient condition的縮寫,意思是某個充分不必要條件下的必要不充分部分[2]。INUS理論認為,在事實集合X已經(jīng)導致事實y發(fā)生的前提下(即X對于y是充分卻可能不必要的),我們認為{x1, x2, …, xk}?X是y的原因,如果{x1, x2, …, xk}是X的必要卻可能不充分部分。過去這一理論的語義上有很多不確定的成分,所用的方法是定性的,或者經(jīng)驗主義的,沒有可行的算法用于量化計算。而在基于大數(shù)據(jù)的推理技術(shù)出現(xiàn)以后,這一理論賦予了準確的含義,并且可以通過算法進行定量描述。

關(guān)于式(6)的計算形成了反事實推理中的一個重要研究內(nèi)容,目前還沒有通用的計算該公式的方法。在實際問題中,引進一個很多情況下都能滿足的所謂“單調(diào)性”假設(shè):

yx=1≥ yx=0

單調(diào)性的直觀意思是:采取某種措施(x = 1)后的效果y總不會低于未采取措施(x = 0)的效果。例如,在流行病學中,一個人不會在未采取隔離措施(x = 0)時健康(y= 1),在采取隔離措施后(x = 1)反被感染(y = 1)。由于單調(diào)性,式(6)通過推導得到:

式(8)分為兩項,前面一項是在風險統(tǒng)計中熟悉的歸因風險部分(attributable risk fraction),或者也叫額外風險率(excess risk ratio),它反映了在x= 1和x= 0不同的措施下的風險率。而后一項就是特別要提出的混雜影響部分(confounding affect fraction),它反映了其他變量干擾的影響。P(yx=0= 1)稱為do-操作,有時也寫作P(y= 1|do(x= 0))。這是在實驗(操縱)條件下,將其他變量固定,而單獨考察x= 0時y= 1的概率。而條件概率P(y= 1|x= 0)表示自然條件下,x= 0時y= 1的概率(其他變量的值不作限制),P(yx=0= 1)和P(y= 1|x= 0)有著不一樣的含義。在do-操作(實驗條件下)時,我們看到的是x與y之間單純的(因果)關(guān)系。而在自然條件下,y的變化來自兩個方面,一個是x的變化直接引起的,另一個是通過其他變量間接引起的,這個現(xiàn)象稱為混雜。兩者之間的差P(y= 1|x= 0) -P(yx=0=1)表示了混雜的程度?;祀s現(xiàn)象干擾了對于真正原因x的計算。在有些情況下,x的變化的確引起了y的變化,但x可能根本不是y變化的原因(如雞叫之后太陽升起)。雖然我們可以通過科學實驗來排除混雜,以便找出引起y變化的真正原因,但是在許多社會科學問題研究中,包括一些自然科學問題研究中,科學的實驗是很難實施的,甚至是不可能的。我們手里能夠得到的數(shù)據(jù)只有觀察數(shù)據(jù),因此如何從觀察數(shù)據(jù)中識別混雜,以找出真正的因果關(guān)系是人工智能一項重要的研究內(nèi)容。

為了更加具體地說明歸因部分和混雜部分之間的關(guān)系,以及它們對于歸因問題(原因的必要性)所起的作用,我們引用文獻[15]中的例子。在這個例子中,趙某由于疼痛,去藥店買了某種止痛藥服用,結(jié)果死了。官司打到法院,要求藥廠承擔部分責任。藥廠和原告律師分別出具了藥品的檢驗結(jié)果(experimental)和市場調(diào)查結(jié)果(nonexperimental),如表1所示,其中,x= 1表示吃藥,y= 1表示死亡。

藥廠的數(shù)據(jù)來源于嚴格的藥品安全實驗標準,而律師的數(shù)據(jù)來源于市場調(diào)查,在患病的人里面根據(jù)自愿服藥進行統(tǒng)計。藥廠的理由是:藥品已經(jīng)通過檢驗,雖然吃藥的死亡概率有所提高(由0.014提高到0.016),但是比起止痛效果而言,這點提高還是可以接受,并且符合藥品上市的規(guī)定,因此根據(jù)傳統(tǒng)的風險歸因計算(額外風險率),藥廠承擔的責任是:

律師的理由是:藥品的檢驗是在隨機選擇的條件下進行的,并沒有征求受試者本人的意愿,因此實驗是有偏置的(bias),并不符合實際服藥情況,而市場調(diào)查的觀察數(shù)據(jù)則是完全自愿的,未受到任何干預。從數(shù)據(jù)中看出,觀察數(shù)據(jù)與實驗數(shù)據(jù)相差很大。在趙某已經(jīng)死亡的前提下,藥廠的責任(即如果不吃藥就會不死亡的概率)應該按照反事實的公式計算,其結(jié)果為:

因此藥廠應對趙某的死亡負全責。

表面上來看,對于市場調(diào)查的數(shù)據(jù),吃藥而死的只占0.2%,而不吃藥死亡的占了2.8%,非常有利于藥廠(藥廠的風險責任是-13,比實驗數(shù)據(jù)還要好),但是仔細分析后,由于混雜成分占了P(y= 1|x= 0) -P(yx=0= 1) = 0.014,也就是有一半的人,不是因為未吃藥而死亡,是因為其他原因死亡,因此這部分的功勞不能歸因于藥品,由此提升了藥廠的責任。當然,在這個例子中,藥廠的責任是否真的就是100%,以及計算公式的合理性與科學性還有一些質(zhì)疑[16]。但是,這個案例說明在觀察數(shù)據(jù)中存在的混雜變量會干擾真正的因果發(fā)現(xiàn),而如何有效地識別混雜現(xiàn)象是因果推理中的現(xiàn)實問題,也是反事實推理中具有實際意義的問題。

表1 藥品訴訟案例的檢驗結(jié)果和市場調(diào)查結(jié)果

在數(shù)據(jù)科學里,數(shù)據(jù)包括人為生成的數(shù)據(jù)和客觀產(chǎn)生的數(shù)據(jù)。在客觀產(chǎn)生的數(shù)據(jù)中又有實驗數(shù)據(jù)和觀察數(shù)據(jù),前者是在實驗條件下所搜集的數(shù)據(jù),后者是在自然條件下搜集的數(shù)據(jù)。觀察數(shù)據(jù)雖然客觀、易于獲取、成本較低,但是其中的混雜問題往往構(gòu)成了因果推理的障礙[17]。特別在客觀世界中可能還會有未知的變量(即隱變量),這些變量我們未能觀察到,同樣可以對已知的變量發(fā)生作用,這種情況稱為非測定混雜?;蛘哒f,已知變量對于隱變量帶來的非測定混雜可能是敏感的,目前的研究還處于十分初步的階段,希望了解更多細節(jié)的讀者可參考文獻 [18]。

3. Yule-Simpson悖論和替代指標悖論

兩個變量的相關(guān)性可能會由于忽略了第三個變量而發(fā)生非常大的變化,甚至可能從正相關(guān)變?yōu)樨撓嚓P(guān),這個現(xiàn)象稱為Yule-Simpson悖論[19,20]。第三個變量是一個混雜因素。表2給出了一個數(shù)值例子。風險差(risk difference,RD)定義為吸煙組患肺癌比率與非吸煙組患肺癌比率的差值:RD = (80/200) - (100/200) = - 0.10,其值為負。表 3給出了將這400人按照性別分組的結(jié)果??梢钥吹桨葱詣e分組后,發(fā)生了很大變化,男性組和女性組的風險差都變成正的,即0.10。這意味著吸煙分別對男性和對女性都有害,但是吸煙對人類有益。

與相關(guān)性推斷的關(guān)鍵區(qū)別在于,因果推斷必須考慮是否可能存在影響處理變量和結(jié)果變量的公共原因,稱為混雜因素?;祀s因素可能導致推斷因果作用時產(chǎn)生混雜偏倚。在試驗性研究中,我們可以設(shè)計試驗方案,根據(jù)某些變量的水平制定處理或暴露的分配概率;在隨機化試驗中,給每個個體隨機地分配處理和暴露,沒有影響處理分配的變量,因此不存在混雜因素。在觀察性研究中,為了進行因果推斷,需要觀測充分多的混雜因素,或者觀測一個獨立所有混雜因素的工具變量??墒?,利用觀測到的數(shù)據(jù)不能確認是否觀測到了充分多的混雜因素或工具變量。根據(jù)觀察性研究得到的數(shù)據(jù)進行因果推斷時要求一些假定,這些假定是不能用數(shù)據(jù)檢驗的。

表2 吸煙與肺癌的關(guān)系

表3 吸煙與肺癌的關(guān)系:按照性別的分類

當感興趣的終點指標不易觀測時,取而代之觀測一個替代指標(如生物標記物),然后用替代指標的因果作用預測處理未觀測終點指標的因果作用。目前,已經(jīng)有各種選擇和確定替代指標的準則。但是,這些準則難以避免替代指標悖論,即處理對替代指標有正的因果作用,而且替代指標對終點指標也有正的因果作用,但是,處理對終點指標反而有負的因果作用[21]。文獻[21,22]給出了替代指標悖論的數(shù)值例子。這個悖論也質(zhì)疑了科學知識是否對決策分析有用[23]。有一個著名的實例,醫(yī)生知道心律失常是猝死的危險因素,因此,臨床試驗將心律失常作為猝死的替代指標。但是,一些能有效糾正心律失常的藥物,后來發(fā)現(xiàn)不但不能減少猝死,反而導致數(shù)萬人過早死亡[24]。如何選擇和確定替代指標的準則還有待于進一步研究。

Yule-Simpson悖論和替代指標悖論告訴我們:從數(shù)據(jù)得到的結(jié)論可能會被未觀測的混雜因素逆轉(zhuǎn)。這兩個悖論還強調(diào)了獲取數(shù)據(jù)方法的重要性。首先,隨機化試驗是因果推斷的金標準。其次,如果不能采用隨機化試驗,試驗設(shè)計需要試圖平衡處理組和對照組的混雜因素。再次,可以考慮鼓勵試驗方法,隨機地鼓勵一部分人接受處理或避免暴露,使得這些鼓勵能夠改變他們處理和暴露的概率,實際上這種鼓勵試驗方法設(shè)計了一個工具變量“鼓勵”。最后,對于純觀察性研究,我們不得不根據(jù)專業(yè)知識論證因果推斷所要求的假定,并且采用敏感性分析探討偏離這些假定的情況下影響因果推斷結(jié)論的程度。這兩個悖論還指出了三段式推理和傳遞性推理也許不能應用于統(tǒng)計得到的總體結(jié)論。統(tǒng)計得到的總體結(jié)論也許會出現(xiàn)這樣的現(xiàn)象:吸煙對男性和女性都有害,盡管任何一個人不是男人就是女人,但是,吸煙對人也可能有益;藥能糾正心律失常,糾正心律失??梢匝娱L壽命,但是,該藥也許會縮短壽命。

4. 因果發(fā)現(xiàn)CPT方法

如何從觀察數(shù)據(jù)中發(fā)現(xiàn)和分析因果結(jié)構(gòu),近百年來研究者已做了廣泛努力。大致都沿著一個類似的思維方向。首先,對欲觀察的多個變量先假設(shè)一個因果結(jié)構(gòu),它直接或間接地描述這些變量的概率分布,而變量間關(guān)系反映因果關(guān)系。最簡單的情況是一個單變量隨機模型x→y,而復雜情況下為一個有向無環(huán)圖(directed acyclic graph,DAG),并滿足某些約束條件。然后,通過觀察數(shù)據(jù)學習模型中的未知參數(shù),監(jiān)測模型能否最佳描述觀察數(shù)據(jù),并滿足主要的約束條件,從而檢驗模型和因果方向的正確性。常用方法包括Rubin因果模型、結(jié)構(gòu)方程模型、函數(shù)因果模型、非線性可加噪聲模型、線性非正態(tài)無環(huán)模型、后非線性模型、型結(jié)構(gòu)發(fā)現(xiàn)模型[25]和ρ圖方程模型[26]。

最近提出的因果勢理論(causal potential theory, CPT)源于很不同的思維[27]?;貧w物理學,因果關(guān)系被視為由某種勢能引起的內(nèi)在動力學性質(zhì)。環(huán)境U中一對變量x和y之間的因果關(guān)系,并不簡單的是這對變量間的局部關(guān)系,而是全局趨勢在二元關(guān)系上的投影。無需事先假定因果結(jié)構(gòu),從x和y的樣本估計非參數(shù)分布p(x,y|U),再通過吉布斯分布獲得對應的因果勢能E(x,y|U) ∝ -lnp(x,y|U)。發(fā)生在x和y處的事件,源于動力學[x.t,y.t]∝[gx,gy],這里記號。該動力流推向能量最低處或可能發(fā)生事件的區(qū)域。如表4所示,可以通過對gy和x之間以及gx和y之間的獨立性檢驗判定因果方向,或者無向,也可以近似檢驗二階獨立,即相關(guān)系數(shù)是否為0。兩個檢驗可用多元檢驗方法聯(lián)合進行。

估算p(x,y|U)也可不用非參數(shù)方法,而是通過某種參數(shù)模型,還可通過x和y的樣本直接估算[gx,gy],尤其是考慮在環(huán)境U下如何估算p(x,y|U)。進一步發(fā)展是探討估計多個變量分布和多個變量之間的因果結(jié)構(gòu)。下面介紹沿兩個方向的可能發(fā)展。

(1)回顧PC算法[28]。通過獨立和條件獨立檢驗,發(fā)現(xiàn)DAG因果結(jié)構(gòu),其中考慮如何集成表4的CPT檢驗。當PC算法要剪的邊與表4中結(jié)論沖突時,若x,y在第三變量條件下獨立,則不剪邊;即使x,y獨立也不急于剪枝,可判為弱定向。

(2)分三步進行TPC學習[26]。一是用PC算法或上述集成,獲得DAG的Topology。二是考慮變量間相關(guān)系數(shù)ρ進行路徑分析,得到所謂的ρ圖方程組,如文獻[26]中的式(29)和式(33),形成一個變量約束在[-1,+1]間的多項式方程組,然后用Wu的方法來求解所有未知的ρ參數(shù)。若方程組有唯一或有限個解,表示對應的DAG有全局且定量的支撐。若沒有解,則加入新的邊或變量;若有無限多解,則剪掉某邊或變量。三是用CPT(表4)確定每個邊的Casual方向。然后,對于剩下的未能定向的邊,再用類似PC的算法對ν節(jié)點進行處理。

5. 從觀測數(shù)據(jù)中發(fā)現(xiàn)因果關(guān)系

因果性是科學中的一個基本的概念,它在提供解釋、預測以及決策和控制中扮演著重要的角色[28,29]?,F(xiàn)代因果關(guān)系的研究中,有兩類本質(zhì)的問題需要解決。一類大致稱為“因果推斷”——假設(shè)已有部分或完全的因果結(jié)構(gòu),如何估計一個變量對另一個變量的因果影響的大?。筷P(guān)于這類研究,有興趣者可參考文獻[29]及其所引文章。該類問題常假設(shè)因果結(jié)構(gòu)已知,但我們怎樣才能知道因果關(guān)系?為找到因果關(guān)系,傳統(tǒng)的方式是求助于人為干涉或者隨機試驗,但這在很多情況下太昂貴、太費時,甚至現(xiàn)實中不可行。因此,越來越多的人開始重視“因果發(fā)現(xiàn)”——通過分析被動觀測的數(shù)據(jù)找出背后的因果關(guān)系。在過去30年,因果發(fā)現(xiàn)這一領(lǐng)域取得了很大進展,這部分歸功于計算機技術(shù)的進步。這些進步包括收集、存儲大數(shù)據(jù)的能力以及計算速度的提高。在一些領(lǐng)域,我們需要用到天氣衛(wèi)星圖像、核磁功能掃描圖像,或基因表達數(shù)據(jù),變量的個數(shù)可達百萬之多,而且一般情況下用來減小因果假設(shè)搜索空間的背景知識是很少的。若沒有自動搜索,因果發(fā)現(xiàn)的實用性會極其受限。越來越快的計算機,以及大的內(nèi)存和存儲空間,使得因果發(fā)現(xiàn)的自動搜索算法可以處理大規(guī)模的實際問題。

統(tǒng)計學中有一個膾炙人口的說法——因果性蘊含了相關(guān)性,但相關(guān)性并沒有蘊含因果性。我們覺得后半句改成“但相關(guān)性并不直接蘊含因果性”會更公允。事實上,現(xiàn)在已經(jīng)清楚地看到,在適當?shù)募僭O(shè)下,通過分析觀測數(shù)據(jù)可以找出部分或者完整的因果結(jié)構(gòu)信息(通常用有向圖表示)。從20世紀90年代開始,數(shù)據(jù)中的條件獨立性已被用作約束條件來重構(gòu)因果信息。這類基于約束的方法包括PC (Peter-Clark)算法和快速因果推理(fast causal inference, FCI)算法[28]。如果假設(shè)給定系統(tǒng)沒有混淆因子(混淆因子的定義是給定系統(tǒng)中兩個變量的未觀測到的直接的因),那么PC算法的結(jié)果是漸進正確的。即使存在混淆因子,F(xiàn)CI算法的結(jié)果亦漸進正確。只要有可靠的條件獨立檢驗的方法,這類算法可以處理各種因果關(guān)系和數(shù)據(jù)分布,所以有較廣的實用性。但同時,它們的結(jié)果往往并不包含全部的因果信息——它們的輸出結(jié)果是(獨立)等價類。作為一個集合,這個類包含了所有具有同樣的(條件)獨立關(guān)系的因果結(jié)構(gòu)。若假設(shè)沒有混淆因子,還存在結(jié)果漸進正確的基于分數(shù)的方法,這些方法通過優(yōu)化恰當?shù)姆謹?shù)來搜索因果結(jié)構(gòu)。這類方法中,貪婪等價類搜索(greedy equivalence search, GES)可直接在等價類空間進行搜索,因此已經(jīng)得到很多應用。

表4 CPT因果關(guān)系分析的兩條路

在過去13年間,人們更進一步地發(fā)現(xiàn)基于恰當定義的函數(shù)因果模型可用來區(qū)分等價類中不同的因果結(jié)構(gòu)。這個進展歸功于關(guān)于因果機制的額外假設(shè)。函數(shù)因果模型把果變量Y寫成直接的因X和噪聲E的一個函數(shù),數(shù)學描述是Y=f(X,E),這里E和X是相互統(tǒng)計獨立的。如果在f上沒有任何約束條件,那么對于任意兩個給定的變量,其中一個總能被寫成另一個變量以及與之獨立的噪聲的函數(shù)。如此一來,因果的不對稱性就沒法得以體現(xiàn)[30]。幸運的是,如果我們恰當?shù)丶s束函數(shù)類,就能找到X和Y之間的因果方向。這是因為若在錯誤的方向上估計因果模型,估計出的噪聲和假設(shè)的因之間不可能統(tǒng)計獨立,而在正確的方向上它們是獨立的。這些函數(shù)因果模型類包括:

(1)線性非正態(tài)無環(huán)模型(linear non-Gaussian model,LiNGAM)[31]:它假設(shè)因果關(guān)系是線性的,而噪聲是非正態(tài)的。

(2)后非線性模型(post-nonlinear, PNL)[32]:它考慮了因的非線性影響以及經(jīng)常存在的測量過程非線性變形。

(3)非線性可加噪聲模型(additive noise model,ANM)[33,34]:它描述了因的非線性影響并假設(shè)噪聲是可加的。

若對如何用這些方法區(qū)分因果以及如何用它們從多個變量找到因果圖感興趣,可參考文獻[30]。

因果發(fā)現(xiàn)是通過分析觀測到的數(shù)據(jù)實現(xiàn)的。這些數(shù)據(jù)是由背后的因果過程以及觀測和采樣過程產(chǎn)生的。因此,在解決實際問題時,我們需要考慮因果過程以及觀測過程帶來的挑戰(zhàn)。比如,從神經(jīng)心理學中常用的血糖依賴水平(blood-oxygenation-level-dependent, BOLD)時間序列來發(fā)現(xiàn)背后的因果過程并不容易,部分由以下原因?qū)е拢阂蚬换タ赡苁欠蔷€性的;數(shù)據(jù)的采樣率跟背后的動態(tài)過程相比太低了;因果模型中可能存在反饋回路;過程具有非平穩(wěn)性;可能存在混淆因子。在臨床研究中,我們常常有很多缺失數(shù)據(jù)。網(wǎng)上收集的數(shù)據(jù)或者醫(yī)院采集的數(shù)據(jù)一般都有選擇偏差。有些數(shù)據(jù)集里面同時有類別變量(或離散變量)以及連續(xù)變量,這可能讓條件獨立檢驗以及尋找合適的函數(shù)因果模型類別變得困難。近年來這些問題基本都已引起注意,也出現(xiàn)了一些相應的處理方法。

機器學習的發(fā)展已經(jīng)促進了因果發(fā)現(xiàn)的研究,因為機器學習為從數(shù)據(jù)中找尋信息提供了基本工具。另一方面,因果信息描述了過程的性質(zhì),從而提供了關(guān)于數(shù)據(jù)分布的一系列約束條件,而這些約束條件可幫助我們更好地理解和解決數(shù)據(jù)分布有變化時的機器學習問題。特別是若要從異構(gòu)數(shù)據(jù)中學習有用信息,我們很自然地需要學習數(shù)據(jù)異構(gòu)的性質(zhì),并為之建模,而這一步可受益于因果模型。這類問題包括領(lǐng)域適應(或遷移學習)[35]、半監(jiān)督學習,以及從正類和無標記樣本中學習。最近幾年,利用因果模型幫助建立推薦系統(tǒng)以及進行強化學習也慢慢引起重視。

6. 形式論辯在因果推理和解釋中的作用

在本節(jié)中,我們將以概述形式討論論辯為何以及如何在因果推理和解釋中發(fā)揮重要作用。形式論辯通過構(gòu)造論證、比較論證和評估論證來實現(xiàn)推理[36]。論證通常由一個主張以及支持該主張的前提組成。前提可以是觀察信息、假設(shè)或其他論證的中間結(jié)論。主張、前提和它們之間的推理關(guān)系都有可能受到攻擊[37]。當一個論證能抵御所有攻擊時,它才能夠被接受。在人工智能領(lǐng)域中,形式論辯是建??蓮U止推理的一般形式,它為證明和解釋因果關(guān)系提供了一種自然的方式。形式論辯也是機器學習的補充,可用于學習、推理和解釋因果關(guān)系。

6.1. 非單調(diào)性和可廢止性

因果推理是確定因果關(guān)系的過程。因果關(guān)系(即原因和結(jié)果之間的關(guān)系)通常是可廢止和非單調(diào)的。一方面,因果推理規(guī)則通常是可廢止的。因果規(guī)則可以用“c引起e”來表示,其中,e是某種結(jié)果,c則是一個可能的原因。因果聯(lián)結(jié)詞并不是實質(zhì)蘊涵的,而是帶有強度和可能性的可廢止條件式。例如,“轉(zhuǎn)動點火開關(guān)是引起發(fā)動機啟動的原因,但這并不意味著發(fā)動機一定會啟動,因為發(fā)動機啟動還和其他因素相關(guān),如是否有電池,電池是否有電,是否有燃氣,等等”[38]。另一方面,因果推理是非單調(diào)的。這意味著我們只能暫時得到因果關(guān)系,當我們得到更多的信息時,之前所獲得的因果關(guān)系可能會被推翻。通常情況下,c引起e,但是c和d卻不能引起e。例如,一個主體認為轉(zhuǎn)動點火開關(guān)會使電動機啟動,但是當該主體知道電池已經(jīng)沒電了,則不會相信轉(zhuǎn)動點火開關(guān)會引起電動機啟動。在人工智能中,這就是著名的條件問題(qualification problem)。由于一些潛在的相關(guān)因素通常是不確定的,所以進行明確的推理并不有效。因此,當進行因果推理時,人們通常會“跳”到結(jié)論,并在需要時推翻一些結(jié)論。類似地,從證據(jù)到原因的推理是非單調(diào)的。如果一個主體觀察到一些結(jié)果e,則可以假設(shè)一個可能的原因c。由事實到原因的推理是溯因推理。對于某些事實來說,如果沒有更好的解釋,則接受溯因解釋。然而,當產(chǎn)生一些新的解釋時,舊的解釋也可能會被丟棄。

6.2. 高效性和可解釋性

從計算的角度看,單調(diào)性是經(jīng)典邏輯的一個重要性質(zhì)。它意味著利用知識的子集進行局部計算得到的每一個結(jié)論都等于利用所有知識進行全局計算得到的結(jié)論。然而,這一性質(zhì)在非單調(diào)推理中并不成立,因此其計算效率可能非常低。在提高計算效率方面,比起其他一些非單調(diào)形式體系(如缺省邏輯和限制邏輯等),形式論辯已被證明是一個良好候選。其原因在于,在形式論辯中,可以采取分而治之的策略,以及依據(jù)論證圖中節(jié)點的可達關(guān)系,最大限度地利用已有的計算結(jié)果[39]。在人工智能中,因果推理的另一個重要特性是可解釋性。傳統(tǒng)的非單調(diào)形式系統(tǒng)在用于解釋方面并不理想,因為其中所有的證明都并非以人類可理解的方式來表達的。由于解釋的目的是為了讓人們能夠更好地理解,比較和對比論證的認知過程具有十分重要的意義[37]。以辯護和論證對話的方式,論辯通過交換論證的方式提供了這樣的一種途徑[40]。

6.3. 與機器學習方法的聯(lián)系

在可解釋人工智能中,包含兩個部分:可解釋模型和解釋接口。后者包括直接來自模型的自反解釋和來自對用戶信念進行推理的理性解釋。為了實現(xiàn)這個目的,一種自然的方式是將論辯與機器學習結(jié)合起來。其中,知識通過機器學習獲得,而推理和解釋則通過論辯來實現(xiàn)。由于論辯提供了一種在不一致情景下進行各種推理的一般形式,并且可以與概率和模糊性等一些不確定性度量相結(jié)合,因此它能夠靈活地對從數(shù)據(jù)中得到的知識進行建模。當機器學習一些特性并做出解釋時,例如,“這張臉很生氣,因為它與這些例子相似,而與另一些例子不同”,這就是一個論證,它可能會受到其他論證的攻擊。并且,要衡量類似“憤怒”這樣的詞所描述的不確定性,人們可以選擇使用可能性論辯或概率論辯[41]。不同的解釋可能相互沖突。例如,在某些情況下,我們可能會采用支持某個選擇的特定示例或故事,從而拒絕對另一基于分析、案例和數(shù)據(jù)的次優(yōu)選擇。通過使用論辯圖,可以方便地對這類支持和攻擊關(guān)系進行建模,從而計算不同選擇下沖突論證的狀態(tài)。

7. 復雜實驗中的因果推斷

因果推斷的潛在結(jié)果框架始于一個假想的實驗,在該實驗中,實驗者可以將每個樣本分配到多個處理水平。每個樣本都有與這些處理水平相對應的潛在結(jié)果, 而因果作用就是對同一組樣本之間潛在結(jié)果的比較。這種方法有時被稱為實驗主義者的因果推斷方法[42]。讀者可進一步參考文獻[43-46]。

7.1. 隨機因子實驗

Neyman [47]首先用數(shù)學嚴格討論了如下的隨機化模型。一個實驗有n個樣本,實驗者隨機分配(n1, …, nJ)個樣本接受處理水平(1, …, J),其中n =。樣本i有潛在結(jié)果{Yi(1), …, Yi(J)}:如果樣本i接收處理水平j,那么Yi(j)是對應的結(jié)果?;跐撛诮Y(jié)果,我們可以定義因果作用。比如,干預水平 j和 j′之間的比較為{Yi(j)-Yi(j′)}。如果樣本i實際接收到了處理水平j,則定義二值指標Ti(j)為1,用Ti(j)Yi(j)表示樣本i的觀測結(jié)果。根據(jù)觀測數(shù)據(jù){Ti(1), …, Ti(J)}ni=1,Neyman [47]建議使用作為τ(j, j′)的估計量。他證明τ^(j, j′)是無偏的,方差為S2(j)/nj+ S2(j′)/nj′- S2(j -j′)/n,其中S2(j)、S2(j′)和S2(j - j′)是Yi(j)、Yi(j′)和Yi(j) -Yi(j′)的樣本方差。注意,所有潛在結(jié)果都是固定的,這個問題的隨機性來自于二值的處理指標。Neyman [47]進一步討論了方差估計和大樣本置信區(qū)間等問題。

我們可以將Neyman [47]的框架推廣到一個更廣泛的因果作用表示個體作用,而cj是滿足= 0的比較矩陣。只要適當選擇比較矩陣,這個定義就包含了方差分析[48]和因子實驗[49,50]。此外,只要適當選擇樣本子集,這個定義也包含了亞組分析、事后分層[51]和同儕效應[52]。文獻[53]提供了在這種框架下漸近統(tǒng)計推斷所需的中心極限定理的一般形式。文獻[54]討論了裂區(qū)設(shè)計,文獻[55]討論了更廣的實驗設(shè)計。

7.2. 協(xié)變量在分析實驗數(shù)據(jù)中的作用

Neyman [47]的隨機化模型也允許在沒有強建模假設(shè)時使用協(xié)變量提高估計精度。在處理為二值的情況下,對于樣本i,用{Yi(1), Yi(0)}表示潛在結(jié)果,Ti表示二值處理變量,xi表示協(xié)變量。平均因果作用的一個無偏估計量為[56]建議使用協(xié)方差分析以提高估計精度;也就是用Yi對Ti和xi擬合一個最小二乘,然后使用Ti的系數(shù)去估計τ。在文獻[47]的模型下,文獻[57]證明Fisher的協(xié)方差分析的估計并不一定好,它的估計精度甚至比τ^還低,而且最小二乘法可能給出不相合的方差估計。文獻[58]提出一個簡單的修正:第一步,中心化協(xié)變量,使平均值為零,x = 0;第二步,用Yi對(Ti, xi, Ti× xi)擬合一個最小二乘,然后使用Ti的系數(shù)去估計τ;第三步,使用Eicker-Huber-White方差估計值[59-61]。在大樣本下,文獻[58]的估計至少和τ^一樣有效,并且Eicker-Huber-White方差估計是τ^真實方差的保守估計。

文獻[62]將分析推廣到高維協(xié)變量,并用文獻[63]提出的最小絕對收縮和選擇算子(least absolute shrinkage and selection operator, ASSO)替換了最小二乘。文獻[64]研究了文獻[58]中最小二乘估計值的理論邊界,考慮了協(xié)變量個數(shù)可能發(fā)散的情形。文獻[65]用Yi在(Ti, xi, Ti×xi)上的最小二乘擬合來研究處理作用的異質(zhì)性。文獻[66]討論了因子實驗中的協(xié)變量調(diào)整,而文獻[67]討論了更廣的實驗設(shè)計中的協(xié)變量調(diào)整。

7.3. 協(xié)變量在實驗設(shè)計中的作用

分析人員可以使用協(xié)變量提高估計效率。與之對偶,設(shè)計人員可以用協(xié)變量改善協(xié)變量平衡,從而提高估計效率。文獻[68]暗示了重新隨機化的思想,也就是只接受那些能確保協(xié)變量平衡的隨機分配??紤]一個特殊的例子:我們接受隨機分配當且僅當且a > 0,并且是一個預定常數(shù)時。文獻[69]正式地討論了這個重新隨機化在處理組和對照組有相同樣本量,協(xié)變量為正態(tài)分布,且處理作用為常數(shù)時的統(tǒng)計性質(zhì)。文獻[70]在沒有這些假設(shè)的情況下研究了τ^的漸近理論。文獻[70]證明τ^具有一個非正態(tài)的極限分布, 并且它在重新隨機化下比在完全隨機化下更接近于τ。文獻[70]中的結(jié)果表明當a≈ 0時,重新隨機化下τ^的漸近方差與完全隨機化下[58]提出的估計量的漸近方差幾乎一樣。因此,我們可以把重新隨機化看作是回歸調(diào)整的對偶。

文獻[71]提出一個能反映不同協(xié)變量重要性的重新隨機化方案,文獻[70]分析了該方案的漸近性質(zhì)。文獻[72,73]將重新隨機化擴展到因子實驗,文獻[74]提出了序貫重新隨機化。

7.4. 結(jié)語

受到文獻[47]的啟發(fā),這一節(jié)重點回顧了隨機實驗中估計量的重復采樣性質(zhì)。另外,在所有的樣本都滿足Yi(1)= … = Yi(J)的強零假設(shè)下,對于任何檢驗統(tǒng)計量和任何實驗設(shè)計,F(xiàn)isher隨機化檢驗都是在有限樣本下精確的假設(shè)檢驗[46,75,76]。文獻[77,78]提出了在隨機化檢驗中使用協(xié)變量調(diào)整的方法,文獻[69]提出用隨機化檢驗分析重新隨機化。文獻[79-81]將隨機化檢驗應用于有干擾的實驗。文獻[48,50,82]討論了隨機化檢驗在弱零假設(shè)下的性質(zhì)。文獻[83-85]提出通過反轉(zhuǎn)一系列隨機化檢驗,以構(gòu)建準確的置信空間。文獻[86]從缺失數(shù)據(jù)的角度討論了不同的統(tǒng)計推斷框架。

8. 觀察性研究中的工具變量和陰性對照方法

在很多科學研究中,人們最終的目的是評價一種處理或者暴露因素對一種結(jié)果或者響應變量的因果作用。自文獻[75]提出隨機化試驗以來,其成為一種非常有效和廣泛使用的評價因果作用的方法。但是,在很多研究中,由于倫理、經(jīng)濟或者不依從因素的制約,隨機化試驗并不適用或者代價太高;反而,在這樣的研究中,觀察性研究提供了更重要的數(shù)據(jù)來源和研究方法。不過,在觀察性研究中,推斷因果作用仍然面臨很多挑戰(zhàn)。最常見的問題是有混雜因素存在?;祀s因素是指同時影響關(guān)心的處理和結(jié)果的因素或協(xié)變量。如果混雜因素被觀測到,可以使用標準的統(tǒng)計推斷方法做調(diào)整。然而,如果有混雜因素未被觀測到,這些標準的調(diào)整方法通常失效,甚至會導致悖論。著名的Yule-Simpson悖論[19,20]就是一個例子。關(guān)于混雜的概念,文獻[87,88]提供了很好的文獻回顧。關(guān)于已觀測混雜因素的調(diào)整,文獻[2,89,90]討論了常用的調(diào)整方法,例如,傾向得分和逆概率加權(quán),回歸調(diào)整和雙穩(wěn)健方法。本文著重回顧兩種針對未觀測混雜因素的調(diào)整方法,一種是經(jīng)典的工具變量方法;另一種是近期引起人們重視的陰性對照方法。本文使用X和Y分別表示關(guān)心的處理和結(jié)果變量,U是未觀測的混雜變量。為了符號上的方便,忽略已觀測的混雜變量,當然,本文的結(jié)果在條件為已觀測的混雜變量時仍然成立。使用小寫的英文字母表示相應變量的一個觀測值,例如,y表示Y的一個觀測值。

工具變量方法在1928年由文獻[91,92]提出,現(xiàn)在,該方法已成為經(jīng)濟學、社會學、流行病和生物醫(yī)學等學科中的觀察性研究的重要方法。除了關(guān)心的處理和結(jié)果變量,這種方法還需要額外觀測一個工具變量,用Z表示,其需要滿足如下條件:

(1)Z對Y沒有作用:Z⊥Y | (X, U)(無直接作用);

(2)Z和U獨立:Z ⊥U(獨立性);

(3)Z和X相關(guān):Z ⊥X(相關(guān)性)。

即使在這三個假定下,也只能得到X對Y的因果作用的上下界,而不能唯一確定因果作用,也就是不能識別[93,94]。為了識別因果作用,需要額外的信息或者模型假定。結(jié)構(gòu)方程模型[91,95]和結(jié)構(gòu)均值模型[96]是常用的模型。這兩個模型通過假定因果作用的同質(zhì)性,即在不同個體上的因果作用是常數(shù),從而得到識別性[97]。一個例子是常見的線性模型(Y|X, U) = α + βX +U,實際上假定了在所有個體上的因果作用都是β;根據(jù)這個模型可以得到人們熟知的工具變量識別公式βiv= σsy/σxs。除了同質(zhì)性的模型假定,在一些實際問題中可以假定單調(diào)性。例如,在一些臨床試驗中,Z表示處理分配,X表示個體實際接受或者采取的處理,由于有不依從存在,X可能和Z不完全相同,但是有時可以合理地假設(shè)Z對X的作用是單調(diào)的:Xz=1≥ Xz=0,即沒有個體會采取與其被分配的相反的處理。這里,XZ表示在處理分配Z = z下潛在接受的處理。在單調(diào)性假定下,可以識別依從組的因果作用:(CACE) = E(Y1-Y0|X1= 1, X0= 0) [98]。此外,在一些應用場景,比如統(tǒng)計遺傳學中,當有多個或高維工具變量時,如何選擇工具變量變得很重要[99,100]。

在實際研究中,尋找一個滿足如上三條工具變量假定的變量并不容易,而且工具變量方法對這三條假定都非常敏感。如何驗證工具變量假定也是一個重要話題,例如,使用工具變量不等式做檢驗,見文獻[94,101]。如果工具變量假定不成立,因果作用通常不可識別,工具變量方法也有偏,在這種情況下,求因果作用的界和敏感性分析方法更加穩(wěn)健[102,103]。

由文獻[104-106]提出和建立的基于陰性對照的因果推斷方法提供了一個新的觀察性研究的工具,也提供了一個補救工具變量可能失效的方法。陰性對照變量分為兩類:陰性對照結(jié)果和陰性對照暴露,分別用W和Z表示,它們分別是一個輔助的結(jié)果變量和暴露變量,分別需要滿足如下的條件:

陰性對照暴露Z可以看作工具變量的推廣,其滿足對Y無直接作用的假定,但不必和未觀測的混雜U獨立,這一點不同于工具變量。給定一對陰性對照暴露和結(jié)果變量,在一定的正則性條件下,文獻[104,106]證明了平均因果作用的非參數(shù)識別性,即不需要假定參數(shù)化的模型。這里,作為示例,考慮線性模型E(Y |X, U) = α +βX +U,并假定E(W|U)也是關(guān)于U的線性模型,那么,β的陰性對照識別結(jié)果為:

這個識別公式也適用于是工具變量的情況,因為,如果Z是一個工具變量,那么Z⊥U且σzw= 0。因此,工具變量方法可以看作陰性對照方法的特例,當Z不滿足工具變量的假定時,使用陰性對照結(jié)果W來消除Z造成的偏差。但是,陰性對照比工具變量需要的假定更弱,在實際中例子很多。例如,文獻[107,108]回顧了觀察性研究中的許多陰性對照的實例;文獻[105,109]還指出,在很多時間序列研究中,陰性對照成立。例如,在空氣污染研究中,當前時間的空氣污染不影響前一段時間的公共衛(wèi)生狀況,而后一段時間的空氣污染也不影響當前時間的公共衛(wèi)生狀況,即公共衛(wèi)生狀況對空氣污染沒有反饋作用。在這種情況下,前一段時間的公共衛(wèi)生狀況和后一段時間的空氣污染可以分別作為陰性對照結(jié)果和陰性對照暴露變量。

文獻[104-106]提出的陰性對照方法需要兩個陰性對照變量,當只有一個陰性對照結(jié)果或者一個陰性對照暴露時,因果作用不可識別。

在這種情況下,文獻[107,109,110]研究了使用單個陰性對照檢驗混雜是否存在和減小偏差的方法,但不能識別因果作用。當陰性對照變量很多時,文獻[111,112]通過因子分析的方法消除偏差,但需要依賴嚴苛的參數(shù)化模型假定。

總之,觀察性研究中如何處理混雜因素仍然是一個難題。盡管使用工具變量和陰性對照等輔助變量方法可以大幅提高因果作用的識別性,但是工具變量和陰性對照的假定不能通過觀察數(shù)據(jù)檢驗,而需要先驗知識或者額外的研究確認。把先驗知識和觀察數(shù)據(jù)結(jié)合起來推斷因果作用是觀察性研究的一個可行的方向?,F(xiàn)代大數(shù)據(jù)為因果推斷提供了非常廣闊的研究場景,但是,大數(shù)據(jù)通常都是觀察性數(shù)據(jù),而不是試驗數(shù)據(jù)。因此,在大數(shù)據(jù)研究中處理混雜因素很重要。如何把先驗知識和大數(shù)據(jù)結(jié)合起來更有效地推斷因果作用需要更深入的研究。

9. 有干擾下的因果推斷

個體處理穩(wěn)定性假設(shè)是傳統(tǒng)的潛在結(jié)果模型中的一個重要假設(shè),它假設(shè)個體之間是沒有干擾的[76]。但是,在很多試驗和觀測性研究中,個體之間會相互影響,從而造成了個體間的干擾。例如,在教育學或者社會學研究中,參與培訓計劃的學生會通過課堂外的交流影響沒有參與的學生[113,114]。在流行病學中,傳染病的預防措施會使得人們被傳染的概率降低,因此即便沒有接受預防的人群也會受到影響[115,116]。在這些研究中,個體接受到的處理不僅會對自己的結(jié)果變量有直接作用,還會對其他個體的結(jié)果變量有溢出作用。在實際問題中,直接作用和溢出作用有著重要的科學意義和社會意義,它們能幫助我們更好地理解因果作用的機制,從而能對政策或者方案的實施有指導作用。

在干擾存在的時候,一個個體的潛在結(jié)果的數(shù)量會隨著整個樣本中個體的數(shù)量呈指數(shù)增長。因此,在對干擾的結(jié)構(gòu)沒有約束時,我們無法得到直接和溢出作用的估計。有許多文獻對干擾下的因果作用的估計進行了研究[117],其中一個重要的方向是將干擾限制在一些不重疊的小群體中,假設(shè)不同群體之間的個體沒有干擾[52,114,118-122]。這種假定被稱為部分干擾假定[114]。近來,許多研究者試著減弱這個假定去處理更一般的干擾結(jié)構(gòu)[123-126]。在有干擾的情況下,因果作用的方差估計會變得更加困難。文獻[118]指出,即便在部分干擾假定下,直接和溢出作用的估計依然是很困難的。在不加任何模型假設(shè)的條件下,一個能得到有效的方差估計的方法是假設(shè)個體的結(jié)果變量只依賴于自己接受到的處理和其他個體接收到的處理的某個函數(shù)。例如,個體的結(jié)果只依賴于自己是否接受了處理,以及有多少個其他個體接收到了處理。

另外一個方向的研究側(cè)重于如何根據(jù)干擾的結(jié)構(gòu)去設(shè)計試驗估計因果作用。在部分干擾的假定下,文獻[118]提出兩階段隨機化試驗去估計直接和溢出作用。在更復雜的干擾結(jié)構(gòu)下,研究者提出了各種各樣的試驗設(shè)計去得到因果作用的點估計和方差估計[127-129]。

對于干擾情況下的統(tǒng)計推斷,文獻[130,131]依賴于關(guān)于潛在結(jié)果的模型,文獻[79]對沒有溢出作用的零假設(shè)提出了一個條件隨機化檢驗的方法。文獻[80]將這個方法推廣到了一大類關(guān)于焦點個體的假設(shè)檢驗中?;谶@些方法,文獻[132]提出了得到有效的條件檢驗的一般程序。

雖然研究者對個體間的干擾提出了許多方法,但是這方面的研究依然存在著很多挑戰(zhàn)。首先,個體干擾下的極限性質(zhì)還不夠完善。文獻[133]研究了均值差估計量在有限制的干擾假定下的一致性。文獻[134]在部分干擾假定和分層干擾的假定下得到了直接作用和溢出作用的中心極限定理。但是在一般的干擾結(jié)構(gòu)下,即便是最簡單的均值差估計量,極限性質(zhì)都是不清楚的。其次,在有復雜數(shù)據(jù)時,個體間的干擾會變得更加難以處理。文獻[120,121,135,136]考慮了干擾情況下的不依從問題,文獻[137]研究了干擾情況下生存時間數(shù)據(jù)的分析方法。但是,對于其他類型的復雜數(shù)據(jù),比如缺失數(shù)據(jù)和測量誤差還沒有方法來進行處理。最后,絕大部分的文獻關(guān)心的是直接作用和溢出作用,但是個體間的干擾在其他的問題中也會存在,比如中介分析(見文獻[138])和縱向數(shù)據(jù)分析。在這些問題中,我們關(guān)心的因果作用是不一樣的。因此,我們需要將這些問題中的一些常用方法進行推廣去處理個體間的干擾。

Compliance with ethics guidelines

Kun Kuang, Lian Li, Zhi Geng, Lei Xu, Kun Zhang,Beishui Liao, Huaxin Huang, Peng Ding, Wang Miao, and Zhichao Jiang declare that they have no conflict of interest or financial conflicts to disclose.

猜你喜歡
變量樣本文獻
Hostile takeovers in China and Japan
抓住不變量解題
用樣本估計總體復習點撥
也談分離變量
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
推動醫(yī)改的“直銷樣本”
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing
隨機微分方程的樣本Lyapunov二次型估計
村企共贏的樣本