劉禮 吳飛 李廉
摘 要:因果和因果關(guān)系是人類理解和描述自然與社會現(xiàn)象,構(gòu)建科學(xué)知識體系的核心概念,近年來頻頻出現(xiàn)在人工智能的教材中,在數(shù)據(jù)分析、機(jī)器學(xué)習(xí)、人工智能等研究領(lǐng)域以及計(jì)量經(jīng)濟(jì)學(xué)、健康醫(yī)學(xué)、政策制定等應(yīng)用領(lǐng)域受到越來越多的關(guān)注。但是與其他教學(xué)內(nèi)容有所不同的是,學(xué)習(xí)因果關(guān)系會更多地涉及哲學(xué)層面一些基本內(nèi)容,從不同的基本原則和思維定式出發(fā),對于因果關(guān)系會有不同的理解和結(jié)論,從而形成不同的流派。因此在因果關(guān)系的教學(xué)中,必須清晰地闡明所約定的先驗(yàn)性原則和假設(shè)。也就是說,需要關(guān)注其中明確的思維取向。目前在研究生和本科生教學(xué)中所采用的相關(guān)教材大多包含以圖靈獎獲得者Pearl為主發(fā)展起來因果分析理論和技術(shù)。本文主要根據(jù)Pearl的兩本著作Causal Inference in Statistics, A primer和Model, Reasoning, and Inference (Second Edition)的內(nèi)容,對于因果關(guān)系學(xué)習(xí)中需要注意的思維形式和基本假設(shè),以及與此相關(guān)的一些概念問題,進(jìn)行較為深入的討論、解釋和評論,澄清其中容易混淆的地方,以此掌握好因果關(guān)系分析的理論實(shí)質(zhì)和計(jì)算要義。
關(guān)鍵詞:因果與統(tǒng)計(jì);實(shí)驗(yàn)與觀察;干預(yù)操作;因果時(shí)序性;結(jié)構(gòu)因果模型;反事實(shí)推斷;非完美實(shí)驗(yàn)數(shù)據(jù);責(zé)任歸因
當(dāng)前數(shù)據(jù)驅(qū)動的因果分析和因果推斷成為學(xué)術(shù)界的研究熱點(diǎn),其中既有人工智能研究中對于知識利用和知識生成的需要,也有對機(jī)器學(xué)習(xí)的結(jié)果做出因果解釋的需要,這些研究成果推動了計(jì)量經(jīng)濟(jì)學(xué)、健康醫(yī)學(xué)、政策制定等社會與人文科學(xué)等領(lǐng)域的發(fā)展。從統(tǒng)計(jì)數(shù)據(jù)中得出因果關(guān)系結(jié)論是現(xiàn)代科學(xué)研究的核心之一,Pearl等人從20世紀(jì)末開始提出的基于數(shù)據(jù)的因果演算受到了廣泛的重視和逐漸的普及[1-2],并且已經(jīng)進(jìn)入教材,成為人工智能領(lǐng)域的重要學(xué)習(xí)內(nèi)容。但是因果關(guān)系的學(xué)習(xí),有很多地方涉及對于科學(xué)研究的基本規(guī)范、思維取向以及哲學(xué)層面有關(guān)人類如何理解自然和社會現(xiàn)象的基本模式。不同的規(guī)范和思維定式會產(chǎn)生對于因果關(guān)系的不同理解,從而形成不同的流派。在這一方面,高等教育出版社的《人工智能導(dǎo)
論:模型與算法》(該教材對應(yīng)的MOOC入選首批國家級線上一流課程),從“知其然、且知其所以然”角度介紹因果分析中“引起和被引起”的關(guān)系,揭示了因果之間的深刻內(nèi)在聯(lián)系,以及在人工智能中的作用和地位。Pearl等在2016年出版的Causal Inference in Statistics,A primer(中譯本:《統(tǒng)計(jì)因果推理入門》,高等教育出版社),闡述了通過觀察和實(shí)驗(yàn)數(shù)據(jù)分析和計(jì)算因果關(guān)系的基本方法,對于因果關(guān)系的相關(guān)定義和原則,以及哲學(xué)層面的理解做了較為詳細(xì)的闡述。因此在學(xué)習(xí)中,對于如何描述因果、因果關(guān)系以及通過計(jì)算手段挖掘潛在的因果關(guān)系,需要建立正確的思維取向和假設(shè)約定,這是在因果關(guān)系的教學(xué)中需要十分注意的地方。
從教育學(xué)的角度,卡耐基梅隆大學(xué)和印第安納大學(xué)所進(jìn)行的面向教育的實(shí)驗(yàn)分析表明:學(xué)習(xí)習(xí)慣、教育手段和教育資源與學(xué)習(xí)效果改善之間存在一定的因果關(guān)系。我們知道,在教與學(xué)過程中,因和果之間關(guān)系由于學(xué)習(xí)主體(即學(xué)習(xí)者)的引入而變得異常復(fù)雜,如何應(yīng)用因果模型來洞悉學(xué)習(xí)過程中混淆變量(confounder)和干預(yù)變量(treatment)以及應(yīng)用合理的控制手段對學(xué)習(xí)效果進(jìn)行評價(jià),準(zhǔn)確界定針對個(gè)體的研究結(jié)論推及總體的泛化能力,形成可靠的知識和經(jīng)驗(yàn)積累,找出影響教學(xué)效果的真正原因,做到“對癥下藥”,是構(gòu)建循證教育學(xué)(Evidence-based education)的基礎(chǔ)理論和方法,成為推動教育評價(jià)科學(xué)化發(fā)展的重要原生動力。
由此看出,無論是對于自然和社會現(xiàn)象的研究中引入因果關(guān)系,還是在教學(xué)本身采用因果的觀點(diǎn)分析相應(yīng)的數(shù)據(jù),以更好地解讀教學(xué)效果和實(shí)現(xiàn)教學(xué)改進(jìn),都有著重要的意義。為了加深對于因果和因果關(guān)系學(xué)習(xí)過程中問題的剖析和理解,本文選取了其中8個(gè)有代表性的概念問題,通過對于這些問題的討論,闡述因果關(guān)系學(xué)習(xí)內(nèi)容中體現(xiàn)的哲學(xué)觀念、人類認(rèn)知模式,以及人工智能與人類智能之間的相似與不同,給出相應(yīng)的闡述、解釋和評論,這些問題如不能梳理清楚,有可能誤導(dǎo)讀者對于該理論的正確理解,以至于產(chǎn)生不適當(dāng)?shù)膽?yīng)用。
一、因果關(guān)系與統(tǒng)計(jì)關(guān)系
Pearl一再強(qiáng)調(diào)因果與統(tǒng)計(jì)之間有著本質(zhì)的區(qū)別,然而因果分析與推斷仍然是建立在統(tǒng)計(jì)學(xué)的語境上。根據(jù)Pearl的看法,統(tǒng)計(jì)學(xué)主要研究數(shù)據(jù)中所蘊(yùn)含變量的聯(lián)合分布,以及聯(lián)合分布有關(guān)的參數(shù)特征、分布密度、存在性和可檢驗(yàn)性。與之不同的是,因果關(guān)系研究的是聯(lián)合分布中變量的變化規(guī)律,即當(dāng)聯(lián)合分布式中一個(gè)變量發(fā)生變化時(shí),如何影響其他變量。簡單地說,就是有關(guān)分布的靜態(tài)性質(zhì)與動態(tài)性質(zhì)的區(qū)別。可見,傳統(tǒng)統(tǒng)計(jì)學(xué)不能有效處理因果關(guān)系。Pearl給出了有關(guān)因果關(guān)系的一些定義(不止一個(gè)),例如圖形化的定義或變量之間條件獨(dú)立性的定義等,這都可以作為不同的角度來理解因果關(guān)系。建立因果分析基本操作的基本計(jì)算模式,這是當(dāng)前對于因果關(guān)系最為數(shù)學(xué)化的描述,也是在應(yīng)用中與現(xiàn)象和常識解釋最為契合的。但是其中所需要的因果圖(DAG)的構(gòu)造,涉及的一些先驗(yàn)假設(shè),對于這些假設(shè)的認(rèn)可,不僅涉及對于具體問題的理解,也涉及一些哲學(xué)層面的考慮,因此仍然存在某些不確定性,從而導(dǎo)致在同樣的數(shù)據(jù)集合下,對于因果關(guān)系可能會有多種解釋。最早試圖定義因果關(guān)系的是休謨(David Hume,1711—1776),他用下面的三條定義了X是Y的原因:(1)X發(fā)生在Y之前;(2)X發(fā)生必導(dǎo)致Y發(fā)生;(3)X不發(fā)生則Y也不發(fā)生。這個(gè)定義看起來十分自然,也符合我們的常識理解,但是卻不嚴(yán)格,可以舉出符合該定義,但不是因果關(guān)系的例子,也可以舉出不符合該定義,但卻是因果關(guān)系的例子。為了尋求更為科學(xué)和嚴(yán)謹(jǐn)?shù)囊蚬x,一些科學(xué)家例如格蘭杰(Clive W. Granger)、賴辛巴赫(Hans Reichenbach)、麥基(John E. Mackie)、魯賓(Donald Rubin)、珀?duì)枺↗udea Pearl)等持續(xù)不懈地探索,給出了各具特點(diǎn)的、從不同角度闡述因果和因果關(guān)系的定義。就目前狀況而言,尋找一個(gè)與人類常識符合的因果關(guān)系普適的定義也許還沒有出現(xiàn),因?yàn)橐蚬P(guān)系所具有的人文屬性和復(fù)雜內(nèi)涵,嚴(yán)格的數(shù)學(xué)化定義因果關(guān)系是非常困難的,要得到大家公認(rèn)的定義看起來更是需要繼續(xù)做出深入的研究。
“因果以及相關(guān)的概念(例如隨機(jī)化、混雜、干預(yù)等)不是統(tǒng)計(jì)概念”,這是貫穿Pearl因果分析思想的一條基本原理,Pearl稱之為第一原理。同時(shí)Pearl還進(jìn)一步解釋道:“如果混雜因素是一個(gè)統(tǒng)計(jì)學(xué)概念,我們就可以從非實(shí)驗(yàn)數(shù)據(jù)的特征中找出混雜因素,對這些混雜因素進(jìn)行校正,得到無偏差的因果效應(yīng)估計(jì)。這違反了我們的黃金法則——在任何因果結(jié)論背后一定有某種未經(jīng)檢驗(yàn)的因果假設(shè)?!?/p>
因果分析或者因果推斷,當(dāng)前有各種學(xué)派,從最保守的到最寬容的,最為保守的只相信建立在嚴(yán)格的動機(jī)—效果模型(或認(rèn)為是這樣的模型)上的推斷,對于數(shù)據(jù)和假設(shè)有近似苛刻的要求。有些學(xué)派認(rèn)為因果推斷必須借助隨機(jī)化的實(shí)驗(yàn),或者準(zhǔn)隨機(jī)化的實(shí)驗(yàn)(包括自然實(shí)驗(yàn)),并在一些強(qiáng)限制的假設(shè)下進(jìn)行數(shù)據(jù)處理。更為寬容的屬于Pearl的學(xué)派,認(rèn)為通過適當(dāng)?shù)挠^察和必要的假設(shè)可以從關(guān)聯(lián)中識別因果關(guān)系。再放寬一步,認(rèn)為人類在日常生活中進(jìn)行因果推斷很少訴諸實(shí)驗(yàn),因此計(jì)算機(jī)也可以基于這樣的原理設(shè)計(jì)因果推斷算法,即推斷完全可以借助經(jīng)驗(yàn)或者純數(shù)據(jù)進(jìn)行。盡管這些不同的觀點(diǎn)對于因果關(guān)系的看法有分歧,但是有一點(diǎn)是共通的,即都不認(rèn)為單靠統(tǒng)計(jì)學(xué)可以解決因果問題[3]。
因果關(guān)系和統(tǒng)計(jì)之間的區(qū)別用決策理論可以說得更清楚。決策理論中有兩類,前者稱為求果問題(forward),后者稱為溯因問題(reverse)。
對于前一類問題,無法采用統(tǒng)計(jì)公式P(Y|X,Z)
來解決。因?yàn)樵摴矫枋觥霸诃h(huán)境Z下,同時(shí)采取了策略X之后,Y的取值”。但是,決策問題關(guān)心的是在當(dāng)前環(huán)境Z下,如果采取措施X,產(chǎn)生效果Y的概率,因此正確的寫法應(yīng)該是P(Y|do(X),Z),這是一種干預(yù)操作。統(tǒng)計(jì)公式表示了觀察情形,被動地看見的效果(seeing),而干預(yù)公式表示主動的作為,即施加策略后產(chǎn)生的效果(doing),兩者是不一樣的。
二、實(shí)驗(yàn)研究與觀察研究
Pearl的因果分析框架非常強(qiáng)調(diào)區(qū)別實(shí)驗(yàn)研究與觀察研究,并且在多種場合說明由于混雜因素的存在,實(shí)驗(yàn)研究與觀察研究的結(jié)果會非常不一致,從觀察性的數(shù)據(jù)中,獲取因果知識具有特殊的困難和問題。在基于數(shù)據(jù)的因果推斷中,主要技術(shù)就是解決好混雜影響。傳統(tǒng)的方法是通過物理實(shí)驗(yàn)識別和消除混雜,即公式P(y|x)?P(y|do(x))。這為那些實(shí)驗(yàn)成本很高或者是無法進(jìn)行試驗(yàn)的社會科學(xué)和人文科學(xué)無疑開辟了一條新的途徑,使得實(shí)驗(yàn)手段借助數(shù)學(xué)計(jì)算進(jìn)入這些學(xué)科[4]。
通常認(rèn)為,實(shí)驗(yàn)是科學(xué)研究的基本手段,是對于假設(shè)的實(shí)證性驗(yàn)證,長期以來被認(rèn)為是獲取科學(xué)結(jié)論的唯一手段,在這種觀點(diǎn)下,那些難以做實(shí)驗(yàn)的社會科學(xué)和人文科學(xué)(包括醫(yī)學(xué)),就因缺少手段支持而發(fā)展艱難。而對于數(shù)據(jù),特別是大規(guī)模的觀察數(shù)據(jù),雖然是自然的、粗糙的(crude)和雜亂的,卻蘊(yùn)含了現(xiàn)象內(nèi)部發(fā)生的規(guī)律,通過數(shù)據(jù)來揭示事物內(nèi)在的因果聯(lián)系是科學(xué)研究的另一種藝術(shù)。盡管后者出現(xiàn)的時(shí)間不長,但卻正在而且必然成為科學(xué)研究新的主要手段之一。
在實(shí)證研究中,實(shí)驗(yàn)表示一種干預(yù),觀察表示一種描述。但是觀察與實(shí)驗(yàn)也不是截然分開的,Pearl的因果分析特別強(qiáng)調(diào),在一定程度上,充分的觀察可以替代實(shí)驗(yàn)。在此基礎(chǔ)上,發(fā)展了一套完整的基于數(shù)據(jù)的因果分析方法,其核心是把因果分析建立在當(dāng)前可利用的數(shù)據(jù)上(觀察的和實(shí)驗(yàn)的),并且與最新發(fā)展的統(tǒng)計(jì)學(xué)融合起來,把預(yù)測和反演問題歸結(jié)為基于數(shù)據(jù)的計(jì)算和分析。
任何學(xué)科的研究都需要建立在一些前提(假設(shè))上,這些前提有時(shí)是明顯的,有時(shí)是隱含的,它們的正確性都需要外部確認(rèn)。但是統(tǒng)計(jì)學(xué)與因果性研究對待前提的區(qū)別是,統(tǒng)計(jì)學(xué)的前提可以根據(jù)樣本數(shù)據(jù)的增加而發(fā)生變化,如果前提被樣本否定,則統(tǒng)計(jì)學(xué)會拋棄原有前提,或修改前提以擬合數(shù)據(jù);而因果性研究的假設(shè)一般不會因?yàn)闃颖緮?shù)量而改變,基本陳述格式是“在這種前提下,因果關(guān)系如此這般”,也就是承認(rèn)前提,才能接受相關(guān)結(jié)論。從這一點(diǎn)說,統(tǒng)計(jì)學(xué)的前提是一種先驗(yàn)假設(shè),而因果性的假設(shè)是一種信仰。貝葉斯主義不太看重先驗(yàn)假設(shè),只要給定充分多的樣本和足夠細(xì)致的測量,原則上統(tǒng)計(jì)假設(shè)是可以檢驗(yàn)的。當(dāng)然從直觀上說,越是平凡且容易認(rèn)同的假設(shè)越合理,過于牽強(qiáng)和復(fù)雜的假說盡管在數(shù)學(xué)上能夠通過,但在研究中不被認(rèn)可。
Pearl因果推斷中最基本的兩個(gè)假設(shè)(稱之為基本定律),第一個(gè)是關(guān)于反事實(shí)假設(shè)(或干預(yù)假設(shè)),即
Yx(u)=YMx(u)
其中u是環(huán)境變量,Mx是強(qiáng)制X=x后的修改模型(圖模型或結(jié)構(gòu)方程模型)。
第二個(gè)假設(shè)是條件獨(dú)立假設(shè),任意兩個(gè)節(jié)點(diǎn)之間缺失的箭頭都意味著數(shù)據(jù)中的某種條件獨(dú)立性,即
(XsepY|Z)G(m)?(X┴Y|Z)
即變量X和Y在圖上的條件分離,意味著在數(shù)據(jù)中的某個(gè)條件分布獨(dú)立。這一條可用來從數(shù)據(jù)構(gòu)建因果模型,或者驗(yàn)證某個(gè)模型是否與數(shù)據(jù)擬合。
第一個(gè)構(gòu)成了干預(yù)操作計(jì)算的基礎(chǔ),第二個(gè)構(gòu)成了因果模型的判別準(zhǔn)則。這兩個(gè)假設(shè)構(gòu)成了Pearl因果推斷的基石,不承認(rèn)這兩條就是拒絕Pearl因果推斷模式。
三、后門準(zhǔn)則和隨機(jī)實(shí)驗(yàn)
后門準(zhǔn)則是Pearl提出的用以計(jì)算因果效應(yīng)的基本方法。從本質(zhì)上說,后門準(zhǔn)則是隨機(jī)實(shí)驗(yàn)的數(shù)字化版本,隨機(jī)實(shí)驗(yàn)的目標(biāo)正是消除其他因素對于目標(biāo)變量因果關(guān)系的混雜,而后門準(zhǔn)則將這種物理手段上的消除,通過數(shù)學(xué)上取平均值的方式予以模擬,從而建立了通過數(shù)學(xué)演算消除混雜的方法,因此后門準(zhǔn)則以及相應(yīng)的do操作有很好的物理和數(shù)學(xué)背景支持。大數(shù)據(jù)提供了現(xiàn)象之間的變化及其關(guān)系,這些變化是大自然有意或無意中形成的,理論上說,只要數(shù)據(jù)量充分大,同樣可能蘊(yùn)含了隨機(jī)實(shí)驗(yàn)中所需要的結(jié)果,只是數(shù)據(jù)的質(zhì)量和分布可能沒有實(shí)驗(yàn)?zāi)敲赐昝?。直接從這些數(shù)據(jù)獲取因果關(guān)系,就是基于數(shù)據(jù)的因果發(fā)現(xiàn)。其重要意義在于,人們因此可能降低隨機(jī)實(shí)驗(yàn)的巨大成本與資源消耗。
貝葉斯學(xué)派以及其他的統(tǒng)計(jì)學(xué)派,都是以被動觀察作為基本研究手段的,而因果推斷是以實(shí)驗(yàn)或者對于數(shù)據(jù)的主動操作(即do操作)作為基本研究手段的,特別是基于數(shù)據(jù)的因果推斷。兩者根本的區(qū)別在于,觀察的結(jié)論是可以更改的,隨著數(shù)據(jù)量的增加,以前的結(jié)論可以被不斷修改和完善,這也是貝葉斯主義的基本原則。但是對于實(shí)驗(yàn)來說,不同的實(shí)驗(yàn)只能得到相同的結(jié)果。無論是一次實(shí)驗(yàn)還是多次實(shí)驗(yàn),其結(jié)果必然是一致的,如果出現(xiàn)矛盾,是實(shí)驗(yàn)本身設(shè)計(jì)出了問題,而不是結(jié)論出了問題。這是因果推斷學(xué)派與統(tǒng)計(jì)學(xué)派的區(qū)別。
在傳統(tǒng)的統(tǒng)計(jì)學(xué)里,一條原理是“觀察不能代替實(shí)驗(yàn)”,但隨著Pearl等人的基于數(shù)據(jù)因果分析方法的引進(jìn),這條“金科玉律”可以修改。在充分大的(觀察)數(shù)據(jù)背景下,通過依賴數(shù)據(jù)的分析方法,也可以揭示現(xiàn)象之間的因果關(guān)系。這也許印證了另一句話:“每個(gè)關(guān)聯(lián)關(guān)系背后都有某種因果關(guān)系?!盵5]
四、統(tǒng)計(jì)時(shí)間與物理時(shí)間
具有時(shí)間標(biāo)記的數(shù)據(jù)對于因果分析是至關(guān)重要的,在因果分析中,將數(shù)據(jù)發(fā)生的自然時(shí)序稱為物理時(shí)間。而從數(shù)據(jù)中通過DAG圖形描述,將變量劃分為層次關(guān)系的次序稱為統(tǒng)計(jì)時(shí)間,在統(tǒng)計(jì)時(shí)間里,父節(jié)點(diǎn)變量的事件發(fā)生于子節(jié)點(diǎn)變量之前。如果在建模中,物理時(shí)間與統(tǒng)計(jì)事件一致,當(dāng)然最好,但也可能不一致,理論上物理時(shí)間只有一個(gè),但是統(tǒng)計(jì)事件卻可能有多個(gè)。不同的統(tǒng)計(jì)時(shí)間可能導(dǎo)致不同的因果解釋(統(tǒng)計(jì)時(shí)間也是假設(shè)前提之一),從應(yīng)用角度,自然應(yīng)該找出那個(gè)與物理時(shí)間相對應(yīng)的統(tǒng)計(jì)時(shí)間,但是在數(shù)據(jù)本身缺失時(shí)間標(biāo)記時(shí),這種尋找是困難的。因此數(shù)據(jù)的語義問題很重要,也就是說,我們不僅需要關(guān)心數(shù)據(jù)本身,也要關(guān)心數(shù)據(jù)產(chǎn)生的機(jī)制和方式,即數(shù)據(jù)產(chǎn)生的環(huán)境。不加區(qū)別地使用數(shù)據(jù),可能會走進(jìn)死胡同。
由于因果關(guān)系是不對稱的,因此如果缺乏時(shí)序信息,不可能唯一地確定因果關(guān)系。在一個(gè)模型里,X是Y的原因,在另一個(gè)模型里,也可能Y是X的原因。從觀察數(shù)據(jù)來看,我們只能得到X與Y聯(lián)合出現(xiàn)或者不出現(xiàn)的信息[即聯(lián)合分布P(X,Y)],除非提供時(shí)序信息,即哪個(gè)變量先出現(xiàn),否則永遠(yuǎn)無法確認(rèn)因果關(guān)系。我們平常談?wù)撘蚬P(guān)系時(shí),經(jīng)常明確或者隱含地涉及時(shí)序。但是在很多(甚至在大多數(shù))場合下,時(shí)序問題并不重要,數(shù)據(jù)中即使包含了時(shí)序信息對于因果分析也沒有用處。例如膽固醇和鍛煉的關(guān)系,單獨(dú)看著這兩個(gè)變量,我們無法知道是鍛煉的變化影響了膽固醇水平,還是膽固醇變化影響了鍛煉的興趣,時(shí)序信息在此毫無用處。另一個(gè)例子出現(xiàn)在同時(shí)發(fā)生的現(xiàn)象,例如,一個(gè)高的旗桿與長的陰影的關(guān)系,是旗桿的高度決定了陰影的長度,還是陰影的長度決定了旗桿的高度,時(shí)序信息在此也毫無用處(當(dāng)然這時(shí)常識可以幫助我們確定因果,但是在常識不具備的情況下,做出判斷就不容易了)。因此要確定兩個(gè)非時(shí)序事件(變量)之間的因果關(guān)系,必須有多于三個(gè)以上的事件(變量),通過相互之間的條件獨(dú)立性來確認(rèn)。
五、回歸方程與結(jié)構(gòu)方程
在因果分析的計(jì)算公式中,Pearl多次強(qiáng)調(diào)回歸方程與結(jié)構(gòu)方程的區(qū)別。從形式上看,兩種方程都是等號連接的公式,或者更一般地,等號左邊是一個(gè)變量,右邊是一個(gè)數(shù)學(xué)表達(dá)式。兩者之間本質(zhì)的區(qū)別在于對稱性。對于線性回歸方程
Y=aX+bZ+e(*)
寫作
X=Y?Z?
是允許的,同樣表示了X和Y之間的關(guān)聯(lián)關(guān)系。但是結(jié)構(gòu)方程卻沒有這種對稱性。在線性回歸方程(*)的例子中,結(jié)構(gòu)方程表示變量X,Z,e可以影響Y,而Y不能影響X(用圖的語言說,X,Z,e是Y的父節(jié)點(diǎn)),因此方程不能逆轉(zhuǎn),不能用Y,Z,e表示X,否則數(shù)學(xué)意義完全與數(shù)據(jù)不符。在最近的報(bào)告中(北京智源大會,2020年6月),Pearl使用“←”取代“=”描述結(jié)構(gòu)方程,突出強(qiáng)調(diào)了方程兩邊的不對稱性。
構(gòu)建回歸方程只要(隨意)選取相關(guān)變量,然后利用協(xié)方差關(guān)系就可以確定系數(shù)。而結(jié)構(gòu)方程則需要利用數(shù)據(jù)中的各種條件獨(dú)立性來構(gòu)建,也就是說,構(gòu)建結(jié)構(gòu)方程,其中的變量選擇需要更多地依賴數(shù)據(jù)內(nèi)部的性質(zhì)和某些假設(shè),單靠相關(guān)關(guān)系無法獲取結(jié)構(gòu)方程。
結(jié)構(gòu)方程理論上允許互為因果,即兩個(gè)變量X,Y可以在兩個(gè)方程中互相出現(xiàn)在左邊和右邊。但是一般來說,希望方程具有“層次性”,每一個(gè)變量至多出現(xiàn)在左邊一次,并且兩個(gè)變量不能互相出現(xiàn)在右邊。那些從未在左邊出現(xiàn)的變量稱為“外生變量”(exogenous variable),否則稱為“內(nèi)生變量”(endogenous variable),顯然內(nèi)生變量的取值由外生變量唯一確定(統(tǒng)計(jì)意義上)。這樣一來,結(jié)構(gòu)方程把變量定義了層次,上層變量的值決定了下層變量的值,這等價(jià)于將數(shù)據(jù)定義了一個(gè)“統(tǒng)計(jì)時(shí)間”(見上面的第四點(diǎn)),如果該統(tǒng)計(jì)時(shí)間與物理時(shí)間(如果有)相一致,則說明結(jié)構(gòu)方程是客觀上合理的,如果不一致,不影響數(shù)學(xué)處理,但是其結(jié)果是否符合實(shí)際情況需要驗(yàn)證。
對于互為因果的結(jié)構(gòu)方程,可以認(rèn)為在兩個(gè)互為因果的變量X,Y之上,還有未被觀察的第三個(gè)變量U。U可能同時(shí)影響X和Y,從而導(dǎo)致從當(dāng)前的觀察來看,X和Y互為因果,也就是說,X和Y互為因果不是實(shí)際情況,而是由于觀察不充分引起的,事實(shí)上可能存在第三個(gè)變量Z是X和Y的公共原因。這個(gè)問題涉及對于因果的哲學(xué)理解和實(shí)證分析,目前只能作為一種假設(shè)(即Reichenbach的公共原因原理)[5]。
這頗有些像當(dāng)代物理學(xué)的困境,對于糾纏等與常識相違的粒子行為,到底是物質(zhì)的本質(zhì)屬性,還是缺少觀察的維度和手段。
在合理地確定了相關(guān)的變量后,建立線性結(jié)構(gòu)方程仍然需要借助回歸的手段,因此兩者在形式上有相同之處。順便強(qiáng)調(diào)一下,即使對于線性系統(tǒng)(*),a未必是X對于Y的全因果效應(yīng),只有當(dāng)回歸變量Z,e滿足后門原則時(shí),a才是X對于Y的全因果效應(yīng)。
六、反事實(shí)推斷與假設(shè)世界
反事實(shí)推斷是最能代表人類智能的特征,Pearl認(rèn)為具有反事實(shí)推斷的智能才能稱為真正的智能,也就是人工智能的第三個(gè)階梯。反事實(shí)在日常生活和科學(xué)論述中是大量出現(xiàn)的。Pearl對于反事實(shí)的定義和計(jì)算是目前關(guān)于反事實(shí)推斷的最為清晰、涵蓋面最廣以及最便于在實(shí)際中應(yīng)用的方法。傳統(tǒng)的統(tǒng)計(jì)學(xué)也試圖討論在事件A已經(jīng)發(fā)生并產(chǎn)生結(jié)果Y的前提下,反推如果在事件A不發(fā)生的情況下可能出現(xiàn)的結(jié)果。但是由于相關(guān)的定義和解釋是模糊的,關(guān)鍵是沒有嚴(yán)格區(qū)分現(xiàn)實(shí)世界與假設(shè)世界的不同。事實(shí)上,反事實(shí)推斷涉及現(xiàn)實(shí)世界和假設(shè)世界兩個(gè)不同的世界,傳統(tǒng)的統(tǒng)計(jì)學(xué)對此的理解是不深刻和不充分的,因此留下了很多問題無法說清。Pearl的框架為此建立了專門的語言,使用邏輯和數(shù)的必要性和充分性原因,這大大提升了對于因果關(guān)系的理解。因果關(guān)系從定性研究發(fā)展到定量研究。其中PN(必要性原因)、PS(充分性原因)、PNS(充要性原因)的計(jì)算可以將因果分析擴(kuò)大到許多領(lǐng)域,并且使之精確化和計(jì)算化,而且具有簡明性和精準(zhǔn)性的優(yōu)點(diǎn)。
從過去可以推算現(xiàn)在,但是從現(xiàn)在難以推算過去。過去的現(xiàn)象很多,哪個(gè)現(xiàn)象都會與現(xiàn)在相關(guān),過去所有的現(xiàn)象集合構(gòu)成現(xiàn)在現(xiàn)象的充分原因,但是其中真正的必要原因很難從觀察中獲知。這就是著名的INUS理論,INUS是Insufficient but Necessary part of a Unnecessary but Sufficient condition的縮寫,意思是在充分不必要條件下尋找其必要不充分部分[6]。如果要回溯某個(gè)結(jié)果的必要原因,只靠觀察顯然不行,需要借助因果分析中的反事實(shí)公式,例如P(y'x'|x,y)進(jìn)行計(jì)算,即計(jì)算在x和y已經(jīng)出現(xiàn)的情況下,如果x不出現(xiàn)(x'),y也不出現(xiàn)(y')的概率,這是x作為y的原因的必要性度量。因果分析可以令人信服地刻畫對于未來的預(yù)測和過去的溯因[7]。
七、非完美實(shí)驗(yàn)與區(qū)間估計(jì)
非完美實(shí)驗(yàn)指的是受試者可能沒有完全按照實(shí)驗(yàn)協(xié)議操作,事先設(shè)計(jì)的方案未能實(shí)現(xiàn)理想的控制,實(shí)驗(yàn)結(jié)果可能會因受試者不完全服從協(xié)議而偏差。比如,通過投放廣告來推銷某種產(chǎn)品,由于接受實(shí)驗(yàn)的用戶可能違反協(xié)議不看廣告,因此廣告的真實(shí)作用難以估計(jì)。這種不完全符合協(xié)議的現(xiàn)象使得實(shí)驗(yàn)變得不可靠,并且給數(shù)據(jù)中得出的結(jié)論帶來了偏差。而且這種偏差是不可知且無法糾正的。
因果分析也可以應(yīng)用在這類問題的處理上,并且給出了因果關(guān)系的一個(gè)區(qū)間估計(jì)。舉一個(gè)檢驗(yàn)治療方案的實(shí)驗(yàn),受試者被隨機(jī)分為兩個(gè)組,一個(gè)組實(shí)施實(shí)際治療,另一個(gè)組實(shí)施安慰治療。給出兩個(gè)假設(shè):(1)對于任何一個(gè)人來說,分組會影響他所選擇的治療方法,但不會影響治療方法的效果。(2)治療對于受試者的效果是相互獨(dú)立的。但是沒有限制治療效果對于選擇治療之間的相互影響,即治療效果好的方法可能會有更多的人選擇該治療(這在日常生活中很常見)。
非完美實(shí)驗(yàn)在很多場合是不得不采取的實(shí)驗(yàn)方式,例如:
(1)隨機(jī)的治療實(shí)驗(yàn)可能會受到違反協(xié)議的影響。例如,實(shí)驗(yàn)藥物的不良反應(yīng)可能會使受試者擅自決定減少指定劑量?;蛘?,如果實(shí)驗(yàn)是測試一種藥物治療晚期疾病,那么懷疑自己是對照組成員的實(shí)驗(yàn)者可能會偷著從其他來源獲得藥物。這種協(xié)議遵守的不完全性使得實(shí)驗(yàn)數(shù)據(jù)產(chǎn)生偏差。
(2)拒絕給予某些受試者提供治療會產(chǎn)生道德和法律后果。例如,在艾滋病研究中,被分配到對照組的患者將會禁止拯救生命的治療,在道德和法律上可能是不允許的。
(3)隨機(jī)化可能影響受試者的參與以及行為。例如,在對于學(xué)校錄取情況的隨機(jī)控制實(shí)驗(yàn)中,一旦申請者知道學(xué)校是隨機(jī)選擇錄取標(biāo)準(zhǔn),可能會對申請學(xué)校持謹(jǐn)慎態(tài)度,這就改變了原來學(xué)校正常的申報(bào)情況,錄取數(shù)據(jù)出現(xiàn)失真。
使用不完整數(shù)據(jù)(缺失或者失準(zhǔn))雖然難以做到對于因果效應(yīng)的精確點(diǎn)估計(jì),但是在一定的條件下卻可以做到區(qū)間估計(jì),這是非完美實(shí)驗(yàn)的因果分析的基本思想。結(jié)構(gòu)因果模型(SCM)描述了各個(gè)變量之間的關(guān)系,其中外生變量(可觀察或不可觀察)處于最外層,而內(nèi)生變量處于里面。外生變量的每一個(gè)具體取值定義了因果圖的一個(gè)狀態(tài),這樣該系統(tǒng)中可能有的因果關(guān)系,完全由外生變量的可能取值決定。反過來,通過部分內(nèi)生變量的當(dāng)前取值,可以反推外生變量當(dāng)前可能的取值范圍,從而確定所有內(nèi)生變量的狀態(tài)(區(qū)間值)。將外生變量的取值水平離散化,劃分為有限個(gè)等價(jià)類,每個(gè)等價(jià)類對應(yīng)一個(gè)因果效應(yīng),這個(gè)分劃稱為典型分劃。再依據(jù)SCM各個(gè)變量之間的依賴函數(shù),通過求解方程,可以得到平均因果效應(yīng)ACE(X→Y)的取值范圍(區(qū)間值)。這就給出了因果效應(yīng)的區(qū)間估計(jì)。這樣一來,即使實(shí)驗(yàn)數(shù)據(jù)不完整或者不準(zhǔn)確,例如實(shí)驗(yàn)的協(xié)議實(shí)際遵守情況不了解,只要具有大概的信息(例如有10%的不遵守協(xié)議,或者再加上其他信息),就可以得到平均因果效應(yīng)ACE的區(qū)間值,這就是基于不完美實(shí)驗(yàn)數(shù)據(jù)推斷的區(qū)間估計(jì)方法,當(dāng)然如果數(shù)據(jù)是充分的和精確的,則區(qū)間估計(jì)可能會塌縮為一個(gè)點(diǎn),即精確的點(diǎn)估計(jì)。
為了進(jìn)一步計(jì)算ACE,可以對于服從協(xié)議的比例有一個(gè)先驗(yàn)假設(shè),然后通過Gibbs抽樣進(jìn)行假設(shè)檢驗(yàn),進(jìn)而估計(jì)概率ACE(X→Y)。結(jié)合已有的對于總體的知識,這個(gè)先驗(yàn)概率可以取平均分布,或者偏態(tài)分布,并通過抽樣分析修改先驗(yàn)假設(shè)。該方法不僅可以用于評估群體的平均概率分布,也可以應(yīng)用于單個(gè)個(gè)體的情況,通過不完全合作背景下的反事實(shí)推斷,估計(jì)單個(gè)個(gè)體的因果效應(yīng)。
八、歸因分析與法律責(zé)任
Pearl在很多報(bào)告中,都談到一個(gè)有關(guān)藥品事故歸因的問題,雖然問題本身是杜撰的,但其內(nèi)容說明了歸因分析的重要性質(zhì),并且引起很多爭議。我們先來介紹一下該問題(見表1)。
表格的左邊是制造商對某種止痛藥品進(jìn)行實(shí)驗(yàn)的數(shù)據(jù),因?yàn)樵搶?shí)驗(yàn)是按照標(biāo)準(zhǔn)的程序和要求進(jìn)行的,該藥品通過了審批部門的核準(zhǔn),從表中可以看出:
(1)雖然藥品增加了死亡率(從14/1000增加到16/1000),但是由于藥品能夠有效減輕疾病痛苦,還是可以容許的。
(2)根據(jù)流行的統(tǒng)計(jì)學(xué)中額外風(fēng)險(xiǎn)的計(jì)算公式,ERR==0.125,因此如果某人因?yàn)槌运幩劳?,則制造商需要承擔(dān)12.5%責(zé)任,對于這部分責(zé)任,制造商可以通過購買保險(xiǎn)的方式賠付,而不是進(jìn)一步提高藥品的安全性。
但是在訴訟中,原告律師拿出另一個(gè)數(shù)據(jù),即表格的右邊,這是律師進(jìn)行實(shí)際調(diào)查時(shí)獲取的數(shù)據(jù),兩者的區(qū)別是,實(shí)驗(yàn)數(shù)據(jù)是強(qiáng)迫性的,無論受試者是否愿意服藥,必須根據(jù)實(shí)驗(yàn)協(xié)議服藥。而律師的數(shù)據(jù)是觀察性的,服藥是出于自愿。因此根據(jù)Pearl的計(jì)算公式,制造商需要承擔(dān)的責(zé)任是
PN=+
=(0.002?0.028)/0.002+(0.028?0.014)/0.001=1
其中PN的第一項(xiàng)是觀察結(jié)果的(不是實(shí)驗(yàn)結(jié)果的)額外風(fēng)險(xiǎn)率,第二項(xiàng)是觀察結(jié)果的混雜修正。兩個(gè)計(jì)算公式產(chǎn)生了巨大的差異,Pearl認(rèn)為被告(即藥物制造商)的責(zé)任為1是可能的,理由有三點(diǎn):
(1)數(shù)學(xué)公式如此,根據(jù)單調(diào)性假設(shè),數(shù)學(xué)推斷的邏輯沒有問題,算出來的結(jié)果不會有問題。
(2)觀察數(shù)據(jù)反映了個(gè)體自愿選擇服藥,而不是像受控實(shí)驗(yàn)?zāi)菢?,根?jù)實(shí)驗(yàn)協(xié)議服藥。即實(shí)驗(yàn)數(shù)據(jù)是藥物的“指定影響”,而觀察數(shù)據(jù)是藥物的“自愿影響”,由于觀察數(shù)據(jù)更加符合原告的情況,所以歸因計(jì)算應(yīng)當(dāng)采取觀察數(shù)據(jù)而不是實(shí)驗(yàn)數(shù)據(jù)(采用實(shí)驗(yàn)數(shù)據(jù),被告的責(zé)任就是0.125)。
(3)由于提供的數(shù)據(jù)比較粗略,缺少受試或者觀察人員屬性的細(xì)節(jié)描述,因此對于非確定的個(gè)人來說,某些概率值(藥商責(zé)任)的估計(jì)為1是可能的。
但是這個(gè)問題還是具有爭議,本質(zhì)上說,這是所謂“亞群翻轉(zhuǎn)”問題(subpopulation reverse,見文獻(xiàn)[1]的1.2節(jié)),即總體人群分布與其中某個(gè)亞群的分布完全不同,甚至相反。在這種情況下,對于總體而言的實(shí)驗(yàn)數(shù)據(jù)與實(shí)際觀察數(shù)據(jù)的關(guān)系就值得探討,在估計(jì)混雜因素時(shí),應(yīng)用了公式P(y|x')?P(y|do(x')),其直觀意義是觀察數(shù)據(jù)值與實(shí)驗(yàn)數(shù)據(jù)值的差,并認(rèn)為這就是混雜因素,這一點(diǎn)值得商榷。由于觀察數(shù)據(jù)可能來自總體的一個(gè)特殊亞群,這個(gè)亞群成員中存在某種未知的原因(屬性),使得吃藥與未吃藥的死亡比例與實(shí)驗(yàn)數(shù)據(jù)差別如此之大,因此可以認(rèn)為觀察的對象并不服從總體的隨機(jī)分布,甚至反轉(zhuǎn)了實(shí)驗(yàn)結(jié)果。因此需要對于實(shí)驗(yàn)結(jié)果的適用范圍(即總體的亞群)做出假設(shè),而不是泛泛認(rèn)為對于所有的亞群都適用。如果假設(shè)實(shí)驗(yàn)結(jié)果適合于所有的亞群(當(dāng)然包含觀察的亞群),顯然其合理性受到質(zhì)疑,如果不包含觀察的亞群,則實(shí)驗(yàn)結(jié)果不能用于該觀察人群。理論上說,只有在這類特殊的亞群中重做隨機(jī)對照實(shí)驗(yàn),才能有說服力地識別出亞群條件下的混雜。否則總體人群與亞群之間的分布完全不同,它們的差是否就是真正的混雜,還是存在疑問的。這個(gè)例子說明,當(dāng)觀察數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)可能產(chǎn)生很大的分歧時(shí),可信的因果推斷必須慎重,并需要有進(jìn)一步的研究支持(例如可遷移性)。無論怎么說,被告(藥品制造商)的律師還是有辭可辯。
哲學(xué)上把現(xiàn)象與現(xiàn)象之間那種“引起和被引起”的關(guān)系,叫作因果關(guān)系,其中引起某種現(xiàn)象產(chǎn)生的現(xiàn)象叫作原因,被某種現(xiàn)象引起的現(xiàn)象叫作結(jié)果,如“力,形之所以奮也”。因果分析和推斷是一種重要的獲取知識的手段,是人類智能的關(guān)鍵組成。本文對因果推斷中的核心概念進(jìn)行了解釋。盡管因果關(guān)系是人類思想的基礎(chǔ),但因果關(guān)系卻長期籠罩在神秘、爭議和謹(jǐn)慎之中,一般很難確定一個(gè)事件是否真正導(dǎo)致了另一事件。Pearl給出了一種描述和處理因果關(guān)系的數(shù)學(xué)語言,理清了一些模糊的和相互矛盾的概念,為科學(xué)處理和獲取因果知識奠定了堅(jiān)實(shí)的基礎(chǔ)。但是,真正具有挑戰(zhàn)性的問題仍然擺在我們面前:對教學(xué)效果、學(xué)習(xí)興趣、性格傾向這些現(xiàn)象仍然無法理解其因果性,只有數(shù)據(jù)的積累和敏銳的洞察力,最終才能實(shí)現(xiàn)真正理解,并在此基礎(chǔ)上,實(shí)現(xiàn)人工智能理論和技術(shù)的新飛躍。
參考文獻(xiàn):
[1] PEARL J, GLYMOUR M, JEWELL N P. Causal inference in statistics, A primer[M]. Hoboken: John Wiley & Sons Ltd, 2016.
[2] PEARL J. Model, reasoning, and inference (second edition)[M]. Cambridge: Cambridge press, 2009.
[3] SLOMAN S. Causal models, How people think the world and its alternative[M]. Oxford: Oxford University Press, 2005.
[4] GELMAN A. Causality and Statistical Learning[J]. American Journal of Sociology, Volume 117 Number 3, 2011: 955–966
[5] SCH?LKOPF B. Causality for machine learning, arXiv: 1911.10500v2[DB]. 23Dec 2019.
[6] MORGAN S, WINSHIP C. Counterfactual and causal inference, method and principle for social research[M]. Cambridge: Cambridge University Press, 2007.
[7] HOERL C, MCCORMACK T, BECK R. Introduction: Understanding Counterfactuals and Causation[M]//HOERL C, MCCORMACK T, BECK R (eds.). Understanding Counterfactuals, Understanding Causation: Issues in Philosophy and Psychology. Oxford: Oxford University Press, 2011.
[責(zé)任編輯:余大品]