国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人工智能與因果語言

2021-04-20 15:01:12吳小安
科學(xué)經(jīng)濟(jì)社會 2021年1期
關(guān)鍵詞:珀爾金字塔服藥

吳小安 張 瑜

一、“迷你”圖靈測試

人工智能的先驅(qū)之一艾倫·圖靈曾提出這樣一個問題[1]:怎么才能說一個計算機(jī)像人一樣在思考?他給出了一個稱為“模仿游戲”的測試方法(后來人們稱之為“圖靈測試”):即向一個計算機(jī)提問,如果它對于問題的回答讓我們不能區(qū)別和我們交談的是計算機(jī)還是人,那么這一臺機(jī)器就可以算是一個思維機(jī)器。當(dāng)然要模仿一個成人的智能是困難的,隨著教育和閱歷的發(fā)展和推進(jìn),她的智能水平也一直在發(fā)展和推進(jìn)。很自然的想法是不妨從模仿孩子的智能開始(“迷你”圖靈測試),再循序漸進(jìn),最終實現(xiàn)成人的智能。

在珀爾和麥肯齊(Pearl and Mackenzie)[2]看來,對因果的理解是人類認(rèn)知最普遍也是最不可或缺的一環(huán)。只有所造的機(jī)器人理解因果,我們才能把對于這個世界的所知教給它們。具體而言,在制造出一個理解因果的機(jī)器人之前,至少有兩個疑難要面對:只有解決了它們,一個思維機(jī)器才是可實現(xiàn)的。首先,人們是如何從環(huán)境中獲取因果知識的?其次,人們是如何處理因果信息的?第一個問題并不是珀爾關(guān)心的,他的主要貢獻(xiàn)和努力在于回答第二個問題,即給出如何表征因果知識的方式,也就是因果貝葉斯網(wǎng)絡(luò),并說明這種表征方式如何使得我們能夠快速地訪問必要的信息并正確地回答因果的問題。

所以姑且把如何獲取因果知識的困難放在一邊,認(rèn)為已經(jīng)預(yù)存了如下的因果知識和模板(珀爾認(rèn)為孩子的大腦并不像有些人所理解的那樣是白板一塊,而是已經(jīng)有了豐富的機(jī)制和預(yù)存的模板)。圖1表示了我們對于世界的因果認(rèn)知和表征,季節(jié)的變化(SE取值{1,2,3,4},分別對應(yīng)春夏秋冬)會影響灑水器的開關(guān)(SP取值1 和0 對應(yīng)灑水車的開關(guān)),也決定雨水的豐沛與否(R取值1 和0,對應(yīng)雨水多與少),而不管是開灑水器還是雨水都會使得路面潮濕(W取值1 和0,對應(yīng)路面潮濕與否),從而使得路面變滑(S取值1和0,對應(yīng)路面滑與否)。

讓我們從珀爾Pearl所謂的“迷你”圖靈測試開始,一個“理想的”思維機(jī)器應(yīng)該能圓滿地回答如下問題:

圖1 表示五個變元之間依賴關(guān)系的因果圖

問題1:如果此時正值秋季非常干燥的北京,但是有一處路面卻很滑,這說明了天下雨了嗎?

回答:并不太可能,更可能是灑水器被打開了,還有一種很小的可能性,路滑并不是因為路濕。而是因為其他原因。

問題2:如果我看到灑水車是關(guān)著的,那能說明天下雨了嗎?

回答:那就很有可能了。

問題3:你的意思是如果在現(xiàn)實中我打開了灑水器,那么下雨就更不可能了嗎?

回答:并不是這樣的,你打開灑水器與否都不會影響是否下雨。

問題4:如果你看到灑水車是開著的且路面是濕的,那么設(shè)使灑水車關(guān)了,路面還會是濕的嗎?

回答:路面將會是干的,因為當(dāng)前是一個干燥的季節(jié),下雨的幾率很小。

上述因果圖,以及以之為基礎(chǔ)對于上述問題的回答,為真正智能的實現(xiàn)提供了思路。我們棲居在這個世界之中,在“煩”與“畏”中與之砥礪,慢慢地,對于這個世界如何周轉(zhuǎn)運(yùn)行,對于事物如何發(fā)展的內(nèi)在理路和模式就有所掌握,對于上述問題的回答實質(zhì)上就是以上述預(yù)存模式為基礎(chǔ),以新情況為根據(jù)對模式做必要之修正而得出的。但是如何讓蠢笨的機(jī)器人能像人一樣思考,回答起因果問題時從容不迫,在因果交談中游刃有余,在珀爾看來就必須給它們裝備因果推斷引擎[2]12,[3]57,[4]160,裝備了這個引擎的機(jī)器人,才能獲取存儲因果知識,并以之為基礎(chǔ)做因果推斷,進(jìn)行有效因果交流,這個引擎中最關(guān)鍵的一環(huán)以及所有工作的初始就是:因果語言。

二、因果語言的源起

從一個頗具思維革命意味的、“測量金字塔”的例子來說明因果語言的意義和必要性是有幫助的。當(dāng)別人問你“金字塔有多高?”假定你沒有其他途徑能查到金字塔的高度,我相信你不會想著造一個金字塔高的巨大尺子來垂直度量它,因為這樣實在辱沒了我們的教育,任何一個受過小學(xué)教育的人都知道歐幾里德幾何,都知道五條公設(shè),并因而都證明過“相似三角形的對應(yīng)邊成比例”,如果你知道這個結(jié)論,那么測量金字塔的高度就不會那么耗時費力了。

你只要找到一個桿子,測量出桿子的影長(a)、桿子高(c)和金字塔的影長(b),再根據(jù)“相似三角形的對應(yīng)邊成比例”這個定理,就可以很輕易地計算出想要的結(jié)果。你會疑惑,這樣一個人類在數(shù)千年前就知道的方法有什么值得大書特書的呢?這種方法的意義在于它昭示了人類思維的巨大勝利,只要倚賴創(chuàng)造的數(shù)學(xué),就可以超越一些之前無法跨越的局限,只要在紙上計算一下,就可以得到在之前需要耗時費力才會得到的結(jié)果。

而今我們同樣也面臨這一類異常困難的問題:“吸煙是否導(dǎo)致肺癌”,或者“宏觀政策的實施是否會導(dǎo)致通貨膨脹”?對于這類問題的一個標(biāo)準(zhǔn)解決:良好設(shè)計的隨機(jī)對照實驗(randomized controlled trials)。在一個恰當(dāng)?shù)碾S機(jī)化對照實驗中,除了一個因素(比如這里的吸煙變量或者政策變量),那些影響結(jié)果變量的其他因素,要么被固定,要么隨機(jī)地變化,于是結(jié)果變量的改變必然是因為那唯一因素所致,以此求出我們想要的因果關(guān)系。

但是這個方法并不是包治百病的良方。首先,在很多時候,隨機(jī)對照實驗是不可能實現(xiàn)的(法律上、實踐上、道德上、醫(yī)學(xué)上,甚至經(jīng)濟(jì)上不可能)。比如下面這個實驗在倫理上就不可行:隨機(jī)抽樣一撥人,隨機(jī)指派為兩組,一組拼命吸煙,一組完全不吸煙,然后觀察個幾十年,看最后哪一組患肺癌的概率更大一些;或者如果想要知道增加稅收對于國家經(jīng)濟(jì)的影響,也不可能拿一個國家來作為實驗對象,通過加稅或者減稅來觀察對于國家經(jīng)濟(jì)狀況的影響,代價太大,風(fēng)險太高,也有太多的不確定。著名的1944 年的明尼蘇達(dá)饑餓實驗(Minnesota Starvation Experiment)在今天的倫理標(biāo)準(zhǔn)之下是斷然不能進(jìn)行的。其次,在執(zhí)行隨機(jī)對照實驗的過程中,現(xiàn)實的復(fù)雜也遠(yuǎn)超我們的想象。比如研究觀看暴力電視節(jié)目和學(xué)校霸凌之間的關(guān)系,很難有效地控制一個孩子看多少的電視節(jié)目,也近乎不可能知道是否有效地控制了看電視的時間。

所以,很自然的問題,我們是否有其他的方法或者程序,可以從可觀測性研究(observational studies)中推導(dǎo)出想求的因果關(guān)系?在這種研究中,研究者只是記錄數(shù)據(jù),并不對研究本身進(jìn)行任何干預(yù)或者控制,即只有數(shù)據(jù)集P(X,Y,W,…)。上述的討論可以總結(jié)如下(表1):

從表1中的比較知道,對金字塔高度的度量我們有兩個問題是需要解決的:

1.需要一個相應(yīng)的語言來表達(dá)需要表達(dá)的問題,在金字塔的例子中,把金字塔高度用抽象的符號d來表示;

2.還需要一個數(shù)學(xué)理論,能夠以在手的數(shù)據(jù)求出因果關(guān)系,正如在金字塔的例子中,通過歐式幾何,把金字塔高度的問題還原為通過一些相對容易可得的量(c,b,a)而計算出來。

表1 金字塔高度度量的啟示

與之對照的兩個問題珀爾[5]都給出了回答。他給出了因果語言來表征相關(guān)的因果問題,發(fā)展出結(jié)構(gòu)因果模型來表征具體的情境,并通過干預(yù)概念把因果模型和刻畫因果的反事實聯(lián)系在一起(對于因果的反事實理論介紹與討論,可以參看裘江杰[6]10-17、何朝安[7]3-9等人的研究),進(jìn)而討論諸多因果概念。

三、物理語言和概率語言

當(dāng)然,因果從來不乏討論。我們熟知的“穆勒五法”就是前現(xiàn)代因果研究的主導(dǎo)方法論,韋伯在《新教倫理和資本主義精神》中對新教倫理和資本主義精神之間因果關(guān)系的探討(為什么資本主義在歐洲發(fā)生了,而沒有發(fā)生在世界的其他地方?),所使用的方法就是穆勒歸納法中的“差異法”。這種探討更多地依賴于作者本人的勤學(xué)苦讀、廣泛涉獵,形成的對于問題本身的直覺,然后再論證這種直覺的合理性。但是這種方法自有其學(xué)理上的弊端,更多是“一家之言”,受制于作者本人的視野和學(xué)識,并不具有科學(xué)的客觀性。今天數(shù)據(jù)時代的到來,這種純直觀的學(xué)理研究必然是要揚(yáng)棄的,數(shù)據(jù)來源的多面性和廣泛性,使得我們有可能更加接近我們想要探尋的真實,在珀爾看來“數(shù)目是盲目的”(Data are profoundly dumb),它需要指導(dǎo)和引領(lǐng),正如概率論源于賭博、運(yùn)籌學(xué)的發(fā)展部分也是戰(zhàn)爭的需要,在當(dāng)前新的形勢下,傳統(tǒng)的學(xué)科,比如社會學(xué)、政治科學(xué)、流行病學(xué)、公共健康也開始鳳凰涅槃,對一種新的因果語言和方法論的需求迫在眉睫又勢在必行。

1.語言的重要性

語言的重要性早就已經(jīng)被行為科學(xué)家和心理學(xué)家所洞悉,他們論證說語言塑造人的思維方式和行為模式[8]。比如,在澳大利亞北部約克角城西邊一個叫作波姆普勞(Pormpuraaw)的原住民小部落,這個部落里的人說庫塔語(Kuuk Thaayorre),這個語言中沒有描述相對空間位置的詞,比如左、右等,只有描述絕對方位的詞,比如東、西、南、北等。對比研究之后發(fā)現(xiàn),使用絕對方向語言的人更精確地把握自己所處的方向?!笆聦嵣?,他們這種能力之強(qiáng),已經(jīng)超出了科學(xué)家過去設(shè)想的人類所能達(dá)到的極限。正是在語言的強(qiáng)化訓(xùn)練下,他們獲得了這種認(rèn)知能力?!碑?dāng)作者在公開演講時用同樣的問題測試那些擁有相對方位語言的聽眾,他們對于自己身處之東西南北卻異常暈圈。

珀爾和麥肯齊[2]10也特別強(qiáng)調(diào)語言的重要:“我對語言的強(qiáng)調(diào)也源于一個堅定的信念,即語言會塑造我們的思想。你無法回答一個你提不出來的問題,你也不能提出一個你沒有詞語來描述的問題?!闭缦瘛耙Α薄办亍薄傲孔印边@樣的概念,正是因為有了確切表達(dá)這些概念的語言,我們才能圍繞這些概念發(fā)展出相關(guān)的科學(xué)和理論。

2.物理語言與概率語言

一個很自然的困惑,因果語言的提出是在21 世紀(jì)末葉,而彼時,科學(xué)的大樹早已經(jīng)根深蒂固,“絜之百圍”,為何要大費周章,另辟蹊徑,再創(chuàng)造一個因果語言?為何不就地取材,因地制宜呢?

遺憾的是,傳統(tǒng)的數(shù)學(xué)語言表達(dá)不了所希望表達(dá)的因果問題。比如在物理學(xué)中牛頓第二運(yùn)動定律是:

F=ma

概率是許多特殊科學(xué)官方的語言,但是標(biāo)準(zhǔn)概率理論的詞匯表中并不包含“原因”這個詞。同樣我們也不能表達(dá)“氣壓是氣壓計讀數(shù)的原因”,“公雞打鳴不是太陽從東方升起的原因”,因為它們和“氣壓計的讀數(shù)依賴于氣壓”,以及“公雞打鳴依賴(或者獨立于)太陽從東方升起”是不一樣的,所以兩者的符號表征應(yīng)該是不一樣的。但是這個區(qū)分并沒有在標(biāo)準(zhǔn)的科學(xué)分析中被嚴(yán)肅對待。盡管我們寓居于這個世界,用到太多太多因果的概念,但是迄今為止,還沒有一個語言來形式化我們關(guān)于世界的因果判斷。

于是珀爾提出用“do-算子”來表達(dá)因果關(guān)系,比如“吸煙是否導(dǎo)致肺癌”的問題可以形式化如下:

其中:

“do-算子”不只是舊的語言的擴(kuò)充,更是新的語言的開始。如果你剛剛接觸統(tǒng)計學(xué),會很難理解它對于因果概念的敵意,比如很多統(tǒng)計學(xué)教材開篇都會強(qiáng)調(diào)“我們這本書中不會使用‘因果的’或者‘因果’這樣的詞匯……我們這樣做是出于一種謹(jǐn)慎,因為從研究中我們很少能夠得到關(guān)于因果的靠譜結(jié)論”[9]。在珀爾看來,之所以有這樣一個對因果的排斥是因為沒有與之對應(yīng)的語言來表達(dá)我們想要表達(dá)的因果關(guān)系,統(tǒng)計的語言是概率,但是概率卻不足以成為因果的語言。

3.因果語言的特點

我們需要對這個新的因果語言做一些澄清。首先,我們需要說明這個新的語言和概率之間的區(qū)別與聯(lián)系;其次,我們需要闡述清楚,這種新的語言實現(xiàn)什么樣的目的,即這個新語言的使命在哪里,以此,才能發(fā)展出與之相應(yīng)的數(shù)學(xué)來實現(xiàn)這個目的;再次,將說明這個新的語言對于人工智能和其他研究的意義。

當(dāng)然,引入一個語言是一回事,正如表(1)所指出的,另一個困難的地方在于,要給出相配套的數(shù)學(xué)理論,讓它和數(shù)據(jù)結(jié)合在一起,把之所以引入這個語言的那些基本想法很好地體現(xiàn)和貫徹出來。“物有本末,事有終始”,姑且把這個困難的問題先擱置在一邊,先把因果語言的問題講清楚。

首先,需要看到這個新的因果表達(dá)式和條件概率的區(qū)別:

P(Y=1|do(X=1))≠P(Y=1|X=1)

“相關(guān)并不意味著因果”(Correlarion is not causation),早上公雞打鳴,太陽隨后就會升起來,這兩者之間有相關(guān)關(guān)系,但是公雞打鳴并不是太陽升起的原因,它們之間沒有因果關(guān)系。

具體而言兩者的區(qū)別有:首先,是方向性。因果是單向的,只有原因會影響結(jié)果,結(jié)果是不會影響原因的。但是概率公式是對稱的,根據(jù)貝葉斯法則,可以從P(Y=1|X=1)得出P(X=1|Y=1),反之亦然。

其次,是混雜(即共同原因)。我們求條件概率,比如P(康復(fù)|服藥),我們首先要知道服藥的人數(shù)是多少,然后再從中找出服藥且康復(fù)的人是多少,后者除以前者得出的結(jié)果就是我們所要求的條件概率。但是這種條件概率并不能滿足我們需要理解因果關(guān)系的目的,因為可能存在混雜因素,它既影響病人服藥也影響病人的康復(fù)(比如性別),所以哪怕你得出P(康復(fù)|服藥)=1,也并不意味著服藥是康復(fù)的原因。而因果關(guān)系實際上表示的是服藥這個行為對于康復(fù)的影響,如何來刻畫這種行為對結(jié)果的影響?顯然它和上述條件概率的直觀不盡然相同。

從現(xiàn)實的生活中,也很容易認(rèn)識到觀察與干預(yù)之間的區(qū)別,比如我們都能感覺到人的手掌的大小和他腳掌的大小之間有一種相關(guān)關(guān)系,腳大的人手一般也不會小,所以一般而言:P(Y=y|X=x)不等于P(Y=y)。P(Y=y|X=x),“∣”的右邊是通常的概率演算中的條件化,代表的是證據(jù)化條件“假如我們看到”,反映的是在X取值為x的那些個體中,Y的總體分布是什么。注意,當(dāng)條件化一個變量的時候,并沒有改變系統(tǒng),只是使變量取了我們感興趣的值,從而把關(guān)注點轉(zhuǎn)移到感興趣的那一類情形中去了(實際上就是一種篩選),如果要談改變的話,那改變的是我們對于這個世界的感知,而不是這個世界。

但是如果你從小就裹腳,顯然你的腳可能就停留在某一個尺寸了,但是你的手掌還是會正常發(fā)育,大小不會受到太大的影響。裹腳就是一種干預(yù),但是裹腳對手掌的發(fā)育并沒有因果影響,所以P(Y=y|do(X=x))=P(Y=y),即不管裹腳與否,手掌大小的概率并不受影響。P(Y=y|do(X=x),“∣”的右邊是do算子,代表的是因果條件“假定我們干預(yù)了(doing)”,反映的是如果在總體中的每一個個體它們的X的取值為x,那么Y的總體的分布是什么。當(dāng)干預(yù)一個變量時,我們固定它的值,改變了這個系統(tǒng)(即珀爾所謂“手術(shù)式的”干預(yù)),其他變量的值也可能因為這個值的改變而改變。

在因果模型的理論中,當(dāng)我們通過干預(yù)來確定某個變量的值的時候,與之對應(yīng)的圖表達(dá)的就是對圖的外科手術(shù)(surgery),刪除所有指向這個變量所對應(yīng)的節(jié)點的箭頭,并把這個節(jié)點所代表的變量的值固定為干預(yù)的值,由此我們得到了被修改的因果模型(perturbed causal model)。

盡管引入do-算子只是一個開始,但那卻是打開新世界的鑰匙。珀爾[5]422生動地指出,如果你身處16 世紀(jì),你是一個加法(“+”)運(yùn)算的專家,迫切感覺需要引入一個新的算子來簡化多個相同的數(shù)字相加的情況,因為把這個相同的數(shù)字一個一個加起來實在是太繁瑣笨拙了。你所做的第一件事情就是用一個新的符號來表達(dá)這個過程:×,然后你要窮究這個算子的意義,正如你推導(dǎo)出的很多加法的法則一樣,你也希望推導(dǎo)出與乘法相關(guān)的法則,比如分配律、結(jié)合律、交換律等,并說明它與之前的加法運(yùn)算之間的關(guān)系。同樣,我們引入了一個新的do-算子,要說明這個新的算子和條件概率之間的關(guān)系,以及怎么來計算它,以得到想要的結(jié)果。為此需要一個與之相配的理論,在金字塔的例子中我們有歐式幾何,那么在這個新的因果語言之下,要給出什么樣的因果理論呢?那就是結(jié)構(gòu)因果模型。接下來我們將對do-算子的用處做進(jìn)一步的刻畫,而這需要通過把它與隨機(jī)對照實驗中“隨機(jī)化”這個概念做一番比照。

總之,觀測和干預(yù)對應(yīng)著兩種處理數(shù)據(jù)的方式。條件概率P(Y=y|X=x)對應(yīng)的前一種,一堆數(shù)據(jù)在我們面前,我們觀察那些X=x的數(shù)據(jù),看在這種條件下Y=y的概率是多少。但是概率的語言和因果的語言還是有很大不同,比如因果是單向的,而條件概率本身并不具有方向性;且當(dāng)一個共同因素(比如Z)決定另外兩個因素(比如X和Y)時,我們知道X的改變并不會導(dǎo)致Y的改變,但是在概率中并不能體現(xiàn)這種特性,這也就是為什么要擴(kuò)充概率的語言,引入do-算子的原因(注意,這里我們對于因果持一種操控主義的理解[10],原因是某種產(chǎn)生差異的東西,改變原因就能改變結(jié)果)。

四、因果語言與隨機(jī)對照實驗

正如在第二節(jié)所指出的,因果模型的提出是為了補(bǔ)隨機(jī)對照實驗之憾,挽隨機(jī)對照試驗之弊。但是因為模型本身有很多很強(qiáng)的假設(shè),比如從數(shù)據(jù)中發(fā)現(xiàn)因果結(jié)構(gòu)的“橋接原則”(bridge principle)(對于它的介紹可以參考楊仁杰[11]18-25),討論的模型是馬爾可夫或者半馬爾可夫模型,以及用不多的變量及其決定論方程來模擬一個復(fù)雜的機(jī)制。它能否成為一個合格的“替代”,有待時間的檢驗,但是不妨先把這些疑慮放在一邊,從一個簡單的例子來說明因果語言所要刻畫的隨機(jī)對照實驗的原理為何。

表2 是觀察數(shù)據(jù),從中我們發(fā)現(xiàn)一個奇怪的現(xiàn)象,如果分別考察男性和女性服藥之后的康復(fù)情況,我們發(fā)現(xiàn)不服藥更有利于康復(fù),但是如果考察總體的數(shù)據(jù),得出相反的結(jié)論,服藥有利于康復(fù)。當(dāng)然敏銳的讀者立刻就會發(fā)現(xiàn)其中的問題,觀測數(shù)據(jù)受性別的影響,女性更傾向于服藥,而男性更不傾向于服藥,而性別的差異又會影響康復(fù),所以可以把我們從表2中所讀到的這些因果假定用圖2表達(dá)如下:

令X=1 代表的是服藥,Y=1 代表的是康復(fù),Z=1 表示的是女性(Z=0 表示的是男性)。顯然Z混雜了X對于Y的因果影響,如果要求出X對于Y的因果影響,我們要控制Z。

表2 觀測數(shù)據(jù)(關(guān)于藥物的例子)

圖2 與數(shù)據(jù)一致的因果圖

在實際的隨機(jī)對照實驗中,如果認(rèn)定混雜因子是性別(Z),就要把總體按性別劃分,再在男性總體中隨機(jī)指派他們進(jìn)入處理組(treatment group)和對照組(control group),在女性的總體中隨機(jī)指派他們進(jìn)入處理組和對照組。

隨機(jī)對照實驗所做的就是破壞Z到X的因果機(jī)制,讓X對于Y的直接因果效應(yīng)彰顯出來。為了實現(xiàn)這樣一種破壞,比如可以通過拋硬幣這樣一個隨機(jī)過程來決定被實驗者是服藥還是服用安慰劑,由此把那些可能影響服藥的因素,比如本例子中性別的因素,還有在其他一些情形中的比如教育水平和健康保險等等影響服藥的因素給排除掉,使之不再影響是否服藥。

對應(yīng)到我們的因果圖3(這里可以把因果圖理解為數(shù)據(jù)的生成機(jī)制)中把Z指向X的箭頭刪除,這種把隨機(jī)化和因果圖中對應(yīng)箭頭的刪除聯(lián)系在一起的直觀并不是顯然的,正如珀爾[5]244所說:“在聽了他斯波蒂斯(Peter Spirtes)在瑞典的烏普薩拉(Uppsala)發(fā)表的一個演講之后,我(珀爾)第一次意識到,執(zhí)行干預(yù)①對于“干預(yù)”有不同的理解,伍德沃德(Woodward)[12]認(rèn)為應(yīng)該把干預(yù)理解為一個因果過程,它獨立于模型中的其他變量而起作用。而劉易斯(Lewis)[13]則把這種設(shè)定變量值的干預(yù)理解為一個小“奇跡”(miracle)??梢员豢醋鲝囊蚬麍D中刪除箭頭?!?/p>

圖3 隨機(jī)指派的作用

正如前面金字塔的例子,我們不需要耗時費力來測量金字塔的高度,只要用相對容易得到的數(shù)據(jù)在紙上算一算,就可以求出金字塔的高度。同樣地,當(dāng)面對因果問題,也希望不需要做隨機(jī)對照試驗,或者在因為各種阻力不能做隨機(jī)對照實驗的時候,結(jié)構(gòu)方程模型能擁有歐式幾何那樣的效力,我們只要數(shù)據(jù)在手,算一算即可求出所要求的因果關(guān)系。根本上,我們是比照著隨機(jī)對照實驗來設(shè)想因果語言的,它的主業(yè)是成為社會科學(xué)研究的方法論,它人工智能的蘊(yùn)含更多是上述工作的引申。

五、總結(jié)

有了我們前面所討論的因果語言,就可以把上述因果問題用它來表征如下:首先,問題1 和問題2 是經(jīng)典的概率問題。問題1 所說的是,如果季節(jié)是秋季且路面很滑的情況下,天下雨的概率有多大,可以形式化為:P(R=1|SE=3,S=1);問題2 所說的是,如果在秋季,路面很滑且灑水車又關(guān)著的情況下,天下雨的概率有多大,可以形式化為:P(R=1|SE=3,S=1,SP=1)。只要有上述圖1,以及與圖中節(jié)點相應(yīng)的變量的條件概率表(兩者組成了一個因果貝葉斯網(wǎng)絡(luò)),那么根據(jù)貝葉斯定理很容易就可以回答上述問題。需要注意的是,上述兩個問題都不是因果問題,只是一種回溯推理(Abduction),根據(jù)概率就可以得到想要的結(jié)果。

問題3 和問題4 則是典型的因果推理問題。問題3 屬于“展望式”(prospective)反事實,判斷的是一個行動對于一個變量的因果影響,即打開灑水車(do(SP=1))是不是會對下雨有因果影響,問題可以形式化為:P(R=1|do(SP=1))。問題4屬于“反省式”(retrospective)反事實,在給定路面是滑的且灑水車開著的證據(jù)之下,如果反事實設(shè)定灑水車是關(guān)著的,看對于里面的滑有無因果影響,問題可以形式化為:P(W_{SP=1}=1|SP=0,W=0)。根據(jù)珀爾的結(jié)構(gòu)因果理論,貝葉斯網(wǎng)絡(luò)加上do-演算就可以回答問題3。但是對于問題4的回答要困難很多,要對事物運(yùn)行的機(jī)制有深刻的理解才行,即需要知道對應(yīng)變量確切的結(jié)構(gòu)方程,以之為基礎(chǔ),根據(jù)珀爾[5]206,給定確切的因果模型M,反事實P(W_{SP=1}=1|SP=0,W=0)的判定可以通過如下三步來實現(xiàn)。首先是溯因推理,根據(jù)證據(jù){SP=0,W=0}來確定變量SE的概率或者確定的值;其次由表示反事實前件的行動do(SP=1)來修正模型M,得到子模型MSP=1;再次,通過得到的子模型和由證據(jù)所更新的SE的信息來計算反事實后件的值,并最終確定反事實的概率。顯然地,do-算子在上述問題上的形式化表述中扮演著重要作用。

需要注意的是,首先,一旦給出數(shù)學(xué)機(jī)制,實現(xiàn)上述過程的算法就不再那么困難了。但是也并不意味著珀爾意義上的智能就是唾手可及。人工智能是一個非常寬泛的領(lǐng)域,因果推斷只能算是其中認(rèn)知與推理工作,或者自然語言理解與交流工作的一部分(對于因果推斷在人工智能大圖景中的地位和作用可以參考:梅劍華[14]86-95),而本文所介紹的因果語言及其直覺、特點和作用更多是一種藍(lán)圖性的指南作用,它只是一個支點,如何讓機(jī)器人真正具有智能?數(shù)學(xué)的設(shè)想在工程上如何可行,如何貫徹?還需要多領(lǐng)域跨學(xué)科的合作與努力才行,總之,前路茫茫,任重道遠(yuǎn)。

其次,任何一個因果理論要配享“理論”之名,至少有四個方面的工作需要完成,首先,以數(shù)學(xué)的語言來表征因果問題;其次,提供精確的語言來傳達(dá)回答這些問題所依賴的假定;再次,提供一種系統(tǒng)的方式以回答至少其中一些問題,并把其他的問題標(biāo)記為“不可回答的”;最后,提供一種方法來決定,為了回答“不可回答的”問題,需要什么假定或者新的度量。限于篇幅,筆者只討論了第一個問題,并沒有具體闡述因果模型理論的成果(即后三個問題),觀念固然重要,但是圍繞著這個觀念發(fā)展出一種理論以處理方方面面的問題更是需要經(jīng)年累月的努力才行(當(dāng)然還有歷史的機(jī)運(yùn)),且更多時候,當(dāng)奔到終點,初始的想法早已面目全非。

再次,因果語言和概率語言的區(qū)分(即干預(yù)與觀測區(qū)分的區(qū)分)也給決策理論(decision theory)的研究很多啟發(fā),之前的決策理論研究并沒有清晰地區(qū)分行動和行為(對應(yīng)著我們討論中的干預(yù)與觀測),比如,杰弗里(Jeffrey)[15]就把行動看作是尋常的事件,于是純粹通過條件化來得到行動的效應(yīng),而這將會得到很多顯然的悖謬性結(jié)論:“病人應(yīng)該盡可能避免去看醫(yī)生,‘以減少得重病的概率’;工人也不要急匆匆趕著去上班,以減少他們睡過了頭的概率;學(xué)生們也不要為考試做準(zhǔn)備,否則將證明他們之前沒有努力學(xué)習(xí),等等(珀爾)”[5]108-109,[16]130。而這種區(qū)分能夠有力地廓清上述悖謬。

另外,與通過概率來理解因果的思路相對應(yīng),在哲學(xué)里面也有一種概率的因果理論,即試圖通過概率來理解因果,即這是一種認(rèn)為概率是一種更為根本的語言,并在此基礎(chǔ)上來定義因果的理論。我們說X是Y的原因,是因為X的發(fā)生提高了Y發(fā)生的概率。這在直覺上似乎是完全可以接受的,正如我們說吸煙是得肺癌的原因,并不是說吸煙一定會得肺癌,而是說吸煙提高了得肺癌的概率。珀爾指出概率并不足以勝任作為因果的語言,“因果關(guān)系不能簡化為概率”,在珀爾[5]249和珀爾和麥肯齊[2]23-51中指出正是哲學(xué)家們不假思索地訴諸這種處理不確定性的概率語言,而導(dǎo)致了數(shù)十年失敗的探索。

猜你喜歡
珀爾金字塔服藥
被這病賴上得終身服藥,變胖還沒勁兒?千萬別忽視
祝您健康(2023年7期)2023-07-06 21:15:15
“金字塔”
服藥禁忌
小主人報(2022年1期)2022-08-10 08:29:10
西摩和奧珀爾
A Study of the Pit-Aided Construction of Egyptian Pyramids
警惕服藥期間的飲食禁忌
祝您健康(2020年10期)2020-10-12 14:04:48
海上有座“金字塔”
珀爾修斯斬殺蛇發(fā)女妖美杜莎
讀者欣賞(2019年5期)2019-05-13 01:56:34
服藥先分陰陽
眼鏡比薩餅
子洲县| 罗城| 古丈县| 屏山县| 鹿邑县| 滦南县| 万盛区| 渭源县| 三门峡市| 商洛市| 广灵县| 会昌县| 石首市| 万载县| 通山县| 鲁甸县| 两当县| 革吉县| 青海省| 天全县| 明溪县| 平定县| 理塘县| 山东省| 盘锦市| 勐海县| 闽侯县| 哈尔滨市| 汽车| 即墨市| 韩城市| 崇仁县| 房山区| 桂东县| 江达县| 阿瓦提县| 大洼县| 石城县| 无锡市| 元氏县| 龙里县|