国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

因果推斷與大數(shù)據(jù)

2014-04-29 21:39:25
互聯(lián)網(wǎng)周刊 2014年18期
關(guān)鍵詞:珀?duì)?/a>康德因果關(guān)系

大數(shù)據(jù)中一個(gè)耳熟能詳?shù)恼f(shuō)法是:大數(shù)據(jù)長(zhǎng)于分析相關(guān)關(guān)系,而非因果關(guān)系。但這可能是一個(gè)偽命題。如何從相關(guān)關(guān)系中推斷出因果關(guān)系,才是大數(shù)據(jù)真正問(wèn)題所在。這個(gè)問(wèn)題,被稱為因果推斷(causal inference),它是蘋果iPhone 6的語(yǔ)音識(shí)別和谷歌的無(wú)人駕馭汽車技術(shù)的基礎(chǔ)。這個(gè)領(lǐng)域的大牛,美國(guó)工程院院士于達(dá)·珀?duì)枺↗udea Pearl,國(guó)內(nèi)一般譯為朱迪亞·珀?duì)枺┮虼双@得2011年的圖靈獎(jiǎng)。珀?duì)栐菏刻岢龈怕屎鸵蚬评硌菟惴?,徹底改變了人工智能最初基于?guī)則和邏輯的方向。

珀?duì)栐菏康乃枷?,在圖靈問(wèn)題的頂層設(shè)計(jì)高度,改變了我關(guān)于大數(shù)據(jù)的認(rèn)識(shí)。與珀?duì)栐菏康纳疃人枷虢涣魇鲁雠既弧!懊绹?guó)大師行”的舊金山站安排9月3日下午見(jiàn)珀?duì)栐菏俊1緛?lái)只是禮節(jié)性的見(jiàn)面,請(qǐng)他簡(jiǎn)單介紹一下研究成果。但珀?duì)栐菏匡@然理解錯(cuò)了,以為是專業(yè)交流,于是準(zhǔn)備了64頁(yè)的數(shù)學(xué)講義。當(dāng)他聽(tīng)說(shuō)聽(tīng)眾竟然來(lái)自媒體、法律、經(jīng)濟(jì)等文科背景時(shí),不禁瞠目結(jié)舌。他說(shuō):“對(duì)不起,我不知道你們……”。改講義已來(lái)不及了,只好硬著頭皮,對(duì)牛彈琴。不料,兩小時(shí)后,珀?duì)栐菏空劦门d起,早忘了我們是學(xué)什么的,奔放的數(shù)學(xué)思想噴薄而出,圖論、概率論、非線性數(shù)學(xué)的公式像袋鼠一樣,隔著十幾步十幾步地跳躍,如黃河之水,一發(fā)而不可收。時(shí)間已到,主辦方反復(fù)提示無(wú)效,又講了一個(gè)多小時(shí)。

我身旁的兄弟,被我晃醒,好像還在夢(mèng)中,幾乎已經(jīng)坐不正了。我靠一杯一杯的咖啡支撐,勉強(qiáng)聽(tīng)著。之后,卻意外地聽(tīng)入了迷,最后聽(tīng)到如醉如癡。因?yàn)槲野l(fā)現(xiàn)珀?duì)栐菏恐v的,正是我在大數(shù)據(jù)上日思夜想的問(wèn)題。

近年來(lái),我在介紹大數(shù)據(jù)時(shí),對(duì)相關(guān)關(guān)系與因果關(guān)系這個(gè)說(shuō)法一直心存疑惑。雖然也引進(jìn)美國(guó)大數(shù)據(jù)理論,如巴拉巴西院士的說(shuō)法,但這個(gè)疑惑并沒(méi)有消除。相關(guān)關(guān)系對(duì)應(yīng)經(jīng)驗(yàn)歸納,因果關(guān)系對(duì)應(yīng)理性演繹。但難道大數(shù)據(jù)只有歸納,沒(méi)有演繹嗎,或者問(wèn),大數(shù)據(jù)如何才能實(shí)現(xiàn)歸納與演繹間的轉(zhuǎn)化?在這個(gè)思維瓶頸上,珀?duì)栐菏恳幌曼c(diǎn)破了我。

珀?duì)栐菏孔吆?,大家面面相覷,互相打聽(tīng),這三個(gè)半小時(shí),灌的是什么東東。在交流學(xué)習(xí)體會(huì)時(shí),一位數(shù)學(xué)專業(yè)的專家說(shuō),他感到珀?duì)栐菏渴窃谟靡环N非線性的方法,解決線性的問(wèn)題。統(tǒng)計(jì)過(guò)去不能處理因果關(guān)系,只能處理相關(guān)關(guān)系,珀?duì)栐菏康呢暙I(xiàn)是把因果關(guān)系引入了統(tǒng)計(jì)概率分析,把非結(jié)構(gòu)化的東西半結(jié)構(gòu)化了。半途接替口語(yǔ)翻譯進(jìn)行專業(yè)翻譯的查理,是騰訊大數(shù)據(jù)師,專業(yè)研究方向與珀?duì)柾I(lǐng)域。他以“西安的模型能否用于成都”為比喻,從專業(yè)角度又向大家解釋了一遍。我被當(dāng)作文科的代表,在毫無(wú)心理準(zhǔn)備的情況下,推到臺(tái)上交流體會(huì)。直到被研究非線性物理出身的查理超贊時(shí),才確認(rèn)自己聽(tīng)的、想的,確實(shí)是珀?duì)栐菏恐v的,感覺(jué)像中了獎(jiǎng)一樣。

我一上來(lái)就說(shuō),圖靈問(wèn)題的核心是人與自然(機(jī)器)關(guān)系問(wèn)題,人工智能就是要實(shí)現(xiàn)二者的統(tǒng)一。這個(gè)問(wèn)題對(duì)應(yīng)的今天的主題,是定性(非結(jié)構(gòu)化)與定量,歸納與演繹,感性與理性的關(guān)系——相關(guān)關(guān)系與因果關(guān)系——如何統(tǒng)一的問(wèn)題。用珀?duì)栐菏康脑捳f(shuō),就是從巴比倫思維到雅典思維的問(wèn)題(The causal revolution from associations to counterfactuals from Babylon to Athens)。大數(shù)據(jù)發(fā)展當(dāng)前存在的問(wèn)題是,偏離了圖靈原問(wèn)題的軌道,變成理性計(jì)算的天下,以谷歌的數(shù)學(xué)算法為代表;而忽視了臉譜的算法(基于人與人associations的感性算法)。后者在統(tǒng)計(jì)學(xué)中,就是相關(guān)關(guān)系數(shù)據(jù)分析。珀?duì)栐菏繉?duì)后者也不滿意,因此才批評(píng)說(shuō)“不要老想數(shù)據(jù),先把現(xiàn)實(shí)用模型模擬出來(lái)”(大意如此),意思是要把非結(jié)構(gòu)化的定性問(wèn)題結(jié)構(gòu)化。

查理此前曾說(shuō)珀?duì)栐菏刻岢龅氖切葜兊膯?wèn)題。我說(shuō),珀?duì)栐菏刻岢龊徒鉀Q問(wèn)題的思路讓我想起康德,我覺(jué)得他今天講的內(nèi)容,就是《純粹理性批判》的數(shù)學(xué)版,而方法上的思路讓我聯(lián)想到牛頓與萊布尼茨。我回國(guó)后查閱專業(yè)資料時(shí),發(fā)現(xiàn)有人這么評(píng)價(jià)珀?duì)栐菏康膯?wèn)題意識(shí):“有人提到了哲學(xué)(史)上的休謨問(wèn)題(我的轉(zhuǎn)述):人類是否能從有限的經(jīng)驗(yàn)中得到因果律?這的確是一個(gè)問(wèn)題,這個(gè)問(wèn)題最后促使德國(guó)哲學(xué)家康德為調(diào)和英國(guó)經(jīng)驗(yàn)派(休謨)和大陸理性派(萊布尼茲-沃爾夫)而寫了巨著《純粹理性批判》?!笨磥?lái)所見(jiàn)略同。

康德《純粹理性批判》的原問(wèn)題,是經(jīng)驗(yàn)與理性之間的關(guān)系,相當(dāng)于大數(shù)據(jù)中相關(guān)關(guān)系與因果關(guān)系之間的關(guān)系。我說(shuō),康德當(dāng)年解同樣問(wèn)題的思路,像極了珀?duì)栐菏?。康德設(shè)置了一個(gè)叫“圖式”的概念,作為溝通經(jīng)驗(yàn)與理性的中間框架(FRAME)?!皥D式”的特征是,兼具經(jīng)驗(yàn)的具體性與理性的普遍性,但既不同于經(jīng)驗(yàn),也不等于理性。珀?duì)栐菏康摹皥D式”就是因果圖 (Causal Diagram),是他的結(jié)構(gòu)化理論。這個(gè)結(jié)構(gòu)不是完全理性的,而是可以靈活調(diào)整的。我說(shuō),珀?duì)栐菏康慕Y(jié)構(gòu)與康德的圖式唯一不同在于,前者設(shè)置了可替換的部件模塊,用于根據(jù)情況臨時(shí)調(diào)整,因此不是機(jī)械的結(jié)構(gòu),而是活的、松耦合的結(jié)構(gòu)(例如,就象查理講的,西安的“普遍真理”模型,只要更換一些適應(yīng)成都“具體實(shí)踐”的子模塊,就可以用于成都)。

在方法上,珀?duì)栐菏恳园乩瓐D著名的洞穴寓言,說(shuō)明因果(真相)、結(jié)構(gòu)(人)與相關(guān)(影子)之間的映射關(guān)系。我說(shuō),這更像牛頓和萊布尼茨的方法論:以理性為極限值,以經(jīng)驗(yàn)為數(shù)列,中間設(shè)一個(gè)結(jié)構(gòu)化的函數(shù)(相當(dāng)于洞穴中的人)。經(jīng)驗(yàn)(相關(guān))可以無(wú)限接近理性(因果),永遠(yuǎn)達(dá)不到因果(極限值),但可以視為等于因果。珀?duì)栐菏康莫?dú)特之處,只不過(guò)是把這個(gè)“函數(shù)”(圖式),泛函化了,實(shí)現(xiàn)了從結(jié)構(gòu)化向非結(jié)構(gòu)化、從線性到非線性的轉(zhuǎn)化。為此,在結(jié)構(gòu)模型上,進(jìn)行大量復(fù)雜的數(shù)學(xué)展開(kāi),成為他理論的重點(diǎn)。他的模型被稱為“圖模型”或者“貝葉斯網(wǎng)絡(luò)”(Bayesian network),用來(lái)描述變量聯(lián)合分布或者數(shù)據(jù)生成機(jī)制。好在聽(tīng)眾睡覺(jué)時(shí),他講的都是這一部分具體內(nèi)容。關(guān)于他的因果結(jié)構(gòu)理論,我聽(tīng)課時(shí)私底下議論說(shuō),這個(gè)用流形上的微積分(Calculus on Manifolds),所謂“橡皮膜上的拓?fù)鋷缀螌W(xué)”也做得出來(lái)。

當(dāng)前,人們討論大數(shù)據(jù),有一個(gè)不好的傾向,在結(jié)構(gòu)化還沒(méi)有打好基礎(chǔ)情況下,片面追求所謂非結(jié)構(gòu)化數(shù)據(jù)。這樣就陷入珀?duì)栐菏颗u(píng)的“老想數(shù)據(jù)”的狀態(tài),相當(dāng)于解微分的時(shí)候,不列函數(shù),就想直接從數(shù)列中求極值一樣。在中國(guó),這種情況尤為嚴(yán)重。這會(huì)把大數(shù)據(jù)搞成脫離表義基礎(chǔ)的禪宗。在商業(yè)上,不排除實(shí)用主義地利用大數(shù)據(jù),找到賣貨上的皮毛聯(lián)系,但更適合小攤小販,畢竟不知其所以然,就做不大,做不長(zhǎng)。

不過(guò)這也不奇怪,整個(gè)統(tǒng)計(jì)學(xué)和概率論,目前還停留在這個(gè)水平上,大多是關(guān)于“相關(guān)關(guān)系”的理論,而關(guān)于“因果關(guān)系”的理論非常稀少。Karl Pearson 就明確反對(duì)用統(tǒng)計(jì)研究因果關(guān)系。困擾統(tǒng)計(jì)的根本問(wèn)題(辛普森悖論,Yule-Simpsons Paradox),也同樣是困擾大數(shù)據(jù)的根本問(wèn)題。

泛而言之,在整個(gè)邏輯學(xué)中,歸納論只能表示事物之間的相關(guān)關(guān)系,還無(wú)法指出真正的因果關(guān)系。這是有人類以來(lái)的難題。巴比倫人在畢達(dá)哥拉斯之前一千年已掌握了勾股定理的應(yīng)用,也早就開(kāi)始了天文觀察;但雅典人卻從經(jīng)驗(yàn)中提煉出了天文學(xué)的思辨理論。我們現(xiàn)在在還只是大數(shù)據(jù)上的巴比倫人。

話說(shuō)回來(lái),因果推斷過(guò)猶不及。如果把相關(guān)關(guān)系完全結(jié)構(gòu)化了,也有問(wèn)題,那就會(huì)排斥人類自由意志的空間。玻爾院士似乎還沒(méi)有想過(guò)其中的哥德?tīng)栥U搯?wèn)題。正如段永朝評(píng)論玻爾院士的那樣:“不可知與可知,一定是你中有我,我中有你。他們想解決這個(gè)問(wèn)題。確定性、不確定攪成一團(tuán)。一時(shí)來(lái)看,方法上實(shí)現(xiàn)了;但根本上來(lái)說(shuō),科學(xué)觀要升級(jí)。”

想一想珀?duì)栐菏恳舱娌蝗菀?,畢業(yè)于人稱的“野雞”大學(xué),超前人類幾十年為大數(shù)據(jù)奠基,卻少有人聽(tīng)懂他。他兒子Daniel Pearl是華爾街日?qǐng)?bào)的駐外記者,9-11后在巴基斯坦被恐怖組織抓住,幾天后斬首碎尸。珀?duì)栐菏繘](méi)回答提問(wèn)就走了,說(shuō)要陪夫人。因?yàn)榫驮谏衔鐐鱽?lái)消息,第二位美國(guó)記者像他兒子一樣被恐怖組織斬首,他夫人一定會(huì)再次想起兒子。

猜你喜歡
珀?duì)?/a>康德因果關(guān)系
廣東第二課堂·小學(xué)(2021年10期)2021-12-03 20:45:38
玩忽職守型瀆職罪中嚴(yán)重不負(fù)責(zé)任與重大損害后果的因果關(guān)系
珀?duì)栃匏箶貧⑸甙l(fā)女妖美杜莎
讀者欣賞(2019年5期)2019-05-13 01:56:34
純接受性的被給予?——康德論自我刺激、內(nèi)感覺(jué)和注意
做完形填空題,需考慮的邏輯關(guān)系
藝術(shù)百家
眼鏡比薩餅
幫助犯因果關(guān)系芻議
康德是相容論者嗎?
對(duì)康德空間觀的誤解及詰難的澄清與辯護(hù)
伊金霍洛旗| 江阴市| 霞浦县| 海盐县| 台安县| 榆树市| 区。| 方城县| 西盟| 云安县| 天气| 涡阳县| 南和县| 嵊泗县| 逊克县| 屏山县| 涪陵区| 左贡县| 南开区| 巨鹿县| 墨竹工卡县| 昭苏县| 柳江县| 定远县| 靖宇县| 景东| 南岸区| 集安市| 利川市| 阿瓦提县| 韶关市| 连山| 瑞金市| 永仁县| 广宗县| 南靖县| 隆昌县| 牙克石市| 宁化县| 滕州市| 商城县|