文/黃欣榮
大數(shù)據(jù)主義者如何看待理論、因果與規(guī)律
——兼與齊磊磊博士商榷
文/黃欣榮
美國(guó)《連線》雜志主編安德森認(rèn)為在大數(shù)據(jù)時(shí)代,知識(shí)的發(fā)現(xiàn)可以從數(shù)據(jù)開(kāi)始,不再需要預(yù)先做出理論的假設(shè),并預(yù)言理論即將終結(jié)。但安德森所說(shuō)的“理論的終結(jié)”不是說(shuō)大數(shù)據(jù)時(shí)代就不需要理論,不再有理論,只是科學(xué)發(fā)現(xiàn)不再僅從理論出發(fā),也可從數(shù)據(jù)出發(fā)。他說(shuō):“大量的可用數(shù)據(jù),以及處理這些數(shù)據(jù)的統(tǒng)計(jì)工具,提供了一個(gè)全新的方式認(rèn)識(shí)世界。通過(guò)相關(guān)關(guān)系而不是因果關(guān)系,即使沒(méi)有清晰的模型、統(tǒng)一的理論,甚至沒(méi)有任何機(jī)理解釋?zhuān)茖W(xué)依然能夠取得進(jìn)步。”因此,安德森并不是全盤(pán)否定科學(xué)理論,只是說(shuō)在大數(shù)據(jù)時(shí)代,科學(xué)發(fā)現(xiàn)可以從數(shù)據(jù)開(kāi)始,而不是必須從理論假設(shè)出發(fā)。
《大數(shù)據(jù)時(shí)代》作者舍恩伯格沒(méi)有安德森極端,而是有所保留。雖然他也認(rèn)為,在大數(shù)據(jù)時(shí)代,從海量數(shù)據(jù)中發(fā)現(xiàn)相關(guān)關(guān)系比尋找因果關(guān)系更重要,科學(xué)發(fā)現(xiàn)更多地依賴于數(shù)據(jù),而不是預(yù)設(shè)的普遍規(guī)則,應(yīng)盡量讓數(shù)據(jù)自己說(shuō)話。在大數(shù)據(jù)時(shí)代,“所有的普遍規(guī)則都不重要了……重要的是數(shù)據(jù)分析,它可以揭示一切問(wèn)題”。但是,他并不完全否定理論在大數(shù)據(jù)中的作用,他在書(shū)中明確告誡:“大數(shù)據(jù)時(shí)代不是理論消亡的時(shí)代,相反地,理論貫穿于大數(shù)據(jù)分析的方方面面?!?/p>
美國(guó)計(jì)算機(jī)專(zhuān)家、圖靈獎(jiǎng)得主吉姆·格雷(Jim Gray)認(rèn)為歷史上曾出現(xiàn)過(guò)三種科學(xué)研究范式,即經(jīng)驗(yàn)范式、理論范式和計(jì)算范式。隨著海量數(shù)據(jù)的出現(xiàn),科學(xué)發(fā)現(xiàn)模式將發(fā)生重大變化,在前三種科學(xué)發(fā)現(xiàn)范式的基礎(chǔ)上出現(xiàn)了第四種范式,即數(shù)據(jù)密集型科學(xué)范式。數(shù)據(jù)密集型科學(xué)范式的邏輯起點(diǎn)是大數(shù)據(jù),它從大數(shù)據(jù)出發(fā),通過(guò)數(shù)據(jù)之間的相關(guān)關(guān)系發(fā)現(xiàn)大數(shù)據(jù)所呈現(xiàn)出來(lái)的數(shù)據(jù)規(guī)律。由大數(shù)據(jù)所構(gòu)成的數(shù)據(jù)世界成為數(shù)據(jù)密集型科學(xué)研究的直接對(duì)象,數(shù)據(jù)挖掘是大數(shù)據(jù)時(shí)代科學(xué)研究最重要的方法,數(shù)據(jù)規(guī)律是數(shù)據(jù)密集型科學(xué)最重要的成果。當(dāng)然,格雷也特別申明,第四范式與前三種范式并列存在,相互補(bǔ)充,共同構(gòu)成了科學(xué)研究的范式體系,它絕不是要取代前三種范式,只是作為前三種范式的重要補(bǔ)充和完善。
大數(shù)據(jù)革命帶來(lái)了科學(xué)發(fā)現(xiàn)的新途徑與新模式,也改變了理論在科學(xué)發(fā)現(xiàn)中的作用。從大數(shù)據(jù)相關(guān)學(xué)者,特別是安德森、舍恩伯格、格雷的論述中,我們可以提煉出大數(shù)據(jù)主義的科學(xué)發(fā)現(xiàn)觀以及理論在科學(xué)發(fā)現(xiàn)中的作用。(1)數(shù)據(jù)成為科學(xué)研究的直接對(duì)象。以往的科學(xué)研究都是直接面對(duì)自然界或人類(lèi)社會(huì),而大數(shù)據(jù)的興起以及數(shù)據(jù)世界的形成,讓我們擺脫了對(duì)直接對(duì)象的依賴,取而代之的是作為自然或社會(huì)現(xiàn)象映射而成的數(shù)據(jù)世界,這樣科學(xué)研究可以直接以數(shù)據(jù)世界為研究對(duì)象。(2)大數(shù)據(jù)徹底改變了科學(xué)數(shù)據(jù)的采集方式。自從經(jīng)驗(yàn)科學(xué)興起之后,數(shù)據(jù)就成為科學(xué)研究的重要手段,然而,以往的數(shù)據(jù)都是研究者預(yù)先設(shè)計(jì)好目的,然后進(jìn)行觀察或?qū)嶒?yàn),所得數(shù)據(jù)已經(jīng)被觀察者污染,也就是觀察已經(jīng)滲透理論。然而,在大數(shù)據(jù)時(shí)代,數(shù)據(jù)主要來(lái)自智能感知設(shè)備、網(wǎng)絡(luò)瀏覽或者網(wǎng)絡(luò)社交等留下的數(shù)據(jù)足跡,這些數(shù)據(jù)因?yàn)椴皇茄芯空哳A(yù)先設(shè)計(jì)而獲得的數(shù)據(jù),沒(méi)有被研究者污染,因而更具有客觀實(shí)在性。(3)大數(shù)據(jù)時(shí)代凸顯出數(shù)據(jù)在科學(xué)發(fā)現(xiàn)中的重要作用。以往的科學(xué)數(shù)據(jù)只是驗(yàn)證科學(xué)假說(shuō)的工具,科學(xué)發(fā)現(xiàn)主要依賴于理論的猜想,即使是邏輯實(shí)證主義的“科學(xué)始于觀察”,其觀察仍然滲透著理論。但是,在大數(shù)據(jù)時(shí)代,數(shù)據(jù)具有了純客觀性,而且從數(shù)據(jù)出發(fā),就能發(fā)現(xiàn)數(shù)據(jù)中蘊(yùn)含的規(guī)律性,因此帶來(lái)了“科學(xué)始于數(shù)據(jù)”的科學(xué)發(fā)現(xiàn)新模式。(4)理論在科學(xué)發(fā)現(xiàn)中的作用方式發(fā)生了重大變化。在大數(shù)據(jù)時(shí)代,初始數(shù)據(jù)雖未被采集者污染,但在隨后的數(shù)據(jù)挖掘過(guò)程中,理論開(kāi)始滲入其中,比如數(shù)據(jù)倉(cāng)庫(kù)的選取、挖掘工具的選擇,以及挖掘結(jié)果的解釋等,都滲透著數(shù)據(jù)挖掘者的意圖。這就是說(shuō),在大數(shù)據(jù)時(shí)代,科學(xué)發(fā)現(xiàn)依然滲透著理論,只是滲透的環(huán)節(jié)被延后罷了,理論在數(shù)據(jù)挖掘、科學(xué)發(fā)現(xiàn)中依然起著重要的作用。
舍恩伯格認(rèn)為,在大數(shù)據(jù)時(shí)代,相關(guān)性分析可能比因果性分析更重要,因?yàn)榕c其用臆想的因果假設(shè),不如從表象出發(fā),快速把握他們的相關(guān)關(guān)系,“大數(shù)據(jù)的相關(guān)關(guān)系分析法更準(zhǔn)確、更快捷,而且不容易受偏見(jiàn)的影響”。特別是在日常生活、商業(yè)分析中,相關(guān)性分析更是一種快速、高效的分析、預(yù)測(cè)工具,“相關(guān)關(guān)系很有用,不僅僅是因?yàn)樗転槲覀兲峁┬乱暯?,而且提供的視角都很清晰。而我們一旦把因果關(guān)系考慮進(jìn)來(lái),這些視角就有可能被蒙蔽”。 舍恩伯格知道,相關(guān)性只是一種表象,因果性才是表象背后的本質(zhì),因此他并不否定因果性的存在,相反,他認(rèn)為相關(guān)性是認(rèn)識(shí)因果性的有效途徑?!跋嚓P(guān)關(guān)系分析本身意義重大,同時(shí)它也為研究因果關(guān)系奠定了基礎(chǔ)?!薄霸诖蠖鄶?shù)情況下,一旦我們完成了對(duì)大數(shù)據(jù)的相關(guān)關(guān)系分析,而又不再滿足于僅僅知道‘是什么’時(shí),我們就會(huì)繼續(xù)向更深層次研究因果關(guān)系,找出背后的‘為什么’?!彼鞔_地表示:“因果關(guān)系還是有用的,但是它不再被看成是意義來(lái)源的基礎(chǔ)?!?/p>
史蒂夫·洛爾在《大數(shù)據(jù)主義》一書(shū)中提出要“厘清大數(shù)據(jù)中的相關(guān)關(guān)系與因果關(guān)系”,認(rèn)為相關(guān)關(guān)系可以為商業(yè)、醫(yī)學(xué)等應(yīng)用領(lǐng)域提供有效的預(yù)測(cè)工具,但不能因此否定因果性。英國(guó)韋斯特敏斯特大學(xué)David Chand1er在論文《沒(méi)有因果的世界:大數(shù)據(jù)與后人類(lèi)時(shí)代的來(lái)臨》中認(rèn)為,大數(shù)據(jù)并不是要取代因果關(guān)系,它只是帶來(lái)了新的歸納方法和新的知識(shí)生產(chǎn)方式。
歸納起來(lái),大數(shù)據(jù)主義對(duì)相關(guān)性與因果性的態(tài)度是:在大數(shù)據(jù)時(shí)代,由于數(shù)據(jù)的暴增,尋找數(shù)據(jù)間的相關(guān)性比因果性更重要,大數(shù)據(jù)主義承認(rèn)事物的因果性,但更應(yīng)該把握事物的相關(guān)性。大數(shù)據(jù)主義為什么強(qiáng)調(diào)相關(guān)性,弱化因果性呢?我們可以從四個(gè)方面來(lái)說(shuō)明。(1)就相關(guān)性與因果性的關(guān)系來(lái)說(shuō),相關(guān)性更廣泛,因果性更嚴(yán)格,因果性是相關(guān)性的一種特例。(2)大數(shù)據(jù)并不否定因果,只是不強(qiáng)調(diào)因果。自休謨對(duì)因果性進(jìn)行全面懷疑和批判以來(lái),雖然眾多科學(xué)家、哲學(xué)家做出了種種努力,但仍然很難證明某兩種現(xiàn)象或事物之間就一定存在著因果關(guān)系。休謨只是把因果性看成是人們的一種習(xí)慣,康德的《純粹理性批判》也只是做出了一種工具主義的修補(bǔ),仍然沒(méi)法證明因果性的必然性。大數(shù)據(jù)沒(méi)有站到徹底否定因果性的隊(duì)伍中,而是承認(rèn)因果性,但從相關(guān)性入手來(lái)把握。從方法論來(lái)說(shuō),相關(guān)性比較表象,只要兩者之間有依隨關(guān)系就認(rèn)為具有相關(guān)性,因此容易被識(shí)別;而因果性則要反映事物之間內(nèi)在的本質(zhì)關(guān)系,這就不容易被認(rèn)識(shí)和把握。大數(shù)據(jù)從相關(guān)性而不是因果性入手,是一種聰明的方法論策略。(3)大數(shù)據(jù)時(shí)代的來(lái)臨,海量數(shù)據(jù)使得尋找因果關(guān)系如同大海撈針一樣困難。大數(shù)據(jù)時(shí)代的數(shù)據(jù)量迅速發(fā)展到PB、ZB級(jí)別,要在這么多的數(shù)據(jù)中找到與某個(gè)數(shù)據(jù)具有因果關(guān)系的另一個(gè)數(shù)據(jù),這比大海撈針還困難。正如統(tǒng)計(jì)物理學(xué)面對(duì)海量的分子,研究者無(wú)法跟蹤每個(gè)分子的運(yùn)動(dòng)軌跡以及它們之間的因果關(guān)系,只能用統(tǒng)計(jì)學(xué)的方法研究大量分子運(yùn)動(dòng)所表現(xiàn)出來(lái)的宏觀行為和規(guī)律,而且這些規(guī)律只遵從統(tǒng)計(jì)規(guī)律,沒(méi)有因果規(guī)律那種必然性。大數(shù)據(jù)的PB、ZB級(jí)別的數(shù)據(jù),跟統(tǒng)計(jì)物理學(xué)所面對(duì)的海量分子一樣,我們不可能跟蹤每個(gè)數(shù)據(jù)的來(lái)龍去脈、前因后果,只能使用數(shù)據(jù)挖掘工具挖掘出數(shù)據(jù)之間的所表現(xiàn)出來(lái)的宏觀行為以及數(shù)據(jù)之間的相關(guān)關(guān)系。(4)許多時(shí)候,特別是日常生活、商業(yè)應(yīng)用中,相關(guān)關(guān)系就已經(jīng)足夠。在許多場(chǎng)合,我們的確不需要知道事物之間內(nèi)在的因果關(guān)系,只要知道它們之間具有依隨性質(zhì)的相關(guān)關(guān)系,在我們發(fā)現(xiàn)某現(xiàn)象或數(shù)據(jù)變化時(shí),大致能夠推斷與之相關(guān)的另一個(gè)現(xiàn)象或數(shù)據(jù)也可能會(huì)發(fā)生變化。例如,我們發(fā)現(xiàn),天氣長(zhǎng)期下雨會(huì)帶來(lái)雨具銷(xiāo)售的增加,而我國(guó)南方總是春雨綿綿,于是聰明的商家早已準(zhǔn)備好了各種雨具來(lái)迎接南方雨季的到來(lái)。又如,每年大學(xué)新生開(kāi)學(xué)季,都有大量的銀行卡、手機(jī)卡等商業(yè)機(jī)會(huì),于是聰明的商家早已與學(xué)校相關(guān)部門(mén)將各種卡隨錄取通知書(shū)投送到新生手中。對(duì)商業(yè)應(yīng)用來(lái)說(shuō),最關(guān)鍵的是快速抓住機(jī)會(huì),至于背后的因果關(guān)系則留給學(xué)者們?nèi)ヌ接憽?/p>
因此,大數(shù)據(jù)主義不是要否定事物之間的因果性,并用相關(guān)性取代,只是不再過(guò)分執(zhí)著于事物因果性的追求,采取從表象的、數(shù)據(jù)之間的相關(guān)性入手,發(fā)現(xiàn)數(shù)據(jù)規(guī)律,然后由此作為路徑,再打開(kāi)黑箱,尋找數(shù)據(jù)之間的因果關(guān)系,由此,相關(guān)關(guān)系就成了尋求因果關(guān)系的一把方便鑰匙。當(dāng)然,大數(shù)據(jù)也能夠接受暫時(shí)找不到因果關(guān)系,只能找到相關(guān)關(guān)系的情況存在。
大數(shù)據(jù)主義者對(duì)世界觀、規(guī)律性的態(tài)度,歸結(jié)起來(lái)主要表現(xiàn)為如下五個(gè)方面,即整體主義、復(fù)雜多樣、關(guān)注細(xì)節(jié)、數(shù)據(jù)規(guī)律、透明世界。
(1)整體主義。自從古希臘以來(lái),西方科學(xué)主要是通過(guò)打開(kāi)黑箱,還原到部分甚至是“始基”去研究其中的奧秘。這種還原方法論反映到數(shù)據(jù)采集上就是受控實(shí)驗(yàn)或抽樣調(diào)查方法。由于技術(shù)能力的限制,以往的數(shù)據(jù)采集只能在理想化處理之后,通過(guò)精心設(shè)計(jì)的受控實(shí)驗(yàn),或精心設(shè)計(jì)調(diào)查問(wèn)卷和調(diào)查對(duì)象之后所進(jìn)行的抽樣調(diào)查來(lái)獲取所需的數(shù)據(jù)。小數(shù)據(jù)時(shí)代的隨機(jī)采樣就是試圖以最少的數(shù)據(jù)獲得最多的信息,這就是將復(fù)雜的現(xiàn)象還原為少量的抽樣數(shù)據(jù)。大數(shù)據(jù)時(shí)代的來(lái)臨,讓我們不再需要選取樣本,或者說(shuō)樣本量可以最大化,這就是大數(shù)據(jù)的“全數(shù)據(jù)模式”。由于與對(duì)象相關(guān)的所有可能性都包括其中,至大無(wú)外,所以這其實(shí)就是一個(gè)整體。以往我們經(jīng)常說(shuō)要用整體論的視野整體地看問(wèn)題,但由于沒(méi)有將整體技術(shù)化,在解決實(shí)際問(wèn)題時(shí)依然運(yùn)用部分代替整體的還原方法。大數(shù)據(jù)的“全數(shù)據(jù)模式”將傳統(tǒng)整體論數(shù)據(jù)化,用全部數(shù)據(jù)代表整體,并可以進(jìn)行計(jì)算、分析,是一種數(shù)據(jù)化、可操作的整體觀,因此大數(shù)據(jù)主義是一種數(shù)據(jù)化的整體主義。
(2)復(fù)雜多樣。經(jīng)過(guò)孤立、靜止、抽樣等理想化處理,所獲數(shù)據(jù)變得簡(jiǎn)單、純粹、單一,所反映出來(lái)的現(xiàn)象世界也變成了簡(jiǎn)單、單一的理想世界。大數(shù)據(jù)時(shí)代的數(shù)據(jù)來(lái)自各種途徑,例如各類(lèi)傳感器數(shù)據(jù)、網(wǎng)絡(luò)瀏覽數(shù)據(jù)、網(wǎng)絡(luò)社交數(shù)據(jù)、電話短信數(shù)據(jù)、消費(fèi)數(shù)據(jù)、刷卡數(shù)據(jù)等等,這些數(shù)據(jù)都屬于原始數(shù)據(jù),因此數(shù)據(jù)粗糙、類(lèi)型多樣。但是,大數(shù)據(jù)時(shí)代的數(shù)據(jù)由于沒(méi)有人工的預(yù)先參與,因而未被人工污染,因此保留了原始性、粗糙性、復(fù)雜性、多樣性等,由此所反映出來(lái)的現(xiàn)象世界也變成了一個(gè)復(fù)雜多樣的真實(shí)世界。復(fù)雜性科學(xué)早就批判了傳統(tǒng)科學(xué)的理想化和簡(jiǎn)單化,認(rèn)為真實(shí)世界是復(fù)雜、粗糙、多樣的世界,而大數(shù)據(jù)技術(shù)則用可計(jì)算的海量數(shù)據(jù)來(lái)刻畫(huà)了復(fù)雜性科學(xué)的理念,讓復(fù)雜性的科學(xué)理念變成了大數(shù)據(jù)的技術(shù)手段。
(3)關(guān)注細(xì)節(jié)。理想化之后的受控實(shí)驗(yàn)和抽樣調(diào)查,都是選取預(yù)先被認(rèn)為重要的少量數(shù)據(jù)來(lái)代表所有數(shù)據(jù),或者說(shuō)由少量數(shù)據(jù)來(lái)描述真實(shí)世界的復(fù)雜現(xiàn)象,例如全國(guó)大學(xué)生有幾千萬(wàn),但不少做大學(xué)生相關(guān)問(wèn)題調(diào)查的研究者往往在幾所大學(xué)發(fā)放幾百份問(wèn)卷,就得出全國(guó)大學(xué)生怎么樣的結(jié)論。做抽樣調(diào)查者辯護(hù)說(shuō),只要能夠保證抽樣的絕對(duì)隨機(jī)性,少量樣本就能代表全體。問(wèn)題是,我們?cè)趺粗谰哂薪^對(duì)隨機(jī)性?還有,事物本身千差萬(wàn)別、豐富多彩,少量樣本又怎么來(lái)代表這些細(xì)節(jié)?大數(shù)據(jù)讓所有樣本都保留,不要其他少數(shù)樣本來(lái)代表自己,這樣每個(gè)樣本的獨(dú)特之處、出彩之處都有可能保留下來(lái)。因此,大數(shù)據(jù)的“全數(shù)據(jù)模式”就保留了每個(gè)樣本的豐富細(xì)節(jié)和個(gè)性,具有統(tǒng)計(jì)學(xué)所說(shuō)的“遍歷性”,而且數(shù)據(jù)越多,細(xì)節(jié)越豐富。抽樣的數(shù)據(jù)無(wú)法被放大以便觀察細(xì)節(jié),而大數(shù)據(jù)的數(shù)據(jù)可以被隨意組合、放大,可以追溯每個(gè)數(shù)據(jù)的細(xì)節(jié),大數(shù)據(jù)成了數(shù)據(jù)顯微鏡。因此,大數(shù)據(jù)比以往的小數(shù)據(jù)更加關(guān)注細(xì)節(jié),更加注重個(gè)性。
(4)數(shù)據(jù)規(guī)律。小數(shù)據(jù)時(shí)代根據(jù)因果推理所得到的規(guī)律叫做因果規(guī)律,簡(jiǎn)稱為規(guī)律。因果規(guī)律被認(rèn)為具有確定性和普遍必然性,具有放之四海而皆準(zhǔn)的可重復(fù)性。利用因果規(guī)律,不但能夠解釋過(guò)去發(fā)生的事件,而且可以預(yù)測(cè)未來(lái)事件的發(fā)生。大數(shù)據(jù)不再執(zhí)著追求因果必然性,而是側(cè)重于通過(guò)數(shù)據(jù)之間的關(guān)聯(lián)性而尋找事件之間的相關(guān)性,并根據(jù)數(shù)據(jù)挖掘、分析得出只具有概率性的數(shù)據(jù)規(guī)律。這種數(shù)據(jù)規(guī)律只是數(shù)據(jù)之間的關(guān)聯(lián)性,不一定具有普遍必然性,也不一定具有絕對(duì)的可重復(fù)性,因此在因果論者看來(lái),這種數(shù)據(jù)規(guī)律根本就不算規(guī)律,并由此推斷大數(shù)據(jù)主義否定規(guī)律,并說(shuō)大數(shù)據(jù)主義者將世界看作是一個(gè)混亂無(wú)序的世界。數(shù)據(jù)規(guī)律是不是規(guī)律呢?數(shù)據(jù)規(guī)律也能夠解釋過(guò)去,預(yù)測(cè)未來(lái),而且在無(wú)法得到因果規(guī)律的時(shí)候,數(shù)據(jù)規(guī)律可以大顯身手,因此數(shù)據(jù)規(guī)律也是規(guī)律的一種類(lèi)型。大數(shù)據(jù)主義不但承認(rèn)世界規(guī)律的存在,而且拓展了規(guī)律的內(nèi)涵和外延,將數(shù)據(jù)規(guī)律納入規(guī)律的范疇,用數(shù)據(jù)規(guī)律補(bǔ)充了因果規(guī)律之不足。舍恩伯格和巴拉巴西都承認(rèn)在混雜多樣的世界都能找到規(guī)律,不能找到因果規(guī)律,起碼能找到數(shù)據(jù)規(guī)律,而且利用數(shù)據(jù)規(guī)律,再?gòu)?fù)雜的現(xiàn)象都可以解釋和預(yù)測(cè),甚至小數(shù)據(jù)時(shí)代難以認(rèn)識(shí)和預(yù)測(cè)的人類(lèi)行為,都能做出高達(dá)93%以上的準(zhǔn)確預(yù)測(cè)。因此,大數(shù)據(jù)沒(méi)有否定規(guī)律,只是拓展了規(guī)律的內(nèi)涵和外延,以便更好認(rèn)識(shí)和把握復(fù)雜世界的規(guī)律。
(5)透明世界。大數(shù)據(jù)技術(shù)可以將一切現(xiàn)象、行為數(shù)據(jù)化,萬(wàn)物的背后都留下了一條可被存儲(chǔ)、識(shí)別的數(shù)據(jù)鏈。這些數(shù)據(jù)在沒(méi)有發(fā)現(xiàn)用途的時(shí)候往往被看作是數(shù)據(jù)垃圾,但事實(shí)上這些數(shù)據(jù)全程記錄了事物的存在和演化的全息軌跡。這些數(shù)據(jù)被永遠(yuǎn)存儲(chǔ)于網(wǎng)絡(luò)、云端,幾乎難于被徹底消除,因此即使某事物已經(jīng)消失,但與其對(duì)應(yīng)的數(shù)據(jù)足跡依然存在于數(shù)據(jù)世界中。通過(guò)對(duì)數(shù)據(jù)世界的挖掘,一切都無(wú)法偽裝和隱藏,就像真有上帝之眼一樣被永遠(yuǎn)地監(jiān)視著。數(shù)據(jù)化的世界是一個(gè)可以永遠(yuǎn)被存儲(chǔ)、識(shí)別、挖掘的世界,通過(guò)相關(guān)性不但能夠知道過(guò)去的一切,而且未來(lái)的一切也可以被掌控。自然界及其規(guī)律都隱藏在黑暗中,但在大數(shù)據(jù)的陽(yáng)光照耀下,世界的一切都變成了透明!因此,大數(shù)據(jù)時(shí)代的世界是一個(gè)徹底透明的世界。
綜上所述,大數(shù)據(jù)主義者并不否定科學(xué)理論或終結(jié)科學(xué)理論,只是從海量數(shù)據(jù)中進(jìn)行知識(shí)發(fā)現(xiàn)時(shí)不能預(yù)先帶著理論的有色眼鏡,必須先“讓數(shù)據(jù)說(shuō)話”,尊重?cái)?shù)據(jù)本身顯現(xiàn)出來(lái)的規(guī)律,數(shù)據(jù)采集環(huán)節(jié)不一定預(yù)先依賴?yán)碚?,但在?shù)據(jù)挖掘和知識(shí)生產(chǎn)中,大數(shù)據(jù)主義仍然承認(rèn)理論的作用。大數(shù)據(jù)不否定事物因果性的存在,但數(shù)據(jù)挖掘時(shí)不會(huì)一開(kāi)始就糾結(jié)于因果性,它更重視數(shù)據(jù)顯現(xiàn)出來(lái)的相關(guān)性。如果需要,我們可以在認(rèn)識(shí)相關(guān)性之后再進(jìn)一步深挖因果性,相關(guān)性為尋求因果性提供了猜想的路徑。大數(shù)據(jù)主義者認(rèn)為,世界是復(fù)雜多樣的,但皆可被數(shù)據(jù)化,通過(guò)數(shù)據(jù)之間的相關(guān)性能夠挖掘出事物間的數(shù)據(jù)規(guī)律,并通過(guò)數(shù)據(jù)規(guī)律來(lái)解釋、預(yù)測(cè)由因果規(guī)律難于解釋和預(yù)測(cè)的復(fù)雜現(xiàn)象,因此他們不但承認(rèn)世界的規(guī)律性,而且在以往難于發(fā)現(xiàn)規(guī)律的地方找出規(guī)律,讓科學(xué)的陽(yáng)光照亮混雜世界的每一個(gè)角落,我們的世界變成了一個(gè)完全透明的世界。
(作者系江西財(cái)經(jīng)大學(xué)馬克思主義學(xué)院教授;摘自《理論探索》2016年第6期)