劉建明
摘要:目前,“大數(shù)據(jù)”問題被國內(nèi)外學(xué)術(shù)界和媒體火熱爆炒,認(rèn)為人類已經(jīng)或即將進(jìn)入大數(shù)據(jù)時(shí)代,體現(xiàn)出人類思維的理性化,真理之門因而被打開。實(shí)際上,大數(shù)據(jù)僅是認(rèn)識事物的一種統(tǒng)計(jì)分析手段,不具有物質(zhì)生產(chǎn)和社會管理徹底變革的性質(zhì),因此不具有時(shí)代的特征,它更不完全等于理性。過高估計(jì)大數(shù)據(jù)的理論和應(yīng)用價(jià)值,不啻是一種奇幻的虛構(gòu)。
關(guān)鍵詞:大數(shù)據(jù);大數(shù)據(jù)時(shí)代;虛構(gòu);兩面性
中圖分類號: 文獻(xiàn)標(biāo)識碼: 文章編號:
自2011年,西方有關(guān)“大數(shù)據(jù)”(big data)的理論像旋風(fēng)一樣席卷知識界,“大數(shù)據(jù)”的學(xué)術(shù)討論接連不斷。媒體火熱的爆炒,各種危言聳聽的結(jié)論,充滿種種玄思,Google上竟有13多億條這方面的報(bào)道和言論。我國IT業(yè)和新聞界也開展探討,并發(fā)表多篇文章。許多文章聲稱,企業(yè)和政府如不諳熟和掌控大數(shù)據(jù)洪流,將導(dǎo)致厄運(yùn),許多社會規(guī)律將被顛覆。
一、“大數(shù)據(jù)”是個(gè)什么概念
有人說,大數(shù)據(jù)實(shí)際是符號,是后信息時(shí)代的標(biāo)志;有人說,“大數(shù)據(jù)”是一種新的信息技術(shù),是控制社會、占有財(cái)富的工具;還有人說,大數(shù)據(jù)是資源寶庫,將決定一個(gè)國家的命運(yùn)。什么是“大數(shù)據(jù)”?“大數(shù)據(jù)”的概念究竟如何理解?
大數(shù)據(jù)(big data)是巨量資料、浩瀚信息的另種稱呼,實(shí)際是80年代末盛行一時(shí)的信息爆炸的同義語。早在1980年,美國未來學(xué)家阿爾文·托夫勒曾在《第三次浪潮》一書中,就將大數(shù)據(jù)稱為“互聯(lián)網(wǎng)上的海量數(shù)據(jù)”,當(dāng)時(shí)并沒有引起大驚小怪。但今天我們閱讀國內(nèi)外有關(guān)“大數(shù)據(jù)”文章,似乎感到它對人類的影響是致命的,讓人產(chǎn)生墜入神秘地帶的恐慌;社會管理如不改變以往規(guī)則,可能遭遇滅頂之災(zāi)。與這種感受恰恰相反,“大數(shù)據(jù)”是社會發(fā)展的新生,作為人類認(rèn)知社會方法的一次飛躍,“大數(shù)據(jù)”技術(shù)將給企業(yè)運(yùn)營、政府管理和媒體傳播的科學(xué)化創(chuàng)造有效的機(jī)制。
“大數(shù)據(jù)”在根本上是數(shù)據(jù)分析的前沿科學(xué),創(chuàng)立全新的量化研究的系統(tǒng)知識和方法,包括大數(shù)據(jù)技術(shù)、大數(shù)據(jù)工程、大數(shù)據(jù)理論和大數(shù)據(jù)應(yīng)用。 “大數(shù)據(jù)”這一語匯的深刻意義不在于“信息巨量”,更不是“巨量信息的記錄”和“對社會的描繪”,而是如何對巨量信息迅速做出有價(jià)值的處理和加工,使人類在信息爆炸面前成為主宰。處理“大數(shù)據(jù)”需要誕生一批新興產(chǎn)業(yè),出現(xiàn)以分析海量信息為專業(yè)的新職業(yè),社會各領(lǐng)域的發(fā)展將極大提高效率。
《大數(shù)據(jù):改變我們生活、工作和思想》一書的作者維克托·邁爾恩伯格(Viktor Mayer-Schonberger)和肯耐茨·N.庫基爾 ( Kenneth Niel Cukier )向讀者發(fā)問:大數(shù)據(jù)到底有多大?一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部內(nèi)容可以刻滿1.68億張DVD,發(fā)出的郵件有2940億封之多(相當(dāng)于美國兩年的紙質(zhì)信件數(shù)量),網(wǎng)絡(luò)發(fā)出的帖子達(dá)200萬個(gè)。據(jù)預(yù)測,到2020年,全世界所產(chǎn)生的數(shù)據(jù)規(guī)模將達(dá)到今天的44倍。①根據(jù)IT界人士的初步設(shè)想,大數(shù)據(jù)分析依據(jù)水平集成數(shù)據(jù)模型,把隱蔽于服務(wù)器的雜亂信息通過多個(gè)接口連接到程序上,在程序運(yùn)作后立刻掌握完整的信息流。再根據(jù)垂直集成的數(shù)據(jù)模型直接訪問SOA組件,通過“云構(gòu)架”查詢信息分析的結(jié)果,解決各種問題將變得異常便捷。
二、“大數(shù)據(jù)時(shí)代”的虛構(gòu)
最早提出“大數(shù)據(jù)時(shí)代”這一概念的是世界知名的思想庫麥肯錫(MGI)。麥肯錫在研究報(bào)告中指出,我們這個(gè)世界的數(shù)據(jù)量已經(jīng)爆炸,分析大數(shù)據(jù)將成為競爭的基礎(chǔ),支撐新的生產(chǎn)力增長。②“大數(shù)據(jù)”技術(shù)帶來社會的上述變化,是否意味一個(gè)新時(shí)代的開始?“大數(shù)據(jù)時(shí)代”和“信息時(shí)代”有根本區(qū)別嗎?
“時(shí)代”這一概念通常用于社會文明形態(tài),是指在一定時(shí)空范圍內(nèi)由物質(zhì)生產(chǎn)、政治制度或文化變遷而改變社會的整體面貌,并非可以隨意貼上何種標(biāo)簽。雖然人們可以對某一階段的流行思想或行為打上“時(shí)代”的標(biāo)記,但那絕不是嚴(yán)謹(jǐn)?shù)目茖W(xué)概念,而僅僅是一種習(xí)慣稱呼。有史以來,人類社會出現(xiàn)過石器時(shí)代、紅銅時(shí)代、青銅時(shí)代、鐵器時(shí)代、蒸汽時(shí)代、電氣時(shí)代、信息時(shí)代、蒙昧?xí)r代、啟蒙時(shí)代、奴隸制時(shí)代、資本主義時(shí)代、社會主義時(shí)代的說法,都是指物質(zhì)生產(chǎn)方式、政治制度或意識形態(tài)的特定狀況?!皶r(shí)代”絕不等同于年代,也不是任何新玩藝一出現(xiàn)、一普及,就打開了一扇新時(shí)代的大門。
“大數(shù)據(jù)”是信息技術(shù)的子集,僅僅是海量信息的統(tǒng)計(jì)分析方法,不具有物質(zhì)生產(chǎn)和社會管理徹底變革的性質(zhì),因此不具有嶄新的時(shí)代特征。作為信息經(jīng)濟(jì)時(shí)代的組成部分,“大數(shù)據(jù)”沒有超出“以數(shù)據(jù)流通推動產(chǎn)品流通,信息技術(shù)和信息勞動占有整個(gè)經(jīng)濟(jì)巨大比重”的信息生產(chǎn)形態(tài)。它只是信息時(shí)代的特征之一,而不是一種新的經(jīng)濟(jì)形態(tài)或社會形態(tài),因此“大數(shù)據(jù)時(shí)代”的概念,是奇幻的虛構(gòu)。
國內(nèi)某IT人士認(rèn)為:“大數(shù)據(jù)正把我們變成新的物種。首先,大數(shù)據(jù)改變了我們的思維方式,讓我們從因果關(guān)系的串聯(lián)思維變成了相關(guān)關(guān)系的并聯(lián)思維。第二,大數(shù)據(jù)改變了我們的生產(chǎn)方式,物質(zhì)產(chǎn)品的生產(chǎn)退居次位,信息產(chǎn)品的加工將成為主要的生產(chǎn)活動。第三,大數(shù)據(jù)改變了我們的生活方式,我們的精神世界和物質(zhì)世界都將構(gòu)建在大數(shù)據(jù)之上?!?③這個(gè)結(jié)論正是把“大數(shù)據(jù)”視為一種時(shí)代特征,玄思的味道十分濃厚。第一,在地球的溫度、磁場、大氣含氧量和紫外線不變的條件下,我們不可能變成新的物種,即使變也需要上百萬年。第二,大數(shù)據(jù)不可能使物質(zhì)產(chǎn)品的生產(chǎn)退居次位。我們只能依靠食品、水、房子、衣物、空氣和交通工具等物質(zhì)來生存,物質(zhì)產(chǎn)品的生產(chǎn)永遠(yuǎn)處于首位,開發(fā)大數(shù)據(jù)技術(shù)或加工信息產(chǎn)品都是為了提高物質(zhì)產(chǎn)品的生產(chǎn)效率和質(zhì)量,永遠(yuǎn)不具有主導(dǎo)地位。大數(shù)據(jù)本身既不能充饑,也不能讓人們安居。
邁爾恩伯格和庫基爾得出更為荒謬的結(jié)論:“大數(shù)據(jù)時(shí)代最大的轉(zhuǎn)變就是,放棄對因果關(guān)系的渴求,取而代之的是關(guān)注社會的各類關(guān)系。即只要知道‘是什么,而不需要知道‘為什么。這就顛覆了千百年來人類思維的慣例,對人類的認(rèn)知和與世界交流的方式提出了全新的挑戰(zhàn)?!?④如果大數(shù)據(jù)技術(shù)使人類只知道“是什么”,就不再有探索客觀規(guī)律的要求——尋求“為什么”,那么“大數(shù)據(jù)”只能讓人的認(rèn)識停留在事物的表面現(xiàn)象,使人類走向無知,以致消弭科學(xué)研究,最終導(dǎo)致社會倒退。這樣,“大數(shù)據(jù)”還有什么“時(shí)代”分量呢!?實(shí)際上,“大數(shù)據(jù)”分析平臺不僅讓人知道“是什么”,而且有時(shí)還讓人知道“為什么”,否則就沒有重大的工具性價(jià)值。
三、“大數(shù)據(jù)”的兩面性
大數(shù)據(jù)正在成為一股熱潮,不僅引發(fā)IT業(yè)的技術(shù)革新,也在不斷沖擊政治、商業(yè)、社會和其他科技領(lǐng)域。對其模式的思考,以及如何應(yīng)用它,已成為新一輪技術(shù)變革的最強(qiáng)音。但是,大數(shù)據(jù)技術(shù)也有兩面性。
從積極方面說,大數(shù)據(jù)確實(shí)已成為數(shù)據(jù)王國的主線,是下一步信息研究的主要對象。大眾媒體、社交媒體和各個(gè)經(jīng)濟(jì)和社會領(lǐng)域如何使用大數(shù)據(jù),正確評估大數(shù)據(jù)的商業(yè)價(jià)值,建立大數(shù)據(jù)的新興產(chǎn)業(yè),培育大數(shù)據(jù)的專業(yè)人員,將極大推動社會變革和經(jīng)濟(jì)發(fā)展。哈佛大學(xué)社會學(xué)教授加里·金說:“這是一場革命,龐大的數(shù)據(jù)資源使得各個(gè)領(lǐng)域開始了量化進(jìn)程,無論學(xué)術(shù)界、商界還是政府,所有領(lǐng)域都將開始這種進(jìn)程?!?⑤
虛擬世界有取之不盡的資源,數(shù)據(jù)可以轉(zhuǎn)化為資產(chǎn)和財(cái)富。據(jù)預(yù)測,僅美國醫(yī)療服務(wù)業(yè)大數(shù)據(jù)技術(shù)的應(yīng)用每年創(chuàng)造的價(jià)值就在3000億美元左右,全球個(gè)人位置服務(wù)的最終價(jià)值將達(dá)到7000多億美元。每天各種機(jī)構(gòu)、每個(gè)人和大量傳媒發(fā)送的圖片、文檔、視頻和言論雜亂無章、周而復(fù)始,人類早已無法掌控。而這些信息正是人類活動的真實(shí)記錄,大量來自人類的心理層面和社會組織的內(nèi)幕,通過大數(shù)據(jù)分析,人類完全有可能認(rèn)識復(fù)雜、隱秘的社會和自然現(xiàn)象,使科學(xué)研究進(jìn)入快速發(fā)展時(shí)期,過去的不可知領(lǐng)域可能將被人類破解。
從消極方面看,大數(shù)據(jù)技術(shù)不是萬能的,不能解決一切問題,它只是決策的一種量化手段。正確認(rèn)識事物的是非和利害,遵循人文精神是更為重要的前提。缺少這個(gè)前提,大數(shù)據(jù)不僅毫無用處,而且能為謬論尋求證據(jù)。
有的文章說:“大數(shù)據(jù)的時(shí)代其實(shí)是弘揚(yáng)理性精神的時(shí)代……美國在這方面就做得好很多,美國政府在各個(gè)領(lǐng)域都用數(shù)據(jù)分析,用數(shù)據(jù)決策,用數(shù)據(jù)創(chuàng)新?!?⑥美國確實(shí)重視數(shù)據(jù),研究社會問題都搞民意測驗(yàn)或其他實(shí)證調(diào)查,已有80多年的傳統(tǒng)。但2008年金融危機(jī)已過去5年,它的各種經(jīng)濟(jì)決策沒有使其走出困境;它的情報(bào)部門搜集的許多數(shù)據(jù)都是虛假的(例如伊拉克有大規(guī)模殺傷性武器、向國際原子能機(jī)構(gòu)提供虛假情報(bào)等)。盡管有大量腦庫提供佐證與數(shù)據(jù),美國歷屆政府都有重大失誤。美國蓋洛普民意調(diào)查所預(yù)測美國大選,每次通常搜集、分析十多萬個(gè)數(shù)據(jù),但卻多次預(yù)測失誤。大數(shù)據(jù)本身不完全等于理性,決策基于數(shù)據(jù)分析而并非基于經(jīng)驗(yàn)和直覺,是一種理性的表現(xiàn),但更大的理性是人文法則。即重視人民的普遍要求,維護(hù)各民族的尊嚴(yán)和文化,尊重人的自由、平等和權(quán)利。不尊重其他民族的歷史和風(fēng)俗,奉行種族歧視,只知道本國利益而不考慮他國利益,在某些國際事務(wù)中奉行雙重標(biāo)準(zhǔn),讓美國政府在內(nèi)政外交中屢屢受挫,給一些國家的老百姓造成不可彌補(bǔ)的傷害(例如多次對外戰(zhàn)爭濫殺平民),其中美國公民也遭到報(bào)復(fù)性的無辜虐殺。
遵循社會(國際)公德、人道主義、公正與正義、平等互利等友善原則,是分析數(shù)據(jù)的指導(dǎo)性準(zhǔn)則。數(shù)據(jù)是有類別的,它真實(shí)與否,對全社會是否有利,哪種意見是絕大多數(shù)人擁護(hù)、贊成的,贊成的人是哪個(gè)階層,等等,數(shù)據(jù)本身還存在一定的模糊性。對社會問題提取大數(shù)據(jù),主要了解絕大數(shù)人的意見,依據(jù)人民是否滿意做出結(jié)論。大數(shù)據(jù)與人民的數(shù)量絕非完全等同,“大數(shù)據(jù)”的應(yīng)用不會使真理之門為之洞開,也難以解決大眾傳媒的是非判斷。新聞傳媒反映主流輿論,做出正確而精準(zhǔn)的報(bào)道,僅僅依賴數(shù)據(jù)還遠(yuǎn)遠(yuǎn)不夠。
互聯(lián)網(wǎng)、大眾傳媒和社交媒體每天提供的巨量信息有大量冗余、虛假和有害的內(nèi)容,其中侵犯他人隱私權(quán)、生存權(quán)和精神健康權(quán)的信息與圖像大肆泛濫,“價(jià)值密度較低”。人類不但不能把大數(shù)據(jù)一股腦地當(dāng)作寶庫,而且要冷靜審視數(shù)據(jù)的兩面性,拋棄有害和無用的信息,使數(shù)據(jù)分析立于價(jià)值和法律層面,避免浪費(fèi)專業(yè)人員的時(shí)間和精力。
機(jī)器儲存和分析難以囊括幾十億兆數(shù)據(jù),即使儲存了這些數(shù)據(jù),專業(yè)人員也無法全部調(diào)閱,刪除和忘掉無價(jià)值的、不相關(guān)的信息是處理大數(shù)據(jù)的重要原則。正如邁爾恩伯格在《刪除:數(shù)字時(shí)代遺忘的美德》一書中所說,數(shù)字技術(shù)和全球網(wǎng)絡(luò)壓倒一切,使我們忘記自己的自然能力,我們必須重新恢復(fù)忘記。人類應(yīng)采取的措施是“數(shù)字化節(jié)制、保護(hù)信息隱私權(quán)、建設(shè)數(shù)字隱私權(quán)基礎(chǔ)設(shè)施、調(diào)整人類的現(xiàn)有認(rèn)知、打造良性的信息生態(tài)、完全語境化”?!按髷?shù)據(jù)的取舍之道,就是把有意義的留下來,把無意義的去掉。只有理解了在大數(shù)據(jù)中,需要的是什么,以及如何判斷這種需要,才能舉一反三地明白到底為什么要去掉那些不需要的?!雹?/p>