李育卓 趙玲
(北京郵電大學(xué)馬克思主義教學(xué)與研究中心,北京 100876)
大數(shù)據(jù)技術(shù)的形成與本質(zhì)
李育卓趙玲
(北京郵電大學(xué)馬克思主義教學(xué)與研究中心,北京100876)
現(xiàn)代技術(shù)的迅速發(fā)展促進(jìn)了大數(shù)據(jù)時(shí)代的到來(lái),大數(shù)據(jù)技術(shù)的發(fā)展極大地變革了人們的生產(chǎn)、生活和思維方式,給我們帶來(lái)前所未有的機(jī)遇和挑戰(zhàn)。大數(shù)據(jù)的產(chǎn)生是隨著現(xiàn)代技術(shù)的發(fā)展以及互聯(lián)網(wǎng)的發(fā)展而形成的。大數(shù)據(jù)技術(shù)的本質(zhì)就是從海量的數(shù)據(jù)中發(fā)現(xiàn)隱藏在其中的規(guī)律并對(duì)事物發(fā)展的可能性做出預(yù)測(cè)。
數(shù)據(jù)大數(shù)據(jù)現(xiàn)代技術(shù)
隨著云計(jì)算、物聯(lián)網(wǎng)以及社交網(wǎng)絡(luò)的發(fā)展,人類所儲(chǔ)存的數(shù)據(jù)越來(lái)越多,已經(jīng)發(fā)生了質(zhì)的變化。在全球范圍內(nèi),個(gè)人電腦、平板電腦、智能手機(jī)等常見(jiàn)的計(jì)算終端以及更廣闊的、泛在互連的智能設(shè)備都連接到網(wǎng)絡(luò)之中,基于社會(huì)化網(wǎng)絡(luò)的平臺(tái)和應(yīng)用,讓數(shù)以百億計(jì)的機(jī)器、企業(yè)、個(gè)人隨時(shí)隨地都會(huì)獲取和產(chǎn)生新的數(shù)據(jù),也使數(shù)據(jù)的積累呈爆發(fā)式增長(zhǎng),這些數(shù)據(jù)的保存積累形成“大數(shù)據(jù)”。大數(shù)據(jù)時(shí)代已經(jīng)到來(lái)。大數(shù)據(jù)涉及到幾乎所有的領(lǐng)域,并對(duì)政治、經(jīng)濟(jì)、教育、醫(yī)療以及整個(gè)社會(huì)帶來(lái)巨大的變革。大數(shù)據(jù)技術(shù)是如何形成的?它的本質(zhì)是什么?我們應(yīng)該以怎樣理性的態(tài)度去看待它?對(duì)這些問(wèn)題的思考將有助于我們更加深刻的認(rèn)識(shí)大數(shù)據(jù)對(duì)于人類生產(chǎn)、生活等各個(gè)方面的影響。
美國(guó)知名的咨詢公司麥肯錫是研究大數(shù)據(jù)的先驅(qū),它將大數(shù)據(jù)定義為“大小超出常規(guī)的數(shù)據(jù)庫(kù)工具獲取、存儲(chǔ)、管理和分析能力的數(shù)據(jù)集?!保?]維基百科中“大數(shù)據(jù)指的是所涉及的資料量規(guī)模巨大到無(wú)法通過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理并整理成為幫助企業(yè)經(jīng)營(yíng)決策目的的資訊?!保?]國(guó)際數(shù)據(jù)公司(IDC)從四個(gè)特征來(lái)定義大數(shù)據(jù):海量的數(shù)據(jù)規(guī)模(Volume)、快速的數(shù)據(jù)流轉(zhuǎn)和動(dòng)態(tài)的數(shù)據(jù)體系(Velocity)、多樣的數(shù)據(jù)類型(Variety)、巨大的數(shù)據(jù)價(jià)值(Value)[3]。這些定義無(wú)一例外的突出了一個(gè)“大”字,旨在說(shuō)明數(shù)據(jù)“大”是大數(shù)據(jù)的一個(gè)重要特征。然而,大數(shù)據(jù)的“大”不是憑空出來(lái)的,而是一個(gè)發(fā)展的過(guò)程。它是隨著互聯(lián)網(wǎng)的發(fā)展階段發(fā)展而增加的。
1.1數(shù)據(jù)庫(kù)發(fā)展階段
數(shù)據(jù)庫(kù)的出現(xiàn)使得數(shù)據(jù)管理的復(fù)雜度大大降低,各種各樣的數(shù)據(jù)庫(kù)在不同的領(lǐng)域發(fā)揮著它們的作用,超市的銷售記錄、銀行的交易記錄、醫(yī)院病人的醫(yī)療記錄等等,這些數(shù)據(jù)庫(kù)都大大的提高了行業(yè)的生產(chǎn)效率。人類社會(huì)數(shù)據(jù)量第一次大的飛躍就是數(shù)據(jù)庫(kù)的廣泛使用。這個(gè)階段最主要的特點(diǎn)就是數(shù)據(jù)都是單向的,數(shù)據(jù)往往是跟隨著我們的經(jīng)營(yíng)活動(dòng)產(chǎn)生并記錄在數(shù)據(jù)庫(kù)中。這時(shí)候的數(shù)據(jù)的產(chǎn)生是被動(dòng)的。
1.2雙向交互階段
這一階段就是我們所說(shuō)的Web2.0時(shí)代。在這一時(shí)期,數(shù)據(jù)呈現(xiàn)爆發(fā)式的增長(zhǎng)。每個(gè)人不僅是信息的接受者,還是信息的產(chǎn)生者。這一時(shí)期主要是以微博、博客為代表的新型社交網(wǎng)絡(luò)的發(fā)展以及以智能手機(jī)、平板電腦為代表的便攜式移動(dòng)設(shè)備的使用和發(fā)展,使得人們產(chǎn)生數(shù)據(jù)的意愿更加強(qiáng)烈和途徑更加便捷。這一階段的主要特征就是數(shù)據(jù)時(shí)雙向互動(dòng)的。數(shù)據(jù)的產(chǎn)生是主動(dòng)的。
1.3自動(dòng)產(chǎn)生階段
這一階段是人類社會(huì)數(shù)據(jù)量的第三次飛躍,最終導(dǎo)致了大數(shù)據(jù)的產(chǎn)生。此次飛躍的根本原因在于傳感器的廣泛使用。隨著科技的發(fā)展,人們已經(jīng)有能力制造相當(dāng)微小的帶有處理功能的傳感器,并開(kāi)始將這些設(shè)備廣泛地布置于社會(huì)的各個(gè)角落,通過(guò)這些設(shè)備來(lái)對(duì)監(jiān)控整個(gè)社會(huì)的運(yùn)轉(zhuǎn)。這些設(shè)備會(huì)隨時(shí)隨地源源不斷地產(chǎn)生新數(shù)據(jù),這種數(shù)據(jù)的產(chǎn)生是自動(dòng)的。
總而言之,大數(shù)據(jù)的產(chǎn)生不是一蹴而就的,而是經(jīng)過(guò)了被動(dòng)、主動(dòng)、自動(dòng)三個(gè)階段。這三個(gè)階段的數(shù)據(jù)共同構(gòu)成了大數(shù)據(jù)的數(shù)據(jù)來(lái)源。然而,大數(shù)據(jù)的產(chǎn)生不僅僅只有“大”就稱之為大數(shù)據(jù),而是人們可以通過(guò)對(duì)這些海量數(shù)據(jù)的分析,找出關(guān)聯(lián),發(fā)現(xiàn)規(guī)律,檢驗(yàn)假設(shè),提高決策的準(zhǔn)確性。這才是我們理解的大數(shù)據(jù)的真正含義。大數(shù)據(jù)的產(chǎn)生從根本上來(lái)講正是由于技術(shù)的不斷進(jìn)步而發(fā)展起來(lái)的。
吳國(guó)盛教授說(shuō)過(guò),技術(shù)是人的存在方式,從這個(gè)意義上來(lái)說(shuō)人類的歷史也就是技術(shù)發(fā)展的歷史,人類歷史上經(jīng)歷了三次信息技術(shù)革命,語(yǔ)言的創(chuàng)造、文字的創(chuàng)造、電信通訊的創(chuàng)造。從這種意義上來(lái)講,大數(shù)據(jù)的產(chǎn)也是現(xiàn)代科技的發(fā)展的必然。大數(shù)據(jù)時(shí)代的到來(lái)在某種意義上來(lái)講也可以說(shuō)是第四次技術(shù)革命的到來(lái)。
語(yǔ)言是最原始的技術(shù),技術(shù)思想家芒福德認(rèn)識(shí)到,人首先不是工具的創(chuàng)造者,而是意義的創(chuàng)造者;語(yǔ)言的進(jìn)化比武器和工具的進(jìn)化更原始更具有先導(dǎo)作用,一切工具的進(jìn)化都是以特定的語(yǔ)言進(jìn)化為前提。語(yǔ)言使人們認(rèn)識(shí)世界,建立相互之間的聯(lián)系、溝通。語(yǔ)言本身就是創(chuàng)造的力量,是構(gòu)造實(shí)在的能力,是意義的來(lái)源。而在現(xiàn)代人只把語(yǔ)言理解成一種傳遞信息的工具,“工具性的語(yǔ)言是本真語(yǔ)言的一種墮落,它是語(yǔ)言之召喚和匯聚能力的一種遺忘和喪失?!保?]
文字的出現(xiàn)實(shí)現(xiàn)了人類思想遠(yuǎn)距離和世代相襲的傳遞,人類聯(lián)合因此擴(kuò)大。它突破了空間的限制,但從語(yǔ)言到文字的技術(shù)進(jìn)化,在柏拉圖看來(lái)就是一種記憶力的喪失。他認(rèn)為,文字只會(huì)使人們?nèi)菀滓蕾囃庠诘臅?shū)寫(xiě)符號(hào),而慢慢丟棄其內(nèi)在的記憶力。我們史前的一些傳說(shuō)都是口口相傳,流傳于世;自從文字的出現(xiàn)人們開(kāi)始記錄歷史,也出現(xiàn)了一些錯(cuò)誤,由于每個(gè)人的理解不同,寫(xiě)出來(lái)的文字也有的被誤解,導(dǎo)致了各種正史與野史之分。
電信通訊的創(chuàng)造尤其是計(jì)算機(jī)的廣泛應(yīng)用使得我們的生活更加的便捷和高效;這是一種進(jìn)步;但也是一種退化。通訊技術(shù)的發(fā)展突破了時(shí)空的界限,使世界變得越來(lái)越小,人們之間的距離“越來(lái)越近”。事實(shí)上我們?cè)谌粘I钪须x不開(kāi)手機(jī)、離不開(kāi)電腦,它給我們提供了各種信息,讓我們和世界緊緊相連,然而,這也使我們?cè)谀撤N意義上成了一種“殘廢”,我們所獲得的知識(shí)全都是碎片化的記憶、就像是盲人摸象似的,沒(méi)有一個(gè)整體上的把握;而且由于這種通訊工具的發(fā)展使得我們?nèi)祟惛黜?xiàng)機(jī)能也在不斷的退化,視聽(tīng)說(shuō)同時(shí)在不斷的退化。
云計(jì)算、物聯(lián)網(wǎng)以及社交網(wǎng)絡(luò)這些技術(shù)的發(fā)展為大數(shù)據(jù)的產(chǎn)生做足了準(zhǔn)備。云計(jì)算改變了數(shù)據(jù)的存儲(chǔ)方式。在云計(jì)算出現(xiàn)以前,數(shù)據(jù)大多數(shù)保存在個(gè)人的計(jì)算機(jī)和企業(yè)、政府的服務(wù)器中。而云計(jì)算則是把所有的數(shù)據(jù)集中儲(chǔ)存在“云端”,用戶通過(guò)瀏覽器或者專用應(yīng)用程序來(lái)訪問(wèn)。云計(jì)算技術(shù)的發(fā)展大大的降低了數(shù)據(jù)存儲(chǔ)的成本,為大數(shù)據(jù)的產(chǎn)生提供了存儲(chǔ)空間和訪問(wèn)渠道。而物聯(lián)網(wǎng)和社交網(wǎng)絡(luò)的發(fā)展使得數(shù)據(jù)得以隨時(shí)隨地的產(chǎn)生,并且數(shù)據(jù)類型豐富,內(nèi)容鮮活,這些技術(shù)的發(fā)展更加加速了大數(shù)據(jù)時(shí)代的到來(lái)。由此可見(jiàn),正是由于這些技術(shù)的迅速發(fā)展促進(jìn)了大數(shù)據(jù)的到來(lái),大數(shù)據(jù)技術(shù)的發(fā)展改變著人們的生產(chǎn)、生活和思維方式,給我們帶來(lái)了前所未有的變革。
現(xiàn)代技術(shù)的迅速發(fā)展促進(jìn)了大數(shù)據(jù)時(shí)代的到來(lái),大數(shù)據(jù)技術(shù)的發(fā)展極大地變革了人們的生產(chǎn)、生活和思維方式,給我們帶來(lái)前所未有的機(jī)遇和挑戰(zhàn)。對(duì)這些機(jī)遇和挑戰(zhàn)我們必須以一種辯證、理性的態(tài)度去審視、去把握,只有這樣,我們才能更深刻的理解大數(shù)據(jù)技術(shù)的本質(zhì)。
3.1大數(shù)據(jù)技術(shù)帶來(lái)的機(jī)遇
(1)預(yù)測(cè)成為核心?!按髷?shù)據(jù)的核心就是預(yù)測(cè)?!比驈?fù)雜網(wǎng)絡(luò)研究權(quán)威巴拉巴西(Albert-László Barabási)在《爆發(fā):大數(shù)據(jù)時(shí)代預(yù)見(jiàn)未來(lái)的新思維》一書(shū)中指出:“人類行為93%是可以預(yù)測(cè)的?!彪S著微博、微信等社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)的發(fā)展,人們每天在網(wǎng)上產(chǎn)生的數(shù)據(jù)量大的驚人,網(wǎng)民在網(wǎng)上產(chǎn)生的海量數(shù)據(jù)記錄著他們的思想、行為乃至情感,加上政府和企業(yè)的信息系統(tǒng)每天源源不斷產(chǎn)生大量的數(shù)據(jù),收集環(huán)境和社會(huì)管理所需要的各種信息。在這些數(shù)據(jù)中蘊(yùn)含著大量的信息和潛在的規(guī)律,我們可以通過(guò)對(duì)相關(guān)數(shù)據(jù)的分析,使得政府了解公民的訴求和意見(jiàn),做出更加科學(xué)的決策;使得企業(yè)了解客戶的需求,增加銷售額。大數(shù)據(jù)把數(shù)學(xué)運(yùn)算運(yùn)用到海量的數(shù)據(jù)上來(lái)預(yù)測(cè)事物發(fā)展的可能性。倘若我們能夠有效地組織和利用大數(shù)據(jù),我們的生活將會(huì)發(fā)生巨大甚至是本質(zhì)上的變化和發(fā)展。
(2)大數(shù)據(jù)技術(shù)可運(yùn)用到各行各業(yè)。中國(guó)工程院院士鄔賀銓曾指出,大數(shù)據(jù)技術(shù)可運(yùn)用到各行各業(yè)?!霸谵r(nóng)業(yè)領(lǐng)域,硅谷有個(gè)氣候公司,從美國(guó)氣象局等數(shù)據(jù)庫(kù)中獲得幾十年的天氣數(shù)據(jù),將各地降雨、氣溫、土壤狀況與歷年農(nóng)作物產(chǎn)量的相關(guān)度做成精密圖表,預(yù)測(cè)農(nóng)場(chǎng)來(lái)年產(chǎn)量,向農(nóng)戶出售個(gè)性化保險(xiǎn)。”在商業(yè)領(lǐng)域,亞馬遜、阿里巴巴、京東商城等公司通過(guò)分析大量的銷售數(shù)據(jù),了解顧客的喜好,根據(jù)顧客的喜好推薦相關(guān)的產(chǎn)品,提高銷售額。在醫(yī)療保健領(lǐng)域,“谷歌流感趨勢(shì)”項(xiàng)目根據(jù)人們?cè)诰W(wǎng)上的搜索記錄來(lái)分析流感的傳播情況,他們的預(yù)測(cè)與美國(guó)疾控中心的官方數(shù)據(jù)公布的數(shù)據(jù)相關(guān)性高達(dá)97%。大數(shù)據(jù)運(yùn)用到各行各業(yè),從海量的數(shù)據(jù)中發(fā)現(xiàn)隱藏在其中的規(guī)律,以及可能的商機(jī)。大數(shù)據(jù)給我們的生產(chǎn)生活帶來(lái)前所未有的機(jī)遇,只有正確的利用好大數(shù)據(jù),才能更好的為我們的生產(chǎn)、生活服務(wù)。
3.2大數(shù)據(jù)技術(shù)帶來(lái)的挑戰(zhàn)
大數(shù)據(jù)給我們帶來(lái)機(jī)遇的同時(shí),也同時(shí)帶來(lái)了一系列的挑戰(zhàn)。個(gè)人隱私的保護(hù)和信息安全的保障成為這一時(shí)期必須要考慮并解決的問(wèn)題,個(gè)人隱私對(duì)于每個(gè)人來(lái)講都不同也都一樣。不同的是每個(gè)人對(duì)于隱私的理解都不一樣,接受的程度不一樣。有的人愿意把自己的事情與別人分享,在微博、在微信隨時(shí)發(fā)布自己的信息,而有的人則不喜歡,不愿意讓別人知道自己的信息;一樣的是在這個(gè)大數(shù)據(jù)時(shí)代我們都必須面對(duì)這一現(xiàn)實(shí)存在,不管你愿意還是不愿意數(shù)據(jù)隨時(shí)記錄著你的一言一行。我們必須面對(duì)隱私相對(duì)于大數(shù)據(jù)之前從來(lái)沒(méi)有過(guò)的挑戰(zhàn)。
3.3辯證地看待大數(shù)據(jù)技術(shù)
一方面,我們應(yīng)該清楚地認(rèn)識(shí)到大數(shù)據(jù)時(shí)代到來(lái)的必然性。大數(shù)據(jù)的產(chǎn)生是科學(xué)技術(shù)發(fā)展的必然。早在1980 年著名未來(lái)學(xué)家阿爾文·托夫勒在其《第三次浪潮》一書(shū)中已經(jīng)提到“大數(shù)據(jù)”一詞。在20世紀(jì)90 年代,“數(shù)據(jù)倉(cāng)庫(kù)之父”比爾·伊蒙(Bill Inmon)更明確提出了“大數(shù)據(jù)”的概念。但是在當(dāng)時(shí)沒(méi)有引起人們的關(guān)注,近兩年,大數(shù)據(jù)已經(jīng)充斥到我們生活的方方面面。這是由于數(shù)字技術(shù)的不斷革新突破、數(shù)字化信息存儲(chǔ)和處理能力的不斷提升、云計(jì)算與物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)的興旺發(fā)達(dá)造成的,這些技術(shù)的發(fā)展使人們成為了數(shù)據(jù)的產(chǎn)生者。這充分說(shuō)明了數(shù)據(jù)在當(dāng)今社會(huì)的重要性,也讓我們知道大數(shù)據(jù)的到來(lái)是不可避免的,是我們必須直面的現(xiàn)實(shí)。
另一方面,我們?cè)谡J(rèn)識(shí)到大數(shù)據(jù)來(lái)臨的必然性的同時(shí),也應(yīng)該認(rèn)識(shí)到對(duì)數(shù)據(jù)的過(guò)度依賴是否會(huì)造成我們被數(shù)據(jù)所“控制”。技術(shù)給我們帶來(lái)了便利,在大數(shù)據(jù)時(shí)代,數(shù)據(jù)充斥在我們生活的方方面面,數(shù)據(jù)至上、技術(shù)崇拜、工具理性將有增無(wú)減,技術(shù)拜物教將水漲船高,這值得我們高度警惕。
綜上所述,現(xiàn)代技術(shù)的迅速發(fā)展促進(jìn)了大數(shù)據(jù)時(shí)代的到來(lái),大數(shù)據(jù)技術(shù)的本質(zhì)就就是從海量的數(shù)據(jù)中發(fā)現(xiàn)隱藏在其中的規(guī)律并對(duì)事物發(fā)展的可能性做出預(yù)測(cè)。我們應(yīng)該辯證地去看待大數(shù)據(jù)對(duì)我們生活生產(chǎn)方面的影響。既不能消極對(duì)待,也不能過(guò)分夸大,這兩種態(tài)度都不能使我們正確的認(rèn)識(shí)到大數(shù)據(jù)的本質(zhì)內(nèi)涵,只有客觀、理性的去分析才能更好地利用大數(shù)據(jù)為我們的生產(chǎn)、生活服務(wù)。
[1]趙國(guó)棟,易歡歡,糜萬(wàn)軍,鄂維南著.大數(shù)據(jù)時(shí)代的歷史機(jī)遇:產(chǎn)業(yè)變革與數(shù)據(jù)科學(xué)[M].清華大學(xué)出版社,2013.
[2]吳國(guó)盛.科學(xué)與人文[J].中國(guó)社會(huì)科學(xué),2001(04).
[3]維克托·邁爾-舍恩伯格(Viktor Mayer-Sch?nberger),肯尼思·庫(kù)克耶(Kenneth Cukier)著,盛楊燕,周濤譯.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革[M].浙江人民出版社,2013.
[4]鄔賀銓.大數(shù)據(jù)時(shí)代的機(jī)遇與挑戰(zhàn)[J].求是,2013(04).
The development of big data technology has greatly revolutionized the way people production, life and thinking, has brought us unprecedented opportunities and challenges. Big data is generated with the development of modern technology and Internet Access formed. The nature of Big Data technology is found hidden in one of the laws from the mass of data in the possibility of the development of things and make predictions.
Data,Big data,Modern technology
北京郵電大學(xué)社會(huì)科學(xué)基金項(xiàng)目“復(fù)雜哲學(xué)視域下的微博用戶群體行為研究”
李育卓(1990—),女,山西臨汾人,北京郵電大學(xué)馬克思主義學(xué)院研究生,研究方向?yàn)榧夹g(shù)哲學(xué)。趙玲(1957—),女,吉林長(zhǎng)春人,北京郵電大學(xué)馬克思主義教研中心教授,博士生導(dǎo)師,研究方向?yàn)榭茖W(xué)技術(shù)哲學(xué)。