我們作為個人不僅是數(shù)據(jù)的接收者,也是數(shù)據(jù)的生產(chǎn)者。一方面我們下載、閱讀瀏覽,因此我們在消費數(shù)據(jù);另一方面,我們又上傳、撰寫、參加各種活動,各種活動就可以留下我們的很多痕跡,因此我們也在留痕,我們實際又在產(chǎn)生數(shù)據(jù)。在這樣一個既是消費又是生產(chǎn)的環(huán)境中,我們從方方面面已經(jīng)和數(shù)據(jù)分不開了。大數(shù)據(jù)已經(jīng)在沖擊各行各業(yè)。
對經(jīng)濟金融的影響
比如經(jīng)濟金融領(lǐng)域。股價的預(yù)測其實一直是個難題,傳統(tǒng)的股價預(yù)測,實際是通過一些專業(yè)的模型來估計風(fēng)險、收益、評價企業(yè),有專門的理論和方法來估計股價。但是影響股價的除了這些因素之外還有人們的“期望”,而估計“期望”是非常難的,因為“期望”既涉及外部因素環(huán)境,又涉及心理預(yù)期?,F(xiàn)在一個新視角是考慮公眾關(guān)注,比如搜索。若對某些企業(yè)比較關(guān)心,可能就搜索其企業(yè)狀況、新聞事件,這種搜索體現(xiàn)了大眾對于具體企業(yè)的股票價格和價值走向的關(guān)心。這是一個跟過去特別不同的角度,因為這不是特別專業(yè)的角度,它是從專業(yè)外人士的行為來估計的角度。這種關(guān)注和搜索與股價的走勢有相當(dāng)強的關(guān)聯(lián)度。這和幾年前谷歌通過搜索來估計流感是一樣的,實際上它不是采用了所謂流行病學(xué)的專業(yè)模型,而是某段時間很多人有癥狀,頭疼、咳嗽、吃了什么藥,大家有很多信息的交換,這種交換的強度、交流的走向,恰恰可能跟流行病的流行模式非常相關(guān)。所以,我們也可以從搜索的角度來估計它和股價之間的影響和關(guān)聯(lián)度。但是,要特別指出,雖然搜索和股價的走勢有聯(lián)系,但是僅這一個因素來估計股價是不夠的,還有大量的因素需要專業(yè)模型。因此,一方面需要能夠擴展或者沖擊傳統(tǒng)的定式和視角,另一方面應(yīng)該把其他專業(yè)視角引進(jìn)來,大數(shù)據(jù)的股價預(yù)測應(yīng)該是包括內(nèi)部與外部、專業(yè)與非專業(yè)因素的模型構(gòu)建。
對會計學(xué)的影響
大數(shù)據(jù)也開始在改變會計學(xué)。傳統(tǒng)的會計學(xué)衡量企業(yè)的狀況是通過三張報表:資產(chǎn)負(fù)債表、現(xiàn)金流量表、利潤表,這三張報表反映了一個企業(yè)的運營能力、償債能力和盈利能力。雖然這三張報表是非常基礎(chǔ)和非常重要的,但是大家突然發(fā)現(xiàn),有一大類企業(yè)是高風(fēng)險的,特別是一些IT企業(yè)、創(chuàng)業(yè)企業(yè)、新行業(yè)企業(yè),長期負(fù)債,但是同時又有非常高的市值,人們又有非常強的忠誠度,如果用這三張報表衡量,似乎不能完全體現(xiàn)它的價值,也就是說,傳統(tǒng)會計學(xué)的三張報表可能就不夠用了。因此,人們在呼喚“第四張報表”的出現(xiàn),業(yè)界和學(xué)界都在做研究。長周期、高負(fù)債、高不確定性企業(yè)的價值可能受到的是口碑、忠誠度、品牌、公允價值,包括無形資產(chǎn)的影響。這些東西我們可以稱之為數(shù)據(jù)資產(chǎn)。所以,這是從會計學(xué)的角度來看我們碰到的一個沖擊,很多新的現(xiàn)象導(dǎo)致呼喚新的模型、新的理論框架。
對體育、藝術(shù)的影響
大數(shù)據(jù)也在為體育界帶來變革。現(xiàn)在我們都在積極籌備冬奧會,我們國家有少數(shù)冰雪項目水平比較高,但總體的水平不是特別高。主要的問題是長期的傳統(tǒng)做法比較粗獷、比較經(jīng)驗型。冰雪項目中有一大類是姿態(tài)類項目,運動員的關(guān)節(jié)、角度、力量和跳躍的高度、旋轉(zhuǎn)的速度以及動作的完成質(zhì)量密切相關(guān),現(xiàn)在大家已經(jīng)意識到這個問題,因此有些隊會用手機照一些照片、視頻,但是數(shù)據(jù)粒度沒有到關(guān)節(jié)這項,也沒有到姿勢、力量和角度上,所以數(shù)據(jù)粒度不夠。第二,視角也不夠,可能需要更加專業(yè)的采集設(shè)備,更加專業(yè)的還原設(shè)備來完成。比如現(xiàn)在簡單的二維的圖像應(yīng)該變成動態(tài)三維的還原,并且可以分解,這樣就可能幫助總體的競賽水平得到提高。
別的項目,像籃球、像NBA就做得非常好,通過收集肌肉、血液、心臟、動作、戰(zhàn)術(shù)、團(tuán)隊等全景式的數(shù)據(jù)來幫助訓(xùn)練和比賽,因為這些因素都有可能影響整個比賽的結(jié)果。像壘球、網(wǎng)球的角度、落點、戰(zhàn)術(shù)都有不同的大數(shù)據(jù)分析。
可見,科技體育這幾年有巨大的空間,傳統(tǒng)的師傅帶徒弟,師傅的傳幫帶確實非常重要,但是應(yīng)該有更細(xì)粒度、更加多角度、更加全景式的手段,采用大數(shù)據(jù)技術(shù)來提升整體的競賽水平。
大數(shù)據(jù)在藝術(shù)上也有很多影響。傳統(tǒng)繪畫,不管是古典的還是現(xiàn)代的畫,都有自己的素材和表現(xiàn)形式。現(xiàn)在出現(xiàn)了一種新的素材——數(shù)據(jù)素材,也就有了新的表現(xiàn)形式。比如飛機航班的數(shù)據(jù)軌跡就可以構(gòu)成一幅新穎的畫。由數(shù)據(jù)作為素材,有新視角進(jìn)來,作為整體的新型創(chuàng)作出現(xiàn)。
對哲學(xué)、歷史學(xué)的影響
大數(shù)據(jù)已經(jīng)影響到經(jīng)濟、管理、體育、藝術(shù)等領(lǐng)域,在其他的領(lǐng)域也有非常多的應(yīng)用,比如農(nóng)業(yè)就有蔬菜革命、精準(zhǔn)扶貧,這些都是利用大數(shù)據(jù)的例子。在醫(yī)療健康領(lǐng)域,醫(yī)院內(nèi)醫(yī)院外,得病和未得病之間的關(guān)聯(lián),也是大數(shù)據(jù)問題。文學(xué)上通過大數(shù)據(jù)技術(shù)對一些詞語、作者、關(guān)系、背景等進(jìn)行分析。
哲學(xué)里一個重要的方向是認(rèn)識論和方法論,這里包括我們近些年提煉出來的新的研究成果。傳統(tǒng)的哲學(xué)認(rèn)識論追求探索因果關(guān)系,因此基本叫做模型驅(qū)動范式,也就是說通過刻劃變量之間的聯(lián)系,比如自變量和因變量,通過構(gòu)建這兩個之間的函數(shù)關(guān)系,比如線性、非線性等,可以知道一個自變量一個單位的變化會導(dǎo)致因變量有幾個單位的變化,試圖反映變量之間的邏輯的因果上的機理。但是,這個模型驅(qū)動的范式在大數(shù)據(jù)時代會受到一些挑戰(zhàn),或者說它碰到一些問題時會捉襟見肘。比如,當(dāng)數(shù)據(jù)變量的組合數(shù)特別多時,當(dāng)很多變量是潛變量和隱變量時,當(dāng)很多的變量雖然重要,但是不可測不可獲時,還有當(dāng)數(shù)據(jù)的樣本規(guī)模特別大時,這些問題用傳統(tǒng)的模型驅(qū)動的做法就會比較困難。
因此,就出現(xiàn)了一個新的范式轉(zhuǎn)變,催生了大數(shù)據(jù)驅(qū)動范式。這個范式想表達(dá)的是,對于管理決策,我們希望能夠?qū)崿F(xiàn)既有關(guān)聯(lián)又有因果的訴求,這個新范式簡單地說由外部嵌入、技術(shù)增強和使能創(chuàng)新三方面構(gòu)成。外部嵌入是指引入視角之外的變量,有些變量我們知道重要,但是沒有辦法放進(jìn)模型里,比如我知道股價,我預(yù)測股價有個計量模型,但是如果今天這個公司出了一個事情,或者是上面有個新聞,或者行業(yè)里有個新的政策,我們覺得可能會影響股價,但是這些變化很可能是視頻、語音或者文本,沒有辦法融入到傳統(tǒng)的模型中去。所以,需要引入外部視角。這些圖像、視頻、新聞文本要引入進(jìn)來,就是要使得我們引入的變量可測、可獲,這就是第二條,技術(shù)上要增強。當(dāng)這些變量引入進(jìn)來的時候,我的變量空間就發(fā)生了變化,這個時候我們可能會研究新的X到Y(jié)的轉(zhuǎn)換,也就是變量關(guān)系和映射要重新定義和審視,這就是使能創(chuàng)新。這是大數(shù)據(jù)驅(qū)動范式框架的三個方面。
歷史學(xué)其實也和大數(shù)據(jù)密不可分。傳統(tǒng)的歷史記錄內(nèi)容都是帝王將相、英雄豪杰、國家、政治、重大的軍事事件等,很難在歷史中看到平民和我們自己。一個是過去的粒度不夠,第二手段也不行,存不下來。大數(shù)據(jù)環(huán)境下就可能自下而上反映歷史。比如國家圖書館互聯(lián)網(wǎng)信息戰(zhàn)略保存項目,和新浪合作,把新浪公開的相關(guān)博客文章作為歷史資料記錄下來,通過自上而下與自下而上的史學(xué)觀的融合,使得我們可以更細(xì)粒度地反映歷史和社會,同時也可以獲得更加全面的歷史畫面。
對法律行業(yè)的影響
法律也和大數(shù)據(jù)相關(guān)。比如下載一個App,憑什么問我要這么多權(quán)限?我不給權(quán)限行不行?沒有辦法,不給就不能用。我在網(wǎng)上購物、瀏覽,我的痕跡、數(shù)據(jù)腳印,都被公司采集了,我有沒有權(quán)利說你把我的這些痕跡抹掉、遺忘掉?這就是被遺忘權(quán)。所謂被遺忘權(quán)是指數(shù)據(jù)主體有權(quán)要求數(shù)據(jù)控制者永久刪除有關(guān)數(shù)據(jù)主體的個人數(shù)據(jù),有權(quán)被互聯(lián)網(wǎng)遺忘,除非數(shù)據(jù)的保留有合法的理由。2018年歐盟出臺了《通用數(shù)據(jù)保護(hù)條例》,強調(diào)了被遺忘權(quán)。這也是由大數(shù)據(jù)激發(fā)出來的新問題,對傳統(tǒng)的法學(xué)研究產(chǎn)生了新的挑戰(zhàn),或者說帶來了新的發(fā)展空間。