〔摘要〕 大數(shù)據(jù)的社會應用是量化社會和控制革命等現(xiàn)代社會數(shù)據(jù)化進程的進一步發(fā)展。基于大數(shù)據(jù)社會實在的構建呈現(xiàn)為表征性、語義性和能動性等多個維度?;诖髷?shù)據(jù)的社會物理學試圖成為表征社會實在的“社會之鏡”和“上帝之眼”,基于大數(shù)據(jù)的智能分析則將人細分為“算法分格”并使社會轉向“管控社會”。鑒于大數(shù)據(jù)并不能帶來完美的表征性構建,應該通過數(shù)據(jù)化社會實在的語義性構建賦予表征性社會實在以有價值的意義。同時,為了打破算法黑箱,基于大數(shù)據(jù)社會實在的構建應通過能動性構建讓主體的能動性得以凸顯,使基于大數(shù)據(jù)的社會實在成為個人和社會自我調適的智能化手段。
〔關鍵詞〕 大數(shù)據(jù),社會實在,表征性,語義性,能動性
〔中圖分類號〕N02 〔文獻標識碼〕A 〔文章編號〕1004-4175(2016)06-0026-07
近年來,大數(shù)據(jù)的獲取、分析、挖掘則使社會實在以一種全新的形式得以展示,甚至有人喊出了“數(shù)據(jù)統(tǒng)治世界”的口號。隨著移動互聯(lián)網(wǎng)、網(wǎng)絡社交媒體和可穿戴式量化自我設備等的發(fā)展,相應的智能化大數(shù)據(jù)分析及應用方興未艾,不僅使社會投射為其數(shù)據(jù)化鏡像或表征性社會實在,而且還可能通過基于普遍數(shù)據(jù)化的意義與主體作用使語義性社會實在和能動性社會實在得以構建,三者共同構成了大數(shù)據(jù)背景下虛實交融的社會實在。
一、大數(shù)據(jù)視野中社會實在的多重維度
大數(shù)據(jù)的社會應用是現(xiàn)代社會數(shù)據(jù)化進程的新發(fā)展,并成為社會實在構建的語境基礎?;跀?shù)據(jù)化社會實在的構建以認識、理解和干預社會實在為目標,社會實在的表征性、語義性和能動性等維度據(jù)此得以展開。
(一) 大數(shù)據(jù)語境中的社會實在。大數(shù)據(jù)是計算機、網(wǎng)絡和人工智能等信息通信技術(ICTs)長期發(fā)展的結果,不僅在科學上帶來了數(shù)據(jù)密集型科學和網(wǎng)絡化科學等“第四范式”,而且在社會層面挖掘出的知識日益成為商業(yè)與政府決策的新工具,使人們得以通過大數(shù)據(jù)洞察社會現(xiàn)實,進而揭示出其中的社會實在。從社會層面來看,可以將大數(shù)據(jù)定義為社會場域中的人或物與數(shù)字網(wǎng)絡世界之間相互作用而產(chǎn)生的數(shù)據(jù)及其完整的集合,其主要內容是人們在日常生活和在線時產(chǎn)生的數(shù)據(jù)或留下的數(shù)據(jù)足跡。這些大數(shù)據(jù)可能涉及較長時段、多個主題和范圍廣泛的數(shù)據(jù)及其組合,既可以是某人在數(shù)年間單變量的數(shù)據(jù),也可以是某個瞬間采集的數(shù)以億計的多變量數(shù)據(jù)。由此形成的各種大數(shù)據(jù)集構成了一種全新的可挖掘的知識空間,通過聚類分析、數(shù)據(jù)畫像、數(shù)據(jù)可視化等形式,其所透視、呈現(xiàn)和構建的社會實在成為人們認識世界、社會和自我的中介。
社會實在的基本含義是指處于社會現(xiàn)實中的主體或群體通過感知、理解而構建對社會事實的陳述。雖然其內涵超出了塞爾(John Searle)在《社會實在的建構》(1997年)和《制造社會世界:人類文明的結構》(2010年)中所討論的使社會世界(social world)得以形成的社會化和功能性的社會實在(如貨幣、關稅等),但在追問其實在性時所顯現(xiàn)出的悖論是一樣的,即“在本體論上具有主觀性的關于社會實在的論斷何以具有認識論上的客觀性?”近代以來,在數(shù)理自然圖景的影響下,用數(shù)量刻畫社會實在的努力使得社會數(shù)據(jù)化成為現(xiàn)代社會運行的基礎,而其背后的認識論預設就是以數(shù)據(jù)表征社會實在更具認識論上的客觀性。究其歷史淵源,大數(shù)據(jù)對社會實在的刻畫是幾個世紀以來社會數(shù)據(jù)化這一長期趨勢的最新發(fā)展。
(二)大數(shù)據(jù)社會應用是量化社會與控制革命的進一步發(fā)展。社會數(shù)據(jù)化的進程可追溯至17~18世紀統(tǒng)計學所開啟的量化社會和發(fā)端于19世紀后期的控制革命。
近年來,大數(shù)據(jù)的倡導者指出,大數(shù)據(jù)的本質在于研究進路的數(shù)據(jù)驅動與計算轉向。提倡用關聯(lián)性取代因果性的安德森(C.Anderson)甚至強調,一旦擁有足夠的數(shù)據(jù),數(shù)據(jù)自己會說話。而實際上,對數(shù)據(jù)的信任,在統(tǒng)計學開始用于分析社會實在時其所訴諸的量化精神已見端倪。產(chǎn)生于17世紀和18世紀的統(tǒng)計學,使人們可以運用數(shù)據(jù)分析預測人口、健康和社會經(jīng)濟發(fā)展。這是歷史發(fā)展到一定階段所產(chǎn)生的必然需求。面對日益復雜的近代社會,人們需要對社會實在有更準確可信的認識。馬爾薩斯的《人口原理》第一版因為沒有數(shù)據(jù)支撐引發(fā)了激烈的爭論,這促使英國政府在1801年首次展開了人口普查。在這些數(shù)據(jù)的支持下,馬爾薩斯在新的版本中不再簡單地斷言人口增長必然引發(fā)災難,轉而強調世界上沒有一個國家會放任人口增長。
統(tǒng)計學在出生率、死亡率、傳染病以及制造、航海、農(nóng)業(yè)和國土的量化上卓有成效,在當時被稱為政治算術?!? 〕75政治算術的核心理念就是通過量化社會來認識社會實在,進而有效地對社會進行管理和調控。政治算術首次在社會層面上體現(xiàn)了量化精神,其深遠意義不亞于伽利略在自然層面強調大自然的語言是數(shù)學的觀點。政治算術的倡導者強調,涉及社會經(jīng)濟和公眾生活方方面面的問題時,數(shù)據(jù)比文字更能說明問題,數(shù)據(jù)能更客觀地反映自然和社會的真實存在,基于數(shù)據(jù)的論斷更可信。從量化精神發(fā)展而來的對數(shù)據(jù)的信任——數(shù)字比文字更客觀——至今依然盛行。大數(shù)據(jù)的提倡者所聲稱的“讓數(shù)據(jù)自己說話”就是這種量化精神的當下體現(xiàn)。
先擱置數(shù)據(jù)是否真的更為客觀可信這個問題不談,且看自政治算術出現(xiàn)以來社會數(shù)據(jù)化的趨勢為何會一路迅猛發(fā)展至今?信息社會的發(fā)展歷程揭示了其中的奧秘。19世紀下半葉以來,社會數(shù)據(jù)化持續(xù)和加速發(fā)展的動力來自信息社會或信息時代的推動,而后者緣于人類為克服“控制的危機”而推動的一場延續(xù)至今的控制革命——實際上也是政治算術的延續(xù)。1986年出版的《控制革命》一書中,貝尼格(James R. Beniger)指出,信息社會的興起源于控制革命(control revolution),要理解信息為何在經(jīng)濟與社會中產(chǎn)生越來越重要的作用,必須從信息與控制之間的關系中尋找答案。他強調指出:(1)19世紀后期以降,在工業(yè)革命的帶動下,技術系統(tǒng)、經(jīng)濟系統(tǒng)和社會系統(tǒng)的迅猛發(fā)展與相互整合導致了“控制的危機”,即工業(yè)化使物質、能量和社會系統(tǒng)加速發(fā)展的同時,信息處理與傳播技術領域的創(chuàng)新出現(xiàn)了相對滯后;(2)正是對控制危機的應對導致了控制革命,人們開始有意識地從調控社會與物質系統(tǒng)的需求出發(fā),通過對信息的收集、貯存、處理和傳播,運用科學管理、數(shù)量規(guī)劃和基于信息的決策等有形之手,使各種系統(tǒng)更具有目的性與合理性,從而實現(xiàn)對整個社會系統(tǒng)的控制。〔2 〕6-14
綜合上述兩方面,社會數(shù)據(jù)化的基本理念是:一方面,運用量化社會所獲得的客觀數(shù)據(jù)認識和揭示社會實在;另一方面,通過信息化推進社會數(shù)據(jù)化發(fā)展,以克服各種“控制的危機”,實現(xiàn)控制革命。前者強調量化社會這種方法可以更客觀地透視社會實在,后者表明社會數(shù)據(jù)化的最終目的是對社會進行更有效的管理和調控。值得強調的是,在現(xiàn)代性權力結構和制度安排下,量化社會和控制革命與社會及組織的管理者或治理者等主體或能動者相關,社會數(shù)據(jù)化的目的在于實現(xiàn)對社會及組織更合理和更有效的管理與治理,具有明顯的問題導向。
(三)數(shù)據(jù)化社會實在的多維度性。社會數(shù)據(jù)化實質上是一種社會技術,其基本技術路線是用數(shù)據(jù)和基于數(shù)據(jù)的模型來構建可以認識、理解和干預的社會實在。由此揭示的社會實在是通過主體與社會存在以及主體之間的互動構建起來的復雜的人工物或人化物。從經(jīng)濟指標、人口狀況、社會人群的健康狀況到公眾的幸福感和網(wǎng)絡輿情,各種基于社會數(shù)據(jù)化的社會實在即數(shù)據(jù)化社會實在的構建不僅涉及基于觀測者視角的客觀認識——用數(shù)據(jù)表征作為主體或群體認識對象的社會存在,而且還與主體或群體認識社會存在的目的與意向性密切相關——從數(shù)據(jù)中推演意義或據(jù)此采取行動。由此,數(shù)據(jù)化社會實在的構建過程具有表征性、語義性和能動性等維度,其結果呈現(xiàn)為由表征性社會實在、語義性社會實在和能動性社會實在疊加融合而成的多重實在。
表征性維度是指主體可以通過數(shù)據(jù)模型及其背后的算法使社會存在表征為社會實在,其實質是對社會實在的總體性認知與把握。用數(shù)據(jù)表征社會實在是由數(shù)據(jù)的本質特征決定的。一方面,數(shù)據(jù)在量的定義、選擇、收集、處理和分析等方面原則上可以通過主體間的討論減少主觀偏見,較一些非量化的方法更為客觀地表征對象、事件和環(huán)境的屬性。另一方面,數(shù)據(jù)本身可以借助載體的存儲而成為一種穩(wěn)定的、物理的東西,是一種可以操作、變換和傳輸?shù)目陀^存在?!? 〕109 由此,可以用“……的數(shù)據(jù)是多少”之類的量化答案回應“……是什么”之類的存在論問題。近年來,此進路最具代表性的是社會物理學和計算社會學。其理想化的認識情境是:在對社會現(xiàn)實和過程進行全方位的自動化數(shù)據(jù)測量和采集的基礎上,它們試圖以其所獲的社會數(shù)據(jù)集替代社會現(xiàn)實和過程本身,進而像“社會之鏡”一樣以數(shù)據(jù)模型或數(shù)據(jù)仿真表征人類行為和社會活動。然而,表征性維度至少會遭遇兩方面的質疑。首先,數(shù)據(jù)并不能替代認識對象。對此,杜威曾指出,對象是最后的、完備的東西,而數(shù)據(jù)是“運用的材料”和有待進一步解釋的題材, 是尚待揭示的事物的征兆、證據(jù)、標志,是中間線索而不是最終的對象,是手段而非終極事物?!? 〕74其次,正像并不存在一種“自然之鏡”可以完全客觀地表征自然實在一樣,同樣不存在一種理想的數(shù)據(jù)化社會實在能夠像鏡子一樣反映整個社會的所有方面。
鑒于我們無法以“社會之鏡”或“上帝之眼”構建完美的表征性的數(shù)據(jù)化社會實在,這使得表征性只能是數(shù)據(jù)化社會實在的一個維度,數(shù)據(jù)化社會實在的構建還需引入語義性和能動性兩個維度。其一是語義性維度。在無法從總體上表征社會的情況下,數(shù)據(jù)化社會實在的構建只有在具體問題的驅動下,才可能提出具體地揭示社會實在的某一方面的主題,賦予跟問題相關的數(shù)據(jù)以特定意義,語義性的社會實在由此得以構建。例如,在沒有提出具體問題之前,你的財務數(shù)據(jù)和過往的消費記錄只是具有無數(shù)潛在信息意義的數(shù)據(jù)集。而當一家零售商想知道你購買某個新款手提包的可能性時,就可以從中挖掘出你的“可支配收入”“顧客忠誠度”以及“時尚度”等方面的表現(xiàn)或評分,賦予相關數(shù)據(jù)具體的意義,你的相關特征和經(jīng)歷方面的數(shù)據(jù)因此被提取和推定出特定的屬性標簽(如很可能購買某個價位或風格的產(chǎn)品),由此你在特定的意義上被構建為語義性的社會實在。其二是能動性維度。不論是表征性還是語義性社會實在的獲得,往往為了展開進一步的行動,或影響相關主體做出相應的行動,能動性的社會實在會由此得到構建。例如,一些用于健康管理的可穿戴式設備通過對數(shù)據(jù)的采集和分析構建的就是能動性的社會實在,這不僅使監(jiān)測對象的健康狀況通過數(shù)據(jù)得以刻畫,還會對監(jiān)測對象、醫(yī)生、保險銷售人員、制藥廠商等相關主體的行為產(chǎn)生影響。
以主體的目的和意向為紐帶,可以使表征性、語義性和能動性三個維度得到整合。在討論科學表征時,科學哲學家吉爾(R. N. Giere)將其描述為:科學家S為了目的P而用X表征世界W?!? 〕類似地,我們可以將數(shù)據(jù)化社會實在的構建看作主體S為了目的P而用X表征社會實在SR的某個方面。并可根據(jù)目的P的不同分為三種情況:(1)P為對SR的(總體性)認知或把握,即主體S為了(從總體上)認知或把握社會實在,力圖用X表征(反映)社會實在SR可認知的(所有)方面;(2)P為關注部分社會實在的意義,即主體S為了關注部分社會實在的意義而用X表征(刻畫)社會實在SR的某個方面的意義;(3)P為干預所關注的部分社會實在,即主體S為了干預所關注的部分社會實在而用X表征(揭示)社會實在SR的某個方面存在的問題以促使其改變。由此可見,數(shù)據(jù)化社會實在的構建必然與構建主體及其意圖相關,因而不單是尋求對社會現(xiàn)實或事實的客觀洞察,而是一個事實與價值相互糾纏的過程,應該引入社會公正、權力賦予等方面的考量與權衡。
二、大數(shù)據(jù)方式牽引社會實在表征性構建
近年來,大數(shù)據(jù)、智能傳感器、物聯(lián)網(wǎng)和現(xiàn)實挖掘等數(shù)據(jù)科學的新發(fā)展使社會物理學迎來了新一波的熱潮——基于大數(shù)據(jù)的社會物理學,它試圖將大數(shù)據(jù)成為洞察社會微觀過程的“社會之鏡”,甚至希望成為能從總體上透視和構建社會實在的“上帝之眼”。在實踐層面,基于大數(shù)據(jù)的各種智能分析可以視為廣義的社會物理學探究,它正在通過各種“算法分揀程序”將人細分為“算法分格”,當代社會隨之走向“管控社會”。
(一)從“社會之鏡”到“上帝之眼”?;诖髷?shù)據(jù)的社會物理學及相關的計算社會學試圖從總體上構建基于大數(shù)據(jù)的表征性社會實在。其理論目標是建立一種關注人類社會過程的行為計算理論,試圖以此超越對社會現(xiàn)象的單純描述。為此,它并不滿足于相關性發(fā)現(xiàn),而力圖尋求對社會結構的因果解釋,并希望運用數(shù)學模型揭示社會變化和社會行為統(tǒng)計規(guī)律背后的動力學機制。
社會物理學的基本研究方法是現(xiàn)實挖掘(reality mining),即通過對人類生活方方面面產(chǎn)生的大數(shù)據(jù)痕跡的記錄、采集和分析,揭示和構建它們所表征的社會實在。在麻省理工學院社會物理學家彭特蘭(A. Pentland)看來,基于行為計算理論的社會物理學能夠將社會互動機制與海量的行為數(shù)據(jù)相結合,從而構建出更好的社會系統(tǒng)。〔6 〕9 一個典型的例證是他領導的“人類動力學研究小組”開發(fā)的名為“奇緣”的移動系統(tǒng)。通過對社交媒體的數(shù)據(jù)挖掘,該系統(tǒng)具有社交發(fā)現(xiàn)(social discovery)功能,它能在有吸引力的約會對象相距八九米的時候發(fā)出報警聲,并使符合條件的雙方的手機通過藍牙交換信息,由此可創(chuàng)造意外邂逅的機會?!? 〕72-73
在具體研究手段上,社會物理學主要通過“生活實驗室”開展研究,其實質就是通過全方位的大數(shù)據(jù)采集和分析對真實的社會生活現(xiàn)場進行實時的追蹤式研究。生活實驗室如同將整個社會組織——小群體、公司或整個社區(qū)放進一個假想的空間,長期持續(xù)地記錄和呈現(xiàn)社區(qū)成員的行為、溝通和社會互動的所有細節(jié),對手機、社交媒體上的帖子和信用卡交易記錄等數(shù)字痕跡進行完全的監(jiān)測。運用這種方法確實可挖掘出一些具體的社會實在。如判斷一個人是否患有糖尿病或是否按時還款,甚至可以通過對人群模式的研究解釋金融泡沫、經(jīng)濟崩潰等隨機的復雜現(xiàn)象。
作為一種理論研究,社會物理學以大數(shù)據(jù)為引擎構建表征性社會實在的努力是高度理想化的。其理想在于通過對人類行為的客觀數(shù)據(jù)的現(xiàn)實挖掘,獲得對人和事的客觀描述,形成對人類活動的規(guī)律性認識。他們認為,對人們的通話記錄、信用卡交易記錄和衛(wèi)星定位等人類活動所留下的數(shù)據(jù)“面包屑”進行現(xiàn)實挖掘,不僅可以對人進行數(shù)據(jù)畫像,還可建立復雜的人類行為的定量預測模型。值得指出的是,社會物理學并不滿足于對社交媒體數(shù)據(jù)的分析,而更多地致力于引入各種新的智能裝置記錄人的行為和活動,全方位采集不受主觀意向影響的數(shù)據(jù)。在他們看來,這些數(shù)據(jù)比社交媒介上留下的那些經(jīng)過編輯的文字更客觀。因為我們究竟是怎樣的一個人不應完全取決于我們聲稱自己做了什么,而應根據(jù)位置及消費等方面的數(shù)據(jù)痕跡更為準確地決定。〔6 〕11由此,社會物理學并不滿足于各種具體的現(xiàn)實挖掘,而旨在對社會進行總體上的透視與洞察,試圖成為“社會之鏡”乃至“上帝之眼”。 〔6 〕11-16
在社會物理學家眼里,社會生活各個方面不斷產(chǎn)生和累積的大數(shù)據(jù)為科學家提供了一種全新透鏡——大數(shù)據(jù)透鏡或“社會之鏡”,它可以幫助人們洞察社會的細微之處,使關于人類行為的研究煥然一新,其作用可與歷史上徹底拓展了自然科學視野的光學透鏡媲美。在他們看來,現(xiàn)有的社會科學主要基于對統(tǒng)計平均或典型樣本的描述,大多建立在對普通實驗室現(xiàn)象或調查結果的分析之上,忽略了人與人之間的互動,無法體現(xiàn)基于想法流動等微觀過程之上的社會生活的復雜性。在大數(shù)據(jù)透鏡下,社會現(xiàn)象則可能獲得更加精細客觀的表征,呈現(xiàn)為由個體之間數(shù)十億物質、貨幣、信息和想法的微小交換構成的微觀模式,通過對它們的社會物理學分析,將使真實社會的復雜性得以洞悉。
在此基礎上,社會物理學家進一步希望構建一種以大數(shù)據(jù)為引擎、能洞察一切的“上帝之眼”,以此真正理解社會的運行并從總體上解決人類面臨的問題。這一理想化目標的技術路線及其所蘊含的基本假設主要包括五個方面。(1)構建更大、更精確的人類行為大數(shù)據(jù)集,運用數(shù)量驚人的、客觀連續(xù)并且密集的數(shù)據(jù)構建能夠表征復雜的人類日常行為的定量預測模型。(2)構建更加精確和可視化的表征性社會實在,將有助于我們適應復雜、互聯(lián)和網(wǎng)絡化等人類社會的新趨勢,更好地理解和管理當代社會。(3)聚焦于人們的“想法流” 而非人的內在認知模式,透過社會網(wǎng)絡和社會學習過程探討人的想法的交換的行為動力學。(4)通過大數(shù)據(jù)實現(xiàn)社會物理學所涉及的經(jīng)濟學、社會學、心理學以及網(wǎng)絡科學、復雜性科學、決策和生態(tài)科學諸學科的融合。(5)為了營造一個更好的社會,建立有利于增長和創(chuàng)新的科學,構建起可靠的政策以及保護隱私和公眾知情權的信息和法律框架。
“上帝之眼”的構想反映了大數(shù)據(jù)和人工智能時代的發(fā)展趨勢,但也存在諸多困難:(1)客觀性問題。僅僅從外在的可測量數(shù)據(jù)出發(fā),我們難以對社會實在的所有方面進行全面客觀的表征。(2)數(shù)據(jù)洞察力問題。數(shù)據(jù)洞察力主要取決于元數(shù)據(jù)的選取以及數(shù)據(jù)背后理論的解釋力,單純的數(shù)據(jù)采集數(shù)量、參數(shù)和頻率在量上的提升未必意味著更強的數(shù)據(jù)洞察力。(3)思維的內在過程問題。回避人的內在認知模式,難以全面客觀地把握人類想法流動的規(guī)律。(4)知識融合問題。社會物理學一方面要融合多種相關學科,另一方面又置其所融合學科的常規(guī)研究對象于不顧,二者似乎很難整合。(5)制度保障問題。大數(shù)據(jù)實現(xiàn)對社會的表征離不開制度保障,而制定和落實相關制度比較困難。
與社會物理學類似,我國學者王飛躍將工業(yè)工程中的信息物理系統(tǒng)拓展到社會領域,提出了平行社會理論。其基本思想是通過建立社會物理網(wǎng)絡系統(tǒng)(Cyber-Physical-Social Systems),使人工社會數(shù)據(jù)化并通過計算實驗同步仿真,再通過兩者間的虛實互動和平行執(zhí)行使兩者協(xié)同發(fā)展,并確保系統(tǒng)按照人類期望的目標收斂?!? 〕但值得指出的是,不論是社會物理學還是平行社會理論,其愿景雖然具有革命性但其困難也是明顯的,除了理論上的問題,還面臨如何在制度層面引入整體性變革的挑戰(zhàn)。顯然需要在國家政治乃至國際政治層面作出整體性制度設計和全新價值抉擇。
(二)從“算法分格”到“管控社會”。不論是“社交發(fā)現(xiàn)”還是“社會之鏡”,它們對社會實在的表征性構建都是量化社會和控制革命在當代的發(fā)展,這些構建的共同特征具有基于大數(shù)據(jù)的智能分析。在實踐層面,鑒于大數(shù)據(jù)的本質實際上是數(shù)據(jù)的自動化和智能化采集、計算和分析。目前,大數(shù)據(jù)在國家、社會和組織層面的應用,使其被賦予商業(yè)智能、管理智能和生活智能,而這些智能分析與應用的首要功能就是透視社會,即構建基于大數(shù)據(jù)的表征性社會實在,故它們可以視為廣義的社會物理學探究。在實踐中,基于大數(shù)據(jù)表征性社會實在構建的關鍵是對人的“本性”進行智能分析——以數(shù)據(jù)洞察人。
以數(shù)據(jù)洞察人的基本方法是通過量化的數(shù)據(jù)、計算程序和智能算法洞察人的特征、分析人的行為、預見人的傾向。由此,人們所產(chǎn)生的所有大數(shù)據(jù)都有可能被分析,進而影響到他個人的“數(shù)字畫像”和分類。這種表征性構建的關鍵環(huán)節(jié)是根據(jù)人留下的數(shù)據(jù)痕跡運用算法對人進行分類并將結果付諸應用。在一些搜索引擎中,不同的用戶搜索同一個詞會得到不同的搜索結果;根據(jù)算法推測購買過《哈利·波特》《暮光之城》的用戶可能會購買《饑餓游戲》三部曲,他可能因此遭遇較高的“差別定價”;臉譜網(wǎng)和領英網(wǎng)更傾向于招聘那些有熟人在其中供職的應聘者;機場會為那些收入高且愿意多付費以快速通關者提供較近的車位;呼叫中心會讓與你的性格特點匹配的話務員為你服務。這種數(shù)字種性系統(tǒng)(digital caste system)無疑使商家和各類管理者在提高效益和規(guī)避風險上受益,而其“算法分揀”式社會實在的構建也存在著對人的隱晦或公開的歧視,其背后的算法黑箱亦難免滲透利潤考量和文化霸權。
基于“數(shù)字種性系統(tǒng)”和“算法分揀程序”的社會實在的構建正在賦予人類一種全新的數(shù)字身份,它使得量化社會的信息顆粒度在繼特定人群(階層、性別、年代)到個體之后進一步細分為個體(individual)在算法上可區(qū)分的特征。當代哲學家德勒茲將這種細分稱作“分格”(dividuals),并將托夫勒在《第三次浪潮》中提出的人類由基于商品生產(chǎn)的紀律社會所轉向的基于信息和金融化商品的經(jīng)濟社會稱為“管控社會”。他指出,在以往的社會中,管控發(fā)生在職場、學校和家庭等具體場所,人們的行為通過受到關注而被規(guī)訓,但存在可以不受管控的空間;而在管控社會中,管控則來自由代碼組成的數(shù)字語言,它們決定了人們能否獲得信息,這種管控不是將人們放到具體的場景中,而是使人置于一種無處不在的、持續(xù)運轉的網(wǎng)絡之中,如同巨型篩子上錯落有致地排列篩孔一般。〔9 〕
這些洞察預言了大數(shù)據(jù)時代人類算法身份的出現(xiàn),即可以通過一套專門針對每個人的算法對其數(shù)據(jù)痕跡進行精細的分析。而其出現(xiàn)的必要性在于,不論是從商業(yè)還是管理目標出發(fā),不對每個人及其行為方式加以精細區(qū)分,市場細分和有針對性管理就不可能展開,也無法對人進行信用評分或對某些有危害社會傾向的人加以監(jiān)控。顯然,管控社會與所謂信息監(jiān)控社會研究中邊沁式的“圓形監(jiān)獄”隱喻的管控結構并不相同。與以嚴苛和專制的規(guī)則規(guī)訓囚犯的圓形監(jiān)獄不同,在管控社會中,實際上是通過消費等“滿足”人的意愿和欲望的活動來規(guī)訓人的自由度。
作為一種表征性社會實在的構建,大數(shù)據(jù)時代的數(shù)據(jù)身份實際上是個人與社會互動的產(chǎn)物,雖然人們會意識到“數(shù)字種性系統(tǒng)”或“算法分揀程序”是企業(yè)或管理部門識別個人的手段或“俘獲工具”,但也認識到其另一面則是人們彰顯個性和實現(xiàn)自由的工具。因此,在數(shù)據(jù)化的表征性社會實在的構建中,人們不得不面對的吊詭是:數(shù)據(jù)已經(jīng)成為人們身份不可分割的一部分,但卻并不擁有它。因此,人類社會在一定程度上可以說正在經(jīng)歷一場“數(shù)據(jù)謀殺”或數(shù)據(jù)涅槃。
三、 大數(shù)據(jù)方式牽引社會實在語義性構建
通過對基于大數(shù)據(jù)社會實在構建的進一步反思可以看到,大數(shù)據(jù)并不能帶來完美的表征性構建。在實踐層面,只有通過語義性的社會實在構建,表征性的社會實在才能被賦予有價值的意義,而且基于大數(shù)據(jù)語義性的社會實在構建與表征性的社會實在構建是密切相關和互為條件的。
大數(shù)據(jù)現(xiàn)實挖掘和各種智能分析固然給數(shù)據(jù)化社會實在的表征性構建帶來了全新的可能性,但應該認識到表征性的社會實在并非數(shù)據(jù)化社會實在構建的全部內容,尤其不能將大數(shù)據(jù)等同于存在本身或對存在的完美表征。一方面,大數(shù)據(jù)一般指基于各種測量數(shù)據(jù)或采集數(shù)據(jù)的完整的數(shù)據(jù)集,它必然受到現(xiàn)有理論和數(shù)據(jù)測量與采集等相關技術的制約,無法替代存在本身。另一方面,雖然大數(shù)據(jù)可視為對自然存在或社會存在的多樣性和多維度的表征,甚至可以在一定程度上視其為完備的和全方位的,但這些表征既不可能窮盡對存在的探索,也不可能僅僅靠數(shù)據(jù)說話實現(xiàn)認識上的范式轉換。
實際上,社會實在的表征性構建與語義性構建互為條件、無法分割——所有的數(shù)據(jù)必須先賦予其意義然后才能用于表征實在,而數(shù)據(jù)也只有達到一定的精確性和多樣性才可能從中獲得有價值的發(fā)現(xiàn)。以自然科學中開普勒的發(fā)現(xiàn)為例,雖然開普勒三定律所運用的第谷的天文觀測記錄可以視為大數(shù)據(jù)集,但不能認為第谷的觀測記錄是對宇宙存在本身的完美表征。開普勒的成功首先在于他選擇了以太陽作為參照系,通過這一新的視角賦予了世界以全新的意義——這無疑是一種語義性的轉向。以此為前提,開普勒透過第谷完整而精確的觀測數(shù)據(jù),獲得了行星沿著橢圓軌道運行這一新的實在圖景,也賦予了日心說更為確切的新意義。在自然實在的構建中,表征性構建與語義性構建的主要差別在于,前者強調實在構建的基礎是唯一正確的理論,后者則認為應該將可能存在不同范式的理論基礎視為模型,實在的意義是由模型所賦予的。
在社會實在的構建中,語義性構建一般是表征性構建的前提,或者說表征性實在只有被解讀為語義性實在才可能獲得有價值的意義。正因為如此,信息哲學家佛洛里迪強調指出,大數(shù)據(jù)的真正問題并不在于數(shù)據(jù)之“大”,而在于如何從海量的數(shù)據(jù)中挖掘出其背后具有規(guī)律性的“小模式”。 〔10 〕這些所謂的“小模式”實際上就是數(shù)據(jù)中所包含的秘密,即各種語義性的實在,如某人信用評分的高低、對某個商品可能感興趣的顧客、潛在的恐怖分子、社交媒體上的情緒傳播模式等。為了揭示這些秘密,可以先提出有意義的問題,再以此作為語義線索,通過基于大數(shù)據(jù)的社會實在表征去尋找答案,獲得確切的語義性實在;也可以不斷變換社會實在的數(shù)據(jù)化表征形式,通過可視化等手段提出一些有意義的猜測,再進一步細化有價值的語義性實在。在通過現(xiàn)實挖掘發(fā)現(xiàn)這些語義性實在的過程中,雖然利用了大數(shù)據(jù),但顯然超越了數(shù)據(jù)原有的表征意義,而關注如何賦予數(shù)據(jù)以新的意義,實際上是在原有數(shù)據(jù)的基礎上開展語義性重建。同時,這些語義性重建又是進一步表征性構建的基礎。
從知識發(fā)現(xiàn)的角度來看,基于大數(shù)據(jù)的表征性實在可以視為一種介于真實世界現(xiàn)象與基于數(shù)據(jù)知識發(fā)現(xiàn)之間的媒介性的存在,語義性構建是在表征性構建基礎之上的二次發(fā)現(xiàn)。 〔11 〕通過大數(shù)據(jù)現(xiàn)實挖掘及智能分析所揭示出的語義性實在是傳統(tǒng)認識方式所無法獲得的,特別是那些從全新視角出發(fā)關于社會事實的有意義的陳述,不僅涉及新的不為人知的各種關系的相關性,還會呈現(xiàn)很多人們永遠無法想象的內容。例如,通過對社交媒體的數(shù)據(jù)挖掘發(fā)現(xiàn),如果配偶雙方與共同好友的聯(lián)系緊密,他們在兩個月內分手的概率就會大于50%,像這些研究顯然只有通過大數(shù)據(jù)才能完成。
近年來,谷歌運用其數(shù)字圖書館對量化歷史變遷領域進行了探索,試圖以一種看待歷史變遷的新視角和語言、文化和歷史的計量方法推進“文化組學”(culturomics)研究。其研究原理是哈佛大學德國文學系主任齊夫(G. K. Zipf)在1937年發(fā)現(xiàn)的齊夫定律(Zipfs law):在大型文本(如喬伊斯的小說《尤利西斯》)中,每個詞出現(xiàn)的總頻次與其在所有的詞頻率表中的排序逆相關。此后,齊夫和其他科學家發(fā)現(xiàn)財富與收入的分布、城市的規(guī)模、姓氏出現(xiàn)的頻次、戰(zhàn)爭傷亡人數(shù)、熱詞的流行、人的受歡迎程度等也存在著 “大者更大” 之類的冪律。〔12 〕33-35根據(jù)這一原理,谷歌研究人員設計了一種“n元詞組查看器”,通過可視化的曲線呈現(xiàn)某個詞或某幾個相關詞匯在谷歌數(shù)據(jù)圖書館的海量語料庫中的詞頻隨時間的變化,以此展示一些重要的歷史人物的名望起落、社會觀念變遷、歷史事件的集體記憶等其他研究方法難以呈現(xiàn)的歷史文化脈絡。
四、大數(shù)據(jù)方式牽引社會實在能動性構建
不論是以大數(shù)據(jù)為引擎的表征性社會實在的構建,還是語義性社會實在的構建,都是由一定的主體所主導的,但在大多數(shù)情況下這些主體都是匿名的。之所以出現(xiàn)這種情況,是因為存在著一個默認的假定,即大數(shù)據(jù)現(xiàn)實挖掘和智能分析所運用的數(shù)據(jù)、程序和算法是科學的和客觀的。由于數(shù)據(jù)、程序和算法是以數(shù)字和符號的形式出現(xiàn)的,很容易讓人誤以為它們只涉及一些事實和邏輯關系,而與價值、權力和利益無關。所以,人們可能會批評一些地圖軟件的街拍會干擾到他們的隱私,也會質疑搜索引擎針對性的推介的不當性,但很少對它們背后的數(shù)據(jù)、程序和算法提出疑問。在大數(shù)據(jù)公司的經(jīng)營者看來,用戶不需要理解復雜的技術過程,他們應該接受數(shù)據(jù)、程序和算法被裝進普通人難以理解的黑箱這一現(xiàn)實,通過各種輸入,再根據(jù)輸出結果作出選擇。
正是通過這些匿名主體的構建,個人和社會成為表征性實在和語義性實在。從社會和組織(包括企業(yè)及各種形式的實體性組織)的角度來看,這無疑使得整個社會和各類組織所關注的群體成為透明的觀測對象,其中的個體被細分成各種算法分格,成為網(wǎng)格化治理以及商業(yè)智能和管理智能監(jiān)控的對象。但這些表征性構建和語義性構建有其固有的缺陷。表征性構建的根本性問題在于,一方面,我們并不能在以大數(shù)據(jù)為引擎的表征性構建的基礎上獲得透視一切的“上帝之眼”;另一方面,通過大數(shù)據(jù)獲得的相關性很難進一步發(fā)現(xiàn)因果性,更不可能由此實現(xiàn)對社會的總體性控制。語義性構建的問題在于其方法論在本質上遵循的是斯金納式的行為主義進路,基于表征性實在的二次發(fā)現(xiàn)從根本上講是一種對外部關系的揣測性認識,而并未觸及內在的動力學及機理層面。更重要的是,在所有的現(xiàn)實挖掘中,不論是表征性構建還是語義性構建都存在著脫離語境和時空的問題。因為數(shù)據(jù)原則上既無法還原到其語境中去理解其完整內涵,也難以根據(jù)其發(fā)生的時空條件把握其有效性,所以基于大數(shù)據(jù)的表征性社會實在的構建和語義性社會實在的構建存在著難以克服的刻板性。
鑒于表征性構建與語義性構建的固有缺陷,基于大數(shù)據(jù)的社會實在的構建應該進一步凸顯主體性,走向能動性社會實在的構建和智能化調適。從理論上講,所謂能動性構建基于一種能動實在論的立場,即認為社會實在的構建是主體發(fā)揮其能動性,并通過與各種人與物的關系網(wǎng)絡中的組分之間的互動而實現(xiàn)的。也就是說,主體不僅應該參與到基于大數(shù)據(jù)的社會實在的構建之中,而且還要通過這種構建采取進一步的行動。實際上,近年來方興未艾的量化自我(QS)運動就是基于大數(shù)據(jù)的能動性社會實在構建的典型技術。通過可穿戴設備,人們可以了解其健康、情緒和生活中方方面面的數(shù)據(jù)和由此獲得的評分,在此基礎上制定相關的改進計劃。由此,量化自我既是對作為社會實在一部分的自我的構建,也是一種動態(tài)的智能化的自我調適。從某種程度上講,量化自我體現(xiàn)了福柯的自我技術的思想。
作為能動性構建典型的量化自我給我們的啟示是:主體可以將基于大數(shù)據(jù)的社會實在的構建當作一面矯正行為的智能化的鏡子,借此不斷地調節(jié)其行為。以學術不端檢測軟件為例,正確地使用方法一方面可以將其內置到寫作軟件中及時矯正潛在的不端行為,另一方面可以針對其算法中存在的不透明、不合理的地方提出質疑并促使其改進。值得指出的是,在能動性構建的場景中,大數(shù)據(jù)這面智能化的鏡子不是用于鳥瞰世界,而類似于自我觀測的鏡子或后視鏡,用于前進中對自我狀況的觀測和自我調節(jié)。如果將能動性構建的視角放大到社會和組織,則可以通過對相關性的智能化調節(jié)來彌補總體上的因果控制上的不足。例如,大數(shù)據(jù)不一定能夠對每個人的能量消費進行絕對的調控,但卻可以通過展示每個人親朋好友的相關數(shù)據(jù)促使他們向好的方面轉變;如智能化的防災系統(tǒng)雖然不能預報地震,但卻可以通過及時的數(shù)據(jù)反饋將災害減到最小。因此,主體的能動性社會實在構建不僅會使個人在大數(shù)據(jù)的發(fā)展中獲益,也使作為復雜系統(tǒng)的社會通過數(shù)據(jù)化的反饋體系實現(xiàn)智能化的發(fā)展。
參考文獻:
〔1〕丹尼爾·墨德里克.追溯信息時代〔M〕.崔希蕓,等譯,石家莊:河北教育出版社,2016.
〔2〕James Beniger. The Control Revolution: Technological and Economic Origins of the Information Society〔M〕. Cambridge: Harvard University Press,1986.
〔3〕馬克·布爾金.信息論:本質、多樣性、統(tǒng)一〔M〕.北京:知識產(chǎn)權出版社,2015.
〔4〕約翰·杜威.確定性的尋求:關于知行關系的研究〔M〕.上海:上海世紀出版集團,2005.
〔5〕R. N.Giere. How Models Are Used To Represent Reality〔J〕. Philosophy of Science, 2004(5).
〔6〕A.彭特蘭.智慧社會:大數(shù)據(jù)與社會物理學〔M〕.汪小凡,汪蓉,譯.杭州:浙江人民出版社,2015.
〔7〕盧克·多梅爾.算法時代:新經(jīng)濟的引擎〔M〕.胡小銳,鐘毅,譯.北京:中信出版社,2016.
〔8〕王飛躍.X5.0: 平行時代的平行智能體系〔J〕.智能產(chǎn)業(yè)快訊,2015(1).
〔9〕Gilles Deleuze.Postscript on the societies of control〔J〕. Societies of Control, 1992(59).
〔10〕Luciano Floridi. Big Data and Their Epistemological Challenge〔J〕.philosophy &Technology;, 2012(25).
〔11〕段偉文.大數(shù)據(jù)知識發(fā)現(xiàn)的本體論追問〔J〕.哲學研究,2015(11).
〔12〕埃雷茲·艾登,讓-巴蒂斯特·米歇爾.可視化未來:數(shù)據(jù)透視下的人文大趨勢〔M〕.王彤彤,等譯. 杭州:浙江人民出版社,2015.
責任編輯 蘇玉娟