劉永謀
數據當然是發(fā)現世界的一種方式,但不是惟一的方式。很多時候,不能在大數據中呈現的世界一樣真實。如果我們把數據世界誤認為惟一真實的世界,就會導致社會風險,如:權力過度集中、數據專家濫用權力、信息安全和隱私問題、精英主義弊端以及文化的單極化。
20年來,計算機、網絡和信息社會等相關領域的哲學社會學問題研究,風向標變化得很快,比如最近10年,先熱的是物聯(lián)網,沒幾年開始流行大數據,2017年阿爾法狗火了,有人說人工智能(AI)元年又來了。但若仔細審視,過去10年信息社會發(fā)展真正有重要突破的,還是在數據方面,也就是說海量數據的涌現,深刻地影響了我們的生活。比如,最近兩年我已經養(yǎng)成了看手機上天氣預報的習慣,決定是否出門、穿什么衣服,大數據已經影響了個人的生活。而如果大數據影響了一群人的生活,這就進入公共事務領域,屬于大數據治理的問題了。最近大家抱怨的“996”,劉強東的“兄弟論”、熱帖“你不是世界首富貝佐斯的兄弟”,就屬于這方面的例子。再往公共政治方面說,川普發(fā)推特背后有沒有大數據支撐,他與希拉里競選如何運用大數據技術,這些都屬于大數據治理討論的問題。
大數據技術已經廣泛應用于出租車行業(yè)、企業(yè)人事管理、學校學生管理和政治競選等,大數據治理的確就在我們身邊,這就引出一個問題:如何看待大數據治理?它究竟是完美天使,還是殘忍的惡魔?它究竟是無堅不破的利器,還是裝模作樣的南郭先生?
一、大數據治理在當代有何正面意義
我對大數據治理的討論,是在一套理論框架下進行的,就是我所謂的技術治理理論。根據我的理論,首先看到的是大數據治理的正面價值。“數據人”的崛起實際上是更大背景即“科學人”崛起的一個表征,這從根本上意味著“作為治理對象的人”的浮現,這是技術治理的基礎。我們這里稍微談一點理論問題。
所謂技術治理(technical governance),其主旨就是將現代科技的成果用于社會公共事務當中,以提高整個社會運行的效率。顯然,無論發(fā)達國家,還是發(fā)展中國家,技術治理已然成為社會運行領域以至全球范圍的普遍現象,我稱之為“當代政治的技術治理趨勢”。在大數據和智能革命的背景下,這種趨勢更是急速推進,日益突出,甚至可以稱之為當代社會的根本性特征之一。換言之,在某種意義上,我們甚至可以說,當代社會是技術治理社會。在過去幾年中,我一直嘗試建構一套審度技術治理理論,以對技術治理現象予以某種框架性的詮釋,以此為基礎探討將之引導到有益方向的可能性。在其中,大數據治理是一個很小的問題。
在我的理論中,技術治理不是只有一種模式,而是可以根據不同國情進行選擇的。但是,不管哪一種技術治理制度安排,都堅持兩個基本原則:其一,科學管理,即以科學原理和技術方法來治理社會;其二,專家政治,即以受過系統(tǒng)自然科學教育的專家掌握政治權力。統(tǒng)計與大數據學院如果參與到公共治理活動之中,也屬于我討論的專家的范圍。為什么?因為當代社會科學主流是自然科學化的,所以才被稱為科學。經濟學家、管理學家、職業(yè)經理人、銀行經濟學家、統(tǒng)計學家、心理學家、精神治療師、經濟分析師乃至實證社會學家等,也是接受過系統(tǒng)的自然科學基礎教育的,有人甚至認為,他們可以被稱為社會工程師,他們掌握的知識可以被稱為社會技術。世紀之交以來,社會工程師的權力正在超過科學工程師。
根據以往思想史和技術治理的實踐經驗,我歸納了技術治理最主要的七大戰(zhàn)略。在每一種戰(zhàn)略中,大數據技術都大有可為。(一)社會測量:對社會所有的物質和精神財富進行調查、統(tǒng)計和計算。這是技術治理的例行工作,是治理戰(zhàn)略的基礎。顯然,大數據技術真正提供了全面社會測量的可能性。收集社會數據的想法可以追溯到很遠,比如威廉?佩弟的《政治算術》。從某種意義上說,正是這種想法才推動了社會統(tǒng)計學的產生。(二)計劃體系:運用計劃手段,既包括國家計劃、社會計劃,也包括企業(yè)計劃,在相對較大的范圍內盡可能地對生產和分配活動進行統(tǒng)一的配置和安排。在其中,大數據技術扮演重要角色,劉強東說可以實現數據共產主義。這個問題很復雜:第一,我不認為計劃與市場是對立的;第二,計劃體系也不等于毛澤東時代的計劃經濟;第三,我反對總體化的計劃烏托邦;第四,我認為計劃是程度問題,與市場可以互補。(三)智庫體系:制度性地將政治權力的一部分通過智庫方式交由專家掌管,實施一定程度、一定范圍的專家政治。智庫制度本質上是一種權力分配的安排,把部分政治權力尤其是建議權交給專家。當代專家的建議越來越多地基于大數據提供的支撐。(四)科學行政:政府運行的科學化。(五)科學管理:是企業(yè)、NGO組織等的理性化。(六)科學城市:科學地建設、運行和維護城市的各個方面。(七)綜合性大工程,這種工程不僅涉及自然改造,還涉及人口、社會、文化和環(huán)境等諸多社會因素,既是自然過程,也是社會工程。
大數據技術在這些戰(zhàn)略中大有可為,可以給技術治理以強大的技術支撐。反過來,這些技術治理戰(zhàn)略的實施也推動了大數據技術的強力發(fā)展。有人說,中國大數據技術發(fā)展最大的推動力就來自政府和公共事業(yè)的需求。
舉智慧城市為例?,F在水電氣供應都智能化,居民可以在手機上直接購買,任何故障、短缺的信息都即時反饋;智能交通方面,有大量的監(jiān)控探頭、測速裝置;智能城市治安,安全監(jiān)控設備、智能110等……每時每刻都產生大量的數據,為城市運行決策提供非常有力的技術支撐,極大地提高了城市運行效率。
安保監(jiān)控也是大數據治理重要作用的突出例子。在重點場所如機場、車站、監(jiān)獄,針對重點人群比如罪犯、精神病人的電子監(jiān)控,非常有必要,保證了公共安全。中國治安大大改善,大數據治理功不可沒。
二、大數據治理是完美的利器嗎
那么,大數據治理真的無往不利嗎?
先說“雪亮工程”。公安部雪亮工程到處裝監(jiān)控,說是可以不接觸即能監(jiān)測人的心跳,以及發(fā)現路人甲攜帶的敏感物品??墒牵覍ρ┝凉こ痰男Ч⒉豢春?。為什么?在這個世界上,一輩子24小時完全照著法律、規(guī)章、政策、治安管理條例、街道公約、公司章程、校紀校規(guī)活著的人有幾個?違法不敢,可誰沒有個違規(guī)的時候?人又不是機器人!比如,隨地個痰,闖紅燈,在不該吸煙的地兒抽煙,看個黃片,“翻墻”,逃個課,小黃車沒有停到地兒,在公園刻個到此一游……把這些全部監(jiān)控下來,都處理嗎?那得多少警察!而那么多警察也要監(jiān)控啊。
現代治理有一個基本的假設:所有人都是有問題的,都要被改造——目標不止于打擊犯罪,而是要改造每一個人,我稱之為“完美人夢想”。于是,社會就用法律、治安條例、公司規(guī)章、學校紀律直到父母的規(guī)定,將每個人約束起來,進行改造。顯然,不能把所有的不完美都監(jiān)控起來,都變得完美,這是不可能的。而且,哪里監(jiān)控裝得多,看起來結果就是哪里治安差一些——本來大家差不多,現在你被發(fā)現得更多而已。因此,理想的連續(xù)治理是不能付諸實施的,它只能是一個理想型(ideal type)或者方法論,當不得真的,用我的理論來說,這叫過度治理。也就是說,大數據治理要把握一個度,要區(qū)別治理與操控之間的界限。
實際上,公安部門也不是真的那么天真和理想主義。這里面有個我稱之為“官僚主義智能化問題”。官僚機構對新技術情有獨鐘,尤其是技術治理的新技術,因為這些新技術的運用更能體現出官僚機構的強大力量。對于官僚機構來說,它最大的動力不是效率,而是組織的生存、擴大和發(fā)展。公安部門推行大數據治理,可以找政府要錢,可以設立新機構,可以招更多的警察。官僚主義智能化問題,實際是官僚主義對技術效率目標的偏離或異化問題。
對于公安部門來說,大數據治理對于治安效率有多大提高,就成了次要的,反正多少有點用。當然,檢查起來,就要用統(tǒng)計數字證明給大家看看,說提高了多少百分點的破案率。這種情況在法院運用大數據技術建設智能法院的時候,也出現了。一些法院反映,效率提高并不明顯,甚至變麻煩了,比如一些例行審批交給智能系統(tǒng),出了問題,責任都不知道找誰負。打著新科技的名義,說是最新技術治理手段,實際上并沒有通過科學原理和技術方法指向效率的提高,我稱之為“偽技術治理現象”。比如最近頗受關注的出生人口統(tǒng)計,有人說,放開二胎根本沒有阻止中國人口數量下滑的趨勢,從2018年開始中國人口開始負增長了。不過后面這些被刪,統(tǒng)計局也出來辟謠,感覺這個事情成了一個謎。但要警惕的是,“科學統(tǒng)計證明二胎政策緩解了中國人口出生率下滑趨勢,所以放開二胎政策好”,實際上變成了“二胎政策好,所以統(tǒng)計數字必須證明這一點”。最近看到一個帖子說,什么長壽鄉(xiāng),其實是有人鼓勵大家虛報年齡的結果,因為成了長壽鄉(xiāng)會帶來經濟利益。
顯然,大數據治理有一個范圍問題。正如有人評論的,機器的結果只是參考,需要人來檢查其有效性,最終做出決定的仍然是人。例如,亞馬遜將大數據治理用于人員雇傭和工作監(jiān)督中,這是非常敏感和需要慎重的。顯然,企業(yè)有社會責任,要提供員工福利,不能一味強調效率,否則就容易走向過度治理。實際上,很多社會參數是沒有必要獲取的,很多違紀違規(guī)行為應該交還道德領域,甚至要被社會所容忍。過度治理以及上面提到的官僚主義智能化、動因漂移等,在我的理論中都屬于技術反治理問題。在我看來,技術治理過程必然伴隨著技術反治理,后者是不可能也沒有必要消除的。要想運轉技術治理機制,就必須在兩者間達到某種作用力與反作用力的平衡;試圖完全鏟除反治理,結果一定是技術治理系統(tǒng)的崩潰。
三、大數據治理有什么可能風險
關于大數據有一種說法:不再是隨機樣本,而是全體數據。大數據是全數據嗎?世界上哪里有什么所謂的全數據,其實就是一個無窮大的集合。大數據相對于之前的數據來說,的確在數量級上發(fā)生了改變,這量變按照某些人認為的甚至導致了某種質變,但是它不是全數據。從根本上說,絕對無窮大的分母,無論分子數量級增加多少,仍然約等于零。因此,大數據所謂的“大”是實用意義上的“大”,是針對某個目的而言足夠大了。比如智能交通調控,如果能掌握八成以上機動車輛的運行軌跡,就可以嘗試以此為基礎進行調控了。所以,這個大數據的意思是進行某個城市交通調控的數據足夠了。
既然以實用目的來判斷數據是不是夠大,那么就意味著所謂大數據并不是客觀的,而是存在價值預設。從這個意義上說,大數據沒有討論因果關系,而是發(fā)現相關關系,而相關關系的發(fā)現是在一定價值觀指導之下的。例如,有人通過大數據提出這樣的觀點:空氣污染與很多不良現象有關,其中包括判斷力減退、心理健康問題、學習成績不佳以及犯罪率上升。這樣的大數據研究提出了什么新的治理結論?沒有,它只是為控制空氣污染提出了一個新的理由,顯然是在反感空氣污染指導之下的發(fā)現。這既說明了大數據的目的或價值屬性,也說明了不是所有數據都有意義,我們并不需要全數據,并不是大數據越多越好。從理論上說,這叫數據超載問題。簡言之,大數據的終極目標不是真理,而是行動。
在現代治理活動中,可計算原理和文牘中心是基礎。可計算要求信息的數字化,文牘中心要讓治理活動圍繞各種文件來展開。人們治理的是紙上的、數字中的社會,實行數字管理,這與日常顯示距離很大。這就出現了現代治理當中的意會知識和非正式知識的問題,這是技術治理中的一個很大問題。這就容易出現數據崇拜現象,比如我根據天氣預報穿衣服,而不是在陽臺上看一看別人穿什么,或者到室外感受一下。在大數據時代,數據崇拜轉變成大數據崇拜,最新技術應用的背書增加了崇拜的程度,統(tǒng)計學和統(tǒng)計數字成了權威的來源。過頭的數據崇拜是有問題的。
波茲曼批評了統(tǒng)計數字崇拜,他認為,運用統(tǒng)計數字進行論證的要害有三。一是抽象概念客觀化,把某個發(fā)明出來的抽象概念轉變成某個客觀的可測量的事物,比如民意測驗統(tǒng)計調查假定有個“輿論”或“民意”的客觀事物,可以從民眾身上抽取出來。但其實并沒有一個實實在在的什么民意,人心是變動不居的,你現在杜撰一個民意,搞一套程序,好像有這么一個東西。二是排序,把每個人按照某種標準安放在某個序列之中,比如從極不喜歡到極其喜歡分為0到10,你選一個數字,5是中間值,這叫排序。好像很科學一樣,其實很可能,被要求打分的人完全搞不清楚在討論的是什么。三是忽略未經或不可數字化的問題,讓客觀化的東西數字化,有些不能數字化的東西,那就忽略不計。比如,所謂的智商測量,IQ能測數字能力、圖形能力、邏輯推理等這些能力,可以量化,而想象力、聯(lián)想能力、直覺這些不能量化的,那就不計入智商了。
對于統(tǒng)計學、數據和概率的哲學反思,并不是否認大數據治理的巨大價值。但我認為,大數據不是什么全數據之下的必然性,它的作用是有限的,我們必須要知道使用大數據是有邊界的,否則就會誤入歧途。而將大數據運用于社會運行策略當中,本質上是政治問題,而不是純粹的技術問題,因為大數據并不能提供一個絕對真理的基礎,可以把我們的行動從真理中推導出來。所以,關于大數據與計劃經濟的討論,本質上是社會制度安排問題,而不是純粹技術問題。進一步而言,即便我們知道了真理,也推導不出我們應該如何行動,這就是休謨著名的是與應當的二分。吸煙有害身體健康,但推導不出我不能吸煙,我可能覺得吸煙比我的健康更重要。在我的理論中,這稱之為治理轉譯問題。
總之,數據當然是發(fā)現世界的一種方式,但不是惟一的方式,不是說只有數據世界才是真實世界,不可量化的世界就不存在。很多時候,不能在大數據中呈現的世界一樣真實。如果我們把數據世界誤認為惟一真實的世界,就會導致社會風險,如:權力過度集中、數據專家濫用權力、信息安全和隱私問題、精英主義弊端以及文化的單極化,等等。
四、可行的風險防范思路
大數據治理的風險防范,可以從各個方面想辦法,防患于未然。我認為,結合國情,更可能落地的思路至少有兩條。
一是制度主義的思路。我認為,技術治理最大的政治風險在于:專家權力過大,威脅民主和自由,極端情況下可能導致許多人所擔心的機器烏托邦,即把整個社會變成大機器,而每個社會成員變成其中可以隨時替換的小零件。機器烏托邦的典型意象,是好萊塢電影《黑客帝國》和《終結者》中的世界。所以,必須從制度上框定和限制大數據專家的權力,比如將其權力限制于政治上的建議權和實施權。社會權力除了政治權力,還有其他如經濟權力、學術權力、宗教權力等,專家只是掌握政治權力的一部分,就會受到平衡和約束。這屬于我所謂的技術治理的再治理問題。再治理除了限制數據專家權力之外,還要有制度上的糾錯機制??傊?,我們要在制度上進行精密的設計,要警惕工程師濫用權力。
二是工程師教育的思路。我認為,純粹的倫理討論不會有什么實質的約束力,倫理考量要與制度設計緊密結合起來,實際上,制度正是倫理、風俗、文化乃至民族性在歷史情境中的結晶,也就是說,制度設計不能脫離具體的國情。在大數據治理方面,數據專家是更能在技術當中貫徹我們的價值理念的。也就是說,我們不是等到大數據治理出了事,再來追責,而是要把倫理考量、風險防范提前到工程師的技術設計之初。這就是新近興起的所謂設計哲學、負責任創(chuàng)新和道德物化等理論的主旨。譬如,許多轎車在駕駛員系好安全帶之前不會啟動,或者發(fā)出噪音。駕駛員做出車該開多快的道德決定取決于途中的減速帶,減速帶設置的目的是:“在達到我之前,請減速”。拉圖爾認為,此類轎車和減速帶包含了道德,設計者賦予它們當駕駛員看到它們時就系安全帶和不能開太快的責任。道德決定通常不是僅僅由人來做出的,而是由人與所使用的技術互相影響來形成的。這是拉圖爾列舉的著名例子,也就是說,工程師們在設計之初是可以把道德考量用技術形式加以體現的。顯然,這種思路要求數據專家不僅懂技術,還要懂倫理和人文,這就需要對工程師進行倫理教育。當然,可以在設計階段引入人文學者、倫理學者參與,但這畢竟不如將價值考量能力、風險防范意識直接灌輸給數據專家。
(作者為中國人民大學哲學院教授)
責任編輯:尚國敏