国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

社會物理學的演進

2019-10-18 01:17:56編譯喬琦
世界科學 2019年9期
關鍵詞:凱特

編譯 喬琦

盡管自由意志和生活環(huán)境變幻莫測,人類行為總體上還是要比我們想象的可預測得多。

在艾薩克·阿西莫夫的《基地》(Foundation,1951)系列小說中,數(shù)學家哈里·謝頓(Hari Seldon)運用心理史學預言了銀河帝國的崩潰。小說中的所謂心理史學,就是一種對人類大眾回應社會及經(jīng)濟事件模式的計算。謝頓起初因叛國罪受審,理由是他的預言助長了所謂的帝國崩潰,后來他獲準在一顆與世隔絕的行星上組建了一個研究小組。在那里,謝頓研究了如何將帝國崩潰造成的破壞最小化,并將后續(xù)出現(xiàn)的無政府狀態(tài)從3萬年之久縮短到僅僅1 000年。

阿西莫夫知道,實際上我們不可能預測上千年尺度的大規(guī)模政治事件。然而,當我們閱讀這本小說時,這種懷疑并沒有縈繞在心頭。簡·奧斯汀的讀者也不會因為知道伊麗莎白·班內特和達西先生并不存在而感到難過不安。阿西莫夫是個聰明人,他知道不論這類預測有多準確,都會受到意料之外的大型擾動的嚴重影響,更別提那些涉及原則的變動了。他也明白,那些愉快接受心理史學這個設定的讀者也一定會意識到這點。在《基地》系列的第二卷中,就有這樣一個“黑天鵝”事件徹底打亂了謝頓的計劃。不過,謝頓還準備了一個應急計劃,這個計劃為后續(xù)小說內容帶來了諸多驚喜。

阿西莫夫的《基地》系列最為人稱道之處在于把重點放在了關鍵人物集團的政治陰謀上,而不是一頁又一頁地重復描寫全副武裝的龐大太空艦隊的戰(zhàn)斗。主角們會定期收到此類戰(zhàn)斗的消息,但對這類消息的描繪與好萊塢的處理手法大相徑庭。正如阿西莫夫自己所說,《基地》系列的故事情節(jié)是根據(jù)愛德華·吉本的作品《羅馬帝國衰亡史》(1776—1789)改編的?!痘亍废盗凶髌肥轻槍Σ淮_定性進行史詩級規(guī)劃的大師之作。每一位高級部長以及公務員都應該好好看看這部小說。

為了取得戲劇性的效果,小說中提到的預測人類未來的方法,也即心理史學,把假設的數(shù)學技巧運用到了極致。然而,我們其實每天都會在不那么宏偉的任務中用到這種基本思想,例如當超市經(jīng)理估算要擺多少袋面粉到貨架上時,又例如當建筑師在設計建筑時估算會議室可能的大小。謝頓這個角色在某種程度上是受到了阿道夫·凱特萊(Adolphe Quételet )的啟發(fā)。凱特萊1796年出生于低地國家根特,也就是現(xiàn)在的比利時,他是第一批將數(shù)學應用到人類行為上的人之一。如今我們對“大數(shù)據(jù)”和人工智能前景和危險的癡迷都是凱特萊智慧成果的直系后代。當然,凱特萊并不把由此衍生出的這門學科叫作心理史學,他稱其為社會物理學。

統(tǒng)計的基本工具和技巧誕生于物理學科(尤其是天文學)之中。它們起源于一種系統(tǒng)方法。這類方法的主要目的是從不可避免地會出現(xiàn)誤差的觀測結果中提取信息。隨著人們對概率論的認識不斷加深,一部分先行者把這種方法拓展到了其原始邊界之外。自此之后,統(tǒng)計學方法就成了生物學、醫(yī)學、政治學、人類學乃至藝術中不可或缺的一種研究手段。因此,當你知道這門學科的奠基人本來是位純粹的數(shù)學家,后來改攻天文,最后又臣服于社會科學的塞壬之歌時,估計也不會太過驚訝,甚至會覺得恰如其分。

凱特萊把自己的這個思想認識饋贈給了后代,那就是:盡管自由意志和生活環(huán)境變幻莫測,人類行為總體上還是要比我們想象的可預測得多。無論怎么說,這種認識都還不夠完美,但正如他們常說的,“對政府工作來說,已經(jīng)足夠好了”。凱特萊還給我們留下了兩條具體思路:一是“平均人”的概念;二是正態(tài)分布的普遍性,也就是如今眾所周知的鐘形曲線。這兩個概念都是非常有用的工具,提供了全新的思考方式,但同時,如果太過刻板或是太過寬泛地應用它們,也會出現(xiàn)非常嚴重的缺陷。

凱特萊的第一個博士學位是當時剛成立不久的根特大學頒發(fā)的。他的博士論文是關于圓錐截面的。這個問題也是古希臘幾何學家們的鐘愛,他們用平面切割圓錐構建出了這些重要曲線——橢圓、拋物線、雙曲線。凱特萊在大學里教了一段時間數(shù)學,直到1820年被選入布魯塞爾皇家學院。這也開啟了他長達50年的比利時科學界核心人物的學術生涯。

大約就在那個時候,凱特萊加入了一場建立新天文臺的運動。當時,他對天文學還所知不多,但他天生就是一位實干家并且對政府里的那些彎彎繞一清二楚。凱特萊的第一個動作就是確保政府能夠為這個項目提供資金支持。接著,他又采取措施彌補了他本人對天文臺研究項目知之甚少的弱點。1823年,在政府資助下,凱特萊前往巴黎從當時頂尖的天文學家、氣象學家和數(shù)學家那兒取經(jīng)問道。弗朗索瓦·阿拉戈和亞歷克西斯·布瓦爾教他天文,約瑟夫·傅里葉則教他概率論。

當時,天文學家是應用概率論的先行者,他們利用這種方法改善必定會出現(xiàn)誤差的行星軌道觀測結果。從專家那兒學習這些技巧的經(jīng)歷培養(yǎng)了凱特萊對把概率論應用于統(tǒng)計數(shù)據(jù)的終生癡迷。到了1826年的時候,凱特萊已經(jīng)是低地國家統(tǒng)計局的一名區(qū)域通訊員了。

對于國家來說,有一個基本數(shù)字對現(xiàn)在及未來發(fā)生的事件施加了巨大影響,那就是:人口。如果你不知道自己國內究竟有多少人,那就很難做出相應規(guī)劃。當然也可以進行猜測,但這么做到頭來很有可能在不必要的基礎設施上浪費很多錢,或者由于低估了國民的需求而引發(fā)危機。直到今天,這也是許多國家仍致力于解決的問題。

查明國家人口的最自然的方式就是把他們一個一個數(shù)出來。然而,人口普查并不像看上去的那樣簡單。國民會四處流動,有些還會因犯罪或逃稅而藏匿起來。1829年,比利時政府醞釀了一場新的人口普查行動,當時一直在歷史人口數(shù)據(jù)方向上工作的凱特萊也加入了這個項目。

“我們當前掌握的數(shù)據(jù)只能說是臨時的,必須進行修正。”他寫道。全面人口普查代價高昂,因此,估算歷次普查結果之間的人口變化情況就變得有意義了。然而,這種估算方法并非長久之計,如今通行的做法是每十年進行一次大普查。當時,凱特萊也督促政府趕緊開展新的人口普查活動,這樣才能獲取估算未來的準確基準。不過,當他從巴黎學成歸來時,產(chǎn)生了一個有趣的想法。這個想法來自偉大的法國數(shù)學家拉普拉斯。如果它能奏效的話,就可以省下一筆大筆錢。

拉普拉斯把兩個數(shù)字相乘,計算出了當時法國的人口。第一個數(shù)字是過去一年的嬰兒出生數(shù),可以在出生登記記錄中找到,準確性很高。第二個數(shù)字是總人口與每年出生人數(shù)之比——也就是人口出生率的倒數(shù)。把這兩個數(shù)字乘起來,就得到了當年總人口的變化情況。不過,這個方法要奏效,似乎首先得知道全國總人口,畢竟這樣才能知道出生率。對此,拉普拉斯給出的解決方案是采樣:通過完善的采樣方法就能得到一個合理的估計值。具體方法是,挑選幾個具有典型性的人口配置合理地區(qū),在那里開展全面的普查工作,然后再把結果與這些地區(qū)每年的出生人數(shù)相比較。拉普拉斯還做了相關計算,認為大約30個這樣的區(qū)域就足以推算整個法國的人口。

然而,比利時政府并沒有使用采樣的方法,而是直接開展了全面的人口普查工作?,F(xiàn)在看來,凱特萊之所以沒有堅持使用完善的采樣方法,是因為當時的一位國家顧問凱弗伯格男爵(Baron de Keverberg)提出了一項睿智、成熟但也具有誤導性的方法論角度上的批評意見。調查不同區(qū)域內的出生率必然涉及各種令人困惑的因素,因此,這位男爵總結,根本不可能取得這樣一種具有代表性的采樣樣本。各種因素造成的誤差會累積,導致采樣結果毫無用處。然而,他犯了兩個錯誤。第一個錯誤是,尋找具有代表性的樣本,并不是找到一個隨機樣本就完事了。第二個錯誤是,他只想到了可能出現(xiàn)的最壞情況(各種誤差不斷累積),卻沒想到最有可能出現(xiàn)的情況(大多數(shù)誤差會通過隨機變化而相互抵消)。值得一提的是,拉普拉斯之前就已經(jīng)提出,對全國人口的最佳采樣方案是預先挑選那些至少在某些方面能夠代表總體的區(qū)域。這意味著這些區(qū)域要與總體有大致相似的貧富人口比例、受教育人口和非受教育人口比例、男女比例等等。如今,要想從小樣本中得到優(yōu)秀的采樣結果,我們也會如此設計相關的民意調查。不過,統(tǒng)計學家最終發(fā)現(xiàn),足夠大的隨機樣本,效果就和精挑細選的代表性樣本一樣好,而且前者的獲取難度還低得多。不過,這些道理都是我們現(xiàn)在發(fā)現(xiàn)的了,無論如何,當時的比利時政府決定挨個統(tǒng)計每個國民。

凱弗伯格男爵對凱特萊計劃的批評最終促成了比利時政府于1829年開展全面人口普查工作,但這也產(chǎn)生了一個有益影響:凱特萊在這項龐大的工作中收集了大量數(shù)據(jù),正是這些數(shù)據(jù)讓他研究、分析了一輩子。很快,凱特萊的工作重點就從“數(shù)人頭”發(fā)展成了測量人口。在整整8年的時間里,他收集了大量國民數(shù)據(jù),其中包括出生率、死亡率、結婚率、預計妊娠期、身高、體重、健康狀況、成年人口率、飲酒率、發(fā)瘋率、自殺率、犯罪率,等等。凱特萊還研究了這些數(shù)據(jù)隨年齡、性別、職業(yè)、地點、季節(jié)、入獄、住院等方面的變化。他一次只比較兩項因素,從而繪制出展示這兩者關系的圖表。最后,凱特萊總結并出版了自己的研究結論,形成了他的代表作《論人類及其能力之發(fā)展——社會物理學論》(1835)。1842年,這本著作譯成了英文,英文書名為《論人及其能力的發(fā)展》(1842)。

凱特萊每次提到這本書的時候,都會用副標題“社會物理學”。于是,當他于1869年修訂本書的新版本時,直接交換了原書的主標題和副標題,也就是直接用“社會物理學”作為主標題。凱特萊完全了解自己創(chuàng)造了一門怎樣的學科,那就是用數(shù)學分析方法詮釋人類,至少是詮釋那些可以量化的人類特征。

這本書中提到的一個概念激發(fā)了公眾的想象力,并且令人們心醉神迷,那就是平均人的概念。凱特萊提出的這個概念在很多領域都有重要意義,他也因此清晰地認識到,還有必要更具體地考慮平均女性、平均孩童等各類人群的平均值。凱特萊很早就注意到,有關身高、體重這類特征的數(shù)據(jù)(充分限制在同一性別的同一年齡組中)往往會集中于單個值附近。如果我們把這類數(shù)據(jù)畫成柱狀圖,就會發(fā)現(xiàn)最高的那根柱子出現(xiàn)在正中央,兩側柱子的高度逐漸減小,形成斜坡。這其實就是鐘形曲線的特征形狀,并且正如凱特萊自己承認的那樣,數(shù)學家早已知曉了這種分布曲線。鐘形曲線的整個形狀大致對稱,因此,中央峰值——代表最常見的取值——也就是平均值。許多類型的數(shù)據(jù)分布都會呈現(xiàn)這種模式,而凱特萊第一個意識到了這種分布模式在社會科學中的重要意義。

圖、表當然都是非常好的工具,但凱特萊想要的是一種更簡潔明了的總結方式,一種用活潑且便于記憶的形式傳遞數(shù)據(jù)主要信息的方式。因此,相較“鐘形曲線顯示,某些階級20歲以上男性的平均身高是1.74米”這種說法,凱特萊更欣賞“(某些群體)男性的平均身高為1.74米”。接著,他就會對不同群體中的“平均男性”進行比較。全比利時范圍內的“平均步兵”和法國“平均農民”相比如何?這個“平均步兵”是更高還是更矮?是更輕還是更重?又或者“他倆”幾乎一樣?“他”與德國“平均軍官”相比又如何?布魯塞爾的“平均男性”和倫敦的“平均男性”相比如何?“平均女性”呢?“平均孩童”呢?哪個國家的“平均男性”殺人或犯罪的可能性更高?哪個國家的“平均男性”成為救死扶傷的醫(yī)生概率更高,而不是更傾向于自己了結自己的性命?對于每一種討論的特征,我們都需要各種平均男性(平均女性、平均孩童)的數(shù)據(jù)。正如斯蒂芬·施蒂格勒在《統(tǒng)計學歷史》(1986)一書中指出的那樣,凱特萊認為“‘平均人’的概念是一種抹平社會隨機變量,展示其‘社會物理學’定律的方法”。

1880年之后,社會科學開始廣泛使用統(tǒng)計學,特別是鐘形曲線。弗朗西斯·高爾頓是將數(shù)據(jù)分析應用于天氣預報的先驅,并且發(fā)現(xiàn)了反氣旋的存在。高爾頓繪制了人類第一幅氣象圖,并于1875年發(fā)表在《泰晤士報》上。他對真實世界的數(shù)字數(shù)據(jù)以及背后潛藏的數(shù)學規(guī)律心馳神往。查爾斯·達爾文出版《物種起源》(1859)后,高爾頓隨即開展了一項人類遺傳學研究。孩子們的身高與其父母之間有什么關系呢?體重、智商又怎么樣呢?高爾頓采用了凱特萊的鐘形曲線,把它應用在各種人群上。如果數(shù)據(jù)形成的鐘形曲線出現(xiàn)了兩個峰值,而不是一個,高爾頓就認為,數(shù)據(jù)樣本涉及的人群一定包含兩個區(qū)別明顯的亞群,每個亞群各自遵守自己的鐘形曲線。

隨著研究的深入,高爾頓越發(fā)相信有許多美好人類特征都是遺傳的,這應該是進化論的一個推論,但達爾文卻予以否認。對高爾頓來說,凱特萊的平均人是一種社會必需,也是一種需要回避的情況。他的作品《遺傳天才》(1869)運用統(tǒng)計學研究天賦和偉大特質的遺傳,以及今日出現(xiàn)的一種平等主義目標(即“每個年輕人都應該有機會展示自己的能力,而如果他天賦極高的話,就應該接受一流教育并就此開啟職業(yè)生涯”)的怪異混合體,還有“種族驕傲”的鼓勵效應。在他的作品《人類能力及其發(fā)展探究》(1883)中,高爾頓創(chuàng)造了一個叫作“優(yōu)生學”的術語,倡導政府提供財政支持鼓勵那些高層級或高智商家庭聯(lián)姻、生育。他想通過這種方式培養(yǎng)出擁有超能力的孩子。優(yōu)生學在20世紀二三十年代大行其道,但由于過分濫用、強迫精神病患者絕育、納粹的優(yōu)等種族論等現(xiàn)象而迅速失去人心。如今,優(yōu)生學與種族主義聯(lián)系在一起。它違反了《聯(lián)合國預防和懲治種族滅絕罪公約》和《歐盟基本權利憲章》。然而,這種思想從沒有徹底離開我們的視線。

無論我們對高爾頓的性格看法如何,他對統(tǒng)計學的貢獻是不容置疑的。1877年,他發(fā)明了回歸分析,這種方法可以計算不同量之間最可能的相互關系,還催生了統(tǒng)計學中的另一個核心概念:相關性,用以評估不同數(shù)據(jù)集間的關聯(lián)程度——例如,吸煙頻率和肺癌發(fā)病率之間的關系。高爾頓在1888年討論了一些例子,比如前臂長度和身高間的關系。隨后,英國數(shù)學家和生物統(tǒng)計學家卡爾·皮爾森將這個想法轉變成了一個數(shù)學公式,也就是相關系數(shù)公式。正如我們經(jīng)常指出的那樣,相關性并不是因果性,但它常常是潛在因果性的一個有用指標。

1824年,《賓夕法尼亞人報》開展了一場民意調查,內容為安德魯·杰克遜還是約翰·昆西·亞當斯會成為美國總統(tǒng)。調查結果為,335票投了杰克遜,169票投了亞當斯。事實情況也是杰克遜贏得了最后的普選。自此之后,選舉這個領域就吸引了民意調查專家的目光。出于實際操作方面的原因,民意調查只會涉及一小部分選民。于是就出現(xiàn)了一個明顯的數(shù)學問題:多大的樣本才能給出準確的結果?這個問題在人口普查、新藥測試以及許多其他領域內都很重要。

直到最近,民意調查主要用的都還是隨機樣本。雅各布·伯努利于1684年左右發(fā)現(xiàn)了大數(shù)定律,并發(fā)表在了他的作品《猜度術》(1713)上。這個定律告訴我們,如果樣本足夠大的話,那么這個樣本的平均值就“幾乎肯定”會無比接近于我們想要的真實值。然而,這個定律并沒有告訴我們所謂的“足夠大”究竟是多大。中值極限定理,這個更復雜的定理就運用鐘形曲線把樣本均值與實際均值聯(lián)系了起來,并可以據(jù)此計算所得結果能夠奏效的最小樣本容量。

如今,社交媒體的出現(xiàn)改變了許多選舉的開展方式。精心設計的互聯(lián)網(wǎng)民意調查又回到了拉普拉斯的方法。它們以精挑細選的個人組成的代表性小組作為統(tǒng)計樣本。然而,很多此類民調都只是讓那些想要投票的人參與進來——既不隨機也不具有完全的代表性。這類民調的設計很糟糕,因為那些擁有強烈政治觀點的人更有可能參與投票,而很多人甚至都不知道這個民調的存在,還有一些人都沒法上網(wǎng)。同理,電話民意調查也很有可能存在傾向性,因為很多人都不太想回應電話那頭冰冷的聲音,甚至會在被問及看法時拒絕做出回答。在這個詐騙橫行的時代,我們甚至沒法確定這通電話是否真的是為民調而打來的。有一些人沒有電話,有一些人不會對電話那頭的民意調查員說真話——例如,他們很可能不太愿意向陌生人透露自己想要把票投給一個極端黨派。在電話民調中,同一個問題的不同表述都會影響人們的回答。

民意調查機構為了盡可能地減小這些誤差來源的影響,運用了各種各樣的方法。其中許多都是數(shù)學方向上的,但心理學和其他方面的因素現(xiàn)在也已納入考量。我們中的大部分人都聽說過這樣的故事:民意調查中出現(xiàn)了明顯錯誤的結果。而且這樣的故事似乎發(fā)生得越來越頻繁了。有時可以用一些特殊因素來“解釋”其中的原因,比如民眾的意向突然發(fā)生了轉變,或者選民在民調時故意撒謊,目的是為了讓對手誤以為自己勝券在握而放松大意。盡管如此,只要能執(zhí)行得當,民意調查總體上還是能夠相當好地勝任追蹤記錄的工作。它為削減不確定性提供了一件非常有用的工具。出口民調,也就是人們在投出選票后不久就被詢問選了誰的民意調查,通常準確率相當高,往往能在官方公布結果前很久就給出正確的選舉結果,且這類民調本身并不會影響選舉結果。

如今,“社會物理學”這個術語背后的隱喻意義已經(jīng)少了許多。信息技術的飛速發(fā)展引發(fā)了“大數(shù)據(jù)”革命。就這樣,我們掌握了獲取并處理海量信息的能力。人類的行為模式可以從信用卡消費記錄、電話記錄和電子郵件記錄中提取出來。社交媒體上的消息突然變多了起來,例如2016年美國總統(tǒng)大選期間的“煽動事件”就可能成為熱議政治問題的線索。

目前面臨的數(shù)學挑戰(zhàn)是:找到從大量非結構化信息中提取出有意義模式的有效方法。另外,我們已經(jīng)嘗試了許多新方法——其中某些源于物理學自身。例如,有關氣體分子如何互相反彈的理論已經(jīng)改編成了預測大型建筑或復雜建筑群(比如奧林匹克公園)中人群移動方式的方法。而社會及政治方面面臨的挑戰(zhàn)則是確保上述這類方法不會被濫用。在越來越多強大新方法的幫助下,社會物理學已經(jīng)從當初凱特萊尋求無須挨個數(shù)人頭就能查明全比利時人口方法的時代,往前走了很長一段路。

猜你喜歡
凱特
凱特數(shù)碼印花
凱特數(shù)碼印花
凱特數(shù)碼印花
凱特的小店
A Caterpillar Wants to Fly
快樂如風
別人家的全家照
中外文摘(2018年15期)2018-08-01 08:27:10
漫畫作品欣賞
讀者(2016年14期)2016-06-29 13:56:08
A Present
在鞋帶上動腦筋
洛隆县| 玉龙| 达拉特旗| 广昌县| 桂林市| 崇左市| 清河县| 清远市| 五大连池市| 汤阴县| 宜君县| 石柱| 棋牌| 图片| 柳河县| 瑞丽市| 马尔康县| 定远县| 株洲县| 平原县| 大田县| 石林| 邵阳市| 敦化市| 永和县| 宜兰市| 邯郸县| 普格县| 郓城县| 古交市| 凌云县| 徐州市| 丹凤县| 高淳县| 璧山县| 睢宁县| 岳阳市| 石阡县| 得荣县| 岚皋县| 富平县|