美國(guó)歷史學(xué)家利希特曼使用蘇聯(lián)地震學(xué)家波洛克設(shè)計(jì)的預(yù)測(cè)地震的算法預(yù)測(cè)美國(guó)大選,從1984年到2016年的九次大選中,預(yù)測(cè)對(duì)了八次。他還用這個(gè)方法來(lái)預(yù)測(cè)美國(guó)的中期選舉,命中率也很高。遺憾的是,這個(gè)算法在地震預(yù)測(cè)中卻沒(méi)有取得同樣的成功。
南方周末特約撰稿 陳希
人們自古以來(lái)就對(duì)公共職位的選舉結(jié)果抱有極大的興趣。古羅馬凱撒在選舉大祭司的時(shí)候,已經(jīng)負(fù)債累累,一旦失敗,鐵定破產(chǎn)。但是仍然有人愿意借大量資金給他。這些人可以說(shuō)是最早的預(yù)測(cè)者和博彩者。中世紀(jì)的人們更青睞樞機(jī)主教們選舉教皇,在1503年就出現(xiàn)了關(guān)于教皇候選人的投注賠率。在近現(xiàn)代民族國(guó)家出現(xiàn)后,在人民主權(quán)原則下,選舉成為普遍的政治活動(dòng),也催生了民意調(diào)查這種預(yù)測(cè)技術(shù)。
有史料可查的第一次民意調(diào)查是1824年美國(guó)賓夕法尼亞州的一個(gè)報(bào)社做的欄目。該報(bào)在1824年7月對(duì)威爾明頓市的公民群體進(jìn)行了調(diào)查,調(diào)查他們心目中最喜歡的總統(tǒng)。這個(gè)335人的民意調(diào)查顯示,安德魯·杰克遜以70%的優(yōu)勢(shì)領(lǐng)先國(guó)務(wù)卿約翰·昆西·亞當(dāng)斯(23%)。但是1824年的總統(tǒng)選舉結(jié)果是對(duì)這個(gè)預(yù)測(cè)的反諷:根據(jù)美國(guó)憲法第十二修正案,只有競(jìng)選人贏得相對(duì)多數(shù)、且過(guò)半數(shù)的選舉人票才可以當(dāng)選,當(dāng)時(shí)四位候選人沒(méi)有一人票數(shù)過(guò)半,所以最終交付眾議院裁決,原本遙遙領(lǐng)先的杰克遜在眾議院投票環(huán)節(jié)慘敗給亞當(dāng)斯。就是這么一個(gè)滿足讀者好奇心的欄目,持續(xù)到現(xiàn)在。
這種民意調(diào)查在1936年發(fā)生了巨大改變,一家默默無(wú)聞的輿論研究所成功預(yù)測(cè)了羅斯福的當(dāng)選,橫掃當(dāng)時(shí)流行的各家民意調(diào)查機(jī)構(gòu),其創(chuàng)始人喬治·蓋洛普將統(tǒng)計(jì)學(xué)方法引入民意調(diào)查,這個(gè)機(jī)構(gòu)日后發(fā)展成了蓋洛普公司。隨著統(tǒng)計(jì)技術(shù)的發(fā)展,選舉數(shù)據(jù)變得越來(lái)越容易處理。選舉預(yù)測(cè)已經(jīng)成為民意調(diào)查公司、新聞機(jī)構(gòu)和博彩市場(chǎng)以及政治學(xué)研究的寵兒。
然而科學(xué)的方法還是經(jīng)常會(huì)被復(fù)雜的現(xiàn)實(shí)打臉,美國(guó)1948年和2016年的總統(tǒng)選舉,英國(guó)1970年、1974年、1992年的大選,讓很多民意調(diào)查機(jī)構(gòu)的專家大跌眼鏡。人們不禁要問(wèn),有沒(méi)有一種更加準(zhǔn)確的預(yù)測(cè)方法呢?
美國(guó)美利堅(jiān)大學(xué)的政治史教授艾倫·利希特曼(Allan Lichtman)和蘇聯(lián)科學(xué)院院士、數(shù)學(xué)地球物理學(xué)家弗拉基米爾·基里斯-波洛克(Vladimir Keilis-Borok,1921-2013)合作,將后者設(shè)計(jì)的地震預(yù)測(cè)算法加以改過(guò),發(fā)展出一套總統(tǒng)選舉預(yù)測(cè)算法,由此衍生出“白宮鑰匙”(The Keys to the White House)系列叢書。從1984年至2016年,共舉行了九次美國(guó)總統(tǒng)選舉,兩人關(guān)于實(shí)際當(dāng)選者的預(yù)測(cè)對(duì)了八次,準(zhǔn)確率不可謂不高。惟一出錯(cuò)的年份還是2000年,利希特曼預(yù)測(cè)戈?duì)柲墚?dāng)選美國(guó)總統(tǒng),結(jié)果戈?duì)栆驳拇_贏得了普選票,這次選舉后來(lái)被稱為“最難產(chǎn)的一次大選”,佛羅里達(dá)州的重新計(jì)票官司幾次打到最高法院,最后小布什贏得271張選舉人票,戈?duì)栚A得266張選舉人票,一波三折,奈何!
歪打正著的波洛克
兩位學(xué)者,一位研究歷史,一位研究地震,可謂風(fēng)馬牛不相及也,他們是如何走到一起的?
艾倫·利希特曼是華盛頓的美利堅(jiān)大學(xué)政治史教授,曾擔(dān)任該校歷史系主任。他還做過(guò)前副總統(tǒng)戈?duì)柡蛥⒆h員愛(ài)德華·肯尼迪的顧問(wèn)。
弗拉基米爾·基里斯-波洛克的來(lái)頭要大得多,他曾先后當(dāng)選為美國(guó)人文與科學(xué)院(1969)、美國(guó)國(guó)家科學(xué)院(1971)、蘇聯(lián)科學(xué)院(后為俄羅斯科學(xué)院,1988)、英國(guó)皇家天文學(xué)會(huì)(1989)、奧地利科學(xué)院(1992)、歐洲學(xué)術(shù)院(1999)正式成員,還是一系列國(guó)際科學(xué)組織,如國(guó)際大地測(cè)量學(xué)與地球物理學(xué)聯(lián)合會(huì)(1987-1991)、國(guó)際地震學(xué)與地球內(nèi)部物理學(xué)聯(lián)合會(huì)(1983-1987)、國(guó)際科學(xué)理事會(huì)(1988-1991)的領(lǐng)導(dǎo)人。
波洛克1921年7月31日出生于莫斯科一個(gè)猶太商人家庭。二戰(zhàn)中,他被派往蘇德戰(zhàn)爭(zhēng)前線當(dāng)通信兵。這需要時(shí)刻冒著炮火保障通信線路暢通,無(wú)疑是一項(xiàng)非常危險(xiǎn)的工作。幸運(yùn)的是,他的文化水平較高,所以被送到烏拉爾山以東為國(guó)家尋找石油。在那里,實(shí)際勘探工作激發(fā)了他對(duì)地球物理學(xué)的興趣。戰(zhàn)爭(zhēng)結(jié)束后,他前往蘇聯(lián)科學(xué)院學(xué)習(xí),于1948年獲得數(shù)學(xué)地球物理學(xué)博士學(xué)位。在20世紀(jì)60年代,波洛克研究地下核爆炸產(chǎn)生的地震波,并將它們與天然地震波進(jìn)行比較,為1963年美蘇軍控談判提供了專業(yè)知識(shí)。大約在同一時(shí)期,他開始前往西方旅游,隨后在美國(guó)和意大利的大學(xué)擔(dān)任客座教授。到了20世紀(jì)80年代,他轉(zhuǎn)向了地震預(yù)測(cè)研究,并在莫斯科建立了“地震預(yù)測(cè)理論和數(shù)學(xué)地球物理學(xué)國(guó)際研究所”。
地震預(yù)測(cè)被公認(rèn)為是地震學(xué)界的“圣杯”,很多科學(xué)家都無(wú)比向往,但是又覺(jué)得這是一個(gè)不可能的任務(wù)。波洛克則認(rèn)為,基于最基本的因果關(guān)系的研究就可以找到答案。如果我們以一個(gè)對(duì)立狀態(tài)來(lái)觀察地震,那么就是“穩(wěn)定-地震”,地震破壞現(xiàn)有地質(zhì)狀態(tài)的穩(wěn)定性,出現(xiàn)新的穩(wěn)定。大地震發(fā)生之前會(huì)發(fā)生很多活躍的地質(zhì)活動(dòng),從中總結(jié)出一些有指標(biāo)性的事件,建立模型,然后就可以從指標(biāo)性事件發(fā)生的頻率,來(lái)推斷下一場(chǎng)大地震發(fā)生的可能性。
早在1985年,波洛克就預(yù)測(cè)在美國(guó)加利福尼亞的圣安德烈亞斯斷層將發(fā)生地震。蘇聯(lián)當(dāng)局非常認(rèn)真地對(duì)待這個(gè)預(yù)測(cè),在那年的日內(nèi)瓦峰會(huì)上,蘇聯(lián)領(lǐng)導(dǎo)人戈?duì)柊蛦谭蛱匾庀蛎绹?guó)總統(tǒng)羅納德·里根提到了這一點(diǎn)。1989年10月17日,美國(guó)加利福尼亞洛馬·普雷塔(Loma Prieta)圣克魯斯山附近發(fā)生了一場(chǎng)里氏6.9級(jí)的大地震,造成63人死亡,3757人受傷,波洛克的預(yù)測(cè)似乎得到了證實(shí)。正好1989年棒球世界大賽就在加州奧克蘭的體育場(chǎng)舉行,大批記者把鏡頭轉(zhuǎn)向了災(zāi)區(qū),這場(chǎng)地震也成為美國(guó)第一次在全國(guó)電視臺(tái)直播的大地震。
波洛克1998年加入了加州大學(xué)洛杉磯分校。真正讓他在地震預(yù)測(cè)領(lǐng)域名聲大噪的,是他準(zhǔn)確預(yù)測(cè)了2003年的加州圣西蒙地震和日本北海道地震,他因此上了很多報(bào)紙的頭條。但是隨后又遭遇了重大失敗。2004年他又預(yù)測(cè)了一次加州的地震。公共部門不敢怠慢,馬上發(fā)布緊急預(yù)告,要求居民準(zhǔn)備物資和飲用水,這造成了民眾不同程度的恐慌。結(jié)果這次被證明是一次預(yù)測(cè)失誤。這似乎證明,地震預(yù)測(cè)的確是一個(gè)“不可能完成的任務(wù)”。
從地震預(yù)測(cè)到大選預(yù)測(cè)
波洛克的職業(yè)生涯中有個(gè)有趣的插曲,成就了大選預(yù)測(cè)。
1981年,利希特曼和波洛克恰好都在加州理工學(xué)院訪問(wèn)。一次晚宴中,兩人被安排坐在了一起。波洛克提出兩人合作,利用他的地震預(yù)測(cè)方法來(lái)預(yù)測(cè)總統(tǒng)大選。利希特曼后來(lái)回憶,當(dāng)時(shí)聽到這個(gè)創(chuàng)意時(shí)覺(jué)得很奇怪,但是很快就意識(shí)到:政壇也是會(huì)發(fā)生“地震”的,與地質(zhì)活動(dòng)“穩(wěn)定-地震”的關(guān)系類似,“現(xiàn)任-挑戰(zhàn)”的關(guān)系時(shí)刻存在:現(xiàn)任政黨被挑戰(zhàn),現(xiàn)任官員被挑戰(zhàn),每一次挑戰(zhàn)的成功實(shí)現(xiàn),也就是政壇的地震;同時(shí),挑戰(zhàn)者也就變成了現(xiàn)任。
兩人的重大理論成果是1981年發(fā)表于《美國(guó)國(guó)家科學(xué)院院刊》第11期的論文:《美國(guó)總統(tǒng)選舉中的模式識(shí)別應(yīng)用:整體社會(huì)、經(jīng)濟(jì)和政治特征的作用,1860-1990》。其中的原理和分析比較復(fù)雜,這里簡(jiǎn)單介紹一下他們的算法。在這篇文章里他們提出12個(gè)問(wèn)題:
1.現(xiàn)任政黨的任期是否超過(guò)一個(gè)任期?
2.現(xiàn)任政黨獲得超過(guò)上次選舉投票數(shù)的50%嗎?
3.大選年期間是否有重大的第三黨活動(dòng)?
4.現(xiàn)任政黨候選人的提名是否存在嚴(yán)重的競(jìng)爭(zhēng)?
5.現(xiàn)任總統(tǒng)屬于現(xiàn)任政黨嗎?
6.選舉年是否經(jīng)濟(jì)衰退且蕭條?
7.現(xiàn)任政府治下實(shí)際國(guó)民生產(chǎn)總值(GNP)的年人均增長(zhǎng)率,是否等于或大于過(guò)去8年的平均水平,并且等于或大于1%?
8.現(xiàn)任總統(tǒng)是否對(duì)國(guó)家政策進(jìn)行了重大改變?
9.現(xiàn)任政府治下,全國(guó)是否存在重大的社會(huì)動(dòng)蕩?
10.現(xiàn)任政府是否因重大丑聞而受到負(fù)面影響?
11.現(xiàn)任政黨候選人是否具有卡里斯瑪氣質(zhì)或者是民族英雄?
12.挑戰(zhàn)現(xiàn)任的政黨候選人是否具有卡里斯瑪氣質(zhì)或者是民族英雄?
以上12個(gè)問(wèn)題,回答“是”賦值為1,回答“否”賦值為0。兩人通過(guò)對(duì)1860年到1980年歷次大選的歷史數(shù)據(jù)進(jìn)行梳理,分別給每個(gè)選舉年的12個(gè)問(wèn)題賦值打分。
第一步,將所有選舉年份分為兩組,“現(xiàn)任勝利組”和“挑戰(zhàn)勝利組”。兩個(gè)組內(nèi),分別將每個(gè)問(wèn)題歷年得分總數(shù)除以勝利總數(shù)。例如“挑戰(zhàn)勝利組”中在此期間勝利了13次,在第一個(gè)問(wèn)題累計(jì)得了10,10除以13得到約0.769,這也就是“挑戰(zhàn)勝利組”中年均得到的賦值。
第二步,將“現(xiàn)任勝利組”和“挑戰(zhàn)勝利組”中12個(gè)問(wèn)題年均得到的賦值進(jìn)行比較,把比較的結(jié)果當(dāng)作“核心值”。如果“挑戰(zhàn)勝利組”大于“現(xiàn)任勝利組”,那么“核心值”賦值為0,反之賦值為1。舉例說(shuō)明,第一個(gè)問(wèn)題的年均賦值,“挑戰(zhàn)勝利組”為0.769,“現(xiàn)任勝利組”為0.500,那么第一個(gè)問(wèn)題的“核心值”就是0。
第三步,將特定年份的12個(gè)問(wèn)題的賦值,與12個(gè)問(wèn)題的“核心值”進(jìn)行比較,等于“核心值”賦值0,反之賦值1。最后,將此年份12個(gè)問(wèn)題與“核心值”比較后的得分進(jìn)行求和,這個(gè)得分也就是通往白宮的鑰匙數(shù)量。
通過(guò)研究,兩人發(fā)現(xiàn)在既有的大選歷史數(shù)據(jù)中,最后得分大于5的,全是挑戰(zhàn)者獲勝,小于5的,全是現(xiàn)任者獲勝。等于5的情況下,挑戰(zhàn)者勝利1次,現(xiàn)任者勝利2次。通俗來(lái)說(shuō),如果挑戰(zhàn)者獲得5把鑰匙以上,那么白宮的大門就已經(jīng)向他敞開了。雖然利希特曼在1990年出版的《總統(tǒng)之路的十三把鑰匙》一書中,將問(wèn)題從12個(gè)增加到了13個(gè),并且希望將此預(yù)測(cè)法更加簡(jiǎn)化,核心的算法還是沒(méi)有改變。這種修改也引起質(zhì)疑,特別是關(guān)于外交軍事的重大成功或失敗問(wèn)題,缺乏客觀標(biāo)準(zhǔn),容易受到預(yù)測(cè)者主觀感受的影響。例如,特朗普上臺(tái)后退出奧巴馬的標(biāo)志性外交成果伊朗核協(xié)議,從一開始的評(píng)價(jià)就是兩極分化,很難評(píng)價(jià)。
無(wú)論如何,利希特曼用這個(gè)方法從1984年到2016年幾乎準(zhǔn)確地預(yù)測(cè)了每一屆總統(tǒng)選舉,甚至是最難預(yù)測(cè)的2016年大選。該算法沒(méi)有對(duì)普選票獲勝者和選舉人票獲勝者分開預(yù)測(cè)。它只是預(yù)測(cè)現(xiàn)任政黨是否會(huì)保留白宮。從1984年至2016年,共舉行了九次美國(guó)總統(tǒng)選舉,利希特曼有八次對(duì)實(shí)際當(dāng)選人的預(yù)測(cè)是準(zhǔn)確的。
惟一美中不足的是2000年,利希特曼預(yù)測(cè)在任政黨候選人戈?duì)杽俪觥=Y(jié)果戈?duì)栚A得了普選票,挑戰(zhàn)者黨候選人喬治·W。布什贏得了選舉人票。普選票中布什得票率為47.87%,戈?duì)枮?8.38%,但是最終布什得到271張選舉人票,勝過(guò)了戈?duì)柕?66票,當(dāng)選了總統(tǒng)。
2016年,利希特曼成功預(yù)測(cè)了挑戰(zhàn)者唐納德·特朗普的勝利。在任政黨希拉里·克林頓贏得了普選票;特朗普贏得了選舉人票。2016年希拉里的普選票得票率為48.2%,遠(yuǎn)遠(yuǎn)超過(guò)特朗普的46.1%,但是特朗普贏得了更多的州,所以在選舉人票上以304票碾壓了希拉里的227票。閱讀《白宮鑰匙》系列叢書,不光是對(duì)美國(guó)政治生態(tài)能夠有較深的理解,更重要的是該書提供了一個(gè)方法論來(lái)預(yù)測(cè)選舉。
失之東隅,收之桑榆
與預(yù)測(cè)人類事務(wù)大獲成功相反,波洛克的地震預(yù)測(cè)卻難以保持成功。這也毫不奇怪,人類能觀察到的地質(zhì)現(xiàn)象始終是有限的,世界上最深的科拉超深鉆孔也才12公里,還沒(méi)有達(dá)到平均地殼深度的一半。一些觸發(fā)大地震的關(guān)鍵性、指標(biāo)性的地質(zhì)活動(dòng),很有可能我們到現(xiàn)在都沒(méi)有觀察到,或者已有觀察卻低估了其重要性。在評(píng)估波洛克關(guān)于2004年加州地震的預(yù)測(cè)時(shí),美國(guó)地質(zhì)調(diào)查局(USGS)說(shuō),波洛克團(tuán)隊(duì)的方法是合理的,但無(wú)法證明是有效的。加州地震預(yù)測(cè)評(píng)估委員會(huì)(CEPEC)指出,波洛克的預(yù)測(cè)太少,達(dá)不到統(tǒng)計(jì)學(xué)上的有效性要求,迄今沒(méi)有證據(jù)表明有任何方法能做到有用的地震中期預(yù)測(cè),包括波洛克的方法在內(nèi)。
波洛克去世后,《洛杉磯時(shí)報(bào)》發(fā)表悼文說(shuō),在1980年代,地震預(yù)測(cè)是地震研究中的邊緣學(xué)科,受到很多科學(xué)家的鄙視。波洛克這兩次準(zhǔn)確的預(yù)測(cè)扳回了一局,讓科學(xué)共同體不再認(rèn)為地震預(yù)測(cè)全是胡說(shuō)八道。失之東隅,收之桑榆,波洛克的地震預(yù)測(cè)雖然沒(méi)有取得預(yù)期的成功,但能讓地震預(yù)測(cè)重新回到科學(xué)家的視野之中,也算功不唐捐了。
敬請(qǐng)關(guān)注南方周末APP了解本文續(xù)篇:《我們用地震學(xué)家的算法,“算”了一下2018美國(guó)中期選舉》。