艾伯特-拉斯洛·巴拉巴西 史翔宇
艾伯特-拉斯洛·巴拉巴西(Albert-László Barabási)
《爆發(fā)》作者、美國東北大學教授。
全球復雜網(wǎng)絡(luò)研究權(quán)威。他提出無尺度網(wǎng)絡(luò)模型,2006年因此榮獲匈牙利計算機學會頒發(fā)的馮·諾依曼金質(zhì)獎章。世界著名科技雜志popular science雜志贊譽,“他可以控制世界”。
哈桑是一個藝術(shù)家,我們可以把他看作一個多媒體藝術(shù)家。“9·11”之后,哈桑身上發(fā)生了一些有趣的事情。哈桑經(jīng)常到世界各地旅行,在結(jié)束非洲的旅行后,他回到美國卻在機場被底特律的聯(lián)邦調(diào)查局帶去審問。審問過程持續(xù)了半年,最后,哈桑在測謊儀的幫助下證明了自己的清白。他在聯(lián)邦調(diào)查局里待了幾千小時,雖然沒有被真正逮捕或是被正式提出控告,但他卻為解釋自己的行為而精疲力竭。事實上,他被逮捕的原因非常簡單,因為他正好在“9·11”之后關(guān)閉了他在佛羅里達的儲存箱,所以那個儲蓄箱的主人認為:在“9·11”之后,在有軍事訓練的佛羅里達州,一個名叫哈桑·伊拉希的褐色皮膚的人……
出于這些原因,他被聯(lián)邦調(diào)查局調(diào)查了6個多月。但最有趣的不是發(fā)生在他身上的這件事,而是哈桑對此事的反應。在一次又一次地被叫去聯(lián)邦調(diào)查局談話之后,哈桑被要求要時時匯報自己的行蹤。對方稱這是為了哈桑著想,以便他能順利返回美國。于是,哈桑決定將自己的行蹤完全公開。哈桑給自己建立一個網(wǎng)頁,只要進入頁面,就可以精確地看到他每一刻都在做什么。人們可以看到他在哪里,他所在地的景色;人們不只可以看到他現(xiàn)在在哪,還可以看到他過去的六七年都到過哪里,甚至可以看到他吃過的每一頓飯、出入的每一個洗手間,支出的所有開銷,坐過的所有航班的航班號,幾乎他的一切行蹤都展示在這里。
現(xiàn)在,您可能理解為什么我們覺得這很有趣了,因為他選擇將自己的所有行為公開,所以所有人都可以知道他在干什么。他選擇向所有人公開自己的行蹤使得他的信息失去了價值。因為信息的價值取決于它的有限性,即有的人知道有的人不知道。如果人人都能得到這個信息,那這個信息的價值也就下降了。哈桑認為如果公開了自己的行為,那對于聯(lián)邦調(diào)查局來說,他的信息就失去了價值,并且他也算幫助聯(lián)邦調(diào)查局跟蹤了自己的行為。而結(jié)果是,我們都可以掌握他的行蹤。
這個故事是本書第一條主線,我做的第一件事就是分析哈桑的行動軌跡和習慣,并將關(guān)于他的數(shù)據(jù)和其他成千上萬的個體做對比,以分析他的行為是特別的還是和他人并無大異。他被逮捕的原因就是不規(guī)則的旅行模式,所以我們想分析聯(lián)邦調(diào)查局逮捕他到底有沒有意義。而我們對哈桑的分析確實得出一些有趣的結(jié)論,這個結(jié)論在書尾才得以揭曉。
有關(guān)人類行為的統(tǒng)計有很重要的意義。這些數(shù)據(jù)該如何利用呢?作為一個自然科學家,套用我對自然現(xiàn)象的理解,就會得出:人類是可以被解析、描述、量化,并且是可預測、可控的。這顯然是一個令人非??只诺年愂觥?/p>
在對人類行為的預測方面,我們擁有大量數(shù)據(jù)的支持。我們發(fā)出的每封郵件都留下個人社會關(guān)系、愛好等線索。銀行了解我們的支付能力、品位、購買意愿及購物地點。雖然我們常常選擇不去想這些,但我們已經(jīng)將自己放在記錄事實的多倍顯微鏡下,這些數(shù)據(jù)細節(jié)讓他人可以迅速了解我們的生活。
說到人類行為,我首先要解釋:“為什么一個物理學家要關(guān)注人類行為?”事實是,物理學家開始關(guān)心人類行為,是因為想了解這背后復雜的系統(tǒng)。除了大腦,還有經(jīng)濟、細胞以及計算機系統(tǒng),這里有很多復雜的體系值得研究。
我是從對網(wǎng)絡(luò)的研究開始的。我的前一本書《鏈接》探討了人類以怎樣的一種方式相互聯(lián)系:復雜體系里的各個部分怎樣聯(lián)系?基因之間怎樣相互關(guān)聯(lián)?計算機之間怎樣相互關(guān)聯(lián)?我們要怎么描繪這些關(guān)聯(lián)背后的大網(wǎng)?《爆發(fā)》一書的研究就是從結(jié)構(gòu)、網(wǎng)絡(luò)分析的角度探詢促使這些事情發(fā)生的動力。
書中的第二條故事線叫做“1514”,這個故事講的是1513年在羅馬舉行的教皇選舉如何最后演變成了十字軍東征。十字軍東征起于匈牙利,一直蔓延到特蘭西瓦尼亞,我對十字軍東征感興趣的原因之一是我就出生在特蘭西瓦尼亞,對這一事件比較了解。但是這件事到底為什么會引起我的興趣呢?從書的角度來說,這件事有趣的一點在于,在十字軍東征剛開始時,一個人站出來說:“我知道將要發(fā)生的一切?!彼念A言是,如果你們在思考要不要發(fā)動改革,那么這場戰(zhàn)爭一定會打響,這會是一場血腥的戰(zhàn)役,你們最終會取得勝利。我要問的是,他的預言是準確的嗎?一個1513年的人又怎么能預測出接下來6個月要發(fā)生的事情,而將這件事作為起點,我們真的能預測重大到可以載入史冊的事件嗎?事實上我們都知道1514年的這場事件的結(jié)局是什么,但是我認為這個故事本身就十分吸引人,并跟書中的主旨緊密相連,即我們怎樣預測人類行為。
預測本身其實就是一個令人感到恐懼的詞。問題是我們要預測什么?我們要預測下次升職的時間嗎?或者和誰偶遇?所有這些預測都需要數(shù)據(jù),有了這些數(shù)據(jù)我們才能說預測的可能性有多大。所以幾年前我開始思考這個問題時,決定從收集人類行為軌跡相關(guān)的數(shù)據(jù)開始,即我們在哪里,接下來要去哪里。
如果我能掌握自己行動軌跡的數(shù)據(jù),是否能用一個方程式解出我明天下午三點會在哪里?我并不是關(guān)心明天下午三點在哪,但是這個測試確實展示了我們對于人類行為,比如行動軌跡的了解能有多深。
我想證實,一旦你收集到足夠多的數(shù)據(jù),你就可以提出這個基本的問題:我們的可預測性有多高,并且會得到一個令人震驚的答案。數(shù)據(jù)真的可以幫助我們預測之后很長一段時間的行為嗎?我嘗試在書中一步步推進這一論題。
(本文根據(jù)巴拉巴西9月9日在中科院計算所湛廬文化“大數(shù)據(jù)時代:誰來掌握我們的未來”高峰論壇整理而成。)