王興
囚徒困境是一種非合作博弈,它的主旨為:囚徒們雖然彼此合作,堅決不吐實情,可為全體帶來最佳利益(無罪開釋),但在資訊不明的情況下,出賣同伙可為自己帶來利益(縮短刑期),而被同伙招出來可為他帶來利益,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。
1950年,就職于蘭德公司的梅里爾·弗勒德和梅爾文·德雷希爾擬定出相關(guān)困境的理論,后來由顧問艾伯特·塔克以“囚徒”方式闡述,并命名為“囚徒困境”。那么,囚徒困境的案例究竟是怎樣的呢?
警方破獲了一起縱火案,抓住了兩名嫌疑犯甲和乙,但是沒有足夠的直接證據(jù)來指控兩人犯罪。于是,警方分開囚禁兩名嫌疑人,分別對他們進行了訊問。為了瓦解分化對方,警方分別對兩名嫌疑人說:如果主動坦白,可以減輕處罰;如果頑抗到底,一旦同伙招供,就要受到嚴懲。
如果兩人都拒不坦白,那最后警方會以擾亂社會治安、破壞公共安全的罪名將兩人各判刑1年;如果其中一人認罪并作證檢控對方,此人將作為證人而免于起訴,而保持沉默的另一人將被重判15年;如果兩人都招供,則兩人都會因縱火罪被各判10年。
面對這樣的情況,甲乙兩名嫌疑犯在各自的心里打起了小算盤。甲經(jīng)過權(quán)衡后發(fā)現(xiàn),只有自己招供是最佳的選擇,可以獲得自由;乙也發(fā)現(xiàn),無論甲招不招供,自己的最佳選擇都是招供。所以,最后的結(jié)果是,甲乙兩人都分別向警方坦白了自己的罪行,甲乙兩個自認為聰明的人分別被判刑10年。
囚徒困境假定每個參與者(即“囚徒”)都是利己的,即都尋求最大自身利益,而不關(guān)心另一參與者的利益。
由于兩名囚徒隔絕監(jiān)禁,并不知道對方的最終的決策,即使他們能交談,也未必能夠盡信對方不會反口。就個人的理性選擇而言,檢舉背叛對方所得的刑期,總比自己沉默要來得低。兩人面對的情況一樣,所以兩人的理性思考都會得出相同的結(jié)論——選擇背叛,結(jié)果兩人同樣獲刑10年。
因為雙方都認為選擇背叛自己最得利,所以根本不會去顧及團體利益。而以全體利益而言,如果兩個人都合作保持沉默,兩人都只會被判刑1年,總體利益更高,結(jié)果也比兩人背叛對方、判刑10年的情況更好。
但兩人均為理性的個人,且只追求自己的個人利益。均衡狀況會使兩個囚徒都選擇背叛,結(jié)果兩人獲刑均比合作要高,這就是“困境”所在。在日常生活中,有很多這樣的“困境”存在。
(摘自《每天學(xué)點博弈論全集》石油工業(yè)出版社 圖/傅樹清)endprint