付 立
在現(xiàn)實(shí)生活中,競(jìng)爭(zhēng)性、對(duì)抗性的活動(dòng)比比皆是,如何在這種環(huán)境中采取最優(yōu)的策略擊敗對(duì)手呢?這正是對(duì)策論所研究的。對(duì)策論又叫博弈論,因?yàn)樽钜?guī)范的對(duì)抗性活動(dòng)是下棋——博弈。
這里,“對(duì)策”可以理解為對(duì)對(duì)方策略的反應(yīng)。在對(duì)抗性活動(dòng)中,各方是具有利害沖突關(guān)系的,一方贏,就可能意味著另一方或多方輸。對(duì)策論研究各方采取策略及效果的規(guī)律,提供對(duì)付對(duì)方策略的最優(yōu)策略,可以使自己在對(duì)抗中處于比較有利的地位。
匈牙利數(shù)學(xué)家馮·諾依曼是個(gè)在對(duì)策論研究中作出重大貢獻(xiàn)的人。1928年,他提出的極小極大定理是構(gòu)建對(duì)策論大廈的重要基礎(chǔ)。
馮·諾依曼分析的是只有兩人參加的游戲,游戲中每個(gè)人可選擇的策略只有有限個(gè),兩個(gè)人的輸贏卻是相抵的:一方贏,另一方就輸。這種二人有限零和對(duì)策,是對(duì)策類型中最簡(jiǎn)單的一種。馮·諾依曼發(fā)現(xiàn),在這樣的對(duì)策中,雖然兩個(gè)非常理智的玩家都企圖戰(zhàn)勝對(duì)方,但游戲仍然存在著最佳解。比如說(shuō),兩個(gè)孩子分蛋糕,每個(gè)孩子都喜歡要多的,但是一個(gè)多了,另一個(gè)就少了,這是一個(gè)二人雙策零和對(duì)策,它的解分為兩個(gè)步驟:一個(gè)孩子先把蛋糕切成兩半,再由另一個(gè)孩子挑選。在每個(gè)孩子都認(rèn)為對(duì)方是貪婪的合理假設(shè)下,有沒有讓兩個(gè)孩子都滿意的解,也就是能讓兩個(gè)孩子都不感到吃虧的解呢?有,就是第一個(gè)孩子盡可能公正地切蛋糕,讓兩塊蛋糕相差極小,否則,第二個(gè)孩子會(huì)選大的那塊。這就是極小極大定理,后來(lái)推廣到有更多玩家的情況,即多人有限零和。
對(duì)于零和這種對(duì)抗性極強(qiáng)的活動(dòng)來(lái)說(shuō),只有最佳解,沒有雙贏解。因?yàn)樽疃嘀荒茏岆p方都不覺得吃虧,卻不可能讓雙方都沾著便宜。戰(zhàn)爭(zhēng)中的敵對(duì)雙方即是如此。
好在現(xiàn)實(shí)世界中并非只有零和,在現(xiàn)實(shí)中,并不一定是你贏我就必然輸,它很可能是非零和的。比如說(shuō)股票市場(chǎng),炒股的人中有贏也有輸,但是錢的總數(shù)是隨著股票市場(chǎng)資本的增加而變化的,并不是贏輸相抵的。
1950年美國(guó)數(shù)學(xué)家小約翰·福布斯·納什的均衡定理,將極小極大定理推廣到了非零和的活動(dòng)中。他指出,在非零和的對(duì)策中,只要參加的人數(shù)有限,而且他們可選擇的策略也是有限的,那么,就至少存在一個(gè)納什均衡點(diǎn)。而在納什均衡點(diǎn)上,沒有哪個(gè)人可以通過(guò)選擇另外一個(gè)可供選擇的策略來(lái)改善自己目前的地位,因此它正是一個(gè)最佳解。
更為重要的是納什的研究還表明,在許多情況下,最佳解雖然存在卻不一定是表面上顯而易見的那個(gè)。所謂的“囚徒困境”就是一個(gè)例子。
“囚徒困境”是說(shuō)兩個(gè)共犯一案的人甲和乙被分別關(guān)押,他們可以保持沉默(合作),也可以供認(rèn)事實(shí)真相(背叛),這是他們可選擇的兩個(gè)策略。選擇不同的策略會(huì)有不同的回報(bào),而且這個(gè)回報(bào)與另一個(gè)人的選擇有關(guān),具體地說(shuō):如果兩個(gè)人都保持沉默,則因無(wú)法定罪,兩人都會(huì)被釋放;如果兩個(gè)人都坦白了,則他們兩人都被判罪;如果其中的一個(gè)人坦白了,他將被釋放還會(huì)受到獎(jiǎng)賞,而另一個(gè)人則要受到懲罰,被判罪并罰款。
合作還是背叛?表面上看,他們的最佳選擇是合作,但在現(xiàn)實(shí)中很少出現(xiàn)這種情況,因?yàn)槊總€(gè)人都有同樣的擔(dān)心:如果另一個(gè)人坦白了怎么辦。這種擔(dān)心導(dǎo)致他們都選擇坦白,因?yàn)閾?jù)他們分析,如果坦白的話,結(jié)果會(huì)有兩個(gè):一是對(duì)方?jīng)]說(shuō),他將被釋放還會(huì)受到獎(jiǎng)賞;另一個(gè)是對(duì)方也坦白了,那就與同伙一起坐牢。哪個(gè)結(jié)果都比“自己保持沉默,對(duì)方卻坦白了”的結(jié)果強(qiáng)。所以實(shí)際發(fā)生的最佳解往往是兩個(gè)人相互背叛?,F(xiàn)實(shí)生活中,各國(guó)的貿(mào)易保護(hù)主義,企業(yè)之間的價(jià)格大戰(zhàn)等,都屬于這種情況。
要想體會(huì)納什研究的妙處,必須強(qiáng)化一個(gè)意識(shí):對(duì)策是相互依賴的。對(duì)于每個(gè)局中人來(lái)說(shuō),一個(gè)對(duì)策的結(jié)果取決于所有其他局中人做什么選擇。這樣一來(lái),在一個(gè)依次行動(dòng)的對(duì)抗性活動(dòng)中,一個(gè)局中人的策略原則就是要注意到別人與自己一樣都是有頭腦的,然后倒退推理、預(yù)測(cè)未來(lái),也就是通過(guò)對(duì)“我認(rèn)為他認(rèn)為我認(rèn)為他認(rèn)為我認(rèn)為……”的分析,嘗試預(yù)測(cè)各種選擇的可能結(jié)果,而他的最佳選擇正是在這樣的預(yù)測(cè)的基礎(chǔ)上作出的。
現(xiàn)在我們考慮這樣的情況:如果局中人對(duì)對(duì)方非常信任會(huì)怎樣?顯而易見,他們的最佳選擇是合作,兩個(gè)人都保持沉默,結(jié)果兩個(gè)人都能自由,達(dá)到一種雙贏的結(jié)局。
由此我們注意到,雙贏作為最佳解并不是邏輯的、數(shù)學(xué)的結(jié)果,而是綜合了心理、社會(huì)諸多因素后的結(jié)果。如果人們講究誠(chéng)信,相互合作,就會(huì)給雙方帶來(lái)利益,取得雙贏。否則,單靠對(duì)策論是算不出雙贏解的。
(李哈鳴摘自《學(xué)習(xí)時(shí)報(bào)》)