朱雅敏 魏永波
【摘 要】“博弈參與人是完全理性的”,這是古典博弈論的基本假設(shè),是博弈論發(fā)展的理性基礎(chǔ)。但是這個(gè)假設(shè)卻產(chǎn)生出一系列博弈困境和悖論。這促使古典博弈理論理性基礎(chǔ)的修正-有限理性下的博弈理論誕生。完全理性和有限理性,是劃分古典博弈論和現(xiàn)代博弈論的分水嶺。
【關(guān)鍵詞】博弈;完全理性;有限理性
0 引言
博弈論是1980年代以來(lái)經(jīng)濟(jì)學(xué)中發(fā)展最迅速和影響最大的分支學(xué)科。在短短的20年時(shí)間里,博弈論從一種不為一般經(jīng)濟(jì)學(xué)家知曉的應(yīng)用數(shù)學(xué)理論,一躍變成主流經(jīng)濟(jì)學(xué)最核心的內(nèi)容,成為很多經(jīng)濟(jì)學(xué)家的基本分析工具和共同語(yǔ)言。但是,博弈論在獲得巨大成功的同時(shí),也逐漸暴露出它所隱含的一些問(wèn)題,其中對(duì)博弈論的發(fā)展威脅最大最嚴(yán)重的問(wèn)題是它的理性基礎(chǔ),即古典博弈論假設(shè)“博弈參與人是完全理性的”。
1 “完全理性”的困境
“博弈參與人是完全理性的”,這是博弈論的公設(shè),然而理性人假設(shè)卻導(dǎo)致了諸多博弈困境,這些困境主要體現(xiàn)為:
“完全理性”假設(shè):
1)個(gè)體理性與集體理性的沖突
一個(gè)熟知的博弈困境是囚徒博弈。有一天,一位富翁在家中被殺,財(cái)物被盜,警察在此案的偵破過(guò)程中抓到了兩個(gè)犯罪嫌疑人,甲和乙,并從他們的住處搜出了被害人家中丟失的財(cái)物,但是他們都否認(rèn)曾殺過(guò)人,辯稱是先發(fā)現(xiàn)富翁被殺,然后只是順手牽羊偷了點(diǎn)東西。于是警方將兩個(gè)人隔離,分別關(guān)在不同的房間進(jìn)行審訊,由警察和他們兩個(gè)人單獨(dú)談話。警察說(shuō):“由于你們的偷盜罪已有確鑿的證據(jù)所以可以判你們一年的刑期。但是,我可以和你們做個(gè)交易。如果你單獨(dú)坦白殺人的罪行,我只判你半年的刑期,但是,你的同伴要被判十年。如果你拒不坦白,而你的同伙坦白,那么你將被判十年的刑期,而他只判半年的刑期。但是,如果你們兩個(gè)人都坦白交代,那么,你們都將判五年的刑期。”
眾所周知,這個(gè)經(jīng)典博弈案例的結(jié)果是雙方從個(gè)人利益最大化出發(fā),都選擇坦白,都判五年的刑期。
與囚徒困境類似的案例還有“公共地悲劇”,囚徒困境與公共地悲劇所反映的是個(gè)體的理性行為產(chǎn)生的集體的不合理性行為,體現(xiàn)了個(gè)體理性與集體理性的沖突。
2)過(guò)程理性與結(jié)果理性之間的沖突
有這樣一個(gè)動(dòng)態(tài)博弈——A、B兩個(gè)人分100元錢。規(guī)則規(guī)定:A提出方案,B對(duì)之進(jìn)行表決。如果B對(duì)A提出的方案表示同意的話,A、B就按照A提出的方案進(jìn)行分配,如果B不同意A的方案,那么A和B均將一無(wú)所有。這是一個(gè)完全且完美信息動(dòng)態(tài)博弈(dynamic game with perfect and complete information)。讓我們分析這個(gè)過(guò)程。
A提出方案時(shí),他知道B是理性人。B的行為是可被A預(yù)測(cè)的。A將提出這么一個(gè)方案:A和B的所得比例為99.99:0.01,即給B留1分錢,而將其余99元9角9分留給自己。此時(shí)B面臨“同意”和“不同意”的選擇:如果B“同意”,B所得為1分錢;如果B“不同意”,他將一無(wú)所得。理性的B將選擇“同意”——這個(gè)選擇是A所能夠預(yù)測(cè)的。
因此在“最后通牒博弈”中,理性的B只能得到1分錢!而A正是根據(jù)B的理性的選擇而使自己利益最大。當(dāng)然這不是實(shí)際情況,有博弈論專家對(duì)這個(gè)問(wèn)題進(jìn)行實(shí)驗(yàn)研究(在經(jīng)濟(jì)學(xué)中實(shí)驗(yàn)研究已成時(shí)尚,2002年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者卡爾曼是實(shí)驗(yàn)經(jīng)濟(jì)學(xué)研究的先驅(qū))。根據(jù)賓謨(K Binmore),“實(shí)驗(yàn)結(jié)果呈現(xiàn)多樣化,但是參與人A提出的方案很可能在50:50附近;而對(duì)參與人B而言,如果其分配的數(shù)額不少于三分之一,他將趨向于接受。”
現(xiàn)在,我們假定B具有某種程度的非理性。他會(huì)向A發(fā)出威脅“如果你不給我足夠的份額,我將不同意?!盇知道B確實(shí)不是完全理性的人。A想,如果不給B足夠數(shù)額的錢,B將不同意。因此,在提出分配方案時(shí),A會(huì)考慮B的非理性的程度。一個(gè)極端的情況是,如果A是理性人,而B(niǎo)極端非理性,那么一個(gè)可能的分配方案比例將是0.01:99.99。即A得到1分錢,B得到99.99元!
這個(gè)例子中,我們看到,人的理性程度與其所得是呈反比關(guān)系的。在博弈論中理性人是努力使自己的收益最大的人,而在最后通牒博弈中,越理性的人得到的利益越低。
理性人假設(shè)導(dǎo)致如此多的困境,而這些困境好多與實(shí)際相違背。博弈論想要作為一門科學(xué)發(fā)展下去,除了能夠用它的理論解釋現(xiàn)實(shí)世界中的問(wèn)題,還要能夠?qū)€(gè)人或團(tuán)體作出正確決策有理論指導(dǎo)。而單純的假設(shè)“博弈參與人是理性的”,顯然不能夠做到這一點(diǎn)。
2 完全理性的修正——有限理性下的博弈分析
20世紀(jì)80年代以后,實(shí)驗(yàn)博弈和演化博弈進(jìn)入博弈論,實(shí)驗(yàn)博弈論用實(shí)驗(yàn)研究策略行為的一般原理,而演化博弈則將達(dá)爾文的生物進(jìn)化論引入博弈論,它假定參與人是有限理性的,由此與此前的假定人是完全理性的古典博弈論形成區(qū)別。
有限理性的概念最初是阿羅提出的,他認(rèn)為有限理性就是人的行為“既是有意識(shí)的理性,但這種理性又是有限的”。而“有限理性”概念的主要提倡者是諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主西蒙(Simon)。西蒙認(rèn)為有限理性的理論是“考慮限制決策者信息處理能力的約束的理論”。
有限理性博弈分析的關(guān)鍵是確定博弈主體學(xué)習(xí)和策略調(diào)整的模式,或者說(shuō)機(jī)制。由于有限博弈主體理性層次的多樣性,使得博弈主體的學(xué)習(xí)和策略調(diào)整的方式和速度相差甚遠(yuǎn),要對(duì)有限理性博弈做出有效的分析預(yù)測(cè),必須發(fā)展適合分析博弈主體的學(xué)習(xí)和策略調(diào)整過(guò)程,適合分析這種學(xué)習(xí)和動(dòng)態(tài)調(diào)整過(guò)程中的穩(wěn)定性,必須用不同的機(jī)制來(lái)模擬博弈主體的策略調(diào)整過(guò)程。
目前,采用較多的兩種分析機(jī)制:一種是理性層次較高、學(xué)習(xí)能力較快的群體,其分析機(jī)制是“最優(yōu)反應(yīng)動(dòng)態(tài)”;而對(duì)于理性層次較低、學(xué)習(xí)能力較差的行為主體,相應(yīng)的分析機(jī)制是“復(fù)制動(dòng)態(tài)過(guò)程”。事實(shí)上,不僅不同博弈的博弈主體的理性和學(xué)習(xí)能力有差異,需要多種動(dòng)態(tài)機(jī)制來(lái)模擬,甚至同一個(gè)博弈中的不同博弈主體在理性方面也會(huì)有較大差異,同樣需要不同的動(dòng)態(tài)機(jī)制來(lái)描述和分析。所以,生物進(jìn)化中生物性狀和行為特征動(dòng)態(tài)變化過(guò)程的“復(fù)制動(dòng)態(tài)”,在有限理性博弈分析中正是模擬有限理性博弈主體學(xué)習(xí)和調(diào)整策略過(guò)程最主要的動(dòng)態(tài)機(jī)制之一,而生物進(jìn)化理論所具有的在動(dòng)態(tài)調(diào)整過(guò)程中恢復(fù)或者達(dá)到的穩(wěn)健性均衡——“進(jìn)化穩(wěn)定策略”,恰是有限理性博弈分析中最核心的均衡概念。
正因?yàn)樯鲜鲇邢蘩硇圆┺姆治雠c生物進(jìn)化理論的這種關(guān)系,所以這種博弈分析理論也稱為“進(jìn)化博弈論”或“經(jīng)濟(jì)學(xué)中的進(jìn)化博弈論”。下面分析這個(gè)鷹(H)—鴿(D)進(jìn)化博弈模型。在一個(gè)生態(tài)環(huán)境中的一群動(dòng)物,可以采用兩種策略一鷹策略和鴿策略,圍繞著有限的生存資源進(jìn)行博弈。其中的鴿策略(D)是指比較溫順,面對(duì)強(qiáng)敵就逃跑的策略,而鷹策略(H)是指比較強(qiáng)硬,碰到對(duì)手就一直與對(duì)方戰(zhàn)斗,直至對(duì)方逃跑,或自己受傷的策略。V代表雙方爭(zhēng)奪的利益,C是爭(zhēng)奪中失敗一方的損失。
這個(gè)博弈模型的得益矩陣表示如表1:
可以看出,如果雙方都采用鷹策略,那么雙方獲勝和失敗的概率都是1/2,因此各自的期望利益都是V—C/2;如果一方采取鷹策略,另一方采取鴿策略,則采取鷹策略的一方獲得全部的V,采取鴿策略方得0;如果雙方都采用鴿策略,那么雙方能夠分享利益或各有一半機(jī)會(huì)獲得利益但沒(méi)有損失,因此各有V/2單位得益。
設(shè)戰(zhàn)略分布已知,即集體內(nèi)采取鷹策略的比率為P,采取鴿策略的比率為1-P,則采取鷹策略的個(gè)體的期望收益為:EU(H)=p(V-C)/2+(1-p)V;采取鴿策略的個(gè)體的期望收益為:EU(D)=p(1-p)V/2。
當(dāng)V>C時(shí),無(wú)論P(yáng)為多少,EU(H)>EU(D),因而鷹策略為支配策略,所有個(gè)體均會(huì)采取鷹策略。這也是惟一的一個(gè)納什均衡,但它不是帕累托最優(yōu)的均衡,類似于囚徒困境。
當(dāng)v (1)當(dāng)P EU(D),采取鷹策略者將獲得更高收益,采取鷹策略的個(gè)體數(shù)目將會(huì)增加; (2)當(dāng)P>P﹡時(shí),EUH 這里,P﹡為穩(wěn)定地采取鷹策略的個(gè)體占總體的比例,可以證明P﹡=V/C。所以,當(dāng)我們從最佳響應(yīng)動(dòng)力的角度出發(fā),社會(huì)中的策略分布無(wú)論從哪一點(diǎn)出發(fā),采取鷹策略的個(gè)體比率最終都將收斂到P﹡上來(lái),從這個(gè)意義上說(shuō),P﹡具有進(jìn)化穩(wěn)定性。 上述進(jìn)化博弈分析方法,可用來(lái)分析由有限理性博弈主體組成的群體成員的策略篩選、演進(jìn),特別是各個(gè)策略在群體成員采用頻率、比例意義上的動(dòng)態(tài)穩(wěn)定性;研究有限理性的博弈主體長(zhǎng)期通過(guò)學(xué)習(xí)和模仿調(diào)整策略最終會(huì)達(dá)到的策略頻數(shù)意義上的均衡及其效率意義;在長(zhǎng)期意義上或者對(duì)已經(jīng)延續(xù)了相當(dāng)長(zhǎng)時(shí)期的問(wèn)題,也可用于對(duì)相關(guān)問(wèn)題的預(yù)測(cè)。這種進(jìn)化博弈分析對(duì)完全理性博弈分析的納什均衡也有一種檢驗(yàn)和篩選作用。進(jìn)化穩(wěn)定策略是納什均衡的一個(gè)精煉概念,進(jìn)化穩(wěn)定策略必然對(duì)應(yīng)完全理性博弈中的納什均衡,包括純策略納什均衡和混合策略納什均衡,但完全理性博弈的納什均衡在進(jìn)化博弈中并不一定是進(jìn)化穩(wěn)定策略。更重要的是,雖然完全理性是唯一的,但有限理性卻有多種情況和層次。對(duì)學(xué)習(xí)速度較快的小群體有限理性博弈主體的動(dòng)態(tài)策略調(diào)整,描述他們的進(jìn)化博弈過(guò)程的有效動(dòng)態(tài)機(jī)制主要是“最優(yōu)反應(yīng)動(dòng)態(tài)”。而在最優(yōu)反應(yīng)動(dòng)態(tài)中還存在各博弈主體究竟是對(duì)哪個(gè)范圍的其他博弈主體的策略進(jìn)行反應(yīng),是對(duì)其他博弈主體的前期策略進(jìn)行反應(yīng)還是對(duì)過(guò)去的平均策略進(jìn)行反應(yīng)等的區(qū)別。事實(shí)上,進(jìn)化博弈的動(dòng)態(tài)策略調(diào)整機(jī)制是很多的,究竟采用哪種應(yīng)該根據(jù)對(duì)具體問(wèn)題中博弈主體的理性和行為方式的判斷而定。 3 結(jié)論 由于對(duì)理性的假設(shè),博弈論的發(fā)展受到了影響,引來(lái)了諸多的博弈論困境。于是有限理性應(yīng)運(yùn)而生,通過(guò)對(duì)目前有限理性的發(fā)展和現(xiàn)狀的分析說(shuō)明,我們可以看出它的出現(xiàn)給博弈論的發(fā)展帶來(lái)了曙光?!坝邢蘩硇浴钡牟┺闹黧w往往不能或不會(huì)采取完全理性條件下的最優(yōu)策略。博弈主體間的策略往往是通過(guò)學(xué)習(xí)調(diào)整的結(jié)果,而不是一次性選擇的結(jié)果,并且即使達(dá)到了均衡也可能再次偏離。能夠更大程度的反應(yīng)現(xiàn)實(shí)社會(huì)人類的文化傳承性對(duì)于人類做決策的影響。 【參考文獻(xiàn)】 [1]潘天群.博弈論中理性人假設(shè)的困境[J].經(jīng)濟(jì)學(xué)家,2003(4):99-104. [2]肯·賓默爾.博弈論教程[M].謝識(shí)予,等譯.上海:格致出版社,上海三聯(lián)書(shū)店,上海人民出版社,2010. [3]謝識(shí)予.有限理性條件下的進(jìn)化博弈理論[J].上海:上海財(cái)經(jīng)大學(xué)學(xué)報(bào),2001,3(5):3-9. [責(zé)任編輯:劉展]