蔣正峰
(1.華南師范大學(xué)政治與行政學(xué)院,廣州 510631;2.華南農(nóng)業(yè)大學(xué)思政部,廣州 510642)
對(duì)博弈論公設(shè)的質(zhì)疑
蔣正峰1,2
(1.華南師范大學(xué)政治與行政學(xué)院,廣州 510631;2.華南農(nóng)業(yè)大學(xué)思政部,廣州 510642)
“理性人”和公共知識(shí)是博弈論中的兩個(gè)公設(shè),即假設(shè)博弈局中人都是理性的,在公共知識(shí)的背景下選取行為策略,使自己的效用達(dá)到最大化。然而,正是從這樣的假設(shè)前提出發(fā),卻使博弈理性推理陷入困境,“理性人”不理性。因此,符合邏輯的是對(duì)博弈論公設(shè)產(chǎn)生質(zhì)疑。
理性;公共知識(shí);集體理性;個(gè)體理性
博弈論以經(jīng)濟(jì)個(gè)體決策和行為互動(dòng)作為研究對(duì)象,研究的主要問題是人們?cè)诨?dòng)行為中的推理問題,就是在與人們的利益和行為有直接的相互影響和相互作用的情況下個(gè)體的理性選擇與策略。Harsanyi在1994年獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的致辭中曾這樣定義博弈論:博弈論是關(guān)于策略相互作用的理論,就是說,它是關(guān)于社會(huì)形勢(shì)中理性行為的理論,其中,每個(gè)局中人對(duì)自己行動(dòng)的選擇必須以對(duì)其他局中人將如何反應(yīng)的判斷為基礎(chǔ)。
在博弈論的視野中,人類的所有理性活動(dòng),只要是互動(dòng)行為,都可以看成是博弈行動(dòng)。當(dāng)然,局中人在博弈中如何選擇自己的行動(dòng)策略,一般都是經(jīng)過一番推理后而采取的,而博弈推理也必須要有前提條件。為此,博弈論給出了博弈推理的兩個(gè)公設(shè),即假設(shè)博弈局中人都是“理性”的,在行動(dòng)策略上努力使自己獲得更多收益,并且每個(gè)局中人彼此都知悉或相信對(duì)方是“理性”人,在博弈中都使自己的效用最大化,這樣博弈推理就能進(jìn)行了??创蠹叶际煜さ那敉嚼Ь车睦?
甲、乙兩個(gè)同案犯罪嫌疑人被囚禁起來進(jìn)行隔離單獨(dú)審問,要求坦白交待犯罪事實(shí)。每個(gè)嫌疑人或者坦白或者抵賴,如果雙方都坦白交待的話,根據(jù)法律規(guī)定犯某某罪每人將判刑三年;如果他們都抵賴,則由于證據(jù)不足,每人將只判刑一年;如果一方抵賴而另一方卻坦白并愿意作證,那么根據(jù)坦白從寬抗拒從嚴(yán)原則,抵賴者將從嚴(yán)處罰,判刑五年,而坦白者將寬大處理,免刑釋放。
在這個(gè)“囚徒博弈”中,每個(gè)嫌疑人究竟是選擇坦白還是抵賴,大抵都需經(jīng)過這樣的推理:
(1)如果對(duì)方坦白,我抵賴的話所得支付為-5,我坦白的話所得支付為-3,根據(jù)理性人假設(shè),我選坦白(-3>-5)。
(2)如果對(duì)方抵賴,我抵賴的話所得支付為-3,我坦白的話所得支付為0,根據(jù)理性人假設(shè),我還是選坦白(0>-3)。
綜合(1)、(2),所以不論對(duì)方坦白還是抵賴,我這方都坦白。這樣,“囚徒博弈”的均衡解是雙方都選取坦白策略,這就是所謂的納什均衡點(diǎn)。
進(jìn)而我們把“囚徒博弈”重復(fù)有限次,比如n次,那么局中人又將如何選取策略呢?運(yùn)用倒推法,從最后一次開始,很顯然,在第n次博弈中,雙方都會(huì)選坦白,因?yàn)檫@是最后一次,就像一次性囚徒博弈一樣,選擇坦白是各自的嚴(yán)格優(yōu)勢(shì)策略(不論對(duì)方采取什么策略,我采取這個(gè)策略總比采取任何別的策略都好)。再看第n-1次,因?yàn)榈趎次已確定雙方都坦白,所以在第n-1次局勢(shì)中,彼此也會(huì)選擇坦白策略。同樣,第n-2次,第n-3次……直到第1次,雙方都會(huì)選擇坦白策略。于是通過倒推法得到的結(jié)論是:理性人在有限重復(fù)囚徒博弈中永遠(yuǎn)都坦白。
然而,出乎意料的是事實(shí)并非如此。在一次性“囚徒博弈”中,選擇坦白并沒有給雙方帶來最大的效用。事實(shí)上,雙方都坦白所得支付從某種意義上說是最少的(兩人的和支付是-6),在有限重復(fù)囚徒博弈中更是如此。雙方永遠(yuǎn)都坦白的結(jié)論在直覺上是不真實(shí)的,與實(shí)際中的情形相反,這只能是“最小程度理性”。[1]面對(duì)如此困惑,人們不得不對(duì)博弈理性推理提出質(zhì)疑和挑戰(zhàn)。
理性人假設(shè)是博弈推理的兩個(gè)公設(shè)之一。所謂理性人,就是追求自己的效用最大化。但問題卻是:理性人如何達(dá)到效用最大化?換言之,何種行為才能在理性人假設(shè)的前提下是“理性的”?
對(duì)理性行為的理解,Harsanyi分析了對(duì)理性行為的手段—結(jié)局解釋。他認(rèn)為,在日常生活中,當(dāng)我們談及“理性行為”時(shí),絕大多數(shù)情形中我們想到的是這樣一種行為,它涉及為達(dá)成某種特定結(jié)局而選擇最佳的可行手段……它指明為了得到某種特定結(jié)局或目標(biāo)我們應(yīng)該做什么。[3]就像前文囚徒博弈中的嫌疑人一樣,雖然我們可以從所謂的理性人假設(shè)出發(fā),來解釋他們的行為策略和預(yù)測(cè)納什均衡點(diǎn)的出現(xiàn),實(shí)際上嫌疑人都坦白所得的支付并不是最大的,從理性(手段)出發(fā)得到非理性的結(jié)局。在有限重復(fù)囚徒博弈中也類似,從理性人出發(fā)得出永遠(yuǎn)都坦白的結(jié)論似乎理所當(dāng)然,然而囚徒很少能夠一貫地按這種理性原則行動(dòng),有時(shí)行為策略的非理性反而結(jié)局更理性?!疤拱讖膶?牢底坐穿;抗拒從嚴(yán),回家過年。”就是這方面的生動(dòng)寫照。實(shí)際上,一個(gè)人選擇的目標(biāo)不合理,無論他如何作為,他的行為都不能稱為是理性的,對(duì)理性行為的手段—結(jié)局解釋過于狹隘。
偏好—機(jī)會(huì)模型是對(duì)理性行為的另一種解釋,它帶有很強(qiáng)的數(shù)理經(jīng)濟(jì)學(xué)色彩,概念的詮釋方式本身即便于數(shù)理化。理性行為等價(jià)于效用最大化,個(gè)人的偏好就可以由一個(gè)適當(dāng)定義的效用函數(shù)來表示。這樣本來不易捉摸的理性行為就可表述為數(shù)學(xué)模型,成為西方經(jīng)濟(jì)學(xué)進(jìn)行理論研究的有力工具。然而該模型也有局限性,正如Harsanyi指出,它僅提供確定性情形中理性行為令人滿意的表示,但不能在風(fēng)險(xiǎn)和不確定性情形中做到這一點(diǎn)。再者,理性人追求自己的最大化效用,這種理性是個(gè)體理性。在博弈中每個(gè)局中人都簡(jiǎn)單地從理性原則出發(fā)去推斷其他參與人的行為,個(gè)體理性是根本無法達(dá)到的。因此,理性必須以所有參與人為出發(fā)點(diǎn),以集體理性(即所有參與人的效用總和最大化)取代個(gè)體理性。如前述囚徒困境的例子,各自從個(gè)體理性出發(fā)都坦白,支付總和為-6,最少,而雙方都抵賴時(shí)支付最大為-2,這時(shí)雙方都選抵賴是集體理性的。同時(shí),在有限重復(fù)囚徒博弈中,個(gè)人的理性局限階段理性,即單個(gè)回合的個(gè)體理性,而沒有把理性放眼于整個(gè)過程,忽視了過程理性。這里講的過程理性是指在所有博弈階段的整個(gè)過程中參與人的效用最大化。
通過上述對(duì)博弈推理中理性人假設(shè)的分析,我們可以得出這樣的結(jié)論:理性概念太強(qiáng)了。按通常的理解,它只強(qiáng)調(diào)了手段和標(biāo)準(zhǔn),而忽視了結(jié)局和目標(biāo)的達(dá)成,這樣的“理性”理性嗎?例如,在一次性囚徒博弈中各局中人為達(dá)到效用最大化,通常認(rèn)為雙方都選坦白是理性的,而從前面的分析中可以看出,雙方坦白各自支付為-3,顯然不是最大效用,因?yàn)檫€有0和-1的支付可能。再說,按古典經(jīng)濟(jì)學(xué)理論的解釋,理性只適用于確定性情形中,對(duì)于風(fēng)險(xiǎn)和不確定性情形卻難以做到。實(shí)際上,理性還依賴于行為人對(duì)不確定性情形的信念和對(duì)冒險(xiǎn)的態(tài)度。在博弈推理中,理性假設(shè)的應(yīng)用只局限于個(gè)體理性和階段理性,而忽視集體理性和過程理性,所以理性人的假設(shè)是有問題的。
公共知識(shí)是博弈推理中的又一假設(shè)前提。公共知識(shí)的概念由Aum an提出:某事件對(duì)兩個(gè)人A和B來說是公共知識(shí),意味著A和B都知道此事,并且A知道B知道此事,B知道A知道此事,A知道B知道A知道此事,如此等等。[4]在此之前,博弈理論家非常疏忽參與人知道或不知道什么,Au2 m an和B randenburger[5]堅(jiān)持證明納什均衡根本沒有公共知識(shí)假設(shè)的必要,正如他們所觀察的,證明納什均衡只要求每個(gè)參與人知道博弈和他對(duì)手所要采取的策略就足夠了。然而,對(duì)博弈理性推理而言,情況就不同了。公共知識(shí)的假設(shè)成為必要,尤其是公共知識(shí)理性的假設(shè)相當(dāng)重要。公共知識(shí)理性就是“每個(gè)參與人是理性的”是公共知識(shí),即每個(gè)參與人都是理性的,每個(gè)參與人都知道每個(gè)參與人是理性的,如此等等。然而這一假設(shè)也是有問題的,是不真實(shí)的。
公共知識(shí)理性這一假設(shè)實(shí)在太強(qiáng)了。關(guān)于理性的分析前面已有論述,這里著重對(duì)公共知識(shí)進(jìn)行剖析。如前所述,每個(gè)參與人都知道每個(gè)參與人是理性的,每個(gè)參與人都知道每個(gè)參與人都知道……每個(gè)參與人是理性的,這是公共知識(shí),對(duì)每個(gè)參與人而言,“知道”每個(gè)參與人是理性的,那每個(gè)參與人是理性的就不是一種“可能”,而是確定的,并且這種“知道”會(huì)一直持續(xù)下去,否則參與人就不知道它為知識(shí)。這樣一來,參與人在博弈中本可以自由地選取任一策略這一被博弈規(guī)則所許可的直覺上的方法卻為公共知識(shí)理性假設(shè)所不許。一旦參與人擁有了公共知識(shí)理性,博弈困境的出現(xiàn)就是一種邏輯必然。正因?yàn)槿绱?Pettit和Sugden指出,參與人被歸因于公共知識(shí)理性的情形對(duì)博弈論而言應(yīng)該沒有絲毫利益,在這種公共知識(shí)的情形下,沒有參與人被允許策略地思考?!覀兿嘈?公共知識(shí)理性的假設(shè)正如博弈理論所激發(fā)的一樣,不應(yīng)該嚴(yán)格地逐字采納,它或許應(yīng)該為像我們所給予“公共信念”這樣的意思所取代。[6]
然而需要指出的是,“公共信念”也未必能行, Schick就對(duì)此持有異議,他認(rèn)為“公共信念”還是太強(qiáng)了。[7]他以有限囚徒困境為例,“公共信念”暗示著每個(gè)參與人相信對(duì)方始終是理性的,而且也都相信自己始終是理性的,參與人在最后階段的囚徒困境中,一開始他心里就相信那時(shí)他會(huì)選擇抵賴,然而到時(shí)他卻不能選擇抵賴,以前的每個(gè)階段也都是如此,他始終不能選擇抵賴。這樣一來就破壞了基本的困境前提:局中人須有選擇的余地。只要給定“公共信念”,這一基本的前提就不能成立,每個(gè)局中人都知道他們將做什么,這樣就無可選擇,也就無困境可言。如果要談困境的話,我們必須放棄“公共信念”。于是,Schick進(jìn)而對(duì)“公共信念”進(jìn)行了弱化,提出了“相互信念”假設(shè)。這一假設(shè)只是暗示參與人相信對(duì)方或除他之外別的參與人是理性的,而并不暗示參與人自己相信自己是理性的。他認(rèn)為,在博弈中有“相互信念”就行了,“公共信念”只能使我們的思維混亂。
Schick提出以“相互信念”假設(shè)來弱化“公共信念”,進(jìn)而取代“公共知識(shí)”假設(shè),可以肯定地說,這種弱化的過程是合理的,它切中了導(dǎo)致博弈困境的真正原因。
[1] Berm udez L.Rationality and the Backw ards Induc tion A rgum ent [J].Analysis,1999,59(4):243-248.
[2] 蔣正鋒.博弈推理中“理性人”的困惑[J].廣東教育學(xué)院學(xué)報(bào),2003(1):75-78.
[3] Butts,H intikka.A dvances in Understanding Rational Behavior [C]//ReidelD.Proceedings of the Fifth In ternational Congress of Logic,M ethodo logy and Philosophy of Science.PartⅡ.Ho l2 land:Dord recht,1977:315-343.
[4] Aum an R.Agreeing to d isagree[J].The Annals of Statistics, 1976(4):1236-1239.
[5] Aum an R,B randenburgerA.Ep istem ic Conditions forNash Equi2 librium[J].Econom etrica,1995,63:1161-1180.
[6] Pettit P,Sugden R.The Backward Induction Paradox[J].The Journalof Philosophy,1989,86:182.
[7] Schick F.Supp rise,Self2know ledge,and Commonality[J].The Journalof Philosophy,2000(8):448-449.
[8] 黃濤.豪爾紹尼評(píng)傳[M].太原:山西經(jīng)濟(jì)出版社,1999.
[9] W eirich P.Equilibrium and Rationality[M].黃濤,譯.北京:經(jīng)濟(jì)科學(xué)出版社,2000.
[10]張維迎.博弈論與信息經(jīng)濟(jì)學(xué)[M].上海:上海人民出版社,1996.
Doubt on Pub lic Pre2assum p tions in Gam e Theory
JIANG Zheng2feng1,2
(1.Schoo lof Po litics and Adm inistration,South China Norm alUniversity,Guangzhou 510631,China; 2.Ideo logicalDepartm ent,South China Agricu lturalUniversity,Guangzhou 510642,China)
“Rational agent”and common know ledge are two public p re2assump tions in gam e theory,w hich assum e that p layers in gam e are rational,and choose action strategy againsta background of common know ledge tom axim ize utility. However,it consequentially puts rational reasoning in a dilemm a,and“rationalagent”is reasonless.Logically,whatwe can do is to throw doubton public p re2assump tions in gam e theory.
rationality;common know ledge;co llective rationality;individual rationality
B81
A
1674-2362(2010)05-0037-03
(責(zé)任編輯 朱慧娟)
2010-06-01
國(guó)家社會(huì)科學(xué)基金“經(jīng)濟(jì)邏輯研究”(06BZX050)
蔣正峰(1970—),男,湖南道縣人,講師,博士研究生,主要從事邏輯哲學(xué)研究。