李軍林,王麒植,姚東旻
?
知識(shí)、信念與均衡
——一個(gè)關(guān)于博弈均衡解理性支持系統(tǒng)的討論*
李軍林,王麒植,姚東旻
均衡解;高階信念;共同先驗(yàn);不完全信息博弈
博弈理論的發(fā)展過程可以看成是對其均衡解的概念不斷完善和精煉的過程,而解的概念反映的是行為和信念的一致性。在不完全信息條件下,在決策時(shí)決策者不但要考慮自己的信息,還要考慮別人的信息,別人對自己信息的信息等等高階信念,此時(shí)如何定義信念一致性的問題長期困擾著學(xué)者。海薩尼的貢獻(xiàn)在于通過構(gòu)造“海薩尼轉(zhuǎn)換”將不完全信息博弈轉(zhuǎn)換為完全但不完美信息博弈,并基于此提出了貝葉斯納什均衡的概念,為經(jīng)濟(jì)學(xué)建立了分析信息問題的博弈框架,并奠定了整個(gè)信息經(jīng)濟(jì)學(xué)的基礎(chǔ)。本文認(rèn)為,海薩尼意義上的貝葉斯納什均衡的一致性需要以共同先驗(yàn)假設(shè)為前提,但是此假設(shè)在現(xiàn)實(shí)中很難滿足。因此,在使用海薩尼博弈分析實(shí)際經(jīng)濟(jì)問題時(shí),必須首先檢驗(yàn)共同先驗(yàn)假設(shè)是否可以被滿足。
從某種意義上講,博弈理論的發(fā)展過程,可以看成是對其均衡解的概念(solution concept)不斷完善和精煉的過程。對均衡的定義,或者說對博弈解的定義,直接反映了研究者對“理性決策”的理解。而對均衡的求解過程無非是在多人交互決策情境下,參與人根據(jù)自己已有知識(shí)并形成的信念,對理性原則的貫徹和堅(jiān)持。
事實(shí)上,最初人們提到博弈論時(shí)也會(huì)很自然地將其與納什均衡聯(lián)系起來,然而,納什均衡所要求的理性與信息約束實(shí)際上并不能很好地刻畫許多常見的經(jīng)濟(jì)情形(例如競標(biāo),二手車買賣,保險(xiǎn)銷售等諸多問題),因此,需要針對此類情形構(gòu)造新的解的概念以及相關(guān)的信息設(shè)定,來完善與改進(jìn)博弈理論。但在放松了假設(shè)之后,如何提出合理的解的概念在博弈論發(fā)展中困擾了理論學(xué)者很長時(shí)間。其中,對于不完全信息的處理尤其棘手:由于博弈的交互性導(dǎo)致參與人的推理過程經(jīng)常需要高階信念(直至無窮階信念)的支持,而如何合理、簡潔地處理這些高階信念便是建模者無法回避的問題。本文即從高階信念和高階知識(shí)的視角出發(fā),分析并介紹海薩尼(Harsanyi)提出的“貝葉斯納什均衡”(Bayesian Nash Equilibrium,后稱BNE)在博弈論發(fā)展中的重大意義。[1][2][3]
在海薩尼之前,經(jīng)濟(jì)學(xué)沒有統(tǒng)一的框架來分析信息問題,因此經(jīng)濟(jì)學(xué)分析中參與人的信息往往都是相同的。[4]海薩尼博弈對高階信念簡潔且精妙的處理,為后來的研究掃清了障礙,是方法論上的巨大突破。正是由于海薩尼的杰出貢獻(xiàn),使得經(jīng)濟(jì)學(xué)進(jìn)入了前人認(rèn)為“不可分析”的領(lǐng)域,沒有他的貢獻(xiàn),信息經(jīng)濟(jì)學(xué)便永遠(yuǎn)不會(huì)產(chǎn)生*海薩尼的論文(參見參考文獻(xiàn)[1][2][3])對于現(xiàn)代信息經(jīng)濟(jì)學(xué)的產(chǎn)生與構(gòu)建是具有里程碑意義的。盡管其他一些學(xué)者關(guān)于非完全信息問題也有過奠基性的研究成果,比如,威克瑞關(guān)于拍賣競標(biāo)的論文[Vickrey,W.,“Counterspeculation, auctions, and competitive sealed tenders”,The Journal of Finance,1961 16(1)];阿克洛夫關(guān)于二手車市場問題的論文[Akerlof, G., “The market for ‘lemons’,quality uncertainty and the market mechanism.”,Quarterly Journal of Economics, 1970,84(3),pp.488-500];斯本斯關(guān)于勞動(dòng)力市場信號(hào)傳遞問題的論文[Spence, M. “Job market signaling”,Quarterly Journal of Economics,1973,87(3),pp.355-374];羅斯柴爾德和斯蒂格利茨關(guān)于保險(xiǎn)市場銷售的論文[Rothschild,M.,&Stiglitz,J.“Equilibrium in Competitive Insurance Markets:An Essay on the Economics of Imperfect Information.”,The Quarterly Journal of Economics.1976,90(4),pp.629-649]等等。盡管他們也都由于對信息經(jīng)濟(jì)學(xué)的杰出貢獻(xiàn)而先后獲得了諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),但是,從研究的方法論上看,他們的工作都針對的是某個(gè)市場的特殊商品的分析而得出的結(jié)論,而海薩尼的工作是給出了非完全信息競爭市場(有不同信息行為人)一般分析框架。。
此外,他的工作在經(jīng)濟(jì)學(xué)說史上也是一項(xiàng)了不起的成就。在完全信息和非完全信息博弈分析框架建立起來之后,組織經(jīng)濟(jì)學(xué)、信息經(jīng)濟(jì)學(xué)等學(xué)科得到了極大的推動(dòng),豐富和拓展了經(jīng)濟(jì)學(xué)分析的視野和深度。因此,他們的貢獻(xiàn)在學(xué)說史上也是濃墨重彩的一筆。
對博弈理論發(fā)展歷程的回顧和整理對研究者正確地理解和使用相關(guān)工具具有重要意義:一方面,從現(xiàn)在理論發(fā)展的視角回看這些工作可以使學(xué)者更清晰完整地認(rèn)識(shí)該理論根基;另一方面,對理論先驅(qū)工作的充分理解也是向其致敬的最好方式。隨著澤爾騰的去世,第一批博弈論做出奠基性貢獻(xiàn)的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者全部離我們而去。這或許意味著一個(gè)時(shí)代的結(jié)束,而本文也體現(xiàn)了作者對這批學(xué)者的追思。
基于此,本文介紹了博弈論圍繞博弈核心問題“高階信念和推理”進(jìn)行處理的發(fā)展脈絡(luò),進(jìn)而也展示知識(shí)和信念如何結(jié)合形成并支撐著具有說服力和解釋力的解的概念。從這個(gè)角度將可以更好地理解、把握博弈論與經(jīng)濟(jì)現(xiàn)實(shí)的關(guān)系,以及如何進(jìn)一步推動(dòng)博弈論向前發(fā)展。
早期關(guān)于處理的經(jīng)典博弈模型分析方法具有求解的簡便性。雖然這種簡便性大大提升了分析效率,從而使博弈分析工具流行起來,但同時(shí),簡便性也弱化了博弈模型背后復(fù)雜的推理過程以及假設(shè)條件,尤其可能會(huì)忽視了博弈的合理均衡解存在的理性支持系統(tǒng),進(jìn)而增大了模型被誤用的可能。
筆者將進(jìn)一步分析博弈所隱含的假設(shè)以及這些假設(shè)所對應(yīng)的情形。因此,本文重點(diǎn)使用決策分析視角對博弈理論分析法背后的機(jī)理和假設(shè)進(jìn)行闡述和分析,進(jìn)而給出不同納什均衡的理性支持系統(tǒng)。
著名的納什均衡(Nash Equilibrium,后稱NE,)是一個(gè)全部參與人的策略組合,其中每個(gè)參與人策略是在給定其他人策略不變的前提之下對自己最有利的策略。換句話說,沒有一個(gè)參與人能夠通過改變自己策略來改善福利水平。[5]
納什均衡的定義中實(shí)際上隱含地引入了共同知識(shí)的假設(shè)*研究發(fā)現(xiàn),博弈中的共同知識(shí)(Common Knowledge)假設(shè)在博弈均衡的定義中起到了基礎(chǔ)性作用,但是卻在現(xiàn)實(shí)中難以滿足。因此,正確識(shí)別對被研究情形中的共同知識(shí)是選擇合適博弈模型的關(guān)鍵。。共同知識(shí)(common knowledge)是指具有如下性質(zhì)的事件:當(dāng)其發(fā)生時(shí),所有人都知道它發(fā)生了,所有人都知道其他人也知道它發(fā)生了,所有人都知道其他人都知道所有人都知道它發(fā)生了,并且此推理鏈條可以推到無窮階均成立。
在完全信息條件下,勃蘭登伯格對NE所要求的推理過程所蘊(yùn)含的信息要求進(jìn)行了總結(jié)。[6]一般來說,兩類信息假設(shè)是必須的*需要注意的是,這并不意味著其他條件均無法保證納什均衡。例如,如果要求參與人的策略是共有知識(shí),則可以放松部分共同知識(shí)約束且仍保證納什均衡的出現(xiàn)(參見參考文獻(xiàn)[6]和[7])。:
首先,博弈的結(jié)構(gòu)必須是共同知識(shí),其中包括博弈規(guī)則、參與人數(shù)、參與人的收益等等。與單人決策過程不同,博弈過程中的決策具有交互性,即決策者的決策過程互相嵌套*例如,在兩個(gè)廠商的古諾競爭中,廠商1的產(chǎn)量取決于自己的邊際成本和廠商2的產(chǎn)量,而廠商2的產(chǎn)量又取決于自己的邊際成本和廠商1的產(chǎn)量,形成一個(gè)嵌套循環(huán)。。博弈決策中的相互嵌套循環(huán)要求每個(gè)參與人的信念或知識(shí)也必須在無窮階成立*參考文獻(xiàn)[8]提供了一個(gè)清晰的例子,展示了高階信念在博弈決策中的必要性。。很明顯,完全信息假設(shè)對決策者信息的要求遠(yuǎn)不止“所有參與人都知道”特定信息,而需要參與人達(dá)成高度的一致,因而在實(shí)際生活中并不非常容易得到滿足。但是遺憾的是,尋找一種合理且簡便的方式放松此假設(shè)卻是一項(xiàng)困難的任務(wù)。關(guān)于這個(gè)問題的理論發(fā)展過程將在第三部分進(jìn)行討論。
其次,所有決策者的理性方式必須是共同知識(shí)*并非在所有情形下都需要“理性”作為共同知識(shí)如此嚴(yán)格的條件來保證NE的出現(xiàn)——作為有限知識(shí)的理性即足夠,參見參考文獻(xiàn)[6]。但是為了結(jié)論不失一般性,此處仍然要求“理性”成為共同知識(shí)。。對每個(gè)決策者而言,博弈決策的交互性決定了其他決策者的決策方式也必然是影響自身決策的重要因素。下例修改自沃朗[9]的思想實(shí)驗(yàn),用以說明在即使客觀條件完全相同的博弈中,決策者也會(huì)根據(jù)對方參與人的不同而改變自身策略。設(shè)想你要參加一個(gè)用現(xiàn)金作為回報(bào)的二人博弈,并被告知將分別和兩個(gè)人進(jìn)行博弈,其中一位是你的朋友,另一位是陌生人。你和朋友相識(shí)多年并且智力水平相同;而那位陌生人是剛剛從喜馬拉雅山上請下來的,他僅僅大概知道一塊錢能買什么東西。你的可選策略有兩個(gè):唯一的納什均衡策略和保險(xiǎn)策略。當(dāng)雙方都采用納什均衡策略時(shí),你的收益是1 000塊;但是此時(shí)如果對方偏離,你將會(huì)至少損失1 000塊。如果你采用保險(xiǎn)策略,那無論對方選擇什么,你的收益都是900塊。那么很明顯,你面對朋友時(shí)更有可能采用納什均衡策略。
為了保證納什均衡的實(shí)現(xiàn),在全部決策者的所有高階信念中都必須排除出現(xiàn)“喜馬拉雅人”的情況。換句話說,每個(gè)參與人的決策規(guī)則也必須是共同知識(shí),也即是要求所有決策者的理性必須是共同知識(shí)。此時(shí),“理性”實(shí)際上指的是參與人如何處理信息、作出決策的規(guī)則。
那么在實(shí)際情形下這兩個(gè)條件是否容易得到滿足?共同知識(shí)對參與人施加的約束十分苛刻——它要求信息不僅僅是公開的,而且必須在多個(gè)參與人中達(dá)成共識(shí)。很顯然如果模型中存在重要的私人信息,那么前述推理過程必然無法成立。但是需要注意的是,并不是所有的公開信息都滿足共同知識(shí)假設(shè)。例如國家宏觀統(tǒng)計(jì)數(shù)據(jù),雖然它是公開的,但是并不是每個(gè)人都會(huì)去看,也不是每個(gè)人都確定別人會(huì)去看,更不是每個(gè)人都確定別人知不知道自己看不看,等等。因此,若假設(shè)此類數(shù)據(jù)是參與人的共同知識(shí),便會(huì)面臨參與人行為偏離預(yù)測的風(fēng)險(xiǎn)。
此外,作為共同知識(shí)的理性也常常被忽略。例如在最后通牒博弈(Ultimatum Game)中,兩個(gè)參與人(匿名)嘗試就一定數(shù)量金錢達(dá)成分成比例。首先一個(gè)出價(jià)者給出他的分成計(jì)劃,然后回應(yīng)者決定是否接受出價(jià)者的計(jì)劃。如果計(jì)劃被接受,那么每個(gè)參與人獲得相應(yīng)的報(bào)酬;如果計(jì)劃被拒絕則分成失敗,兩人的收益都為0。對于回應(yīng)者來說,面對一個(gè)非負(fù)的計(jì)劃,接受總是不差于拒絕的,因此出價(jià)者應(yīng)該預(yù)測理性的回應(yīng)者在此種情況下總是選擇接受。然而金提思[10]通過實(shí)驗(yàn)研究發(fā)現(xiàn)低于30%的分成比經(jīng)常被拒絕。這表明參與人所使用的理性原則并非總是與理論相符,對其進(jìn)行預(yù)測也并不是簡單的任務(wù)*另一種解釋是雖然博弈規(guī)則給定了支付金額,但是卻沒有唯一確定每個(gè)人的效用。例如參與人可以因?yàn)榉峙洳还蕉a(chǎn)生副效用,從而導(dǎo)致拒絕成為了理性選擇。如果遵從這種解釋,那么實(shí)際上是各個(gè)參與人的支付而不是理性方式?jīng)]有成為共同知識(shí)。這種解釋是有道理的,不過卻與本文提供的解釋從分析邏輯上完全等價(jià),原因在于新古典經(jīng)濟(jì)學(xué)以來“理性”的內(nèi)含實(shí)際上是包括了“效用”和“最大化方法”兩個(gè)元素的,并且二者都需要借助對方來定義自己,并不存在清晰的界限。參見[Vriend,N.J.“Rational behavior and economic theory,”Journal of Economic Behavior & Organization, 1996,29(2),pp.263-285;Binmore.K.“Chapter l-rationality,”Handbook of Game Theory with Economic Applications,2015,pp.1-26]。
總的來說,NE概念從認(rèn)識(shí)論和方法論上為交互決策情形提供了有力工具,但是對于具體的情形的研究經(jīng)常需要對其做更進(jìn)一步的限制或擴(kuò)展。接下來將介紹的貝葉斯納什均衡用一種精妙的模型設(shè)置將NE概念的內(nèi)含延伸到不完全信息情況下,而這些工作為信息經(jīng)濟(jì)學(xué)取得的突破性進(jìn)展,在關(guān)鍵問題的處理上掃清了障礙。
(一) 不完全信息博弈與高階信念
納什均衡的實(shí)現(xiàn)所需要的大量共同知識(shí)在實(shí)際經(jīng)濟(jì)生活中很難滿足——經(jīng)濟(jì)參與者往往不能對客觀現(xiàn)實(shí)產(chǎn)生如此一致且正確的認(rèn)識(shí)。因此在20世紀(jì)五六十年代左右,博弈論學(xué)者便提出了“不完全信息”的概念。
以如下兩個(gè)簡單的博弈為例,參與人1在(a)和(b)中的支付相同而參與人2的支付不同。如果參與人1不能知道參與人2的實(shí)際支付的話,他便不知道參與人2將會(huì)選L還是R,進(jìn)而不知道自己的最優(yōu)策略是U還是D。
表1 不完全信息
參與人2LR參與人1U1,00,1D0,01,1
(a) (b)
如果博弈中部分模型設(shè)置不是共同知識(shí),例如上例中的支付矩陣,那么此博弈便被稱為不完全信息博弈。在博弈論的發(fā)展過程中,博弈論學(xué)者對“什么是不完全信息博弈”的定義實(shí)際上發(fā)生過變化。[4]馮·諾依曼和摩根斯坦最初對“不完全信息”的定義是“部分結(jié)構(gòu)沒有被清晰定義的博弈” ,[11]而且從理論上講,沒有定義清楚的模型是不能被分析的,因此,他們認(rèn)為沒有必要研究此類博弈。顯然,這個(gè)回答無法使學(xué)者們滿意,許多學(xué)者此后依然在不斷嘗試建立新的分析方法以處理這類情形,其中最成功的嘗試來自海薩尼。[1][2][3]在海薩尼的模型中,無法被精確定義的變量以概率分布的形式描述并且此分布被假設(shè)為全部參與人的共同知識(shí)。在后文的討論中可以發(fā)現(xiàn),在這些假設(shè)的幫助下,不完全信息博弈模型便是可分析的。因此,從這種意義上講,這些變量的取值雖然不是被精確地知道,但是其取值范圍以及分布是知道的,即決策者知道他們“知道自己不知道的具體是什么”和“多大程度上不知道”,因此也并不是完全不知道。換句話說,海薩尼模型所刻畫的“不完全信息”已經(jīng)與其最初的定義有所不同:馮·諾依曼和摩根斯坦定義的不完全信息是“不知道”,而海薩尼定義的不完全信息是“不確知”,即前者比后者包含更大的范圍,如下圖所示。
圖1 兩種不完全信息對比
用概率對不確定性進(jìn)行刻畫之后更重要的問題是高階信念如何處理。一個(gè)直接的辦法是將所有高階信念逐階給出,分析每種情況下的最優(yōu)策略。魯斯和拉法亞[12]曾經(jīng)沿著這條思路進(jìn)行了探索。為了避免完全信息的嚴(yán)格假設(shè),他們?yōu)橐粋€(gè)n人博弈構(gòu)建了n2個(gè)支付函數(shù)以刻畫每個(gè)參與人i對參與人j支付的推測。然而很顯然,僅僅對二階信念進(jìn)行刻畫是遠(yuǎn)遠(yuǎn)不足以支撐均衡的。例如,考慮表1所描述的博弈。如果在完全信息條件下,當(dāng)真實(shí)支付矩陣是(a)時(shí),參與人1將采取其納什均衡策略D。然而,如果參與人1認(rèn)為參與人2“錯(cuò)誤地”相信真實(shí)矩陣是(b),進(jìn)而選擇L的話,他也會(huì)將自己的策略修改為U。如果參與人1認(rèn)為參與人2認(rèn)為參與人1“錯(cuò)誤地”相信真實(shí)矩陣是(b),則參與人1會(huì)期待參與人2選擇R,進(jìn)而自己選擇D。此類考慮可以無限延展下去。
因此,在不完全信息下,如何設(shè)置全部的高階信念是一個(gè)無法回避的問題。同時(shí)也可以發(fā)現(xiàn),直接給出全部信念并不是一個(gè)理想的方式,因?yàn)樗謴?fù)雜凌亂并且難以處理。海薩尼[1][2][3]介紹了一種數(shù)學(xué)上更為簡便的建模方法,極大地提升了分析的可操作性。
(二)海薩尼轉(zhuǎn)換與貝葉斯納什均衡
海薩尼構(gòu)造了一個(gè)由自然先行動(dòng)的博弈模型,在此模型中借助貝葉斯規(guī)則便可以簡便地將全部高階信念給出,于是便解決了高階信念的問題。海薩尼的等價(jià)構(gòu)造將馮·諾依曼和摩根斯坦意義上的不完全信息博弈轉(zhuǎn)換為完全信息但不完美博弈,進(jìn)而避免了馮·諾依曼和摩根斯坦質(zhì)疑的這種情形不可分析、相關(guān)模型不可解的問題,使分析討論可以繼續(xù)。此過程即是著名的“海薩尼轉(zhuǎn)換(Harsanyi’s Transformation)”,它使不完全信息條件下的博弈分析成為可能,使經(jīng)濟(jì)學(xué)第一次可以使用統(tǒng)一規(guī)范的框架對信息問題進(jìn)行分析,也為現(xiàn)代信息經(jīng)濟(jì)學(xué)的繁榮發(fā)展做出了奠基性貢獻(xiàn)。
海薩尼首先令人信服地論證,所有對于模型的不確定性可以分為三類:對事件的不確定、對支付的不確定和對參與人策略的不確定。其次,他進(jìn)一步論證這三種不確定性完全可以轉(zhuǎn)化為對參與人支付的不確定性。然后,根據(jù)參與人支付的不同將參與人分為不同的“類型”,并且在正式博弈開始之前,由“自然”按照先驗(yàn)的概率(是共同知識(shí))對參與人的類型進(jìn)行選擇,并且所有參與人僅僅可以觀測到自己的類型,而不知道別人的類型。因此,雖然參與人并不確切地知道其他參與人的類型,但是可以根據(jù)先驗(yàn)概率和自己的類型對他們的類型進(jìn)行推測(貝葉斯推斷)。最后,在余下的博弈中,參與人依照自己的條件期望收益選擇最優(yōu)反應(yīng)。以上過程被稱為“海薩尼轉(zhuǎn)換”,而轉(zhuǎn)換后的博弈被稱為海薩尼博弈。
對“海薩尼轉(zhuǎn)換”過程更加準(zhǔn)確的介紹需要引入一些概念*本文僅介紹簡略定義,嚴(yán)格的數(shù)學(xué)定義可見[Zamir,S.,“Bayesian Games:Games with Incomplete Information,”Encyclopedia of Complexity and Systems Science,Robert A.Meyers (ed.),Springer,New York,2009,pp.426-441;Dekel,E.,& Gul,F.“Rationality and knowledge in game theory”,David M.Kreps and Kenneth F. Wallis,(eds.),Advances in Economics & Econometrics Theory & Applications Seventh World congress, Volume 1,Econometric Society Monographs,no.26,Cambridge,New York and Melbourne:Cambridge University Press,1997,pp.87-172]。。
● 自然狀態(tài)(state of nature),包含關(guān)于博弈的全部客觀信息,如支付函數(shù)、博弈規(guī)則、模型中隨機(jī)數(shù)的可能實(shí)現(xiàn)值等等。例如,表1中(a)和(b)兩個(gè)博弈情形就代表了兩個(gè)不同的自然狀態(tài)。
● 類型(type),包含關(guān)于博弈參與人主觀信念的全部信息,因此也被稱為意識(shí)狀態(tài)(state of mind)。例如,參與人對真實(shí)狀態(tài)是表1中哪個(gè)的信念以及全部高階信念。
● 世界狀態(tài)(state of world),由特定的一個(gè)自然狀態(tài)和特定一組參與人類型構(gòu)成,描述了某個(gè)特定的博弈模型以及其中參與人的信念。
在海薩尼構(gòu)造的博弈中,對“解的概念”(solution concept)的定義沿承以最優(yōu)反應(yīng)為核心的納什均衡思路,又因?yàn)槠鋵ω惾~斯理性的使用,也被稱為貝葉斯納什均衡(Bayesian Nash Equilibrium, 后稱BNE)。在BNE中,每個(gè)參與人都在給定其他參與人策略的條件下,選擇最大化自己條件期望收益的策略。根據(jù)澤邁爾的總結(jié),海薩尼博弈以如下順序進(jìn)行:
式中,Pr為激光回波功率,常數(shù)k為4ln2,tr為回波時(shí)刻,T0為激光脈沖寬度,Nn為噪聲,包括背景噪聲、電路噪聲等非理想因素.其中激光回波功率可以由激光朗伯體反射傳輸模型得到[14],即
1.自然選擇世界狀態(tài),包括一種自然狀態(tài)和全部參與人的類型;
2.參與人被告知自己的類型,但不知道自然狀態(tài)和其他參與人的類型;
3.參與人選擇策略并獲得支付。
通過海薩尼轉(zhuǎn)換,不完全信息博弈被轉(zhuǎn)換成為完全但不完美信息博弈,因而模型便可以求解了。
例如,參與人1的信念為“如果自己是高能力的,那么參與人2是高能力的概率是3/7,低能力的概率是4/7;如果自己是低能力的,那么參與人2是高能力的概率為2/3,低能力的概率是1/3”*為了簡潔起見,僅給出二階信念。實(shí)際上,每一階信念均需要滿足一致性要求。;參與人2的信念為“如果我是高能力的,那么參與人1是高能力的概率是3/5,低能力的概率是2/5;如果我是低能力的,那么參與人1是高能力的概率為4/5,參與人2是低能力的概率是1/5”*雙方的信念都是共同知識(shí)。。那么便可以找到一個(gè)聯(lián)合分布(見表2)來描述自然的選擇。在這種情況下,便稱參與人的信念是一致的(consistent)。
表2 一致的信念
參與人2高低參與人1高0.30.4低0.20.1
可以看出,根據(jù)條件概率公式,所有的高階信念均可以通過此聯(lián)合分布得到。為了看清這一點(diǎn),記高類型和低類型的參與人1為H1,L1。類似的,參與人2的類型為H2,L2。為了符號(hào)上的簡便,分別記世界狀態(tài)(H1,H2),(H1,L2),(L1,H2)和(L1,L2)為a,b,c和d。以高類型的參與人H1為例,其一階信念可以通過計(jì)算各個(gè)世界狀態(tài)條件于H1的概率得到,即真實(shí)世界狀態(tài)是a的概率是3/7,是b的概率是4/7。
類似的,其二階信念是有3/7的概率參與人2相信“世界狀態(tài)是a的概率為3/5,c的概率為2/5”,有4/7的概率參與人2相信“世界狀態(tài)是b的概率為4/5,d的概率為1/5”。
如果信念是一致的,或者說,存在共同先驗(yàn),那么在貝葉斯理性(利用條件概率進(jìn)行推斷)的幫助下,所有的高階信念均是共同知識(shí)。也就是說,此時(shí),博弈模型以一種簡潔的方式重新成為了“完全的”(complete),并且可以通過條件概率公式計(jì)算出每一階信念,避免了直接考慮高階信念時(shí)所面對的復(fù)雜又難以處理的數(shù)學(xué)運(yùn)算。在“共同先驗(yàn)假設(shè)”的保證下,BNE便可以被清晰地定義*此定義非常基礎(chǔ),可在任意博弈論教材中找到,因此本文略去介紹。。
由于海薩尼的工作,后繼的研究可以輕易地對信息問題進(jìn)行分析而不用涉及復(fù)雜的高階信念問題。這一貢獻(xiàn)是奠基性的,它在不增加過多的數(shù)學(xué)復(fù)雜性的前提下,直接拓展了經(jīng)濟(jì)學(xué)研究的范圍,為理解更加復(fù)雜的博弈互動(dòng)行為提供了有力的分析工具。
此外,了解海薩尼轉(zhuǎn)換的前提也同樣重要。通過上例可以看到,海薩尼轉(zhuǎn)換要求信念的一致性。如果信念不是一致的,便無法找到一個(gè)作為共同知識(shí)的聯(lián)合分布,因此分析過程就會(huì)變得更加復(fù)雜。需要注意的是,海薩尼轉(zhuǎn)換并非適用于為所有的不確定性和關(guān)于不確定性的信念情形建模,作為對海薩尼工作的補(bǔ)充,下一節(jié)將考察不一致信念的問題。
(三) 信念的一致性問題
如果將上述參與人2的信念前半部分修改為“如果我是高能力的,那么參與人1是高能力的概率為1/2,參與人2是低能力的概率是1/2”,此時(shí),便不存在可以支撐1和2信念的聯(lián)合分布*此例修改自Zamir,S.,“Bayesian Games: Games with Incomplete Information”,Encyclopedia of complexity and Systems Science,Robert A.Meyers(ed.),Springer,New York,2009,pp.426-441.。那么,便不存在一個(gè)公認(rèn)的自然選擇過程作為起點(diǎn),海薩尼轉(zhuǎn)換無法適用。在這種情況下,便稱參與人的信念是不一致的。
顯然,海薩尼轉(zhuǎn)換所需要的重要假設(shè)是全部參與人的信念是“一致的”,即可以從共同的先驗(yàn)概率中推得,并且此先驗(yàn)概率分布是共同知識(shí)。此假設(shè)被稱為共同先驗(yàn)假設(shè)(Common Prior Assumption,后稱CPA假設(shè)),滿足此假設(shè)的博弈被稱為海薩尼博弈。顯然,并不是所有的博弈都是海薩尼博弈。也就是說,為了分析更廣泛的博弈情形,需要一個(gè)比海薩尼博弈中定義的BNE更加一般的解的概念。
實(shí)際上,BNE的定義并不一定要以海薩尼轉(zhuǎn)換(或一致性信念)為基礎(chǔ)。如上例中的不一致的信念可表示如下:
高低高3/74/7低2/31/3
(a)參與人1的信念
高低高1/24/5低1/21/5
(b)參與人2的信念
假設(shè)四種情形下參與人的支付矩陣為:
參與人2LR參與人1U2,00,1D0,01,0
GHH:參與人都是高能力時(shí)的支付矩陣
參與人2LR參與人1U0,00,0D1,11,0
GHL:參與人1是高能力且參與人2是低能力時(shí)的支付矩陣
參與人2LR參與人1U0,00,0D1,10,0
GLH:參與人1是高能力且參與人2是低能力時(shí)的支付矩陣
參與人2LR參與人1U0,02,1D0,00,2
GLL:參與人都是高能力時(shí)的支付矩陣
由于信念的不一致性,無法使用海薩尼轉(zhuǎn)換,但是此博弈仍然有混合策略均衡。將參與人1的策略記為(x,y),表示:
● 當(dāng)參與人1是高能力時(shí),使用混合策略[x(U), (1-x)(D)];
● 當(dāng)參與人1是低能力時(shí),使用混合策略[y(U), (1-y)(D)];
類似的,將參與人2的策略記為(z,t)。在混合策略均衡下,每個(gè)參與人的每個(gè)類型必須對自己的兩個(gè)純策略無差異。因此解得:
可以看出,CPA所要求的前提實(shí)際上十分嚴(yán)格,它不僅要求參與人對“不知道”的事件形成概率層面的認(rèn)識(shí),更要求這種概率層面的認(rèn)識(shí)是一致的且是共同知識(shí)。換句話說,它要求參與人對不知道的事情達(dá)成一致。一致性信念的要求很重要,因?yàn)榧词箙⑴c人的信念是共同知識(shí),但是如果他們不一致,海薩尼意義下的BNE依然不適用。而在現(xiàn)實(shí)生活中,我們往往很難說清CP是從哪來的。CP所刻畫的情形中參與人都必須十分熟悉且達(dá)成了思想層面的高度一致。所以,實(shí)際上海薩尼意義下的BNE的適用范圍十分局限,并不是任意的情形都可以適用。若要適用海薩尼博弈作為分析框架,必須首先驗(yàn)證是否所要模型化的情境之中存在CP的基礎(chǔ)*參考文獻(xiàn)[14]證明了在所有可能的信念系統(tǒng)集合(belief system)中一致性信念系統(tǒng)集合的勒貝格測度為0。也就是說,海薩尼轉(zhuǎn)換所依賴的一致性信念系統(tǒng)并非是一個(gè)容易滿足的條件。。
為了解決信念不一致的問題,默滕斯和澤邁爾[15]提出了信念空間(BeliefSpace)的模型,并將在信念空間上重新定義BNE。在信念空間中,并不要求信念是一致的,進(jìn)而大大拓展了分析范圍。然而,這種方法所使用的數(shù)學(xué)技術(shù)較為復(fù)雜,在實(shí)際研究中,研究者總是希望能利用共同知識(shí)來簡化模型??偟膩碚f,CPA的合理性在經(jīng)濟(jì)學(xué)界仍然是一個(gè)有爭議的話題*對這個(gè)問題的討論可參見[Dekel,E.,& Gul,F.Rationality and knowledge in game theory,Advances in Economics & Econometrics Theory & Applications Seventh world Congress, Volume 1, Econometric Society Monographs,no.26,David M. Kreps and Kenneth F. Wallis,(eds.),Cambridge, New York and Melbourne:Cambridge University Press,1997,pp.87-172;Morris,S.,“The common prior assumption in economic theory,” Economics & Philosophy, 1995,11(2),pp.227-253;Gul,F.,“A Comment on Aumann’s Bayesian View, ”Econometrica,1998,Vol. 66, No.4,pp.923-927],對CPA假設(shè)的質(zhì)疑,以及奧曼(Aumann,R.J.“Common Priors: A Reply to Gul,”Econometrica,1998,Vol.66,No.4,pp.929-938)為CPA的辯護(hù)。。
海薩尼貢獻(xiàn)的直接產(chǎn)物之一便是現(xiàn)代信息經(jīng)濟(jì)學(xué)。從以上對海薩尼模型的簡單梳理過程便可以很清晰地發(fā)現(xiàn),現(xiàn)代信息經(jīng)濟(jì)學(xué)分析必須遵從海薩尼模型的前提假設(shè)。研究者若要用不完全信息博弈模型對現(xiàn)實(shí)進(jìn)行刻畫分析,則必須先驗(yàn)證這些假設(shè)是否能被滿足。一旦不滿足,則必須對標(biāo)準(zhǔn)模型進(jìn)行修改或建立新模型。一個(gè)嚴(yán)重的建模誤區(qū)是將部分假設(shè)看成“建模慣例”而不對其深究。CPA便是一個(gè)很好的例子:雖然現(xiàn)實(shí)生活中能滿足CPA的情形十分有限,但是在分析中對其的使用則顯得有些任意。正如賓莫爾[16]所強(qiáng)調(diào)的:海薩尼僅僅告訴我們滿足CPA的模型該如何處理,但沒有告訴我們哪些情況滿足它。對模型假設(shè)的詳細(xì)驗(yàn)證不僅保證模型對現(xiàn)實(shí)的準(zhǔn)確刻畫,而且還幫助研究者正確地解釋結(jié)論并排除那些由不合理假設(shè)帶來的“有趣”結(jié)論。
一個(gè)值得注意的問題是,雖然不完全信息最初被引入是為了放松“共同知識(shí)”對博弈參與人過于苛刻的要求,但是在海薩尼模型中對CPA的依賴實(shí)際上完全背離了這一初衷:共同知識(shí)的假設(shè)完全沒有被放松,甚至可以說是更加嚴(yán)格了。在不完全信息博弈中,CPA假設(shè)要求參與人對不知道的事情也要達(dá)成一致,即確切地知道別人是如何不知道的、以什么概率認(rèn)為是什么情況等等信息。這種一致明顯更難以達(dá)成。此外,由于貝葉斯推斷的復(fù)雜性遠(yuǎn)遠(yuǎn)高于一般選擇理論對決策者的理性要求,所以,奧曼認(rèn)為不完全信息博弈并非體現(xiàn)了決策者的有限理性,而是一個(gè)要求超級無限理性的模型。這也導(dǎo)致不完全信息博弈的理論預(yù)測結(jié)果可能與現(xiàn)實(shí)情況產(chǎn)生偏差。
總結(jié)來說,納什均衡的思路在非合作博弈中得到了很好的繼承和延續(xù)。同時(shí),納什均衡所要求的嚴(yán)苛前提條件在后續(xù)的博弈研究中也并沒有得到緩解,反而,以海薩尼博弈為例,甚至被限定得更加苛刻了。因此,研究者在利用博弈論對現(xiàn)實(shí)問題進(jìn)行考察的過程中,必須仔細(xì)驗(yàn)證這些條件是否得到了滿足,從而保證分析的合理性。
[1]Harsanyi,J.C.Gameswithincompleteinformationplayedby“Bayesian”players, Ⅰ-Ⅲ.PartI.Thebasicmodel[J].ManagementScience,1967,(14).
[2]Harsanyi,J.C.Gameswithincompleteinformationplayedby“Bayesian”players,Ⅰ-ⅢPartII.Bayesianequilibriumpoints[J].ManagementScience,1968a,(14).
[3]Harsanyi,J.C.Gameswithincompleteinformationplayedby“Bayesian”players,Ⅰ-ⅢPartⅢ.Thebasicprobabilitydistributionofthegame[J].ManagementScience,1968b,(14).
[4]Myerson,R.B.Commentson“GameswithIncompleteInformationPlayedby‘Bayesian’Players,I-IIIHarsanyi’sGameswithIncompleteInformation”[J].ManagementScience,Vol. 50,No. 12Supplement,December2004.
[5]Nash,J.Non-cooperativegames[J].AnnalsofMathematics, 1951,(54).
[6]Brandenburger,A.Knowledgeandequili-briumingames[J].TheJournalofEconomicPerspectives,Vol.6,No.4,1992.
[7]Aumann,R., &Brandenburger,A.EpistemicConditionsforNashEquilibrium[J].Econometrica,1995,63(5).
[8]Binmore,K.Playingforreal[M].Oxford:OxfordUniversityPress,2007.
[9]Werlang,S.R.D.C.Commonknowledgeandgametheory[Z].PhDDissertation,PrincetonUniversity,1986.
[10]Gentis,H.GameTheoryEvolving[M].Princeton,NJ:PrincetonUniversityPress,2000.
[11]VonNeumann,J.,Morgenstern,O.TheoryofGamesandEconomicBehavior[M].Princeton,NJ:PrincetonUniversityPress,1944.
[12]Luce,R.D.andRaiffa,H.GamesandDecisions[M].Wiley,NewYork,1957.
[13]Zamir,S.BayesianGames:GameswithIncom-pleteInformation[A].RobertA.Meyers(ed.).EncyclopediaofComplexityandSystemsScience[C].Springer;NewYork,2009
[14]Nyarko.Mostgamesviolatethecommonpriorsdoctrine[J].InternationalJournalofEconomicTheory,2010,6(1).
[15]Mertens,J.F., &Zamir,S.FormulationofBayesiananalysisforgameswithincompleteinformation[J].InternationalJournalofGameTheory, 1985,14(1).
[16]Binmore.K.Chapter1-rationality[Z].HandbookofGameTheorywithEconomicApplications, 2015.
[責(zé)任編輯 陳翔云]
Knowledge, Belief and Equilibrium——A Discussion on the Belief System of Solution Concept
Li Junlin1, Wang Qizhi2, Yao Dongmin3
(1,2. School of Economics, Renmin University of China, Beijing 100872; 3. Center for China Fiscal Development, Central University of Finance and Economics, Beijing 100081)
equilibrium solution; high-order belief; common prior; incomplete information game
The development of game theory can be regarded as a process of continuous improvement and refinement of the solution concept, which imposes consistency requirements on behaviors and beliefs. Harsanyi’s contribution is converting a game of incomplete information to a complete but imperfect information game by “Harsanyi transformation”, and proposing the concept of Bayesian Nash equilibrium, which provided an unified analytical framework to cope with information problem and laid the foundation for the economics of information. This paper argues that the Bayesian Nash Equilibrium defined on the Harsanyi game needs to take the common prior assumption as the premise, which is rather demanding. Therefore, any analysis based on the Harsanyi game must make sure the common prior assumptions are satisfied.
李軍林,中國人民大學(xué)經(jīng)濟(jì)學(xué)院教授,中國特色社會(huì)主義經(jīng)濟(jì)建設(shè)協(xié)同創(chuàng)新中心研究員;王麒植,中國人民大學(xué)經(jīng)濟(jì)學(xué)院博士生(北京 100872);姚東旻(通訊作者),中央財(cái)經(jīng)大學(xué)中國財(cái)政發(fā)展協(xié)同創(chuàng)新中心講師(北京100081)。
* 作者李軍林感謝近年來在博弈論專題課堂上積極參與討論的各位博士生、碩士生同學(xué)。