李停
(銅陵學(xué)院經(jīng)濟(jì)學(xué)院,安徽銅陵244000)
現(xiàn)實(shí)中生活中的企業(yè)決策,無(wú)論是產(chǎn)量、價(jià)格、廣告、研發(fā)都不再是孤立無(wú)關(guān)的,而是彼此間存在策略依存和策略互動(dòng)。尤其是對(duì)生產(chǎn)日趨集中的寡占市場(chǎng),企業(yè)任何行動(dòng)都必須考慮其競(jìng)爭(zhēng)對(duì)手的反應(yīng),傳統(tǒng)決策理論和運(yùn)籌學(xué)方法很難解決這類利益相互影響的決策均衡問(wèn)題。博弈論正是研究在利益相互影響的局勢(shì)中,局中人如何選擇自己的策略才能使自身的收益最大化的均衡問(wèn)題[1]。近半個(gè)世紀(jì)以來(lái),博弈論的理論和方法激起管理學(xué)家的極大興趣,將決策理論的發(fā)展推向前所未有的新高峰。納什均衡是博弈論最核心的概念,由于戰(zhàn)略管理本質(zhì)上也是組織如何在相互影響的對(duì)局中尋求決策均衡的問(wèn)題,所以本文不加區(qū)分地使用納什均衡和決策均衡的概念。
Nash(1950)[2]應(yīng)用數(shù)學(xué)上的不動(dòng)點(diǎn)定理,證明了“任何有限的策略型博弈至少存在一個(gè)混合納什均衡”。隨后,Debreu(1952)[3]給出了“在n個(gè)局中人的策略型博弈中,滿足局中人策略空間Si是歐式空間的非空有界閉集、支付函數(shù)Ui(s)連續(xù)且對(duì)Si是擬凹函數(shù),該博弈存在一個(gè)純策略納什均衡”。這是博弈論學(xué)科發(fā)展過(guò)程中的兩大理論基石,解決了均衡的存在性問(wèn)題。國(guó)內(nèi)學(xué)者中,李正龍(2001)[4]、朱年磊等(2006)[5]對(duì)靜態(tài)博弈純策略納什均衡的存在性作了延伸性探討。但從實(shí)踐應(yīng)用角度看,如何尋求納什均衡同樣不容忽視。現(xiàn)有文獻(xiàn)大致可梳理出博弈均衡的三種求解方法:相對(duì)優(yōu)勢(shì)劃線法、期望支付等值法和最優(yōu)反應(yīng)函數(shù)法。這些方法不同程度地存在適用范圍有限、過(guò)程繁瑣等弊端。如何尋求一種歸一化解法,將復(fù)雜的納什均衡求解過(guò)程“簡(jiǎn)單化、程序化和規(guī)范化”,正是本文的寫作目的。本文將在理論上證明,局中人的支付矩陣在局部變換下不改變博弈的均衡特征,并以納什均衡不變性定理為基礎(chǔ),完成16種類型的2×2型博弈決策均衡的歸一化求解。
對(duì)于完全信息的靜態(tài)博弈,策略型博弈模型是較為適當(dāng)?shù)谋硎?,而局中人、策略和支付是?gòu)成策略型博弈的三個(gè)基本要素。本文分析的2×2型博弈是指包含2個(gè)局中人,每個(gè)局中人只有2個(gè)策略的有限博弈。2×2型博弈構(gòu)成要素雖然簡(jiǎn)單,但卻是分析N個(gè)局中人復(fù)雜博弈的基礎(chǔ)。從純粹數(shù)學(xué)意義上講,這無(wú)非是2維向量空間向N維向量空間的形式化推廣。
于是G=(2,S1,S2,u1,u2)為2×2型博弈的策略型表示,S1、S2分別是局中人1、2的策略空間。在2×2型博弈中,S1、S2都只含有2個(gè)元素,記
令s1、s2是局中人1、2具體的某個(gè)策略,s1∈S1,s2∈S2。u1、u2代表局中人1、2在各種策略組合下的支付。由于局中人和策略都是有限集,2×2型博弈的策略組合也是有限集,策略組合空間可表示為
由于分析的是完全信息靜態(tài)博弈,策略等同于行動(dòng)。記局中人1的行動(dòng)集為α={α1,α2},局中人2的行動(dòng)集為β={β1,β2}。再記u1(αi,βj)=aij,u2(αi,βj)=bij,i=1,2,j=1,2。該2×2型博弈的支付矩陣如表1所示:為下文分析方便,記表示局中人1、2的支付矩陣。
表1 2×2型博弈的支付矩陣
由于并非所有2×2型博弈都有純策略納什均衡,需引入混合納什均衡的概念。局中人1的混合策略X=[p,1-p]表示分別以概率p、1-p選擇行動(dòng)α1、α2。局中人2的混合策略Y=[q,1-q]T表示分別以概率q、1-q選擇行動(dòng)β1、β2。利用支付矩陣A和B,局中人1、2的期望支付的代數(shù)表示為E1(X,Y)=XAY、E2(X,Y)=XBY。這里X表示局中人1的混合策略行向量,Y表示局中人2的混合策略列向量。混合策略(X*,Y*)為G的混合納什均衡,當(dāng)且僅當(dāng)X*AY*≥XAY*、X*BY*≥X*BY對(duì)任何X、Y同時(shí)成立。易知當(dāng)p=1或p=0時(shí),局中人1的混合策略e1=(1,0)、e2=(0,1)退化成純策略α1、α2;同樣,當(dāng)q=1或q=0時(shí),局中人2的混合策略e1=(1,0)、e2=(0,1)退化成純策略β1、β2。因而混合策略包含著純策略的含義,對(duì)二者的分析便可以統(tǒng)一起來(lái)。
定理1:設(shè)G=(2,S1,S2,u1,u2)為某2×2型博弈,則納什均衡對(duì)任一局中人的支付函數(shù)的正仿射變換下不變。即對(duì)i∈{1,2},令(s)=σiui(s)+εi,其中σi>0。正仿射變換下的新2×2型博弈與G有相同的納什均衡。
定理2:納什均衡在支付函數(shù)的局部變換下不變。
定理1和定理2使用嚴(yán)謹(jǐn)而又晦澀的數(shù)學(xué)語(yǔ)言詮釋納什均衡的不變性。事實(shí)上,借助局中人支付矩陣A和B對(duì)該定理簡(jiǎn)化,有助于把握納什均衡不變性定理的實(shí)質(zhì)。
對(duì)G的支付函數(shù)作正仿射變換,相當(dāng)于對(duì)局中人1、2的支付矩陣A、B的每個(gè)元素乘以一個(gè)正數(shù)再加上一個(gè)常數(shù)。即A′=σ1A+ε1,B′=σ2B+ε2,其中,σ1,σ2>0,εi是元素取值為常數(shù)的2階方陣。
對(duì)G的支付函數(shù)作局部變換,相當(dāng)于對(duì)A的某一列加一個(gè)常數(shù),或者對(duì)B的某一行加一個(gè)常數(shù)。即或者
既然對(duì)支付函數(shù)的局部變換實(shí)質(zhì)是對(duì)局中人支付矩陣的列或行加某個(gè)常數(shù),那么一個(gè)自然的想法是只要常數(shù)選取得當(dāng),很容易將局中人的支付矩陣對(duì)角化。這將使得納什均衡求解過(guò)程得到簡(jiǎn)化,以此為基礎(chǔ)可探討2×2型博弈決策均衡的歸一化解法,同時(shí)納什均衡不變性定理保證了這種探討的有效性。
對(duì)局中人1的支付矩陣A進(jìn)行列變換,將其變成對(duì)角陣A′,具體過(guò)程如式(3)所示;對(duì)局中人2支付矩陣B進(jìn)行行變換,將其變成對(duì)角陣B′,具體過(guò)程如式(4)所示:
由于任一2×2型博弈都可通過(guò)局部變換成對(duì)角陣,下文對(duì)其決策均衡的討論只需對(duì)支付矩陣是的2×2型博弈進(jìn)行。
3.2.1 局中人1的最優(yōu)反應(yīng)函數(shù)
局中人1的混合策略為X=(p,1-p),局中人2的混合策略為Y=(q,1-q)T。局中人1的最優(yōu)反應(yīng)是對(duì)不同的Y,選擇X最大化期望支付E1(p,q)。
(1)a1>0,a2<0。當(dāng)a1+a2>0時(shí),恒有此時(shí),對(duì)?q∈[0,1],p=1最大化期望支付E1;而當(dāng)a1+a2<0時(shí),顯然成立,從而也得到綜合起來(lái),局中人1的最優(yōu)反應(yīng)函數(shù):p(q)=1,?q∈[0,1]。
(2)a1<0,a2>0。類似情形(1),可得到此時(shí)恒有,故局中人1的最優(yōu)反應(yīng)函數(shù):p(q)=0,?q∈[0,1]。
(3)a1>0,a2>0。當(dāng)時(shí),恒成立。?p∈[0,1],都能最大化期望支付E1;當(dāng)時(shí),,局中人1的最優(yōu)反應(yīng)是p(q)=0;當(dāng)時(shí),,局中人1的最優(yōu)反應(yīng)是p(q)=1。局中人1的反應(yīng)函數(shù)可用分段函數(shù)表示:
(4)a1<0,a2<0。類似情形(3),可得局中人1的最優(yōu)反應(yīng)函數(shù):
3.2.2 局中人2的最優(yōu)反應(yīng)函數(shù)
局中人2的最優(yōu)反應(yīng)是對(duì)不同的X,選擇Y最大化期望支付E2(p,q)。
(1)b1>0,b2<0。局中人2的最優(yōu)反應(yīng)函數(shù):q(p)=1,?p∈[0,1]。
(2)b1<0,b2>0。局中人2的最優(yōu)反應(yīng)函數(shù):q(p)=0,?p∈[0,1]。
(3)b1>0,b2>0。局中人2的最優(yōu)反應(yīng)函數(shù)可用分段函數(shù)式(9)表示:
(4)b1<0,b2<0。局中人2的最優(yōu)反應(yīng)函數(shù)可用分段函數(shù)式(10)表示:
表2 2×2型博弈的決策均衡
由于局中人1和2的反應(yīng)函數(shù)都有4種情形,交叉組合后共有4×4=16種情形。上頁(yè)表2列出2×2型博弈在每種情形下的反應(yīng)函數(shù)圖形和決策均衡。表2中(ei,ej)是純策略納什均衡,如(e1,e2)表示[(1,0),(0,1)],亦即純策略組合(α1,β2)。粗實(shí)線表示相應(yīng)的反應(yīng)函數(shù)曲線。
以企業(yè)管理中著名的“協(xié)調(diào)”博弈為例,闡述不同決策均衡求解過(guò)程并進(jìn)行方法比較。企業(yè)1和企業(yè)2是相關(guān)行業(yè)內(nèi)的兩個(gè)廠商,都具備生產(chǎn)產(chǎn)品甲和乙的技術(shù)條件。比較而言,廠商1在產(chǎn)品甲生產(chǎn)上有比較優(yōu)勢(shì),廠商2在產(chǎn)品乙生產(chǎn)上有比較優(yōu)勢(shì)。但由于生產(chǎn)過(guò)程中的技術(shù)互補(bǔ)的原因,兩家企業(yè)生產(chǎn)同一種產(chǎn)品更容易獲得外部規(guī)模經(jīng)濟(jì)?,F(xiàn)在的問(wèn)題是,兩家企業(yè)如何協(xié)調(diào),實(shí)現(xiàn)產(chǎn)品選擇決策均衡。表3列出各種策略組合下的支付。
表3 產(chǎn)品選擇“協(xié)調(diào)”博弈
相對(duì)優(yōu)勢(shì)劃線法的基本思想是:對(duì)每個(gè)局中人在對(duì)手各種確定的策略情形下尋求其最優(yōu)策略,并在該局中人相應(yīng)的支付下面劃一短線。等兩個(gè)局中人都分析完成后,每個(gè)局中人支付下面都有短線的策略組合就是納什均衡。
對(duì)于企業(yè)1而言,給定企業(yè)2選擇產(chǎn)品甲,選擇產(chǎn)品甲支付是3,選擇乙支付是-1,于是在(3,2)中局中人1的支付3下面劃線。類似這樣的討論對(duì)所有局中人的全部策略,劃線結(jié)果也在表3中同時(shí)給出。通過(guò)相對(duì)優(yōu)勢(shì)劃線法,容易得到該產(chǎn)品選擇“協(xié)調(diào)”博弈的決策均衡是(產(chǎn)品甲,產(chǎn)品甲)、(產(chǎn)品乙,產(chǎn)品乙)。
相對(duì)優(yōu)勢(shì)劃線法的優(yōu)點(diǎn)是簡(jiǎn)單易行,但只適用于純策略納什均衡的求解。
期望支付相等是混合納什均衡的一個(gè)重要性質(zhì)。如果(X*,Y*)是博弈G的一個(gè)納什均衡,這里X=[p,1-p]表示局中人1以概率p、1-p選擇行動(dòng)α1、α2,Y=[q,1-q]T表示分局中人2以概率q、1-q選擇行動(dòng)β1、β2,那么E1(X*,Y*)=E1(X,Y*)、E2(X*,Y*)=E2(X*,Y)對(duì)任意X、Y都成立。給定某局中人選擇均衡策略,另一局中人無(wú)論選擇什么混合策略都不改變其支付。在混合納什均衡點(diǎn)上,局中人的期望支付與另一局中人的策略選擇無(wú)關(guān)。這當(dāng)然也包括兩種純策略,由此引入求解2×2型博弈混合納什均衡的一種簡(jiǎn)便方法——期望支付等值法。
仍以產(chǎn)品選擇“協(xié)調(diào)”博弈為例,說(shuō)明期望支付等值法的求解過(guò)程。對(duì)于企業(yè)1而言,當(dāng)企業(yè)2選擇混合策略(q,1-q)時(shí),其選擇純策略產(chǎn)品甲和產(chǎn)品乙的期望支付相等,即:
相對(duì)優(yōu)勢(shì)劃線法和期望支付等值法分別在求解2×2型博弈的純策略納什均衡和混合策略納什均衡方面有各自優(yōu)勢(shì),但缺陷是適用范圍有限,容易造成解得遺漏。一個(gè)自然的想法是如何將兩種方法歸一化,探求對(duì)2×2型博弈的一般性求解方法。
歸一化解法基于最優(yōu)反應(yīng)函數(shù)法,能有效減輕該方法在使用過(guò)程中的計(jì)算量。由表3,產(chǎn)品選擇“協(xié)調(diào)”博弈中局中人1、2的支付矩陣是:經(jīng)局部變換后的對(duì)角陣分別是:于是a1=4、a2=1、b1=1、b2=4,。查閱表2知該2×2型博弈有三個(gè)納什均衡:,分別是純策略納什均衡(產(chǎn)品甲,產(chǎn)品甲)、(產(chǎn)品乙,產(chǎn)品乙)和混合納什均衡
通過(guò)方法比較后不難發(fā)現(xiàn),2×2型博弈決策均衡的歸一化解法利用納什均衡不變性定理,可將復(fù)雜的求解過(guò)程“簡(jiǎn)單化、程序化和規(guī)范化”,具有普適性特征,且很好地解決了其他方法解的遺漏問(wèn)題。
[1]王文舉.經(jīng)濟(jì)博弈論基礎(chǔ)[M].北京:高等教育出版社,2010.
[2]Nash J.Equilibrium Points in n-person Games[J].Proceedings of the National Academy of Science,1950,(36).
[3]Debreu D A.Social Equilibrium Existence Theorem[J].Proceedings of the National Academy of Science,1952,(38).
[4]李正龍.雙人靜態(tài)博弈純戰(zhàn)略納什均衡存在性判別[J].應(yīng)用數(shù)學(xué)與計(jì)算機(jī)學(xué)學(xué)報(bào),2001,15(1).
[5]朱年磊,李榮生.靜態(tài)博弈純戰(zhàn)略均衡存在性判別法[J].曲阜師范大學(xué)學(xué)報(bào),2006,32(1).