李夢圓++段靈子++栗夢妍++張博宇
摘 要:以往的研究一般是從社會學(xué)和心理學(xué)的角度出發(fā)分析人類從眾行為的合理性,本課題應(yīng)用演化博弈理論對人類社會中廣泛存在的模仿行為進(jìn)行分析?;谀7滦袨樽畋举|(zhì)的兩個(gè)特征,即初始策略與模仿強(qiáng)度,我們定義了重復(fù)公用品博弈中的模仿策略集,并通過計(jì)算不同類型模仿策略在重復(fù)公用品博弈中的收益,得到不同博弈參數(shù)下的最優(yōu)模仿對策。在選擇-突變框架下,本課題給出了重復(fù)公用品博弈情境下嚴(yán)格模仿策略的局部(演化)穩(wěn)定性條件,并證明了其在模仿策略集內(nèi)是不可被入侵的。
關(guān)鍵詞:重復(fù)公用品博弈 嚴(yán)格模仿策略 演化穩(wěn)定性 社會學(xué) 心理學(xué)
中圖分類號:TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-098X(2015)02(a)-0018-02
在公用品博弈中,每一個(gè)參與者在游戲開始之前被給予一筆資金,他可以把它直接據(jù)為己有或者從中拿出一部分向一個(gè)公共儲備池(common pool)投資,公共儲備池中的資金被放大一定倍數(shù)后平均分配給所有參與者,不論其貢獻(xiàn)多少[1]。根據(jù)傳統(tǒng)的經(jīng)濟(jì)學(xué)理論,公用品博弈中唯一的理性結(jié)果為所有參與者均不捐獻(xiàn)任何資金。
在真實(shí)的公用品試驗(yàn)中,只有少數(shù)人的行為符合經(jīng)典經(jīng)濟(jì)學(xué)的預(yù)測。大量的實(shí)驗(yàn)證據(jù)顯示大多數(shù)受試者在博弈開始時(shí)一般會往公共儲備池中投入接近一半的資金。隨著博弈重復(fù)進(jìn)行,貢獻(xiàn)率逐漸下降到0[2]。例如在Fehr和G?chter[3]的重復(fù)公用品博弈實(shí)驗(yàn)中,在第一輪中平均捐獻(xiàn)率能達(dá)到初始資金的40%~60%,而在第十輪中超過70%的參與者選擇了0貢獻(xiàn)的行為。Traulsen等人[4]指出,在重復(fù)公用品博弈中,如果將降低貢獻(xiàn)視為對低貢獻(xiàn)者行為的模仿,那么這類行為的比例一般能占到全部行為的70%。
本研究中,我們將策略空間限定在重復(fù)公用品博弈的模仿行為類里??紤]一個(gè)n人t輪重復(fù)公用品博弈,每一輪中,公共儲備池會將當(dāng)輪所有貢獻(xiàn)的資金放大r倍后平分給n個(gè)人。對于采用模仿策略的個(gè)體,在首輪博弈中他將按照自己意愿貢獻(xiàn)一定比例的資金,然后在之后的每一輪中對其他n-1個(gè)個(gè)體的貢獻(xiàn)平均值進(jìn)行一定力度的模仿。在一個(gè)重復(fù)博弈進(jìn)行過程中,每個(gè)個(gè)體的模仿策略始終保持不變,其收益定義為t輪重復(fù)博弈中每輪博弈結(jié)束后結(jié)余資金的平均值。一個(gè)模仿策略被稱為是(演化)穩(wěn)定的,如果大多數(shù)個(gè)體都采用該對策時(shí),任何突變對策無法獲得更高的收益[5]。
1 模仿對策模型的建立
假設(shè)重復(fù)公用品博弈參與人數(shù)為n,公用儲備池的放大倍數(shù)為r,博弈輪數(shù)為t。通過包含兩個(gè)參數(shù)的向量(x,p)來定義個(gè)體的模仿策略,其中x∈[0,1]表示在重復(fù)公用品博弈中首輪的貢獻(xiàn)率,p∈[0,1]表示之后的每一輪對于組內(nèi)其他斜-1個(gè)個(gè)體平均貢獻(xiàn)值的模仿強(qiáng)度。嚴(yán)格模仿策略可寫為(x,1),即首輪貢獻(xiàn)x,從第二輪開始,每輪嚴(yán)格貢獻(xiàn)上一輪組內(nèi)其他個(gè)體貢獻(xiàn)的平均值。
我們假定n人重復(fù)公用品博弈中n-1個(gè)參與者所采用的模仿策略為S1=(x,p),另外1個(gè)參與者采用突變策略S2=(y,q)。所有采用S1策略的個(gè)體行為變化是同步的,并且每輪的貢獻(xiàn)值只依賴于上一輪組內(nèi)其他n-1個(gè)成員的平均貢獻(xiàn)比率,因此這類個(gè)體第t輪的貢獻(xiàn)率xt可以通過下面遞推式表示:
(1)
類似的,采用策略S2的個(gè)體在第t輪的貢獻(xiàn)率yt可以表示為:
(2)
下面我們利用待定系數(shù)法求解xt和yt的具體表達(dá)式。不妨設(shè)
, (3)
其中α和β為待定系數(shù)。
將方程(3)帶入(1)和(2)的第二個(gè)等式,解得
。
將上面結(jié)果帶入方程(1)和(2)的第二個(gè)等式,可以得到
由此解得S1策略個(gè)體和S2策略個(gè)體第t輪的貢獻(xiàn)分別為
因此使用S1策略的個(gè)體在t輪重復(fù)公用品博弈中的貢獻(xiàn)總和為
使用S2策略的個(gè)體在t輪重復(fù)公用品博弈中的貢獻(xiàn)總和為
n人公用品博弈中,如果n-1個(gè)個(gè)體采用S1策略,1個(gè)個(gè)體采用S2策略,那么使用S1策略和S2策略的個(gè)體在第t輪的收益可以表示為以下形式
(4)
所以由方程(4),兩類個(gè)體t輪重復(fù)公用品博弈中的每輪平均收益分別為
(5a)
(5b)
2 嚴(yán)格模仿策略的局部穩(wěn)定條件
2.1 模仿策略的局部穩(wěn)定性
一個(gè)模仿策略(x,p)被稱為局部(演化)穩(wěn)定的,如果對于任意局部突變策略(x+△x,p+△p),采用該突變策略的個(gè)體在一個(gè)由采用(x,p)策略的個(gè)體構(gòu)成的群體中,其收益低于使用原策略(x,p)帶來的收益[7]。這種情況下,此個(gè)體顯然沒有動機(jī)堅(jiān)持使用突變策略(x+△x,p+△p),而會改回使用原對策(x,p)。
在n人重復(fù)公用品博弈中,模仿策略S1=(x,p)是局部穩(wěn)定的,當(dāng)且僅當(dāng)對任意S2=(x+△x,p+△p),(6)
當(dāng)△x→0,△p→0時(shí),S1的局部穩(wěn)定性可以等價(jià)的表示為下面兩個(gè)條件
(7)
其中原策略S1=(x,p),突變策略S2=(y,q)。
2.2 n人重復(fù)公用品博弈嚴(yán)格模仿策略的局部穩(wěn)定條件
在n人重復(fù)公用品博弈情境下,方程(7)給出了模仿策略S1的局部穩(wěn)定性條件。將原策略記為S1=(x,p),突變策略記為S2=(y,q),由方程(5b),
(8)
(9)
方程(8)當(dāng)r>1和t>>1時(shí),總有,即單輪平均收益隨著首輪貢獻(xiàn)率的增加單調(diào)遞增。因此在n人重復(fù)公用品博弈情境下,當(dāng)輪次t足夠大時(shí),唯一可能的局部穩(wěn)定嚴(yán)格模仿策略是(1,1)。
我們接下來討論(1,1)對策在n人t輪重復(fù)公用品博弈中的局部穩(wěn)定條件。當(dāng)t=1時(shí),首輪全部貢獻(xiàn)是穩(wěn)定的當(dāng)且僅當(dāng)r>n,即個(gè)體單獨(dú)提高貢獻(xiàn)值能使其收益增加。當(dāng)t>1時(shí),將原策略(1,1)和突變策略(y,q)=(1-△y,1-△q)帶入方程(8)和(9),(1,1)是局部穩(wěn)定的當(dāng)且僅當(dāng)下面兩個(gè)不等式成立endprint
(10)
綜上所述,(1,1)的局部穩(wěn)定條件為
(11)
當(dāng)r>n時(shí),(1,1)在任意輪次的重復(fù)公用品博弈中都是穩(wěn)定的。另一方面,注意到當(dāng)t>>1時(shí),方程(10)中兩個(gè)不等式的右邊均趨近于1。這意味著當(dāng)r>1時(shí),只要博弈重復(fù)的輪次充分長,嚴(yán)格模仿策略(1,1)就會成為局部穩(wěn)定的,此時(shí)每名參與者都會選擇全部貢獻(xiàn)。
在實(shí)驗(yàn)經(jīng)濟(jì)學(xué)中,重復(fù)公用品實(shí)驗(yàn)一般4人分為一組[4-6],此時(shí)嚴(yán)格模仿策略(1,1)的局部穩(wěn)定條件如圖1所示。例如當(dāng)t=5時(shí),局部穩(wěn)定條件為r>1.49;當(dāng)t=10時(shí),局部穩(wěn)定條件為r>1.24;當(dāng)t=20時(shí),局部穩(wěn)定條件為r>1.11。注意到在這些實(shí)驗(yàn)中r的取值均大于1.5,且重復(fù)的次數(shù)一般超過10輪,因此(1,1)在模仿策略集中是局部穩(wěn)定的,并且每輪平均收益隨首輪貢獻(xiàn)率的提高單調(diào)上升。這可能是重復(fù)公用品博弈中貢獻(xiàn)率居高不下的一個(gè)原因。
2.3 重復(fù)公用品博弈嚴(yán)格模仿策略局部穩(wěn)定條件的進(jìn)一步研究
上節(jié)中我們得到了n人重復(fù)公用品博弈中嚴(yán)格模仿對策(1,1)的局部穩(wěn)定條件。由于方程(10)包含兩個(gè)不等式,一個(gè)自然的問題是哪個(gè)不等式條件更強(qiáng)。這里我們給出此結(jié)論在n人重復(fù)博弈下的一個(gè)一般性證明。
對方程(10)中兩個(gè)不等式的右邊項(xiàng)做差,當(dāng)t較大時(shí),
這表明當(dāng)t較大時(shí),方程(10)的第2個(gè)不等式比較強(qiáng),即如果個(gè)體收益隨著模仿強(qiáng)度單調(diào)增加,那么其收益也會隨著首輪貢獻(xiàn)值單調(diào)增加。
因此,對于較大的t,(1,1)策略的局部穩(wěn)定條件可以簡化為
(12)
注意到方程(12)不等式右邊包含兩個(gè)變量n和t,我們進(jìn)一步分析(1,1)的局部穩(wěn)定性與n和t的關(guān)系。
當(dāng)t較大時(shí),有
(13)
因此不等式(12)的右邊項(xiàng)隨著n單調(diào)增加而隨著t單調(diào)減小。即給定重復(fù)輪次t時(shí),隨著公用品博弈參與的人數(shù)增加,(1,1)的局部穩(wěn)定性條件越來越嚴(yán)格。但是對于任意r>1的n人公用品博弈,只要重復(fù)的輪次足夠長,(1,1)就能夠成為局部穩(wěn)定的。特別的,當(dāng)n和t都較大時(shí),(1,1)局部穩(wěn)定的一個(gè)近似的條件是r>1+n/t。
3 結(jié)語
在本課題中,我們考慮僅僅引入兩個(gè)變量——初始貢獻(xiàn)率及模仿強(qiáng)度來刻畫人們在社會生活中所采取的行為?;谌祟惸7滦袨樽畋举|(zhì)的特征建立起相對簡單的數(shù)學(xué)模型,并通過對最優(yōu)模仿策略的研究拓展了學(xué)習(xí)理論對人類社會中真實(shí)現(xiàn)象的解釋力度。
參考文獻(xiàn)
[1] Hardin G.The tragedy of the commons[J].Science,1968,162:1243-1248.
[2] Chaudhuri A.Sustaining cooperation in laboratory public goods experiments:a selective survey of the literature[J].Experimental Economics,2011,14(1):47-83.
[3] Fehr E,G?chter S.Cooperation and punishment in public goods experiment[J].The American Economic Review,2000,90:980-994.
[4] Traulsen A,Semmann D,Sommerfeld RD,et al.Human strategy updating in evolutionary games[J].Proceedings of the National Academy of Sciences,2010,107:2962-2966.
[5] Hofbauer J,Sigmund K.Evolutionary Games and Population Dynamics.Cambridge[M].Cambridge University Press,1998.endprint