李夢婷,劉心聲
(南京航空航天大學理學院數(shù)學系,南京210016)
引入需求上限的鷹鴿博弈中合作和競爭的演化動態(tài)
李夢婷,劉心聲
(南京航空航天大學理學院數(shù)學系,南京210016)
重點研究考慮資源最大需求上限的鷹鴿博弈中合作和競爭的演化動態(tài).我們假設參與博弈的鴿策略者對資源的最大需求量為m1,參與博弈的鷹策略者對資源的最大需求量為m2(m1<m2),資源總量為V(0<V<m1+m2),斗爭導致受傷的代價為c(c>0).首先求出當2m1<m2時,資源總量V的取值不同時的收益矩陣.隨后求出當m2<2m1時,資源總量V的取值不同時的收益矩陣.基于收益矩陣最后研究引入需求上限的鷹鴿博弈中合作和競爭的演化動態(tài).
Moran過程;鷹鴿博弈;進化博弈理論
本文的擴展機制是在傳統(tǒng)的鷹鴿博弈的基礎上考慮資源最大需求上限.我們假設參與博弈的鴿策略者對資源的最大需求量為m1,參與博弈的鷹策略者對資源的最大需求量為m2(m1<m2),資源的總量為V(0<V<m1+m2),斗爭導致受傷的代價為c(c>0).
1.1 當2m1<m2時,資源總量V取值不同時的收益矩陣[6]
(1)當0<V≤2m1時,此時的模型為傳統(tǒng)的鷹鴿博弈,此時的收益矩陣為:
(2)當2m1<V≤m2時,此時若兩個鷹策略者相遇,斗爭不可避免的發(fā)生,最終勝利的一方得到全部的資源量V,失敗的一方受到一定的傷害c,由于參與博弈的個體具有相同的實力,那么雙方的期望收益均為V/2-c/2=(V-c)/2.當一個鷹策略者與一個鴿策略者相遇時,鴿策略者主動退出,鷹策略者得到滿足自身最大需求的資源量V,而鴿策略者什么也得不到.當兩個鴿策略者相遇時,斗爭不會發(fā)生,博弈的雙方平分資源,因為m1<V/2,所以鴿策略者各自得到的資源為m1,此時的收益矩陣為:
(3)當m2<V≤m1+m2時,此時若兩個鷹策略者相遇,最終勝利的一方獲得最大需求的資源量m2,失敗的一方受到一定的傷害c并且得到剩下的資源V-m2,同樣雙方的期望收益均為m2/2+(V-m2-c)/2=(V-c)/2.當一個鷹策略者與一個鴿策略者相遇時,鴿策略者主動退出,鷹策略者得到滿足自身最大需求的資源量m2,而鴿策略者得到剩余的那部分資源V-m2.當兩個鴿策略者相遇時,斗爭不會發(fā)生,博弈的雙方平分資源,因為2m1<V即m1<V/2,所以鴿策略者各自得到的資源為m1,此時的收益矩陣為:
1.2 當m2<2m1時,資源總量V取值不同時的收益矩陣
(1)當0<V≤m2時,此時的模型為傳統(tǒng)的鷹鴿博弈,收益矩陣為:
(2)當m2<V≤2m1時,此時若兩個鷹策略者相遇,同上所述雙方的期望收益均為m2/2+(V-m2-c)/2=(V-c)/2.當一個鷹策略者與一個鴿策略者相遇時,鴿策略者主動退出,鷹策略者得到滿足自身最大需求的資源量m2,而鴿策略者得到剩余的那部分資源V-m2.當兩個鴿策略者相遇時,斗爭不會發(fā)生,博弈的雙方平分資源,因為V<2m1即V/2<m1,所以鴿策略者各自得到的資源為V/2,此時的收益矩陣為:
(3)當2m1<V≤m1+m2時,此時若兩個鷹策略者相遇,同上所述雙方的期望收益均為m2/2+(V-m2-c)/2= (V-c)/2.當一個鷹策略者與一個鴿策略者相遇時,鴿策略者主動退出,鷹策略者得到滿足自身最大需求的資源量m2,而鴿策略者得到剩余的那部分資源V-m2.當兩個鴿策略者相遇時因為2m1<V即m1<V/2,所以鴿策略者各自得到的資源為m1,此時的收益矩陣為:
考慮一個無限種群,種群中鷹策略者的頻率為x,鴿策略者的頻率為(1-x)[5].則可得鷹策略者與鴿策略者的期望收益分別為:
其中E(A,B)表示一個A策略者遇到一個B策略者時得到的收益.
當2m1<m2時,可得到該模型的復制動態(tài)方程[6,7]:
(1)當0<V≤2m1時,從復制動態(tài)方程(1)式中可以看出,當V/c<1時系統(tǒng)存在唯一的穩(wěn)定內(nèi)平衡點x*=V/c,從而鷹策略者和鴿策略者可以達到共存,并且在平衡點處鷹策略者的頻率與V成正比,而與c成反比.當V/c≥1時系統(tǒng)不存在內(nèi)平衡點,此時鷹策略者占優(yōu),種群最終被鷹策略者所占領(lǐng).
(2)當2m1<V≤m2時,從復制動態(tài)方程(2)式中可以看出,當V/c<1時系統(tǒng)存在唯一的穩(wěn)定內(nèi)平衡點x*= (2m1-2V)/(2m1-c-V),從而鷹策略者和鴿策略者可以達到共存,并且在平衡點處鷹策略者的頻率與V成正比,而與c和m1成反比.當V/c≥1時系統(tǒng)不存在內(nèi)平衡點,此時鷹策略者占優(yōu),種群最終被鷹策略者所占領(lǐng).
(3)當m2<V≤m1+m2時,從復制動態(tài)方程(3)式中可以看出,當(V+c)/2>m2時,系統(tǒng)存在唯一的穩(wěn)定內(nèi)平衡點x*=(2m1-2m2)/(2m1-c-V),從而鷹策略者和鴿策略者可以達到共存,并且在平衡點處鷹策略者的頻率與m2成正比,與資源量V、c及m1成反比.當(V+c)/2≤m2時,系統(tǒng)的內(nèi)平衡點消失,鷹策略者占優(yōu),種群最終被鷹策略者所占領(lǐng).
綜上所述,我們可以發(fā)現(xiàn)當2m1<m2(也就是說鴿策略者對資源的需求量很小于鷹策略者對資源的需求量)時,只要V/c<1,鷹策略者與鴿策略者就可以達到共存,受傷所付出的代價c的增加總是對鴿策略者有利.當鴿策略者對資源的最大需求量m1、鷹策略者對資源的最大需求量m2及受傷所付出的代價c一定時,資源的增加(0<V≤m2)對鷹策略者越來越有利,而當V>m2時,V的進一步增加卻越來越有利于鴿策略者.圖1為當m2/m1=4時,對于不同的參數(shù)c/m1,鷹鴿博弈的穩(wěn)定內(nèi)平衡點隨參數(shù)V/m1的變化情況.圖2為當c/m1=8時,對于不同的參數(shù)m2/m1,鷹鴿博弈的穩(wěn)定內(nèi)平衡點隨參數(shù)V/m1的變化情況.
對于m2<2m1時的情況可類似討論.
下面我們來分析在無突變的有限均勻種群中引入最大需求上限的鷹鴿博弈的演化動態(tài).我們假設種群的數(shù)量為Z,種群中鷹策略者的數(shù)量為i,則鷹策略者和鴿策略者的期望收益分別是[6-10]:
鷹策略者和鴿策略者的適合度分別為:
圖1 引入最大需求上限的鷹鴿博弈的穩(wěn)定平衡點隨參數(shù)V/m1的變化情況(m2/m1=4時)
圖2 引入最大需求上限的鷹鴿博弈的穩(wěn)定平衡點隨參數(shù)V/m1的變化情況(c/m1=8時)
其中,參數(shù)ω表示選擇強度.
我們采取Moran過程來研究在有限種群中鷹策略者和鴿策略者的進化動力學.則可得鷹策略者和鴿策略者的固定概率在弱選擇下分別近似為:
其中
當2m1<m2時,分三種情況進行討論:
(1)當0<V≤2m1時,由(7)和(8)式可得當前情況下鷹策略和鴿策略的固定概率近似分別為:
從上式中可以看出鷹策略的固定概率ρH與資源量V成正比,與受傷所付出的代價c成反比.鴿策略的固定概率ρD與資源量V成反比,與受傷所付出的代價c成正比.從而說明在0<V≤2m1的條件下,資源量V的增加或受傷所付出的代價c的減少都對鷹策略有利,資源量V的減少或受傷所付出的代價c的增加都對鴿策略有利.
從預備知識中我們知道,一個策略的固定概率大于1/Z等價于自然選擇有利于該策略.由(9)式可知ρH>1/Z等價于
當Z→+∝時,上式退化為V/c>1/3.
由(9)、(10)還可以得到ρH-ρD=ω[2c+Z(2V-c)]/4Z
當Z→∝時,由上式可知V/c>1/2時ρH>ρD,即鷹策略者風險占優(yōu);否則鴿策略風險占優(yōu).
(2)當2m1<V≤m2時,由(7)和(8)式可得當前情況下鷹策略和鴿策略的固定概率近似分別為:
從上式中可以看出鷹策略的固定概率ρH與資源量V成正比,與c及m1成反比.鴿策略的固定概率ρD與資源量V成反比,與c及m1成正比.
由(11)式可知ρH>1/Z等價于
當Z→∝時,上式退化為5V-c-4m1>0
在當前情況下,若V/c>1/3,則5V-c-4m1>0,即ρH>1/Z成立.但反之不一定成立,即V/c>1/3是ρH>1/Z成立的充分不必要條件.
由(11)、(12)還可以得到
當Z→∝時,上式退化為3V-c-2m1>0
在當前情況下,若V/c>1/2時,則3V-c-2m1>0,也就是說ρH>ρD成立,即鷹策略風險占優(yōu).但V/c<1/2時,鴿策略不一定風險占優(yōu).
(3)當m2<V≤m1+m2時,由(7)和(8)式可得當前情況下鷹策略和鴿策略的固定概率近似分別為:
從上式中可以看出鷹策略的固定概率ρH與m2成正比,與資源量V、c及m1成反比.鴿策略的固定概率ρD與資源量V、c及m1成正比,m2成反比.也就是說鷹策略者對資源的最大需求量m2越大,資源量V、受傷所付出的代價c及鴿策略者對資源的最大需求m1越小,越有利于鷹策略者,反之越有利于鴿策略者.
由(13)式可知ρH>1/Z等價于
當Z→∝時,上式退化為3m2-2m1-V/2-c/2>0
由(13)(14)還可以得到
當Z→∝時,由上式可知當2m2-m1-V/2-c/2>0時,ρH>ρD,即鷹策略者風險占優(yōu);否則鴿策略風險占優(yōu).
對于m2<2m1時的情況可類似討論.
本文在傳統(tǒng)的鷹鴿博弈的基礎上考慮最大需求上限從而構(gòu)建新的模型,也就是假設參與博弈的鴿策略者和鷹策略者對資源具有最大需求量且分別為m1、m2.然后根據(jù)資源總量V與2m1、m2、m1+m2的大小關(guān)系求出相應的收益矩陣,最后在此收益矩陣下分析無限種群和有限種群中合作和競爭的演化動態(tài).在無限種群中只要V/c<1,鷹策略者與鴿策略者就可以達到共存.在有限種群中我們求出鷹策略和鴿策略的固定概率并分析參數(shù)對固定概率的影響.無論在有限種群中還是在無限種群中,受傷的代價c的增加總是對鴿策略有利;在m2<V≤2m1的情況下,m1的增加不會產(chǎn)生任何影響,而在其余情況下m1的增加也總是對鴿策略者有利.在不同的情況下資源總量V對鴿策略者有不同的影響.
[1]MAYNARD SMITH J,PRICE G R.The logic of animal conflict[J].Nature,1973,246:15-18.
[2] 王幽然.證券市場中噪聲交易的“鷹鴿博弈”理論分析[J].河南工業(yè)大學學報:社會科學版,2008,4(3):21-24.
[3]CUSHING B S.When a hawk can damage a dove:an extension of game theory[J].Theor,Biol,1995,175:173-176.
[4]CROWLEY PH.Hawks,doves,and mixed-symmetry games[J].Theor.Biol,2000,204(4):543-563.
[5]NOWAK M A.Evolutionary dynamics:exploring the equations of life[M].Harvard University Press,2006.
[6]SAMUELSON L.Evolutionary games and equilibrium selection[M].Mit Press,1997.
[7]TAYLOR C,F(xiàn)UDENBERG D,NOWAK M A.Evolutionary game dynamics in finite populations[J].Bul,Math,Biol,2004,66:1621-1644.
[8]ANTAL T,SCHEURING I.Fixation of strategies for an evolutionary game in finite populations[J].Bul,Math,Biol,2006,68:1923-1944.
[9]OHTSUKIH,BORDALO P,NOWAK M A.The one-third law of evolutionary dynamics[J].Theor.Biol,2007,249(2): 289-295.
[10]VON NEUMANN J,MORGENSTERN O.Theory of games and economic behavior[M].Princeton University Press,1944.
[責任編輯 王新奇]
On Evolution Dynam ics of Cooperation and Com petition in the Hawk and Dove Game w ithin Upper Lim it of Demand
LIMeng-ting,LIU Xin-sheng
(Department of Mathematics,School of Science,Nanjing University of Aeronautics and Astronautics,Nanjing 210016,China)
Our focus is on the evolution dynamics of cooperation and competition in the hawk and dove game within the upper limit of resource demand.If themaximum resource demand of the dove strategists is m1,meanwhile,that of the hawk strategists is m2(m1<m2)and the total resource is V(0<V<m1+m2),the cost of fighting woundswill be c(c>0).Firstly,under the condition of 2m1<m2,the total resource V ismeasured against non-simultaneous income matrix;Secondly,under the condition of m2<2m1,the total resource V ismeasured against nonsimultaneous incomematrix.Lastly,based on incomematrix,evolution dynamics of cooperation and competition in the hawk and dove gamewithin the upper limitof resource demand are studied.
Moran process;hawk and dove game;evolutionary game theory
1008-5564(2015)01-0022-05
O211.9
A
鷹鴿博弈自從被John Maynard和George Price提出以后[1],就被廣泛用于討論人類社會和動物世界中普遍存在的競爭和沖突等現(xiàn)象,如人類戰(zhàn)爭,證券投資[2]等.同時國內(nèi)外很多著名的學者也對其進行了一系列擴展以使其更具有現(xiàn)實意義,例如,Cushing考慮了在博弈過程中鷹可能會對鴿造成傷害這一因素[3],Crowley考慮了博弈個體可能不清楚自己和對手的競爭能力、清楚自己和對手的競爭能力和只清楚其中一方的能力從而分別得到對稱的鷹鴿博弈、非對稱的鷹鴿博弈和混合對稱的鷹鴿博弈[4],在這些博弈模型中,無論資源總量有多大,勝利的一方總能占領(lǐng)全部的資源.然而在現(xiàn)實世界中,有時候資源很大或者勝利的一方對資源的需求量很小以至于勝利的一方不能完全占有它,這時候失敗的一方就可以得到剩下的那部分資源.此時的鷹鴿博弈就不能再用傳統(tǒng)的鷹鴿博弈來描述.因此,對鷹鴿博弈進行相應的擴展是有實際意義的.
2014-09-16
李夢婷(1986—),女,安徽淮北人,南京航空航天大學理學院數(shù)學系碩士研究生,主要從事概率論與數(shù)理統(tǒng)計研究.