劉 靜, 劉春燕, 陸征一, 楊 鳴
(1.武警警官學(xué)院部隊(duì)管理系,四川成都610213; 2.四川師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,四川成都610066;3.中國(guó)科學(xué)院成都計(jì)算機(jī)應(yīng)用研究所,四川成都610041)
復(fù)制系統(tǒng)與 Lotka -Volterra 系統(tǒng)[1]是進(jìn)化博弈中的 2 個(gè)重要模型.1998 年,Sigmund[2]在國(guó)際數(shù)學(xué)家大會(huì)(ICM)報(bào)告中將Lotka-Volterra系統(tǒng)與復(fù)制系統(tǒng)作為2 個(gè)主題分別進(jìn)行了總結(jié),綜述了永久生存性、穩(wěn)定性、異宿環(huán)、極限環(huán)存在性等一系列結(jié)果且說(shuō)明了兩者之間存在等價(jià)性.利用兩系統(tǒng)的等價(jià)性和中心流形定理[3],楊靜等[4]用異于前人的方法得到了三維Lotka -Volterra 系統(tǒng)極限環(huán)的存在性,汪芳[5]得到三維復(fù)制系統(tǒng)在正平衡點(diǎn)處存在中心或全局穩(wěn)定的充分必要條件.
進(jìn)化博弈[6-7]中具有循環(huán)優(yōu)勢(shì)的博弈是近年來(lái)學(xué)術(shù)研究的熱點(diǎn),其有效地解釋了策略的選擇和進(jìn)化.人們發(fā)現(xiàn)循環(huán)優(yōu)勢(shì)博弈不僅能夠深入的解釋自然選擇理論,還能解釋物種空間分布復(fù)雜性[8]和物種進(jìn)化[9].實(shí)例表明,物種多樣性也可以用循環(huán)優(yōu)勢(shì)博弈來(lái)解釋.學(xué)者們還不斷拓寬著經(jīng)典的石頭-剪刀-布三循環(huán)優(yōu)勢(shì)博弈的研究,不僅研究了其吸引性理論[10-11],還將其應(yīng)用到微觀(guān)競(jìng)爭(zhēng)群體[12]和大范圍生物群落[13-14].四物種循環(huán)演化博弈[15]也具有與石頭-剪刀-布博弈相似的結(jié)論,即過(guò)快的流動(dòng)性會(huì)破壞系統(tǒng)的生物多樣性.而在四循環(huán)優(yōu)勢(shì)博弈中,還會(huì)出現(xiàn)三循環(huán)優(yōu)勢(shì)博弈中不存在的中性策略對(duì),即存在2 種策略互不入侵的情形.
進(jìn)化博弈中可考慮同步博弈和交替博弈.同步博弈是指兩位參與者同時(shí)做決定,而交替博弈是兩位參與者先后做決定進(jìn)行博弈.現(xiàn)在的大多數(shù)研究基于同步博弈中較為簡(jiǎn)單的策略相互博弈展開(kāi)的,但對(duì)交替博弈中更復(fù)雜的策略相互博弈所產(chǎn)生的循環(huán)優(yōu)勢(shì)系統(tǒng)的研究還不豐富.本文將在交替博弈中對(duì)新規(guī)定下的16 種策略相互博弈產(chǎn)生的三、四循環(huán)優(yōu)勢(shì)系統(tǒng)的性質(zhì)展開(kāi)研究.先給出了基于行為誤差的交替博弈在不同成本收益比k 值情形下,具有三、四循環(huán)優(yōu)勢(shì)的系統(tǒng)的數(shù)量,得到了三循環(huán)優(yōu)勢(shì)系統(tǒng)的完全分類(lèi)和四循環(huán)優(yōu)勢(shì)系統(tǒng)的永久生存性;再利用Lotka-Volterra 系統(tǒng)與復(fù)制系統(tǒng)的等價(jià)性,中心流形定理和實(shí)根分離等理論,考慮基于行為誤差的交替囚徒困境中,具有四循環(huán)優(yōu)勢(shì)的系統(tǒng)[S4,S8,S10,S15]的極限環(huán)的存在性.
在雙人博弈中參與者Ⅰ和參與者Ⅱ每次博弈都有2 種選擇:合作C 或背叛D,博弈中可出現(xiàn)4種狀態(tài):(C,C)、(C,D)、(D,C)、(D,D),其對(duì)應(yīng)的收益分別為 R、S、T、P.用 qR、qS、qT、qP來(lái)表示上一輪獲得收益 R、S、T、P 本輪選擇合作的概率.如果只考慮反應(yīng)規(guī)則(qR,qS,qT,qP)的空間,這個(gè)單位方形由它的 16 個(gè)頂點(diǎn)張成,即由向量(uR,uS,uT,uP)張成,其中 ui取 0 或 1 決定于獲得收益 i∈{R,T,P,S}后策略選擇是背叛還是合作.將這些策略記為 Sj,j =0,1,…,15.而(uR,uS,uT,uP)由二進(jìn)制給出,例如回報(bào)者 TFT = (1,0,1,0)表示為 S10.通過(guò)文獻(xiàn)[16]計(jì)算方法可以得到交替囚徒博弈中16種策略相互博弈所對(duì)應(yīng)的收益,見(jiàn)表1 所示.
表1 具有行為誤差的交替的囚徒困境博弈Tab. 1 Alternating prisoner’s dilemma game with behavioral errors
當(dāng)支付成本為 c,收益為 b,且 b >c時(shí),即
該博弈稱(chēng)捐贈(zèng)博弈,其收益見(jiàn)文獻(xiàn)[16].由達(dá)爾文選擇定律可知群體中策略的單位增長(zhǎng)率可由(AX)i-X·AX 給出,其中
為當(dāng)群體處于狀態(tài) X = (x1,x2,…,xn)時(shí),策略 i的收益,X·AX為群體的平均收益.由此,可得單形
上的復(fù)制方程
考慮復(fù)制系統(tǒng)(1)當(dāng) n =2 時(shí)的情形,其正平衡點(diǎn)
滿(mǎn)足 xi>0(i =1,2)的解.又由于收益矩陣添加任意函數(shù) f(x),復(fù)制系統(tǒng)(1)不會(huì)改變.因此,當(dāng)只有2 種策略相互博弈時(shí),可假設(shè)其收益矩陣A 為如下形式
引理 1[16]在收益矩陣為 A 的系統(tǒng)中,如果a、b 不同時(shí)為 0 且 ab≤0 時(shí),則當(dāng) a > b 時(shí),策略 x1占優(yōu);當(dāng) a <b時(shí),策略 x2占優(yōu).
由引理1 可以得到任意兩策略相互博弈的占優(yōu)情形,為實(shí)現(xiàn)對(duì)成本收益比的完全分類(lèi),根據(jù)收益矩陣的特殊性可將 k 分為4 個(gè)區(qū)間:
[0,1],[0,3],[0,4],[0,5],[0,6],[0,7],[0,9],[0,12],[0,13],[0,15],[1,5],[1,6],[1,7],[1,12],[1,13],[1,14],[1,15],[3,1],[3,2],[3,13],[3,14],[3,15],[4,2],[4,3],[4,5],[4,6],[4,7],[4,12],[4,13],[4,15],[5,2],[5,6],[5,7],[5,13],[5,14],[5,15],[6,2],[6,15],[7,2],[7,3],[7,6],[7,10],[7,14],[7,15],[8,1],[8,3],[8,4],[8,5],[8,7],[9,1],[9,5],[9,7],[9,13],[9,15],[10,0],[10,1],[10,2],[10,8],[11,1],[11,2],[11,3],[11,5],[11,8],[11,9],[11,10],[11,13],[12,7],[12,13],[12,15],[13,14],[13,15],[14,2],[14,8],[14,10],[15,10].
由此可以得到在具有行為誤差的交替捐贈(zèng)博弈中的16 種策略相互博弈所形成的三循環(huán)優(yōu)勢(shì)系統(tǒng)與四循環(huán)優(yōu)勢(shì)系統(tǒng).
其中,三循環(huán)優(yōu)勢(shì)系統(tǒng)1、2、3、6 和 7 存在孤立正平衡點(diǎn).
引理2[5]當(dāng)復(fù)制系統(tǒng)(1)存在正平衡點(diǎn)時(shí),其存在中心的充分必要條件是
且下列條件之一成立:
考慮具有行為誤差的交替捐贈(zèng)博弈系統(tǒng),合作者(ALLC)S15總是提供幫助;背叛者(ALLD)S0,總是不提供幫助;回報(bào)者(TFT)S10當(dāng)且僅當(dāng)對(duì)手上一回合不提供幫助時(shí),本回合不提供幫助.三循環(huán)優(yōu)勢(shì)系統(tǒng)2 中3 個(gè)策略相互博弈具有收益矩陣:
因此,由引理2 知三循環(huán)優(yōu)勢(shì)系統(tǒng)2 正平衡點(diǎn)處存在中心.
同理,可驗(yàn)證三循環(huán)優(yōu)勢(shì)系統(tǒng) 8、9、10、11 存在中心.
引理 3[5]當(dāng)復(fù)制系統(tǒng)(1)存在正平衡點(diǎn),即滿(mǎn)足引理2 中的條件1)~3)且
時(shí),該系統(tǒng)全局穩(wěn)定的充分必要條件為下列條件之一成立:
三循環(huán)優(yōu)勢(shì)系統(tǒng)7 中具有野心(這個(gè)策略只有在相互背叛后才合作,一旦遇到傻瓜便都無(wú)情的背叛)的只滿(mǎn)足于 T 的策略 S1=(0,0,0,1),與 S10、S15博弈構(gòu)成三循環(huán)優(yōu)勢(shì)系統(tǒng),現(xiàn)討論其動(dòng)力學(xué)行為.
系統(tǒng)[S1,S10,S15]具有收益矩陣
故三循環(huán)優(yōu)勢(shì)系統(tǒng)7 滿(mǎn)足引理3 中條件6),具有全局穩(wěn)定性.
保留系統(tǒng)[S1,S10,S15]中的策略 S1與回報(bào)者S10,將合作者S15替換成與策略S1恰好完全相反的策略S14(該策略稱(chēng)為“滯后的傻瓜”只有在相互背叛后才選擇背叛),三策略組成系統(tǒng)6,此系統(tǒng)仍是三循環(huán)優(yōu)勢(shì)系統(tǒng)且具有全局穩(wěn)定性.
具有正平衡點(diǎn)的三優(yōu)勢(shì)循環(huán)系統(tǒng),如果其正平衡點(diǎn)不存在中心且非全局穩(wěn)定,那么其平衡點(diǎn)為不穩(wěn)定焦點(diǎn),即三循環(huán)優(yōu)勢(shì)系統(tǒng)1、3 的正平衡點(diǎn)為不穩(wěn)定焦點(diǎn).
三循環(huán)優(yōu)勢(shì)系統(tǒng)1 具有收益矩陣
做負(fù)變換有收益矩陣
滿(mǎn)足引理3 中條件1).因此三循環(huán)優(yōu)勢(shì)系統(tǒng)1 做負(fù)變換后是全局穩(wěn)定的,原系統(tǒng)1 除正平衡點(diǎn)外異宿環(huán)全局吸引的.由此可知:當(dāng)時(shí),三循環(huán)優(yōu)勢(shì)系統(tǒng)2、8、9、10、11 存在中心,三循環(huán)優(yōu)勢(shì)系統(tǒng)6、7 具有全局穩(wěn)定性,三循環(huán)優(yōu)勢(shì)系統(tǒng)1、3除正平衡點(diǎn)外異宿環(huán)全局吸引.同理,結(jié)合引理1 ~3,得到定理.
定理1在具有行為誤差的交替捐贈(zèng)博弈中,當(dāng)成本收益比k∈(0,1)不同取值時(shí),可以對(duì)具有正平衡點(diǎn)的三循環(huán)優(yōu)勢(shì)系統(tǒng)關(guān)于動(dòng)力學(xué)行為進(jìn)行完全分類(lèi),見(jiàn)表2 所示.對(duì)應(yīng)相圖如圖1 所示,其中空心表示不穩(wěn)定駐點(diǎn),實(shí)心表示穩(wěn)定駐點(diǎn).
圖1 三循環(huán)優(yōu)勢(shì)系統(tǒng)動(dòng)力學(xué)行為相圖Fig. 1 Phase diagram of dynamic behavior of three-cycle superior system
表2 具有行為誤差的交替捐贈(zèng)博弈中不同成本收益比三循環(huán)優(yōu)勢(shì)系統(tǒng)的完全分類(lèi)Tab. 2 A complete classification of three-cycle advantage systems with different cost-benefit ratios in an alternating donation game with behavioral errors
經(jīng)運(yùn)算得到了不同成本-收益比下交替捐贈(zèng)博弈中四循環(huán)優(yōu)勢(shì)系統(tǒng)的數(shù)量,下面將進(jìn)一步討論存在正平衡點(diǎn)的四循環(huán)優(yōu)勢(shì)系統(tǒng)的永久生存性.具有正平衡點(diǎn)的四循環(huán)優(yōu)勢(shì)系統(tǒng)如表3 所示.
表3 存在正平衡點(diǎn)的四循環(huán)優(yōu)勢(shì)系統(tǒng)Tab. 3 Four-cycle advantage systems with positive equilibriums
定義1[17]對(duì)于Sn上的復(fù)制方程
(4)式的永久生存性即存在 δ >0 使得對(duì)所有 i,只要 xi(0)>0,就有
對(duì)于(5)式永久生存性還需存在D,使得
引理 4[17]復(fù)制系統(tǒng)(1)為永久生存的,如果存在向量P∈int Sn使得
對(duì)所有駐點(diǎn)x∈bd Sn成立.
定理2具有收益矩陣
將邊界駐點(diǎn)分別帶入(8)式有:
又由 p1,p2,p3,p4>0,且 p1+p2+p3+p4=1,不等式可簡(jiǎn)化為等價(jià)形式:
其中,不等式4)~6)恒成立.因此驗(yàn)證系統(tǒng)的永久生存性只需適當(dāng)?shù)娜∠蛄縋使其滿(mǎn)足不等式1)~3)即可.令則滿(mǎn)足P的所有限制條件,故存在向量P 使得(8)式成立,得證.
系統(tǒng)[S0,S7,S14,S10]具有收益矩陣:
將其邊界駐點(diǎn)帶入(8)式有:
又P∈int Sn,即P是非負(fù)的,與1)矛盾.由此,該系統(tǒng)不滿(mǎn)足永久生存性的充分條件.同理,可驗(yàn)證存在正平衡點(diǎn)的四循環(huán)優(yōu)勢(shì)系統(tǒng)的永久生存性,從而定理2 得證.
在第二節(jié)中是以交替捐贈(zèng)博弈為背景展開(kāi)討論的,接下來(lái)在更一般的交替囚徒困境中討論極限環(huán)的存在性和穩(wěn)定性.
在雙人博弈中若收益關(guān)系滿(mǎn)足:S <0,S < P <R <T 和 T+S <2R,則稱(chēng)為囚徒困境.
考慮具有收益矩陣
的復(fù)制系統(tǒng),由 n 維復(fù)制系統(tǒng)與 n -1 維Lotka -Volterra系統(tǒng)的等價(jià)性,具有收益矩陣(11)的復(fù)制系統(tǒng)相對(duì)應(yīng)的Lotka-Volterra系統(tǒng)為:
假設(shè)正平衡點(diǎn)存在,則
下面給出本文的主要結(jié)果.
定理3具有收益矩陣(11)的四循環(huán)系統(tǒng)(1)如果有正平衡點(diǎn),則當(dāng)參數(shù)適當(dāng)選取時(shí),至少存在一個(gè)不穩(wěn)定的極限環(huán).
又根據(jù)高(n)維系統(tǒng)構(gòu)造極限環(huán)的一般降維原理,系統(tǒng)線(xiàn)性部分在正平衡點(diǎn)處的特征值具有非正實(shí)部,且需 n -2 個(gè)負(fù)實(shí)部.對(duì)此問(wèn)題可由(14)式保證:
又(13)和(14)式等價(jià)于
在(15)式條件下,令
則系統(tǒng)的收益矩陣變換為
(16)式具有一個(gè)負(fù)特征值和一對(duì)共軛純虛根特征值[18]當(dāng)且僅當(dāng)
即
對(duì)系數(shù)矩陣(16)做變換 y = Tx,
fij、gij是關(guān)于R 的高次多項(xiàng)式,則變換后系統(tǒng)線(xiàn)性部分具有以下形式
其中aij是關(guān)于R 的高次多項(xiàng)式.變換后的線(xiàn)性系統(tǒng)有一對(duì)共軛純虛特征值和一個(gè)負(fù)實(shí)特征值,現(xiàn)計(jì)算局部中心流形 y3= h(y1,y2).
將 y3= h(y1,y2)展開(kāi)為
并代入不變流形[3]所滿(mǎn)足的方程求得一階焦點(diǎn)量
其中,f1、f2、g1、g2、g3、g4分別是 6、90、31、8、20、9項(xiàng)的多項(xiàng)式.
為得到小擾動(dòng)極限環(huán),需在滿(mǎn)足(17)式的條件下判斷一階焦點(diǎn)量的正負(fù)性.又(17)式精確到10-100的 3 個(gè)區(qū)間形式解分別為[a1,b1]、[a2,b2]、[a3,b3],其中分?jǐn)?shù)a2、a3的分子分母分別是長(zhǎng)度為103、101 位的整數(shù),分?jǐn)?shù)b2、b3的分子分母是長(zhǎng)度為103 和102 位的整數(shù).又(17)式與L1的分子分母的結(jié)式都不為零,因而與L1的分子分母都無(wú)公根.即在條件(17)下L1分子分母的所有因子都不為零,故判斷L1的正負(fù)性只需通過(guò)判斷非平方因子f1、f2、g1的正負(fù)性即可.
利用實(shí)根分離算法[18]的極大極小多項(xiàng)式方法有
即當(dāng) R 在區(qū)間[a1,b1]上時(shí),L1<0.同理可得:
f1|[a2,b2]> 0, f2|[a2,b2]< 0, g1|[a2,b2]> 0,f1|[a3,b3]> 0, f2|[a3,b3]< 0, g1|[a3,b3]> 0.因此,當(dāng) R∈[a2,b2]或 R∈[a3,b3]時(shí),L1> 0.由Hopf分支[19]可判定 Lotka-Volterra 系統(tǒng)(12)存在不穩(wěn)定極限環(huán),再由具有收益矩陣(11)的復(fù)制系統(tǒng)與Lotka-Volterra系統(tǒng)(12)的同胚性定理3 成立.
四川師范大學(xué)學(xué)報(bào)(自然科學(xué)版)2020年6期