王盼盼, 南江霞,2, 關(guān) 晶
(1.桂林電子科技大學(xué) 數(shù)學(xué)與計(jì)算科學(xué)學(xué)院,廣西 桂林 541004;2.桂林電子科技大學(xué) 廣西高校數(shù)據(jù)分析與計(jì)算重點(diǎn)實(shí)驗(yàn)室,廣西 桂林 541004)
企業(yè)戰(zhàn)略聯(lián)盟是2個(gè)或2個(gè)以上的經(jīng)濟(jì)實(shí)體為了實(shí)現(xiàn)特定的戰(zhàn)略目標(biāo)而采取的任何股權(quán)或非股權(quán)形式的共擔(dān)風(fēng)險(xiǎn)、共享利益的長期聯(lián)合與合作協(xié)議。競爭公司往往為了達(dá)到各自的戰(zhàn)略目標(biāo),在增加收益的同時(shí)減少風(fēng)險(xiǎn)、充分利用寶貴資源等3個(gè)目標(biāo)走向聯(lián)盟的道路。企業(yè)之間往往存在競爭與合作共存的狀態(tài)。如2018年4月9日,橙家與蘇寧易購正式宣布展開戰(zhàn)略合作[1],雙方擬攜手解決“整裝+家電”難題。一方是依托碧桂園集團(tuán)優(yōu)勢資源,打造出業(yè)內(nèi)最短30天工期、單月營收突破1億的快時(shí)尚家居領(lǐng)導(dǎo)品牌;另一方是在家電行業(yè)深耕28年的中國智慧零售巨頭。此次橙家與蘇寧雙方強(qiáng)強(qiáng)聯(lián)手,標(biāo)志著家裝產(chǎn)品與家電資源樞紐被打通,家裝家電被整體打包。此次聯(lián)姻讓橙家與蘇寧構(gòu)建家裝效率生態(tài)聯(lián)盟,讓雙方得以優(yōu)勢互補(bǔ)、資源共享。一方面,家裝生態(tài)鏈打通前中后端,推進(jìn)蘇寧易購家裝智慧零售領(lǐng)域布局;另一方面,橙家效率再提速,進(jìn)一步為用戶一站式解決裝修問題。聯(lián)盟可以創(chuàng)造出更多的收益,利益的分配又取決于聯(lián)盟的策略選擇,
在橙家與蘇寧易購展開戰(zhàn)略合作的例子中,既有策略的選擇又有利益的分配,這種企業(yè)戰(zhàn)略聯(lián)盟問題實(shí)質(zhì)上是既有競爭又有合作的博弈問題。為解決此類博弈問題,Brandenburger和Stuart[2]提出了Biform game的概念,稱為非合作-合作兩型博弈。該類博弈分為2個(gè)階段:第一階段,局中人選取策略,形成策略組合,但策略組合并不能直接產(chǎn)生支付,而是形成第二階段的競爭環(huán)境,為非合作博弈階段;第二階段,在第一階段的策略組合下合作并進(jìn)行利益分配,為合作博弈階段。把合作博弈的解作為非合作博弈的支付值,最終轉(zhuǎn)化為多人非合作博弈求解問題。目前,一些研究者對(duì)非合作-合作兩型博弈進(jìn)行了應(yīng)用研究。Stuart[3]運(yùn)用非合作-合作兩型博弈模型研究價(jià)格競爭下的報(bào)童問題。Plambeck和Taylor[4]運(yùn)用非合作-合作兩型博弈研究原始設(shè)備制造商(OEM)和合同制造商(CM)之間的投資博弈問題。Feess和Thun[5]用非合作-合作兩型博弈模型分析生產(chǎn)鏈上存在的策略選擇和收益分配問題。Anupindi等[6]運(yùn)用非合作-合作兩型博弈的方法研究由N個(gè)零售商和W個(gè)倉庫所構(gòu)成的配送系統(tǒng)在各零售商獨(dú)立決策情況下的庫存和轉(zhuǎn)運(yùn)決策問題。Fandel和Trockel[7]利用非合作-合作兩型博弈,第一次嘗試在供應(yīng)鏈中將2家公司的訂單決定和庫存結(jié)合。通過查閱文獻(xiàn)發(fā)現(xiàn)非合作-合作兩型博弈的相關(guān)研究文獻(xiàn)匱乏。而對(duì)于局中人數(shù)大于兩人的非合作博弈的均衡點(diǎn)的求解是一個(gè)十分困難的問題,目前尚未有適用于一般性博弈問題均衡點(diǎn)的計(jì)算方法。但對(duì)于兩人的非合作博弈,能夠給出非常有效的計(jì)算方法。因此,對(duì)兩人非合作-合作兩型博弈進(jìn)行了深入研究,且得到較好的效果。
首先給出雙矩陣博弈的概念。
定義1[8]在博弈G=[N,{Si},{Pi}]中,若滿足:1) 只有2個(gè)局中人,即N={1,2};2) 策略集有限,即S1={α1,α2,…,αm},S2={β1,β2,…,βn}。對(duì)任意的策略組合(αi,βj),記支付函數(shù)P1(αi,βj)=aij,P2(αi,βj)=bij,得到局中人1和局中人2的支付矩陣分別為A和B,此類博弈稱為雙矩陣博弈,簡記為(A,B)。
雙矩陣博弈的解為其納什均衡點(diǎn),但大多數(shù)雙矩陣博弈純策略納什均衡點(diǎn)不存在,因此,下面給出混合策略及混合策略納什均衡點(diǎn)的定義。
定義2[8]若局中人1和局中人2的策略集分別為
S1={α1,α2,…,αm},
S2={β1,β2,…,βn},
則局中人1和局中人2的混合策略分別為
Xm={x=(x1,x2,…,xm),|xi≥0,
Yn={y=(y1,y2,…,yn),|yi≥0,
即局中人1對(duì)每個(gè)純策略αi以概率xi進(jìn)行選擇,則x=(x1,x2,…,xm)稱為局中人1的一個(gè)混合策略。特別地,若存在一個(gè)xi=1,則混合策略為一個(gè)純策略;同理,局中人2對(duì)每個(gè)純策略βi以概率yi進(jìn)行選擇,則y=(y1,y2,…,yn)稱為局中人2的一個(gè)混合策略。特別地,若存在一個(gè)yi=1,則混合策略為一個(gè)純策略。
若取混合策略組合(x,y)∈Xm×Yn,則局中人1和局中人2的期望收益值分別為
定義3[8]設(shè)有一局勢為(x*,y*),若對(duì)局中人1和局中人2的所有混合策略 (x,y)∈Xm×Yn都滿足
xTAy*≤x*TAy*,
x*TBy≤x*TBy*,
則稱(x*,y*)為雙矩陣博弈(A,B)的混合策略納什均衡點(diǎn),x*,y*分別為納什均衡策略,并稱u*=x*TAy*與v*=x*TBy*分別為局中人1和局中人2的均衡值。
目前,為了獲得更多的利益,個(gè)個(gè)企業(yè)選擇聯(lián)盟,但每個(gè)企業(yè)選擇的策略不同又會(huì)影響到整個(gè)聯(lián)盟的收益,此類博弈既有策略的選擇又有利益的分配。為解決此類博弈問題, Brandenburger等[2]提出了Biform game的概念,其定義如下。
定義4[2]設(shè)局中人集合為N={1,2},ρ(N)為集合N的冪集,兩人非合作-合作兩型博弈表示為
(S1,S2;V;α1,α2)。
其中:
1)對(duì)任意局中人i∈N,S1,S2分別為局中人1和局中人2的策略集;
2)在策略組合(αi,βj)∈S1×S2下,(i=1,2,…,m;j=1,2,…,n),V是一個(gè)映射,即,V(αi,βj):ρ(N)→R,對(duì)于每個(gè)A?N,V(αi,βj)(A)表示當(dāng)局中人選擇策略組合(αi,βj)時(shí),由某些局中人組成的聯(lián)盟A所創(chuàng)造的該聯(lián)盟的總價(jià)值,且對(duì)于任何策略組合(αi,βj)∈S1×S2,均有V(αi,βj)(φ)=0;
3)對(duì)于任意局中人i∈N,0≤αi≤1,αi為局中人i的信心指數(shù)。
用Shapley值求解合作博弈的解,其定義如下。
定義5[9]在兩人合作博弈V(αi,βj)(N)中,Shapley值是n維向量:
φ(αi,βj)(N)=(φ1(αi,βj)(N),φ2(αi,βj)(N))。
其中,對(duì)任意的局中人i∈N,有
φi(αi,βj)(N)=
[V(αi,βj)(T)-V(αi,βj)(T{i})],
稱為局中人i在合作博弈V(αi,βj)(N)中的分配值,|T|表示為聯(lián)盟T中局中人個(gè)數(shù),
表示聯(lián)盟T出現(xiàn)的概率。
V(αi,βj)(T)-V(αi,βj)(T{i})
表示局中人i對(duì)聯(lián)盟T的邊際貢獻(xiàn)。
兩人非合作-合作兩型博弈的解是應(yīng)用合作博弈相關(guān)理論求解每個(gè)策略組合下的解,然后運(yùn)用非合作博弈理論求解納什均衡,最后得到的納什均衡,稱為兩人非合作-合作兩型博弈的解,其定義如下。
定義6在兩人非合作-合作兩型博弈(Xm,Yn,;V;α1,α2)中,若存在策略組合(x*,y*)∈Xm×Yn,使得每一個(gè)局中人i∈N,對(duì)任意的(x,y)∈Xm×Yn都有
(1)
其中,φ1、φ2分別為局中人1和局中人2在第一階段用Shapley值求解得到的支付矩陣,則稱(x*,y*)是混合策略納什均衡點(diǎn),對(duì)應(yīng)的納什均衡值x*Tφ1y*和x*Tφ2y*為局中人1和局中人2在策略組合(x*,y*)下的收益值,兩人非合作-合作兩型博弈的解記為{(x*,y*);x*Tφ1y*,x*Tφ2y*}。
兩人非合作-合作兩型博弈解,其求解步驟為:
1)對(duì)于任意的策略組合(αi,βj)下,得到一個(gè)合作博弈V(αi,βj)(N),用Shapley值求解每個(gè)策略組合下的合作博弈V(αi,βj)(N)的解,得到在每個(gè)策略局勢下的局中人i(i=1,2)的分配值;
2)對(duì)于每個(gè)策略組合(αi,βj),將第一步得到的局中人i(i=1,2)分配作為非合作博弈的支付值,構(gòu)成非合作博弈,求解非合作博弈的納什均衡解。
根據(jù)兩人非合作-合作兩型博弈的求解步驟,該類博弈的求解最終轉(zhuǎn)化為雙矩陣博弈的納什均衡解問題,由文獻(xiàn)[10]可得到兩人非合作-合作兩型博弈最優(yōu)解的存在的充分必要條件。
定理1策略組合(x*,y*)為兩人非合作-合作兩型博弈解的充分必要條件是(x*T,y*T,u*,v*)為雙線性規(guī)劃
(2)
的最優(yōu)解。其中:em、en為m維和n維單位向量;u、v分別為局中人1和局中人2的期望收益值。
證明由雙線性規(guī)劃式(2)的約束條件立即可得
xTφ1y+xTφ2y+u+v≤0。
(3)
這表示雙線性規(guī)劃式(2)目標(biāo)函數(shù)是非正的,即最大值為0。
設(shè)局勢(x*,y*)為兩人非合作- 合作兩型博弈解,則
(4)
由定義3可知,(x*T,y*T,u*,v*)為雙線性規(guī)劃式(2)的最優(yōu)解。
反之,設(shè)(x*T,y*T,u*,v*)為雙線性規(guī)劃式(2)的最優(yōu)解,由式(3)可知
x*Tφ1y*+x*Tφ2y*+u*+v*=0。
(5)
設(shè)(x,y)∈Xm×Yn為局中人1和局中人2的策略,則xTem=1,yTen=1,且
(6)
特別地,可有
x*Tφ1y*≤-u*,x*Tφ2y*≤-v*。
利用式(5)可得
x*Tφ1y*=-u*,x*Tφ2y*=-v*。
再利用式(6)可得
由定義6可知,策略局勢(x*,y*)兩人非合作-合作兩型博弈解。
此定理說明只要雙線性目標(biāo)規(guī)劃有解,則兩人非合作-合作兩型博弈一定有解,利用Matlab軟件求解雙線性目標(biāo)規(guī)劃,則可得到兩人非合作-合作兩型博弈的解。
例1現(xiàn)有兩家企業(yè)1和企業(yè)2,他們做出各自的生產(chǎn)計(jì)劃并同時(shí)宣布。假定每個(gè)企業(yè)都有3個(gè)可供選擇的生產(chǎn)計(jì)劃方案,分別記企業(yè)1和企業(yè)2的策略集S1=(α1,α2,α3),S2=(β1,β2,β3),則9個(gè)局勢下的收益函數(shù),如表1所示。
表1 不同局勢下合作博弈的特征函數(shù)
用Shapley值求解,可得不同局勢下合作博弈的解如表2所示。
表2 不同局勢下合作博弈的解
由定理1求其混合策略納什均衡策略,利用Matlab軟件求解,可得混合策略為{(0,0.33,0.67),(0.33,0.67,0)},納什均衡值為(5.83;6.17),即,企業(yè)1以0.33的概率選擇α2和0.67的概率選擇α3且企業(yè)人2以0.33的概率選擇β1和0.67的概率選擇β2時(shí)收益最大,企業(yè)1的最大期望收益為5.83,企業(yè)2的期望收益為6.17。則例1的解為{(0,0.33,0.67),(0.33,0.67,0);5.83,6.17}。
兩人非合作-合作兩型博弈解決了一類簡單的合作與競爭共存的博弈,即參與人只有兩個(gè),其策略可以有很多,這樣的情況在現(xiàn)實(shí)中也是比較常見的,因?yàn)閮扇说姆呛献鞑┺那蠼獗容^方便,對(duì)于多于兩人的非合作博弈沒有一般的解決方法。創(chuàng)新點(diǎn)為1)對(duì)兩人非合作-合作兩型博弈的特征函數(shù)不用滿足文獻(xiàn)[2]中的加總性,無外部性,不相關(guān)性等條件即可存在解,因此拓展了模型的適用范圍。2)用Shapley值求解,避免了文獻(xiàn)[2]中核心不存在和核心為空的情況。