[摘要]博弈論是研究決策行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問題。一般認(rèn)為,博弈論始于1944年馮諾依曼和摩根斯坦恩合作的《博弈論和經(jīng)濟(jì)行為》。本文借助博弈論的相關(guān)理論,分析圍繞皇權(quán)交接時(shí)三種勢(shì)力集團(tuán)的行動(dòng),當(dāng)達(dá)到均衡時(shí)的各勢(shì)力集團(tuán)的策略,解釋歷史存在相似的原因。
[關(guān)鍵詞]博弈;皇權(quán);勢(shì)力
引言
博弈論,英文又為game theory,指當(dāng)一個(gè)主體,好比說一個(gè)人或一個(gè)企業(yè)的選擇受到其他人、企業(yè)選擇的影響,而反過來影響到其他人與企業(yè)選擇時(shí)的決策問題和均衡問題。博弈論問世之前,我國古人在處理人際、戰(zhàn)爭、對(duì)弈游戲時(shí)不自覺地用博弈論的原則,創(chuàng)造了一些較基礎(chǔ)的歷史規(guī)則,即我們常說的“謀略”等。
一、相關(guān)理論研究
(一)中國古代官僚政治制度
本文要用博弈來研究皇權(quán)交迭,簡要闡述一下中國古代官僚政治制度,這是皇權(quán)政治賴以運(yùn)行的基礎(chǔ)。
中國古代封建貴族政治基于宗法血緣,權(quán)力層層分散在各級(jí)貴族手中,一度貴族制度盛行,到后代王朝強(qiáng)調(diào)軍功淡化世襲身份,開始向官僚制轉(zhuǎn)化[1]。西漢至南北朝時(shí)皇權(quán)始終依托于當(dāng)時(shí)最有勢(shì)力的集團(tuán)或階層,依靠他們進(jìn)行統(tǒng)治,世族擔(dān)任宰相和高官,皇帝總要和貴族豪強(qiáng)勢(shì)力聯(lián)姻,以加強(qiáng)和他們的聯(lián)系,皇后的廢立是國家大事,外戚干政也在這種背景下產(chǎn)生;及至唐高宗李治立武則天為后才把皇后廢立作為“家事”處理。隨著科舉制度的興起,一批寒窗苦讀的學(xué)生朝為田舍郎暮登天子堂,以及政府機(jī)構(gòu)按職能分工不斷加以調(diào)整,讀書人寒門子弟出將拜相增多,他們接近甚至可以觸摸到皇權(quán)樞紐。當(dāng)接觸到皇權(quán)的人參和進(jìn)皇權(quán)交接,從而歸納出幾方勢(shì)力,并用博弈論解釋皇權(quán)更迭時(shí)各種勢(shì)力的選擇。
(二)博弈論的幾個(gè)概念
1.參與人:指一個(gè)決策主體,他的目的是通過選擇行動(dòng)以最大化自己的支付水平,記作i=1,2,…,n;在博弈論中自然(nature)作為“虛擬參與人”來處理,記作N。
2.信息:特別是有關(guān)自然的選擇,其他參與人的特性和行動(dòng)的知識(shí)。下面提出兩個(gè)相關(guān)概念:
①完全信息指自然首先行動(dòng)或自然的初始行動(dòng)被參與人準(zhǔn)確觀察到的情況,沒有實(shí)現(xiàn)的不確定性;
②完美信息指一個(gè)參與人對(duì)其他的參與人,包括自然的行動(dòng)有準(zhǔn)確了解的情況,即每一個(gè)信息集只包含一個(gè)值,不完全信息意味著不完美信息,反之不成立。
3.戰(zhàn)略:是參與人在給定信息集的情況下的行動(dòng)規(guī)則,它規(guī)定參與人在什么時(shí)候選擇什么行動(dòng),用Si表示第i個(gè)參與人的一個(gè)特定戰(zhàn)略。Si={si}代表第i個(gè)參與人可選擇的戰(zhàn)略集合。
4.支付:指參與人得到期望效用水平,用u表示。
5.均衡:指所有參與人的最優(yōu)戰(zhàn)略組合。
6.動(dòng)態(tài)博弈表示法:動(dòng)態(tài)博弈各方的選擇行為又稱先后次序,每個(gè)參與人的選擇行為會(huì)形成聯(lián)系的時(shí)間階段,因此動(dòng)態(tài)博弈中一個(gè)參與人的一次選擇常稱為一個(gè)階段[2]。動(dòng)態(tài)博弈中也可能參與人同時(shí)選擇的情況,這時(shí)這些參與人同時(shí)選擇構(gòu)成一個(gè)階段,一個(gè)動(dòng)態(tài)博弈至少兩階段。例:一個(gè)完全且完美信息動(dòng)態(tài)博弈,首先參與人1行動(dòng),參與人2先觀察到參與人1的行動(dòng),然后2行動(dòng)。
7.逆推歸納法:指從動(dòng)態(tài)博弈的最后一個(gè)階段開始分析,每一次確定出所分析博弈方的選擇和路徑,然后再確定前一個(gè)階段的博弈方的選擇和路徑。
二、皇權(quán)周圍兩勢(shì)力模型
(一)圍繞皇權(quán)的三種勢(shì)力集團(tuán)
首先介紹皇權(quán)周圍三種勢(shì)力集團(tuán),前文中對(duì)我國古代官僚政治制度分析中已有涉及,歸納如下:
1.重臣:講求門閥時(shí),皇帝多與豪門貴族聯(lián)姻,重臣有外戚一類。隋唐后規(guī)定應(yīng)試者不受門第限制,幾乎所有人都能帶著證明自己身份清白的材料報(bào)考,庶族學(xué)子有望飛黃騰達(dá),重臣中因此包含通過科舉走上仕途的人。
2.嬪妃及子嗣:嬪妃是靠近權(quán)力的內(nèi)闈女子,皇權(quán)更迭她們的力量不可或缺。
3.宦官是特殊群體,有異于常人的生理特征,還具有不同普通官吏的特殊身份。明太祖評(píng)價(jià)宦官認(rèn)為:他們朝夕在人君左右,出入起居之際。聲音笑貌……皆足以固結(jié)君心。茍一為所惑而不之省,將必假威服竊權(quán)威,以干政事。[3]可以看出宦官干政的情勢(shì)。
(二)模型的前提假設(shè)
1.經(jīng)濟(jì)人假設(shè)。重臣、宦官、嬪妃目標(biāo)一致,即利益最大化。重臣目的是借助皇權(quán)得到更多的好處,有詩可證:明朝戚繼光《馬上行》“南北驅(qū)馳報(bào)主情,江花邊月笑平生?!盵4]重臣利益最大化是出將拜相;嬪妃目的是讓其子嗣繼承皇位,先排除武則天的特例;宦官目的是把持權(quán)力斂財(cái),使其畸形欲望得到滿足;
2.完全且完美信息;
3.皇帝僅為自然(N)收益忽略;
4.模型僅兩位嬪妃甲乙和一名宦官或重臣,且甲乙沒有地位差別,兩人各有一名皇子;
5.甲乙二人都有極強(qiáng)的報(bào)復(fù)心理,對(duì)宦官或重臣具有威脅;
因甲乙均具有威脅,所以宦官或重臣必做非此即彼的選擇,無法選擇觀望。
以宦官為例:
①參與人:嬪妃甲,定義為1;宦官,定義為2;I=2;
②策略空間:S1={L,R},其中L:拉攏宦官、R:不拉攏宦官;S2={L1,L2},L1:接受拉攏且甲之子取得皇權(quán)、L2:不被拉攏且甲之子取得皇權(quán);
③收益函數(shù):u1(L,L1)=1,u1(L,L2)=1,u1(R,L2)=1
u2(L,L1)=1,u2(L,L2)=-2,u2(R,L2)=0
宦官觀察嬪妃甲的行為:若甲選擇策略L,宦官有收益-2的威脅,應(yīng)該選擇策略L1;若甲選擇策略R,宦官應(yīng)該選擇策略L2,即采取觀望態(tài)度。
現(xiàn)實(shí)中拉攏宦官的嬪妃不止甲一人,宦官一旦支持對(duì)了人就有1的收益,收益增加的誘惑很難抗拒。因此經(jīng)濟(jì)人不會(huì)觀望中立,他還會(huì)竭力避免-2收益的風(fēng)險(xiǎn),故宦官需更多信息判斷哪位皇子成功,綜上宦官必做出非此即彼的選擇,若把宦官換成重臣亦然。
(三)皇權(quán)周圍兩勢(shì)力模型
1.參與人:宦官,定義為1;嬪妃甲,定義為2;I=3,包括N(皇帝);
2.策略空間:S1={L,R},其中L:巴結(jié)嬪妃甲、R:巴結(jié)嬪妃乙;S2={L1,L2},其中L1:甲之子取得皇權(quán)、L2:乙之子取得皇權(quán);
3.收益函數(shù):u1(L,L1)=1,u1(L,L2)=-2,u1(R,L1)=-2,u1(R,L2)=1
u2(L,L1)=1,u2(L,L2)=-1,u2(R,L2)=1,u2(R,L2)=-1
逆推歸納法:嬪妃甲有收益最大策略L1,宦官觀察甲的策略選擇為L1,宦官收益最大化選擇L,納什均衡為(1,1),即宦官巴結(jié)嬪妃,甲盡力讓自己兒子取得皇位,這是雙贏組合?;鹿僖苊馐找?2的風(fēng)險(xiǎn),他定要得到更多信息,如甲家族政治實(shí)力、皇帝對(duì)甲的寵愛程度、皇太后的意見等,以確保自身收益。若參與人由宦官換成重臣,納什均衡同樣為(1,1)。
歷史上與本模型擬合事件眾多,僅舉兩個(gè)事例:一是(東漢末年)靈帝,何皇后生子辯,王美人生子協(xié),董太后自養(yǎng)之。群臣請(qǐng)立太子,帝以辯輕佻無威儀欲立協(xié),猶預(yù)未決。會(huì)疾篤,屬協(xié)于蹇碩。靈帝崩,碩時(shí)在內(nèi),欲先誅何進(jìn)而立協(xié),然事敗反被何進(jìn)誅殺。蹇碩為宦官參與廢立大事,判斷形勢(shì)不足賠了性命。
另明憲宗朱見深專寵萬貴妃。萬氏有孕后,“帝后宮生子漸多,(梁)芳等懼太子將立,勸帝易儲(chǔ)”[5]以致皇帝一度萌生廢立想法。
歷朝歷代皇權(quán)更迭時(shí),許多人行為會(huì)不自覺遵循博弈論。
三、皇權(quán)周圍三勢(shì)力模型
當(dāng)把宦官和重臣同時(shí)考慮,這是兩種勢(shì)力模型的擴(kuò)展,當(dāng)加上重臣勢(shì)力集團(tuán),應(yīng)考慮重臣在宦官和嬪妃勾結(jié)情況下的選擇。首先三種勢(shì)力中重臣和宦官這兩種勢(shì)力集團(tuán)的選擇是相關(guān)關(guān)系,其次討論重臣要排除外戚這種情況。
(一)三種勢(shì)力模型的前提假設(shè)
1.經(jīng)濟(jì)人假設(shè)。無論是重臣、宦官、嬪妃目標(biāo)一致,即利益最大化;
2.完全且完美信息;
3.皇帝僅為自然(N)收益忽略;
4.模型僅甲乙兩位嬪妃、一名宦官和一名重臣,且甲乙沒有地位差別,兩人各有一名皇子;
5.甲乙二人都有極強(qiáng)的報(bào)復(fù)心理,對(duì)宦官及重臣都有威脅。
(二)皇權(quán)周圍三勢(shì)力模型
1.參與人:宦官,定義為1;重臣,定義為2;甲,定義為3;乙,定義為4;I=5,包括N(皇帝);
2.策略空間:S1={L,R},其中L:巴結(jié)嬪妃甲、R:巴結(jié)嬪妃乙;S2={L1,L2},其中L1:支持甲之子取得皇權(quán)、L2:支持乙之子取得皇權(quán);S3={M,N}、S4={N,M},其中M:甲之子取得皇權(quán)、N:乙之子取得皇權(quán);
3.收益函數(shù):u1(L,L1,M)=1,u1(L,L1,N)=-2,u1(L,L2,M)=1,u1(L,L2,N)=-2,u1(R,L1,M)=-2,u1(R,L1,N)=-2,u1(R,L2,M)=1,u1(R,L2,N)=-2;
u2(L,L1,M)=1,u2(L,L1,N)=-2,u2(L,L2,M)=-2,u2(L,L2,N)=1,
u2(R,L1,M)=1,u2(R,L1,N)=-2,u2(R,L2,M)=-2,u2(R,L2,N)=1;
u3(L,L1,M)=1,u3(L,L1,N)=-1,u3(L,L2,M)=1,u3(L,L2,N)=-1,
u3(R,L1,M)=1,u3(R,L1,N)=-1,u3(R,L2,M)=1,u3(R,L2,N)=-1;
U4(L,L1,M)=-1,u4(L,L1,N)=1,u4(L,L2,M)=-1,u4(L,L2,N)=1,
u4(R,L1,M)=-1,u4(R,L1,N)=1,u4(R,L2,M)=-1,u4(R,L2,N)=1。
逆推歸納法:嬪妃甲選擇收益最大策略為M,重臣觀察甲的選擇,為收益最大必選擇L1,宦官也隨之選擇L;同樣?jì)邋視?huì)選擇收益最大策略N,重臣觀察乙必選擇L2,宦官隨之選擇R。宦官選擇巴結(jié)哪位后宮嬪妃,他需要考慮多種因素,重臣能夠觀察到宦官的選擇和公共信息,也需要更詳實(shí)的信息確保不因選擇錯(cuò)誤而付出慘痛代價(jià)。
由于臣子信息不如宦官直接,掌握信息結(jié)成“朋黨”是經(jīng)濟(jì)人的天性。清雍正帝最痛恨“朋黨”,他認(rèn)為“(歐陽)修之所謂道(朋黨)……亦小人之道耳?!盵6]
其實(shí)三勢(shì)力模型仍不完整,尚未考慮外戚的情況。外戚作為帝王母親、妻子方面的親戚,與單純以科舉或其他方法進(jìn)入官場(chǎng)的人不同,家族利益維系他們與嬪妃及皇子們的關(guān)系,外戚勢(shì)力強(qiáng)弱應(yīng)是宦官考慮巴結(jié)誰的重要方面。
四、完全不完美信息動(dòng)態(tài)博弈
歷史上實(shí)際更多不完美信息的動(dòng)態(tài)博弈。完全信息即皇帝N的選擇,皇帝的選擇在某種意義上是公共信息。封建社會(huì)的皇權(quán)無孔不入滲透到社會(huì)每個(gè)角落,古代規(guī)則中皇帝一舉一動(dòng)幾乎公開透明,而不完美信息的產(chǎn)生在重臣方面,士大夫等官吏臣僚經(jīng)常被皇帝不信任。只有宦官屬于家奴,是皇帝可親近依賴的,嬪妃們?nèi)缛襞c宦官勾結(jié),不一定為重臣所知。
把三勢(shì)力模型假設(shè)2變?yōu)橥耆煌昝佬畔?,得出?/p>
設(shè)宦官選擇S1={L}的概率為p,選擇S2={R}的概率為1-p;甲選擇S2={L1}的概率為q,選擇S2={L2}的概率為1-q。
1.參與人:宦官,定義為1;甲,定義為2;乙,定義為3;重臣,定義為4;I=5包括N;
2.策略空間:S1={L,R},其中L:巴結(jié)嬪妃甲、R:巴結(jié)嬪妃乙;S2={L1,L2},其中L1:甲之子取得皇權(quán)、L2:乙之子取得皇權(quán);S3={M,N},其中M:支持甲之子取得皇權(quán)、N:支持乙之子取得皇權(quán)。
重臣選擇S3={M}的收益為:u3=pq*1+p*(1-q)*(-2)=3pq-2p
重臣選擇S3={N}的收益為:u3=pq*(-2)+1*p*(1-q)=p-3pq
令u3=u3化簡得:3pq-2p=p-3pq
∵p>0 ∴q=1/2
若q<1/2,則u3 若q>1/2,則u3>u3 由于甲選擇L1的概率必為q=1,那么第三階段重臣選擇M收益較高,而第二階段中甲必選擇L1,所以第一階段宦官知道從甲選擇的子博弈均衡必然為L,意味著選擇L策略可獲得1收益,因此L是他的均衡策略,找到一個(gè)均衡策略組合{L,L1,M},如把甲換為乙有同樣的結(jié)果。 動(dòng)態(tài)模型說明宦官不能干政也不曾干政的王朝,依靠重臣,嬪妃的皇子們也能成功取得皇權(quán)。清康熙雍正皇位交接時(shí),隆科多成為康雍兩朝交接的關(guān)鍵人物。雍正帝皇權(quán)鞏固與隆科多手握兵權(quán)提督九門的權(quán)力是分不開的,故乾隆帝稱其為其父雍正帝的忠臣。 五、放寬模型的假設(shè) 以上的分析全部基于五個(gè)假設(shè): 1.經(jīng)濟(jì)人假設(shè)。無論是重臣、宦官、嬪妃目標(biāo)一致,即利益最大化; 2.假設(shè)完全且完美信息,后放寬為完全不完美信息; 3.皇帝僅為自然(N)收益忽略; 4.模型僅甲乙兩位嬪妃、一名宦官及一名重臣,且甲乙沒有地位差別,兩人各有一名皇子; 5.甲乙二人都有極強(qiáng)的報(bào)復(fù)心理,對(duì)宦官及重臣都具有威脅。 現(xiàn)其他假設(shè)不變,僅放寬假設(shè)1為:嬪妃的利益最大化包括她自己取得皇權(quán),即武則天掌權(quán)這種情況,也能被模型的結(jié)論解釋。作為歷史上唯一女皇,后來者雖沒有武則天的天時(shí)地利人和,但她給女性稱帝做了楷模。 六、結(jié)語 本文試圖用博弈論方法解釋歷史皇權(quán)更迭勢(shì)力集團(tuán)的選擇。假設(shè)中最關(guān)鍵是經(jīng)濟(jì)人假設(shè)。需說明如何解釋海瑞等層出不窮寧愿忤逆皇帝的強(qiáng)項(xiàng)之臣。自古讀書人離不開儒家思想義利觀,歷朝歷代以“君子”著稱的臣子都不愿如“小人”般蠅營狗茍,不一定完全符合經(jīng)濟(jì)人假設(shè)。 歷史也有不合模型的地方:明萬歷年間,皇帝本人成為批評(píng)的對(duì)象,進(jìn)諫的官員們對(duì)其私生活是否適當(dāng)提出疑問。雖然萬歷皇帝授予寵妃鄭氏貴妃封號(hào),卻無力使其子成為太子。因?yàn)闆]有朝臣或心腹幫他完成這件事情,反引起首輔申時(shí)行和王錫爵對(duì)他的懷疑。 參考文獻(xiàn): [1]吳宗國.中國古代官僚政治制度研究[M].北京:北京大學(xué)出版社.2004-11 [2]謝識(shí)予.經(jīng)濟(jì)博弈論(第四版)[M].上海:復(fù)旦大學(xué)出版社.2018-1 [4]王云瀚.閹宦[M].天津:百花文藝出版社.2005-1 [3]岳文強(qiáng),張善明.官德古詩詞選析[M].北京:藍(lán)天出版社.2002-5 [5][英]崔瑞德.[美]牟復(fù)禮.劍橋中國明代史(1368-1644年下)[M].楊品泉,譯.北京:中國社會(huì)科學(xué)出版社.2006-12 [6]劉潞,萬依,王樹卿.清代宮廷史[M].天津:百花文藝出版社.2004-1 作者簡介:仲晶昕(1984.12-),女,漢族,江蘇南通人,碩士,中級(jí)會(huì)計(jì)師,研究方向:財(cái)務(wù)分析。