“皇帝新裝”困境中博弈均衡的誘導機制及其治理研究

2018-03-26 09:45:06李盼道李雙雙

江蘇科技大學學報（社會科學版） 2018年1期

李盼道, 李雙雙

(德州學院歷史與社會管理學院,山東德州 253023)

《皇帝的新裝》是丹麥著名童話作家安徒生的代表作之一。整個故事以騙子建立的規(guī)則(任何愚蠢或不稱職的人都看不見新衣)為主線,講述了一個愚蠢的國王受兩個騙子的愚弄,光著身子舉行大典的滑稽鬧劇。不少國內(nèi)外學者從多個角度對這篇經(jīng)典童話進行了研究,眾多研究為人們?nèi)?、深入地理解這篇童話故事提供了有益參考。然而,其不足之處在于,截至目前尚未有一篇文章以《皇帝的新裝》中上自國王下至百姓,幾乎人人都選擇違背良心而稱贊新衣漂亮這一現(xiàn)象為線索,對“皇帝新裝”困境中博弈均衡的誘導機制進行研究?；诖?，筆者力圖運用博弈論的基本分析范式,通過分析參與主體之間的博弈行為及均衡結(jié)果的達成,以闡釋“皇帝新裝”困境中博弈均衡的誘導機制,并提出打破該“說謊的均衡”的治理對策。

博弈論是一門研究相互影響著的局中人進行策略選擇的行為科學[1]。根據(jù)博弈論的基本分析范式,從博弈的約束性條件出發(fā),可以將“皇帝新裝”困境中參與主體之間的博弈劃分為三種類型:完全信息靜態(tài)博弈、完全信息動態(tài)博弈、不完全信息動態(tài)博弈。筆者擬在不同類型的博弈狀態(tài)下,借助不同的分析方法,探討參與主體之間博弈行為及均衡結(jié)果的達成,闡釋“皇帝新裝”困境中博弈均衡的誘導機制。老大臣、官員、國王和群眾之間的博弈分析方法如表1所示。

表1 “皇帝新裝”困境中博弈均衡誘導機制的分析方法

一、“皇帝新裝”困境中博弈均衡的誘導機制分析

本部分中，筆者基于完全信息靜態(tài)博弈、完全信息動態(tài)博弈與不完全信息動態(tài)博弈三種博弈類型,采用不同的分析方法,對“誠實”的老大臣與官員之間、國王與文武百官和群眾之間以及群眾之間的博弈行為及均衡結(jié)果的達成進行分析,以闡釋“皇帝新裝”困境中博弈均衡的誘導機制。

(一) 基于完全信息靜態(tài)博弈的“誠實”老大臣與官員間的博弈

完全信息靜態(tài)博弈是指參與主體同時決策,且所有參與者對博弈中各種情況下的策略及收益都完全了解。但這里要求的“同時”并不意味著參與主體要在同一時刻一起行動,即使行動有先后順序,但只要保證每一位參與者在行動時并不知道其他參與者的行動,其效果仍等價于他們在同時行動[2]。本部分中，筆者通過建立博弈樹以及采用重復剔除嚴格劣戰(zhàn)略、有限次與無限次重復博弈等方法,對“誠實”的老大臣和官員之間的博弈行為及均衡結(jié)果的達成進行分析。

1. 基于博弈樹的老大臣與官員間的博弈及Nash均衡的達成

在行動之前,國王先后派出兩位大臣前去騙子那里了解新衣制作的情況,他們分別是“誠實”的老大臣(用字母A表示)和“誠實”的官員(用字母B表示)。游戲開始時,參與者A和B依次行動,且滿足參與者B行動時并不清楚參與者A的行動,然后依據(jù)兩位參與者策略選擇的特定組合決定每一位參與者的博弈結(jié)果(收益或損失)。建立如圖1所示的博弈樹對上述博弈問題進行描述。

圖1 老大臣與官員的博弈樹

由圖1可知,每一位參與者均有兩種可供選擇的戰(zhàn)略:說真話、說假話。在一組特定的戰(zhàn)略組合被選定后,兩人的收益均由圖1所示的博弈樹中列舉的相關(guān)字母來表示。需要說明的是,圖例中參與者A的收益放在兩個字母的最前面,參與者B的收益置于其后。在排除其他因素干擾的情況下,圖1中a、b、c、d的大小關(guān)系決定了參與者顯示何種偏好?，F(xiàn)在分析以下幾種情況:

(1) 當d>b、d>c、a>b、a>c時,若參與者A選擇說假話,參與者B也選擇說假話;若參與者A選擇說真話,參與者B則選擇說假話。此時該博弈存在唯一一個Nash均衡,即(說假話，說假話)。

(2) 當d>b、d>c、a>b、a

(3) 當d>b、d>c、a

(4) 當dc、a

(5) 當dc、a>b、a>c時,若參與者A選擇說假話,參與者B也選擇說假話;若參與者A選擇說真話,參與者B也選擇說真話。此時該博弈存在兩個Nash均衡,即(說假話，說假話)與(說真話，說真話)。

(6) 當db、a>c時,若參與者A選擇說假話,參與者B也選擇說假話;若參與者A選擇說真話,參與者B也選擇說真話。此時該博弈存在兩個Nash均衡,即(說假話，說假話)與(說真話，說真話)。

(7) 當dc、ac時,若參與者A選擇說假話,參與者B也選擇說假話;若參與者A選擇說真話,參與者B也選擇說真話。此時該博弈存在兩個Nash均衡,即(說假話，說假話)與(說真話，說真話)。

(8) 當db、a

(9) 當dc時,若參與者A選擇說假話,參與者B也選擇說假話;若參與者A選擇說真話,參與者B也選擇說真話。此時該博弈存在兩個Nash均衡,即(說假話，說假話)與(說真話，說真話)。

(10) 當d>b、db、a>c時,若參與者A選擇說假話,參與者B也選擇說假話;若參與者A選擇說真話,參與者B也選擇說真話。此時該博弈存在兩個Nash均衡,即(說假話，說假話)與(說真話，說真話)。

(11) 當d>b、db、a

(12) 當d>b、d

(13) 當d

由此可見,在排除其他因素干擾的情況下,a、b、c、d的大小關(guān)系(即參與者的效用)決定了博弈的結(jié)果。而在“皇帝新裝”困境中,所有的參與者都是在騙子建立的規(guī)則(看見新衣意味著稱職或聰明,看不見新衣意味著不稱職或愚蠢)下進行博弈的,這意味著參與者選擇說假話給自己帶來的效用總要大于選擇說真話,即a、b、c、d的大小關(guān)系滿足:a>b、d>c、a>c、d>b。通過上述分析不難知道，當a>b、d>c、a>c、d>b時,該博弈存在唯一一個Nash均衡,即(說假話，說假話)。結(jié)果也就出現(xiàn)了“誠實”的老大臣與官員都選擇說假話的現(xiàn)象。

2. 基于重復剔除嚴格劣戰(zhàn)略的老大臣與官員間的博弈及Nash均衡的達成

基于理性人不會選擇嚴格劣戰(zhàn)略這一基本決策的原則,我們可以運用“重復剔除嚴格劣戰(zhàn)略”的方法進一步求證(說假話,說假話)就是此博弈唯一的Nash均衡。

圖2 老大臣與官員博弈的雙變量矩陣

由圖2可知,參與者A和B均有兩種可供選擇的戰(zhàn)略:說真話、說假話。假定參與者A是理性的,他就可以把“說真話”從參與者B的戰(zhàn)略空間中剔除,即將圖2所示博弈視同圖3所示博弈。

在圖3中,對于參與者A來講,“說真話”相對于“說假話”來說依然是嚴格劣戰(zhàn)略。因此,假定參與者A是理性的,他是不會選擇說真話的。那么,如果參與者B知道參與者A是理性的,并且參與者B知道參與者A知道參與者B是理性的,參與者B就可以把“說真話”從參與者A的戰(zhàn)略空間中剔除,即將圖3所示博弈視同圖4所示博弈。

圖3 老大臣與官員博弈的雙變量矩陣

圖4 老大臣與官員博弈的雙變量矩陣

由圖4可知,(說假話，說假話)就是此博弈唯一一個Nash均衡,結(jié)果也就出現(xiàn)了“皇帝新裝”困境中“誠實”的老大臣與官員都顯示虛假偏好的現(xiàn)象。

3. 基于有限次與無限次重復博弈的老大臣與官員間的博弈

有限重復博弈就是階段博弈重復實施有限次[3]。先不妨令T=2,考慮如圖5所示的“誠實”的老大臣與官員間的博弈。

圖5 老大臣與官員博弈的雙變量矩陣

通過上文分析可知,在騙子建立的規(guī)則下,a、b、c、d的大小關(guān)系滿足:a>b、d>c、a>c、d>b,此時老大臣與官員的博弈存在唯一一個Nash均衡解(說假話，說假話)。假定將該博弈實施兩次,兩階段重復博弈中每一位參與者的效用等價于第一階段的效用加上δ倍的第二階段的效用(考慮到第二階段可能存在折扣因子δ)。借助后退歸納法,顯然第二階段博弈的唯一Nash均衡仍為(說假話，說假話),效用向量是(a，a)。因此,如果該博弈存在子博弈完美均衡解,其第二階段博弈的結(jié)果必定是(說假話，說假話),所得效用的現(xiàn)實值為(aδ，aδ)。無論子博弈完美中第一階段博弈的結(jié)果如何,該結(jié)果的效用向量加上(aδ，aδ)就是參與者的子博弈完美均衡效用。因此,可以在圖5的效用矩陣的各個結(jié)局中加上(aδ，aδ),得到如圖6所示的新效用矩陣。

圖6 參與者的子博弈完美均衡效用

圖6中的博弈也有四種結(jié)局,而每個任意結(jié)局(m，n)對應了兩個階段重復博弈的行動系列中的一個行動:{(m，n),(說假話，說假話)},相應于圖6中(m，n)的效用向量就是參與者在第二階段博弈中的所得。累次取優(yōu)法表明(說假話，說假話)是唯一的Nash均衡,因此也就得到了唯一的子博弈完美Nash均衡:{(說假話，說假話),(說假話，說假話)}。

兩階段重復博弈的上述結(jié)論很容易推廣到任意有限次重復博弈,其效用矩陣相當于把重復博弈的效用矩陣中各元素擴大到(a+aδ+aδ2+……+aδT)倍。而最新一次的博弈,其Nash均衡仍為(說假話，說假話)。這也就說明T階段重復博弈有唯一的子博弈完美Nash均衡:{(說假話，說假話),……,(說假話，說假話)}。

假設將這場博弈無限次地重復,(說假話、說假話)仍然是子博弈完美均衡。因為在每一次博弈中,在給定對手已取得均衡策略的條件下,沒有任何一位參與者會主動偏離均衡策略?；蛟S人們會認為,在無限水平博弈中,前一階段的博弈結(jié)果會影響到后面階段的選擇,而這里的子博弈完美Nash均衡的確是唯一一個具有這樣性質(zhì)的均衡:每一階段的行動并不會隨著以前階段所采取行動的變化而變化。

總之,通過以上對完全信息靜態(tài)博弈狀態(tài)下“誠實”的老大臣與官員的博弈行為及所產(chǎn)生的均衡結(jié)果的分析,筆者認為在排除其他因素干擾的情況下,參與者的效用決定了其究竟顯示何種偏好。換言之,“皇帝新裝”困境中誘使博弈群體顯示其虛假偏好的誘導機制是博弈效用中的參數(shù)。

(二) 基于完全信息動態(tài)博弈的國王與文武百官和群眾之間的博弈

完全信息動態(tài)博弈是指博弈中信息是完全的,但是行動有先后順序,后行動的參與者可以觀察到先行動的參與者的所有信息[4-5]。本部分中，筆者通過建立博弈樹,對國王與文武百官和群眾之間的博弈行為及均衡結(jié)果的達成進行分析。以國王與文武百官之間的博弈為例。

當國王帶著一幫特別圈定的文武百官親自到兩個狡猾的騙子那里了解新衣的制作情況時,此時國王與文武百官之間將進行一場博弈。需要說明的是,國王與文武百官之間的行動是有先后順序的,即國王(用1表示)首先行動,文武百官(用2表示)先觀察國王的行動,然后再行動,以此類推,直至博弈結(jié)束。建立如圖7所示的博弈樹,對上述博弈問題進行描述。

圖7 國王與文武百官之間的博弈樹

由圖7可知,國王有兩個純策略,S1={(說真話),(說假話)};文武百官有4個純策略,S2={(說真話，說真話),(說真話，說假話),(說假話，說真話),(說假話，說真話)}。依據(jù)國王與文武百官的純策略構(gòu)成純策略剖面如下:

(1) {說真話,(說真話，說真話)},路徑為(1,2(說真話),(b、b))。屬于文武百官的信息集有“說真話”與“說假話”2個,此處分別將它們記作2(說真話)與2(說假話),節(jié)點結(jié)以收益向量表示,指出該剖面的各參與者的收益,下同。

(2) {說真話,(說真話，說假話)},路徑為{1,2(說真話),(b、b)}。

(3) {說真話,(說假話、說真話)},路徑為{1,2(說假話),(c，d)}。

(4) {說真話,(說假話，說假話)},路徑為{1,2(說假話),(c，d)}。

(5) {說假話,(說真話，說真話)},路徑為{1,2(說真話),(d，c)}。

(6) {說假話,(說真話，說假話)},路徑為{1,2(說假話),(d，c)}。

(7) {說假話,(說假話，說真話)},路徑為{1,2(說真話),(a，a)}。

(8) {說假話,(說假話，說假話)},路徑為{1,2(說假話),(a，a)}。

從上述羅列的情況中能夠發(fā)現(xiàn),不同的純策略剖面可以有相同的路徑和結(jié)局,例如(1)與(2)、(5)與(7)等。上述8種情況可列成如圖8所示的盈利矩陣。

圖8 國王與文武百官之間的博弈

不難發(fā)現(xiàn),圖8相當于圖7展開型博弈的策略型表示。圖8蘊含著國王與文武百官在行動之前都會預先作出一個全面的應急計劃之意。例如，(說假話，說假話)可能就是文武百官考慮到國王“說假話”或“說真話”時他的一個反應,再加上(說真話，說真話)、(說真話，說假話)、(說假話，說真話),則使整場博弈中每一種應該考慮的可能情況全部被列入計劃。而本質(zhì)上，同樣的博弈表示成圖7那種展開形式,文武百官在決定自己究竟選擇“說假話”與“說真話”兩個行動中的哪一個時,要等到信息集h2(即參與者2在選擇行動前,他所了解的有關(guān)國王的行動)已獲得,然后依據(jù)h2=“說真話”還是h2=“說假話”再作出相應決策。對于國王來講,在騙子建立的規(guī)則下,考慮到a、b、c、d的大小關(guān)系滿足:a>b、d>c、a>c、d

總之,通過以上對完全信息動態(tài)博弈狀態(tài)下國王與文武百官之間的博弈行為及其所產(chǎn)生的均衡結(jié)果的分析,筆者認為，“皇帝新裝”困境中誘使博弈群體顯示其虛假偏好的誘導機制是博弈效用中的參數(shù)。

(三) 基于不完全信息動態(tài)博弈的群眾間的博弈

不完全信息動態(tài)博弈是指博弈中的每一個參與者都知道其他參與者有哪幾種類型以及各種類型出現(xiàn)的概率,即知道“自然”參與者的不同類型與相應選擇之間的關(guān)系[6-7],但參與者并不知道其他參與者具體屬于哪一種類型[8-9]。本部分中，筆者借助信號博弈的方法對群眾之間的博弈行為及均衡結(jié)果的達成進行分析。

信號博弈是兩個參與者之間的非完全信息動態(tài)博弈[10]:信號發(fā)送者(S)和信號接收者(R)。博弈時序規(guī)定如下:

1. 自然按照概率分布p(ti)為發(fā)送者S從一個可行類型空間T={t1,t2}中選取類型ti(新衣不存在),其中p(ti)≥0對每一個i都成立,且p(t1)+p(t2)=1。

2. 發(fā)送者S觀察到ti(新衣不存在)后,從一個可行信號集M={m1(國王的新衣真漂亮),m2(國王沒有穿新衣)}中選取一個信號mj。

3. 接收者R觀察到mj,然后從可行行動集A={a1(說真話),a2(說假話)}中選取行動ak。

4. 發(fā)送者S與接收者R的盈利函數(shù)分別為US=(ti,mj,ak)。

圖9 群眾之間的信號博弈

在該信號博弈中,N表示自然,T={t1,t2},M={m1,m2},A={a1,a2},[p]與[1-p]表示自然選擇類型時的概率分布。在騙子建立的規(guī)則下,a、b、c、d的大小關(guān)系滿足a>b、d>c、a>c、d>b,e、f、g、h的大小關(guān)系滿足e>f、h>g、e>g、h>f,并且a>f、a>g、d>g,e>b、e>c、h>b、h>c。

圖9中發(fā)送者S的純策略:

S(1)若自然抽取t1,則取m1(國王的新衣真漂亮);若自然抽取t2,仍取m1(國王的新衣真漂亮)。

S(2)若自然抽取t1,則取m1(國王的新衣真漂亮);若自然抽取t2,則取m2(國王沒有穿新衣)。

S(3)若自然抽取t1,則取m2(國王沒有穿新衣);若自然抽取t2,則取m1(國王的新衣真漂亮)。

S(4)若自然抽取t1,則取m2(國王沒有穿新衣);若自然抽取t2,仍取m2(國王沒有穿新衣)。

接收者R的純策略:

R(1)若S發(fā)出m1(國王的新衣真漂亮),則取a1(說真話);若S發(fā)出m2(國王沒有穿新衣),仍取a1(說真話)。

R(2)若S發(fā)出m1(國王的新衣真漂亮),則取a1(說真話);若S發(fā)出m1(國王沒有穿新衣),則取a2(說假話)。

R(3)若S發(fā)出m1(國王的新衣真漂亮),則取a2(說假話);若S發(fā)出m2(國王沒有穿新衣),則取a2(說真話)。

R(4)若S發(fā)出m1(國王的新衣真漂亮),則取a2(說假話);若S發(fā)出m2(國王沒有穿新衣),仍取a2(說假話)。

現(xiàn)在從發(fā)送者S的四個純策略出發(fā),分別分析該信號博弈完美Bayes均衡。

第一，共用m1。

第二，共用m2。

第三，分離:類型t1發(fā)出信號m1,類型t2發(fā)出信號m2。

假設發(fā)送者S的純策略是(m1，m2),那么接受者R的兩個信息集都在均衡路徑上,因此兩個信念均可由Bayes法則與發(fā)送者S的策略確定。例如對p而言:

p=u(t1|m1)=p(t1)/p(t1)=1;同理可得:

1-q=u(t2|m2)=p(t2)/p(t2)=1,即q=0。在給定信念p=1的情況下,接受者R的最優(yōu)反應是a2;而在給定信念q=0的情況下,接受者R的最優(yōu)反應仍是a2。此時，屬于類型t1與t2的發(fā)送者S獲得的效用分別為a與g。在給定接受者R策略(a1，a2)下,發(fā)送者S的純策略(m1，m2)是否最優(yōu)?根據(jù)圖9可知,屬于類型t2的發(fā)送者S如果偏離這個策略，不取信號m2而取信號m1,此時由于接受者R的反應為a2,而使得類型t2的發(fā)送者S獲得效用e。這要優(yōu)于他取信號m2獲得的效用g。因此，在給定接受者R策略(a2，a2)下,發(fā)送者S有可能會主動偏離(m1、m2)這一策略,故發(fā)送者S的純策略(m1，m2)不可能是均衡策略。

第四，分離:類型t1發(fā)出信號m2,類型t2發(fā)出信號m1。

假設發(fā)送者S的純策略為(m2，m1),如(3)所示,則可以確定接受者R的兩個信念:p=0與q=1。在給定p=0與q=1這兩個信念的情況下,接受者R的最優(yōu)反應是(a2，a2),從而屬于類型t1與t2的發(fā)送者S獲得的效用分別為c與e。在給定接受者R策略(a2、a2)下,發(fā)送者S的純策略(m2、m1)是否最優(yōu)?根據(jù)圖9可知,屬于類型t1的發(fā)送者S如果偏離這個策略，不取信號m2而取信號m1,此時,由于接受者R的反應為a2,而使得類型t1的發(fā)送者S獲得效用a。這要優(yōu)于他取信號m2獲得的效用c。因此，在給定接受者R策略(a2，a2)下,發(fā)送者S有可能會主動偏離(m2，m1)這一策略,故發(fā)送者S的純策略(m2、m1)不可能是均衡策略。

總之,通過從發(fā)送者S的四個純策略出發(fā),分別對該信號博弈的完美Bayes均衡進行分析,發(fā)現(xiàn)在騙子建立的規(guī)則下,只有(m1，m1)和(a2，a2)是博弈的共用完美Bayes均衡。結(jié)果也就出現(xiàn)了“皇帝新裝”困境中博弈群體在不能確定彼此所屬具體類型的情況下均選擇顯示其虛假偏好的現(xiàn)象。很顯然,在整個博弈過程中,決定博弈群體采取何種動作為其最優(yōu)策略的誘導機制是博弈效用中的參數(shù)。

二、 “皇帝新裝”困境中博弈均衡誘導機制的治理對策

站在局中人的角度,身為行動的執(zhí)行者,在裁縫建立的規(guī)則(任何愚蠢或不稱職的人都看不見新衣)下,沒有人會質(zhì)疑裁縫是否是騙子。因此,局中人會把自己沒有看到新衣歸因于自己是愚蠢的,而當聽到其他人對新衣贊不絕口時,局中人會得出兩個結(jié)論:其他人是聰明的,所以他們真的看到了新衣;其他人和自己一樣沒有看到新衣,在說謊。因此,每個人雖然能確定自己沒有看到新衣,但不能確定其他人是否真的看到新衣?？傊?為鼓勵博弈群體顯示其真實偏好,從而達到所有參與主體均選擇說真話的一種新的均衡狀態(tài),筆者提出以下幾點治理對策,詳細情況見表2。

表2 “皇帝新裝”困境中博弈均衡誘導機制的治理對策

(一) 打破從眾心理,誘導博弈群體顯示其真實偏好

騙子之所以能夠拿自己的生命與所有人下賭注,這里有一個前提,即騙子能夠建立一種規(guī)則,使所有人都活在這種規(guī)則之下。在這種規(guī)則下,根本就不會有人質(zhì)疑騙子說的是謊言,更談不上揭發(fā)謊言,因為一旦有人懷疑,這個故事就會立即被終結(jié),最初的邏輯世界被破壞,整個童話故事就會變得毫無意義。因此,在這種前提下,每個人都不敢相信自己看到的事實——“看到”和“相信”是兩碼事?，F(xiàn)在我們假設p=F(“說假話的人數(shù)”/“對國王的新衣發(fā)表看法的所有人數(shù)”),F=xa(x代表說假話的人群占比,a代表“不從眾系數(shù)”)。這里的F因不同的人存在異質(zhì)性,我們很容易得到F(0)=0、F(1)=1。但需要注意的是，0-1中間的部分會隨著a的不同而有所不同,因此只要保證a稍微大些,即使只有1%的人站出來說真話,F也會距離1較遠,此時他就會非常相信自己的眼睛,從而發(fā)出真實信號。所以可以通過以下幾種方法來確?！安粡谋娤禂?shù)a”盡可能大些,換句話說,就是最大限度地打破博弈群體的從眾心理,誘導其顯示真實偏好。首先，可以對博弈群體進行思想道德教育,使其能夠相信自己的眼睛,忠于自己的本心,敢于將生死置之度外,說出自己看到的事實。其次,在排除效用等因素干擾的情況下,也可以對博弈群體進行“隔離”,即讓他們依次行動,以確保每個人在行動時都不知道其他人的選擇,從根源上避免從眾心理起作用。最后,也可以大膽地質(zhì)疑騙子,結(jié)果是博弈群體無須從眾,大膽地說出新衣不存在,打破原來博弈群體都“說謊的均衡”,兩個狡猾的騙子也會受到嚴厲的法律制裁。

(二) 改變博弈效用,鼓勵博弈群體作出符合社會價值標準的策略選擇

博弈論研究的博弈中的參與者總是被假定為理性的和自利的,而決定參與者究竟采取何種行動的誘導機制或激勵機制之一就是他自己的效用。因此,在排除其他因素干擾的情況下,只有改變博弈效用,才能誘使參與主體作出符合社會價值標準的策略選擇。通過上文分析可知,a、b、c、d的大小關(guān)系一共有13種情況,相對應的博弈結(jié)果可以歸納為3種:一是參與主體都說假話,二是參與主體都說真話,三是一半人說真話,一半人說假話(假設參與主體人數(shù)N是偶數(shù))。

在整個博弈過程中,因為后行動的參與者只知道先于他行動的參與者要么選擇說真話,要么選擇說假話,但不知道先于他行動的參與者究竟會在“說真話”或“說假話”中到底選擇哪一個?，F(xiàn)在,在后行動的參與者“不完美”的信息集上賦予一個概率分布(p，1-p)作為信念,繪制博弈樹如圖10所示。

圖10 依次行動的參與者之間博弈的博弈樹

一旦給定后行動的參與者在“不完美”信息集上的信念,就可以計算出他的期望效用。如果后行動的參與者取“說真話”,期望效用為:

p×b+(1-p)×c=p(b-c)+c;

如果后行動的參與者取“說假話”,期望效用為:

p×d+(1-p)×a=p(d-a)+a。

我們知道,在騙子建立的規(guī)則下,a、b、c、d的大小關(guān)系滿足:a>b、a>c、d>b、d>c。

1. 當b-c=d-a時,后行動的參與者的最佳選擇是說假話;

2. 當b-c

3. 當b-c>d-a時,后行動的參與者的最佳選擇是說真話。

因此,在騙子建立的規(guī)則下,排除其他因素的干擾,只要能夠保證b-c>d-a,也就保證了所有參與者都選擇說真話。

(三) 加強行為互動,誘使私人信息外部化為公共知識

在一個群體的行動中,如果公共知識改變了,群體的均衡也會發(fā)生改變。故事最初達到了一種均衡,即所有參與者出于對個人利弊的權(quán)衡而選擇掩蓋事實真相,紛紛稱贊國王新衣漂亮。倘若我們是局中人,在給定的先決條件(任何愚蠢或不稱職的人都看不見新衣)下,對于每一位參與者來講,他們都清楚新衣不存在,但他們會認為或許是因為自己愚蠢、不稱職而沒有看到新衣。所以他們是不能肯定其他參與者是否真的看到新衣。這時,“新衣根本就不存在”僅僅構(gòu)成參與者的私人信息,而小孩子一語道破了事實的真相。小孩子是真誠的、天真無邪的,他不會像其他參與者那樣權(quán)衡利弊得失。確切地說，小孩其實屬于非理性的參與者,即使他發(fā)現(xiàn)周圍的人什么都不說或者都在稱贊國王的新衣,他也會童言無忌地說出真相:國王什么也沒穿?！捌鋵崌跏裁匆矝]有穿”便瞬間成為所有參與者之間的公共知識,這時大家才開始勇敢地顯示自己的真實偏好。此時人們經(jīng)過交流達成通識,私人信息外部轉(zhuǎn)化為公共知識,否則每一位理性參與者都不會有單獨改變策略的沖動。

此外,還可以通過改變國王的行為來鼓勵大家勇敢地說出真話。國王身為一國之君,理應率先示范,當場拆穿謊言,并給予騙子嚴厲的懲罰,以捍衛(wèi)一國之君的尊嚴。而故事中的國王之所以沒能及時戳穿騙子的謊言,也與他多年來的“不務正業(yè)”有關(guān)。當他沒有看到新衣時,他不敢說出來,因為他心里清楚自己不是一個稱職的國王,他缺乏自信。因此，倘若國王一直都是兢兢業(yè)業(yè),不僅國王自己對自己有足夠的信心,而且大臣、百姓都會對其有足夠的信心,在面對裁縫設置的騙局時大家就一定能夠戮力同心、齊心協(xié)力地揭穿騙子。

總之,本部分基于對“皇帝新裝”困境中博弈均衡的誘導機制進行的理論分析,通過采取相應的治理對策,包括改變博弈效用參數(shù)、加強行為互動等來鼓勵博弈群體作出符合社會價值標準的策略選擇,從而達到博弈群體均選擇說真話的一種新的均衡狀態(tài)。

基于上述分析，筆者提出以下幾點治理對策:應對博弈群體進行思想道德教育或?qū)⒉┺娜后w“隔離”以打破從眾心理;改變博弈效用,保證a、b、c、d的大小關(guān)系始終滿足b-c>d-a;建立健全信息交換共享平臺，拓寬信息溝通渠道，以加強行為互動。

[ 1 ] 劉康興,李海.關(guān)于博弈論在人力資源管理中的應用綜述[J].時代金融,2007(4):42-44.

[ 2 ] 吉本斯.博弈論基礎[M].北京:中國社會科學出版社,1999:7.

[ 3 ] 施錫銓.博弈論[M].上海:上海財經(jīng)大學出版社,1999：97-99.

[ 4 ] 王艷梅,趙希男,孫世敏.基于動態(tài)博弈的橫向監(jiān)督與團隊激勵的關(guān)系研究[J].管理工程學報,2017(2):162-168.

[ 5 ] 張立凡,程楠,朱恒民.基于動態(tài)博弈的媒體參與下網(wǎng)絡輿情機制分析[J].情報科學,2017 (1):144-147.

[ 6 ] 王康,孫健,周欣. 不完全信息動態(tài)博弈視角下的食品安全責任保險問題研究——基于參與主體之間的KMRW聲譽博弈[J].江西財經(jīng)大學學報,2017(2):70-76.

[ 7 ] 趙熒梅,郭本海,劉思峰.不完全信息下產(chǎn)品質(zhì)量監(jiān)管多方博弈模型[J].中國管理科學,2017 (2):111-120.

[ 8 ] 易凱凱,朱建軍,張明,等.基于不完全信息動態(tài)博弈模型的大型客機主制造商-供應商協(xié)同合作策略研究[J].中國管理科學,2017(5):125-134.

[ 9 ] 鄭君君,邵祥民,韓笑,等.認知層次與信念更新對博弈合作行為影響研究[J].系統(tǒng)工程理論與實踐,2016(1):113-120.

[10] 吳文靜,王占中,馬芳武.從眾心理影響下的行人群體行為演化博弈的仿真分析——以行人過街為例[J].吉林大學學報(工學版),2017(1):92-96.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡