国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

納什均衡與我們的生活

2012-04-29 03:21:12劉亞婷
考試周刊 2012年25期
關(guān)鍵詞:坦白毛驢納什

劉亞婷

摘要: 納什均衡是博弈論的一個(gè)重要術(shù)語(yǔ),以約翰·納什命名。納什均衡就是在人有限非合作博弈中的所有參與人的最優(yōu)策略組合。由于一個(gè)博弈的納什均衡解可能只有一個(gè),也可能有多個(gè),于是關(guān)于納什平衡點(diǎn)精煉的問(wèn)題逐漸被提出,而每一種精煉都是為了剔除某種不合理或者脆弱的納什平衡點(diǎn),從而就產(chǎn)生了子博弈納什均衡、貝葉斯納什均衡、精煉貝葉斯納什均衡。

關(guān)鍵詞: 博弈論納什均衡生活

納什均衡(Nash equilibrium),又稱(chēng)為非合作博弈均衡,是博弈論的一個(gè)重要術(shù)語(yǔ),以約翰·納什命名。博弈論,又叫做游戲理論或?qū)Σ哒?,是一門(mén)以數(shù)學(xué)為基礎(chǔ),研究對(duì)抗沖突中最優(yōu)解問(wèn)題的學(xué)科。雖然博弈論從本質(zhì)上來(lái)講是研究決策問(wèn)題,但與傳統(tǒng)的決策分析相比,博弈論更加關(guān)注的是博弈決策中博弈各方的互動(dòng)行為。博弈論思想最早源于中國(guó)古代,成書(shū)于春秋時(shí)期的《孫子兵法》中的軍事理論與治國(guó)策略就蘊(yùn)含了豐富深刻的對(duì)策思想。博弈論真正成為數(shù)學(xué)的一個(gè)分支始于1944年,Von Neumann和Morgenstern合作的《博弈論與經(jīng)濟(jì)行為》一書(shū)的出版,第一次給博弈(game)以明確的數(shù)學(xué)描述;對(duì)博弈現(xiàn)象最早用數(shù)學(xué)方法來(lái)研究的則是數(shù)學(xué)家E.Zermelo,始于國(guó)際象棋,體現(xiàn)于其論文《集合論在象棋對(duì)策中的應(yīng)用》(1912);其后法國(guó)數(shù)學(xué)家Borel討論引入了“最優(yōu)策略”,并證明了其普遍存在性,同時(shí)預(yù)測(cè)了一些結(jié)論;在1950年和1951年,納什提出了非合作博弈的均衡解,并證明了均衡解的存在,自此博弈發(fā)展到了一個(gè)很重要的階段;到了二十世紀(jì)八九十年代,博弈論逐漸走向成熟,其發(fā)展已進(jìn)入前所未有的輝煌時(shí)期,博弈論重構(gòu)經(jīng)濟(jì)學(xué)大廈的趨勢(shì)正逐步變?yōu)楝F(xiàn)實(shí),在經(jīng)濟(jì)學(xué)中的應(yīng)用越來(lái)越廣泛,并正以主流經(jīng)濟(jì)學(xué)的面貌出現(xiàn)。隨著博弈論的不斷成熟,它不僅僅在經(jīng)濟(jì)領(lǐng)域和數(shù)學(xué)領(lǐng)域被廣泛研究,我們發(fā)現(xiàn)博弈的思想在日常生活中無(wú)處不在,博弈就像空氣,時(shí)刻伴隨在我們身邊,例如有名的“囚徒困境”、“智豬博弈”、“性別大戰(zhàn)”等,還有小孩子們玩的“石頭剪刀布”、“擲硬幣”,大人們玩的“斗地主”、麻將、象棋、乒乓球等都是博弈論的應(yīng)用。如果將博弈論與生活結(jié)合起來(lái),那么生活中每個(gè)人都如同棋手,其每一種行為如同在一張隱形的棋盤(pán)上布一個(gè)子,精明慎重的棋手們相互揣摩、相互牽制,人人爭(zhēng)贏,下出許多精彩紛呈、變化多端的棋局,而博弈論正是研究棋手們的策略與技巧,并將其系統(tǒng)化的一門(mén)科學(xué)。換句話(huà)說(shuō),就是研究個(gè)體如何在錯(cuò)綜復(fù)雜的相互影響中找到最合理的策略。

在博弈論中,納什是完全信息靜態(tài)博弈的代表人物,他在1950年和1951年發(fā)表的兩篇論文中定義了非合作博弈及其均衡解,并給出了均衡解的證明,后來(lái)人們稱(chēng)它為納什均衡,即是假設(shè)有個(gè)參與人博弈,給定其他人戰(zhàn)略的情況下,每個(gè)人選擇自己的最優(yōu)策略(個(gè)人最優(yōu)策略可依賴(lài)于也可能不依賴(lài)于其他人的策略),所有參與人選擇的策略一起構(gòu)成一個(gè)策略組合。納什均衡指的就是所有參與人的最優(yōu)策略組合。為了清楚地了解納什均衡,我們就以“囚徒困境”為例。據(jù)說(shuō)有一位富翁家中財(cái)物被盜,警方通過(guò)此偵破此案,發(fā)現(xiàn)有兩個(gè)嫌疑人A和B,將他們抓獲后從他們的住處搜出受害人家中丟失的財(cái)物。但是,他們都矢口否認(rèn),于是警方將兩人分開(kāi)審訊。為了擊垮他們的心理防線(xiàn),警方告訴他們,如果主動(dòng)坦白,可以從輕處罰;如果頑抗到底,一旦同伙招供,就要受到嚴(yán)懲。當(dāng)然,如果兩人都坦白,就不存在“主動(dòng)交代”,兩人都要受到嚴(yán)懲,只不過(guò)比抵賴(lài)要處罰輕一些。在這種情形下,兩個(gè)囚犯都可以作出自己的選擇,或者招供,即與警察合作,從而背叛他的同伙;或者保持沉默,與警察對(duì)抗到底。這樣,就會(huì)出現(xiàn)以下幾種情況:

在這個(gè)例子里,納什均衡就是(坦白,坦白),在給定B坦白的情況下,A的最優(yōu)策略是坦白,同理,給定A坦白的情況下,B的最優(yōu)策略也是坦白。實(shí)際上,這里的(坦白,坦白)不僅是納什均衡,而且是一個(gè)占優(yōu)策略均衡,就是說(shuō),不論對(duì)方如何選擇,個(gè)人的最優(yōu)選擇都是坦白。比如說(shuō),若B抵賴(lài),A坦白的話(huà)被放出來(lái),抵賴(lài)的話(huà)被判1年,所以坦白比抵賴(lài)好;若B坦白,A坦白的話(huà)被判8年,抵賴(lài)的話(huà)被判10年,所以坦白還是比抵賴(lài)好,這樣坦白既是A的占優(yōu)策略,又是B的占優(yōu)策略,結(jié)果是每個(gè)人都選擇坦白,各判8年?!扒敉嚼Ь场狈从沉藗€(gè)人理性與集體理性的矛盾,雖然兩個(gè)都抵賴(lài)各判刑1年顯然比都坦白各判刑8年好,但是他不滿(mǎn)足個(gè)人理性要求,即(抵賴(lài),抵賴(lài))不是納什均衡。

“囚徒困境”的思想在我們的日常生活中有著廣泛的應(yīng)用,比如市場(chǎng)上的商家常常通過(guò)降價(jià)來(lái)爭(zhēng)奪市場(chǎng),假設(shè)商家A和商家B是某市場(chǎng)上的兩個(gè)競(jìng)爭(zhēng)對(duì)手,他們?cè)瓉?lái)用同一種較高的價(jià)格銷(xiāo)售相同的產(chǎn)品,若這兩商家不滿(mǎn)足他們?cè)瓉?lái)的市場(chǎng)份額和利潤(rùn),就都想通過(guò)降價(jià)來(lái)爭(zhēng)奪更大的市場(chǎng)份額和利潤(rùn)。但值得注意的是,當(dāng)自己的降價(jià)引起對(duì)手的報(bào)復(fù)時(shí),這種目的就不一定達(dá)到。假設(shè)兩商家在原來(lái)的高價(jià)策略下各可以獲利200萬(wàn)元,若商家A單獨(dú)降價(jià)可以獲得250萬(wàn)元利潤(rùn),此時(shí)商家B因?yàn)槭袌?chǎng)份額被商家A搶去利潤(rùn)將下降到80萬(wàn)元,此時(shí)商家B也采取了降價(jià),則兩商家都只能得到120萬(wàn)元利潤(rùn),此時(shí)博弈可以由下表表示:

由此表容易看出,假設(shè)商家B采用高價(jià)策略,那么商家A采用高價(jià)的200萬(wàn),采用低價(jià)得250萬(wàn),由于250大于200,商家A應(yīng)采用低價(jià),假設(shè)商家B采用低價(jià),那么商家A采用高價(jià)得益80萬(wàn),采用低價(jià)得益120萬(wàn),由于120大于80,因此商家A也采用低價(jià),用同樣的方法分析商家B,商家B也應(yīng)選低價(jià)策略,因而這個(gè)博弈的最終結(jié)果就是兩商家都采用低價(jià),最終各得120萬(wàn)元利潤(rùn),即(120,120)就是納什均衡解。當(dāng)然囚徒困境思想的應(yīng)用不僅僅是這一個(gè)例子,它還應(yīng)用在公共產(chǎn)品的供給、軍備競(jìng)賽、股票市場(chǎng)等許多方面。

由于一個(gè)博弈的納什均衡解不止一個(gè),有些博弈可能有無(wú)數(shù)個(gè)納什均衡解,于是澤爾騰在1965年通過(guò)對(duì)動(dòng)態(tài)博弈的分析完善了納什均衡的概念,定義了“子博弈精煉納什均衡”,這個(gè)概念的中心意義是將納什均衡中包含的不可置信的威脅戰(zhàn)略剔除去,使均衡戰(zhàn)略不再包含不可置信的威脅。他要求參與人的決策在任何時(shí)點(diǎn)上都是最優(yōu)的,決策者要隨機(jī)應(yīng)變,而不是固守舊略。由于剔除了不可置信的威脅,在許多情況下,精煉納什均衡也縮小了納什均衡的個(gè)數(shù)。當(dāng)然這里應(yīng)該指出的是一個(gè)精煉均衡首先必須是一個(gè)納什均衡,但納什均衡不一定是精煉均衡,只有那些不包含不可置信威脅的納什均衡才是精煉納什均衡。例如:假如有一個(gè)富家千金愛(ài)上了一個(gè)窮小子,可是姑娘的母親覺(jué)得并不門(mén)當(dāng)戶(hù)對(duì),于是姑娘的母親堅(jiān)決不同意,并威脅說(shuō),若女兒與小伙子不斷絕戀愛(ài)關(guān)系,她就與女兒斷絕母女關(guān)系。若女兒相信母親的話(huà),女兒就會(huì)中斷與小伙子的戀愛(ài)關(guān)系,因?yàn)閼偃丝梢灾匦逻x擇,而母親則無(wú)法重新選擇。問(wèn)題是假設(shè)女兒堅(jiān)持到底最終與小伙子結(jié)婚,母親難道真的會(huì)去斷絕母女關(guān)系嗎?一般來(lái)說(shuō)是不會(huì)的,因?yàn)閿嘟^母女關(guān)系對(duì)母親的損害會(huì)更大,這就是說(shuō),母親的威脅是不可置信的。聰明的女兒當(dāng)然會(huì)明白,一旦與男友生米煮成熟飯,母親只好妥協(xié)。結(jié)果是女兒會(huì)勇敢地堅(jiān)持戀愛(ài)并結(jié)婚,母親最終承認(rèn)那個(gè)她當(dāng)初并不喜歡的女婿。這就是此博弈中唯一的精煉納什均衡。

納什均衡和子博弈完美納什均衡所反映的博弈都包括了一個(gè)基本假設(shè),即博弈的結(jié)構(gòu)、博弈的規(guī)則、所有局中人的策略空間和支付函數(shù)都是共同知道的,滿(mǎn)足這樣一個(gè)假設(shè)的博弈稱(chēng)為“完全信息博弈”,但在現(xiàn)實(shí)生活中這一假設(shè)往往得不到滿(mǎn)足。在非合作博弈中,局中人對(duì)博弈的結(jié)構(gòu)和其他局中人的特征并沒(méi)有準(zhǔn)確的了解的情況叫“不完全信息博弈”。在1967年以前,博弈論專(zhuān)家對(duì)不完全信息博弈是束手無(wú)策的,直到1967年至1968年海薩尼提出了不完全信息靜態(tài)博弈,并定義了貝葉斯納什均衡,即在不完全信息靜態(tài)博弈中,參與人同時(shí)行動(dòng),沒(méi)有機(jī)會(huì)觀(guān)察到別人的選擇,給定別人的戰(zhàn)略選擇,每個(gè)參與人的最優(yōu)策略依賴(lài)于自己的類(lèi)型,由于每個(gè)參與人僅知道其他參與人的類(lèi)型的概率分布而不知道其真實(shí)類(lèi)型,他不可能準(zhǔn)確地知道其他參與人實(shí)際上會(huì)選擇什么策略,這樣他決策的目標(biāo)就是在給定自己的類(lèi)型和別人的類(lèi)型依從策略的情況下,最大化自己的期望效用。也就是說(shuō),貝葉斯納什均衡就是給定自己的類(lèi)型和別人類(lèi)型的概率分布的情況下,每個(gè)參與人的期望效用達(dá)到了最大化。這種類(lèi)型的例子在生活中也是無(wú)處不在,例如:某交通局有一段柏油路要包出去,通過(guò)招投標(biāo)來(lái)進(jìn)行。假設(shè)招標(biāo)的辦法為一級(jí)密封投標(biāo),讓每個(gè)投標(biāo)者將自己的標(biāo)價(jià)寫(xiě)下并裝入信封,一同交給交通局,信封打開(kāi)后交通局選擇標(biāo)價(jià)最低者為中標(biāo)者,此時(shí)不同的投標(biāo)者之間進(jìn)行的就是一場(chǎng)博弈。假定每個(gè)投標(biāo)者都不知道其他投標(biāo)者的真實(shí)生產(chǎn)成本而僅僅知道其概率分布,那么他在選擇自己的報(bào)價(jià)時(shí)就面臨著一種交替:一方面報(bào)價(jià)越低,中標(biāo)的可能性越大,但另一方面,給定中標(biāo)的情況,報(bào)價(jià)越低,利潤(rùn)就越小。分析證明,每個(gè)投標(biāo)人的標(biāo)價(jià)都依賴(lài)于他的生產(chǎn)成本,但一般來(lái)說(shuō),生產(chǎn)成本會(huì)低于貝葉斯納什均衡標(biāo)價(jià),二者之間的差異隨總投標(biāo)人數(shù)的增加而減少,也就是說(shuō),投標(biāo)人越多,交通局越有利。

前面說(shuō)了靜態(tài)博弈,其實(shí)在生活中還有動(dòng)態(tài)博弈。在一個(gè)動(dòng)態(tài)博弈中,行動(dòng)是分先后次序的,后行動(dòng)者可以通過(guò)觀(guān)察先行動(dòng)者的行動(dòng)獲得有關(guān)后者偏好、戰(zhàn)略空間等方面的信息,修正自己的判斷。就像日常生活中通過(guò)觀(guān)察某人的行為表現(xiàn)來(lái)了解其品德一樣,顯然,先行動(dòng)者知道自己的行為有傳遞自己特征信息的作用,就會(huì)有意識(shí)地選擇某種行動(dòng)來(lái)掩飾自己的真實(shí)面目。當(dāng)然,在均衡狀態(tài)下,理性人是不會(huì)被蒙混的。1975年澤爾騰和克瑞普斯(1982年)等人相繼給出了不完全信息動(dòng)態(tài)博弈的精煉貝葉斯納什均衡的定義,即是當(dāng)事人根據(jù)所觀(guān)察到的他人的行為來(lái)修正自己有關(guān)后者類(lèi)型的主觀(guān)概率,并由此選擇自己的行動(dòng)。在我們的生活中,這樣的例子也很多,例如:“黔驢之技”的故事就是一個(gè)不完全信息動(dòng)態(tài)博弈:一頭毛驢被帶到貴州時(shí),老虎從沒(méi)見(jiàn)過(guò)驢子見(jiàn)它威武高大,心想它的本領(lǐng)一定很大。老虎就很好奇,于是憑著這個(gè)判斷,老虎就躲在樹(shù)林里偷偷觀(guān)察毛驢,這是它的最優(yōu)選擇。過(guò)了一會(huì)兒,老虎走出樹(shù)林,逐漸靠近毛驢,就想獲得這個(gè)龐然大物的真實(shí)本領(lǐng)的信息。突然毛驢大叫一聲,老虎嚇了一跳,急忙逃走,這也是老虎的最優(yōu)選擇,因?yàn)槊H的叫聲是老虎意料之外的。過(guò)了兩天,老虎又來(lái)觀(guān)看,發(fā)現(xiàn)毛驢除了會(huì)大聲叫之外沒(méi)什么本領(lǐng),可是仍然不敢吃毛驢,因?yàn)樗€是不完全了解毛驢的真實(shí)本領(lǐng)。后來(lái),老虎逐漸靠近毛驢,并故意往毛驢身上擠,毛驢實(shí)在忍無(wú)可忍,就往老虎身上踢了一腳,這下老虎反倒高興了,因?yàn)樗懒嗣H不過(guò)就這點(diǎn)真實(shí)本領(lǐng),此時(shí),老虎對(duì)毛驢就有了全面的了解,于是撲過(guò)去就把毛驢吃掉了。在這個(gè)故事里,老虎通過(guò)觀(guān)察毛驢的行為逐漸修正了對(duì)毛驢的看法,直到看清它的真實(shí)本領(lǐng),最后把它吃掉,就是一個(gè)精煉貝葉斯均衡,而老虎的每一步行動(dòng)都是給定它的判斷下最優(yōu)的。事實(shí)上,毛驢的行為也是理性的,它知道自己技能有限,不到萬(wàn)不得已它不會(huì)用僅有的一技,否則它早就被老虎吃掉了。這種博弈的思想在生活中也很多,比如:強(qiáng)者欺負(fù)弱者,信號(hào)傳遞模型,等等。

以上這些例子是我們?nèi)粘I钪薪?jīng)常碰到的,這些博弈的思想也不知不覺(jué)地被人們使用,雖然博弈的例子數(shù)不勝數(shù),但有一個(gè)共同特點(diǎn),即參與者都是在每一場(chǎng)博弈中尋求自己的最優(yōu)解。其實(shí),人生就是一個(gè)不斷合作和競(jìng)爭(zhēng)的過(guò)程,在這些合作與競(jìng)爭(zhēng)中,每個(gè)人都想使自己的利益最大化,從而得到一個(gè)自己認(rèn)為滿(mǎn)意的結(jié)果。由此看來(lái),學(xué)習(xí)博弈論的目的不在于解法而在于尋求巧妙的策略,學(xué)習(xí)博弈論不是為了享受分析博弈的過(guò)程,而在于贏得更好的結(jié)果。博弈的思想來(lái)自現(xiàn)實(shí)生活,它既可以高度抽象地用數(shù)學(xué)來(lái)表述,又可以用日常事例來(lái)說(shuō)明,并運(yùn)用到生活中去,沒(méi)有高深的數(shù)學(xué)知識(shí),我們同樣可以學(xué)習(xí)博弈論并成為生活中的策略高手,就像孫臏沒(méi)有學(xué)過(guò)高數(shù),但是這并不影響他通過(guò)最優(yōu)策略來(lái)幫助田忌贏得賽馬。

參考文獻(xiàn):

[1]張維迎.博弈論與信息經(jīng)濟(jì)學(xué).上海人民出版社,2004.

[2]謝識(shí)予.經(jīng)濟(jì)博弈論,(第二版).復(fù)旦大學(xué)出版社.

猜你喜歡
坦白毛驢納什
THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
騎上毛驢找毛驢
THE ROLE OF L1 IN L2 LEARNING IN CHINESE MIDDLE SCHOOLS
博弈論—囚徒困境模型淺析
長(zhǎng)臉大毛驢
中文的魅力,老外理解不了
真情告白
喜劇世界(2016年18期)2016-11-26 13:05:29
論坦白的處遇
刑法論叢(2016年3期)2016-06-01 12:15:04
毛驢的悲哀
師傅領(lǐng)進(jìn)門(mén),修行靠個(gè)人
托克逊县| 大宁县| 荆门市| 高安市| 阿拉善左旗| 太仓市| 伊吾县| 闽清县| 隆子县| 仙游县| 昭平县| 泸水县| 定兴县| 汪清县| 长沙市| 柳江县| 微山县| 安陆市| 浮梁县| 霍邱县| 新乐市| 三河市| 礼泉县| 宝丰县| 敖汉旗| 大理市| 普兰店市| 仁寿县| 东辽县| 贵州省| 富锦市| 全州县| 林口县| 岳阳县| 米脂县| 鞍山市| 安达市| 广德县| 汪清县| 搜索| 紫云|