有限理性與逼近定理

2021-05-25 10:21:40俞建賈文生

貴州大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版) 2021年2期

俞建賈文生

摘要：本文簡(jiǎn)要介紹了經(jīng)濟(jì)學(xué)中的博弈論革命、Simon的有限理性理論以及有限理性研究中的博弈論模型，指出了對(duì)于建立在完全理性假設(shè)上的模型分析結(jié)果，大多數(shù)情況下仍然是合理的和可以接受的。作為應(yīng)用，本文還介紹了最優(yōu)化問(wèn)題的逼近定理。

關(guān)鍵詞：博弈論;有限理性;逼近定理;最優(yōu)化

中圖分類(lèi)號(hào)：O225;F019.1文獻(xiàn)標(biāo)識(shí)碼：A文章編號(hào)：1000-5099（2021）02-0034-07

一、經(jīng)濟(jì)學(xué)中的博弈論革命

1944年，von Neumann 等出版了名著《博弈論與經(jīng)濟(jì)行為》[1]，宣告了博弈論的誕生。他們指出：“博弈論是建立經(jīng)濟(jì)行為理論的最恰當(dāng)?shù)姆椒ā薄敖?jīng)濟(jì)和社會(huì)問(wèn)題可以從這個(gè)角度得到最好的解釋”[1]。他們重點(diǎn)研究了矩陣博弈和合作博弈。

矩陣博弈是零和博弈，這種零和思維模式有很大的局限性，尤其是在當(dāng)今世界。1950年，年輕的 Nash 突破了von Neumann等的零和思維，將矩陣博弈推廣到了一般來(lái)說(shuō)是非零和的n人非合作有限博弈。

以n=2的雙矩陣博弈為例：博弈有兩個(gè)局中人Ⅰ和Ⅱ，局中人Ⅰ的純策略集合A={a1，…，am}，Ⅱ的純策略集合B={b1，…，bn}。如果局中人Ⅰ選擇ai，Ⅱ選擇bj，則局中人Ⅰ獲得支付cij，Ⅱ獲得支付dij。如果i=1，…，m，j=1，…，n，都有cij+dij=0，這就是零和，矩陣博弈;否則就是非零和，雙矩陣博弈，因?yàn)樗衶cij}和{dij}分別構(gòu)成兩個(gè)矩陣。如果對(duì)某些i和j有cij>0，dij>0，則局中人Ⅰ選擇ai，Ⅱ選擇bj，這就是雙贏。

每個(gè)局中人都是理性的，都希望自己能獲得最大的利益，因此都努力不讓對(duì)手猜出自己將采取的策略，他們可以用隨機(jī)方法來(lái)選擇自己的策略。通過(guò)引進(jìn)所謂混合策略的概念，Nash證明了：存在局中人Ⅰ的混合策略x*和Ⅱ的混合策略y*，雙方能夠達(dá)到平衡;誰(shuí)也不能通過(guò)單獨(dú)改變自己的策略而使自己獲得更大的利益[2]。（x*，y*）稱(chēng)為雙矩陣博弈的Nash平衡。

關(guān)于局中人的利益，用他獲得的支付來(lái)表示，不僅包括收入，也包括風(fēng)險(xiǎn)、休閑、名聲以及社會(huì)責(zé)任等，每個(gè)局中人都有自己獨(dú)立的價(jià)值體系，它可以是利己的，也可以是利他或部分利他的，這一點(diǎn)很重要。

“天下熙熙，皆為利來(lái);天下攘攘，皆為利往?！?000多年以前我國(guó)偉大的史學(xué)家和文學(xué)家司馬遷在《史記》中的名言，今天讀起來(lái)仍然感受到其思想之深刻。試問(wèn)當(dāng)今世界離開(kāi)了對(duì)利益沖突與合作的分析，我們又如何能夠研究經(jīng)濟(jì)乃至于整個(gè)社會(huì)的天下大事呢？

數(shù)學(xué)在經(jīng)濟(jì)中的應(yīng)用，是與經(jīng)濟(jì)學(xué)中最基礎(chǔ)也是最核心的利益最大化原則密切相關(guān)的：如果在模型中決策者只是一個(gè)，那就應(yīng)用種種最優(yōu)化方法;如果在模型中決策者不止一個(gè)，每個(gè)決策者都追求利益的最大化，且他們的利益是互相關(guān)聯(lián)的（在很多情況下是互有沖突的），那只有達(dá)到平衡，這就是博弈論的思想，博弈論正是研究這種利益沖突與合作的運(yùn)籌學(xué)的一個(gè)重要分支。應(yīng)當(dāng)說(shuō)，相比最優(yōu)化方法，博弈論更具普遍性，因?yàn)樗歉咏咏鼘?shí)際的你中有我且我中有你的行為互動(dòng)的決策科學(xué)，它與當(dāng)今世界經(jīng)濟(jì)和社會(huì)發(fā)展的全球化潮流是一致的。當(dāng)然，博弈論與最優(yōu)化方法并不是對(duì)立的，很多博弈的平衡點(diǎn)，也還是要通過(guò)最優(yōu)化方法來(lái)求得，例如，矩陣博弈的平衡點(diǎn)，就可以用線(xiàn)性規(guī)劃的算法來(lái)求得。

1954年，正是在von Neumann和Nash工作的鼓舞下，Arrow和Debreu合作，應(yīng)用廣義博弈平衡點(diǎn)的存在性定理證明了一般經(jīng)濟(jì)均衡的存在性定理[3]，產(chǎn)生了巨大的影響，他們也分別獲得了1972和1983年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。66年過(guò)去了，這些年來(lái)經(jīng)濟(jì)全球化深入發(fā)展，科學(xué)技術(shù)突飛猛進(jìn)，生產(chǎn)規(guī)模擴(kuò)大，壟斷勢(shì)力增強(qiáng)，隨著這種競(jìng)爭(zhēng)的日益加劇以及各種利益沖突與合作的持續(xù)展開(kāi)，博弈論的思想和方法已逐漸成為理解和分析經(jīng)濟(jì)問(wèn)題的工具和語(yǔ)言，這就是經(jīng)濟(jì)學(xué)中的博弈論革命。

西爾維婭·娜薩在其序言中指出：“1987年，新版的大型經(jīng)濟(jì)百科全書(shū)《新帕爾格雷夫經(jīng)濟(jì)學(xué)大辭典》問(wèn)世，編寫(xiě)者指出那場(chǎng)橫掃經(jīng)濟(jì)學(xué)的博弈論革命‘很顯然完全是由von Neumann和Nash的數(shù)學(xué)原理所引發(fā)，別人的任何貢獻(xiàn)都不能與他們相比?！盵4]

1994年，授予Harsanyi、Nash和Selten三人諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)，瑞典皇家科學(xué)院的“新聞公告”中指出：“von Neumann等的不朽研究《博弈論與經(jīng)濟(jì)行為》奠定了經(jīng)濟(jì)學(xué)中運(yùn)用博弈論基礎(chǔ)。在50年后的今天，博弈論已成為一種經(jīng)濟(jì)問(wèn)題分析的主導(dǎo)工具。特別的，非合作博弈（即排除了有約束力合同的博弈論分支）對(duì)經(jīng)濟(jì)研究有著巨大影響。該理論的主要內(nèi)容是平衡概念，這一概念被用來(lái)預(yù)測(cè)策略互動(dòng)的結(jié)果?！盵5]在這以后，又有6次（分別是1996、2001、2005、2007、2012和2014年）諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予從事博弈論研究與應(yīng)用的學(xué)者，除去2012年的獲獎(jiǎng)工作，諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)中的博弈論工作都屬于非合作博弈。

非合作博弈論與合作博弈論，它們之間的關(guān)系如何？

非合作博弈論不允許局中人結(jié)盟，也不允許局中人之間對(duì)支付進(jìn)行再分配，強(qiáng)調(diào)的是策略和平衡（注意到非合作博弈并不意味著局中人總是拒絕與其他局中人合作，受自身利益的驅(qū)使，局中人也能在一些情況下表現(xiàn)合作的行為）;合作博弈論則允許局中人結(jié)盟，也允許局中人之間對(duì)支付進(jìn)行再分配，強(qiáng)調(diào)的是結(jié)盟和分配。合作博弈論強(qiáng)調(diào)結(jié)盟，這就需要局中人之間在博弈開(kāi)始之前進(jìn)行談判，包括如何協(xié)調(diào)各自的策略以及如何進(jìn)行再分配，達(dá)成一個(gè)具有強(qiáng)制力的協(xié)議。談判是要以實(shí)力為基礎(chǔ)的，談判達(dá)成的協(xié)議往往是不穩(wěn)定的，這難道不是當(dāng)今世界的現(xiàn)實(shí)嗎？正如國(guó)際著名博弈論學(xué)者Dixit在名著《策略博弈》中指出的那樣：“現(xiàn)實(shí)中絕大多數(shù)博弈并沒(méi)有充足的實(shí)施聯(lián)合行為協(xié)議的外部強(qiáng)制力，因此本書(shū)以非合作博弈為主要分析對(duì)象。”[6]總之，在這場(chǎng)經(jīng)濟(jì)學(xué)的博弈論革命中，非合作博弈論處于基礎(chǔ)和核心的地位，而合作博弈論有時(shí)可以起到必不可少的補(bǔ)充作用。

二、 Simon的有限理性理論

無(wú)論是von Neumann的矩陣博弈，Nash的n人非合作有限博弈，還是Arrow-Debreu數(shù)理經(jīng)濟(jì)學(xué)中的一般均衡模型，其基礎(chǔ)都建立在決策者完全理性的假設(shè)之上，即每個(gè)決策者都能夠在一定的約束條件下做出對(duì)自己最為有利的選擇，這就是上節(jié)提及的經(jīng)濟(jì)學(xué)中的利益最大化原則。

1955年，Simon對(duì)完全理性的假設(shè)進(jìn)行了深刻的質(zhì)疑和批判：“在關(guān)于理性的論述方面，社會(huì)科學(xué)深受著‘精神分裂癥之苦。在一個(gè)極端，經(jīng)濟(jì)學(xué)家給經(jīng)濟(jì)人賦以一種全智全能的荒謬?yán)硇浴＿@種經(jīng)濟(jì)人有一個(gè)完整而內(nèi)在一致的偏好體系，使其總能夠在他所面臨的備選方案當(dāng)中作出抉擇;他總是完全了解有哪些備選的替代方案;他為擇優(yōu)而進(jìn)行的計(jì)算，不受任何復(fù)雜性的限制;……他具有很大的智慧和美學(xué)魅力;但同具有血肉之軀的人的真實(shí)行為（或可能的行為），看不出有多大關(guān)系?！盵7]

Simon提出了有限理性理論，而其核心是滿(mǎn)意原則，就是使決策者感到滿(mǎn)意的原則。他認(rèn)為問(wèn)題本身是近似的，其求解方法也是近似的，只能尋求某種近似的、但已經(jīng)是足夠好的，可以使決策者滿(mǎn)意的方案或策略。

Simon曾因他的杰出貢獻(xiàn)在1978年獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)，他也是諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者中唯一的一名管理科學(xué)家。此外，他還在1975年獲得計(jì)算機(jī)科學(xué)的圖靈獎(jiǎng)，1988年獲得運(yùn)籌學(xué)和管理科學(xué)的von Neumann獎(jiǎng)，并曾獲得心理學(xué)以及人工智能的終生榮譽(yù)獎(jiǎng)等。

究竟什么是有限理性？ Simon在《新帕爾格雷夫經(jīng)濟(jì)學(xué)大辭典》中的“有限理性”的條目中指出：“‘有限理性一詞，系指那種把決策者在認(rèn)知方面的局限性（包括知識(shí)和計(jì)算能力兩方面的局限性）考慮在內(nèi)的理性選擇”[8]。對(duì)此定義，學(xué)術(shù)界爭(zhēng)論較多，國(guó)際著名博弈論學(xué)者Kreps指出：“迄今為止，文獻(xiàn)記載了許多有限理性的定義，就某種意義而言，他們彼此之間相互矛盾，我個(gè)人認(rèn)為，Simon的定義最為恰當(dāng)，即有限理性行為是指主觀上期望合理，但客觀上受到限制的行為。這就是說(shuō)，某些人主觀上期望達(dá)到某些目標(biāo)，但是他們追求這些目標(biāo)的方式反映出他們自身認(rèn)識(shí)能力的局限性與計(jì)算能力的局限性?！盵9]

按照Simon的論述[8]，有限理性理論“只能建立在心理學(xué)研究的基礎(chǔ)之上”，這一點(diǎn)很重要。

滿(mǎn)意原則當(dāng)然有他的合理性，但是什么是滿(mǎn)意？究竟能否應(yīng)用一些心理學(xué)理論，用實(shí)驗(yàn)數(shù)據(jù)對(duì)原有模型的系統(tǒng)性偏差進(jìn)行種種修正，并據(jù)此替代利益最大化原則，從而為博弈論和經(jīng)濟(jì)學(xué)建立起嚴(yán)格和漂亮的新體系呢？在學(xué)術(shù)界是有很多爭(zhēng)論的，客觀地說(shuō)，這些年來(lái)有進(jìn)展，但進(jìn)展不是很大，至少還有很長(zhǎng)的路要走。

Simon在《新帕爾格雷夫經(jīng)濟(jì)學(xué)大辭典》中的“滿(mǎn)意化”的條目中指出：“決策者選擇出一個(gè)備選方案達(dá)到一定的標(biāo)準(zhǔn)或超過(guò)之，……，叫作滿(mǎn)意。”[8]“滿(mǎn)意者如何確定達(dá)到滿(mǎn)意定義的準(zhǔn)則水平？心理學(xué)設(shè)置了愿望水平機(jī)制：如果很容易找出達(dá)到準(zhǔn)則水平的替代，標(biāo)準(zhǔn)就逐漸提高，如果找了半天還未找出滿(mǎn)意的替代，標(biāo)準(zhǔn)便逐步降低?！薄斑\(yùn)籌學(xué)與管理科學(xué)的多數(shù)最優(yōu)化模型可以被看作有用的滿(mǎn)意化模型。”這樣的論述顯然是不能令人滿(mǎn)意的。國(guó)際著名博弈論學(xué)者Binmore指出：“Simon曾引入滿(mǎn)意概念開(kāi)辟了有限理性下的經(jīng)濟(jì)理論研究，但是從那時(shí)到現(xiàn)在，這個(gè)領(lǐng)域的進(jìn)展一直曖昧不明?！盵10]

這些年來(lái)，以心理學(xué)為基礎(chǔ)的行為心理學(xué)興起，2002年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者、行為經(jīng)濟(jì)學(xué)的倡導(dǎo)者Kahneman指出：“行為經(jīng)濟(jì)學(xué)理論總的來(lái)說(shuō)保留了理性人模型中的基本結(jié)構(gòu)，同時(shí)添加了一些有關(guān)認(rèn)知局限性的假設(shè)，設(shè)置這些假設(shè)是為了解釋一些具體的非正常情況，……，行為人一般是理性的?！盵11]2017諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者，對(duì)行為經(jīng)濟(jì)學(xué)的發(fā)展作出突出貢獻(xiàn)的Thaler指出：“許多經(jīng)濟(jì)學(xué)家繼續(xù)使用理性假設(shè)，因?yàn)樗麄冋J(rèn)為沒(méi)有更好的替代?！盵12]

我國(guó)著名經(jīng)濟(jì)學(xué)家林毅夫指出：“不管在什么社會(huì)里，人都是理性的，所謂理性指的是一個(gè)決策者在做決策時(shí)，在他可做的選擇中，總會(huì)選擇他認(rèn)為是最好的選擇?！薄袄硇缘臎Q策者所要最大化的目標(biāo)可以各式各樣，可以收益最大化，可以選擇風(fēng)險(xiǎn)規(guī)避，可以選擇內(nèi)心的滿(mǎn)足，也可以選擇社會(huì)責(zé)任等?！盵13]

作者認(rèn)為：大多數(shù)決策者總是理性的，在大多數(shù)情況下總是追求自身利益最大化的，這一點(diǎn)必須肯定。另一方面，每個(gè)決策者都有自己獨(dú)立的價(jià)值體系，自身利益并不限于收入，他不必是利己的，可以是利他或部分利他的，這一點(diǎn)也必須肯定。我們應(yīng)當(dāng)思考這樣的問(wèn)題：在博弈論與經(jīng)濟(jì)學(xué)模型中考慮有限理性作用，究竟會(huì)對(duì)建立在完全理性假設(shè)之上的模型分析結(jié)果產(chǎn)生怎樣的影響或沖擊呢？如果回答是基本正面的，即一般來(lái)說(shuō)不會(huì)產(chǎn)生較大的影響或沖擊，那么對(duì)于建立在完全理性假設(shè)之上的模型分析結(jié)果，大多數(shù)情況下仍然是合理的和可以接受的。

三、有限理性研究的博弈論模型

以下介紹有限理性研究的博弈論模型。

2001年，Anderlini和Canning用博弈論的語(yǔ)言建立了有限理性研究的抽象模型M[14]，這是一類(lèi)帶有抽象理性函數(shù)的一般博弈（general games）。模型M的建立是很有創(chuàng)新性的，但是其假設(shè)條件太強(qiáng)，很多重要的博弈論與經(jīng)濟(jì)學(xué)模型都無(wú)法滿(mǎn)足。俞建等作者[15-20]對(duì)此模型進(jìn)行了必要的改造，將Anderlini等作者的假設(shè)條件大大減弱[14]，不僅擴(kuò)大了模型的應(yīng)用范圍，還得到了一系列新的相當(dāng)深刻的定理。

總結(jié)以上的說(shuō)明，可以這樣說(shuō)，當(dāng)λ∈Q時(shí)，雖然博弈λn是近似的（λn→λ），求解方法也是近似的（εn→0），但可以用有限理性得到的εn-平衡點(diǎn)集E（λn，εn）來(lái)近似代替E（λ）。這表明在Baire分類(lèi)的意義上或者在非線(xiàn)性分析和拓?fù)鋵W(xué)的意義上，有限理性的引入一般不會(huì)對(duì)完全理性假設(shè)之上的模型分析結(jié)果產(chǎn)生較大的影響和沖擊。在大多數(shù)的情況下，可以用有限理性來(lái)逼近完全理性。這是一個(gè)很有理論意義的結(jié)果，也是對(duì)上節(jié)中Simon質(zhì)疑和批判的一個(gè)回應(yīng)。

四、最優(yōu)化問(wèn)題與逼近定理

Montet C、Serra D等作者指出：“決策論也可被認(rèn)為是一種兩人博弈，只不過(guò)其中一方是一個(gè)虛擬的參與者—自然。”[21]由此，可以將最優(yōu)化等決策問(wèn)題看作為決策者與虛擬的決策者“自然”之間的博弈問(wèn)題：當(dāng)決策者是完全理性時(shí)，他就得到最優(yōu)解，而當(dāng)決策者是有限理性時(shí)，他就得到ε-最優(yōu)解。一個(gè)最優(yōu)化算法，往往是通過(guò)迭代，通過(guò)f在A上的εn-最優(yōu)解的一個(gè)序列（εn→0）來(lái)逼近f在A上的最優(yōu)解;或者更一般地，往往是通過(guò)迭代，通過(guò)fn（滿(mǎn)足fn→f）在An（滿(mǎn)足An→A）上的εn-最優(yōu)解的一個(gè)序列（εn→0）來(lái)逼近f在A上的最優(yōu)解。推而廣之，數(shù)學(xué)中的各種迭代算法或者說(shuō)逐次逼近算法，往往都是通過(guò)有限理性來(lái)逼近完全理性。

以下給出兩個(gè)最優(yōu)化問(wèn)題的逼近定理，具體證明可見(jiàn)俞建的《有限理性與博弈論中平衡點(diǎn)集的穩(wěn)定性》及俞建、賈文生的《有限理性研究的博弈論模型》[19-20]，當(dāng)然假設(shè)條件還可減弱。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

有限理性與逼近定理