曲文秀 曲德祥
博弈論的含義
博弈論(Game Theory),也稱為對策論,或者賽局理論,是應(yīng)用數(shù)學(xué)的一個分支,也是運籌學(xué)的一個重要學(xué)科。目前在、國際關(guān)系、計算機科學(xué)、生物學(xué)、經(jīng)濟學(xué)、軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。是研究具有斗爭或競爭性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法。博弈論考慮游戲中的個體的預(yù)測行為和實際行為,并研究它們的優(yōu)化策略。
博弈行為即具有競爭或?qū)剐再|(zhì)的行為。在這類行為中,參加斗爭或競爭的各方各自具有不同的目標(biāo)或利益。為了達到各自的目標(biāo)和利益,各方必須考慮對手的各種可能的行動方案,并力圖選取對自己最為有利或最為合理的方案。比如日常生活中的下棋,打牌等。博弈論就是研究博弈行為中斗爭各方是否存在著最合理的行為方案,以及如何找到這個合理的行為方案的數(shù)學(xué)理論和方法。
博弈論的數(shù)學(xué)說明
對于“博弈”有不少可以互換的定義。這里給出簡短的介紹和相互關(guān)系的說明。正規(guī)形式的博弈又被譯為正則形式的博弈、策略型賽局或標(biāo)準(zhǔn)型賽局。
設(shè)定 N 是一個“參與者”的集合。對于每一個“參與者”都有一個給定的“策略”集合博弈(游戲)是一個函數(shù), 定義為:
也就是說,如果我們知道了參與者的策略集合是什么,那么就可以有一個實數(shù)值與之對應(yīng)。 我們可以把上面的方程拆成兩個方程來進一步把它一般化。一個方程是正則形式的參與者程,描述策略規(guī)定結(jié)果的方式。 另外一個方程描寫參與者對于結(jié)果集合的偏好。也就是:
這里 是游戲(博弈)的結(jié)果集合。對于每一個參與者 都有一個偏好函數(shù) 。
當(dāng)代博弈論領(lǐng)軍人物
當(dāng)代博弈論的領(lǐng)軍人物有:約翰?福布斯?納什、約翰?C?海薩尼,萊因哈德?澤爾騰。這三人同時因為他們對博弈論的突出貢獻而獲得1994年諾貝爾經(jīng)濟學(xué)獎。以及羅伯特?J?奧曼、肯?賓摩爾、戴維?克瑞普斯,以及阿里爾?魯賓斯坦等人。他們都為博弈論的發(fā)做出了卓越貢獻。
博弈的分類
博弈的分類根據(jù)不同的基準(zhǔn)也有不同的分類。博弈主要可以分為合作博弈和非合作博弈。它們的區(qū)別在于相互發(fā)生作用的當(dāng)事人之間有沒有一個具有約束力的協(xié)議,如果有,就是合作博弈,如果無,則是非合作博弈。
從行為的時間序列性來看,博弈論又進一步分為靜態(tài)博弈和動態(tài)博弈。靜態(tài)博弈中,參與人同時選擇或雖非同時選擇但后行動者并不知道先行動者采取了什么具體行動;動態(tài)博弈是指在博弈中,參與人的行動有先后順序,且后行動者能夠觀察到先行動者所選擇的行動。
按照參與人對其他參與人的了解程度分為完全信息博弈和不完全信息博弈。完全博弈是指在博弈過程中,每一位參與人對其他參與人的特征、策略空間及收益函數(shù)有準(zhǔn)確的信息。如果參與人對其他參與人的特征、策略空間及收益函數(shù)信息了解的不夠準(zhǔn)確、或者不是對所有參與人的特征、策略空間及收益函數(shù)都有準(zhǔn)確的準(zhǔn)確信息,在這種情況下進行的博弈就是不完全信息博弈。
目前經(jīng)濟學(xué)家們現(xiàn)在所談的博弈論一般是指非合作博弈,由于合作博弈論比非合作博弈論復(fù)雜,在理論上的成熟度遠(yuǎn)遠(yuǎn)不如非合作博弈論。而非合作博弈又分為:完全信息靜態(tài)博弈,完全信息動態(tài)博弈,不完全信息靜態(tài)博弈,不完全信息動態(tài)博弈。與上述四種博弈相對應(yīng)的均衡概念為:納什均衡,子博弈精煉納什均衡,貝葉斯納什均衡,精煉貝葉斯納什均衡。
博弈論的應(yīng)用與將來
綜觀近二十年來,博弈論的發(fā)展及其應(yīng)用在研究上的巨大成就,可說是與其日益廣泛的實際應(yīng)用分不開的?,F(xiàn)在看來,博弈論的主要應(yīng)用領(lǐng)域涉及經(jīng)濟學(xué)、政治學(xué)、軍事學(xué)。演化生物學(xué)、計算機和人工
智能學(xué)、工程控制論等眾多理論,而且它還與社會心理學(xué)、倫理學(xué)、
會計學(xué)、統(tǒng)計學(xué)、企業(yè)管理、等學(xué)科有重要聯(lián)系。對于社會科學(xué)而言,博弈論可成為一種具有高度概括力的“統(tǒng)一場論”
介紹博弈論的重要概念——納什均衡
納什平衡,以約翰?納什命名。又稱為非合作賽局平衡,是博弈論的一個重要概念。如果某情況下無一參與者可以獨自行動而增加收益,則此策略組合被稱為納什均衡點。
經(jīng)典的例子就是囚徒困境。大意是:一個案子的兩個嫌疑犯被分開審訊,警官分別告訴兩個囚犯,如果你招供,而對方不招供,則你將被立即釋放,而對方將被判刑十年;如果兩人均招供,將均被判刑兩年。如果兩人均不招供,將最有利,只被判刑半年。于是,兩人同時陷入招供還是不招供的兩難處境。但兩人無法溝通,于是從各自的利益角度出發(fā),都依據(jù)各自的理性而選擇了招供,這種情況就稱為納氏均衡點。這時,個體的理性利益選擇是與整體的理性利益選擇不一致的。如下圖:
囚犯甲的博弈矩陣 囚犯甲
招供 不招供
囚犯乙 招供 各判刑兩年 甲判刑十年,乙立即釋放
不招供 甲立即釋放,乙判刑十年 各判刑半年
基于經(jīng)濟學(xué)中Rational agent的前提假設(shè),兩個囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被判刑半年就不會出現(xiàn)。事實上,這樣兩人都選擇坦白的策略以及因此被判兩年的結(jié)局被稱作是“納什均衡”(也叫非合作均衡),換言之,在此情況下,無一參與者可以“獨自行動”(即單方面改變決定)而增加收獲。
學(xué)術(shù)爭議和批評
第一,納什的關(guān)于非合作博弈論的平衡不動點解)學(xué)術(shù)證明是非構(gòu)造性的,就是說納什用角谷靜夫不動點定理證明了平衡不動點解是存在的,但卻不能指出以什么構(gòu)造算法如何去達到這個平衡不動點解。這種非構(gòu)造性的發(fā)現(xiàn)對現(xiàn)實生活里的博弈的作用是有限的,即使知道平衡不動點解存在,在很多情況下卻找不到,因此仍不能解決問題。在數(shù)學(xué)意義上,納什并沒有超越角谷靜夫不動點定理。
第二,納什的非合作博弈論模型僅僅是突破了博弈論中的一個局限。一個更大的局限是,博弈論面對的往往是由幾十億節(jié)點的龐大對象構(gòu)成的社會、經(jīng)濟等復(fù)雜行為,但馮?諾伊曼(Von Neumann)和納什的研究是針對兩三個節(jié)點的小規(guī)模博弈論(有人稱之為tiny-scale toy case)。這個假設(shè)的不完善處,可能比假設(shè)大家都是合作的更嚴(yán)重。因為在經(jīng)濟學(xué)里,一個龐大社會里的人極不可能全部都是合作的,非合作的情況通常在龐大對象的情形中更普遍,而在兩三個節(jié)點的小規(guī)模經(jīng)濟中倒反而影響較小。既然改了合作前提為非合作前提,卻仍然停留在兩三個節(jié)點的小規(guī)模博弈論中,這是一個不可忽視的缺陷。MIT的一位計算機科學(xué)博士生的博士論文——獲得2008年度美國計算機協(xié)會學(xué)位論文獎——認(rèn)為經(jīng)濟學(xué)家的推測是錯誤的,找到納什均衡點是幾乎不可能的事。
博弈論在經(jīng)濟學(xué)中的應(yīng)用
第一,定量分析與定性分析的結(jié)合。 把博弈論引入經(jīng)濟分析中的目的在于使經(jīng)濟分析數(shù)量化?,F(xiàn)代經(jīng)濟博弈論高度抽象、邏輯嚴(yán)密、分析問題深刻精確、多學(xué)科相關(guān)。在我們看來,經(jīng)濟分析的完全數(shù)量化只是一種理想。面對現(xiàn)實的復(fù)雜經(jīng)濟問題,只用采用以定性分析為主,定性分析和定量分析相結(jié)合的辦法,才能使分析得到切合實際較為滿意的結(jié)果。博弈論作為一種思想方法和分析工具,在經(jīng)濟學(xué)的應(yīng)用中大有可為,但遠(yuǎn)不能一次取代原有的經(jīng)濟理論和分析方法:經(jīng)濟學(xué)科需要的是兩者適當(dāng)?shù)慕Y(jié)合。
第二,未得到滿意解決的難題。在博弈論的發(fā)展和普及過程中,許多理論和具體應(yīng)用的難題遠(yuǎn)未得到滿意的解決。這些有待于進一步探討的問題,涉及到經(jīng)濟環(huán)境的博弈描述如何進一步包括社會制度、文化心理、技術(shù)發(fā)展、資源稟賦等因素;博弈的基本“解概念”如何進一步精化和適用于更為現(xiàn)實的經(jīng)濟環(huán)境狀況;博弈的建模技術(shù)、分析方法和求解手段如何進一步發(fā)展;博弈論的應(yīng)用領(lǐng)域如何逐步拓寬;博弈論在經(jīng)濟學(xué)的研究和應(yīng)用中如何求得更廣泛的普及、等等、這些問題的解決,需要各方熱心于博弈論發(fā)展和應(yīng)用的力量,進行共同的持續(xù)不斷的努力。(第一作者系西南大學(xué)文化與社會發(fā)展學(xué)院;第二作者供職于山東省煙臺市兒童影劇院 )