(蘭州財經大學 甘肅 蘭州 730020)
“博弈”本意是下棋,為了利益而進行的競爭。作為一種爭取利益的手段,始終伴隨著人類的發(fā)展。但是博弈論作為一門科學理論,是匈牙利數(shù)學家約翰﹒馮﹒諾依曼在1928年開始逐漸建立起來。起先博弈論只是一套數(shù)學理論,未受到人們的關注。在1944年,由馮﹒諾依曼和摩根斯坦合著的《博弈論與經濟行為》的出版,將單純的二人博弈推廣到了n人;同時將博弈論運用在經濟領域中,也正是在經濟領域中難以替代的作用,才成就了這一理論體系?,F(xiàn)如今,博弈論的應用非常廣泛,在經濟中尤為突出。到目前為止因博弈論研究而獲得諾貝爾經濟學獎的經濟學家占諾貝爾獎得主的比例是最高的。由此可以看出博弈論的無可替代的影響力和重要性。
博弈論是指雙方或者多方在競爭、合作、沖突等狀況下,充分了解信息并依此尋找一種能自己爭取最大利益的或最小損失的最優(yōu)決策的理論,又叫對策論,它作為現(xiàn)代數(shù)學與運籌學相結合形成的學科,主要用來實現(xiàn)博弈參與者最大化效用以及不同參與者之間決策的均衡,同時為理性的參與者找到其應該采用的最佳策略。
其中,博弈有4個要素,即參與者(至少2人)、利益、信息、策略。博弈可分為正和博弈、零和博弈與負和博弈,在經濟學中均有著廣泛的運用。
博弈論最早是在什么時候被應用于經濟領域目前無任何記載,但其在經濟活動中的作用是絕對不容忽略的。由于博弈論的發(fā)展是經濟學史上的一次巨大的飛躍,它為人們解決問題提供了一種新的方法,基于此,研究博弈論的經濟學家在1994年、1996年、2005年均榮獲了諾貝爾經濟學獎。從中我們不難看出博弈論不僅成為經濟學中思考問題的一種重要手段,也在國際上受到了高度的關注。
“囚徒困境”是1950年美國的梅里爾·弗勒德和梅爾文·德雷希爾提出困境理論,后由艾伯特·塔克以囚徒方式闡述,由此命名為“囚徒困境”??紗栴}的一種重要手段,也在國際上受到了高度的關注。比如市場經濟環(huán)境下競爭是常態(tài),但是競爭面臨一個很大的問題就是囚徒困境。通常表現(xiàn)在同行之間的惡性競爭—價格大戰(zhàn)。如果一方選擇降價,而另一方就只能選擇降價,否則將失去市場,收益受損——囚徒困境。這個問題也存在于社會生活中,這種競爭往往是不利的。然而合作也是常態(tài),這也是走出囚徒困境的最有效的方式。當然合作的前提是共同利益,合作就意味著雙方的讓利。也就是說合作能帶來更高的利益,同樣也承擔著伙伴背叛的風險。而這種風險的降低則需要道德標準、制度安排、信息披露和社會關系等[1]。
博弈中,如果參與者事先掌握了相關的信息和知識,那么他們的行動的目的性就會被增強,行動就會更有規(guī)劃。但是并不是所有的參與者所獲得的信息都是均等的。羅伯特·奧曼在他的一篇論文中說:“信息的披露會導致博弈雙方資源的配置情況發(fā)生變化,并最終改變博弈的結果”[2]。下面以具體案例進行分析:
兩個同謀犯罪的人同時被捕入獄,且相互隔離不能溝通。如果兩個人都不揭發(fā)對方,則會由于證據不足,兩個人都坐牢1年;如果一個人揭發(fā),另一個人沉默,則揭發(fā)者因為揭發(fā)有功無罪釋放,而沉默者就會坐牢6年;如果兩個人相互揭發(fā),會由于證據確鑿,都會坐牢3年。由于相互的不信任,所以雙方都會揭發(fā)對方。博弈的矩陣如表1所示:
表1
由表1我們可以看到,相互揭發(fā)對方并不是兩人的最優(yōu)策略,然而雙方為什么會這樣選擇呢?雙方在被隔離的情況下也就避免了串供的可能,罪犯A和B所掌握的信息完全,但是他們不知道對方是否會揭發(fā)自己。出于對自己有利的考慮,罪犯A會考慮選擇揭發(fā)對方對自己有利,還是沉默對自己有利。如果選擇揭發(fā)對方自己可能坐3年牢或者釋放;如果選擇沉默,自己可能會坐6年或1年牢,這時(3,0)與(6,1)做比較,當然是(3,0)對自己更有利。這樣罪犯A會選擇揭發(fā)對方。同樣的罪犯B同樣也會這樣想,而做出相同的決策。
經濟中也存在相同的問題。家電價格戰(zhàn):20世紀初,由于彩電行業(yè)為寡頭控制的,9大廠商控制了70%的市場份額。1999年4月,長虹為擴大市場宣布彩電產品降價,各整個行業(yè)市場造成巨大震動,隨即康佳、TCL、創(chuàng)維達成默契:建立彩電聯(lián)盟。直到4月20日上午,康佳仍表示不降價,但是當晚即改變主意,使得TCL和創(chuàng)維措手不及,價格戰(zhàn)立即蔓延。大家都降價對于各自的擴大市場沒有多大幫助,反而使得利潤都被削弱了,1996~2000年,彩電行業(yè)發(fā)生大的價格戰(zhàn)達到8次以上,整個行業(yè)的利潤被極大削減,全行業(yè)進入虧損,信息產業(yè)部統(tǒng)計價格戰(zhàn)使行業(yè)利潤減少147億元。
價格戰(zhàn)于人于己都不利,這明顯是一個簡單的囚徒困境博弈。對于雙方而言,降價都是“優(yōu)勢策略”。當年8月康佳響應長虹的降價20%口號,率先脫離9家同盟會,價格戰(zhàn)再次開打。所以,任何同盟都抵擋不住“先下手為強”的背義利益。由此可見,博弈論在囚徒困境中得到了有效應用。
智豬博弈涉及到一個著名的納什均衡的例子,在1950年由約翰·納什提出的。設計一個這樣的豬圈,假如豬圈里有2頭豬,一大一小,而且在一個槽里進食豬必須到豬圈的另一邊按下按鈕,才能將一定量的食物落到食槽中。假如每次落下10份,兩頭豬都有智慧。一只豬按下按鈕,另一只豬就會搶先進食。由于按鈕到食槽有一定的距離,按完按鈕的豬再趕到食槽時,食物必然會減少。如果大豬去按按鈕,小豬會等在食槽旁。由于返回食槽需要一定的時間。最終大豬和小豬進食的比例是5:5;如果小豬前去按按鈕,則大豬等在食槽旁,大豬進食快于小豬,等小豬返回食槽時,食物已經被大豬吃完。大豬小豬的進食比例為10:0;如果大豬和小豬都不去啟動按鈕,結果為大豬和小豬的進食比例為0:0。博弈的矩陣如表2所示:
表2
由表2可以看出,對小豬而言,等在食槽旁或許有吃的,而若是去碰按鈕,結果是什么也吃不到。所以小豬的優(yōu)勢策略就是等在食槽旁邊。對于大豬而言,它若是選擇啟動按鈕,還會有一半的食物,如果不去,結果是都沒吃的。于是便形成了大豬忙碌,小豬坐享其成。這與囚徒困境模式有所不同,在囚徒困境模式中雙方都有各自的嚴格優(yōu)勢策略,而在智豬博弈模式中只有小豬嚴格優(yōu)勢策略,且小豬損害大豬的利益適中。
在股票市場上也存在搭便車現(xiàn)象,在這里我們不討論其中的道德問題的問題。股票和證券市場上的博弈過程是非常復雜的。依據投資金額的多少,我們將投資者分為大戶投資者和散戶投資者。因為大戶投資者的投資金額較大,為了降低風險,他們在投資前都會對股市的具體情況或是未來情況進行技術分析,這需要專業(yè)的分析人員或分析公司做出預測和分析,這都需要一定的投入,當然大戶投資者會將這部分投資計入總投資中。因此相對于散戶,大戶投資者的投資計劃就更為可靠。
在確定股票后,他們就會收集該股票的信息,確保以較低的價格吃進。而對于散戶來說,最好的策略就是清楚了解大戶投資者的策略,跟緊大戶投資者吃進同一種股票。這樣,散戶便像“小豬”那樣守株待兔了。當然這只是一理想化的模型,在股票和證券交易市場中存在很大的不確定性,且大戶與小戶之間的博弈也十分復雜,畢竟大戶投資者不會像“大豬”那樣傻乎乎的忙碌。由此可見,博弈論在智豬博弈中同樣得到了廣泛應用。
獵鹿博弈(SHG)又叫獵鹿模型,指對應與信任困境,它最早起源于法國啟蒙思想家盧梭的著作《論人類不平等的起源和基礎》中的一個故事[3]:從前的一個村莊里有兩個獵人,他們以打獵為生。一天兩人一同出去打獵,不久他們就發(fā)現(xiàn)了一只梅花鹿。他們很高興,準備一起抓住梅花鹿。當時的情況是,梅花鹿可以逃走的路有2條,分被兩個獵人守住,也就是說有一個人放棄圍獵,則不能抓住梅花鹿。意外的事發(fā)生了。正當兩人圍捕梅花鹿的時候,突然從旁邊跑出一群兔子。如果其中一個獵人去抓兔子,可以抓3只,能吃3天。如果兩人同心協(xié)力抓住梅花鹿,從所得利益的多寡來看,一只梅花鹿可以讓他們每人吃10天。博弈的矩陣如表3。
表3
情況一:兩個人都去抓兔子,則都得到3天的收益;情況二:其中一個人去抓兔子,另一個人捕鹿,則抓兔子的獵人獲得3天的收益,捕鹿的獵人一無所獲;情況三:兩個人團結合作,都選擇捕鹿,則兩個人都得到10天的收益。
我們可以看出,這場博弈中存在2個納什均衡。分別是:甲、乙精誠合作捕鹿,都獲得10天的收益;甲、乙都選擇抓兔子,各自獲得3天的收益。對于這兩種選擇來說,很明顯前者給他們帶來的利益最大。這也正是獵鹿模型所反映的問題,即合作可以產生最大的利益。
應該知道,我們國家的房地產行業(yè)是從19世紀70-80年代起步的,21世紀初,隨著各地房價的不斷上漲,房地產行業(yè)不斷壯大,這跟它對資源的聚積規(guī)模和聚積速度有非常大的關系。然而在20世紀90年代初,那時海南等地的房地產泡沫破裂,政府為了保證國家經濟安全,預防房地產過熱對經濟發(fā)展產生更為不利影響,出臺了緊縮銀根的政策。此政策的出臺對房地產開發(fā)商的沖擊巨大,甚至會切斷了房地產炒作的資金鏈。
房地產開發(fā)商利用媒體和其他機構的影響力,召開研討會,極力勸說政府放松銀根政策。在巨大的利益面前,房地產開發(fā)商們沒有各自為戰(zhàn),而是選擇合作,壯大了他們的影響力和經濟實力,為博弈添加了籌碼,實現(xiàn)了利益的最大化??梢哉f,博弈論在獵鹿博弈中得到了充分的應用。
博弈與人類生活的關系密切,它可以幫助我們應對方方面面的問題,但是以上的舉例都是單階段的非合作博弈,有些問題的解釋仍需重復博弈去解釋。囚徒困境是博弈論中非零和博弈的具有代表性的例子,反映了個人利益的最優(yōu)選擇并非是團隊利益的最優(yōu)選擇。這里我們應該學會選擇,首先,團隊利益總和要高于個人利益總和;其次,在結果上各自的收益也會比實際所得利益要高。從表1我們可以看出,(1,1)的結果才是對雙方最有利的,同時又很難辦到,因為當你選擇沉默的時候,并不能保證對方也沉默,單方面的沉默所承擔的風險過大。
智豬博弈與囚徒困境的不同就在于:囚徒困境中的參與者都有自己的嚴格優(yōu)勢策略;但智豬博弈中,只有小豬有嚴格優(yōu)勢策略,而大豬沒有。智豬模型聽起來有些可笑,但是不可否認的是,確實存在這種均衡的博弈模型。小豬智慧之處就在于,它了解自己的實力有限,想要吃飯,就得借助外力,當然,這個外力可以是自然的或是人為的;而人為可以是朋友的或是對手的。在這個博弈中,弱者對強者的利益造成了一定程度的損害,這是會有兩種結果:其一,這個損害在強者可以接受的范圍之內,強者會忍痛接受;其二,這個損害超過了強者愿意接受的底線,則強者可能會終結弱者。這就說,弱者也需要擁有一定的能力,對強者形成一定的威脅且能長久保持。
獵鹿博弈中,雙方合作所獲得的收益比各自為政的多,這說明合作雙贏的機會是存在的。2013年1-5月我國共對全球144個國家和地區(qū)的2000多家境外企業(yè)進行了直接投資實現(xiàn)非金融類對外直接投資343億美元,增長20%,對外承包工程業(yè)務完成營業(yè)額437億美元,增加19%。(2013年5月我國對外投資和經濟合作數(shù)據)由此可見,與人合作更容易獲得成功。合作有兩個前提:共同利益和誠信保障[4]。在囚徒困境中減刑便是共同利益,智豬博弈中進食為共同利益,獵鹿博弈中捕鹿就是共同利益,但是利益分配不公也會破壞合作,正是由于這種誠信保障的缺乏和不公的分配,才造成了這樣的困境。
所以,囚徒困境啟示我們要學會選擇;智豬博弈指示我們要策略化思維;獵鹿博弈鼓勵我們要學會合作。不得不說博弈論在經濟學中有著非同凡響的重要意義。相信在未來的幾年,博弈論將會得到更加廣泛的應用。