徐 雷(渤海大學(xué)管理學(xué)院,遼寧錦州121013)
博弈論又被稱為對(duì)策論(Game Theory),是現(xiàn)代數(shù)學(xué)的一個(gè)分支。它是一門研究沖突與合作的學(xué)問。在這種沖突與合作中,參與人之間相互影響,這些參與人可以是個(gè)人、公司、集團(tuán)甚或是它們的組合。幾乎所有社會(huì)科學(xué)領(lǐng)域中都活躍著與博弈論交叉的分支學(xué)科,為滿足當(dāng)代大學(xué)生對(duì)博弈論知識(shí)的需求,越來越多的高校正在不斷加大博弈論課程的建設(shè)力度[1]。作為學(xué)?!肮芾聿┺恼摗闭n程的主講教師,筆者認(rèn)為,當(dāng)前高等院校中的博弈論教學(xué)除了講授博弈論基本理論知識(shí)外,還應(yīng)引導(dǎo)學(xué)生培養(yǎng)博弈思維,將博弈分析潛質(zhì)開發(fā)出來。因此,應(yīng)設(shè)計(jì)與講授內(nèi)容直接聯(lián)系的課堂博弈活動(dòng),讓學(xué)生參與其中,從而提高學(xué)生對(duì)博弈論思想的理解,增強(qiáng)學(xué)生運(yùn)用博弈論的能力,進(jìn)而將書本中的抽象知識(shí)轉(zhuǎn)化為現(xiàn)實(shí)中解決問題的實(shí)際能力。然而,即使是課堂博弈也需要對(duì)博弈支付進(jìn)行科學(xué)設(shè)定,如果按照一般的方法——以貨幣作為支付,則勢必增加課堂教學(xué)成本。筆者通過對(duì)多年的教學(xué)經(jīng)驗(yàn)進(jìn)行總結(jié),提出以課程成績作為支付的方法,這不僅節(jié)省了成本,與貨幣支付相比,它還存在一些天然的優(yōu)勢,值得推廣。
博弈論思想源遠(yuǎn)流長。中國古代的《孫子兵法》《三十六計(jì)》等兵書都蘊(yùn)含著樸素的博弈論思想,但這些思想沒有能夠發(fā)展成為系統(tǒng)的理論。作為一門正式的理論,博弈論的發(fā)展大致經(jīng)歷了這樣的一個(gè)過程:1838年,法國經(jīng)濟(jì)學(xué)家安東尼·奧古斯丁·庫爾諾(又譯作古諾)提出了一個(gè)雙寡頭產(chǎn)量競爭模型,即古諾模型。1883年,法國經(jīng)濟(jì)學(xué)家約瑟夫·伯特蘭德(Joseph Bertrand)提出了價(jià)格競爭模型,即伯特蘭德模型。1925年,埃奇沃思自己編輯,以皇家經(jīng)濟(jì)學(xué)會(huì)的名義出版了他的《經(jīng)濟(jì)學(xué)論文選集》之卷本,研究了兩個(gè)寡頭的產(chǎn)量與價(jià)格壟斷。1934年,《市場結(jié)構(gòu)和平衡》出版,作者斯塔克爾伯格,提出了著名的斯塔克爾伯格模型。1944年,《博弈論與經(jīng)濟(jì)行為》出版,作者馮·諾依曼和摩根斯坦。
以上這些思想奠定了現(xiàn)代博弈論的基礎(chǔ),但系統(tǒng)的博弈理論是在20 世紀(jì)50、60年代由納什、澤爾騰和海薩尼等人發(fā)展起來的。代表性著作包括1950年發(fā)表的《n 人博弈的均衡點(diǎn)》(納什);1951年的《非合作博弈論》(納什);1964年澤爾騰發(fā)表了論文《n 人博弈的評(píng)價(jià)》;1965年,澤爾騰發(fā)表了他最著名的博弈論論文《一個(gè)具有需求慣性的寡頭博弈模型》,定義了子博弈精煉(subgame perfectness)的概念;海薩尼在1967-1968年間分三部分發(fā)表了其論文《由“貝葉斯”參與人進(jìn)行的不完全信息博弈》;1975年,澤爾騰發(fā)表了論文《擴(kuò)展式博弈精煉均衡概念的重新考察》。1994年,納什、澤爾騰、海薩尼三人獲得了諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),以表彰他們?cè)诜呛献鞑┺恼擃I(lǐng)域作出的開創(chuàng)性貢獻(xiàn)。
由于博弈論聚焦于行為分析,其均衡由參與人的行動(dòng)組合構(gòu)成,因此,該理論迅速應(yīng)用于多個(gè)領(lǐng)域,主要包括:(1)經(jīng)濟(jì)學(xué),尤其是產(chǎn)業(yè)組織領(lǐng)域。代表性人物是泰勒爾,他1988年出版的教材《產(chǎn)業(yè)組織理論》,至今仍被國內(nèi)外高校列為產(chǎn)業(yè)組織領(lǐng)域的必讀書目[2];(2)政治學(xué),尤其是國際政治。代表性人物是托馬斯·謝林,其著作《沖突的戰(zhàn)略》(1960)首次定義并闡明了威懾、強(qiáng)制性威脅與承諾、戰(zhàn)略移動(dòng)等概念,開始把關(guān)于博弈論的洞察力作為一個(gè)統(tǒng)一的分析框架來研究社會(huì)科學(xué)問題,并對(duì)討價(jià)還價(jià)和沖突管理理論做了非常細(xì)致的分析[3]。(3)生物學(xué)。代表性人物約翰·梅納德·史密斯(John Maynard Smith,1920-2004),《演化與博弈論》是演化博弈論研究領(lǐng)域的經(jīng)典著作[4]。1982年,約翰·梅納德·史密斯因此書的出版被稱為演化博弈論之父。在《演化與博弈論》中,作者把博弈論的思想納入到生物演化的分析中,揭示了動(dòng)物群體行為變化的動(dòng)力學(xué)機(jī)制。
可見,博弈論在經(jīng)濟(jì)學(xué)、政治學(xué)乃至生物學(xué)等學(xué)科的本科和研究生教學(xué)中占據(jù)了重要位置。然而,由于博弈論引入我國相對(duì)較晚,較為流行的教材也僅限于張維迎的《博弈論與信息經(jīng)濟(jì)學(xué)》和謝識(shí)予的《經(jīng)濟(jì)博弈論》等有限的幾部。因此,普通高校在博弈論課程建設(shè)上相對(duì)滯后,不能適應(yīng)博弈論近年來的迅猛發(fā)展。即使是在已經(jīng)開設(shè)了博弈論課程的高校,由于實(shí)驗(yàn)手段、設(shè)備、經(jīng)驗(yàn)的不足,課程教學(xué)也僅能專注于理論的講授,在重要的學(xué)生課堂參與環(huán)節(jié)缺乏實(shí)踐。本文將對(duì)這一問題進(jìn)行探討,總結(jié)和闡述以課程成績?yōu)橹Ц督M織學(xué)生進(jìn)行課堂博弈的實(shí)施方法。與以貨幣為支付的組織方式相比,這種形式不僅具有節(jié)約成本的優(yōu)勢,而且還具備理性人假設(shè)下,參與人對(duì)支付感知程度一致性的優(yōu)點(diǎn),具有重要的推廣意義。
在博弈論課程的教學(xué)中,課堂博弈對(duì)教學(xué)效果的提升具有重要作用。目前,在國際流行的博弈論教材中,已經(jīng)開始結(jié)合課程內(nèi)容進(jìn)度設(shè)計(jì)專門的課堂博弈環(huán)節(jié)(如Eric Rasmusen 的《Games and Information》),引領(lǐng)學(xué)生更加深刻地理解博弈論的精髓[5]。這種課堂博弈是一種簡單的行為實(shí)驗(yàn),比較適合在課堂上進(jìn)行的如公共物品捐贈(zèng)、消耗戰(zhàn)、討價(jià)還價(jià)等。當(dāng)在課堂上進(jìn)行這些行為實(shí)驗(yàn)時(shí),學(xué)生自然成為參與人,行動(dòng)集、行動(dòng)順序、信息等博弈規(guī)則均在事前約定,此時(shí),博弈支付就成為最為重要的一個(gè)要素,對(duì)它的設(shè)置能夠影響博弈結(jié)果,進(jìn)而對(duì)學(xué)生能否通過課堂博弈更為深刻地理解博弈理論產(chǎn)生重要影響。
目前,在國內(nèi)外博弈論教學(xué)實(shí)踐中更多的是以貨幣作為博弈支付。以貨幣為支付是一種自然的選擇,它能夠直接反映人的物質(zhì)需求。然而,以貨幣為支付在課堂博弈中應(yīng)用也存在著幾點(diǎn)不足。首先,博弈論對(duì)行為實(shí)驗(yàn)往往有參與人偏好一致的前提假設(shè),因此,如果以貨幣為支付,那么參與人應(yīng)對(duì)貨幣支付具有一致的偏好,即參與人的效用函數(shù)應(yīng)是相同的。然而,這一假設(shè)在以學(xué)生為參與人的條件下很容易被打破。一方面,大多數(shù)學(xué)生尚未有勞動(dòng)收入,對(duì)獲取貨幣的難易程度的感知十分主觀,這就導(dǎo)致學(xué)生的效用函數(shù)存在差異;另一方面,就是學(xué)生的效用函數(shù)具有一致性,但由于家庭條件的差異,學(xué)生間的每月生活預(yù)算也有很大不同,這會(huì)導(dǎo)致貨幣支付的邊際效用在學(xué)生間存在差異。其次,以貨幣為支付就要求每次課堂博弈都要付出一定的成本,以我國當(dāng)前的課堂教學(xué)來看,這種成本付出是不現(xiàn)實(shí)的,因此,這種方式并不適合大規(guī)模應(yīng)用。
基于以上兩點(diǎn)原因,以貨幣為支付在課堂博弈中存在重要局限,所以,有必要尋找其他更為理想的支付手段。當(dāng)行為實(shí)驗(yàn)的參與人為學(xué)生時(shí),很自然地,我們考慮是否可以以課程成績作為博弈支付以及具體的實(shí)施辦法。這里,我們從以下幾方面進(jìn)行探討。
第一,以學(xué)生為參與人時(shí),成績自然是參與人的共同關(guān)注點(diǎn)。成績的高低能夠?qū)⑴c人效用產(chǎn)生重要影響,這種影響甚至超過貨幣。當(dāng)然,效用函數(shù)仍具有主觀性,成績對(duì)效用的影響在個(gè)體間仍存在差異性,但這種差異性是小于貨幣支付的。這主要是由于成績具有滿分這一最高值,其邊際效用在個(gè)體間的差異性較貨幣支付更小。因此,學(xué)生對(duì)成績的關(guān)注度具有更強(qiáng)的共性,與貨幣相比,成績更適合在課堂博弈中作為支付。
第二,課堂博弈的成績?cè)诳偝煽冎械谋壤?。?dāng)前,我國高校教學(xué)改革的方向是更加注重過程化考核,因此,可以課堂博弈作為博弈論課程過程化考核的一個(gè)重要組成部分。然而,博弈論課程的理論學(xué)習(xí)和實(shí)踐具有較大差異。在理論學(xué)習(xí)中,學(xué)生應(yīng)明白個(gè)體理性和集體理性在博弈結(jié)果和均衡達(dá)成中的作用。而在實(shí)踐中,往往是更加“理性”的個(gè)體能夠獲得更大的支付。當(dāng)然,這能夠誘導(dǎo)學(xué)生探討如何在實(shí)踐中運(yùn)用激勵(lì)和約束等手段對(duì)個(gè)體理性加以限制,但在課堂博弈中,如果賦予的成績?cè)诳偝煽冎姓急冗^大,是否會(huì)使學(xué)生產(chǎn)生個(gè)體理性比集體理性更加具有現(xiàn)實(shí)意義的思維傾向?如果產(chǎn)生這種傾向,對(duì)學(xué)生未來的成長會(huì)產(chǎn)生怎樣的影響,還存在不確定性。因此,課堂博弈的成績應(yīng)在課程總成績中占比不超過20%。這樣的設(shè)置既能讓學(xué)生充分重視課堂博弈結(jié)果,從而強(qiáng)化對(duì)博弈論的理解,又能讓學(xué)生不易陷入到無謂的爭執(zhí),從而影響其價(jià)值判斷。
第三,因?yàn)槭侨珕T參與,所以要考慮適用的班型。如果把課堂博弈作為一項(xiàng)考核,就需要全體學(xué)生參與??墒且淮涡袨閷?shí)驗(yàn)所需要的參與人是有限的,如果教學(xué)班型太大,則不適合組織課堂博弈。只有在60 人以內(nèi)的中小班型中開展課堂博弈,才是比較適宜的。即使一些行為實(shí)驗(yàn)所需的參與人很少,也可以將班級(jí)進(jìn)行分組,從而同時(shí)展開。這樣的教學(xué)模式便于教師的組織和記錄,有利于教學(xué)效果的提升。
第四,營造課堂博弈所需要的軟硬件環(huán)境。課堂博弈的進(jìn)行需要一定的軟硬件環(huán)境,如一些博弈要求參與人之間不能進(jìn)行交流,因此需要足夠大的空間。另外,可利用Z-Tree 軟件在計(jì)算機(jī)教室中組織課堂博弈,極大地方便了課堂博弈的組織實(shí)施和博弈結(jié)果的記錄與分析。
每個(gè)公司由5-6 名同學(xué)組成①。每年,公司都要決定是否仍繼續(xù)參與市場競爭。如果繼續(xù)競爭,公司會(huì)產(chǎn)生每年300 的固定成本,和每單位產(chǎn)品為2 的邊際成本。公司要做的是在[0,1,2,3,4,5,6,7,8,9,10]的集合中選擇一個(gè)商品售價(jià)。公司的虧損可以任意多。
市場需求在售價(jià)不大于10 時(shí)是60,且無彈性。如果售價(jià)高于10,則需求降為0。
每個(gè)公司要在一張紙條上寫下它所定的售價(jià)或者是“退出”,然后將紙條折疊交給教師。所有公司交齊后,教師將最低出價(jià)進(jìn)行公布,售價(jià)最低的公司平分60 的市場需求。每個(gè)公司的利潤就是它的銷售收入(銷售量乘以售價(jià))減去固定成本(300)和可變成本(銷售量乘以2)。
博弈從新的一年開始,如果公司選擇退出則是永久的退出,不能夠重新進(jìn)入市場。博弈一直持續(xù),直到只剩下一家公司,此時(shí)該公司得到2000 的獎(jiǎng)勵(lì),因?yàn)樗蔀榱耸袌鲋械膲艛嗾摺T诘?0 輪博弈結(jié)束后,給仍留在市場中的公司一次談判的機(jī)會(huì),即它們是否選擇結(jié)束博弈,如果結(jié)束則它們平分2000 的獎(jiǎng)勵(lì);如果選擇繼續(xù),則博弈繼續(xù)到僅剩一家公司為止或者課堂時(shí)間結(jié)束。如果最后僅剩一家公司,則它獨(dú)占2000的獎(jiǎng)勵(lì),如果博弈進(jìn)行到課堂時(shí)間結(jié)束仍有多于1 家的公司,則它們不能獲得獎(jiǎng)勵(lì)。
此博弈在課堂中進(jìn)行,課堂時(shí)間100 分鐘。博弈進(jìn)行前的規(guī)則解釋和博弈結(jié)束后的總結(jié)分析用時(shí)40 分鐘,博弈用時(shí)60 分鐘。學(xué)生人數(shù)57人,分為6 個(gè)公司。博弈共進(jìn)行10 輪。第一輪博弈最低出價(jià)為4,無公司退出;第二輪博弈最低出價(jià)為1,無公司退出;3-6 輪次中最低出價(jià)均為2。第五輪退出1 家公司,第六輪退出2 家公司。7-10 輪次中最低出價(jià)為3。剩余3 家公司在第十輪結(jié)束后達(dá)成和解,平分了2000 的獎(jiǎng)勵(lì)。
表1 博弈過程與結(jié)果表
從博弈結(jié)果看,利潤最高的企業(yè)為最先退出的企業(yè),而堅(jiān)持到最后的企業(yè)即使得到了獎(jiǎng)勵(lì),在利潤總額上也是最少的。從理論分析來看,該行業(yè)顯然是一個(gè)自然壟斷行業(yè),僅當(dāng)行業(yè)中只有一家企業(yè)的時(shí)候才會(huì)產(chǎn)生正的理論。在兩參與人的消耗戰(zhàn)中,博弈均衡應(yīng)為(堅(jiān)持,退出)或(退出,堅(jiān)持),即參與人的占優(yōu)策略應(yīng)是(對(duì)方選擇堅(jiān)持則選擇退出,對(duì)方選擇退出則選擇堅(jiān)持)。而在多參與人的消耗戰(zhàn)中情況則更為復(fù)雜,參與人必須對(duì)其他參與人的策略進(jìn)行判斷才能選擇更加合適的行動(dòng)。從整體上看,博弈結(jié)果與理論預(yù)期是相符的。
此次課堂博弈占課程總成績的比重為15%,即滿分為15 分。參與即得到7 分,利潤最高公司的同學(xué)加6 分,第二高的加5 分……利潤最低的加0 分。博弈結(jié)束后每個(gè)公司需要上交一份書面總結(jié),該總結(jié)為2 分。在課堂博弈中,學(xué)生十分重視每輪的支付情況,組內(nèi)對(duì)每輪行動(dòng)均能夠進(jìn)行有效的討論。實(shí)踐結(jié)果表明,以課程成績作為支付發(fā)揮了應(yīng)有的效果。
隨著博弈論的不斷發(fā)展及其對(duì)其他學(xué)科的影響不斷加深,越來越多的高校已經(jīng)開設(shè)了博弈論課程。然而,作為博弈論教學(xué)重要實(shí)踐方式的課堂博弈卻被很多教師在教學(xué)過程中忽略了。這主要是因?yàn)檎n堂博弈作為一種行為實(shí)驗(yàn),往往以貨幣作為支付,這就大大提高了組織成本,從而降低了課堂博弈的可實(shí)施性。
本文探討了以學(xué)生成績作為課堂博弈支付的可行性,同時(shí)對(duì)課堂博弈的組織方式和所需的軟硬件環(huán)境進(jìn)行了分析,對(duì)當(dāng)前我國博弈論教學(xué)效果的提升具有一定意義。另外,在經(jīng)濟(jì)學(xué)、政治學(xué)和社會(huì)學(xué)等學(xué)科中,時(shí)常需要組織行為實(shí)驗(yàn)來開展學(xué)術(shù)研究,而高校中的這種行為實(shí)驗(yàn)經(jīng)常以學(xué)生為被試,因此,如果能夠?qū)⒄n堂博弈與學(xué)術(shù)研究中的行為實(shí)驗(yàn)相結(jié)合,則既可以節(jié)省研究經(jīng)費(fèi),又能夠讓學(xué)生親身參與到課題研究中來,進(jìn)而加深對(duì)博弈論的認(rèn)識(shí)。這是教學(xué)促進(jìn)科研、科研反哺教學(xué)的一項(xiàng)現(xiàn)實(shí)應(yīng)用,值得在更廣范圍實(shí)施。
①公司數(shù)量與每個(gè)公司的學(xué)生數(shù)可根據(jù)授課班型的實(shí)際情況進(jìn)行設(shè)置。