国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

略論博弈論中囚徒困境的人性因素

2004-04-29 12:41:21李立群
市場周刊 2004年8期
關(guān)鍵詞:坦白囚徒交代

李立群

摘 要:博弈論是西方經(jīng)濟(jì)學(xué)中的一種重要理論,對(duì)現(xiàn)代經(jīng)濟(jì)理論的發(fā)展作出了重要貢獻(xiàn),囚徒困境是博弈論中的一個(gè)經(jīng)典案例,人們經(jīng)常運(yùn)用囚徒困境理論來分析一些問題。本文主要從其人性角度談一些自己的想法。

關(guān)鍵詞:博弈論囚徒困境啟示

囚徒困境是博弈論中的一個(gè)經(jīng)典案例,也是目前學(xué)界注意力的焦點(diǎn)所在。不少人將囚徒困境理論用來解釋我們生活中的各種現(xiàn)象,例如出版界屢禁不絕的盜版現(xiàn)象 、在高等教育考試中尤其是高考和四級(jí)考試中的誠信 ,以及國際時(shí)政問題的觀察和分析。確實(shí),運(yùn)用囚徒困境理論來分析一些問題時(shí),在切入點(diǎn)、視角方面有令人耳目一新之感,但需要指出的是,目前我們對(duì)囚徒困境理論的理解至少還忽略了一點(diǎn),那就是這一理論中所蘊(yùn)含的人性因素――人性本惡基本價(jià)值判斷。

一、囚徒困境的基礎(chǔ)是人性本惡

所謂“囚徒困境”,實(shí)際上指是經(jīng)濟(jì)學(xué)上的一種原理。其內(nèi)容大同小異,大致是說有兩個(gè)人共同犯罪,被警方抓獲并分別關(guān)押,但警方并沒有掌握確鑿的證據(jù)。這時(shí)兩個(gè)囚徒就面臨著三種選擇:一、兩個(gè)人都拒不交代,將無罪釋放;二、都交代罪行,并揭發(fā)同伙,各判10年;三、一個(gè)人拒不交代,另一個(gè)人坦白并揭發(fā)同伙,坦白者判刑5年,拒不交代者判刑20年。

對(duì)其中一個(gè)囚徒甲來講,如果選擇拒不交代,要么被判無罪,這個(gè)結(jié)果的前提是同伙B也不交代;要么被判20年,前提是B坦白了;如果選擇了坦白,要么被判10年,前提是同伙B也坦白;要么被判5年,前提是B拒不交代。囚徒乙的選擇結(jié)果也一樣。這樣看來,囚徒的選擇事實(shí)上是一種賭博,賭同伙不交代風(fēng)險(xiǎn)太高,而自己交代則風(fēng)險(xiǎn)最低。因此一般來講,兩個(gè)囚徒都會(huì)選擇坦白,這也正是警方所要達(dá)到的目的。

純經(jīng)濟(jì)學(xué)家往往會(huì)指出,囚徒困境悖論是一個(gè)非零和游戲,囚徒甲、乙都是理性的,他們所關(guān)心的是自己會(huì)被判多少年,至于對(duì)方被判多少則不在自己的考慮范圍之內(nèi),由此,理性的囚徒甲、乙所做出的選擇最后看來卻是不合理性的。所謂“純利已動(dòng)機(jī)的個(gè)人,也會(huì)因追求哪怕是合理的自利而對(duì)整體造成危害” ,這正好與亞當(dāng)·斯密的名言——“他(指經(jīng)濟(jì)人)自己的利益,往往使他能夠比在真正出于本意的情況下,更有效地促進(jìn)社會(huì)的利益” ——恰恰相反。也就是說,囚徒困境理論反映了看起來很合理的個(gè)人行為與合作所得的利益間的矛盾,在一個(gè)個(gè)體看起來有利的策略卻可能帶來整體的不利,因?yàn)?,在一個(gè)不知道其他的參賽者做什么的情況下,每一個(gè)個(gè)體參與者都期望獲得自身的最大利益,而不考慮別人的利益即是一個(gè)理性的“利己主義者”。

理性個(gè)體人的決定,結(jié)果卻導(dǎo)致了非理性的集體選擇。如果從人性的角度對(duì)這一現(xiàn)象加以剖析,就會(huì)發(fā)現(xiàn)人性本惡的傾向。

首先,我們先假設(shè)甲囚徒是善的,就會(huì)出現(xiàn)兩種結(jié)果:1、甲堅(jiān)持不坦白,也不供出對(duì)方,乙也如是,這樣兩人都釋放,皆大歡喜。2、甲堅(jiān)持不坦白,但乙坦白交代,這樣甲判20年乙判5年;這也沒什么,反正本來就有罪,應(yīng)該坐牢的。

其次,再假設(shè)甲囚徒是惡的,也會(huì)出現(xiàn)兩種結(jié)果:1、甲坦白,供出對(duì)方,乙卻沒有坦白,這樣甲判5年、乙判20年。這里暫不考慮良心因素。2、甲坦白,供出對(duì)方,乙也坦白,供出對(duì)方,這樣雙方都判10年;反正有罪,坐牢就坐牢吧。

這里的不同之處在于,囚徒甲從善的角度出發(fā),分別得到的兩種結(jié)果可以說是最好的(釋放)、最差的(判20年),而從惡的角度出發(fā),分別得到的兩種結(jié)果則處于中間(分別是判5年、10年)。兩相比較,無論是囚徒甲還是乙,最不能接受的結(jié)果就是最差的那一種,即自己不坦白,對(duì)方卻交代。更為關(guān)鍵的是,如果甲選擇了善,乙或者釋放、或者判5年;如果甲選擇了惡,乙或者判20年、或者判10年,只要選善,對(duì)方的“下場”就會(huì)比自己超出一籌。顯然,只有選惡,對(duì)方才不會(huì)有比自己好的遭遇,在這種判斷下,甲、乙兩個(gè)囚徒都選擇惡式做法的可能性也就難免更大了。

二、對(duì)人性本惡的承認(rèn)和限制

但事實(shí)上,把兩個(gè)囚徒選擇惡的做法看成是必然還不盡確切。因?yàn)樯鲜銮敉嚼Ь忱碚搶?shí)際上還有一個(gè)假設(shè)基礎(chǔ),即囚徒甲、乙之間并不熟悉了解,只有在這種前提下,囚徒甲、乙才會(huì)做出讓警察滿意、即互相坦白的選擇來。而在現(xiàn)實(shí)生活,更多的情況則是兩個(gè)囚徒彼此有所了解,這時(shí)又會(huì)出現(xiàn)什么的結(jié)果呢?

可以肯定的認(rèn)為,這時(shí)兩個(gè)熟悉的囚徒首先要考慮的是判斷對(duì)方的選擇,即囚徒甲首先要考慮囚徒乙選擇交代、坦白的可能性各為多少,然后才會(huì)根據(jù)這一判斷作出自己的判斷。如果囚徒甲很信任對(duì)方,知道乙的為人素來義氣為先,出了事自己扛,那么囚徒甲肯定會(huì)毫不猶豫地選擇A不交代;反之,如果囚徒甲知道乙肯定靠不住,他也會(huì)毫不猶豫選擇B坦白;只有第三種情況才是一種賭博,即囚徒甲不知道囚徒乙的為人,也就不知道囚徒乙會(huì)做出什么樣的選擇,當(dāng)囚徒甲覺得這場賭博風(fēng)險(xiǎn)太大、不愿意進(jìn)行這場賭博即選擇C時(shí),就會(huì)趨向于選擇坦白。

也就是說,囚徒的選擇還要加上一個(gè)因素,即雙方是否互相信任的前提。

這樣看來,囚徒困境理論中必需要考慮的一個(gè)因素就是給對(duì)方的“誠信度”打多少分。也就是說,在兩個(gè)囚徒(范圍可以推而廣之)互為了解的前提下,選擇非A即B,只有互相不了解的情況下,才有可能出現(xiàn)選擇C,這種可能性很小,同樣是出于對(duì)另一方的不了解,選擇B是一條起碼的退路。因此,在一定程度甚至可以說,囚徒困境理論中的選擇C實(shí)際上僅僅是一個(gè)擺設(shè),只是為了逼迫對(duì)方去走選擇C這條道路,在現(xiàn)實(shí)生活中出現(xiàn)的可能性是極小的。

這也是為什么繼囚徒困境理論后,一報(bào)還一報(bào)策略(TIT FOR TAT)最終取勝的原因所在 。1984年,美國密西根大學(xué)一位叫做羅伯特·愛克斯羅德的教授組織了一場計(jì)算機(jī)競賽,任何參加者都扮演囚徒困境案例中一個(gè)囚犯的角色,然后他們的程序會(huì)被成雙成對(duì)地融入不同的組合。分好組以后,然后參與者就開始玩囚徒困境的游戲,重復(fù)多次地玩這個(gè)游戲,最后在這個(gè)游戲中,競賽的桂冠屬于其中最簡單的策略:多倫多大學(xué)心理學(xué)家阿納托·拉帕波特提交上來的一報(bào)還一報(bào)策略。

簡單來說,一報(bào)還一報(bào)的思路總是以合作開局,從此以后就采取以其人之道還治其人之身的策略,它永遠(yuǎn)不先背叛對(duì)方,即永遠(yuǎn)不先采取供出對(duì)方的選擇,但一旦對(duì)方在前一次合作中選擇了坦白,那么這個(gè)程序在接下來的游戲中肯定選擇供出對(duì)方。應(yīng)該說,這一原則是胡蘿卜加大棒,融寬容和強(qiáng)硬于一體,同時(shí)這個(gè)程序所奉行的原則也是極為簡單明了的。正是這樣一樣策略,獲得了最終勝利。很顯然,一報(bào)還一報(bào)策略就建立在了解對(duì)方的基礎(chǔ)之上,在首次交手后即有了對(duì)方的“誠信”記錄,以后,或者以血還血、以牙報(bào)牙;或者投桃報(bào)李、互致善意,一報(bào)還一報(bào)策略的選擇就完全在人們的意料之中了。

由此可見,與其說囚徒困境理論證明了個(gè)體的理性導(dǎo)致集體的非理性這一現(xiàn)象,毋如說個(gè)體的缺乏溝通導(dǎo)致了集體的非理性來得更為確切。而一報(bào)還一報(bào)策略的高明之處則在于,表面上看并不限制對(duì)方選擇善或是惡的自由,但卻以一種明確的、以其人之道還治其人之身的方式告訴對(duì)方:不要選擇惡,否則自己將飲下自釀的惡之酒,從而在實(shí)質(zhì)上給對(duì)方上了一道緊箍咒。

三、囚徒困境理論的啟示

眾所周知,人性本惡是西方文化的基本判斷之一,這一點(diǎn)和中國傳統(tǒng)文化完全不同。例如按照基督教《圣經(jīng)》的說法,亞當(dāng)與夏娃偷食了智慧之果,因而被上帝趕出了伊甸園,帶著罪惡來到了人世間,這就是原罪說,將其理解為人性本惡并無不妥之處。而中國自孟子開始,將人性本善的大旗高高舉起,“人性之善也,猶水之就下也,人無有不善,水無有不下” 。人性到底是善、是惡這涉及到哲學(xué)上的論爭,因超出本文討論范圍暫且不論。這里需要指出的是,一報(bào)還一報(bào)策略的立足點(diǎn)則是承認(rèn)對(duì)方有選擇惡的權(quán)利,至少是承認(rèn)了人性有本惡的一面,但同時(shí)確立了一報(bào)還一報(bào)的游戲規(guī)則,迫使人性朝著善的方向努力。也就是說,一報(bào)還一報(bào)策略的出發(fā)點(diǎn)是人性本惡,但最終歸宿、或者說努力方向卻是人性本善。

如此看來,囚徒困境案例背后隱藏的居然是關(guān)于人性的基本價(jià)值判斷。筆者以為,完整的囚徒困境理論應(yīng)該將一報(bào)還一報(bào)策略也涵括在內(nèi),這樣才形成一個(gè)整體,給人們的啟示也可以略作修改如下:

個(gè)體的理性行為確實(shí)可以導(dǎo)致集體的非理性結(jié)果,但這只是短時(shí)期的,從長遠(yuǎn)看,只要輔以合適的制度——在囚徒困境理論中體現(xiàn)為一報(bào)還一報(bào)策略,那么個(gè)體的理性行為終導(dǎo)致集體的理性行為。其中,合理和有效的制度的設(shè)立和實(shí)施就成為了重中之重。

那么,什么樣的制度才是合理而有效的呢?首先應(yīng)簡單而明確,要讓別人產(chǎn)生誤解的可能性被降低到了最小范圍。其次,制定新制度時(shí)應(yīng)承認(rèn)人性本惡,但努力的方向是人性本善,即承認(rèn)一個(gè)人有選擇惡的可能和權(quán)利,但卻以巧妙地方式讓個(gè)性自覺地朝著善的方向靠攏。這又可以兩種方式表達(dá)出來:其一,規(guī)定選擇惡的后果是以血還血,這是以一種強(qiáng)硬的方式規(guī)范個(gè)性必需向著善的方向努力,也可以說是一根大棒;其二勾勒出一幅一旦選擇善后出現(xiàn)的彼此得利的圓滿局面(在囚徒困境中表現(xiàn)為雙方獲釋),這是以一種施惠的方式誘使個(gè)性心甘情愿地朝著善的方向努力,也可以說是一個(gè)胡蘿卜,這種方式也即所謂的胡蘿卜加大棒法。

四、結(jié)語

上面,筆者通過對(duì)囚徒困境案例和一報(bào)還一報(bào)策略作出了簡要分析,并著重指出了其中包含的人性本惡這一屬于西方傳統(tǒng)的價(jià)值判斷對(duì)決擇結(jié)果的影響。需要強(qiáng)調(diào)的是,我們?cè)谟懻撉敉嚼Ь忱碚摃r(shí),往往會(huì)自覺不自覺地忽略這一基本價(jià)值判斷,這不利于我們對(duì)囚徒困境理論討論的深入。此外,囚徒困境理論同樣也揭示了什么樣的制度才是一項(xiàng)合理有效的制度,這對(duì)于我們目前正處于當(dāng)務(wù)之急的制度建設(shè)應(yīng)該說也不無禆益。

猜你喜歡
坦白囚徒交代
博弈論—囚徒困境模型淺析
機(jī)智的囚徒
中文的魅力,老外理解不了
囚徒
歲月(2016年12期)2016-12-07 17:32:11
真情告白
喜劇世界(2016年18期)2016-11-26 13:05:29
論坦白的處遇
刑法論叢(2016年3期)2016-06-01 12:15:04
海盜的囚徒
論男性出軌者的囚徒困境
交代
交代
黔江区| 贵定县| 吐鲁番市| 平顶山市| 禹州市| 曲阳县| 广汉市| 青浦区| 深水埗区| 会同县| 肥乡县| 招远市| 鹤庆县| 南皮县| 兰考县| 姚安县| 志丹县| 图木舒克市| 德钦县| 普兰县| 奇台县| 岚皋县| 遂溪县| 万宁市| 江陵县| 乌兰浩特市| 文成县| 大荔县| 华安县| 合水县| 青川县| 行唐县| 漯河市| 东乡| 横峰县| 永平县| 昌宁县| 红桥区| 子长县| 浦县| 北流市|