趙子達(dá)(遼寧大學(xué)哲學(xué)與公共管理學(xué)院,遼寧 沈陽 110036)
“智豬博弈”是博弈論中一個十分經(jīng)典的分析模型。假設(shè)豬圈中有兩頭豬在同一個食槽里進(jìn)食,一頭大豬,一頭小豬,暫且認(rèn)為它們都是有著自我意識和實現(xiàn)個人利益的充滿理性的“智豬”。這個豬圈很長,一頭安裝了一個控制飼料供應(yīng)的踏板,飼料的出口和食槽卻安在另一頭。豬每踩一下踏板,另一邊就會有相當(dāng)于10份的飼料進(jìn)入食槽,但是踩踏板以及跑到食槽所需要付出的“勞動”加起來相當(dāng)于要消耗2份飼料的能量。由此,大豬和小豬有以下幾種策略選擇:(1)如果小豬踩踏板,大豬將吃到9份飼料;(2)如果大豬踩踏板,小豬將吃到4份飼料;(3)如果兩頭豬同時踩踏板,大豬吃到7份飼料,小豬吃到3份飼料;(4)如果兩頭豬都等待,則雙方都吃不到飼料。綜上所述,智豬博弈的收益矩陣如表1所示。
表1 智豬博弈的收益矩陣
在這種情況下,兩頭“智豬”會怎樣分析問題呢?從小豬的角度來看,選擇踩踏板只能吃掉1份飼料,不踩踏板反而可能吃上4份。所以,踩踏板也就成為小豬的嚴(yán)格劣勢策略。若將該策略剔除,小豬的優(yōu)勢策略必然是選擇等待。而此時的大豬有兩種選擇:(1)等待,則意味著什么都吃不到;(2)踩踏板,則意味著可以吃到4份飼料。
在這個博弈過程中,踩踏板對于小豬來說是嚴(yán)格的劣勢策略,應(yīng)先將其剔除。在剔除小豬踩踏板這一選擇后所形成的新博弈中,小豬只有等待這一個選擇,而大豬卻有兩個可供選擇的策略。在這兩個抉擇中,選擇等待對大豬來說是一個嚴(yán)格劣勢策略,再剔除該策略。那么,在最后構(gòu)成的新博弈中,必然會出現(xiàn)“小豬躺著大豬跑”的景象,這就是“智豬博弈”的最后均衡,即重復(fù)剔除的優(yōu)勢策略均衡。
道德,是一種公共服務(wù)。[1]道德環(huán)境在一定程度上具有公共產(chǎn)品的屬性,即使用上的非競爭性和受益上的非排他性。誠然,良好的道德環(huán)境需要每個個體共同創(chuàng)造。但在現(xiàn)實生活中,社會成員的差異性導(dǎo)致每個道德行為成員在維系該環(huán)境平衡時,所需付出的成本是不盡相同的。成本不等與收益相等之間的矛盾,導(dǎo)致守德者得不償失,失德者卻不勞而獲。而出于自身利益的考量,企圖期望出現(xiàn)許多“圣人”,在遵守該不成文契約的同時卻容忍他人失德是不現(xiàn)實的。
根據(jù)前述“智豬博弈”模型,守德者如同大豬,失德者如同小豬。守德者花費成本奔波于“食槽和踏板”之間,而失德者卻在等待“飼料”供應(yīng)。長此以往,對待守德者的不公,極易使其向失德者的行為模式傾斜。當(dāng)大豬(守德者)也選擇等待時,雙方就都無飼料可吃了。這種道德危機(jī)的窘狀,如果不加以遏制,便會加速道德環(huán)境的惡化,最終導(dǎo)致社會道德體系的坍塌。由此可見,道德領(lǐng)域中的“智豬博弈”危機(jī)似乎在所難免。
共處社會道德環(huán)境中,如果失德者(小豬)的行為總被默許,那么守德者(大豬)便會越來越少。破解“智豬博弈”的困境,其核心指標(biāo)為:飼料數(shù)量、踏板與投食口的距離。為此,有如下三種方案:(1)飼料減半,一方踩踏板意味著另一方吃完,則雙方都選擇等待;(2)飼料翻倍,倘若無論誰踩踏板,對方都不會把食物吃完,則雙方都可能會去踩踏板;(3)減量加位移,飼料減半,投食口移到踏板附近,則多勞多得,等待者不得食。
為防止社會道德危機(jī),不妨借鑒破解“智豬博弈”窘境的三種策略,從而設(shè)計良好的守德激勵制度。上述方案中,如果減少獎勵力度,社會成員將失去“守德”的動力,傾向于通過“失德”而獲益;如果加大獎勵力度,則會導(dǎo)致道德維護(hù)成本的陡增。所以,最好的激勵機(jī)制來源于方案三,即針對個別優(yōu)秀守德者(大豬)給予獎勵的同時,提高違德者(小豬)的作弊代價。如此,既節(jié)約了成本(對政府維護(hù)社會道德環(huán)境而言),又消除了“搭便車”的現(xiàn)象,有利于激勵社會成員構(gòu)建良好的道德環(huán)境。
1.激勵機(jī)制——驅(qū)使人們守德?lián)P善
中國傳統(tǒng)道德觀念強調(diào)“善欲人見,不是真善”。但在市場經(jīng)濟(jì)逐利性愈發(fā)彰顯的今天,道德冷漠現(xiàn)象不斷出現(xiàn),試圖讓每個社會成員都擁有這種“大善”未免過于苛責(zé)?,F(xiàn)實生活中,守德者也許從未感受到別人對他們行為的合宜性所表示的贊賞之情。[2]適當(dāng)?shù)莫剟顧C(jī)制有利于驅(qū)使人們守德?lián)P善,構(gòu)建良好的道德環(huán)境。獎勵的關(guān)鍵在于,增強守德者的內(nèi)心滿足感,促使其保持良好的行為習(xí)慣。所以,這種機(jī)制應(yīng)以物質(zhì)獎勵為輔,精神獎勵為主。例如,可以以社區(qū)為單位定期評選日常生活中的先進(jìn)個人和事跡,并通過黨委宣傳部、官方傳媒等途徑,對守德楷模進(jìn)行表揚和宣傳,引導(dǎo)全社會形成良好的道德風(fēng)尚。
2.制度保障——免除施德后顧之憂
由馬斯洛的需要層次理論可知,安全需求處于較低階梯。[3]所以,社會成員在進(jìn)行道德活動時,必須有相應(yīng)的安全保障,避免正義的舉動給自身帶來不必要的麻煩和代價。政府應(yīng)提供相應(yīng)的優(yōu)惠政策鼓勵公益社會組織的發(fā)展,如果施德者因救助他人反被誣陷,可以由公益機(jī)構(gòu)對其提供維權(quán)支持。即便施德者因自身行為損害了他人一定的利益,也應(yīng)該適當(dāng)減輕甚至免除責(zé)任。倘若當(dāng)?shù)卣畵碛休^好的財政條件,還可以設(shè)立公益基金,為施德者的利益損失提供金錢救濟(jì)。通過完善制度保障網(wǎng)絡(luò),激發(fā)社會成員的施德行為,免除后顧之憂。
1.內(nèi)在約束——滲透道德柔性信條
構(gòu)建良好的道德環(huán)境,其理想狀態(tài)是把道德準(zhǔn)則內(nèi)化為道德意識,從而指導(dǎo)個人的行為舉止,最終將守德形成一種日常生活習(xí)慣。即將守德觀念成為內(nèi)心活動的外顯,而非外在規(guī)定的不得已。要想達(dá)到這種狀態(tài),必須重視教育功能。道德教育,在人的教化和塑造上扮演著重要的角色,具有基礎(chǔ)性和全局性的作用。道德凝聚人心,但具有盲目性。為了正確引導(dǎo)道德走向,應(yīng)當(dāng)將道德教育立足于日常生活,注重受教育者自身利益的發(fā)展,增強道德教育的實踐性和開放性,而非只是單純地傳授課本上僵化的“圣人”模范信條。
2.制度規(guī)避——構(gòu)建全民信用檔案
僅僅通過對失德者的教育,試圖改變其行為模式是遠(yuǎn)遠(yuǎn)不夠的。守德行為多依賴于社會個體的自覺,同時也需要制度提供保障。政府應(yīng)運用經(jīng)濟(jì)職能和政治職能,構(gòu)建全民信用檔案系統(tǒng),并將失德者的行為記錄其中。為更好地發(fā)揮懲戒教育的作用,可以允許將顯著輕微的失德記錄通過良好的守德行為予以抵消。但失德記錄的清除并不是毫無底線的,倘若觸碰了法律紅線,這種失德且違法的行為必將伴隨一生,讓其舉步維艱。通過適當(dāng)提高信用數(shù)據(jù)的透明度,增加失德者的違規(guī)成本,進(jìn)而引導(dǎo)其走向守德的軌道。
3.輿論監(jiān)督——引領(lǐng)社會輿論導(dǎo)向
通過制度約束,可以有效防止社會成員觸碰失德的逆鱗。但是,如果這種剛性手段大范圍適用,容易引起人民反抗和社會動亂。為此,政府應(yīng)加強輿論支配,使守德行為成為一種社會風(fēng)尚,甚至是個人信仰。輿論萬能,所有其他形式的權(quán)力都導(dǎo)源于它。軍隊是無用的,除非士兵相信他們?yōu)橹鲬?zhàn)的理由。制度是難以發(fā)揮作用的,除非它受到人們的普遍尊重。鑒于大眾傳媒對重大事件的傾向,近乎決定著社會輿論的走向,所以政府在尊重新聞媒體言論自由的同時,也應(yīng)該加強對媒體的引導(dǎo)和監(jiān)督,掌握輿論主動權(quán)。
根據(jù)道德領(lǐng)域中的“智豬博弈”模型,在構(gòu)建具有公共產(chǎn)品屬性的道德環(huán)境時,守德者得不償失,而失德者卻不勞而獲。本文從破解“智豬博弈”的激勵機(jī)制出發(fā),就守德者(大豬)和失德者(小豬)兩個層次,提出具體的應(yīng)對策略,旨在改善道德危機(jī)現(xiàn)狀、營造良好社會氛圍。