郭海寬
(太原師范學(xué)院 數(shù)學(xué)系, 山西 太原 030012)
“優(yōu)先發(fā)展教育,建設(shè)人力資源強(qiáng)國”是黨的十七大做出的重大戰(zhàn)略部署,是制定《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010—2020年)》(以下簡稱《綱要》)的基本宗旨,也是實(shí)現(xiàn)中華民族偉大復(fù)興的根本要求。然而,正如《綱要》公開征求意見稿中所指出的那樣,“我國教育還不適應(yīng)國家經(jīng)濟(jì)社會(huì)發(fā)展和人民群眾接受良好教育的要求”。其中最突出的問題是“學(xué)生適應(yīng)社會(huì)和就業(yè)創(chuàng)業(yè)能力不強(qiáng),創(chuàng)新型、實(shí)用型、復(fù)合型人才緊缺”。導(dǎo)致這一后果的主要原因是“教育觀念落后”、“內(nèi)容方法比較陳舊”。具體表現(xiàn)為“學(xué)生學(xué)習(xí)主要為了考試和分?jǐn)?shù)”、“學(xué)校教師只關(guān)心升學(xué)率”、“家長最看重名牌大學(xué)”、“社會(huì)只承認(rèn)高學(xué)歷”。這就是教育領(lǐng)域的“應(yīng)試教育”現(xiàn)象。
對(duì)于應(yīng)試教育的危害,本文不想展開討論,而是試圖用博弈論的原理對(duì)于造成這種現(xiàn)象的深層次原因進(jìn)行剖析,并對(duì)解決這一問題提出一些看法。
博弈論也稱對(duì)策論,英文為game theory,是上世紀(jì)30年代發(fā)展起來的一門新興學(xué)科,以研究決策主體行為發(fā)生直接相互作用時(shí)的決策以及這種決策的均衡問題為任務(wù)。一個(gè)博弈包括三要素:(1)一組參與人;(2)參與人可選擇的行動(dòng)或策略;(3)參與人可能得到的贏利(或稱支付)。
這里所說的參與人即決策主體可以是自然人也可以是一個(gè)組織。一個(gè)重要的假設(shè)是,這些參與人都是“理性人”,這里的理性人是指有一個(gè)很好定義的偏好,且在面臨給定的約束條件下最大化自己的偏好。每一個(gè)參與人不僅自己是理性的,而且也知道“每個(gè)參與人都是理性的”,也知道“每個(gè)參與人都知道‘每個(gè)參與人是理性的’”。參與人的贏利是其偏好的體現(xiàn),它不僅僅是自己策略的函數(shù),每個(gè)參與人的策略都對(duì)其有影響,亦即每個(gè)參與人的贏利都是所有參與人的策略組合(如果參與人有n個(gè),那么這是一個(gè)n元有序組)的函數(shù)。
按照這樣的表述,在現(xiàn)實(shí)生活中博弈無處不在,大到天下分合、生死之地、存亡之道,小到棋牌游戲、日常生活、處世為人,謀略性的對(duì)抗、合作都是最常見的局勢(shì)。
博弈論專家們經(jīng)過長期觀測(cè)、研究,歸納總結(jié)出許多簡單、有趣且寓意深刻的博弈模型,“囚徒困境”就是其中最經(jīng)典的一個(gè)。
在一次刑事案發(fā)生后,警察在現(xiàn)場(chǎng)抓到兩個(gè)犯罪嫌疑人。事實(shí)上正是他們做的案,但是警察沒有掌握足夠的證據(jù)。于是,警方把他們隔離囚禁起來,要求他們坦白交代。如果他們都坦白,每人將入獄三年;如果他們都抵賴,由于證據(jù)不充分,每人將只入獄一年;如果一個(gè)抵賴而另一個(gè)坦白,那么抵賴者將入獄五年,而坦白者將得到寬大釋放,免于刑事處罰。
在這個(gè)博弈中:
(1)參與人:甲和乙。
(2)甲和乙可選擇的策略都是兩個(gè):坦白或抵賴。
(3)甲的贏利函數(shù)是:甲坦白且乙坦白,獲刑3年;甲坦白乙抵賴,獲刑0年;甲抵賴乙坦白,獲刑5年;甲抵賴乙抵賴獲刑1年。
乙的贏利函數(shù)是:甲坦白且乙坦白,獲刑3年;甲坦白乙抵賴,獲刑5年;甲抵賴乙坦白,獲刑0年;甲抵賴乙抵賴獲刑1年。
這樣的博弈格局可以用圖1來表示:
圖1 甲乙囚徒博弈矩陣
在圖1中,每個(gè)格子中左下角的數(shù)字是甲的贏利,右上角的數(shù)字是乙的贏利。
這樣的表格通常稱為“博弈矩陣”。
現(xiàn)在的問題是,兩個(gè)“囚徒”將怎樣選擇自己的策略呢?參與博弈的這兩個(gè)人十分明白,每個(gè)人的贏利(即刑期)不僅和自己的決策有關(guān),也和另一個(gè)人的決策有關(guān)。
簡單分析后不難看出,對(duì)于甲來說,如果乙坦白,自己選擇坦白比選擇抵賴好;如果乙抵賴自己選擇坦白更好。因此不論對(duì)方怎樣選擇,自己選擇“坦白”總比選擇“抵賴”要好,亦即“坦白”是甲的“優(yōu)勢(shì)策略”。同理,對(duì)于乙來說,“坦白”也是他的“優(yōu)勢(shì)策略”。
因此這個(gè)博弈的結(jié)果是甲乙都選擇了坦白?;蛘哒f(坦白,坦白)是這一博弈的“納什均衡”。兩個(gè)囚徒陷入了困境,對(duì)于參與人的整體利益來說,這是最糟的結(jié)果。
有人可能會(huì)說,這種結(jié)果不符合實(shí)際情況,因?yàn)槿瞬豢赡芏枷裆厦娣治龅哪菢印安徽塘x”。值得提醒的是,我們?cè)诜治鲋耙呀?jīng)作了假設(shè),參與人是理性的!
“囚徒困境”是個(gè)體理性損害集體理性的博弈模型,在現(xiàn)實(shí)生活中很多現(xiàn)象都可以用這個(gè)模型來解釋。
為敘述簡單起見,我們不妨作如下假設(shè):
社會(huì)上只有兩所學(xué)校甲和乙,它們的師資水平、生源質(zhì)量、教學(xué)設(shè)施等條件都基本相同,升學(xué)名額是一定的。在這樣的假設(shè)下,如果兩學(xué)校都采取同樣的教學(xué)方法,升學(xué)率幾乎是相同的。但是如果其中一家選擇增加課時(shí)、壓縮副科、加大作業(yè)量等應(yīng)試教育的策略,而另一家則按照正常教學(xué)規(guī)律進(jìn)行教學(xué),顯然前者的升學(xué)率必然要高于后者。我們把這一博弈局勢(shì)歸納如下:
參與人:甲校和乙校;
甲校和乙??蛇x擇的策略:應(yīng)試教育或素質(zhì)教育;
甲校的贏利函數(shù):
如果甲校選擇素質(zhì)教育,乙校選擇素質(zhì)教育,贏利a+c。
如果甲校選擇素質(zhì)教育,乙校選擇應(yīng)試教育,贏利a+c-b。
如果甲校選擇應(yīng)試教育,乙校選擇素質(zhì)教育,贏利a+b-c。
如果甲校選擇應(yīng)試教育,乙校選擇應(yīng)試教育,贏利a-c。
乙校的贏利函數(shù):
如果甲校選擇素質(zhì)教育,乙校選擇素質(zhì)教育,贏利a+c。
如果甲校選擇素質(zhì)教育,乙校選擇應(yīng)試教育,贏利a+b-c。
如果甲校選擇應(yīng)試教育,乙校選擇素質(zhì)教育,贏利a+c-b。
如果甲校選擇應(yīng)試教育,乙校選擇應(yīng)試教育,贏利a-c。
這個(gè)博弈的博弈矩陣見圖2。
圖2博弈中的a,b,c均大于零,各自的意義分別是:a是升學(xué)率效用;b是升學(xué)率效用的增量;c是學(xué)生整體素質(zhì)提高帶來的效用,簡稱素質(zhì)效用。每個(gè)格子中,左下角是甲校的贏利;右上角是乙校的贏利。
在分?jǐn)?shù)決定一切的大環(huán)境下,升學(xué)率效用被放大了,素質(zhì)效用被縮小了,這樣b遠(yuǎn)遠(yuǎn)大于c,最起碼也是b-c>c,即b>2c(其意義是即使?fàn)奚怂刭|(zhì)效用,升學(xué)率提高帶來的正效應(yīng),對(duì)于校方來說也是值得的)。
圖2 甲乙校博弈矩陣
于是,對(duì)于甲校來說:
如果乙校選擇素質(zhì)教育,甲校選擇素質(zhì)教育的贏利是a+c,而選擇應(yīng)試教育的贏利是a+b-c,因?yàn)?a+b-c)-(a+c)=b-2c>0,所以甲校選擇應(yīng)試教育。
如果乙校選擇應(yīng)試教育,甲校選擇素質(zhì)教育的贏利是a+c-b,而選擇應(yīng)試教育的贏利是a-c,因?yàn)?a-c)-(a+c-b)=b-2c>0,所以甲校選擇應(yīng)試教育。
可見,不論乙校采取應(yīng)試教育還是素質(zhì)教育,應(yīng)試教育總是甲校的優(yōu)勢(shì)策略。
同理,對(duì)于乙校來說,應(yīng)試教育也是其優(yōu)勢(shì)策略。
因此,這一博弈唯一的納什均衡就是:應(yīng)試教育,應(yīng)試教育。
學(xué)校教育與刑事犯罪雖然毫不相干,表中的數(shù)字也不相同,但是博弈的結(jié)構(gòu)卻是完全一致的。因此我們說,應(yīng)試教育是“囚徒困境”的又一個(gè)翻版??杀氖牵@種結(jié)果非但沒有給學(xué)校甲和學(xué)校乙?guī)韺?shí)際好處(由于招生總量是一定的,所以各自的升學(xué)率并沒有提高)。相反,素質(zhì)效用卻成了負(fù)數(shù),也就是說學(xué)生的整體素質(zhì)下降了?,F(xiàn)實(shí)中的情形確實(shí)如此。當(dāng)前大學(xué)生就業(yè)如此困難,一個(gè)很重要的原因是,應(yīng)試教育培養(yǎng)出來的學(xué)生,無法適應(yīng)社會(huì)的需要。因此,走出這種“困境”是保證國家長治久安、實(shí)現(xiàn)民族復(fù)興的重中之重。
根據(jù)前面的分析,走出“困境”的關(guān)鍵是改變博弈的結(jié)構(gòu),具體說來就是,縮小升學(xué)率效用,提高素質(zhì)效用。通過法律、行政、輿論等諸多手段,在全社會(huì)取得共識(shí)的基礎(chǔ)上,逐漸使素質(zhì)教育法制化、常態(tài)化、自覺化?!?/p>
太原師范學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版)2012年5期