季愛民
(安徽師范大學 政治學院,安徽蕪湖 241000)
1738年,貝努利(D.Bernoulli)闡發(fā)了現(xiàn)代期望效用決策理論的萌芽,經(jīng)過拉姆齊(F.P.Ramsey)和菲尼蒂(B.De Finetti)主觀概率理論的奠基,以及馮·諾意曼(J.V.Neumann)和摩根斯頓(Q.Morgenstern)現(xiàn)代期望效用決策理論的發(fā)展,1954年,薩維奇(L.J.Savage)給出了一個規(guī)范的理性決策模型——主觀期望效用理論,為20世紀50年代決策分析理論的迅速崛起做出了不可磨滅的貢獻。
拉姆齊在不滿意通過打賭方法測度部分信念后,曾提出了一種用效用定義相信度的方法,雖然后來他依舊不滿意這個方法。他認為行為人對任何事物都有著某種信念,可以將所有的可能世界(即行動的所有可能結果的集合,一個可能世界是一個結果的全部情形)都放進一個價值序列,看行為人如何看待所有可能世界進程的好壞。這樣一來,信念就能夠通過個體的行動選擇反映出來。不過,僅僅指出不同可能世界的價值不同肯定不夠,這樣無法在不同的可能世界之間進行比較。因為在不同的可能世界里,雖然價值的數(shù)值不同,但是,如果它們在不同的可能世界里是被任意地賦值,無法用確切的數(shù)值代表它們,那么說α和β之間的價值差別等于γ和δ之間的價值差別,這樣一個斷言將不會有意義。[1][2]這就是說,雖然存在某種定性的價值,可以將所有的可能世界放進一個價值序列,但是,如果沒有辦法在它們之間進行比較,那肯定是不夠的。拉姆齊提出可以通過個體的偏好對價值進行比較,即通過個體的某種信念對所有可能世界用偏好關系進行排序,利用偏好關系導出一個概率測度來定義相信度。
拉姆齊證明了他的每一個定義都伴隨著一個一致性公理,把部分信念一致性理解為一種特別類型的偏好關系的性質,如果行為人的信念體系不滿足這種偏好關系,那么他的價值判斷將不一致,這會導致自己遭受荷蘭賭。[3]拉姆齊給出了四個概率律并證明對于任何一致的相信度集合,概率律都必然成立,違背概率律的任何確定的相信度集合都將違背選擇間的優(yōu)選律。[1][2]在對這個建立在偏好關系之上的測度價值體系給出一些假設性條件后,他認為可以由偏好關系得到效用函數(shù)。雖然他本人沒有對效用函數(shù)的存在性進行證明,只是指出這種偏好關系是一種傳遞關系,但是,實際上,這個偏好關系就是一種弱序關系,并且他所指的效用函數(shù)是存在的。
薩維奇同樣把概率看成是私人的事情,1954年,他將效用理論與私人概率(Personal probability為薩維奇用語)結合起來研究不確定情形下理性人的行動選擇,給出了一個嚴格的公理體系,得到主觀期望效用理論。之所以稱之為主觀期望效用理論,是因為對效用函數(shù)進行加權的不是客觀概率,而是取決于個體的偏好,由個體的行動選擇推斷出來的私人概率。
薩維奇的方法與拉姆齊不同,拉姆齊是基于機會均等事件取得效用,然后根據(jù)效用得到概率,而薩維奇私人概率的獲得并沒有通過效用,他是把行動定義為狀態(tài)到結果的函數(shù),在弱序和一系列假設條件的基礎上得到:在狀態(tài)空間存在唯一的概率測度;在結果空間存在唯一的適合于一個正線形變換的實值效用函數(shù)。即對所有的行動(f,g)而言,f≤g,當且僅當,U(f)≤U(g),U(f)和U(g)為行動的主觀期望效用。
薩維奇承認自己曾陷入頻率論傳統(tǒng)太深,之所以他要重新考慮統(tǒng)計學基礎,提出私人概率是統(tǒng)計學大廈的階梯,至少有以下一些因素:如果統(tǒng)計學家既拒絕客觀概率,又拒絕私人主義的概率,那么勢必使得他們別無選擇;如果統(tǒng)計學家使用頻率論進行統(tǒng)計理論的研究,由于接受了概率必然性的觀點,那么又只能“影響著科學以及統(tǒng)計學的其他應用領域的最重要的不確定的事情就再也不能用概率來測度了”[1];如果使用私人概率,則可以推進統(tǒng)計學的發(fā)展。
為了對個體進行概率測度,薩維奇對現(xiàn)實世界的狀態(tài)、行動和結果進行了形式化的處理。他認為現(xiàn)實世界是個體關心的,針對不同的問題,行為人會有許多不同的現(xiàn)實世界,而現(xiàn)實世界的狀態(tài)就是一種對現(xiàn)實世界有關方面毫不遺漏的描述。狀態(tài)要體現(xiàn)一切有關的決定因素(關于這些因素,決策者不能斷定),并且應當用這樣一種方法來表示,即取得的狀態(tài)不依賴于選定的行動。[4]在薩維奇那里:世界狀態(tài)是一個有著元素s,s',s"……和表示事件的子集A,B,C……的集合S;一個結果是可能對個體發(fā)生的任何事件,結果集合被設想由F表示,由 f(s),g(s),h(s)……組成;行動是行為人采取的一個動作,一個行動被視為和它的可能結果相同,即行動被定義為狀態(tài)到結果的函數(shù)(而不是把狀態(tài)定義為行動到結果的函數(shù)),用f,g,h表示。
薩維奇通過一個具體事例澄清了這些概念。他說:“思考一個例子。當你進來并且自愿完成煎蛋卷的時候,你的妻子已經(jīng)打了5個好雞蛋放在一個碗里。第六個雞蛋,沒有打碎放在碗的旁邊,由于一些原因,它必須要么被用來煎蛋卷,要么扔掉。你必須決定怎么處置這個沒有打碎的雞蛋。你必須只能在三個行動之間作出決定,也許這并不是太過度單純化的。即把它打碎放在裝其他5個雞蛋的碗里,把它打碎放在一個碟子里觀察,或者不觀察直接把它扔掉。取決于蛋的狀態(tài),這三個行動的每一個將有一些與你有關的結果。這個說明行動、狀態(tài)和結果的例子可用下表來表示:”[5]
行動打碎放進碗里打碎放進碟子里扔掉狀態(tài)好的六個煎蛋卷六個煎蛋卷,和洗一個碟子五個煎蛋卷,一個好雞蛋毀壞臭的沒有煎蛋卷,5個好雞蛋毀壞五個煎蛋卷,和洗一個碟子五個煎蛋卷
可以看出,在給定的情形下,所有可得到的行動的集合可以用F表示,在這個例子中,F(xiàn)有三個行動作為元素。如果用f表示表中的第一個行動“打碎放進碗里”,那么行動f可以表示成函數(shù)的形式:f(好的)=六個煎蛋卷;f(臭的)=沒有煎蛋卷,和5個好雞蛋毀壞。以次類推。
薩維奇認為,雖然菲尼蒂私人概率的提出在拉姆齊之后,但是他是獨立的,并且非常詳細地發(fā)展了這一概念。他們對概率的觀點相同之處在于,都認為私人概率可以解釋客觀概率所解釋的問題。但是,與菲尼蒂拒斥客觀概率的態(tài)度不同,薩維奇和拉姆齊一樣,并不否定客觀概率,他只是主張沒有必要用客觀概率去解釋外面的世界,所有這些事情,私人概率都可以做的很好。他自己“已經(jīng)對提出一個特別的私人概率的概念很滿意。因此,在這一點上,在客觀概率和私人概率兩者之間的某種相互連接中,尋找一個對這兩者都承認的二元的理論應該是很誘人的。雖然菲尼蒂對此已經(jīng)表明(似乎薩維奇認為菲尼蒂的私人概率是一種客觀的私人概率,尋求的是兩者之間的某種聯(lián)系),但是,這樣做是沒有必要的,因為有著未知概率p的硬幣的想法能夠單獨用私人概率重新解釋?!盵5]不過,薩維奇對徹底的貝葉斯主義者菲尼蒂是理解和欣賞的,他認為,在懷疑菲尼蒂理論,甚至把它作為荒謬的東西之前,至少應該好好研究菲尼蒂那些激動人心的著作。
薩維奇在借助弱序概念和一些前提條件之后,嚴格論證出行為人用私人概率和效用進行決策的主觀期望效用決策理論:存在唯一的私人概率測度,并且存在有界的和唯一正線形變換的實值效用函數(shù)。這一理論是從個體對行動的偏好關系中推導出來的,個體就是行動決策人,決策人的決策是根據(jù)價值大小進行評價和選擇,價值體現(xiàn)了決策人需要的某種滿足。這里的決策人也就是偏好主體,而使決策人在需要上得到某種滿足的對象為偏好對象。簡單地說,偏好關系是一種關于偏好對象的二元關系。例如,對象x優(yōu)于對象y,并且偏好關系x優(yōu)于y,也就蘊涵了最終在價值判斷上決策人是認為x優(yōu)于y。而對于一個理性決策人而言,“理性的偏好關系體現(xiàn)在關于偏好關系≥(弱優(yōu)于)的兩個基本假設,即完備性和傳遞性之中。具體地說,我們假定決策者是理性的,即他的偏好關系≥滿足:(1)完備性。任何兩個備選對象a、b∈S,它們的關系是,或者a≥b,或者b≥a。兩者必居其一。(2)傳遞性。對于任意的三個對象:a,b,c∈S,如果a≥b,b≥c,那么a≥c?!盵6]薩維奇的決策理論就是建立在具有這樣的完備性和傳遞性的弱序(≥或者≤)之上。
薩維奇給出的7個原則性前提條件中,[4]對狀態(tài)到結果的集合上的全部行動而言,其中的第7個假設條件只是用來保證對全部行動的效用計算,并且保證在結果集合上的效用函數(shù)u是有界的,正因為u是有界的,所以全部行動也是有界的。其余的P1-P6對于求得在狀態(tài)空間存在唯一的概率測度,在結果空間存在唯一適合于一個正線形變換的實值效用函數(shù)u是足夠的,它們分別為:
P1.行動之間的聯(lián)系≤是弱序。
D1.給定B(為一事件),f≤g? f'≤g',對每個 f'和g'與 f和g一致,在B上分別地一致,在?B上互相一致。
P2.對每一個f,g,和B,給定B時f≤g,或者給定B時g≤f。
D2.g≤g'?f≤ f',當 f(s)=g,f'(s)=g',s∈S。
D3.B≡Φ?f≤g,對每個f,g,給定B。
P3.如果f(s)=g,f'(s)=g',s∈S,并且B≠Φ;那么給定B,f≤ f'?g≤g'。
D4.A≤B?fA≤fB或者g≤g',對每個 fA,fB,g,g'使得:fA(s)=g,s∈A;fA(s)=g',s∈?A;fB(s)=g,s∈B;fB(s)=g',s∈?B。
P4.對所有的A,B,A≤B或者B≤A。
P5.對每個 f,f',f≤f'為假。
P6.假定g≤h為假,那么對每個f,S有一個有限的劃分,使得假如g'與g一致除了此劃分中的任一元素,g'和h'等于 f為假,則g'≤h或者g≤h'將為假。
薩維奇用≤·(…比…的可能性差一點)來表示所有事件B,C,D…之間的聯(lián)系是一個定性概率關系,當且僅當,它滿足下面三個性質:[5]
(1)≤·是弱序;2.B≤·C,當且僅當,B∪D≤·C∪D,假如B∩D=C∩D=0;3.0≤·B,0≤·S。
在這些原則性前提條件下,薩維奇證明了他的兩個著名的結論:第一,在狀態(tài)集合的全部子集的集合上有唯一的一個概率測度,即一個個體對每一個事件可以賦予一個概率數(shù)值。他說:“如果S有一個概率測度P并且有一個定性概率關系≤·,那么對每一個B,C,P(B)≤P(C)?B≤·C?!盵5]薩維奇應該是緣于此給出了概率的私人解釋,因為對個體的偏好而言,在證明上述一系列前提條件合理后,通過它們確實推導出一個概率測度,并且,正如薩維奇所認為的那樣,這種推導并沒有依賴任何客觀的因素,而是完全從個體的偏好關系用數(shù)學方法嚴格推導出來的,因此,私人概率的解釋是合理的。
第二,存在有界的和唯一適合于一個正線性變換的實值效用函數(shù),使得對所有的行動(f,g)而言,f≤g?U(f)≤U(g)。這個公式和馮·諾意曼和摩根斯頓的期望效用理論,都反映了理性人在決策時考慮的效用等于各個結果效用的期望值。不同點在于,馮·諾意曼和摩根斯頓用客觀概率對效用加權,而在薩維奇的公式中,客觀概率被私人概率取代。對一個二元博弈而言,薩維奇的效用值為U(x,A;y)=S(A)U(x)+(1-S(A))U(y),S(A)為個體對事件A的私人概率。因此,上式中的U應該為行動的主觀期望效用,其效用值為U=(Xi)S(Ai),A={A1,A2,…,An},對應事件A有n個可能結果,即X={X1,X2,…,Xn}。這就是說,決策結果可以用私人概率和代表偏好關系的效用函數(shù)來理解,即理性人決策的依據(jù)是期望效用最大化。
薩維奇拓展了拉姆齊和菲尼蒂的主觀概率理論,建立了規(guī)范人們行動的主觀期望效用理論。該理論認為個體的概率分布可以由行動的偏好導出,理性人的行動選擇應該遵循主觀期望效用最大化,但是,該理論也遭受了不少批評和挑戰(zhàn),最著名的例子是阿萊斯悖論[7]和埃爾斯伯格悖論[8]。這兩個悖論指出,在現(xiàn)實生活中,人們實際行動的選擇并不總是和該理論的結果相一致,人們并不總是按照主觀期望效用最大化進行決策。究其實質,這兩個悖論針對的主要是確定事件原則或“確鑿性原則”。
確定事件原則是薩維奇通過一個事例引入的,他說:“一個商人打算購買某個物品。他認為下一屆總統(tǒng)選舉的結果與對這個購買的吸引是相關的。因此為了對自己澄清這個事情,他問自己,如果知道共和黨候選人將獲勝,他是否購買,他決定自己將購買。相同地,他認為如果他了解到民主黨候選人將獲勝,他又發(fā)現(xiàn)自己將購買。由于看到在每一個事件里自己都將購買,他決定自己應該購買這個物品,即使他不知道哪個事件成功,或者將成功,正如我們通常說的。一個決策能夠在一個被這個商人使用的原則的基礎上做出是很少的,但是,可能除了這個簡單的次序假定之外,我了解到?jīng)]有其他特別的調整決策的邏輯原則能夠得到這樣情愿的贊同?!盵5]由此,薩維奇給出了確定事件原則相對形式化的陳述:如果一個人在得知事件B出現(xiàn),或者在得知事件B不出現(xiàn)時,他都將不是喜歡f勝過g,那么他是不喜歡f勝過g。而且(倘若他不把B看作實質上的不可能),如果他在得知B出現(xiàn)時,他很明確,自己喜歡g勝過f,并且,如果他在得知B不出現(xiàn)時,他并不喜歡f勝過g,那么他就是明確地喜歡g勝過f。[5]實際上,這就是指一個理性人對兩個行動之間偏好的次序關系。
薩維奇對該原則形式化的詳細說明主要是通過P2和P3進行的。P3是用來指出B在非零狀態(tài)下的偏好關系,這就在關于結果的優(yōu)先和關于決策者視為可能事件條件的優(yōu)先之間產(chǎn)生一個合理的對應。單獨P2的意思是指,對沒有進行條件偏好定義的、給定B時的偏好關系是不存在的,即給定B時,f≤g,或者給定B時,g≤f。D1則正是針對P2下的關于條件偏好的一個定義,把它們結合起來,則為:如果f,g和f',g'滿足下面三個條件:①在?B上,f和g一致,并且,f'和g'一致;②在B上,f和 f'一致,并且,g和g'一致;③ f≤g;那么 f'≤g'。
這就指出了存在一種行動之間的偏好關系,直覺上的理解為:在給定B時,f和g之間的條件偏好關系僅僅依賴于在B上f和g的特性,而不依賴f和g在狀態(tài)B之外所假定的值;只要兩個行動f和g在B之外被更改成相互之間一致,那么在更改的行動之間的偏好次序的獲得將不依賴于被容許修改的哪個行動實際上的實現(xiàn)。簡而言之,在假定f和g在除B之外是相互一致的,沒有一般性的損失,因此,我們能夠在B之外對它們進行修改,使得他們一致而不影響條件偏好。
在同等意義上,如果f和g是兩個行動,在B之外它們可以被任何方法更改,只要修改了的行動f'和g'在B之外繼續(xù)相互一致,那么在B之外所發(fā)生的變化將不影響給定B時f和g之間的條件偏好??梢酝ㄋ椎乩斫鉃椋褐灰〉脿顟B(tài)不依賴于實際上履行的行動,行動中間的優(yōu)先就不應當取決于那些對兩個行動有完全等同結果的狀態(tài)。這在薩維奇看來肯定是合理的,并且由很多人也都證實這是合乎情理的。[4][5]但是,恰恰是這個看上去合理的條件偏好被顯示出和人們實際中的行動選擇相違背。
針對這一原則,薩維奇用了一個直觀的圖表進行了進一步的闡明,圖表如下:[5]
在圖表中,所有的狀態(tài)s的集合S和所有的結果f的集合F分別用水平和垂直的距離表示,一個行動f(對每一個s∈S,存在一個函數(shù)f(s)∈F)用一個曲線表示。這很形象地說明了用來保證條件偏好的確定事件原則,即:在?B上,兩個行動f和g相互一致,并且,f'和g'也相互一致。在B上,行動f和f'相互一致,并且,行動g和g'也相互一致。如果這個條件滿足,那么 f≤g?f'≤g'。
雖然薩維奇對作為理論出發(fā)點的偏好關系竟然違背理論自身的原則感到震驚,但是,他似乎并沒有正面回答悖論對其理性原則的置疑,沒有澄清悖論所針對的確定事件原則本身的合理性問題,也沒有放棄自己的理性決策觀。只是在回答阿萊斯提出的問題時,他提到人們可能有兩種偏好,一種是個體臨時的、最初的偏好,當被發(fā)現(xiàn)與理性原則不一致后會進行修正,另一種是與主觀期望效用理論中的理性原則相一致的個體真正的偏好。不過,修正仍然是在事先假定確定事件原則正確性的前提下進行,這樣,再次選擇是為了使個體的偏好關系滿足確定事件原則,而得出個體對自己的偏好確實“有一個一般性的或者客觀性的主張”的相應結論。
從邏輯學視野來看,嚴格意義上的邏輯悖論應該同時具有三個要素:即公認正確的背景知識;嚴密無誤的邏輯推導;可以建立矛盾等價式。如果不能同時滿足這三個要素,那么不能稱之為邏輯悖論。有些“悖論”雖然具有悖論的結構特征,但是不滿足“公認正確的背景知識”這一要素,稱之為悖論的擬化形式。[9]公認正確的背景知識是一個涉及到認知主體的概念,“‘公認,總是為某一領域的認知共同體所公認,因而任一悖論都相對于一定領域的認知共同體而言。……其中的‘背景知識,既可以是人們公認的明晰知識,也可以是認知共同體不自覺地使用的預設。盡管這個一般概念是模糊的,但落實到每個具體悖論的構造,其由以導出的背景知識,是能夠以特定認知領域相適應的嚴格性,明確而非含混地予以揭示的。”[9]
主觀期望效用理論的兩個悖論所依據(jù)的同一背景知識實質上相同,悖論實例的本意就是要反對該理論用所謂的理性人作為決策理論的基本假定。不過,完全理性人的假定并不是經(jīng)濟學家這個共同體所公認正確的背景知識。西蒙(H.A.Simon)曾明確提出有限理性理論,認為現(xiàn)實生活中的決策者介于完全理性與非理性之間。之后,卡尼曼(D.Kahneman)和特韋爾斯凱(A.Tversky)更是提出在不確定情形下人們的行動選擇要受到心理因素的影響,實際決策中的決策權重不是概率,也不服從概率公理。同樣持有主觀概率思想的奧地利經(jīng)濟學派的沙克爾(G.Shackle)則開辟了一條由非帕斯卡概率理論來研究個體選擇的方向。這就是說,邏輯全知和概率全知并不是公認的知識,這里的“公認”至多是針對帕斯卡概率論者。
因此,之所以通過嚴密無誤的邏輯推導,建立了矛盾等價式,是由于理性人的假定,理性人的信念滿足概率公理。但是,這個背景知識的正確只是針對經(jīng)濟學領域特定的共同體而言,對其他人而言(例如,對非帕斯卡概率論者來說,帕斯卡概率公理并不成立),這個假設不一定被認為正確。鑒于這個公認正確的背景知識有一定的模糊性導致了這兩個悖論本質上的相對性,它們只能被稱為悖論的擬化形式,不屬于嚴格意義上的邏輯悖論,至多只能將它們歸入廣義邏輯悖論的范疇。它們也不應該是經(jīng)濟學的悖論,只能是針對有著理性人假定的主觀期望效用理論的悖論,由此,促進了不確定性經(jīng)濟學朝著一般期望效用理論發(fā)展。
雖然阿萊斯悖論和埃爾斯伯格悖論不是嚴格意義上的邏輯悖論,但是,它們表明了,在不確定情形下,行動決策存在非理性。這使得經(jīng)濟學家開始對完全理性人假定進行重新審視,決策研究開始重視非理性因素的作用。因此,在薩維奇的主觀期望效用決策理論遭遇悖論挑戰(zhàn)后,出于辯護和摒棄,主觀決策理論開始朝兩個方向發(fā)展。一是繼續(xù)堅持理性決策宗旨,或對現(xiàn)有的期望效用值理論進行改進,或研究更具一般性的理性決策模型;一是質疑期望效用理論本身,開始研究行為人行動時的心理因素。毫無疑問,這對促進決策理論的發(fā)展起到了杠桿的作用。
[1]江天驥主編.科學哲學名著選讀[M].武漢:湖北人民出版社,1988.
[2]H.E.Kyburg,H.E.Smokler.Studies in Subjective Probability[M].Florida:Robert E.krieger Publishing Company,Inc,1980.
[3]Howson,Colon.Logic and Probability[J].The British Journal for the Philosophy of Science,1997,48(4).
[4]潘介人.決策分析中的效用理論[M].上海:上海交通大學出版社,2000.
[5]Leonard J. Savage. The Foundations of Statistics[M]. New York:John Wiley and Sons,1954.
[6]潘天群.社會決策的邏輯結構研究[M].北京:中國社會科學出版社,2003.
[7]Allais,Maurice.Le Comportement de I,Homme Rationnel devant le Risque:Critique des Postulates et Axiomes de I,Ecole Americane[J].Econometrica,1953,21(4).
[8]Ellsberg,Daniel.Risk,Ambiguity,and the Savage Axioms[J].The Quarterly Journal of Economics,1961,75(4).
[9]張建軍.邏輯悖論研究引論[M].江蘇:南京大學出版社,2002.