郭剛正
(中南財經(jīng)政法大學統(tǒng)計與數(shù)學學院,武漢 430073)
基本定義:假如已知有一個可觀察的隨機變量X,它的密度函數(shù)(或概率函數(shù))p(x|θ)依賴于未知參數(shù)θ,θ∈Θ,此處θ稱為參數(shù),Θ稱為參數(shù)空間。定義一個行動集λ={a}:在對θ做點估計時,取λ=θ;在對θ做空間估計時,行動a就是一個區(qū)間,Θ上的一切可能的區(qū)間構(gòu)成行動集λ;在對θ做假設檢驗時,只含兩個行動,接受和拒絕。
損失函數(shù):在Θ×λ上定義了一個損失函數(shù)L(θ,a),它表示參數(shù)為θ時,決策者采取行動a采用行動所引起的損失。
決策函數(shù):在給定的貝葉斯決策問題中,從樣本空間x={x=(x1,…,xn)}到行動集λ上的一個映射δ(x)稱為該問題的一個決策函數(shù),所有從x到λ上的決策函數(shù)組成的類稱為決策函數(shù)類,用D={δ(x)}表示。
若存在某一決策函數(shù),使得此決策函數(shù)在全部決策函數(shù)類中具有最小的后驗風險,則這個決策函數(shù)為后驗風險準則下的最優(yōu)決策函數(shù),也就是貝葉斯決策函數(shù)。依據(jù)后驗風險準則作出的貝葉斯決策可以按照以下步驟。
第一步:后驗風險的刻畫
對可觀察的隨機變量X做n次觀察,獲得一個樣本x=(x1,…,xn),若 X=x的密度函數(shù)為 p(x|θ),用貝葉斯公式可得在樣本給定下,θ的后驗密度函數(shù)為
π(θ|x)=p(x|θ)π(θ)/m(x),
其中 m(x)為邊緣密度函數(shù) m(x)= ∫Θp(x|θ)π(θ)/dθ 。
然后把損失函數(shù)L(θ,a)對后驗分布π(θ|x)求得期望,記為 R(a|x),有
R(a|x)=Eθ|xL(θ,a)∫ΘL(θ,a)π(θ|x)dθ
R(a|x)即為后驗風險。
第二步:最優(yōu)決策函數(shù)的求解
在所有的決策函數(shù)類中,我們需要選取某一特定的決策函數(shù),使得后驗風險達到最小值。因此,后驗風險準則在決策函數(shù)上的δ(x)描述即為:給定樣本聯(lián)合密度函數(shù)p(x|θ)、參數(shù)空間 Θ 上的先驗分布 π(θ)、定義在 Θ × λ上的損失函數(shù) L(θ,a)這三個前提的貝葉斯決策問題中,D={δ(x)}是其決策函數(shù)類,R(δ|x)=Eθ|xL(θ,δ(x)),x∈x,θ∈Θ是決策函數(shù)δ(x)的后驗風險,若在決策函數(shù)類中存在決策函數(shù)δ0(x),使得它在D中具有最小的后驗風險,則稱δ0(x)為后驗風險準則下的最優(yōu)決策函數(shù)。
在做決策的過程中,除了總體信息和先驗信息之外,需要獲取一定的樣本信息,而樣本信息獲取所帶來的效益與相應的費用大小關系決定了獲取該樣本信息的必要性。抽樣信息期望值就是來描述這個兩者之間的關系。
1.3.1 完全信息期望值EVPI
完全信息是指決策者所獲得的信息完全確定一個狀態(tài)的發(fā)生,即在已知完全信息的條件下,事件發(fā)生的概率為1。有了完全信息,就能進行最優(yōu)行動,獲取最大效益。一個決策問題有多個狀態(tài),第j個狀態(tài)的先驗概率為θj,j=1,…,n。且各狀態(tài)都有一個完全信息,第ai,i=1,…,m個行動第j個狀態(tài)的收益為qij。在每一狀態(tài)中,依據(jù)完全信息選取出某一行動,使得該狀態(tài)下的收益值達到最大,即因此可求得有完全信息時的收益期望值而沒有完全信息時,只能按照先驗期望準則決策,其收益期望值為兩者之差稱為完全信息期望值EVPI,是這個完全信息給決策者在收益上帶來的增加或者損失的減少。EVPI的計算公式為
而進一步來看,EVPI也可以用損失函數(shù)來表示:
其中,Qji為出現(xiàn)θj狀態(tài)時采取行動ai的收益,ak表示使E0[Q(θ,ai)]取最大時的行動,Qjk表示ak行動下對應的收益矩陣。由收益矩陣可以確定損失矩陣,而完全信息期望值就可由最優(yōu)行動的先驗期望損失來確定和計算了。
1.3.2 抽樣信息期望值EVSI
完全信息期望值EVPI表示決策者在能掌握完全信息時的期望損失或期望收益,它是以先驗分布為基礎的。而在獲得樣本信息后,在以后驗分布為基礎的討論中,我們類似的可以得出完全信息后驗期望值。設π(θ|x)為樣本x=(x1,…,xn)給定下θ的后驗分布,δ(x)為據(jù)此后驗分布所確定的貝葉斯決策函數(shù),而在δ(x)下?lián)p失函數(shù)L(θ,δ(x))的后驗期望 Eθ|xL(θ,δ(x))稱為完全信息后驗期望值,記為
后驗 EVPI=Eθ|xL(θ,δ(x))
而后驗EVPI仍是依賴于樣本x的隨機變量,用樣本x的邊緣分布m(x)對Eθ|xL(θ,δ(x))再求一次期望以消除隨機性,得到后驗EVPI期望值,記為
后驗 EVPI期望值 =ExEθ|xL(θ,δ(x))
一般來說,樣本信息的獲得會增加決策者對狀態(tài)的了解,決策過程中期望損失會降低,這個減少量就稱為抽樣信息期望值EVSI。EVSI的計算公式為
其中,ak是先驗期望準則下的最優(yōu)行動,δ0(x)是后驗風險準則下的最優(yōu)決策函數(shù),EVSI即為先驗EVPI與后驗EVPI期望值的差,即獲得樣本信息后給決策者帶來的收益。
某公司希望增加一個小額高頻資金投資項目。市場經(jīng)驗表明,一年中每千次投資里失敗次數(shù)θ的概率分布如下表1所示:
表1 一年中每千次投資里失敗次數(shù)的概率分布
假定每次投資失敗,公司平均要付出賠償款200元。為進行該項目,每年固定成本為10萬元。該公司估計,每次投資會產(chǎn)生利潤10元,每年可投資10萬次,試求完全信息期望值EVPI。與此同時,決策者想從每千次投資中抽取三次進行調(diào)查,根據(jù)投資失敗的次數(shù)(用x表示)來決定是否增加該投資項目,求出最優(yōu)決策函數(shù),并計算抽樣信息期望值EVSI。
首先求解完全信息期望值。由題可知,該公司面臨兩個行動的選擇:
a0:不增加該投資項目
a1:增加該投資項目
若選擇a0行動,公司利潤為0元/年;
若選擇a1行動,公司利潤為900000~20000θ元/年。
由此可得出利潤矩陣和損失矩陣
可計算出a0行動和a1行動的先驗期望損失:
在先驗期望準則下,a1是最優(yōu)行動,故完全信息期望值EVPI=54000元/年。
在決策者抽取三次投資行動進行調(diào)查時,失敗的人數(shù)x只可能從0,1,2,3這四個值中取得,所以由{0,1,2,3}到{a0,a1}上的任一映射δ(x)都是一個決策函數(shù)。我們通過下面幾步計算來確定最優(yōu)決策函數(shù)和抽樣信息期望值。
第一步,計算θ的后驗分布。因為抽樣結(jié)果x服從二項分布b(3,θ),即
而根據(jù)表1的先驗分布π(θ)可以算出x的邊緣分布,結(jié)果見下表2:
表2 x的邊緣分布
由上表2的邊緣分布可以算出x值下的后驗分布π(θ|x),結(jié)果見下表3:
表3 各x值下的后驗分布π(θ|x)
第二步,計算各行動的后驗期望損失Eθ|xL(θ,a)∑L(θ,a)π(θ|x),結(jié)果見下表4:
表4 各x值下各行動的后驗期望損失
第三步,定出最優(yōu)決策函數(shù)。根據(jù)風險最小化準則,對抽樣結(jié)果x的每個可能制定最優(yōu)結(jié)果,這樣就得到最優(yōu)決策函數(shù)
第四步,計算后驗EVPI和后驗EVPI期望值。根據(jù)上表4的后驗期望損失結(jié)果可計算出后驗EVPI,即為表4中每個x值下的最小后驗期望損失,結(jié)果為
在x=0時,后驗EVPI=52170
在x=1時,后驗EVPI=66096
在x=2時,后驗EVPI=54140
在x=3時,后驗EVPI=42110
而后驗EVPI期望值是用樣本的邊緣分布m(x)對后驗EVPI求期望而得。根據(jù)表2中x的邊緣分布結(jié)果,可求得后驗EVPI期望值為
ExEθ|xL(θ,δ0(x))=52170×0.8747+66096×0.11956+54140×0.00563+42110×0.0000915=53844.19803≈53844.2
第五步,計算抽樣信息期望值。
EVSI=先驗后EVPI的期望值=54000-53844.2=155.8(元)
這表明,在每千次投資中隨機抽取3次進行調(diào)查,根據(jù)檢驗結(jié)果x定出的最優(yōu)決策函數(shù)δ0(x)要比抽樣前的最優(yōu)行動減少損失155.8元,也就是抽樣給決策者帶來的增益。
決策者總是希望自己的決策能夠更有依據(jù),期望收益更高,期望損失更低,而貝葉斯方法充分利用總體信息、樣本信息、先驗信息、損失函數(shù),計算最優(yōu)決策函數(shù)與最小后驗期望損失,并利用相關指標刻畫抽樣的經(jīng)濟效益,使得整個決策過程更有說服力。從全文的分析和研究中,我們能夠體會到貝葉斯方法在決策中應用時,具有一些很優(yōu)良的特性:
第一,貝葉斯方法的決策過程是一套完整的體系。從先驗分布到后驗分布,再借助損失函數(shù),得出最優(yōu)決策函數(shù),同時可計算抽樣的經(jīng)濟效益。這個逐漸融入更多信息的過程形成了決策的完整體系,使決策者能夠作出成熟、迅速的判斷。
第二,貝葉斯方法使決策具有更小的后驗期望風險。用利潤函數(shù)描述就是后驗期望最大化,用損失函數(shù)描述就是后驗損失最小化。
第三,貝葉斯方法能充分利用各種信息,它尤其重視先驗信息利用,收集、挖掘、加工先驗信息,使它數(shù)量化,形成先驗分布,和樣本信息結(jié)合起來,大大提高了統(tǒng)計推斷的質(zhì)量。
第四,貝葉斯決策能用抽樣信息期望值這一指標量化抽樣給決策者帶來的效益,減少決策中的期望損失,同時,將抽樣信息期望值與抽樣所需費用相比較就能告訴決策者進行該抽樣是否合理。
[1]茆詩松.貝葉斯統(tǒng)計[M].北京:中國統(tǒng)計出版社,1999.
[2]吳喜之.統(tǒng)計決策論及貝葉斯分析[M].北京:中國統(tǒng)計出版社,1998.
[3]James O.Berger.Statistical Decision Theory and Bayesian Analysis[M].New York:Springer-Verlag,2004.
[4]吳海村.管理統(tǒng)計決策分析[M].西南財經(jīng)大學出版社,1991.
[5]朱金玲.貝葉斯決策分析及改進[J].江蘇統(tǒng)計,2000,(6).
[6]劉昊.貝葉斯決策方法在審計中的運用[J].財貿(mào)研究,2002,(3).
[7]朱震峰.貝葉斯決策法的應用[J].大原大學學報,2007,8(3).
[8]盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計[M].北京:高等教育出版社,2008.
[9]徐國祥.統(tǒng)計預測與決策[M].上海:上海財經(jīng)大學出版社,2008.