国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于馬爾科夫模型的期望效用序貫三支決策方法

2021-07-22 00:22曹家碩李華雄賈修一
關(guān)鍵詞:馬爾科夫投資決策效用

曹家碩,李華雄,閔 帆,賈修一,于 洪

(1.南京大學(xué) 工程管理學(xué)院, 江蘇 南京 210093;2.西南石油大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院,四川 成都 610500;3.南京理工大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,江蘇 南京 210094;4.重慶郵電大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,重慶 400065)

三支決策(three-way decisions,3WD)是一種基于人類(lèi)認(rèn)知的決策模式,它把待解決的問(wèn)題或待處理的信息分解為3個(gè)元素或者3個(gè)部分,再進(jìn)行處理。因其思想的樸素性與實(shí)用性,三支決策理論普遍存在于科學(xué)研究和日常生活等各個(gè)方面[1]。三支決策理論最初由姚一豫教授提出,是一種較新的決策分析理論,可以用于處理不完整、不精確信息[2-3]。在粗糙集理論模型中,Yao通過(guò)引入貝葉斯風(fēng)險(xiǎn)決策方法,依據(jù)最低風(fēng)險(xiǎn)代價(jià),將劃分對(duì)象集分為正域、邊界區(qū)域和負(fù)域[4]。在此基礎(chǔ)上,通過(guò)獲取更多有效信息,繼續(xù)對(duì)延遲區(qū)域進(jìn)行三支劃分,形成了序貫三支決策模型,適用于處理動(dòng)態(tài)、復(fù)雜、不確定性的問(wèn)題[5]。

目前,對(duì)三支決策的研究主要集中在理論擴(kuò)展、模型改進(jìn)和實(shí)際應(yīng)用上。

1) 在理論擴(kuò)展方面,研究主要集中在概念分析、閾值確定和屬性約簡(jiǎn)等方面的研究。魏玲等對(duì)三支概念分析進(jìn)行了系統(tǒng)的研究[6-9]。周獻(xiàn)中等利用概率語(yǔ)言術(shù)語(yǔ)集來(lái)確定閾值概率[10]。劉盾、李天瑞等在三支決策粒計(jì)算方面進(jìn)行了理論擴(kuò)展[11-12]。于洪、王國(guó)胤等將聚類(lèi)算法和屬性約簡(jiǎn)引入到?jīng)Q策理論粗糙集,重新劃分了三支決策區(qū)域[13-14]。張清華等從模糊集角度對(duì)三支決策進(jìn)行了系統(tǒng)研究[15-16]。孫秉珍等在2個(gè)全集上建立了三支決策粗糙集[17]。李金海等在三支決策概念方面做了系統(tǒng)地研究[18]。折延宏等在多尺度決策表方面對(duì)決策規(guī)則進(jìn)行了拓展研究[19]。

2) 在模型改進(jìn)方面,研究主要集中在將效用理論、罰函數(shù)、混淆矩陣等引入三支決策建立新的模型。王天行、李華雄等將前景理論、累積前景理論等引入到了三支決策[20-24]。姚一豫等將序貫粒度屬性約簡(jiǎn)引入到了序貫三支決策[25]。張清華、王國(guó)胤等從相鄰兩個(gè)粒度層的分類(lèi)精度差異出發(fā),提出了一種基于罰函數(shù)的序貫三支決策,并通過(guò)引入效用理論提出了一種效用三支決策[26-27]。苗奪謙等通過(guò)引入混淆矩陣建立了新的三支分類(lèi)器模型[28]。閔帆等通過(guò)引入聚類(lèi)選擇算法提出了三支主動(dòng)學(xué)習(xí)模型[29]。賈修一等通過(guò)提出一種自動(dòng)選擇簇號(hào)的方法改進(jìn)了三支聚類(lèi)方法[30]。王平心、楊習(xí)貝等引入關(guān)聯(lián)矩陣和確定性函數(shù)提出了新的三支聚類(lèi)方法[31]。

3) 在實(shí)際應(yīng)用方面,研究主要集中在將三支決策應(yīng)用到人臉識(shí)別、醫(yī)療診斷、投資金融等方面。劉盾等將三支決策應(yīng)用到了投資決策方面[32-34]。祁建軍等在沖突分析方面進(jìn)行了三支決策的相關(guān)研究[35]。梁德翠等將三支決策模型應(yīng)用到了眾包任務(wù)分配方面[36]。

投資問(wèn)題必然伴隨著投資決策。目前,在投資決策方面的研究,徐澤水等提出了多維偏好線性規(guī)劃法來(lái)解決鐵路投資問(wèn)題[37]。廖諾等通過(guò)引入遺傳算法以節(jié)能減排為目標(biāo)解決了建筑投資問(wèn)題[38]。李曉彤等通過(guò)構(gòu)建信息安全投資決策博弈模型來(lái)解決企業(yè)投資問(wèn)題[39]。如圖1所示,投資決策與三支決策具有天然的一致性,三支決策的正域與決策進(jìn)行投資相對(duì)應(yīng),負(fù)域與決策不進(jìn)行投資相對(duì)應(yīng),邊界域與決策暫且觀望并收集更多信息相對(duì)應(yīng)。

圖1 三支決策模型Fig.1 Trisecting-and-acting model of three-way decisions

劉盾等曾就投資問(wèn)題建立起三支決策模型以解決石油投資問(wèn)題[32],然而,該模型未考慮投資者的投資效用問(wèn)題,投資的收益和風(fēng)險(xiǎn)也未考慮動(dòng)態(tài)序貫的過(guò)程。因此,為解決動(dòng)態(tài)序貫的投資決策問(wèn)題,本文將通過(guò)引入期望效用理論來(lái)模擬投資人的投資偏好,使用馬爾科夫預(yù)測(cè)方法模擬估計(jì)投資預(yù)期收益和風(fēng)險(xiǎn),提出了一種序貫三支決策模型,以期望能為投資問(wèn)題提供新的思路。

1 相關(guān)工作

1.1 序貫三支決策

假設(shè)狀態(tài)集Ω={X,X}表示2種狀態(tài),本文對(duì)象屬于X和屬于X的補(bǔ)集分別表示投資在未來(lái)預(yù)期具備高收益和預(yù)期不具備高收益。行動(dòng)集A={aP,aB,aN}中的aP,aB和aN分別代表進(jìn)行投資,無(wú)法判定和不進(jìn)行投資3種決策行動(dòng),在實(shí)際決策過(guò)程中,不同狀態(tài)下采取不同行動(dòng)往往會(huì)產(chǎn)生不同的損失代價(jià)。表1給出了相應(yīng)的決策代價(jià)損失,其中λPP,λBP和λNP為對(duì)象屬于狀態(tài)X時(shí),分別采取行動(dòng)aP,aB和aN對(duì)應(yīng)的代價(jià)損失;λPN,λBN和λNN為對(duì)象不屬于狀態(tài)X時(shí),分別采取aP,aB和aN行動(dòng)的代價(jià)損失。在經(jīng)典三區(qū)域決策模型中,決策代價(jià)損失均以實(shí)值表示。

表1 代價(jià)損失矩陣Tab.1 Loss function matrix

事實(shí)上,對(duì)于對(duì)象[x]([·]表示等價(jià)類(lèi)),采取不同行動(dòng)所產(chǎn)生的風(fēng)險(xiǎn)代價(jià)可計(jì)算為:

R(aP|[x])=λPPPr(X|[x])+

λPNPr(X|[x]);

R(aB|[x])=λBPPr(X|[x])+

λBNPr(X|[x]);

R(aN|[x])=λNPPr(X|[x])+

λNNPr(X|[x])。

依據(jù)貝葉斯最小風(fēng)險(xiǎn)決策原則,最小成本決策規(guī)則可歸納為:

(P1) 如果代價(jià)R(aP|[x])≤R(aB|[x])且R(aP|[x])≤R(aN|[x]),則x∈POS(X);

(B1) 如果代價(jià)R(aB|[x])≤R(aP|[x])且R(aB|[x])≤R(aN|[x]),則x∈BND(X);

(N1) 如果代價(jià)R(aN|[x])≤R(aP|[x])且R(aN|[x])≤R(aB|[x]),則x∈NEG(X)。

考慮到一種合理情形,即

λPP≤λBP<λNP且λNN≤λBN<λPN。

假設(shè)決策邊界域存在,則有

(λBP-λPP)(λBN-λNN)<

(λPN-λBN)(λNP-λBP),

則上述決策規(guī)則(P1)~(N1)可進(jìn)一步簡(jiǎn)化為:

(P2) 若滿(mǎn)足條件Pr(X|[x])≥α, 則

x∈POS(X);

(B2) 若滿(mǎn)足條件β

x∈BND(X);

(N2) 若滿(mǎn)足條件Pr(X|[x])≤β,則x∈NEG(X)。

其中:

否則,決策規(guī)則(P1)~(N1)表示為:

(P3) 若Pr(X|[x])≥γ,則x∈POS(X);

(N3) 若Pr(X|[x])≤γ,則x∈NEG(X)。

其中,

在邊界域決策的過(guò)程當(dāng)中,需要更準(zhǔn)確的劃分它的正域、負(fù)域和邊界域,形成一個(gè)序貫的、多粒度、多層次的決策結(jié)構(gòu),構(gòu)成一個(gè)序貫三支決策過(guò)程。序貫三支決策是一種從粗粒度到細(xì)粒度的動(dòng)態(tài)決策過(guò)程。在每個(gè)粒度級(jí)別,當(dāng)沒(méi)有足夠的可用信息來(lái)支持最終決策時(shí),會(huì)采用延遲決策。在添加更多信息后,在下一個(gè)粒度級(jí)別繼續(xù)進(jìn)行三支決策。假設(shè)(αi,βi)為第i層粒度下的決策閾值,則基于(αi,βi)的正域、邊界域和負(fù)域分別為:

POS(αi,βi)(Xi)={x∈Ui|Pr(Xi|

[x]≥αi)};

BND(αi,βi)(Xi)={x∈Ui|βi

[x]<αi)};

NEG(αi,βi)(Xi)={x∈Ui|Pr(Xi|

[x]≤βi)}。

其中,Xi表示第i層粒度結(jié)構(gòu)的目標(biāo)概念,即第i層粒度結(jié)構(gòu)下投資項(xiàng)目的決策結(jié)果,Xi?Ui;Ui表示第i層粒度結(jié)構(gòu)下需要決策的投資項(xiàng)目,即第i層粒度結(jié)構(gòu)的論域。

經(jīng)過(guò)第i層決策后,得到邊界域BND(αi,βi)(Xi)中的對(duì)象,將在第i+1層重新進(jìn)行投資決策。因此,Ui+1=BND(αi,βi)(Xi)滿(mǎn)足Un?…?U2?U1。此外,第i+1層的目標(biāo)概念Xi+1=Xi∩BND(αi,βi)(Xi)滿(mǎn)足Xn?…?X2?X1。

序貫三支決策多層次處理問(wèn)題的過(guò)程中,當(dāng)獲取的信息不足時(shí),把對(duì)象劃分到邊界域中,當(dāng)獲取到有效信息時(shí)繼續(xù)對(duì)邊界域中的對(duì)象進(jìn)行劃分,這種對(duì)象的認(rèn)識(shí)粒度由粗逐漸變細(xì)的過(guò)程,為許多實(shí)際問(wèn)題的解決提供了方法,能夠有效解決多粒度、多層次的問(wèn)題。

1.2 期望效用理論

序貫三支決策的邊界域的確定,即閾值的獲取是受到廣泛關(guān)注的問(wèn)題。對(duì)于投資決策問(wèn)題,可以通過(guò)期望效用理論來(lái)刻畫(huà)決策者的投資感受。決策人對(duì)于期望收益值的滿(mǎn)意程度就叫做投資決策的效用。在決策理論中,決策結(jié)果對(duì)決策人的實(shí)際價(jià)值,即決策人對(duì)結(jié)果的偏好次序是用效用來(lái)描述的。效用就是偏好的量化[27]。偏好次序如下:

1)x≥y:弱偏好于x,即x至少與y一樣好;

2)x?y:強(qiáng)偏好于x,其中x?y?x≥y但

y≥x不成立;

3)x~y:對(duì)x,y無(wú)差異,即x~y?x≥y且y≥x。

當(dāng)考慮不帶不確定性的一般經(jīng)濟(jì)均衡討論中,經(jīng)濟(jì)活動(dòng)者的行為是以效用函數(shù)期望最大化來(lái)進(jìn)行決策的。當(dāng)考慮帶不確定性的經(jīng)濟(jì)均衡討論中,則假定商品的量均是隨機(jī)變量,它們的取值將取決于不確定的狀態(tài)。當(dāng)效用函數(shù)遇到不確定現(xiàn)象時(shí)比如投資決策中投資者的滿(mǎn)意程度,這種模糊的概念比較難以確定其準(zhǔn)確值,因此,就引出了期望效用的概念。假設(shè)投資的效用是一個(gè)隨機(jī)變量u,它可能取2個(gè)值

ui=u(ωi),i=1,2。

并且,u=ui的概率分別是π1和π2,那么,u的期望值Eu=π1u1+π2u2就是投資的期望效用。對(duì)于期望效用函數(shù), 它的數(shù)學(xué)性質(zhì)可以反映人的行為特性。因?yàn)槠谕в檬遣灰欢軐?shí)現(xiàn)的, 真實(shí)的效用會(huì)比它高或比它低, 有不確定性。達(dá)不到預(yù)期的效用就造成了損失, 形成風(fēng)險(xiǎn)。對(duì)待風(fēng)險(xiǎn)的態(tài)度可分為3種:風(fēng)險(xiǎn)厭惡、風(fēng)險(xiǎn)中性、風(fēng)險(xiǎn)偏好, 如圖2所示。

1)若效用函數(shù)是凹函數(shù),如圖2中曲線a有u(Eω)>Eu(ω),即期望的效用好于效用的期望,則相應(yīng)于風(fēng)險(xiǎn)厭惡者;

2)若效用函數(shù)如圖2中直線b滿(mǎn)足u(Eω)=Eu(ω),即期望的效用等于效用的期望,則相應(yīng)于風(fēng)險(xiǎn)中性者;

3)若效用函數(shù)是凸函數(shù),如圖2中曲線c有u(Eω)

圖2 效用函數(shù)類(lèi)型Fig.2 Types of utility function

經(jīng)典的資產(chǎn)定價(jià)理論中介紹了多種形式的效用函數(shù),而一般認(rèn)為投資者是屬于風(fēng)險(xiǎn)厭惡的。因此,最常用的投資者的效用函數(shù)是二次型效用函數(shù),為

二次型效用函數(shù)具有遞增絕對(duì)風(fēng)險(xiǎn)厭惡的性質(zhì)。如果投資的收益率服從正態(tài)分布(即滿(mǎn)足馬科維茲均值-方差模型的分析假設(shè)條件),同時(shí),投資者效用函數(shù)為二次型,那么,不論投資者的風(fēng)險(xiǎn)偏好程度如何,他們?cè)谫Y產(chǎn)組合的有效邊界中總能確定一個(gè)最優(yōu)資產(chǎn)組合。

1.3 馬爾科夫預(yù)測(cè)方法

二次型效用函數(shù)對(duì)效用的計(jì)算需要投資的收益值與風(fēng)險(xiǎn)值,因此,需要對(duì)投資的收益和風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè)。在投資決策中,對(duì)于投資收益率、投資的風(fēng)險(xiǎn)等變量進(jìn)行預(yù)測(cè)十分重要,也是很多學(xué)者努力研究的方向。根據(jù)解題思路不同,常用的預(yù)測(cè)方法大致分為:時(shí)間序列模型、灰色預(yù)測(cè)模型及馬爾科夫方法[40]等??梢赃\(yùn)用預(yù)測(cè)股票收益的馬爾科夫方法來(lái)預(yù)測(cè)投資收益與風(fēng)險(xiǎn)。

符合無(wú)后效性質(zhì)的過(guò)程,稱(chēng)為馬爾科夫過(guò)程。根據(jù)學(xué)者們?cè)谥把芯繒r(shí)的經(jīng)驗(yàn),以及對(duì)投資標(biāo)的物一段時(shí)間內(nèi)的觀察,再加上市場(chǎng)對(duì)標(biāo)的物價(jià)格在一般情況下的決定方式,可以把標(biāo)的物價(jià)格的變動(dòng)過(guò)程看作是服從馬爾科夫過(guò)程的。若將收益率變量設(shè)定為隨機(jī)變量,則其具有的馬爾科夫性質(zhì)意味著投資收益率在未來(lái)的變化軌跡不會(huì)依賴(lài)收益率在過(guò)去遵循的路徑。借助于標(biāo)的物價(jià)格的馬爾科夫性質(zhì),采用馬爾科夫方法,對(duì)根據(jù)每期標(biāo)的物價(jià)格所測(cè)算出來(lái)的投資未來(lái)期望收益率進(jìn)行預(yù)測(cè)。

假設(shè)當(dāng)期證券的收益率處于狀態(tài)i,下一期該證券的收益率處于狀態(tài)j,則可獲得整個(gè)收益率歷史數(shù)據(jù)中由狀態(tài)i轉(zhuǎn)移到狀態(tài)j的轉(zhuǎn)移次數(shù)aij,并構(gòu)建狀態(tài)空間轉(zhuǎn)移次數(shù)矩陣

根據(jù)狀態(tài)轉(zhuǎn)移次數(shù)可計(jì)算狀態(tài)轉(zhuǎn)移概率

因此,可構(gòu)建狀態(tài)轉(zhuǎn)移概率矩陣

建立線性方程組以求得收益率處于各個(gè)狀態(tài)的概率

求解線性方程組,解為x=(p1,p2,…,pN)T。由此可知,在經(jīng)過(guò)一段時(shí)間后,證券收益率處于狀態(tài)1至狀態(tài)N的概率分別為p1至pN。那么,其中概率最大的狀態(tài)的對(duì)應(yīng)收益率即為該證券在未來(lái)一段時(shí)間內(nèi)最有可能的收益率。

2 期望效用序貫三支決策

通過(guò)馬爾科夫預(yù)測(cè)方法預(yù)測(cè)投資的收益和風(fēng)險(xiǎn),并獲得決策者的期望效用,由此可以建立起一種序貫的投資三支決策模型。

針對(duì)投資問(wèn)題,假設(shè)基于期望效用理論的三支決策模型是由狀態(tài)集Ω={X,X}的2個(gè)狀態(tài)和行動(dòng)集A={aP,aB,aN}的3個(gè)行動(dòng)組成。假設(shè)不同狀態(tài)下不同行為產(chǎn)生的期望效用eij(i=P,B,N;j=P,N)由一個(gè)3×2矩陣給出,如表2所示。在矩陣中,ePP,eBP,eNP分別表示當(dāng)投資在未來(lái)預(yù)期處于高收益狀態(tài)時(shí)給出行為aP,aB和aN的期望效用,ePN,eBN,eNN分別表示當(dāng)投資在未來(lái)預(yù)期可能不處于高收益狀態(tài)時(shí)給出行為aP,aB和aN的期望效用。類(lèi)似于經(jīng)典三支決策模型[2]和基于效用理論的三支決策模型[27],本模型同樣利用等價(jià)類(lèi)[x]刻畫(huà)對(duì)象x即證券,Pr(X|[x])表示x屬于X的概率,即一系列證券中預(yù)期具備高收益率的概率。

表2 期望效用矩陣Tab.2 Expected utility matrix

與上節(jié)稍有不同, 需要獲取投資具有最高收益預(yù)期的狀態(tài)的概率, 而非概率狀態(tài)最高對(duì)應(yīng)的預(yù)期收益率。 通過(guò)計(jì)算該投資處于各個(gè)狀態(tài)下的預(yù)期收益率, 預(yù)期收益率最高的狀態(tài)的概率即可認(rèn)為是該投資具有高收益率預(yù)期的概率。 由上節(jié)可知,投資處于狀態(tài)1至狀態(tài)N的概率分別為p1至pN。 假設(shè)當(dāng)前處于狀態(tài)i, 則下一期處于狀態(tài)j的概率為pij, 可計(jì)算得到投資的收益率期望和方差為:

通過(guò)比較狀態(tài)1至狀態(tài)N對(duì)應(yīng)計(jì)算得到的期望收益率r,選取其中最大的r對(duì)應(yīng)的狀態(tài)i即為三支決策的狀態(tài)X,則條件概率Pr(X|[x])即為對(duì)應(yīng)狀態(tài)概率pi。

假設(shè)收益率R服從正態(tài)分布N(μ,σ2),其中,由上述公式可知有μ=r和σ2=σ2[41]。正態(tài)分布的密度函數(shù)為

因此,二次型效用函數(shù)的期望效用為[41]

ER~N(r,σ2)R-bER~N(r,σ2)R2=

ER~N(r,σ2)R-b[(ER~N(r,σ2)R)2+

varR~N(r,σ2)R]=

r-b(r2+σ2)=

r-br2-bσ2,

根據(jù)期望效用最大化的決策程序,采取不同行動(dòng)aP,aB和aN所對(duì)應(yīng)的期望效用EU(ai|[x])(i=P,B,N)可以表示如下:

EU(aP|[x])=ePPPr(X|[x])+

ePNPr(X|[x]),

EU(aB|[x])=eBPPr(X|[x])+

eBNPr(X|[x]),

EU(aN|[x])=eNPPr(X|[x])+

eNNPr(X|[x])。

由于決策者可能會(huì)選擇最大期望效用的選項(xiàng),基于期望效用的三支決策模型提出了以下優(yōu)化問(wèn)題來(lái)尋找最佳行動(dòng)

因此,決策程序建議以下追求最大期望效用的決策規(guī)則:

(P4) 如果EU(aP|[x])≥EU(aB|[x])且EU(aP|[x])≥EU(aN|[x]),則x∈POS(X);

(B4) 如果EU(aB|[x])≥EU(aP|[x])且EU(aB|[x])≥EU(aN|[x]),則x∈BND(X);

(N4) 如果EU(aN|[x])≥EU(aP|[x])且EU(aN|[x])≥EU(aB|[x]),則x∈NEG(X)。

考慮到一種合理情形,即

eNP

假設(shè)決策邊界域存在,則有

(eBP-ePP)(eBN-eNN)<

(ePN-eBN)(eNP-eBP)

則上述決策規(guī)則(P4)~(N4)可進(jìn)一步簡(jiǎn)化為:

(P5) 若滿(mǎn)足條件Pr(X|[x])≥α,

則x∈POS(X);

(B5) 若滿(mǎn)足條件β

則x∈BND(X);

(N5) 若滿(mǎn)足條件Pr(X|[x])≤β,

則x∈NEG(X)。

其中:

因此,上述3種決策規(guī)則(P5)~(N5)稱(chēng)之為期望效用三支決策。然而,基于投資決策問(wèn)題,需要構(gòu)建一個(gè)動(dòng)態(tài)序貫的三支決策。假設(shè)T={T1,T2,…,Tn}為投資期數(shù),即投資者選取作為歷史數(shù)據(jù)的期數(shù)。其中T1

3 實(shí)驗(yàn)與分析

基于以上分析,為驗(yàn)證模型的有效性,將投資標(biāo)的物以股票為例進(jìn)行實(shí)驗(yàn)分析。本文選取了中國(guó)股票市場(chǎng)中基于不同行業(yè)共9支股票s={s1,s2,…,s9}進(jìn)行實(shí)驗(yàn)。以股票ID為000825的股票s1為例,首先選取2020年初至2021年初的歷史交易數(shù)據(jù)作為第一次決策的數(shù)據(jù)樣本。以每5天作為1期,則樣本數(shù)據(jù)可分為共48期,即T1=48。下面,先應(yīng)用馬爾科夫鏈預(yù)測(cè)方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。

根據(jù)歷史數(shù)據(jù)計(jì)算得出, 該股票收益率的最大值為0.159 9, 最小值為-0.141 1。 于是, 收益區(qū)間為[-0.141 1, 0.159 9], 將區(qū)間4等分為[-0.141 1,-0.062 6),[-0.062 6,0.009 4),[0.009 4,0.084 6), [0.084 6,0.159 9],分別設(shè)為狀態(tài)1至4。則一步狀態(tài)轉(zhuǎn)移矩陣為

建立如下方程,求解股票收益率落在各個(gè)狀態(tài)的概率

上述方程的解為x=(p1,p2,p3,p4)T,由此可知,在未來(lái)一段時(shí)間內(nèi)處于狀態(tài)1至4的概率分別為0.063 8,0.595 7,0.297 8,0.042 6。

因此,狀態(tài)1的期望收益率和方差分別為0.047 0和0.003 8;狀態(tài)2的期望收益率和方差分別為-0.004 0和0.002 0;狀態(tài)3的期望收益率和方差分別為-0.012 1和0.001 8;狀態(tài)4的期望收益率和方差分別為-0.028 2和0.005 7。顯然,當(dāng)股票處于狀態(tài)1時(shí),它具有最高的期望收益率。9支股票處于高收益預(yù)期的概率Pr(X|s)及對(duì)應(yīng)的收益率期望r和方差σ2如表3所示。

表3 股票相關(guān)屬性Tab.3 Stock related attributes

針對(duì)證券投資者問(wèn)題,并參考劉盾等在投資三支決策中閾值的設(shè)置方式[32],9支股票不同行為對(duì)應(yīng)期望效用如表4所示,顯然都滿(mǎn)足eNP

eBP=wePP,uBN=weNN

其中,w為權(quán)重函數(shù)。由于狀態(tài)1至狀態(tài)N為歷史收益率區(qū)間的N均等分,很顯然狀態(tài)1至狀態(tài)N的區(qū)間收益率為遞增狀態(tài)。當(dāng)處于狀態(tài)1時(shí),更可能轉(zhuǎn)移到預(yù)期收益率更高的狀態(tài);當(dāng)處于狀態(tài)N時(shí),則更可能轉(zhuǎn)移到低預(yù)期收益率的狀態(tài)。本文實(shí)驗(yàn)對(duì)應(yīng)的權(quán)重函數(shù)如下式所示:

其中,Pij為股票從狀態(tài)i轉(zhuǎn)移到狀態(tài)j的概率。根據(jù)如上方法設(shè)置期望效用,當(dāng)股票處于預(yù)期高收益狀態(tài)的概率足夠高或者該狀態(tài)的預(yù)期收益率足夠高時(shí),很容易被分到正域;當(dāng)股票的狀態(tài)概率和狀態(tài)預(yù)期收益率都很低時(shí),很容易被分到負(fù)域;其余情況則會(huì)被分到邊界域。則由期望效用求得的9支股票對(duì)應(yīng)閾值如表5所示。

表4 不同行為對(duì)應(yīng)期望效用Tab.4 Expected utility of actions

假設(shè)第二次決策選取2019年初至2021年初共97期收益率歷史數(shù)據(jù);第三次決策選取2018年初至2021年初共140期收益率歷史數(shù)據(jù);第四次決策選取2017年初至2021年初共189期收益率歷史數(shù)據(jù)。則序貫三支決策的決策結(jié)果如表6所示。

表5 股票閾值Tab.5 Threshold of the stocks

由表3可知,股票s2和s7都具有較高的高期望收益狀態(tài)概率,即Pr(X|s2)=42.6%且Pr(X|s7)=48.9%,因此,易將它們分入正域;相反,股票s3,s4,s6和s9的高期望收益狀態(tài)概率Pr(X|s)和預(yù)期收益率r都較低,因此,易將它們分入負(fù)域;剩下的股票s1,s5和s8先將它們分入邊界域,再通過(guò)不斷擴(kuò)大歷史數(shù)據(jù)再次進(jìn)行決策。其中,股票s1和s8通過(guò)更大的歷史數(shù)據(jù)獲得的Pr(X|s)和r有所下降,因此,被逐步分入負(fù)域。由此可見(jiàn),序貫三支決策的決策結(jié)果符合設(shè)計(jì)預(yù)期。

4 結(jié)語(yǔ)

如何描述決策者的風(fēng)險(xiǎn)態(tài)度是三支決策理論中的一個(gè)焦點(diǎn)問(wèn)題。本文基于投資決策問(wèn)題,首先,通過(guò)馬爾科夫預(yù)測(cè)方法來(lái)模擬預(yù)測(cè)投資預(yù)期的收益和風(fēng)險(xiǎn);然后,根據(jù)取得的收益和風(fēng)險(xiǎn)再通過(guò)計(jì)算二次型效用函數(shù)的期望效用來(lái)模擬投資者的投資偏好;最后,根據(jù)期望效用最大化原則提出一種序貫三支決策模型。

表6 投資決策結(jié)果Tab.6 Results of investment decisions

有關(guān)投資決策的三支決策模型,目前還隱含著大量的研究課題。在未來(lái)的研究中,可以進(jìn)一步將馬爾科夫模型與三支決策結(jié)合起來(lái),例如,將馬爾科夫鏈應(yīng)用到序貫的決策過(guò)程中,形成一段時(shí)間內(nèi)的動(dòng)態(tài)決策。這些富含理論意義與研究?jī)r(jià)值的新問(wèn)題將在今后的研究中進(jìn)一步討論。

猜你喜歡
馬爾科夫投資決策效用
基于三維馬爾科夫模型的5G物聯(lián)網(wǎng)數(shù)據(jù)傳輸協(xié)議研究
馬爾科夫鏈驅(qū)動(dòng)的帶停時(shí)的超前倒向隨機(jī)微分方程的適應(yīng)解
呼和浩特市中心城區(qū)低效用地潛力分析
中醫(yī)特色護(hù)理技術(shù)在老年高血壓患者中的應(yīng)用效用觀察
基于分級(jí)診療體系的轉(zhuǎn)診與政府投資決策研究
高等院校對(duì)我國(guó)殘疾人冰雪運(yùn)動(dòng)發(fā)展的效用研究
馬爾科夫鏈在企業(yè)沙盤(pán)模擬教學(xué)質(zhì)量評(píng)價(jià)中的應(yīng)用
馬爾科夫鏈在企業(yè)沙盤(pán)模擬教學(xué)質(zhì)量評(píng)價(jià)中的應(yīng)用
基于云會(huì)計(jì)的A集團(tuán)企業(yè)固定資產(chǎn)投資決策實(shí)施探析
企業(yè)投資決策中項(xiàng)目評(píng)價(jià)指標(biāo)法適用條件的探析