張倩昀, 陳華友 , 江立輝
(1.安徽大學(xué) a.經(jīng)濟(jì)學(xué)院,b.數(shù)學(xué)科學(xué)學(xué)院,合肥 230601;2. 合肥學(xué)院 人工智能與大數(shù)據(jù)學(xué)院,合肥 230601)
“凡事預(yù)則立,不預(yù)則廢”,可見科學(xué)預(yù)測(cè)至關(guān)重要。它為科學(xué)決策提供前提和依據(jù)?,F(xiàn)代的社會(huì)經(jīng)濟(jì)和工程管理等復(fù)雜系統(tǒng), 面臨大量人流、物流和現(xiàn)金流等多種因素的變化,這些不確定因素加劇了預(yù)測(cè)的難度。傳統(tǒng)的單個(gè)精巧的模型可能會(huì)面臨模型設(shè)定形式的錯(cuò)誤而導(dǎo)致預(yù)測(cè)風(fēng)險(xiǎn)。[1]為此,減少預(yù)測(cè)風(fēng)險(xiǎn)的另一個(gè)有效途徑便是通過多個(gè)模型的信息融合和集成來實(shí)現(xiàn)。[2]由于信息源的廣泛性使得不同模型的源信息之間具有相互補(bǔ)充的作用,為了提高預(yù)測(cè)精度,Bates 和Granger[3]提出組合預(yù)測(cè)方法的概念。組合預(yù)測(cè)自提出以來,國內(nèi)外學(xué)者在理論和應(yīng)用等各方面的研究取得了一些重要的研究成果[4-9]。
現(xiàn)有的組合預(yù)測(cè)方法的研究大多從如下幾個(gè)方面來進(jìn)行研究:
(1)組合預(yù)測(cè)模型的構(gòu)造,即按照組合預(yù)測(cè)與各單項(xiàng)預(yù)測(cè)方法的設(shè)定不同函數(shù)關(guān)系,在誤差準(zhǔn)則或多種精度準(zhǔn)則下,構(gòu)造線性加權(quán)算術(shù)平均的組合預(yù)測(cè)模型或者利用加權(quán)幾何平均、加權(quán)調(diào)和平均來構(gòu)建非線性組合預(yù)測(cè)模型。[9]
(2)組合預(yù)測(cè)模型中單項(xiàng)預(yù)測(cè)方法的權(quán)重確定方法的研究。
對(duì)于最優(yōu)化的組合預(yù)測(cè)模型,模型往往以線性規(guī)劃或者非線性規(guī)劃模型來表達(dá),可以利用單純形算法或者Kuhn-Tucher條件,把非線性規(guī)劃轉(zhuǎn)化為線性規(guī)劃問題來求解。[10,11]若組合預(yù)測(cè)模型放棄了權(quán)重的非負(fù)約束,可以從統(tǒng)計(jì)角度給出權(quán)重的LS估計(jì)及其假設(shè)檢驗(yàn)[12],對(duì)于非負(fù)變權(quán)組合預(yù)測(cè)權(quán)系數(shù),文獻(xiàn)[13] 給出了Bayes極大似然估計(jì)方法。而對(duì)于一些非最優(yōu)的組合預(yù)測(cè)模型,可以利用預(yù)測(cè)誤差平方和倒數(shù)方法、均方誤差倒數(shù)、二項(xiàng)式系數(shù)方法、合作對(duì)策方法等。[14]
(3)多種準(zhǔn)則下組合預(yù)測(cè)有效性的探討。組合預(yù)測(cè)方法分別構(gòu)建了基于標(biāo)準(zhǔn)差的預(yù)測(cè)有效度準(zhǔn)則[15]、基于相關(guān)系數(shù)準(zhǔn)則[16]、基于向量夾角余弦準(zhǔn)則[17]等模型,這些模型分別提出了相應(yīng)準(zhǔn)則下優(yōu)性組合預(yù)測(cè)、預(yù)測(cè)方法優(yōu)超和冗余度的概念,探討了組合預(yù)測(cè)存在的條件以及權(quán)重系數(shù)的近似計(jì)算方法。
(4)組合預(yù)測(cè)模型的若干應(yīng)用研究。由于組合預(yù)測(cè)方法在實(shí)踐中表現(xiàn)出良好的性能,因而,在諸多領(lǐng)域有著廣泛的應(yīng)用,例如,文獻(xiàn)[18]構(gòu)建IOWHA算子的組合預(yù)測(cè)模型,并探討了在中國入境旅游中應(yīng)用。文獻(xiàn)[19]建立了Theil不等系數(shù)的組合預(yù)測(cè)模型,并對(duì)稅收收入進(jìn)行了預(yù)測(cè)。文獻(xiàn)[20]提出了模糊神經(jīng)網(wǎng)絡(luò)組合預(yù)測(cè)模型,并在短時(shí)交通流量的預(yù)測(cè)中進(jìn)行了應(yīng)用。文獻(xiàn)[21]利用ARMA-GM-BP組合預(yù)測(cè)模型預(yù)測(cè)了中國GDP的發(fā)展趨勢(shì)。另外,組合預(yù)測(cè)技術(shù)在信用風(fēng)險(xiǎn)評(píng)估[22],電力負(fù)荷中預(yù)測(cè)[23],選舉問題中的預(yù)測(cè)[24],網(wǎng)絡(luò)輿情預(yù)測(cè)[25]等領(lǐng)域均有應(yīng)用。
最近,在國際預(yù)測(cè)雜志的主流刊物刊登了Thomson[26]等人的論文,該文指出組合預(yù)測(cè)的相對(duì)誤差減少取決于單項(xiàng)預(yù)測(cè)方法包含獨(dú)立信息的程度,文中提出一致性的度量方法來確定預(yù)測(cè)集方法之間的獨(dú)立性程度,并對(duì)誤差平方和進(jìn)行了基于性能指標(biāo)的分解,該分解對(duì)正確理解組合預(yù)測(cè)中單項(xiàng)預(yù)測(cè)方法的選取具有重要的意義。
然而,該文的結(jié)論是針對(duì)簡(jiǎn)單的算術(shù)平均的組合預(yù)測(cè)模型所做的結(jié)論。實(shí)際上,等權(quán)的組合預(yù)測(cè)模型認(rèn)為每個(gè)單項(xiàng)預(yù)測(cè)方法具有相同的重要性,這顯然與各個(gè)單項(xiàng)預(yù)測(cè)方法的表現(xiàn)出不同的誤差平方和相矛盾,也就是說,好的單項(xiàng)預(yù)測(cè)方法理應(yīng)在組合預(yù)測(cè)中賦予較大的權(quán)重。因此,有必要進(jìn)一步探討加權(quán)情形下的組合預(yù)測(cè)誤差平方和的分解。在文獻(xiàn)[26]的基礎(chǔ)上,探討了加權(quán)平均組合預(yù)測(cè)模型誤差平方和的分解表達(dá)式,嘗試并將此分解推廣至加權(quán)算術(shù)平均組合預(yù)測(cè)的情形。 文中分別提出了均值偏差、預(yù)測(cè)分辨率系數(shù)、離差誤差方差等概念,探討了加權(quán)算術(shù)平均組合預(yù)測(cè)方法和各個(gè)單項(xiàng)預(yù)測(cè)方法相應(yīng)的數(shù)學(xué)性質(zhì),獲得了組合預(yù)測(cè)方法和各個(gè)單項(xiàng)預(yù)測(cè)方法均方誤差指標(biāo)分解的表達(dá)式。
設(shè)某個(gè)預(yù)測(cè)對(duì)象的實(shí)際觀察值序列為X={xt,t=1,2,…N},設(shè)有m種可行的單項(xiàng)預(yù)測(cè)方法對(duì)其進(jìn)行預(yù)測(cè),設(shè)X(i)={xit,t=1,2,…N}為第i種單項(xiàng)預(yù)測(cè)方法在第t時(shí)刻的預(yù)測(cè)值序列,i=1,2,…,m.設(shè)w1,w2,…wm為m種單項(xiàng)預(yù)測(cè)在組合預(yù)測(cè)中的加權(quán)系數(shù),它滿足歸一化和非負(fù)性, 即
(1)
根據(jù)加權(quán)算術(shù)平均數(shù)計(jì)算公式, 定義1 令
(2)
設(shè)et為第t時(shí)刻的組合預(yù)測(cè)值與實(shí)際值之間誤差,則有
(3)
其中eit=xt-xit表示第i種預(yù)測(cè)方法第t時(shí)刻預(yù)測(cè)值與實(shí)際值之間的誤差,i=1,2,…,m,t=1,2,…,N,則總的組合預(yù)測(cè)誤差平方和為:
(4)
對(duì)組合預(yù)測(cè)方法而言,E(w)越小表示加權(quán)算術(shù)平均的組合預(yù)測(cè)方法得到的預(yù)測(cè)值越接近實(shí)際值。因此以誤差平方和為準(zhǔn)則的加權(quán)算術(shù)平均組合預(yù)測(cè)模型可表示成如下模型(1):
(5)
模型(1)的最優(yōu)解即為加權(quán)算術(shù)平均組合預(yù)測(cè)模型的權(quán)系數(shù)。
均方誤差(MSE)是反映組合預(yù)測(cè)的性能的重要指標(biāo)之一,為便于探討加權(quán)算術(shù)平均組合預(yù)測(cè)方法MSE的分解,為此引入如下定義。
(6)
(7)
由(6)式可得:
(8)
同理,由(7)式可得:
(9)
性質(zhì)1組合預(yù)測(cè)方法和各個(gè)單項(xiàng)預(yù)測(cè)方法對(duì)應(yīng)的時(shí)間序列的均值滿足如下關(guān)系:
證明由(2)、(6)和(7)式知:
性質(zhì)1表明:組合預(yù)測(cè)方法對(duì)應(yīng)的時(shí)間序列的均值是各個(gè)單項(xiàng)預(yù)測(cè)方法的均值的加權(quán)平均。
(10)
(11)
則稱MSEi為第i種單項(xiàng)預(yù)測(cè)方法的均方誤差,MSE稱為組合預(yù)測(cè)的均方誤差。
定義4令
(12)
(13)
則稱BSEi為第i種單項(xiàng)預(yù)測(cè)方法的均值偏差,BSE稱為組合預(yù)測(cè)的均值偏差。
定義4表明:從均值角度來看,BSEi和BSE分別反映了單項(xiàng)預(yù)測(cè)方法和組合預(yù)測(cè)方法對(duì)應(yīng)的時(shí)間序列均值與實(shí)際值序列均值之間的差異程度。
定義5令
(14)
(15)
性質(zhì)2組合預(yù)測(cè)值序列與實(shí)際值序列的協(xié)方差與各個(gè)單項(xiàng)預(yù)測(cè)值序列與實(shí)際值序列的協(xié)方差滿足如下關(guān)系:
證明由(14)、(15)和性質(zhì)1知:
從而結(jié)論成立。
性質(zhì)2表明:組合預(yù)測(cè)值序列與實(shí)際值序列的協(xié)方差是各個(gè)單項(xiàng)預(yù)測(cè)值序列與實(shí)際值序列的協(xié)方差的加權(quán)平均。
定義6令
(16)
(17)
則稱Sli為第i種預(yù)測(cè)值序列與實(shí)際值序列的分辨率系數(shù),Sl稱為組合預(yù)測(cè)值序列與實(shí)際值序列的分辨率系數(shù)。
定義6表明:以方差作為信息量的度量準(zhǔn)則來看,Sli和Sl分別反映了第i種單項(xiàng)預(yù)測(cè)方法和組合預(yù)測(cè)方法對(duì)應(yīng)的時(shí)間序列對(duì)實(shí)際值序列的解釋程度。
性質(zhì)3組合預(yù)測(cè)值序列和實(shí)際值序列的分辨率系數(shù)與各個(gè)單項(xiàng)預(yù)測(cè)值序列和實(shí)際值序列的分辨率系數(shù)滿足如下關(guān)系:
證明由(17)式和性質(zhì)2的結(jié)論,并注意到(16)式,則有:
從而結(jié)論成立。
定義7令
RVi=(1-Sli)2V(X)
(18)
RV=(1-Sl)2V(X)
(19)
則稱RVi為第i種單項(xiàng)預(yù)測(cè)值序列對(duì)實(shí)際值序列因分辨能力不足而產(chǎn)生的方差,RV稱為組合預(yù)測(cè)值序列與實(shí)際值序列因分辨能力不足而產(chǎn)生的方差。
定義7表明: RVi和RV分別反映了單項(xiàng)預(yù)測(cè)方法和組合預(yù)測(cè)方法對(duì)應(yīng)的時(shí)間序列對(duì)實(shí)際值序列因分辨能力不足而產(chǎn)生得不可解釋的誤差。
定義8令
(20)
(21)
性質(zhì)4第i種單項(xiàng)預(yù)測(cè)值和組合預(yù)測(cè)值與實(shí)際值基于分辨系數(shù)的離差誤差序列的均值滿足如下結(jié)論:
(22)
證明由均值的定義,以及(20)、(8)、(9)式可知
=0-Sli×0=0.
同理,注意到(21)、(8)、(9)式,則有:
定義9令
DEVi=V(U(i)),i=1,2,…,m,
(23)
(24)
則稱DEVi為第i種單項(xiàng)預(yù)測(cè)方法基于分辨系數(shù)的離差誤差的方差,DEV稱為組合預(yù)測(cè)方法基于分辨系數(shù)的離差誤差的方差。
定理1設(shè)MSEi第i種單項(xiàng)預(yù)測(cè)方法的均方誤差,則有如下的分解式:
MSEi=BSEi+RVi+DEVi,
(25)
其中BSEi、RVi、DEVi分別表示單項(xiàng)預(yù)測(cè)方法序列和實(shí)際值序列的均值的偏差、分辨能力的不足而產(chǎn)生的方差以及離差誤差方差。
證明由均方誤差的定義式(10)可得
=V(X(i))+BSEi+V(X)+0-0-2Cov(X(i),X)
=V(X(i))+BSEi+V(X)-2COV(X(i),X).
(26)
由(16)式可知:
Cov(X(i),X)=Sli·V(X),
(27)
(27)式代入(26) 式,則有:
MSEi=V(X(i))+BSEi+(1-2Sli)·V(X),
(28)
由(18)式可知:
(29)
由(29) 式,從而有
(30)
(31)
把(30) 式代入到(28) 式中,并注意到(31)式,則有MSEi=BSEi+RVi+DEVi成立。
定理1表明:第i種單項(xiàng)預(yù)測(cè)方法的均方誤差的分解式可以看出,其均方誤差來源于三個(gè)方面。一是由單項(xiàng)預(yù)測(cè)方法序列和實(shí)際值序列的均值的偏差所形成的,二是單項(xiàng)預(yù)測(cè)值序列對(duì)實(shí)際值序列因分辨解釋能力的不足而產(chǎn)生的分辨方差,三是單項(xiàng)預(yù)測(cè)值與實(shí)際值基于分辨系數(shù)的離差誤差。
對(duì)于加權(quán)平均的組合預(yù)測(cè)方法,也有類似的均方誤差的分解式結(jié)果:
定理2設(shè)MSE為加權(quán)算術(shù)平均的組合預(yù)測(cè)的均方誤差,則有如下的分解式:
MSE=BSE+RV+EV
(32)
其中BSE,RV,DEV,分別表示組合預(yù)測(cè)序列和實(shí)際值序列的均值的偏差、分辨能力的不足而產(chǎn)生的方差以及離差誤差方差。
證明由均方誤差的定義式(11),通過恒等變換并展開,并注意到(8)、(9)式,則有:
(33)
注意到(17)式,則有:
(34)
因此(33)式可以改寫為:
(35)
類似地,由(19)式可知:
(1-2Sl)X=RV-Sl2V(X),
(36)
(36)式代入 (35)式可得:
(37)
由性質(zhì)4的(22)式,且根據(jù)(24)、(34)式可知:
(38)
結(jié)合(37)和(38)式可得結(jié)論MSE=BSE+RV+DEV成立。
定理2表明:組合預(yù)測(cè)方法的均方誤差的分解式也有類似三個(gè)來源。若要減小組合預(yù)測(cè)方法的均方誤差,需要減小組合預(yù)測(cè)方法序列和實(shí)際值序列的均值的偏差,增加組合預(yù)測(cè)值序列對(duì)實(shí)際值序列的解釋能力,減小預(yù)測(cè)值與實(shí)際值基于分辨系數(shù)的離差誤差。
合肥學(xué)院學(xué)報(bào)(綜合版)2020年2期