国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

雙自回歸模型下基于EM算法的分位數(shù)回歸分析

2022-12-22 07:18:30袁曉惠
關(guān)鍵詞:階數(shù)位數(shù)參數(shù)估計

袁曉惠, 杜 讓, 胡 茜

(長春工業(yè)大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院, 吉林 長春 130012)

0 引 言

股票價格能夠體現(xiàn)一個國家的經(jīng)濟(jì)狀況,股市的波動也時刻影響著個人和企業(yè)對股票的投資情況。當(dāng)前,中國經(jīng)濟(jì)飛速發(fā)展,國家經(jīng)濟(jì)市場面臨機(jī)遇和挑戰(zhàn),經(jīng)濟(jì)主體潛在的風(fēng)險和不確定性日益凸顯,基于線性相關(guān)系數(shù)的分析方法不再適用于研究股票市場的發(fā)展?;诖?,黃義[1]研究了金融股票市場與房地產(chǎn)市場價格指數(shù)的動態(tài)相關(guān)性。袁曉惠等[2]針對我國2011-2018年消費(fèi)者信心指數(shù)的經(jīng)濟(jì)數(shù)據(jù)擬合閾值自回歸模型,選出模型的自回歸參數(shù),并估計閾值點(diǎn)。馬育欣等[3]對股票收盤價序列進(jìn)行經(jīng)驗?zāi)J椒纸?EMD),并對分解后的本征模函數(shù)(IMF)與殘差序列分別擬合ARMA-GARCH模型。

近20年來,雙AR(p)模型受到人們的關(guān)注,F(xiàn)rancq C等[4]針對非線性過程提出雙AR(p)模型,可作為一種弱ARMA模型;Ling S[5]研究了雙AR(p)模型的平穩(wěn)遍歷條件,得出模型中參數(shù)的極大似然估計是漸近正態(tài)的結(jié)論;Zhu K等[6]研究雙AR(p)模型的擬極大似然估計,發(fā)現(xiàn)該方法比加權(quán)一乘方法更具優(yōu)越性;玄海燕等[7]提出雙AR(p)模型的一種混成檢驗,再次驗證了雙AR(p)模型在股價預(yù)測中的優(yōu)越性。

目前有關(guān)該模型的研究大多局限于對均值的建模,假定誤差項服從正態(tài)分布。當(dāng)數(shù)據(jù)為非正態(tài)時,模型的擬合效率會降低,甚至錯誤推斷。作為一類穩(wěn)健模型,分位數(shù)回歸不僅放寬了模型假設(shè),還可以刻畫不同分位點(diǎn)上的數(shù)據(jù)表現(xiàn),成為穩(wěn)健統(tǒng)計分析的首選模型之一[8-10]。對于經(jīng)典的雙AR(p)模型,其分位數(shù)回歸參數(shù)估計的計算較難實現(xiàn)。Zhu Q等[11]修正了模型假設(shè),將之轉(zhuǎn)化成線性形式,從而在一般分位數(shù)回歸的理論框架下討論參數(shù)估計。然而,針對經(jīng)典雙AR(p)模型分位數(shù)回歸的計算問題,我們至今未檢索到相關(guān)文獻(xiàn)。因此,文中嘗試在雙AR(p)模型的基礎(chǔ)上對其分位數(shù)回歸進(jìn)行計算。

在線性分位數(shù)回歸問題的研究中,Tian Y等[12]將EM算法引入線性復(fù)合分位數(shù)回歸模型,通過迭代加權(quán)進(jìn)行最小二乘估計;Yang F[13]提出了一種分位數(shù)回歸模型的隨機(jī)EM算法,估計效果良好。

文中運(yùn)用EM算法對雙AR(p)分位數(shù)回歸模型進(jìn)行參數(shù)估計,提出了兩階段迭代加權(quán)估計,并考察其在不同分位點(diǎn)上的表現(xiàn)。模擬研究表明,文中所提EM算法在分位數(shù)回歸估計中表現(xiàn)出色。

1 雙AR(p)模型的分位數(shù)估計

考慮經(jīng)典的雙AR(p)模型[5-6]

(1)

其中,φi∈R,ω>0,βi≥0(1≤i≤p),并且{εt}是獨(dú)立同分布的白噪聲序列。令

φ=(φ1,φ2,…,φp)T,

β=(β1,β2,…,βp)T,

Y1t=(yt-1,yt-2,…,yt-p)T,

則模型表示為

(2)

通常假定{εt}是正態(tài)白噪聲,可以得到模型參數(shù)的最小二乘估計。

研究此模型在不同分位點(diǎn)上的表現(xiàn),類似于Koenker R等[8]提出的分位數(shù)回歸理論,第τ分位點(diǎn)下的估計為

(3)

其中,Θ={φ,ω,β},ρτ(μ)=μ{τ-I(μ<0)}是分位數(shù)回歸的損失函數(shù),I(·)為示性函數(shù)。但上述優(yōu)化問題的求解較為困難,文中通過構(gòu)造EM算法求解此模型的參數(shù)估計。

2 EM算法

2.1 似然

在分位數(shù)回歸領(lǐng)域,非對稱拉普拉斯分布(ALD)越來越受到關(guān)注,根據(jù)Yu K等[9]基于ALD似然函數(shù)的貝葉斯分位數(shù)回歸思想,最小化目標(biāo)損失函數(shù)

ρτ(μ)=μ{τ-I(μ<0)},

(4)

相當(dāng)于在ALD誤差下最大化似然函數(shù)。ALD的概率密度函數(shù)為

(5)

式中:μ----位置參數(shù);

σ----尺度參數(shù);

τ----偏度,τ∈(0,1)。

即使對真實值的估計有一定的誤差,估計結(jié)果依舊是穩(wěn)健的。

運(yùn)用Kozumi H等[10]提出的概率重構(gòu)方法,將式(4)置于誤差分布為非對稱拉普拉斯分布的極大似然估計理論上。該誤差項{εt}的分布可以表示為指數(shù)分布和正態(tài)分布的混合表達(dá):

(6)

其中,

vt~exp(1),

et~N(0,1)。

γ=(ω,β)T,

ht(γ)=ω+βTY2t=γTY3t,

則模型等價于

(7)

則有

exp{-vt},

(8)

vt的條件概率密度函數(shù)為

(9)

由此得到

(10)

完全數(shù)據(jù){yt,vt}下的條件似然函數(shù)為

(11)

取對數(shù),求得對數(shù)似然

(12)

2.2 算法

對于含有潛變量的概率模型參數(shù)估計問題,通過EM算法迭代可以進(jìn)行局部最優(yōu)求解。令Θ=(φ,γ),設(shè)初始值為Θ(0),給定第t次迭代值Θ(t),然后利用EM算法通過迭代E步和M步來搜索模型的極大似然估計值。該算法從Θ(0)開始迭代,然后在兩步之間交替。E表示期望,M表示最大化,EM算法計算過程如下:

E步:基于第t次的迭代值Θ(t),似然函數(shù)第(t+1)次的期望值為

Q(Θ|Θ(t))E[l(Θ|yt,vt)|Θ(t)]=

(13)

M步:將E步中的Q函數(shù)最大化,求導(dǎo)得到估計方程

令導(dǎo)函數(shù)為零,有

(15)

求解,得到第(t+1)步φ的估計值為

(16)

(17)

得到γ的估計

(18)

(19)

γ2即為所求γ的估計值。

具體算法過程如下:

1)設(shè)定初值(φ,γ)(0),由E步計算出Q(φ(1)|(φ,γ)(0));

4)將得到的(φ,γ)(1)估計值返回1),重復(fù)1)~3),當(dāng)滿足條件‖(φ,γ)(t+1)-(φ,γ)(t)‖≤10-5時,停止迭代;

5)對γ的估計值標(biāo)準(zhǔn)化,最終得到參數(shù)估計結(jié)果。

3 BIC準(zhǔn)則

BIC準(zhǔn)則又稱貝葉斯信息準(zhǔn)則,可用于模型的選擇,通過加入模型復(fù)雜度的懲罰項來避免過擬合問題。借鑒Wang H等[14]提出的廣義貝葉斯信息準(zhǔn)則,得到:

(2p+1)log(n-pmax),

(20)

其中p在{1,2,…,pmax}上搜索,pmax為給定的最大階數(shù),n為樣本量,Q為EM算法中E步似然函數(shù)期望值。

4 模 擬

通過模擬驗證雙AR(p)分位數(shù)回歸模型在有限樣本下的表現(xiàn),基于模型

產(chǎn)生隨機(jī)數(shù)。其中,εt(τ),ht(γ)的形式參見式(6)。

設(shè)定回歸系數(shù)為

φ=(φ1,φ2)T=(0.1,0.2)T,

γ=(ω,β1,β2)T=(0.2,0.5,0.2)T。

4.1 參數(shù)估計

對上述分位數(shù)回歸模型進(jìn)行擬合,令n=100、500和1 000。分別討論分位點(diǎn)τ為0.3、0.5和0.7時的估計,通過EM算法迭代,并進(jìn)行1 000次模擬試驗,列出相應(yīng)參數(shù)估計值的偏度、標(biāo)準(zhǔn)差和均方誤結(jié)果。不同分位點(diǎn)τ參數(shù)估計模擬結(jié)果分別見表1~表3。

表1 參數(shù)估計模擬結(jié)果(τ=0.3)

表2 參數(shù)估計模擬結(jié)果(τ=0.5)

表3 參數(shù)估計模擬結(jié)果(τ=0.7)

以上結(jié)果可以看出,隨著樣本量的增大,三個分位點(diǎn)下估計的均方誤都減小,說明估計具有相合性,EM算法在模型估計中表現(xiàn)較好。

4.2 BIC定階

通過BIC準(zhǔn)則對雙AR(p)分位數(shù)回歸模型進(jìn)行參數(shù)選擇,在4.1節(jié)模擬的基礎(chǔ)上,假定最大階數(shù)pmax為4,在{1,2,…,pmax}上搜索最優(yōu)階數(shù),通過式(20)求出BIC值最大時對應(yīng)的階數(shù)p,即為最優(yōu)階數(shù)。

以τ=0.5為例,通過模型

從表中可以看出,在對角線上元素的取值最高,即模型選到與真值相同階數(shù)的頻率很高。當(dāng)n=300時,BIC準(zhǔn)則選擇效果明顯好于n=100,說明BIC準(zhǔn)則進(jìn)行模型選階,樣本量較大時,結(jié)果更為準(zhǔn)確。

表4 BIC待選頻數(shù)表

5 實 證

研究金融市場的發(fā)展規(guī)律,一般選取綜合性強(qiáng),能反映經(jīng)濟(jì)整體趨勢發(fā)展的指數(shù),以確保結(jié)論能夠符合大多數(shù)情況,滬深300指數(shù)(399300)可以反映中國證券市場股票價格變化的整體趨勢。因此,文中選取滬深300指數(shù)的部分收盤價數(shù)據(jù)進(jìn)行分析,以2018年1月2日至2021年7月27日的收盤價數(shù)據(jù)作為觀測值,2021年7月28日至2021年7月30日的數(shù)據(jù)作為預(yù)測值數(shù)據(jù),共870個樣本。數(shù)據(jù)來源于網(wǎng)易財經(jīng)(http://quotes.money.163.com/1399300.html)。

滬深300指數(shù)收盤價數(shù)據(jù)的時間序列圖和ACF圖如圖1所示。

(a) 時序圖 (b) ACF圖

由時序圖可知,在有限時間內(nèi),觀測數(shù)據(jù)波動性較大,數(shù)據(jù)不平穩(wěn)。由ACF圖可以看出,樣本數(shù)據(jù)具有很強(qiáng)的自相關(guān)性。由于文中研究的模型在所給條件下是嚴(yán)平穩(wěn)的,我們對原始數(shù)據(jù)進(jìn)行平穩(wěn)化處理,采用一階對數(shù)差分變換,并做單位根檢驗,檢驗的p值小于0.01,即變換后的數(shù)據(jù)為平穩(wěn)序列。

對處理后的數(shù)據(jù)作回歸分析,分別對τ取0.3、0.5和0.7,通過BIC準(zhǔn)則在p={1,2,3,4}上選取合適的階數(shù),結(jié)果見表5。

表5 最優(yōu)階數(shù)選擇BIC值

可以看出,在三個分位點(diǎn)上,BIC最大時對應(yīng)的p值均為1,所以,文中選取雙自回歸維數(shù)p=1。應(yīng)用雙AR(p)分位數(shù)回歸模型對滬深300指數(shù)進(jìn)行模擬,分別得到在τ分位點(diǎn)為0.3、0.5和0.7上的三種模型估計,估計結(jié)果見表6。

表6 參數(shù)估計結(jié)果

由此得到如下模型。

模型一(τ=0.3):

yt=-0.006 60Y1t+

模型二(τ=0.5):

yt=-0.006 64Y1t+

模型三(τ=0.7):

yt=-0.004 35Y1t+

基于以上三種模型對2021年7月28日至2021年7月30日的股價進(jìn)行預(yù)測,結(jié)果見表7。

表7 預(yù)測結(jié)果

由表7可以看出,不同分位點(diǎn)下的預(yù)測值和真實數(shù)據(jù)都非常接近,且變化趨勢相近,說明文中提出的模型對滬深300指數(shù)的預(yù)測結(jié)果較為準(zhǔn)確,模型是有效的。

6 結(jié) 語

考慮雙AR(p)分位數(shù)回歸模型,首先運(yùn)用EM算法分別對不同分位點(diǎn)下的參數(shù)進(jìn)行估計。模擬研究發(fā)現(xiàn),參數(shù)中對非零真值估計的均方誤很小,且隨著樣本量的增大,均方誤也越來越小,估計效果較好;其次,通過BIC準(zhǔn)則選取模型階數(shù)的最佳p值,階數(shù)選擇結(jié)果準(zhǔn)確,正確率較高。最后對滬深300指數(shù)的股價數(shù)據(jù)進(jìn)行實證研究,驗證了模型的有效性。

猜你喜歡
階數(shù)位數(shù)參數(shù)估計
基于新型DFrFT的LFM信號參數(shù)估計算法
關(guān)于無窮小階數(shù)的幾點(diǎn)注記
確定有限級數(shù)解的階數(shù)上界的一種n階展開方法
五次完全冪的少位數(shù)三進(jìn)制展開
Logistic回歸模型的幾乎無偏兩參數(shù)估計
基于向前方程的平穩(wěn)分布參數(shù)估計
基于競爭失效數(shù)據(jù)的Lindley分布參數(shù)估計
一種新的多址信道有效階數(shù)估計算法*
關(guān)于動態(tài)電路階數(shù)的討論
遙感衛(wèi)星CCD相機(jī)量化位數(shù)的選擇
邵武市| 高州市| 洪雅县| 三明市| 石柱| 巩义市| 安达市| 永靖县| 新巴尔虎左旗| 科技| 团风县| 景宁| 邮箱| 东台市| 枝江市| 邵阳市| 谷城县| 上饶县| 金山区| 北票市| 旅游| 麦盖提县| 延长县| 唐河县| 三都| 噶尔县| 五大连池市| 海盐县| 西和县| 柘城县| 乐东| 上蔡县| 岚皋县| 新绛县| 拉萨市| 运城市| 绩溪县| 淅川县| 广饶县| 益阳市| 济阳县|