国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

金融指數(shù)的單變點(diǎn)非參數(shù)極大似然估計(jì)研究

2019-03-13 05:54陳睿軒田海濤
統(tǒng)計(jì)與決策 2019年3期
關(guān)鍵詞:預(yù)處理程序模型

陳睿軒,田海濤,黃 磊

(西南交通大學(xué) 數(shù)學(xué)學(xué)院,成都 611756)

0 引言

變點(diǎn)問(wèn)題的研究源于實(shí)際的需要。自1954年P(guān)age提出變點(diǎn)問(wèn)題以來(lái),變點(diǎn)問(wèn)題經(jīng)過(guò)長(zhǎng)期的研究發(fā)展,已經(jīng)應(yīng)用于諸多領(lǐng)域。在金融計(jì)量經(jīng)濟(jì)學(xué)中,變點(diǎn)分析可以用于找出市場(chǎng)(或經(jīng)濟(jì))的發(fā)展方向[1],此外變點(diǎn)分析還能用于找出信用卡詐騙[2]和其他的異常情況。在信號(hào)處理方面,對(duì)一個(gè)圖像流中重要變化的估計(jì)是十分重要的問(wèn)題[3]。在醫(yī)學(xué)上,變點(diǎn)問(wèn)題在DNA的拷貝數(shù)變異檢測(cè)上有了很大的應(yīng)用,而在現(xiàn)代基因芯片技術(shù)所產(chǎn)生的海量數(shù)據(jù)中找出拷貝數(shù)的變異就是變點(diǎn)問(wèn)題的一個(gè)最新的發(fā)展方向[4]。在數(shù)據(jù)挖掘中,變點(diǎn)問(wèn)題也起著很重要的作用[5]。

近些年,越來(lái)越多的學(xué)者開始研究金融領(lǐng)域的變點(diǎn)問(wèn)題[6-10]。然而,其研究?jī)?nèi)容都只局限于ARCH、GARCH等參數(shù)模型,很多時(shí)候金融市場(chǎng)數(shù)據(jù)往往不能很好地用參數(shù)模型去擬合,這時(shí)非參數(shù)的方法就應(yīng)該被考慮到。本文的重點(diǎn)就是研究如何將非參數(shù)的變點(diǎn)方法應(yīng)用到金融指數(shù)數(shù)據(jù),并通過(guò)統(tǒng)計(jì)模擬實(shí)驗(yàn)和實(shí)際數(shù)據(jù)分析說(shuō)明方法的可行性與實(shí)用性。

由于非參數(shù)方法不對(duì)數(shù)據(jù)所服從分布的結(jié)構(gòu)提出任何的參數(shù)假設(shè),其推斷的有效性通常依靠漸進(jìn)的證明,不同累積分布函數(shù)間有任何的差異,都將保證變點(diǎn)被漸進(jìn)地探測(cè)出來(lái)。又由于非參數(shù)方法不對(duì)數(shù)據(jù)的分布做任何的假設(shè),所以它可以靈活地適用于任何的分布。同時(shí),單變點(diǎn)是變點(diǎn)問(wèn)題研究中最為基礎(chǔ)的問(wèn)題,且單變點(diǎn)在實(shí)際處理數(shù)據(jù)中具有易操作性。因此,單變點(diǎn)非參數(shù)的估計(jì)方法是本文研究的重點(diǎn)。

對(duì)于金融領(lǐng)域的時(shí)間序列型數(shù)據(jù)而言,數(shù)據(jù)之間往往具有自相關(guān)性。在很多情況下,忽略自相關(guān)性而進(jìn)行模型變點(diǎn)的估計(jì),就會(huì)得到有偏差或者不相合的參數(shù)估計(jì)值,這將降低模型的預(yù)測(cè)能力,該問(wèn)題可參見文獻(xiàn)[11,12]關(guān)于非線性時(shí)間序列模型的研究。因此本文提出一個(gè)簡(jiǎn)單易行的方法,使得單變點(diǎn)非參數(shù)估計(jì)方法能適用于具有自相關(guān)性的金融時(shí)間序列數(shù)據(jù)。

本文中所考慮的金融時(shí)間序列數(shù)據(jù)為上證綜合指數(shù)。上證綜合指數(shù)從總體上反映了上海證券交易所上市股票價(jià)格的變動(dòng)情況,也反映了當(dāng)前中國(guó)市場(chǎng)的狀況。當(dāng)市場(chǎng)的經(jīng)濟(jì)形式發(fā)生變化,上證綜合指數(shù)也會(huì)發(fā)生相應(yīng)的變化,對(duì)這種變化的研究是十分有意義的。由于上證綜合指數(shù)數(shù)據(jù)不是一個(gè)獨(dú)立同分布的數(shù)據(jù),帶有自相關(guān)性,因此不能直接使用非參數(shù)估計(jì)方法,需要做相應(yīng)的改進(jìn)。本文的方法能有效地找出上證綜合指數(shù)中存在的變點(diǎn),這可以對(duì)中國(guó)經(jīng)濟(jì)的研究起到輔助作用,特別是宏觀經(jīng)濟(jì)調(diào)控效果以及經(jīng)濟(jì)周期的研究。

1 單變點(diǎn)非參數(shù)極大似然估計(jì)

1.1 單變點(diǎn)問(wèn)題的定義

設(shè)X1,X2,…,Xn是隨機(jī)變量的觀測(cè)值,一般情況下,假定X1,X2,…,Xn相互獨(dú)立。如果X1,…,Xr-1同分布于F,Xr,…,Xn同分布于G,且F≠G,其中r是未知的正整數(shù)(2≤r≤n),稱其為變點(diǎn)。而單變點(diǎn)問(wèn)題要解決的就是如何有效地估計(jì)出r的正確位置。

對(duì)于參數(shù)方法,首先需要假設(shè)F、G屬于一些已知的參數(shù)函數(shù)族。再采用最小二乘法或者極大似然法,并通過(guò)一個(gè)動(dòng)態(tài)選擇程序來(lái)確定變點(diǎn)。然而參數(shù)方法雖然簡(jiǎn)便,但是需要確保對(duì)F、G分布假設(shè)的準(zhǔn)確性。當(dāng)假設(shè)不正確時(shí),其估計(jì)結(jié)果與真實(shí)結(jié)果往往會(huì)有很大的偏差,而實(shí)際生活中,通常很難得知數(shù)據(jù)所屬的真實(shí)分布。由于參數(shù)方法在實(shí)際問(wèn)題中的局限性很大,所以大多時(shí)候都采用不需要考慮數(shù)據(jù)所屬分布的非參數(shù)方法。

1.2 非參數(shù)極大似然方法

本文的方法是基于Zou等(2014)[13]所提出的非參數(shù)極大似然估計(jì)方法并對(duì)其進(jìn)行改進(jìn),然后將改進(jìn)后的方法應(yīng)用于單變點(diǎn)問(wèn)題。這樣做的目的有兩點(diǎn):第一,對(duì)于金融時(shí)間序列型數(shù)據(jù),數(shù)據(jù)量往往不大,比如研究股票日收益率,觀測(cè)時(shí)間長(zhǎng)度T取值過(guò)大會(huì)導(dǎo)致不同區(qū)間的異方差性,參見文獻(xiàn)[14]。因此,在這種情況下,用傳統(tǒng)的圖形技術(shù)就能輕易地探測(cè)出變點(diǎn)。而且,對(duì)于中等或較小的數(shù)據(jù)樣本,多變點(diǎn)模型會(huì)導(dǎo)致過(guò)度擬合;第二,對(duì)于確實(shí)需要進(jìn)行多變點(diǎn)研究的數(shù)據(jù),單變點(diǎn)方法可以通過(guò)迭代推廣成多變點(diǎn)方法。因此本文主要研究單變點(diǎn)非參數(shù)極大似然估計(jì),以及其對(duì)自相關(guān)金融時(shí)間序列數(shù)據(jù)的改進(jìn)。

假設(shè)Z1,…,Zn獨(dú)立同分布于F0,并讓表示該樣本的經(jīng)驗(yàn)累積分布函數(shù),則有,其中將其看作是有著成功概率(u)的二元數(shù)據(jù)的樣本時(shí),則可以得到非參數(shù)極大對(duì)數(shù)似然函數(shù):

對(duì)于單變點(diǎn)問(wèn)題,由于它是有兩段獨(dú)立同分布的數(shù)據(jù)序列拼接而成的,因此可以得到它的聯(lián)合對(duì)數(shù)似然函數(shù)(Kn=1):

為了估計(jì)變點(diǎn)1<≤n,在一個(gè)積分的形式下將式(1)最大化,得到:

其中,ω(·)是一些正的權(quán)重函數(shù),所以Rn(·)是有限的,這個(gè)積分可以用來(lái)結(jié)合所有u的信息。

它是隨著θ→q1,從兩邊逼近于的,且在q1點(diǎn)處具有極大值。

其中:

1.3 參數(shù)選擇

本文所采用的極大對(duì)數(shù)似然方法的一個(gè)重要特性是可分離性,因此把任意點(diǎn)看作變點(diǎn)時(shí),它都可以通過(guò)動(dòng)態(tài)規(guī)劃運(yùn)算來(lái)計(jì)算出一個(gè)似然值,并把似然值最大的那個(gè)點(diǎn)當(dāng)作估計(jì)變點(diǎn),其總共的計(jì)算復(fù)雜度為O(n2)(參見文獻(xiàn)[15,16]的動(dòng)態(tài)規(guī)劃運(yùn)算的偽代碼)。Hawkings(2001)[15]建議在一個(gè)m?n值的坐標(biāo)格中使用動(dòng)態(tài)規(guī)劃運(yùn)算。Harchaoui和 Levy-Leduc(2010)[17]提出使用一個(gè)LASSO型罰參數(shù)的評(píng)估值來(lái)達(dá)到最小二乘法的一個(gè)簡(jiǎn)化版本。

在實(shí)際應(yīng)用時(shí),本文采用Zou等(2014)[13]提出的:

它被認(rèn)為比dω(u)=(u)更有效。

當(dāng)u∈(-∞,X(1))和u∈(X(n),∞)時(shí)(其中:X(1)<…<X(n)表示次序統(tǒng)計(jì)量),Lu=0,則式(2)可以改寫成:

同時(shí),本文使用施瓦茨-貝葉斯信息準(zhǔn)則(BIC)來(lái)判斷變點(diǎn)是否存在。如果存在變點(diǎn),L=1;如果不存在變點(diǎn),則L=0。

BIC準(zhǔn)則是主觀貝葉斯派歸納理論的重要組成部分,是最簡(jiǎn)單也是最典型的貝葉斯變量選擇的方法。在信息不完全的情況下,本文采用主觀概率來(lái)估計(jì)那些未知的狀態(tài),然后通過(guò)貝葉斯公式對(duì)所得概率進(jìn)行修正,最后再利用期望值和修正概率來(lái)做出最優(yōu)決策。因此,本文通過(guò)最小化BICL來(lái)確定L的值:

并且ζn是一個(gè)趨于無(wú)窮大的序列。

Yao(1988)[18]使用ζn=logn的BIC來(lái)選擇變點(diǎn)的數(shù)量,并在最小二乘法的框架下顯示出了它的連貫性,因此本文直接使用這個(gè)結(jié)果。

2 統(tǒng)計(jì)模擬

本文將通過(guò)模擬研究來(lái)測(cè)試非參數(shù)方法的一致性和有效性。在模擬研究中,本文將隨機(jī)生成獨(dú)立的數(shù)據(jù)序列和經(jīng)典的時(shí)間序列。由式(3)和式(4)編寫的程序?qū)?huì)應(yīng)用于探測(cè)變點(diǎn)。

2.1 改進(jìn)程序1

在模擬研究中,本文發(fā)現(xiàn)該方法對(duì)于變點(diǎn)存在性的判別不夠準(zhǔn)確。當(dāng)模擬的數(shù)據(jù)序列中不存在變點(diǎn),有時(shí)該方法卻判斷出:數(shù)據(jù)序列的前端或尾部存在估計(jì)變點(diǎn)。經(jīng)過(guò)對(duì)數(shù)據(jù)序列的分析后,本文發(fā)現(xiàn)該方法在數(shù)據(jù)序列兩端出現(xiàn)極端值點(diǎn)時(shí)易將該極端值點(diǎn)視為變點(diǎn),形成誤判。所以將該方法加以改進(jìn),當(dāng)估計(jì)變點(diǎn)出現(xiàn)在兩端2.5%處的數(shù)據(jù)量范圍內(nèi)時(shí),判斷該段數(shù)據(jù)序列不存在變點(diǎn),該改進(jìn)方法對(duì)應(yīng)的程序稱為改進(jìn)程序1。當(dāng)樣本量特別小(小于1000)時(shí),把比例從2.5%提高到5%才能較為有效地減少誤判變點(diǎn)的發(fā)生。同時(shí),采用ζn=(logn)2+c2,(c=0.1),將更為有效[13]。

2.2 改進(jìn)程序1的獨(dú)立數(shù)據(jù)的模擬結(jié)果

表1記錄了在不同分布和樣本量的情況下,變點(diǎn)估計(jì)的均方誤差。在模擬研究中,估計(jì)的是θ。樣本量N分別為100、200、400,相應(yīng)的把真實(shí)變點(diǎn)設(shè)為51、101、201。所以相應(yīng)的變點(diǎn)分位數(shù)θ為0.51、0.505、0.5025。令估計(jì)變點(diǎn)的分位數(shù)為q1,則均方誤差其中,n是模擬的次數(shù),本文中n=200。

表1 變點(diǎn)估計(jì)的均方誤差統(tǒng)計(jì)結(jié)果

由表1可以看出,改進(jìn)程序1用于對(duì)常用分布組合的變點(diǎn)估計(jì)的準(zhǔn)確度很高,且隨著樣本量的增大,對(duì)變點(diǎn)分位數(shù)估計(jì)的精度越來(lái)越高。因此,對(duì)于大多數(shù)獨(dú)立數(shù)據(jù)序列變點(diǎn)的探測(cè),改進(jìn)程序1將會(huì)給出一個(gè)可信的結(jié)果。

2.3 金融時(shí)間序列上的應(yīng)用

變點(diǎn)問(wèn)題在時(shí)間序列上一直有著廣泛的應(yīng)用,也經(jīng)常需要判斷時(shí)間序列中是否存在變點(diǎn)以及變點(diǎn)的位置。但由于金融時(shí)間序列數(shù)據(jù)往往具有自相關(guān)性,而該非參數(shù)極大似然的方法要求每段數(shù)據(jù)序列是獨(dú)立同分布的,因此,該非參數(shù)方法需要一些改進(jìn)。

本文使用平穩(wěn)的ARMA模型生成時(shí)間序列的隨機(jī)數(shù)據(jù)。自回歸滑動(dòng)平均模型(Auto-Regressive and Moving Average Model,ARMA模型)是研究時(shí)間序列的重要方法,也是研究平穩(wěn)隨機(jī)過(guò)程有理譜的典型方法,適用于很大一類實(shí)際問(wèn)題。

ARMA模型分為以下三種:自回歸模型(Auto-Regressive,AR模型)、移動(dòng)平均模型-(Moving-Average,MA模型)、自回歸滑動(dòng)平均模型(ARMA模型)。

在模擬研究中,本文采用AR模型來(lái)生成時(shí)間序列的隨機(jī)數(shù)據(jù),之后嘗試直接使用改進(jìn)程序1進(jìn)行變點(diǎn)的估計(jì)。結(jié)果顯示,直接使用改進(jìn)程序1來(lái)估計(jì)變點(diǎn)有著很大的偏差。所以本文決定對(duì)數(shù)據(jù)序列進(jìn)行預(yù)處理來(lái)減少數(shù)據(jù)間的相關(guān)性,采用差分的方法來(lái)對(duì)原始時(shí)間序列數(shù)據(jù)做預(yù)處理并得到一個(gè)新的數(shù)據(jù)序列。把加入預(yù)處理的程序稱為改進(jìn)程序2,模擬結(jié)果記錄在表2中。

表2 兩種改進(jìn)程序?qū)r(shí)間序列變點(diǎn)估計(jì)的均方誤差結(jié)果比較

表2記錄了兩種改進(jìn)程序的變點(diǎn)估計(jì)的結(jié)果。表2的結(jié)構(gòu)與表1相同,且樣本的模擬次數(shù)n=200。

從表2中可以看出,對(duì)于時(shí)間序列,改進(jìn)程序2比改進(jìn)程序1有著更好的估計(jì)結(jié)果。改進(jìn)程序2變點(diǎn)估計(jì)的均方誤差更小,估計(jì)更準(zhǔn)確,也更令人滿意。因此,本文認(rèn)為,非參數(shù)極大似然方法不能直接用于時(shí)間序列的變點(diǎn)估計(jì),但是在做差分的預(yù)處理后,該方法是可行的。雖然在一些情況下,估計(jì)結(jié)果不如獨(dú)立同分布的數(shù)據(jù)序列的估計(jì)結(jié)果好,但是仍然可以接受。對(duì)于復(fù)雜的時(shí)間序列,估計(jì)的偏差總是存在,這可能是因?yàn)閷?duì)于復(fù)雜的時(shí)間序列,差分的預(yù)處理并不足以有效地消除數(shù)據(jù)間的相關(guān)性。如果有更為有效的預(yù)處理方法,那么非參數(shù)極大似然方法仍是有效的,這也將是下一步的研究方向。

3 金融指數(shù)實(shí)證分析

上證綜合指數(shù)反映了上海證券交易所上市股票價(jià)格的變動(dòng)情況,是分析整個(gè)市場(chǎng)狀況的一個(gè)良好數(shù)據(jù)。本文對(duì)2015年4月7日至2017年4月6日的上證綜合指數(shù)(共463個(gè)數(shù)據(jù))進(jìn)行分析。由于是金融類的時(shí)間序列數(shù)據(jù),所以預(yù)處理采用log差分,即采用Rt=log(Yt)-log(Yt-1),得到回報(bào)波動(dòng)率進(jìn)行考慮。對(duì)log差分后的數(shù)據(jù)Rt進(jìn)行自相關(guān)分析(見圖1)。

圖1 Rt樣本自相關(guān)函數(shù)

從圖1可以看出,log差分后的數(shù)據(jù)Rt在5階內(nèi)可以認(rèn)為相關(guān)性不顯著,說(shuō)明用log差分代替差分作為預(yù)處理手段是可行的。之后對(duì)Rt進(jìn)行變點(diǎn)的判別。結(jié)果如圖2所示。

圖2 各變點(diǎn)似然函數(shù)值

從圖2可以看出,最大值點(diǎn)為228。由于序列中的第1個(gè)點(diǎn)是不能作為變點(diǎn)的,所以本文從第2個(gè)點(diǎn)開始判斷,圖中顯示的變點(diǎn)228實(shí)際上指的是Rt中的第229個(gè)點(diǎn)。本文以變點(diǎn)229為分界繪制Rt的數(shù)據(jù),情況如圖3所示。

圖3 Rt樣本的數(shù)據(jù)分布

從圖3可以看出,以變點(diǎn)229分割后的兩段Rt數(shù)據(jù)分布有著明顯的不同:第一段數(shù)據(jù)序列的波動(dòng)性更大,第二段的數(shù)據(jù)序列更為穩(wěn)定。而Rt數(shù)據(jù)序列的變點(diǎn)229對(duì)應(yīng)的是2016年3月31日。此結(jié)果與市場(chǎng)的反饋是一致的。

采購(gòu)經(jīng)理指數(shù)(PMI:Purchase Management Index)是一套月度發(fā)布的、綜合性的經(jīng)濟(jì)監(jiān)測(cè)指標(biāo)體系。PMI有著及時(shí)性與先導(dǎo)性、綜合性與指導(dǎo)性、真實(shí)性與可靠性、科學(xué)性與合理性、簡(jiǎn)單易行五大特點(diǎn)。PMI是經(jīng)濟(jì)回暖的先行指數(shù),對(duì)于經(jīng)濟(jì)預(yù)測(cè)和商業(yè)分析方面都有著重要的意義。

通過(guò)國(guó)家統(tǒng)計(jì)局公布的數(shù)據(jù)繪制圖4。

圖4 制造業(yè)PMI指數(shù)(經(jīng)季節(jié)調(diào)整)

從圖4可知,2016年3月前的PMI數(shù)據(jù)大多在50%以下,表現(xiàn)出國(guó)內(nèi)經(jīng)濟(jì)狀態(tài)的低迷。而在2016年3月,中國(guó)制造業(yè)PMI為50.2%,比上月上升1.2個(gè)百分點(diǎn),重回?cái)U(kuò)張區(qū)間。并且從該點(diǎn)開始,其后的PMI數(shù)據(jù)大多在50%以上,這顯示國(guó)內(nèi)經(jīng)濟(jì)形勢(shì)變好。這與之前的低迷狀況不相同,說(shuō)明這兩段時(shí)期的經(jīng)濟(jì)狀況所屬分布是不同的。這證明了非參數(shù)極大似然方法所找出的變點(diǎn):2016年3月31日是和市場(chǎng)經(jīng)濟(jì)的宏觀調(diào)控結(jié)果一致的,也說(shuō)明了該方法在實(shí)際應(yīng)用中是可行的。

4 結(jié)論

變點(diǎn)問(wèn)題是當(dāng)前的熱門問(wèn)題之一,本文采用一種非參數(shù)極大似然方法來(lái)解決單變點(diǎn)問(wèn)題。該非參數(shù)極大似然方法對(duì)于獨(dú)立數(shù)據(jù)序列的變點(diǎn)判別有著很高的精度。再加入差分作為預(yù)處理手段后,該方法對(duì)于金融時(shí)間序列數(shù)據(jù)也有著很好的效果。統(tǒng)計(jì)模擬顯示,本文所提出的改進(jìn)方法將會(huì)獲得更加一致的估計(jì)結(jié)果,改進(jìn)后的非參數(shù)極大似然方法在實(shí)際數(shù)據(jù)分析中也是可行的。通過(guò)對(duì)2015年4月7日至2017年4月6日的上證綜合指數(shù)的變點(diǎn)分析,發(fā)現(xiàn)估計(jì)變點(diǎn)的結(jié)果與實(shí)際PMI指數(shù)的變化是吻合的。變點(diǎn)估計(jì)顯示上證綜合指數(shù)在2016年3月31日存在變點(diǎn),市場(chǎng)在此前后的狀態(tài)是不同的。而實(shí)際PMI指數(shù)顯示,市場(chǎng)在2016年3月后經(jīng)濟(jì)形式脫離低迷狀態(tài),重回增長(zhǎng)狀態(tài)。由此可見,本文所提出的方法在實(shí)際應(yīng)用中的效果明顯,同時(shí)也說(shuō)明對(duì)于自相關(guān)的金融時(shí)間序列數(shù)據(jù),預(yù)處理的改進(jìn)措施是必要的。改進(jìn)后的非參數(shù)極大似然方法可以做進(jìn)一步拓展使其適用于其他情形,如多元的情況。這些后續(xù)的問(wèn)題仍需要進(jìn)一步的研究分析。

猜你喜歡
預(yù)處理程序模型
適用于BDS-3 PPP的隨機(jī)模型
求解奇異線性系統(tǒng)的右預(yù)處理MINRES 方法
污泥預(yù)處理及其在硅酸鹽制品中的運(yùn)用
重要模型『一線三等角』
給Windows添加程序快速切換欄
試論我國(guó)未決羈押程序的立法完善
“程序猿”的生活什么樣
基于預(yù)處理MUSIC算法的分布式陣列DOA估計(jì)
模型小覽(二)
英國(guó)與歐盟正式啟動(dòng)“離婚”程序程序
和静县| 台北县| 扶余县| 咸宁市| 衡山县| 新津县| 修水县| 金坛市| 昭苏县| 昌邑市| 日土县| 南开区| 浮山县| 通河县| 长沙市| 扎囊县| 枣强县| 全椒县| 陆丰市| 孟州市| 福鼎市| 仙游县| 衡山县| 泌阳县| 蚌埠市| 平乡县| 丹巴县| 光泽县| 高邑县| 电白县| 永年县| 锦屏县| 本溪市| 康定县| 临汾市| 永德县| 邢台县| 遂昌县| 湘潭县| 桑植县| 石狮市|