劉 鋒,郭似童,譚祥勇,康新梅
(重慶理工大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶 400054)
?
響應(yīng)變量缺失下部分線性單指標(biāo)模型的序列相關(guān)性檢驗(yàn)
劉鋒,郭似童,譚祥勇,康新梅
(重慶理工大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,重慶400054)
摘要:研究了在響應(yīng)變量隨機(jī)缺失下的部分單指標(biāo)模型的序列相關(guān)檢驗(yàn)問(wèn)題。首先采用借補(bǔ)的方法對(duì)缺失響應(yīng)變量進(jìn)行處理,再運(yùn)用經(jīng)驗(yàn)似然方法對(duì)殘差部分進(jìn)行序列相關(guān)性檢驗(yàn),構(gòu)造了經(jīng)驗(yàn)似然比統(tǒng)計(jì)量,并證得其為漸近分布。數(shù)值模擬結(jié)果表明:該檢驗(yàn)方法具有較為理想的檢驗(yàn)功效。
關(guān)鍵詞:部分單指標(biāo)模型;缺失數(shù)據(jù);隨機(jī)缺失;經(jīng)驗(yàn)似然;序列相關(guān)性檢驗(yàn)
部分單指標(biāo)模型(1.1)是由Carrall等于1997年首次提出的[1],他們結(jié)合局部線性的最小二乘法構(gòu)造了參數(shù)部分和非參數(shù)部分的估計(jì)量,并得到其漸近分布。此后很多學(xué)者對(duì)此模型進(jìn)行了研究。
在應(yīng)用研究領(lǐng)域,缺失數(shù)據(jù)是一種常見(jiàn)的數(shù)據(jù)。很多學(xué)者提出了在MAR(隨機(jī)缺失)假定下解決缺失數(shù)據(jù)的方法[2]。關(guān)于缺失數(shù)據(jù)最近的研究成果可以參見(jiàn)文獻(xiàn)[3-4]。
在經(jīng)濟(jì)和金融數(shù)據(jù)分析中,檢驗(yàn)?zāi)P偷男蛄邢嚓P(guān)是一項(xiàng)非常重要的工作。模型殘差潛在的序列相關(guān)會(huì)導(dǎo)致估計(jì)量無(wú)效、模型預(yù)測(cè)失效等問(wèn)題,很多學(xué)者對(duì)其做了深入研究[5-6],但是很少有學(xué)者研究缺失數(shù)據(jù)下的序列相關(guān)性檢驗(yàn)。本文研究響應(yīng)變量缺失下部分單指標(biāo)模型的序列相關(guān)性檢驗(yàn),利用經(jīng)驗(yàn)似然方法構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,并證明了零假設(shè)下檢驗(yàn)統(tǒng)計(jì)量的漸近分布為卡方分布。
1理論與方法
1.1對(duì)缺失值進(jìn)行借補(bǔ)
考慮如下部分線性單指標(biāo)模型:
(1)
現(xiàn)在假設(shè){(Xi,Yi,δi),i=1,…,n} 是來(lái)自模型(1.1)的一組不完全隨機(jī)樣本,其中{Yi,i=1,2,…,n}存在缺失。當(dāng)δi=1時(shí),Yi有觀測(cè)值;當(dāng)δi=0時(shí),Yi缺失。 假定缺失為隨機(jī)缺失(MAR),則可以得到
即在給定Xi和Zi條件下,δi和Yi條件獨(dú)立。
(2)
這里ei=δiεi,且滿足E(ei|Xi,Zi)=0。從ei的表達(dá)式可以看出,ei和εi的序列相關(guān)結(jié)構(gòu)是一致的,即檢驗(yàn)εi的序列相關(guān)性等價(jià)于檢驗(yàn)ei的序列相關(guān)性。下面進(jìn)行ei的序列相關(guān)性檢驗(yàn)。
設(shè)Vk=E(eiei+k),V=(V1,V2,…,Vp),k=1,2,…,p,則對(duì)ei的序列相關(guān)檢驗(yàn)可轉(zhuǎn)化為如下的原假設(shè)和備擇假設(shè):
H0:V=0?H1:V≠0
令ωi1=eiei+1,ωi2=eiei+2,…,ωip=eiei+p,i=1,2,…,n-p,ωi=(ωi1,ωi2,…,ωip)τ。則在零假設(shè)下,E(ωi)=0;在備擇假設(shè)下,E(ωi)≠0。這樣,檢驗(yàn){ei}是否存在序列相關(guān)性就等價(jià)于檢驗(yàn)E(ωi) 是否為0。
1.2構(gòu)造經(jīng)驗(yàn)似然比統(tǒng)計(jì)量
定義ωi的分布函數(shù)為F,則F的非參數(shù)似然函數(shù)為
取到最大值,從而得到經(jīng)驗(yàn)似然比函數(shù):
則有
(3)
對(duì)于未知的參數(shù)β,θ和g(·)的估計(jì),通常采用兩步估計(jì)法。先估計(jì)出g(·)和θ:
其中:
(4)
采用Largrange乘數(shù)法求出式(3)中關(guān)于πi的最優(yōu)解,解得
(5)
其中λ為方程(6)的解。
(6)
將式(5)代入式(3)得
(7)
2數(shù)值模擬
考慮如下部分單指標(biāo)模型:
數(shù)據(jù)產(chǎn)生如下:
β=(0.6,0.8)τ,θ=2
Xi1~U(-1,1)
Xi2~U(-1,1)
Zi~N(0,1)
Xi=(Xi1,Xi2)τ
i=1,2,…,n
① 當(dāng)p(δi=1)=0.9,p(δi=0)=0.1時(shí),即缺失概率為10%的缺失狀態(tài);
② 當(dāng)p(δi=1)=0.8,p(δi=0)=0.2時(shí),即缺失概率為20%的缺失狀態(tài);
③ 當(dāng)p(δi=1)=0.8,p(δi=0)=0.4時(shí),即缺失概率為40%的缺失狀態(tài)。
樣本量分別取n=100,200,300。為驗(yàn)證經(jīng)驗(yàn)似然比檢驗(yàn)的功效,本研究取顯著性水平0.05各做1 000次模擬,結(jié)果如表1~6所示。
從表1~6中可以看出:在零假設(shè)條件下,經(jīng)驗(yàn)似然比檢驗(yàn)的size隨著缺失率的增大而增大,但是隨著樣本量的增大,檢驗(yàn)的size越來(lái)越接近預(yù)設(shè)的顯著性水平α,檢驗(yàn)的power會(huì)隨著缺失概率的增大而減少,但是power還是較為理想。
表1 缺失概率為0.1時(shí)的AR(1)
表2 缺失概率為0.2時(shí)的AR(1)
表3 缺失概率為0.4時(shí)的AR(1)
表4 缺失概率為0.1時(shí)的MA(1)
表5 缺失概率為0.2時(shí)的MA(1)
表6 缺失概率為0.4時(shí)的MA(1)
3定理的證明
在證明過(guò)程中,由于N=n-p,因此不區(qū)別op(n) 和op(N)等。設(shè)C為絕對(duì)常數(shù),在不同的地方取值不同。為證明定理1,給出以下幾個(gè)條件:
(A1)g(·)滿足一階Lipschitz條件且其二階倒數(shù)連續(xù)有界;
(A2) 核函數(shù)K連續(xù)有界,滿足一階Lipschitz條件,且有
(A4)βτX(jué)的密度函數(shù)是有界且緊密支撐的,并且Lipschitz連續(xù),而且βτX(jué)在β的任意領(lǐng)域內(nèi)任一點(diǎn)有有界支撐。
由文獻(xiàn)[2]可知,上述假定條件是比較合理的。
引理1在零假設(shè)和條件A1~A6下有:
證明見(jiàn)文獻(xiàn)[2]。
引理2(Abel不等式)對(duì)于任意的2個(gè)序列{ai}和{bi},i=1,2,…,n,總存在C>0,使得
其中(j1,j2,…,jn)是(1,2,…,n)的任意重排。
且對(duì)于(1,2,…,n)的任意置換(j1,j2…,jn),也有
證明見(jiàn)文獻(xiàn)[7]。
引理4在條件A1~A6和零假設(shè)下,可得
其中Ip為p階單位陣。
證明對(duì)于任意的正整數(shù)k(1≤k≤p),有:
其中:
首先考慮Ω1,由于g(·)滿足Lipschitz條件,記其Lipschitz常數(shù)為L(zhǎng),則有
由引理1可得Ω1=op(1)。類(lèi)似可證Ω4=op(1)。
下證Ω7。
由引理1可得Ω7=op(1)。
由引理2可得
Op((nh)-1/2log1/2n)·Op(N-1/2)·
Op(n1/2logn)=op(1)
同理類(lèi)似可證的Ω5=op(1)。
下證Ω8。由引理2和3可得:
同理應(yīng)用引理2和3可得Ω10=op(1)。
接著證明Ω11。
N1/2op((nh)-1logn)=op(1)
然后考慮Ω15。
這樣就得到
因此有
令ν為任意p維非零向量,由引理1知,在零假設(shè)下,νTφi為p步相依的隨機(jī)變量序列,但對(duì)于i≠j,有
故由m步相依隨機(jī)變量中心極限定理得
其中Φ=ννTσ4。由Cramer-Wold方法就可以得到引理2所要的結(jié)果。
引理5在零假設(shè)和條件A1~A2下,有
證明類(lèi)似引理4的證法,可證明引理5。
引理6λ是式(6)的解,有
證明見(jiàn)文獻(xiàn)[8]中引理3。
定理1的證明如下:
由引理1~6,將式(7)泰勒展開(kāi)可得
經(jīng)簡(jiǎn)單的計(jì)算以及由引理4~6可得
定理1證明完畢。
4結(jié)束語(yǔ)
當(dāng)前對(duì)缺失數(shù)據(jù)的研究主要集中于對(duì)統(tǒng)計(jì)模型的估計(jì)和置信區(qū)間的構(gòu)造上,對(duì)序列相關(guān)性的研究較少。本文采用經(jīng)驗(yàn)似然方法檢驗(yàn)缺失數(shù)據(jù)下的部分單指標(biāo)模型的序列相關(guān)性,其研究成果有較重要的理論價(jià)值和參考價(jià)值。
參考文獻(xiàn):
[1]CARROLL R J,FAN J,GIJBELS I,et al.Generalized partially linear single-index models[J]. Jounrnal of the American Statistics Association,1997,92:477-489.
[2]WANG J L,XUE L G,ZHU L X,et al. estimation for a partially linear single-index models[J]. The Annals of Statistics,2010,38(1):246-274.
[3]楊宜平.協(xié)變量隨機(jī)缺失下相性模型的經(jīng)驗(yàn)似然推斷及其應(yīng)用[J].數(shù)理統(tǒng)計(jì)與管理,2011,99:367-367.
[4]ZHANG K K,GONZALEZ R,HUANG B,et al.Expectation maximization approach to fault diagnosis with missing data[J].IEEE Trans-actions on Industrial Electronics,2015,62(2):1231-1240.
[5]LIU F,CHEN G M,CHEN M.Testing serialcorrelation in partially linear errors-in-variables models based on empirical likelihood[J].Communication in Statistics Theory and Methods,2008,37(12):1905-1918.
[6]LI J B,WANG Y Y,HUANG Z S,et al.Testing serial correlation in single index models[J].Communications in Statistics,2015,44(4):1020-1035.
[7]高集體,沈紅巖,梁華.部分線性模型中估計(jì)的收斂速度[J].數(shù)學(xué)學(xué)報(bào),1995,38(5):658-669.
[8]OWEN A B.Empirical likelihood ratio for linear models.[J] Ann Statistics,1991,19:1725-1747.
(責(zé)任編輯劉舸)
Serial Correlation Test for Partial Linear Single-Index Model with Missing Response Variables
LIU Feng, GUO Si-tong, TAN Xiang-yong, KANG Xin-mei
(College of Mathematics and Statistics, Chongqing University of Technology,Chongqing 400054, China)
Abstract:We considered the serial correlation test for partial linear single-index model with response variables missing at random (MAR). Firstly, we filled in the missing response variables by the imputation method. Then we applied the empirical likelihood method to establish the test statistic, and constructed the ratio statistic of empirical likehood and derive the asymptotic distribution of the statistic. Simulation results indicate that the test method performs well.
Key words:part of single-index model; missing data; missing at random; experience likelihood; serial correlation tests
文章編號(hào):1674-8425(2016)02-0145-07
中圖分類(lèi)號(hào):O212
文獻(xiàn)標(biāo)識(shí)碼:A
doi:10.3969/j.issn.1674-8425(z).2016.02.025
作者簡(jiǎn)介:劉鋒(1973—),男,湖南新化人,博士,副教授,主要從事非參數(shù)統(tǒng)計(jì)研究;郭似童(1990—),女,湖北隨州人,碩士研究生,主要從事非參數(shù)統(tǒng)計(jì)研究。
基金項(xiàng)目:重慶理工大學(xué)研究生創(chuàng)新基金資助項(xiàng)目(YCX2014234)
收稿日期:2015-10-12
引用格式:劉鋒,郭似童,譚祥勇,等.響應(yīng)變量缺失下部分線性單指標(biāo)模型的序列相關(guān)性檢驗(yàn)[J].重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2016(2):145-151.
Citation format:LIU Feng, GUO Si-tong, TAN Xiang-yong, et al.Serial Correlation Test for Partial Linear Single-Index Model with Missing Response Variables[J].Journal of Chongqing University of Technology(Natural Science),2016(2):145-151.