闕 燁
(南京理工大學 理學院,南京 210094)
非參數(shù)混合效應模型的估計*
闕 燁
(南京理工大學 理學院,南京 210094)
針對非參數(shù)混合效應模型提出估計方法,通過B樣條的方法估計非參數(shù)函數(shù),使用懲罰(非加權)最小二乘方法估計隨機效應,然后通過構造正態(tài)似然函數(shù)得到方差的估計,并且證明了方差分量的相合性和函數(shù)部分的漸近正態(tài)性;最后給出數(shù)字模擬來展示所提出方法的估計效果,結果表明:該方法給出的估計效果良好,且在數(shù)值上是穩(wěn)定的。
非參數(shù)混合效應模型;B樣條;懲罰最小二乘;正態(tài)似然函數(shù)
在分析相關數(shù)據(jù)的時候經(jīng)常用到混合效應模型,因此此處考慮非參數(shù)混合效應模型:
(1)
混合效應模型對于分析縱向和重復測量數(shù)據(jù)來說是一個重要工具,近年來它引起了國內(nèi)外統(tǒng)計學者的極大關注。Cai T,etal.(2002)[1]研究了在集群故障時間數(shù)據(jù)下的半?yún)?shù)混合效應模型,他們在文中提出了對于這個隨機效應模型的推斷和預測;Chen Z和Dunson D(2003)[2]研究了線性混合效應模型的隨機效應選擇;Li W B和Xue L G(2014)[3]研究了廣義部分線性混合效應模型的有效推斷問題,他們對參數(shù)和方差分量提出了一系列半?yún)?shù)估計值,然后使用局部線性光滑方法去展示非參數(shù)分量的估計值;Pang Z和Xue L G(2012)[4]研究了單指標混合效應模型,為了估計指標系數(shù)和聯(lián)系函數(shù),提出了一系列新的估計方程去調(diào)整邊界效應,使用局部線性光滑方法去估計非參數(shù)函數(shù);Schimek M G(2000)[5]研究了部分線性模型在光滑樣條下的估計和推斷,描述了在光滑樣條方法下的廉價直接算法,光滑參數(shù)可以被選擇通過一個無偏風險標準;Zhong X P,etal.(2003)[6]對帶有變量誤差的線性混合效應模型的估計提出了統(tǒng)一分類法;Zhao H B和You J H(2011)[7]研究了帶有測量誤差的部分線性回歸模型的不同估計,他們給出的估計是漸近無偏估計并且實現(xiàn)了非參數(shù)有效邊界。其他的關于隨機效應的文獻可參看Li W B和Xue L G(2013)[8],Liang H(2009)[9],Lindstrom M J和Bates D M(2010)[10],Wu H和Zhang J T(2002)[11]。此處與已有文獻的不同之處是本文使用B樣條來估計函數(shù)部分,從而將非參數(shù)模型轉(zhuǎn)化為線性混合效應模型。B樣條估計方法的優(yōu)點在于它有緊支撐,這使得計算速度加快,函數(shù)部分的擬合曲線會更光滑,這無疑在視覺上更吸引人。而隨機效應項的處理借鑒了已有文獻的方法并在此基礎上進行改進,請參考文獻Gu C和Ma P(2005)[12]。
2.1 非參數(shù)函數(shù)的估計
使用B樣條基函數(shù)將g(·)表示為
2.2 隨機效應項b的估計
這里使用懲罰最小二乘法估計b,極小化
(2)
2.3 方差分量的估計
-n(n-1)log(σε2)-nlog(σε2+nσb2)-
首先,給出下列條件:
Ⅰc0表示一個常數(shù),有E(e2)≤c0<∞成立,這里e=Zb+ε=Y-g(U);
Ⅱ 對任意的i,協(xié)變量Ui是獨立同分布的變量,且Ui的分布是緊支撐集;
定理2 在條件(Ⅰ)—(Ⅲ)下,有
(3)
(4)
定理1的證明 定理1的證明類似于Huang J Z,etal.(2004)[13]中定理2的證明方法,這里忽略該定理的證明過程。
定理2的證明 先證明式(3)。
下面證明式(4),進行一系列的演算后有:
N2=OP(n-1/2)
N3=OP(n-1/2)
通過利用式(3)就得到了式(4)的證明。
例1 考慮模型:Yi=cos(πUi)+b+εi,i=1,2,…,n,其中Ui服從區(qū)間(0,1)上的均勻分布,模型的隨機效應項服從均值為0,方差為0.16的正態(tài)分布,誤差項服從均值為0,方差為0.04的正態(tài)分布的隨機變量。運用B樣條估計函數(shù)項,本例中樣條的節(jié)點由廣義交叉驗證(GCV)方法得出節(jié)點個數(shù)為5個,樣條階數(shù)為3。
圖1 函數(shù)部分的真實曲線和估計曲線(n=100)Fig.1 The real link function curve and the estimated link function curve(n=100)
圖2 函數(shù)估計值的箱線圖(n=100)Fig.2 The boxplot for the estimated link function(n=100)
[1] CAI T,CHENG S C,WEI L J.Semiparametric Mixed-effects Models for Clustered Failure Time Data[J].Journal of the American Statistical Association,2002,97(6):514-522
[2] CHEN Z,DUNSON D.Random Effects Selection in Linear Mixed Models[J].Biometrics,2003,59(4):762-769
[3] LI W B,XUE L G.Efficient Inference in a Generalized Partially Linear Model with Random Effect for Longitudinal Data[J].Communication in Statistics Theory and Methods,2014,44(2):241-260
[4] PANG Z,XUE L G.Estimation for the Single-index Models with Random Effects[J].Computational Statistics and Data Analysis,2012,56(6):1837-1853
[5] SCHIMEK M G.Estimation and Inference in Partially Linear Models with Smoothing Splines[J].Journal of Statistical Planning and Inference,2000,91(2):525-540
[6] ZHONG X P,FUNG W K,WEI B C.Estimation in Linear Models with Random Effects and Errors-in-variables[J].Annals of the Institute of Statistical Mathematics,2002,54(3):595-606
[7] ZHAO H B,YOU J H.Difference Based Estimation for Partially Linear Regression Models with Measurement Errors[J].Journal of Multivariate Analysis,2011,102(10):1321-1338
[8] LI W B,XUE L G.Efficient Inference about the Partially Linear Varying Coefficient Model with Random Effect for Longitudinal Data[J].Communications in Computer and Information Science,2013(391):573-583
[9] LIANG H.Generalized Partially Linear Mixed-effects Models Incorporating Mismeasured Covariates[J].Annals of the Institute of Statistical Mathematics,2009,61(1):27-46
[10] LINDSTROM M J,BATES D M.Nonlinear Mixed-effects Models for Repeated Measures Data[J].Biometrics,2010,46(46):673-687
[11] WU H,ZHANG J T.Local Polynomial Mixed-effects Models for Longitudinal Data[J].Journal of the American Statistical Association,2002,97(459):883-897
[12] GU C,MA P.Optimal Smoothing in Nonparametric Mixed-effect Models[J].Annals of Statistics,2005,33(3):1357-1379
[13] HUANG J Z,WU C O,ZHOU L.Polynomial Spline Estimation and Inference for Varying Coefficient Models with Longitudinal Data[J].Statistica Sinica,2004,14(3):763-788
責任編輯:李翠薇
The Estimation for the Nonparametric Mixed Effects Model
QUE Ye
(School of Science, Nanjing University of Science and Technology, Nanjing 210094, China)
The estimation methodology for the nonparametric mixed effects model is proposed. For this, we use the B-splines methods to estimate the function, and employ the penalized least square method to obtain the estimator of the random effects. Further, we construct the normal likelihood function to estimate the variance components. And we also prove the consistency of variance components and the asymptotic normality of the link function.A simulation study is carried out to show the estimation effect of our proposed methodology.It shows our proposed methodology performs well.Our algorithm is stable numerically.
nonparametric mixed effects model; B-splines method; penalized least square method; normal likelihood function
10.16055/j.issn.1672-058X.2017.0000.003
2016-05-19;修回時間:2016-06-24.
江蘇省自然科學基金(BK20131345).
闕燁(1992-),女,安徽淮南人,助教,碩士研究生,從事非參數(shù)統(tǒng)計及應用研究.
O212.7
A
1672-058X(2017)01-0010-04