国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

響應(yīng)變量缺失下基于協(xié)變量平衡下的變系數(shù)模型的經(jīng)驗(yàn)似然推斷

2021-04-10 10:40:58王秀麗
關(guān)鍵詞:概率模型定理概率

范 莉 王秀麗

(山東師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,250358,濟(jì)南)

1 引 言

考慮如下形式的變系數(shù)模型

Y=XTβ(U)+ε,

(1)

其中,Y是響應(yīng)變量,X,U為協(xié)變量,X∈RP,U∈R,β(·)=(β1(·),…,βp(·))T為一個(gè)p維未知的參數(shù)函數(shù)向量,ε為誤差項(xiàng)且滿足:E(ε|X,U)=0,var(ε2|U,X)=σ2(U).

這里主要考慮響應(yīng)變量Y隨機(jī)缺失的情況,樣本量為n的不完全數(shù)據(jù)可以表示為(δi,Xi,Yi,Ui),i=1,…,n,其中當(dāng)Yi缺失時(shí),δi=0,否則δi=1,且滿足

P{δi=1|Yi,Xi,Ui}=P{δi=1|Xi,Ui}=π(Xi,Ui).

(2)

變系數(shù)模型是一類應(yīng)用非常廣泛的模型,包含了常見的一些模型,如可加模型,部分線性模型,單指標(biāo)函數(shù)系數(shù)回歸模型等.它不僅避免了“維數(shù)禍根”,而且更加具有可解釋性,許多統(tǒng)計(jì)學(xué)者對(duì)該模型進(jìn)行了研究,取得了豐富的研究成果.Fan J Q等人[1]提出了兩步估計(jì)法,允許系數(shù)函數(shù)有不同的窗寬,并且證明了兩步估計(jì)要優(yōu)于一步估計(jì).盧一強(qiáng)等人[2]考慮到各個(gè)系數(shù)函數(shù)的差別,允許各個(gè)系數(shù)函數(shù)有不同的光滑參數(shù),在系數(shù)函數(shù)為三階B樣條函數(shù)的條件下,用貝葉斯模型平均的方法來估計(jì)函數(shù)系數(shù).

但在實(shí)際問題中經(jīng)常會(huì)遇到缺失數(shù)據(jù),分析缺失數(shù)據(jù)廣泛使用的是由Thompson P G等人[3]提出的逆概率加權(quán)方法,這個(gè)方法產(chǎn)生的估計(jì)在缺失機(jī)制假定正確的前提下是無偏的.杜海燕等人[4]考慮了協(xié)變量缺失下變系數(shù)部分非線性模型的統(tǒng)計(jì)推斷問題,基于逆概率加權(quán)利用輪廓最小二乘和經(jīng)驗(yàn)似然的方法得到參數(shù)和非參系數(shù)的估計(jì).陳盼盼等人[5]基于逆概率加權(quán)最小二乘方法研究了缺失數(shù)據(jù)下變系數(shù)部分線性模型的統(tǒng)計(jì)推斷問題.但是這種估計(jì)方法也只是用到了完全觀測(cè)的數(shù)據(jù).為了提高估計(jì)的效率,Robins J M等人[6]提出了擴(kuò)張的逆概率加權(quán)(Augmented Inverse Probability Weighting,AIPW),通過對(duì)每一個(gè)缺失的變量借補(bǔ)一個(gè)合適的值,利用觀測(cè)到的數(shù)據(jù)和借補(bǔ)的值進(jìn)行統(tǒng)計(jì)推斷,得到的估計(jì)量具有雙穩(wěn)健性.有很多學(xué)者利用它來處理缺失數(shù)據(jù)的問題[7-9].在運(yùn)用以上兩種方法構(gòu)造估計(jì)量時(shí),通常需要先估計(jì)出選擇概率,當(dāng)選擇概率模型和回歸模型都被指定正確時(shí),擴(kuò)張的逆概率加權(quán)就會(huì)得到很好的估計(jì),但是當(dāng)兩者都被指定錯(cuò)誤時(shí),擴(kuò)張的逆概率加權(quán)方法的雙穩(wěn)健性就會(huì)變差.為了解決這個(gè)問題,Kosuke I等人[10]提出了協(xié)變量平衡傾向得分(Covariate Balancing Propensity Score,CBPS)方法,這個(gè)方法通過最大化協(xié)變量平衡得到的參數(shù)值來降低潛在的選擇概率模型被錯(cuò)誤指定而導(dǎo)致的后果,所以這是一種穩(wěn)健的估計(jì)選擇概率的方法.Guo D L等人[11]基于協(xié)變量平衡傾向得分(CBPS)研究了非線性模型穩(wěn)健估計(jì),但對(duì)于變系數(shù)模型中的穩(wěn)健估計(jì)沒有進(jìn)行研究.本文將基于協(xié)變量平衡傾向得分研究在響應(yīng)變量隨機(jī)缺失條件下的變系數(shù)模型的經(jīng)驗(yàn)似然統(tǒng)計(jì)推斷.

2 基于協(xié)變量平衡傾向得分的估計(jì)量的構(gòu)造

在(2)式中π(Xi,Ui)是未知的,通常情況下假設(shè)π(Xi,Ui)是logistic模型,則有

(3)

(4)

若π(Z,γ)關(guān)于γ是二階連續(xù)可導(dǎo)的,則(4)式等價(jià)于如下一階條件

(5)

其中π′(Zi,γ)=?π(Zi,γ)/?γT.

雖然極大似然方法簡(jiǎn)單,但是當(dāng)選擇概率錯(cuò)誤的時(shí)候,該方法得到的回歸系數(shù)估計(jì)量是有偏的.為了使參數(shù)方法更穩(wěn)健,利用文獻(xiàn)[10]提出的協(xié)變量平衡的傾向得分(CBPS)方法對(duì)選擇概率模型中的未知參數(shù)γ進(jìn)行估計(jì),即令選擇概率π(Zi,γ)滿足協(xié)變量平衡條件

(6)

即使選擇概率模型被指定錯(cuò)誤,(6)式也能保證協(xié)變量的一階矩平衡,由(6)式可得協(xié)變量平衡條件的樣本形式為

(7)

若只考慮(5)式,此時(shí)參數(shù)的個(gè)數(shù)和方程的個(gè)數(shù)相等即為恰好識(shí)別,這種情況下利用矩方法的思想可以得到未知參數(shù)的矩估計(jì).在這里只考慮過識(shí)別的情形,聯(lián)合(5)式及(7)式可得

(8)

(9)

為了方便介紹,引入以下的記號(hào)和假設(shè)條件.

C1 對(duì)所有Zi,π(Zi,γ)在γ0附近都是一個(gè)已知可微的函數(shù);

C2E(Zi)、E[W(δi,Zi,γ)]存在且矩陣E(ZiZiT)滿秩;

C3 1)WE[U(δi,Zi,γ)]=0當(dāng)且僅當(dāng)γ=γ0,γ0∈Θ為緊集;

2)E(‖π′(Z,γ0)‖2)<且E(‖Zi‖2)<;

C4U有有界支撐Ω,且U的密度函數(shù)f(u)>0,f(u)為L(zhǎng)ipschitz連續(xù);

C6 核函數(shù)K(·)為有界支撐的對(duì)稱概率密度函數(shù);

C7 {β(U),i=1,2,…,p}在所有的U∈Ω有連續(xù)的二階導(dǎo)數(shù);

C8 存在r>0,使得E|X|2+r<,E|ε|2+r<;

C9 窗寬h滿足當(dāng)n→,h→0時(shí),nh5→0,nh→;

由參考文獻(xiàn)[13],可以得到下述的定理1.

定理1[13]假設(shè)Zi,i=1,2,…,n是一組獨(dú)立同分布的隨機(jī)向量,滿足條件C1-C3,γ0為γ的真值,則有

推論1[13]如果π(Zi,γ)是連續(xù)的,γ0為γ的真值,在條件C1-C3下,有

2.2回歸系數(shù)的經(jīng)驗(yàn)似然由Zhou X S等人[14]的研究結(jié)果可知,系數(shù)函數(shù)向量β(u)=(β1(u),β2(u),…,βp(u))T在u0處的局部線性估計(jì)可表示為

其中,IP和0p分別表示p階單位矩陣和p階零矩陣,

Y=(Y1,Y2,…,Yn)T,X=(X1,X2,…,Xn)T,ε=(ε1,…,εn)T,

W(u0)=Diag(Kh(U1-u0)δ1,Kh(U2-u0)δ2,…,Kh(Un-u0)δn),

(10)

構(gòu)造輔助隨機(jī)向量

(11)

(12)

利用Lagrange乘子法選擇最優(yōu)pi,可得

(13)

其中λ為拉格朗日乘數(shù)且為下述方程的解

(14)

定理2如果假設(shè)條件C1-C10成立,則當(dāng)β(u)為真值時(shí),有

其中χp2表示自由度為p的卡方分布.

基于定理2可以定義β(u)的近似置信水平為1-α的置信區(qū)間為

Iα(β(u))={β(u)|l(β(u))≤χp2(1-α)}.

3 定理的證明

下面給出定理2的證明,首先給出如下的引理1.

引理1若假設(shè)條件C4-C10成立,則有

其中

證經(jīng)計(jì)算有

類似于文獻(xiàn)[11]中定理2,可證

下面給出定理2的證明.

證由引理1的證明簡(jiǎn)單計(jì)算可得

(15)

由引理1的證明及文獻(xiàn)[15]中引理1的證明可得

(16)

類似于文獻(xiàn)[16]中的定理2的證明可知

λ=OP((n/h)-1/2).

(17)

由(15)式和(16)式,將(13)式進(jìn)行Taylor展開易得

(18)

又由(14)式,結(jié)合(15)-(17)式,可得

(19)

(20)

再根據(jù)(18)-(20)式,計(jì)算可知

結(jié)合引理1,定理2得證.

猜你喜歡
概率模型定理概率
J. Liouville定理
第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
概率與統(tǒng)計(jì)(一)
概率與統(tǒng)計(jì)(二)
在精彩交匯中,理解兩個(gè)概率模型
A Study on English listening status of students in vocational school
基于停車服務(wù)效率的選擇概率模型及停車量仿真研究
“三共定理”及其應(yīng)用(上)
一類概率模型的探究與應(yīng)用
西宁市| 北流市| 墨脱县| 聂荣县| 兴宁市| 桦川县| 陇川县| 会同县| 富顺县| 汽车| 乌拉特后旗| 康马县| 阿尔山市| 遵义市| 麦盖提县| 赞皇县| 尚志市| 庄河市| 浮山县| 微博| 祁连县| 双柏县| 晴隆县| 漠河县| 永年县| 色达县| 湖州市| 应用必备| 信阳市| 西城区| 新宁县| 屏东县| 巴彦县| 阳谷县| 汤原县| 株洲县| 渝北区| 博白县| 荆州市| 息烽县| 嘉禾县|