于 洋,侯 文
(遼寧師范大學(xué) 數(shù)學(xué)學(xué)院,遼寧 大連 116029)
廣義線性模型的概念由 Nelder和Wedderburn(1972)[1]首先提出.他將經(jīng)典線性回歸模型進(jìn)行了延拓,并針對(duì)新模型確定統(tǒng)一的理論,且在其論文中詳細(xì)地討論了廣義線性模型的假設(shè)、構(gòu)成及其參數(shù)估計(jì).MaCullagh和Nelder(1989)[2]第一次將廣義線性模型引入到保險(xiǎn)精算學(xué)中,認(rèn)為指數(shù)型分布族可以通過(guò)適當(dāng)?shù)木€性變換完成線性化,該線性化的模型包括泊松、二項(xiàng)、負(fù)二項(xiàng)等分布.但是存有廣義線性模型不適用的情形,比如在分析離散數(shù)據(jù)時(shí)常常出現(xiàn)零觀測(cè)值過(guò)多的情形.如果強(qiáng)行采用廣義線性模型擬合將導(dǎo)致擬合效果不佳且容易對(duì)分析結(jié)果產(chǎn)生失真的解釋.零膨脹廣義線性模型可用在這些情形中,如零膨脹泊松回歸模型,該模型用于分析生產(chǎn)過(guò)程中產(chǎn)品所含有的瑕疵數(shù)量,進(jìn)一步,將零膨脹泊松回歸模型擴(kuò)展到零膨脹負(fù)二項(xiàng)回歸模型,并將該模型應(yīng)用到顧客信用卡不良記錄的探究中.Deng和Paul(2000)[3]對(duì)零膨脹廣義線性模型的參數(shù)給出了得分檢驗(yàn)統(tǒng)計(jì)量.但是現(xiàn)有的 大多數(shù)文獻(xiàn)打都是關(guān)注于模型的應(yīng)用,較少涉及零膨脹廣義線性模型極大似然估計(jì)的相合性和漸近正態(tài)性等大樣本性質(zhì).借鑒Fahrmeir和Kaufmann(1985)[4]對(duì)廣義線性模型極大似然估計(jì)的大樣本性質(zhì)的研究結(jié)果,在一定的正則條件下,證明零膨脹廣義線性模型極大似然估計(jì)的相合性和漸近正態(tài)性等性質(zhì)應(yīng)該是有價(jià)值的.
f(y,θ)=c(y)exp {θy-b(θ)}dγ.
(1)
其中,θ為自然參數(shù),b(θ)和c(y)是已知函數(shù).這兩個(gè)函數(shù)必須滿足以下條件:
b(θ)的二階導(dǎo)數(shù)存在并且大于零;
c(y)是獨(dú)立于參數(shù)θ的函數(shù).
由于零膨脹現(xiàn)象經(jīng)常發(fā)生在計(jì)數(shù)數(shù)據(jù)中,例如,泊松分布,二項(xiàng)分布,負(fù)二項(xiàng)分布等,故在此背景下,零膨脹指數(shù)族定義為
其中,f(y,θ)為式(1)所示的單參數(shù)指數(shù)分布族密度函數(shù),記作Y~f(y,θ,ω),θ,ω為參數(shù).其均值和方差為
E(Y)=(1-ω)μ=(1-ω)b′(θ),
Var(Y)=(1-ω)(b″(θ)+ω{b′(θ)})2.
零膨脹廣義線性模型結(jié)構(gòu)如下:
(1)模型的響應(yīng)變量為Yi,Yi~f(y,θ,ω),且Yi相互獨(dú)立,i=1,2,…,n;
(3)聯(lián)結(jié)函數(shù)g是一個(gè)單調(diào)可微的函數(shù),它體現(xiàn)了隨機(jī)成分的期望值與系統(tǒng)成分之間的聯(lián)系,即E(Yi)=μi=g-1(ηi).
對(duì)數(shù)似然函數(shù)為
其score向量為
sn(δ)=(s0(δ),s1(δ),…,sp(δ),sp+1(δ))T,
(2)
其中,
又
進(jìn)一步求導(dǎo),可得觀測(cè)值矩陣為
(3)
Fisher信息陣Fn(δ)=EδHn(δ),
由E(I(yi=0))=P(Yi=0)=ω+(1-ω)f(0,θi)和
E(I(yi>0))=P(Yi=y)=(1-ω)f(yi,θi),
(4)
為了方便,先設(shè)定一些特殊的記號(hào).令λminA和λmaxA分別表示矩陣A的最小特征根和最大特征根,用AT表示矩陣A的轉(zhuǎn)置矩陣,A1/2表示正定矩陣A的Cholesky分解中左平方根的下三角矩陣,且其對(duì)角元素為正,即A1/2(A1/2)T=A.
為了表示方便設(shè)定AT/2=(A1/2)T,A-T/2=(AT/2)-1,A-1/2=(A-1/2)-1.
用‖·‖表示一個(gè)矩陣的譜范數(shù),一個(gè)實(shí)值矩陣A的譜范數(shù)為
‖A‖=(λmax(ATA))1/2,
Hn(δ)和Fn(δ)分別表示零膨脹廣義模型參數(shù)δ的觀測(cè)信息陣和Fisher信息陣.
此外分別將sn(δ0)、Fn(δ0)、Eδ0記為sn、Fn、E.
定理1需要在以下假設(shè)下進(jìn)行證明:
(2){Xn,n≥1}?Kx,Kx?RP+1是一個(gè)緊集,
(3)假設(shè)B?Rp+1是一個(gè)開(kāi)集且δ0是集合Kδ:=B×Ω的內(nèi)點(diǎn),其中Ω=[0,1].
為了證明定理1,需要證明以下引理.
若函數(shù)u(·)在[0,)是非負(fù)的,有
證明第一個(gè)式子通過(guò)下面等式證明
由E(I(y>0))=P(Y=y)=(1-ω)f(y,θ).
又由函數(shù)u(·)在[0,)是非負(fù)的,顯然有
證明根據(jù)Ramesh(1974)[5]中定理2.2,有遞推公式
引理3設(shè)Qk(y)為k階多項(xiàng)式,其系數(shù)是關(guān)于x,δ,δ0的連續(xù)函數(shù)且系數(shù)為正,令Yi~f(yi,θi,ω),i=1,2,…,n.如果條件(1)-(3)成立,則
證明在條件(1)下,對(duì)?n∈N,鄰域Nn(ε)是緊集,且對(duì)于?ε>0,當(dāng)n→時(shí),Nn(ε)收斂于δ0.因此由引理3.1和3.2以及多項(xiàng)式Qk(y)系數(shù)的連續(xù)性,有
引理4在條件(1)-(3)下,當(dāng)n→時(shí),,其中N(0,Ip+2)是p+2維正態(tài)分布,且其均值為0,協(xié)方差矩陣為Ip+2(Ip+2為p+2階的單位陣).
由Cr不等式的一個(gè)展開(kāi)式
(5)
有E‖sni‖3≤C(E|s0,i|3+…+E|sp,i|3+E|sp+1,i|3).
由式(5)得
將其最后一步拆成兩部分來(lái)證明.
再由Cauchy-Schearz不等式和引理3.2,得
由此證得引理4成立.
需證明
(6)
(7)
(8)
(9)
(10)
由于式(8)、式(9)和式(10)有相似的結(jié)構(gòu),只證明式(8)成立,其他可類(lèi)似處理.
為得到式(8),只需證
(11)
(12)
其中:
而式(9)和式(10)由大數(shù)定律可知成立.
由式(7),有
(13)
(14)
(15)
由于式(13)、式(14)和式(15)有相似的結(jié)構(gòu),只證明式(13)成立,其余可以類(lèi)似處理.
當(dāng)n充分大時(shí),由δ∈Nn(ε),由式(4)中frs(δ)的連續(xù)性,可得式(13)成立.
由此證得引理5成立.
證明令?Nn(ε)表示Nn(ε)的邊界,由條件(1)知,當(dāng)n→時(shí),Nn(ε)收斂于δ0.
則 ln(δ)-ln(δ0)<0,?δ∈?Nn(ε).
(16)
下面證明對(duì)?η>0,?ε>0和n1使得對(duì)所有n≥n1,有
P(ln(δ)-ln(δ0))<0,且對(duì)?δ∈?Nn(ε)≥1-η成立.
(17)
由此可知式(17)成立.
因此可以推得定理1的(i)成立.
由引理4和引理5即可推得定理1 的(ii)成立.
通過(guò)討論響應(yīng)變量為單參數(shù)指數(shù)族且在零點(diǎn)處膨脹的廣義線性模型的大樣本性質(zhì),表明零膨脹廣義線性模型具有與廣義線性模型相類(lèi)似的漸近性質(zhì).另外,定理的漸近結(jié)果也適用于一些離散型模型,如零膨脹負(fù)二項(xiàng)回歸模型,零膨脹泊松回歸模型,等等.
經(jīng)濟(jì)數(shù)學(xué)2020年3期