国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

Logistic模型的局部影響分析

2012-11-08 00:53:41
關(guān)鍵詞:計(jì)算公式對數(shù)曲率

光 琳

(江蘇聯(lián)合職業(yè)技術(shù)學(xué)院 連云港財(cái)經(jīng)分院, 江蘇 連云港 222003)

Logistic模型的局部影響分析

光 琳

(江蘇聯(lián)合職業(yè)技術(shù)學(xué)院 連云港財(cái)經(jīng)分院, 江蘇 連云港 222003)

利用曲率方法研究了Logistic模型的局部影響,推導(dǎo)出了漂移擾動、加權(quán)擾動、自變量擾動及因變量擾動下的曲率計(jì)算公式,最后給出了實(shí)例分析,證實(shí)了結(jié)論的有效性.

Logistic模型; 局部影響; 曲率; 擾動

0 引言

在工程上以及醫(yī)學(xué)、流行病學(xué)、生物學(xué)等學(xué)科中,人們經(jīng)常需要研究二分變量與諸多自變量的相互關(guān)系,Logistic模型作為其中一種重要的模型,日益受到人們的重視.關(guān)于Logistic模型,人們已經(jīng)做了大量的研究,但主要集中在參數(shù)估計(jì)理論、假設(shè)檢驗(yàn)理論以及模型的應(yīng)用方面,而對其模型的統(tǒng)計(jì)診斷在國內(nèi)相關(guān)的參考文獻(xiàn)并不多見.

識別Logistic模型的異常點(diǎn)及強(qiáng)影響點(diǎn)的診斷統(tǒng)計(jì)量主要有Score統(tǒng)計(jì)量,廣義cook距離,似然距離等,它們都是刻劃了刪除個(gè)別數(shù)據(jù)點(diǎn)對回歸分析的影響.刪除個(gè)別數(shù)據(jù)點(diǎn)其實(shí)不過是模型擾動的一種方式[1],由數(shù)據(jù)刪除模型(CDM)與均值漂移模型(MSOM)的等價(jià)性可以清楚地看到:刪除一個(gè)數(shù)據(jù)點(diǎn)相當(dāng)于加進(jìn)一個(gè)擾動向量而得到的模型,但模型的擾動方式并不限于刪除數(shù)據(jù)這一種擾動方式,還有別的一些擾動方式,如方差加權(quán)模型等.本文利用Cook[2]提出的曲率方法研究了Logistic模型在各種擾動情況下的局部影響,得出了影響曲率的計(jì)算公式,從而探測出模型的強(qiáng)影響點(diǎn).

Logistic模型是一種廣義的線性模型(GLM),應(yīng)變量Y1,Y2, …,Yn是相互獨(dú)立的,而且Yi~B(Pi),EYi=Pi=P(Yi=1),在這種模型下,

(1)

其中xi=(1,xi1,…,xi,p-1)T,β=(β0,β1,…,βp-1)T.

對應(yīng)的對數(shù)似然函數(shù)、Score函數(shù)與觀察信息矩陣分別是為:

(2)

(3)

(4)

其中X=(x1,x2,…,xn)T,p=(p1,p2,…,pn)T,y=(y1,y2,…,yn)T,

W=diag(w1,w2,…wn),wi=pi(1-pi) .

本文主要研究(1)式的Logistic模型.

1 局部影響分析

局部影響分析是考慮模型的擾動而建立起來的統(tǒng)計(jì)診斷方法,它最早由Cook[2]提出,其后許多統(tǒng)計(jì)學(xué)家如Thomas and Cook[3], Escobar and Meeker[4]和 Poon and Poon[5]等發(fā)展了局部影響分析方法.在統(tǒng)計(jì)診斷研究中,該方法已被廣泛應(yīng)用于許多模型,例如韋博成等[1]分析了線性模型的局部影響,Thomas等[3]討論了非線性模型及廣義線性模型的情形,曾林蕊等[6]研究了半?yún)?shù)廣義線性模型的局部影響分析,解鋒昌等[7]研究了具有結(jié)構(gòu)變化的線性回歸模型的局部影響分析,呂敏紅等[8]研究了時(shí)間序列的局部影響分析.我們首先回顧 Cook 的局部影響分析方法的基本思想,然后將其應(yīng)用到Logistic模型,導(dǎo)出其局部影響分析的曲率度量及計(jì)算公式.

根據(jù)Cook[2],韋博成等[1]的討論,影響圖在ω0處d方向的影響曲率可表示為

Cd=2|dTFd|

(5)

2 Logistic模型的局部影響分析的曲率計(jì)算公式

上面介紹了局部影響分析的基本公式,下面我們將這些結(jié)果應(yīng)用到Logistic模型,討論常見的幾種擾動模式.

2.1 均值漂移擾動

考慮均值漂移擾動模型[9],擾動后模型的對數(shù)似然函數(shù)為

(6)

ω0=0表示對應(yīng)的似然函數(shù)沒有擾動.

由(5)式有

進(jìn)而得到影響曲率的計(jì)算公式為

Cd=2|dTFd|=2|dTWTX(XTWX)-1XTWd|

(7)

2.2 方差加權(quán)擾動

方差加權(quán)擾動模型[1]是研究影響分析的重要模型,經(jīng)擾動ω后的對數(shù)似然函數(shù)轉(zhuǎn)化為加權(quán)形式

(8)

其中

ω=(ω1,ω2,…,ωn)T,ω0=1表示無擾動.

于是,可算得

根據(jù)(5)式,得

進(jìn)而得到影響曲率的計(jì)算公式為

Cd=2|dTFd|=2|dTΛTX(XTWX)-1XTΛd|

(9)

2.3 自變量的擾動

假設(shè)擾動ω加在第i列,即Xi轉(zhuǎn)化為Xi(ω)=Xi+ω,在此擾動下,MSOM轉(zhuǎn)化為[1]

(10)

于是,對數(shù)似然函數(shù)可化為

其中l(wèi)i表示第i分量為1其他分量為0的p維向量.因此,在d方向上的影響曲率的計(jì)算公式為

2.4 因變量的擾動

因變量yi受到擾動變?yōu)閥i+ωi,i=1,2,…,n.其對數(shù)似然函數(shù)可表示為[10]

ω0=0表示對應(yīng)的似然函數(shù)沒有擾動.

進(jìn)而

于是

相應(yīng)影響曲率的計(jì)算公式為

Cd=2|dTFd|=2|dTX(XTWX)-1XTd| .

3 數(shù)值實(shí)例

資料為50位急性白血病人的生存時(shí)間y與在入院后取得的淋巴浸潤等級X1,出院后有無鞏固治療X2的關(guān)系[11].該數(shù)據(jù)曾被多次引用,我們用Logistic模型,根據(jù)R軟件擬合的結(jié)果,得到

在此基礎(chǔ)上,利用R軟件編程計(jì)算可得到局部影響圖(這里我們以影響矩陣的對角元的相反數(shù)為縱坐標(biāo),數(shù)據(jù)序號為橫坐標(biāo)).我們以前兩種擾動方式為例,得圖1.

圖1 局部影響圖

由圖(a)可知,第11,20,37,39,43,46號點(diǎn)由于漂移擾動而產(chǎn)生較大影響,是強(qiáng)影響點(diǎn);由圖(b)可知,第16,22,41號點(diǎn)由于加權(quán)擾動而成為強(qiáng)影響點(diǎn),另外第20,43,46號點(diǎn)影響也相對較大.

利用R軟件編程計(jì)算這兩種擾動下的影響矩陣的絕對值最大的特征值λ1及其相應(yīng)的特征向量dmax,得到擾動時(shí)dmax分量絕對值散點(diǎn)圖,如圖2所示,可以看出,與圖1中得到的結(jié)果完全一致.

圖2 擾動時(shí)|dmax|的散點(diǎn)圖

[1] 韋博成, 魯國斌,史建清. 統(tǒng)計(jì)診斷引論[M]. 南京: 東南大學(xué)出版社,1991.

[2] Cook R D. Assessment of local influence[J]. J R Statist Soc B,1986,48(3):133-169.

[3] Thomos W, Cook R D. Assessing influence on regression coefficients in generalized liner models[J].Biometrika,1989,76:741-749.

[4] Escobar L A, Meeker W Q. Assessing influence in regression analysis with censored data[J].Biometrics,1992,48:507-508.

[5] Poon W Y, Poon W S. Conformal normal curvature and assessment of local influence[J]. J R Statist, Soc B,1999,16(1):51-61.

[6] 曾林蕊,朱仲義. 半?yún)?shù)廣義線性模型的局部影響分析[J]. 華東師范大學(xué)學(xué)報(bào):自然科學(xué)版,2005(4):18-25.

[7] 解鋒昌,李愛萍,李勇. 具有結(jié)構(gòu)變化的線性回歸模型的局部影響分析[J]. 河海大學(xué)學(xué)報(bào):自然科學(xué)版,2005,33(6):717-720.

[8] 呂敏紅,郭鵬江. 時(shí)間序列的局部影響分析[J]. 西北大學(xué)學(xué)報(bào):自然科學(xué)版,2011,41(1):1-4.

[9] 熊加兵. 帶右刪失數(shù)據(jù)非線性模型的統(tǒng)計(jì)分析[D]. 揚(yáng)州:揚(yáng)州大學(xué),2007.

[10] 謝書培,韓俊林. Logistic回歸模型的統(tǒng)計(jì)診斷與實(shí)例分析[J]. 聊城大學(xué)學(xué)報(bào),2011, 24(1):27-31.

[11] 薛毅,陳立萍. R軟件建模與R軟件[M]. 北京:清華大學(xué)出版社,2007.

[責(zé)任編輯:李春紅]

LocalInfluenceofLogisticModel

GUANG Lin

(Lianyungang Branch of Finance and Economics, Jiangsu Union Technical Institute, Lianyungang Jiangsu 222003, China)

This paper systematically discusses the local influence of Logistic statistical model by use of the curvature method. The counting formulas of curvature for mean shift perturbation, case weights perturbation, arguments perturbation and the dependent varible perturbation are derived. At last, a case study are given to illustrate our results.

Logistic mode; local influence;curvature;perturbation

O212.1

A

1671-6876(2012)02-0129-05

2012-02-29

光琳(1980-), 男, 河南靈寶人, 講師, 碩士研究生, 研究方向?yàn)楦怕逝c數(shù)理統(tǒng)計(jì).

猜你喜歡
計(jì)算公式對數(shù)曲率
大曲率沉管安裝關(guān)鍵技術(shù)研究
一類雙曲平均曲率流的對稱與整體解
電機(jī)溫升計(jì)算公式的推導(dǎo)和應(yīng)用
含有對數(shù)非線性項(xiàng)Kirchhoff方程多解的存在性
指數(shù)與對數(shù)
指數(shù)與對數(shù)
半正迷向曲率的四維Shrinking Gradient Ricci Solitons
2019離職補(bǔ)償金計(jì)算公式一覽表
對數(shù)簡史
Esn+1中具有至多兩個(gè)不同主曲率的2-調(diào)和超曲面
霞浦县| 望江县| 蒙阴县| 象州县| 木兰县| 清涧县| 资溪县| 大石桥市| 云南省| 冀州市| 苏州市| 沐川县| 渝中区| 汉阴县| 沙湾县| 巍山| 武胜县| 姚安县| 嘉鱼县| 化德县| 南江县| 寿光市| 湖北省| 琼结县| 平塘县| 乐陵市| 黑山县| 凤庆县| SHOW| 蓬溪县| 永嘉县| 双牌县| 周至县| 永和县| 西平县| 阿克| 新巴尔虎左旗| 隆林| 铜川市| 连城县| 秦皇岛市|