高鵬麗,夏志明
(西北大學(xué) 數(shù)學(xué)學(xué)院,陜西 西安 710127)
經(jīng)驗似然最早是由Owen[1]提出的,這一方法與經(jīng)典的統(tǒng)計方法相比較有很多突出的優(yōu)點。因此,這一方法被統(tǒng)計學(xué)家們應(yīng)用到各種統(tǒng)計模型及各種領(lǐng)域。如Owen[2]和Chen[3]將其應(yīng)用到線性回歸模型的統(tǒng)計推斷;Zhu和Xue[4]發(fā)展了部分線性模型的經(jīng)驗似然;Liu[5]等應(yīng)用經(jīng)驗似然方法研究了兩個維樣本的不同均值的結(jié)構(gòu)置信域。Zou[6]等基于經(jīng)驗似然應(yīng)用非參數(shù)方法檢測來自獨立隨機變量序列的變點。Einmahl和McKeague[7]基于殘差利用經(jīng)驗似然檢驗一組獨立的時間序列中是否至多只有一個變點。近來,Kitamura[8]等將經(jīng)驗似然應(yīng)用到經(jīng)濟模型的研究中;Zou[9]等將經(jīng)驗似然方法應(yīng)用到了多元變點問題中。但是至今沒有人研究過將經(jīng)驗似然應(yīng)用于由于誤差發(fā)生變化的分段線性模型中。
(1)
這里xi∈Rd,i=1,…,n是非隨機的,β∈Rd是未知系數(shù)向量,{ei}是獨立隨機誤差序列,滿足Eei=0,k的位置已知,分布函數(shù)F和G未知。模型(1)可寫成如下矩陣形式
Y=Xβ+e,
其中
X=(x1,x2,…,xn)T,Y=(y1,y2,…,yn)T,
β=(β1,β2,…,βd)T,
e=(e1,e2,…,ek,ek+1,…,en)T。
為了證明后面的定理,先給出如下假設(shè)和引理。
假設(shè)4當n→∞,有k→∞,n-k→∞。
引理1 對k→∞,有:
證明因為
由假設(shè)1-2,有
更進一步
本文的目的是構(gòu)造一個檢驗方法,基于模型(1)檢驗分段線性模型中兩組誤差之間是否存在差異,于是考慮如下假設(shè)檢驗問題
H0:F(t)=G(t)?H1:F(t)≠G(t),t∈(-∞,∞)。
為了得到殘差,我們首先給出回歸系數(shù)β的最小二乘估計如下:
定理1對模型(1),如果假設(shè)1-4成立,當n→∞時,在H0成立的條件下有下面結(jié)論成立。
證明不失一般性,我們只證明結(jié)論(i).根據(jù)定義,有
因此可以得到
由假設(shè)1-4和引理1,有
同理,結(jié)論(ii)也成立。
定理2對模型(1),在假設(shè)1-4下,當H0成立時,有
證明由Glivenko-Cantelli定理有
再結(jié)合定理1,知定理2的結(jié)論顯然成立。
本文考慮誤差來自兩個獨立總體的檢驗問題,求得到經(jīng)驗似然比統(tǒng)計量值后,為根據(jù)檢驗水平去決定臨界值,需要求出統(tǒng)計量在原假設(shè)成立時的分布。但在一般情況下,很難得到統(tǒng)計量的精確分布,此時可以求出它的漸近分布近似的決定臨界值。
類似的,在H0下的非參數(shù)最大似然函數(shù)為
定義局部經(jīng)驗似然比為
(2)
給(2)式兩邊同時取對數(shù)就可以得到對數(shù)局部經(jīng)驗似然比為
則經(jīng)驗似然比函數(shù)為
(3)
定理3 在H0成立的條件下, 當假設(shè)1-4成立時,有
其中B是一個標準的布朗橋。
(4)
和
(5)
在δ上一致成立。下面我們首先證(4)式。由于δ≤y≤1-δ,通過泰勒展開,有
考慮(4)式就相當于考慮
(6)
(7)
引理3[12-15]在引理2的條件下, 存在一個標準的布朗橋序列{Bn}滿足
只考慮求和的第一項, 第二項很容易處理。由引理2可知第一項以很高的概率在區(qū)域上一致有上界
由引理3,有
基于殘差序列,類似的定義
相應(yīng)的局部經(jīng)驗似然比定義為
(8)
給(8)式兩邊同時取對數(shù)得到對數(shù)局部經(jīng)驗似然比為
因此經(jīng)驗似然比檢驗統(tǒng)計量為
定理4 在H0成立的條件下,當假設(shè)1-4成立時,有
(9)
證明證明(9)等價于證明
由于
先考慮求和的第一項, 第一項可以化簡為
(10)
由定理1以及隨機變量的連續(xù)函數(shù)的收斂性可知(10)式依概率收斂于0,同理可證求和的第二、三、四項均依概率收斂于0。因此有
即
定理5在H0成立的條件下,當假設(shè)1-4成立時,有
證明由定理3、定理4以及Slutsky定理知
表1 統(tǒng)計量經(jīng)驗分布各分位數(shù)、均值、方差對應(yīng)值
表2 統(tǒng)計量漸近分布各分位數(shù)、均值、方差對應(yīng)值
用R語言計算得到
D=0.036,P=0.149 7,
本文通過經(jīng)驗似然的方法基于殘差分析了分段線性模型中兩組誤差的對比檢驗。在原假設(shè)下成立的條件下,構(gòu)造了經(jīng)驗似然比統(tǒng)計量,并求出了統(tǒng)計量依分布收斂的漸近分布。但是未能給出其收斂速度,這有待后邊更進一步研究。文章最后進行Monte Carlo 模擬,驗證理論的正確性。結(jié)果表明對于分布相同的兩組誤差,當樣本量較大時,統(tǒng)計量的經(jīng)驗分布與漸近分布擬合較好。