范梓淼, 田夢(mèng)琴
(新疆農(nóng)業(yè)大學(xué) 數(shù)理學(xué)院,新疆 烏魯木齊 830052)
變點(diǎn)問(wèn)題是統(tǒng)計(jì)學(xué)中的熱門研究方向,在金融、醫(yī)學(xué)、氣象學(xué)和計(jì)算機(jī)領(lǐng)域等方面有廣泛地應(yīng)用。該問(wèn)題源于質(zhì)量檢測(cè)與監(jiān)控。現(xiàn)今,變點(diǎn)的應(yīng)用不再局限于工業(yè)質(zhì)量的檢測(cè)中,更廣泛地被應(yīng)用于經(jīng)濟(jì)、醫(yī)學(xué)、計(jì)算機(jī)等領(lǐng)域。[1]例如,在醫(yī)學(xué)中,心電圖韻律的檢測(cè)及流行病中傳染病的傳染率檢測(cè);計(jì)算機(jī)領(lǐng)域中,圖像識(shí)別和圖形邊界的判斷等都依賴于變點(diǎn)的發(fā)展使用。另外,在生態(tài)環(huán)境和突發(fā)災(zāi)難方面,變點(diǎn)研究方法也發(fā)揮著重大作用。因此對(duì)變點(diǎn)問(wèn)題的深入研究有著重大意義。
泊松過(guò)程由法國(guó)數(shù)學(xué)家Poisson Simeon-Denis首先提出的,是一個(gè)時(shí)間連續(xù)狀態(tài)離散隨機(jī)過(guò)程,是記錄隨機(jī)事件發(fā)生次數(shù)累加的獨(dú)立增量過(guò)程[2]。泊松過(guò)程不僅是作為計(jì)數(shù)過(guò)程的重要隨機(jī)過(guò)程模型,也是重要隨機(jī)過(guò)程的特例,且通過(guò)泊松過(guò)程可以構(gòu)造其他獨(dú)立增量過(guò)程,所以其在隨機(jī)過(guò)程中占重要位置。研究泊松過(guò)程變點(diǎn)問(wèn)題,也為進(jìn)一步研究隨機(jī)過(guò)程奠定了一定基礎(chǔ),是有意義的。本文基于泊松過(guò)程,采用U統(tǒng)計(jì)量方法研究參數(shù)變點(diǎn)的假設(shè)檢驗(yàn)問(wèn)題。
U統(tǒng)計(jì)量是由W.Hoeffding于1948年引入統(tǒng)計(jì)學(xué)研究中的,它被廣泛地應(yīng)用于非參數(shù)統(tǒng)計(jì)學(xué)研究中??姲仄?、魏登云通過(guò)U統(tǒng)計(jì)量研究了刻度參數(shù)變點(diǎn)的統(tǒng)計(jì)推斷[3-5];Horváth通過(guò)U統(tǒng)計(jì)量討論了分布函數(shù)的變點(diǎn)問(wèn)題[6];Cs?rg?,M,Orasch等在變點(diǎn)問(wèn)題研究的其他應(yīng)用中都使用了U統(tǒng)計(jì)量[7]。
U統(tǒng)計(jì)量的定義為:設(shè)X1,X2,…,Xn為獨(dú)立隨機(jī)變量,φ(x1,x2,…,xm)為其某一對(duì)稱函數(shù),mn。則以φ(x1,x2,…,xm)為核構(gòu)造的統(tǒng)計(jì)量
稱為U統(tǒng)計(jì)量。
X1,X2,…Xτ0~P(λ1),X(τ0+1),…Xn~P(λ2)
(1)
其中P(λ)為參數(shù)λ的泊松過(guò)程。
關(guān)于泊松過(guò)程變點(diǎn)的問(wèn)題可以化為如下假設(shè)檢驗(yàn)問(wèn)題:
H0:λ1=λ2vsH1:λ1≠λ2
(2)
為敘述方便,首先給出以下定義
設(shè)X1,X2,…,Xmi.i.d~F,Y1,Y2,…,Yni.i.d~G,
對(duì)于對(duì)稱函數(shù)φ(x1,x2,…,xm;y1,y2,…,yn),定義
φij(X1,X2,…,Xi;Y1,Y2,…,Yj)=E[φ(X1,X2,…,Xm;Y1,Y2,…,Yn)|X1,X2,…,Xi;Y1,Y2,…,Yj],
σij2=Varφij(X1,X2,…,Xi;Y1,Y2,…,Yj),1im,1jn。
定理1 若X1,X2,…,Xn為來(lái)自泊松過(guò)程的獨(dú)立隨機(jī)變量,定義
若k滿足
(3)
為了證明定理1,需指出以下引理。
引理1[8]設(shè)隨機(jī)變量X1,X2,…,Xn,i.i.d.~F,Var(X1)<,φ(x,y)為R2上的二元可測(cè)函數(shù),且|φ(x,y)|bEφ(Xi,Xj)=0,i≠j。
則存在常數(shù)C>0,對(duì)?ε>0,當(dāng)m充分大時(shí),
引理2[8]設(shè)X1,X2,…,Xni.i.d~F,φ(x,y)為R2上的二元可測(cè)函數(shù),且
|φ(x,y)|b,Eφ(Xi,Xj)=0,i≠j,Eφ(Xi,Xj|Xi)=0。
設(shè)Un是以φ(x,y)為核的U型統(tǒng)計(jì)量,則對(duì)?ε>0,δ>0,當(dāng)n充分大時(shí),有
由Uk的定義知
-φ01(Xj1)-φ01(Xj2)+φ10(Xi1)+φ10(Xi2)+φ01(Xj1)+φ01(Xj2)]
?U1+U2
定理2 若n和k滿足定理1的條件(3),則
證明:
-φ12(Xi2;Xj1,Xj2)+φ12(Xi1;Xj1,Xj2)+φ12(Xi2;Xj1,Xj2)+φ02(Xj1,Xj2)-φ10(Xi1)-φ10(Xi2)
-φ01(Xj1)-φ01(Xj2)]
-φ12(Xi1;Xj1,Xj2)]
由φ(Xi1,Xi2;Xj1,Xj2)定義知,|φ(x,y)|
∴當(dāng)Xk+1,Xk+2,…,Xn給定時(shí),由引理2可得,
同理,當(dāng)X1,X2,…,Xk給定時(shí),
由引理1
U14和U15符合引理2條件,所以有,
∴存在c(ε),使得
由定理1條件知,當(dāng)n充分大時(shí),上述不等式右邊小于n-2,由Borel-Cantelli引理知,該定理成立。
其中c>0為任一常數(shù)。
引理4[8]若{Z(t),t≥0}為一平穩(wěn)高斯過(guò)程,且
ρ(τ)=E[Z(t)Z(t+τ)]=1-|τ|+ο(|τ|),τ→0
定理1證明:
由定義知
設(shè){B(t),t≥0}為標(biāo)準(zhǔn)布朗運(yùn)動(dòng),進(jìn)行如下運(yùn)算,有
由引理4和定理?xiàng)l件,有
作高斯過(guò)程Z(t)=B(t)-B(t-1),易知Z(t)為平穩(wěn)過(guò)程,
EZ(t)=0
及
∴由引理5,可得
綜上,
該定理給出了檢驗(yàn)假設(shè)模型(2)的方法,假設(shè)給定顯著性水平為α。由
exp{-2e-x}=1-α,
解得
那么當(dāng)且僅當(dāng)
時(shí),拒絕原假設(shè),也就是接受有變點(diǎn)。
本文構(gòu)造適應(yīng)于泊松過(guò)程的檢驗(yàn)統(tǒng)計(jì)量,并證明了該檢驗(yàn)統(tǒng)計(jì)量的極限分布為第一型極限分布。如果令k從小到大增加,則|Uk|會(huì)增大,當(dāng)?shù)竭_(dá)變點(diǎn)位置τ0時(shí),|Uk|應(yīng)該會(huì)出現(xiàn)最大值;如果k繼續(xù)增大,|Uk|又會(huì)減小,因此,參數(shù)變點(diǎn)位置的估計(jì)可選取使得檢驗(yàn)統(tǒng)計(jì)量最大的點(diǎn)作為。
變點(diǎn)分析理論在科學(xué)研究和實(shí)踐應(yīng)用等方面都有著快速的發(fā)展。變點(diǎn)問(wèn)題的統(tǒng)計(jì)推斷就是根據(jù)具體的背景,對(duì)變點(diǎn)做出估計(jì),并對(duì)估計(jì)量的性質(zhì)進(jìn)行統(tǒng)計(jì)分析。本文在泊松過(guò)程模型下,對(duì)其參數(shù)的變點(diǎn)進(jìn)行假設(shè)檢驗(yàn),在存在變點(diǎn)的情形下,對(duì)變點(diǎn)位置做出了估計(jì)。對(duì)深入研究泊松過(guò)程有一定的幫助。