秦瑞兵,孫 麗,宋冠儀
(1.山西大學 數(shù)學科學學院,山西 太原 030006;2.山東大學 數(shù)學學院,山東 濟南 250100)
近年來很多領(lǐng)域存在變點問題,有關(guān)突變點理論應(yīng)用從最初由Page[1]提出在產(chǎn)品質(zhì)量控制領(lǐng)域擴寬到在金融等領(lǐng)域,如Hoga[2]提出的在線監(jiān)測多元時間序列在金融上的應(yīng)用.而快速地監(jiān)測到一任意時刻出現(xiàn)的變點并報警,對于減小損失,降低風險具有重要意義.
陳希孺[3]與Perron[4]介紹了有關(guān)變點理論的研究與發(fā)展.有關(guān)線性過程的變點估計問題,Bai[5]基于最小二乘估計提出其均值變點的估計.趙文芝等[6]則給出了其方差變點的CUSUM型估計量.隨后Zhao等[7]提出采用比率統(tǒng)計量檢測線性過程的方差變點.
由實時監(jiān)測時歷史數(shù)據(jù)不斷產(chǎn)生,Chu等[8]提出在線監(jiān)測方法,即在原模型的基礎(chǔ)上,對在線數(shù)據(jù)連續(xù)進行變點檢驗,當監(jiān)測統(tǒng)計量的值超過給定極限臨界值時停止且當前時刻為變點,否則一直監(jiān)測下去.Cs?rg?等[9]提出的變點分析的極限理論也為變點的研究奠定了理論基礎(chǔ).Deng等[10]證明了CUSQ統(tǒng)計量在一般假設(shè)下的極限分布.
但上述文獻[11-13]中監(jiān)測方法的準確度和運行長度均依賴于初始樣本中的長期方差的估計,故據(jù)文獻[16-18]監(jiān)測統(tǒng)計量思考,并基于回歸殘差的平方累積和統(tǒng)計量,提出兩種比值型監(jiān)測統(tǒng)計量,避免了文獻[11-13]中變點監(jiān)測統(tǒng)計量的樣本長期方差的估計,進而提高監(jiān)測穩(wěn)定性.
考慮如下線性回歸模型:
(1)
假設(shè)前[Tr]個歷史樣本滿足βi=β0,1≤i≤[Tr],r∈(0,1).從第[Tr]+1個新樣本數(shù)據(jù)開始在線監(jiān)測系數(shù)變點,提出如下假設(shè)檢驗問題:
H0:βi=β0,i=[Tr]+1,[Tr]+2,…
(2)
(3)
其中s*∈(0,1),模型系數(shù)β0,β*,(β0≠β*)和變點的值均未知.
由下節(jié)定義的兩個監(jiān)測統(tǒng)計量Γ1(r),Γ2(r)及其相應(yīng)的顯著性水平為α的臨界值c1(α),c2(α)定義停時
τ([Tr])=inf{[Ts]>1:Γ1,2(r)>c1,2(α)}其中c1,2(α)滿足原假設(shè)下lim[Tr]→∞P{τ([Tr])<∞}=α與備擇假設(shè)下lim[Tr]→∞P{τ([Tr])<∞}=1.
基于文獻[11-13]的假設(shè),為證明監(jiān)測統(tǒng)計量漸近性質(zhì)及備擇假設(shè)下的一致性,線性回歸模型需滿足如下假設(shè)條件:
{εi,1≤i<∞}獨立同分布.
(4)
(5)
(6)
{εi,1≤i<∞},{xi,1≤i<∞}相互獨立.
(7)
存在正定陣C和常數(shù)τ>0使得
(8)
構(gòu)造一般殘差平方和函數(shù):
1≤[Tt]≤[Tr],t∈(0,1).
1≤[Tt]≤[Tr]+[Ts],s∈(0,1).
[Ts]+1≤[Tt]≤[Tr]+[Ts],s∈(0,1).
并據(jù)此構(gòu)造下列兩個比值型監(jiān)測統(tǒng)計量:
Γ1(r)=
Γ2(r)=
定理1若假設(shè)(4)~(8)成立,則在原假設(shè)(2)下,當T→∞時有Γ1(r)?γ1(r),
證明:設(shè)
(9)
若假設(shè)(4)~(8)成立,則在原假設(shè)(2)下,當T→∞時,由文獻[10]中CUSQ漸近分布證得
(10)
(11)
由式(9)~(11)及連續(xù)映照定理得證定理1.
定理2若假設(shè)(4)~(8)成立,則在備擇假設(shè)(3)下,當T→∞時有Γ1(r)→∞.
證明:由(7)及中心極限定理,得
從而滿足備擇假設(shè)(3)時有
2[Tr]-1/2(β*-β0).
(β*-β0)2Op(1)>0
(12)
(β*-β0)2Op(1)>0
(13)
由式(9)、(10)、(12)、(13)得證定理2.
第二個監(jiān)測統(tǒng)計量也有類似的結(jié)論.
定理3若假設(shè)(4)~(8)成立,則在原假設(shè)(2)下,當T→∞時有Γ2(r)?γ2(r),
γ2(r)=
證明:同定理1的證明,
(14)
由式(9)、(10)、(14)及連續(xù)映照定理得證定理3.
定理4若假設(shè)(4)~(8)成立,則在備擇假設(shè)(3)下,當T→∞時有Γ2(r)→∞.
通過數(shù)值模擬檢驗方法的有限樣本性質(zhì).表1列出了用10 000個標準正態(tài)分布的歷史樣本及歷史樣本量與監(jiān)測樣本量比值r取0.1,0.2,0.3,0.4,0.5時經(jīng)1 000次循環(huán)得到的檢驗水平α=0.05的臨界值.
表1 兩個監(jiān)測統(tǒng)計量的臨界值表
采用文獻[11]的模型及假設(shè)β0i=0,β1i=0生成數(shù)據(jù),歷史樣本量[Tr]取200,監(jiān)測樣本q分別取0.5-1[Tr],0.4-1[Tr],0.3-1[Tr],0.2-1[Tr],0.1-1[Tr]時,在α=0.05檢驗水平下做模擬.在表2中,經(jīng)驗水平隨著r取值逐漸上升.固定r值時,歷史樣本量與監(jiān)測樣本量的比值較大于r時結(jié)果更趨近于檢驗水平.而該比值小于r時Γ1,2(r)經(jīng)驗水平漸失真,此時樣本量相對較小,參數(shù)的估計殘差平方和比值較不準確.
表2 兩個監(jiān)測統(tǒng)計量的經(jīng)驗水平(百分數(shù))
由表3和表4比較參數(shù)變化時的檢驗勢和平均運行長度,并判斷是否快速監(jiān)測到變點.顯然,Γ1(r)比Γ2(r)監(jiān)測變點時的power較高,且在部分情況下ARL較短.用不同r值的臨界值監(jiān)測時,不同位置的變點監(jiān)測模擬結(jié)果power都較文獻[13]更趨近于1.這表明去除了估計樣本標準差產(chǎn)生的誤差提高了監(jiān)測精確度.同時在變點時刻靠后時,該方法仍能監(jiān)測到變點,但ARL稍長.
表3 截距項在[Ts*]處由0變?yōu)?時的power與ARLs(百分數(shù))
表4 斜率在[Ts*]處由0變?yōu)?.4時的power與ARLs(百分數(shù))
續(xù)表4
模擬結(jié)果表明,比值型監(jiān)測統(tǒng)計量對檢驗勢和監(jiān)測結(jié)果的穩(wěn)定性都有了較大改進,對監(jiān)測變點時刻靠后情況的效果也有所改進.在實際數(shù)據(jù)監(jiān)測時,由于無法判定可能出現(xiàn)變點的時期,可取r=0.1時的臨界值監(jiān)測,以便在監(jiān)測較多樣本量時控制好犯第一類錯誤,且盡可能的減小監(jiān)測到變點的延遲時間.
圖1(a)給出2016年9月12日至2018年1月18日IBM股票收盤價格,圖1(b)是其波動不均勻的一階差分數(shù)據(jù).取前200個樣本為歷史數(shù)據(jù),在顯著性水平α=0.05下,用文中監(jiān)測統(tǒng)計量監(jiān)測變點,Γ1(r),Γ2(r)均在[Ts*]=78處監(jiān)測到變點.而用文獻[13]的方法則監(jiān)測不到變點,表明新方法能夠盡快且準確監(jiān)測到變點.
(a)收盤價格
(b)一階差分圖1 IBM股票收盤價格及其一階差分數(shù)據(jù)
文章研究了線性回歸模型系數(shù)變點的在線監(jiān)測問題,在很多學者研究的基礎(chǔ)上,提出了兩個基于回歸殘差的平方累積和的比值型監(jiān)測統(tǒng)計量,給出其極限分布與一致性的證明.通過數(shù)值模擬與實例分析,新的監(jiān)測統(tǒng)計量有效提高了檢驗勢與監(jiān)測結(jié)果的穩(wěn)定性,對變點出現(xiàn)時刻靠后情況的監(jiān)測結(jié)果有所改進.但關(guān)于如何縮短監(jiān)測的平均運行長度,仍需進一步研究.