秦瑞兵,趙姣
(山西大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,山西 太原 030006)
變點(diǎn)問(wèn)題最初由Page[1]提出,由于變點(diǎn)問(wèn)題可以快速地監(jiān)測(cè)到系統(tǒng)在任意時(shí)刻出現(xiàn)的變點(diǎn)并發(fā)出預(yù)警,避免決策上的失誤,對(duì)減小損失,降低風(fēng)險(xiǎn)具有重要意義,因此從最初的產(chǎn)品質(zhì)量控制領(lǐng)域逐步擴(kuò)展到金融、氣候、流行病學(xué)、信號(hào)過(guò)程和智能導(dǎo)航等領(lǐng)域。Küchenhoff等[2]用帶有變點(diǎn)的趨勢(shì)回歸模型對(duì)時(shí)間序列進(jìn)行分析,進(jìn)而估計(jì)德國(guó)新冠病毒某一天發(fā)病的病例數(shù)。Basalamah等[3]研究了線性回歸模型下的正態(tài)分布誤差在檢測(cè)回歸參數(shù)變化時(shí)的情形,提出一種基于修正信息準(zhǔn)則的檢測(cè)方法來(lái)定位變點(diǎn),該程序應(yīng)用于美國(guó)國(guó)家航空航天局的數(shù)據(jù)來(lái)說(shuō)明探測(cè)過(guò)程。
陳希孺[4]與Perron等[5]介紹了有關(guān)變點(diǎn)理論的研究與發(fā)展。Li等[6]針對(duì)分段平穩(wěn)向量自回歸過(guò)程,提出了一種三步法檢測(cè)多重結(jié)構(gòu)突變,用于多元時(shí)間序列變點(diǎn)估計(jì)。Shi等[7]用基于秩的回歸方法對(duì)于多變點(diǎn)連續(xù)分段線性回歸模型去同時(shí)估計(jì)回歸系數(shù)和閾值的位置,實(shí)現(xiàn)了魯棒性。Lu等[8]將模糊變點(diǎn)算法與M估計(jì)相結(jié)合實(shí)現(xiàn)了回歸模型中的變點(diǎn)和回歸參數(shù)的魯棒估計(jì)。Brown等[9]提出了在變點(diǎn)理論廣為應(yīng)用的CUSUM統(tǒng)計(jì)量和CUSQ統(tǒng)計(jì)量。Sen[10]導(dǎo)出基于遞歸殘差的CUSUMrec統(tǒng)計(jì)量的極限分布為一個(gè)加權(quán)維納過(guò)程的最大值,即使回歸模型的自變量包含因變量滯后項(xiàng)滯后,該統(tǒng)計(jì)量的極限分布仍然正確,Ploberger和Kr?mer[11]考慮用最小二乘回歸殘差代替遞歸殘差構(gòu)造了CUSUMols統(tǒng)計(jì)量,此統(tǒng)計(jì)量除了在變點(diǎn)發(fā)生時(shí)刻靠前的情形功效并不高之外,相較于CUSUMrec統(tǒng)計(jì)量,對(duì)于變點(diǎn)發(fā)生時(shí)刻靠后的情形功效有較大提高。對(duì)此Brown[9]基于遞歸回歸殘差平方序列,構(gòu)造 CUSQrec統(tǒng)計(jì)量,Ploberger和 Kr?mer[12]導(dǎo)出了 CUSQrec統(tǒng)計(jì)量的極限分布。Deng與Perron[13]在一般混合條件下得到了CUSQrec統(tǒng)計(jì)量和CUSQols統(tǒng)計(jì)量的極限分布,對(duì)文獻(xiàn)[12]CUSQ統(tǒng)計(jì)量的極限分布做了系數(shù)修正,得到CUSQ統(tǒng)計(jì)量的極限分布為一個(gè)布朗橋過(guò)程的最大值。Ploberger和Kr?mer[14]考慮了CUSUM統(tǒng)計(jì)量和CUSQ統(tǒng)計(jì)量的局部勢(shì)函數(shù),得出CUSQ統(tǒng)計(jì)量有很小的漸近局部勢(shì)而CUSUM統(tǒng)計(jì)量有較大的漸近局部勢(shì),除非變點(diǎn)的系數(shù)偏移量正交于解釋變量的均值向量,但由于局部性質(zhì)對(duì)于發(fā)生較大偏移的情形并不適用,Deng與Perron[5]考慮了CUSUM統(tǒng)計(jì)量和CUSQ統(tǒng)計(jì)量的非局部勢(shì)函數(shù)的性質(zhì),表明CUSQ統(tǒng)計(jì)量在非局部的情形下有較高的功效?;谝陨戏椒?,Nielsen和Sohkanen[15]將CUSQ檢驗(yàn)統(tǒng)計(jì)量推廣到具有確定性時(shí)間趨勢(shì)的非平穩(wěn)自回歸分布滯后模型,將漸近理論更廣泛地應(yīng)用于最小二乘殘差的檢驗(yàn)。
但是當(dāng)變點(diǎn)發(fā)生時(shí)刻靠前時(shí),遞歸殘差的CUSQ檢驗(yàn)功效較低。本文將遞歸殘差序列分為兩組,比較兩組遞歸殘差平方的算術(shù)平均值,構(gòu)建檢驗(yàn)統(tǒng)計(jì)量,推導(dǎo)其漸近分布,并得到其在備擇假設(shè)下的漸近極限。模擬結(jié)果表明本文構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量比已有統(tǒng)計(jì)量在變點(diǎn)發(fā)生時(shí)刻靠前的情形功效有較大提高。
本節(jié)通過(guò)數(shù)值模擬來(lái)分析本文所給方法的有限樣本性質(zhì),并與文獻(xiàn)[5]中的方法進(jìn)行比較。首先生成120個(gè)獨(dú)立同分布的標(biāo)準(zhǔn)正態(tài)隨機(jī)數(shù),代入統(tǒng)計(jì)量(5)中,重復(fù)該試驗(yàn)5 000次,可以計(jì)算得到顯著水平α=0.05的臨界值為8.470 2。為方便與文獻(xiàn)[5]比較,考慮用模型(1)生成數(shù)據(jù):xt={x1t,x2t}={1,(-1)t}′,備擇假設(shè)中系數(shù) βt的變化由 δ=b[cos(φ),sin(φ)]′來(lái)確定,其中 φ 是 δ和 xt的均值向量的夾角,分別取值為 φ=0?,45?,90?,λ取 0.3,0.5,0.7,ut為標(biāo)準(zhǔn)正態(tài)隨機(jī)數(shù)列。表1上部分為文獻(xiàn)[5]中的實(shí)驗(yàn)結(jié)果,下部分為本文中方法重復(fù)試驗(yàn)5 000次中統(tǒng)計(jì)量拒絕原假設(shè)頻率保留兩位小數(shù)的結(jié)果。對(duì)比表1上下兩部分,可以看到:(1)本文構(gòu)建的統(tǒng)計(jì)量在原假設(shè)成立時(shí),其經(jīng)驗(yàn)水平更接近檢驗(yàn)的顯著水平0.05;(2)當(dāng)變點(diǎn)發(fā)生在序列早期時(shí),本文的統(tǒng)計(jì)量比傳統(tǒng)的基于遞歸回歸殘差的CUSQ統(tǒng)計(jì)量具有較高的功效。當(dāng)變點(diǎn)發(fā)生在序列后期時(shí),本文方法的功效也均高于或等于已有基于遞歸回歸殘差的CUSQ統(tǒng)計(jì)量。這與定理2的結(jié)論相吻合。
表1 檢驗(yàn)統(tǒng)計(jì)量的功效Table 1 Power of the test statistics
本文所構(gòu)造的統(tǒng)計(jì)量對(duì)犯第一類錯(cuò)誤的概率與選定的顯著水平0.05更接近,同時(shí),在檢驗(yàn)有限樣本下有更高的功效。在變點(diǎn)發(fā)生時(shí)刻靠后的情形下,功效也逐漸趨于1,對(duì)于變點(diǎn)發(fā)生時(shí)刻靠前的情形,較已有統(tǒng)計(jì)量有更高的功效。
但本文僅考慮誤差為正態(tài)分布的情形,未考慮誤差為非正態(tài)分布的情形以及誤差具有相依性的情形。如何基于遞歸殘差和最小二乘回歸殘差構(gòu)造適合于誤差是非正態(tài)分布和誤差之間具有相依性情形下線性回歸模型系數(shù)變點(diǎn)檢驗(yàn)問(wèn)題上,有待進(jìn)一步研究。