梅夢玲, 周菊玲, 董翠玲
(新疆師范大學 數(shù)學與科學學院,烏魯木齊 830017)
變點(change point)指的是某一位置或時刻在此前后觀測值或數(shù)據(jù)遵循兩個不同的模型. 變點問題是近幾年統(tǒng)計方向研究中比較熱門的話題,主要應用于質(zhì)量控制、水文統(tǒng)計、金融經(jīng)濟、地震預測等領(lǐng)域. 目前變點分析方法主要有極大似然法、最小二乘法、貝葉斯法和非參數(shù)方法等. 關(guān)于變點問題,國內(nèi)外的學者進行了深入研究,James B J[1]在1992 年對多元正態(tài)分布位置參數(shù)的變點用似然比檢驗做了假設(shè)檢驗;Kokoszka 和Leipus[2]在1998 年用累積和方法檢測了ARCH 模型中的均值變點,證明了CUSUM 統(tǒng)計量的一致性;陳希孺[3]在1988 年研究了序列中只有一個變點的情況;1991年陳希孺[4]還在變點系列文章中介紹了基本理論及其常用的方法,如最小二乘法、局部比較法、Bayes法等,并對這些方法進行了舉例說明. 近些年來,關(guān)于隨機截尾試驗的研究比較多,帶有不完全信息隨機截尾試驗(random censoring test with incomplete information,簡稱IIRCT)由Elperin T I,Gertsbakh I B[5]首次研究,后來又有許多學者對IIRCT下壽命分布的參數(shù)估計問題進行了深入研究[6-11]. 指數(shù)分布是概率統(tǒng)計中一種重要的分布,關(guān)于指數(shù)變點問題的研究也有很多,胡興[12]研究了完全數(shù)據(jù)下單參數(shù)指數(shù)族分布參數(shù)單變點的貝葉斯估計;彭秋曦[13]研究了左截斷右刪失數(shù)據(jù)下指數(shù)分布單變點和多變點的Bayes估計;黃月蘭[14]使用了最小二乘法、極大似然法和貝葉斯法三種方法對指數(shù)分布變點問題進行研究;王黎明[15]研究了雙參數(shù)指數(shù)分布的變點問題. 變點問題在實際應用中也很廣泛,雷鳴等[16]、馮娜[17]、周影輝等[18]研究了不同情況下上證指數(shù)的變點問題;廖遠甦[19]利用方差多變點分析技術(shù)對SARS疫情的研究;許歡[20]基于ASAMC算法對氣象數(shù)據(jù)的變點進行估計. 本文主要是通過添加缺失數(shù)據(jù),得到完全似然函數(shù),然后基于MCMC方法研究了IIRCT下指數(shù)分布的多變點模型的參數(shù)估計問題.
指數(shù)分布多變點模型如下:
當αi=1,βi=1時,
當αi=0時,
利用逆變換法可以產(chǎn)生z1i,利用篩選法產(chǎn)生z2i,由于λ1,λ2,λ3的滿條件分布是伽馬分布,所以這三個參數(shù)可以直接利用Gibbs抽樣,而k1,k2的滿條件分布比較復雜,不能直接用Gibbs抽樣,所以利用Metropolis-Hastings算法進行抽樣.
下面給出MCMC方法的具體步驟.
其中:m=1,2;j=1,2,3 .
令n=200,取真實值(k1,k2,λ1,λ2,λ3)=(50,150,3,8,5),取λ1,λ2,λ3的先驗分布分別為gamma(6,2),gamma(8,1.2),gamma(15,2.6). yi服從指數(shù)分布,且參數(shù)為0.5,假設(shè)顯示概率a=0.8,取M=20 000,B=10 000.參數(shù)的貝葉斯估計見表1.
表1 參數(shù)k1,k2,λ1,λ2,λ3 的貝葉斯估計Tab.1 Bayesian estimation of parameters k1,k2,λ1,λ2,λ3
變點位置參數(shù)的Gibbs抽樣迭代過程見圖1和圖2.
圖1 參數(shù)k1 的Gibbs抽樣迭代過程Fig.1 Gibbs sampling iteration process of parameter k1
圖2 參數(shù)k2 的Gibbs抽樣迭代過程Fig.2 Gibbs sampling iteration process of parameter k2
Gibbs 抽樣收斂性判斷最常用的方法是同時產(chǎn)生多條markov 鏈,MCMC 收斂性判斷的常用方法是抽樣時出入兩組初始值產(chǎn)生兩條鏈,當抽樣收斂時迭代重合. 在模擬過程中,輸入兩組初始值分別進行10 000次迭代,k1、k2的兩條迭代鏈如圖3和圖4
圖3 k1 的多層迭代鏈軌跡Fig.3 Multiple iterative chain trajectory of k1
圖4 k2 的多層迭代鏈軌跡Fig.4 Multiple iterative chain trajectory of k2
由表可得參數(shù)估計的相對誤差不超過6%,MC誤差也較小,故整體上參數(shù)估計的精度較高,Gibbs抽樣迭代值波動較小,估計效果較好. 由圖3和圖4可以看出參數(shù)的兩條迭代鏈都分別趨于重合,這說明由MCMC算法產(chǎn)生的馬爾科夫鏈收斂.