陳 琦, 胡錫健
(新疆大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院, 新疆 烏魯木齊 830046)
隱馬爾可夫模型(Hidden Markov Model,HMM)是由Baum L E在20世紀(jì)60年代末提出的一個(gè)非常重要的統(tǒng)計(jì)分析模型,其在語(yǔ)音識(shí)別、故障診斷、生物統(tǒng)計(jì)等領(lǐng)域中有廣泛的應(yīng)用.評(píng)估問(wèn)題、隱狀態(tài)估計(jì)(解碼)問(wèn)題、參數(shù)估計(jì)(學(xué)習(xí))問(wèn)題是HMM的三個(gè)基本問(wèn)題.其中,隱狀態(tài)估計(jì)問(wèn)題在某種程度上其實(shí)就是一個(gè)貝葉斯估計(jì)問(wèn)題.當(dāng)HMM的隱狀態(tài)取連續(xù)值時(shí),通常將其稱為狀態(tài)空間模型.對(duì)于線性高斯系統(tǒng),可以利用卡爾曼濾波(Kalman Filter)得到解析解.對(duì)于狀態(tài)空間是離散的、有限的馬爾可夫鏈的系統(tǒng),運(yùn)用基于網(wǎng)格的濾波方法(Grid-based methods)可以得到后驗(yàn)概率分布的解析解.但實(shí)際上這些條件在很多動(dòng)態(tài)隨機(jī)系統(tǒng)中很難滿足,大部分是非線性、非高斯的,無(wú)法求出解析解,因此,只能求助于次優(yōu)或逼近方法.文獻(xiàn)[1]提出擴(kuò)展卡爾曼濾波(Extended Kalman Filter,EKF),但EKF存在線性化誤差,只適用于弱非線性系統(tǒng).文獻(xiàn)[2]提出UT的變換,并在EKF濾波框架里得到廣泛應(yīng)用,被稱為UKF,這種方法不必對(duì)非線性方程進(jìn)行線性化和計(jì)算雅克比矩陣,均值和方差均可精確到二階,比標(biāo)準(zhǔn)的EKF精度更高.但由于這兩種非線性估計(jì)方法都是把pk(xk|y1:k)用高斯逼近,如果真實(shí)的分布是非高斯的,那么就不能精確表示狀態(tài)的真實(shí)分布.然而,對(duì)于狀態(tài)空間是連續(xù)的但是可以劃分成有限的Ns個(gè)單元,那么仍然可以用基于網(wǎng)格的逼近方法來(lái)近似后驗(yàn)概率密度[3].近年來(lái),將粒子濾波用于處理非線性、非高斯系統(tǒng)的估計(jì),為貝葉斯估計(jì)提供了有效的新解法.但當(dāng)隱狀態(tài)空間維數(shù)很高時(shí)離子濾波方法有以下兩個(gè)不足之處:計(jì)算量特別大;不能精確近似目標(biāo)分布.此外,離子濾波還要求似然函數(shù)是逐點(diǎn)可知的,但在實(shí)際情況中通常不能滿足,而用近似貝葉斯計(jì)算方法(Approximate Bayesian Compute,ABC)可以避免這些問(wèn)題.本文將HMM隱態(tài)估計(jì)問(wèn)題看作一個(gè)貝葉斯濾波問(wèn)題,首先詳細(xì)介紹粒子濾波用于HMM隱狀態(tài)估計(jì),然后將近似貝葉斯計(jì)算思想引入HMM隱狀態(tài)估計(jì)中.
HMM是一對(duì)離散時(shí)間隨機(jī)過(guò)程{Xn}n≥1、{Yn}n≥1,其中xn∈dx是隱狀態(tài),yn∈dy是觀測(cè)值。HMM隱狀態(tài)估計(jì),就是給定觀測(cè)序列y0:n及模型參數(shù)θ,對(duì)隱狀態(tài)作出恰當(dāng)?shù)呐袛?,即在某種意義下求與此觀測(cè)序列對(duì)應(yīng)的最優(yōu)隱狀態(tài)序列x0:n.這一問(wèn)題的回答取決于對(duì)模型狀態(tài)物理意義的理解,根據(jù)不同的準(zhǔn)則,可能會(huì)選出不同的最優(yōu)狀態(tài)序列.
對(duì)?0≤k≤l及n>0,定義φk:l|n(y0:n,·)為給定Y0:n的條件下Xk:l的條件分布,對(duì)于具有轉(zhuǎn)移密度函數(shù)的HMM來(lái)說(shuō),φk:l|n(y0:n,·)是Yn+1到Xl-k+1的轉(zhuǎn)移核,且有密度函數(shù)φk:l|n(xk:l|y0:n).對(duì)于隱狀態(tài)估計(jì)問(wèn)題有兩種原則,單點(diǎn)最優(yōu)原則對(duì)應(yīng)于條件分布φk|n(y0:n,·)=φk:k|n(y0:n,·),0≤k≤n;路徑最優(yōu)原則對(duì)應(yīng)于條件分布φ0:n|n(y0:n,·).
單點(diǎn)最優(yōu)原則下的隱狀態(tài)估計(jì)問(wèn)題其實(shí)是一個(gè)最優(yōu)濾波問(wèn)題[4],HMM模型的隱狀態(tài)是由φk|n(xk|y0:n)而得到的,即時(shí)刻k(0≤k≤n)下最有可能的隱狀態(tài)為
(1)
(2)
粒子濾波算法是通過(guò)非參數(shù)化的蒙特卡洛(MonteCarlo)模擬方法來(lái)實(shí)現(xiàn)遞推的貝葉斯濾波,適用于任何能用狀態(tài)空間模型描述的非線性系統(tǒng),其核心思想是得到一批有權(quán)重的離散隨機(jī)采樣點(diǎn)(粒子)來(lái)近似狀態(tài)變量的后驗(yàn)概率密度函數(shù),然后利用他們得到估計(jì)值,當(dāng)?shù)玫降牧W雍芏鄷r(shí),其精度可以逼近最優(yōu)估計(jì).
HMM隱狀態(tài)估計(jì)的核心是后驗(yàn)分布φ0:n|n(y0:n,·),假設(shè)其密度函數(shù)存在,則
(3)
(4)
L(y0:n)φ0:n|n(x0:n|y0:n)=L(y0:n-1)φ0:n-1|n-1(x0:n-1|y0:n-1)q(xn-1,xn)g(xn,yn)
(5)
(6)
得φk|n(xk|y0:n)的估計(jì)為
(7)
故(4)式的最優(yōu)建議分布為
(8)
在進(jìn)行序貫重要性采樣時(shí),隨著 k的增大,將會(huì)出現(xiàn)權(quán)值退化問(wèn)題,當(dāng)n較大時(shí),就將大量的時(shí)間浪費(fèi)在一些對(duì)估計(jì)結(jié)果不起任何作用的粒子更新上,針對(duì)權(quán)值退化問(wèn)題,Gordon等提出采用重抽樣(Resampling)方法,即評(píng)估粒子權(quán)值后重抽樣粒子以減少小權(quán)值的粒子而復(fù)制大權(quán)值的粒子.
(a)當(dāng)k=0時(shí)
(b)當(dāng)k=1,2,…,n時(shí)
第k步抽樣:
第k步重抽樣:
由于
(9)
由(7)式知
(10)
(11)
設(shè)
(12)
(13)
粒子濾波算法是基于重點(diǎn)抽樣來(lái)近似目標(biāo)分布的序列,通常目標(biāo)分布的維數(shù)隨著時(shí)間參數(shù)的增加而增加.在維數(shù)很高時(shí),離子濾波有計(jì)算量大、不能準(zhǔn)確地近似目標(biāo)分布等缺點(diǎn).第一個(gè)缺點(diǎn)歸因于進(jìn)行模擬和估計(jì)權(quán)值時(shí)的計(jì)算量都很大,第二個(gè)缺點(diǎn)是由于目標(biāo)分布本身的復(fù)雜性.此外,離子濾波通常要求g(xk,yk)是逐點(diǎn)可得的,但在一些應(yīng)用中不能滿足該要求.采用基于近似貝葉斯計(jì)算的方法可以解決此類問(wèn)題.
近似貝葉斯計(jì)算已經(jīng)成為貝葉斯范例的一個(gè)重要方面,在人們感興趣的許多實(shí)際問(wèn)題中,貝葉斯模型不可得,或者由于計(jì)算量太大而不能被擬合,或者所需的模擬方法不能處理問(wèn)題的復(fù)雜性.文獻(xiàn)[5]介紹了后驗(yàn)密度π(x|y)∝g(y|x)μ(x)的如下近似:
(14)
其中:Aε,y={u:ρ(s(u),s(y))<ε};u是一個(gè)輔助數(shù)據(jù)點(diǎn),∏A是集合A的示性函數(shù),g是似然函數(shù),μ是先驗(yàn)密度,s:dy→ds是一個(gè)數(shù)據(jù)的匯總統(tǒng)計(jì)量,ρ是一個(gè)距離測(cè)度.通常ds比dy小很多.如果s是充分的,可以看到當(dāng)ε趨于0時(shí),πε(x|y)趨于π(x|y).可以采用拒絕抽樣[5]、馬爾可夫蒙特卡洛[6]或序貫蒙特卡洛[7-8])等方法對(duì)(14)式進(jìn)行統(tǒng)計(jì)推斷,其中的關(guān)鍵點(diǎn)是,若不能對(duì)g(u|x)進(jìn)行數(shù)值估計(jì),但對(duì)任一x,如果可以從g(·|x)進(jìn)行抽樣,仍就可以從πε(x|y)生成樣本.
πn(x1:n|y1:n)的邊際ABC目標(biāo)為
(15)
第1步:
文中將HMM的隱狀態(tài)估計(jì)問(wèn)題看成一個(gè)貝葉斯估計(jì)問(wèn)題,在單點(diǎn)原則下就是一個(gè)最優(yōu)濾波問(wèn)題,而解決濾波問(wèn)題的方法很多,但適用的條件及范圍各不相同,其得到的估計(jì)結(jié)果精度也不相同.離子濾波可以很好地對(duì)大部分HMM的隱狀態(tài)的后驗(yàn)密度進(jìn)行估計(jì),但其也有自身的一些缺點(diǎn),并且當(dāng)遇到g(xk,yk)逐點(diǎn)不可得時(shí),無(wú)法對(duì)后驗(yàn)密度進(jìn)行估計(jì).而基于ABC的方法可以對(duì)此類情況進(jìn)行估計(jì),從而使HMM隱狀態(tài)估計(jì)問(wèn)題得到了全面解決,而且也可以考慮將ABC方法用到其它更廣泛的領(lǐng)域中.
[1] Anderson B D,Moore J B.Optimal filtering[M].New Jersey:Prentice-Hall,1979.
[2] Julier S J, Uhlmann J K.A new extension of the Kalman filter to nonlinear systems[C]// The 11th Int Symp on Aerospace:Simulation and Controls. London: 1997:10-12.
[3] 張?jiān)姽?,朱立新,趙義正.離子濾波算法研究進(jìn)展與展望[J].自動(dòng)化技術(shù)與應(yīng)用 ,2010,29(6):1-16.
[4] 朱成文,李兵,胡奎,等.HMM隱狀態(tài)的粒子濾波估計(jì)[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(8):161-167.
[5] Pritchard J K, Seielstad M T, Perez-Lezaun A,etal. Population growth of human Y chromosome microsatellites[J]. Mol Biol Evol.,1999,16, 1 791-1 798.
[6] Majoram P, Molitor J , Plagnol V,etal. Markov chain Monte Carlo without likelihoods[J]. Proc Natl Acad Sci,2003,100, 15 324-15 328.
[7] Beaumont M A, Cornuet J M, Marin J M, et al.Adaptivity for ABC algorithms: the ABC- PMC scheme[J]. Biometrika, 2009,96, 983-990.
[8] Doucet A, Johansen A M. A tutorial on particle filtering and smoothing: fifteen years later[J]. Oxford Handbook of Nonlinear Filtering,2009,7:54-89.
[9] Jasra A ,Singh S S,Martin J S,etal. Filtering via approximate Bayesian computation[J]. Statistics and Computing, 2012,22(6):1 223-1 237.
[10] Moral P D, Doucet A, Jasra A. An adaptive sequential Monte Carlo method for approximate Bayesian computation[J]. Statistics and Computing, 2012,22(5):1 009-1 020.