祝青芳
摘 要:本文介紹了一種基于隱馬爾科夫模型(HMM)的分析核磁共振圖像(fMRI)數(shù)據(jù)的無監(jiān)督學(xué)習(xí)模型,與一般線性模型(GLM)方法不同,GLM的主要針對體素的血氧水平(BOLD)反應(yīng)大腦活動的時間序列響應(yīng)進行建模,而HMM方法主要針對體素在第一個時間序列的演化過程進行建模。因此,HMM方法可以在BOLD信號上發(fā)現(xiàn)更多的信息。本文介紹了兩種不同的腦激活檢測方法,第一種方法基于似然估計和似然估計比檢驗,其中高斯模型被用來增加HMM似然映射的對比度。第二種方法是基于兩個狀態(tài)的分布之間的定距,其中,對HMM狀態(tài)序列進行最有效的估計的是Viterbi算法。通過T檢驗或使用K- L距離(KLD)來測量激兩種狀態(tài)之間是分布距離。
關(guān)鍵詞:腦激活檢測 功能磁共振成像 隱馬爾科夫模型 似然比
中圖分類號:TP393.0 文獻標(biāo)識碼:A 文章編號:1672-3791(2018)05(a)-0094-02
功能磁共振成像(fMRI)技術(shù)是一個在認知神經(jīng)科學(xué)領(lǐng)域的檢測大腦活動的技術(shù)。每個功能磁共振成像體素的響應(yīng)表示氧合血紅蛋白和脫氧血紅蛋白濃度的在時間序列上的變化,因為神經(jīng)激活可能增加血流腦的某些區(qū)域。BOLD信號通常被認為是腦活動的間接信息。
1 基于fMRI序列的隱馬爾科夫模型
隱馬爾科夫模型是一個含有隱含位置參數(shù)的馬爾科夫過程的統(tǒng)計模型,描述了一種不同狀態(tài)集組成的一個序列集合。隱馬爾科夫模型包含有限個狀態(tài)。在傳統(tǒng)的馬爾可夫鏈中,狀態(tài)是直接可見的,并且狀態(tài)轉(zhuǎn)移概率是確定的。然而在HMM中,只有在隱馬爾可夫模型中,狀態(tài)是不直接可見的,但輸出依賴于該狀態(tài)。每個狀態(tài)通過可能的輸出記號有了可能的概率分布。因此,通過一個隱馬爾科夫模型產(chǎn)生標(biāo)記序列提供了有關(guān)狀態(tài)的一些序列的信息。一個隱馬爾科夫模型可由以下描述:
因此一個隱馬爾科夫模型可以表示成為,我們假設(shè)每個狀態(tài)的分布服從高斯分布:
給定隱馬爾科夫模型和狀態(tài)O,通過Viterbi算法[36]計算的最大似然,估計可以得到最可能的序列,Viterbi的權(quán)值函數(shù)如下:
表示狀態(tài)i在時間t最可能的分布,可以整理如下:
在隱馬爾科夫模型的應(yīng)用中,多個隱馬爾可夫模型被不同組標(biāo)記的數(shù)據(jù)訓(xùn)練。隱馬爾科夫模型的參數(shù)通過訓(xùn)練集進行估計,通過最大似然估計進行分配。
1.1 HMM似然估計
在無監(jiān)督的學(xué)習(xí)方法中,HMM參數(shù)通過給定給定模式和體素的時間序列訓(xùn)練得來。這與傳統(tǒng)的隱馬爾科夫模型直接從訓(xùn)練集上訓(xùn)練得到參數(shù)不同,因為這些腦激活過程會在不同的體素和患者之間不同,因此避免直接訓(xùn)練參數(shù),不使用固定的體素特征。
因為腦活動只有兩種狀態(tài),on和off狀態(tài)在此工作中,另狀態(tài)數(shù)N=2,on狀態(tài)S1和off狀態(tài)S0
基于給定給定模式,我們令on狀態(tài)的序列為Lon,off狀態(tài)的序列為Loff,狀態(tài)轉(zhuǎn)移矩陣A可以表示為, a01=1-a00,,a10=1-a11。
腦激活檢驗的參數(shù)可以通過體素的時間序列O表示,假設(shè)采樣服從高斯分布,另pon表示on狀態(tài)分布,Poff表示off狀態(tài)分布,off狀態(tài)So高斯分布的參數(shù)為:
由給定模式可知,序列總是從off狀態(tài)開始,因此我們令,π0=1,π1=0,給定一個二值狀態(tài)的隱馬爾科夫模型,如果這個觀察序列有兩個很明顯區(qū)分的狀態(tài),那么會與顯著不同,那么這個模型針對這個序列的似然估計會比較高。如果觀察順序沒有這樣明顯分布不同或者有兩個相似的狀態(tài),那么這個狀態(tài)轉(zhuǎn)移就會顯現(xiàn)隨機性,因此不會與狀態(tài)轉(zhuǎn)移矩陣A有很好的擬合,在這樣的的情況下,該序列的最大似然估計將就會比較低。
為了增強似然映射的正確率,我們?yōu)镻off采樣引入高斯分布,與二值隱馬爾科夫模型的So狀態(tài)分布一致,以下的對整個序列的似然估計都將基于高斯假設(shè)。
1.2 狀態(tài)分配距離
給定高斯分布的參數(shù)和通過t檢驗計算不同分布之間的距離為:
對fMRI每個序列的體素進行計算t值,t值高的點對應(yīng)于激活的體素KL距離通常被用來衡量兩個概率分布密度之間的距離。因為KL距離不對稱,因此理論上來說并不是真正的距離,KL距離通常用來表示相對熵;
2 結(jié)語
本文提出一個假設(shè),令所有給定給定模式為off狀態(tài)的作為off狀態(tài)采樣,所有給定給定模式是on狀態(tài)的作為on狀態(tài)采樣,我們把這種方法稱為“模式狀態(tài)”方法。通過將序列與HRF卷積波形而得到μ0和μ1,將體素序列與加權(quán)模式波形的殘差作為σ0和σ1。我們通過不同的方法來計算體素序列的兩種不同隱馬爾科夫狀態(tài),并且通過Viterbi算法計算最可能的狀態(tài)序列,這種方法是Viterbi路徑方法,然后通過優(yōu)化每個序列的狀態(tài)分配得到on狀態(tài)和off狀態(tài)的取樣概率分布,通過off狀態(tài)的分布得到,通過on狀態(tài)的分布得到。
參考文獻
[1] 林亞平,劉云中,周順先,等.基于最大熵的隱馬爾可夫模型文本信息抽取[J].電子學(xué)報,2005,33(2):236-240.