王 琪 胡良平 高 穎 柳偉偉 馬 斌 張 楊
潛在類別分析在缺血性中風(fēng)病患者證候數(shù)據(jù)中的應(yīng)用*
王 琪1,3胡良平1△高 穎2柳偉偉1馬 斌2張 楊2
目的 探討觀測(cè)結(jié)果為證候數(shù)據(jù)時(shí)潛在類別分析在樣品聚類中的應(yīng)用,及不同首發(fā)證候缺血性中風(fēng)病患者各證候隨時(shí)間的變化規(guī)律。方法 采用潛在類別分析將1023例缺血性中風(fēng)病住院患者按首發(fā)證候進(jìn)行聚類,計(jì)算各組患者各時(shí)點(diǎn)各證候的頻率,并繪制線圖。結(jié)果 根據(jù)潛在類別分析模型的擬合統(tǒng)計(jì)量及似然比檢驗(yàn)得出4個(gè)潛在類別的模型是首選模型,缺血性中風(fēng)病住院患者可聚為4個(gè)亞組,“內(nèi)濕+血瘀”組98人,“痰+血瘀”組485人,“血瘀”組266人,“多種證候”組160人。經(jīng)潛在類別分析聚成的4組患者,各證候的發(fā)生率及隨時(shí)間的變化趨勢(shì)不盡相同。結(jié)論 潛在類別分析可用于觀測(cè)結(jié)果為證候數(shù)據(jù)的樣品聚類,聚類后各組各證候隨時(shí)間的變化規(guī)律不同,對(duì)更深刻地揭示缺血性中風(fēng)病的病機(jī)本質(zhì),更準(zhǔn)確地指導(dǎo)臨床中醫(yī)藥干預(yù)有實(shí)際意義。
中風(fēng)病 證候 潛在類別分析 變化規(guī)律
*國(guó)家重點(diǎn)基礎(chǔ)研究計(jì)劃(973計(jì)劃)課題(課題編號(hào)2003CB517102),國(guó)家重點(diǎn)科技專項(xiàng)“重大新藥創(chuàng)制”(課題編號(hào)2009ZX09502-028)
1.軍事醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)統(tǒng)計(jì)咨詢中心(100850)
2.北京中醫(yī)藥大學(xué)東直門醫(yī)院(100700)
3.軍事醫(yī)學(xué)科學(xué)院放射與輻射醫(yī)學(xué)研究所
△通信作者:胡良平,E-mail:lphu812@sina.com
20世紀(jì)中期以后傳染病得到了有效的控制,現(xiàn)代人類主要的死亡原因?yàn)樾难懿?、腦血管病、惡性腫瘤這3類非傳染病。隨著社會(huì)老齡化趨勢(shì)日益加速,老年人口比重越來(lái)越大,故中風(fēng)病作為現(xiàn)代社會(huì)的重大疾病,其防治和相關(guān)基礎(chǔ)研究一直得到國(guó)家的重點(diǎn)支持〔1〕。缺血性中風(fēng)由于患者自身病機(jī)不同,必然具有不同的證候特征和演變趨勢(shì)〔2〕。中醫(yī)領(lǐng)域中搜集的證候資料是分類或稱定性資料,適合用潛在類別分析對(duì)樣品進(jìn)行聚類。
病例取自2004年9月-2009年8月在北京中醫(yī)藥大學(xué)東直門醫(yī)院、北京中醫(yī)藥大學(xué)東方醫(yī)院、首都醫(yī)科大學(xué)附屬宣武醫(yī)院、廣州中醫(yī)藥大學(xué)第二附屬醫(yī)院、天津中醫(yī)藥大學(xué)第一附屬醫(yī)院、天津中醫(yī)藥大學(xué)第二附屬醫(yī)院住院的缺血性中風(fēng)病患者。本研究在住院后第 0、7、14、28、90 天對(duì)患者內(nèi)風(fēng)、內(nèi)火、內(nèi)濕、痰、血瘀、陰虛和氣虛等七種證候(均為二值變量)進(jìn)行觀測(cè),其中,將第0天的證候定為首發(fā)證候。
潛在類別分析模型主要用于社會(huì)學(xué)、生物醫(yī)學(xué)和市場(chǎng)研究中,有探索性和驗(yàn)證性兩種,其目的是以最少的潛在分類數(shù)據(jù)解釋顯在變量間的關(guān)聯(lián)程度。傳統(tǒng)的潛在類別分析可以估計(jì)潛類別概率和潛類別中外顯變量的條件概率兩類參數(shù)〔3〕。類別概率參數(shù)表示隨機(jī)抽取的個(gè)體屬于一個(gè)特定類的概率,相當(dāng)于因子分析中的解釋變異百分比;而條件概率反應(yīng)個(gè)體某觀察變量屬于特定類別的可能性,相當(dāng)于因子分析中的因子載荷。在沒有先驗(yàn)知識(shí)的情況下一般采用探索性潛在類別分析。常用的探索性潛在類別分析方法有潛在類別聚類分析模型和潛在類別因子分析模型〔4〕。
結(jié)果變量為分類變量的潛在類別聚類分析模型,假定K個(gè)分類觀察變量y和包含L類的分類潛變量x,其一般表達(dá)式為:
LCA的思想類似于因子分析。它假定分類潛變量對(duì)多個(gè)觀測(cè)變量產(chǎn)生反應(yīng)。LCA較經(jīng)典聚類分析有一些優(yōu)勢(shì)。首先它非常靈活,可以處理分布類型復(fù)雜的分類變量;此外,它不需要確定每個(gè)觀測(cè)變量的分布。
確定類別數(shù)目的最佳方法目前存在爭(zhēng)議,有文獻(xiàn)指出〔5〕,可以用 BIC聯(lián)合似然比檢驗(yàn)來(lái)確定模型。BIC用于比較模型,BIC值越小說(shuō)明模型擬合越好。對(duì)數(shù)似然比檢驗(yàn)用于比較k-1類模型和k類模型的差別是否具有統(tǒng)計(jì)學(xué)意義。分類數(shù)目的建立使用似然比檢驗(yàn),一般認(rèn)為最少類別數(shù)的模型P<0.05。使用這個(gè)合并策略確定類別數(shù)目,之后我們基于最大后驗(yàn)概率將每個(gè)受試者進(jìn)行分類。
因發(fā)病時(shí)首次出現(xiàn)的證候在臨床上有重要意義,故根據(jù)患者的首發(fā)證候?qū)颊哌M(jìn)行聚類。
采用SAS9.2軟件對(duì)數(shù)據(jù)進(jìn)行分析。其中,PROC LCA是用作潛在類別分析的一個(gè)新的SAS過(guò)程,它是一個(gè)外掛模塊,可以從http://methodology.psu.edu免費(fèi)下載,安裝后使用。
共收集1 023例缺血性中風(fēng)病住院患者的證候資料,去除14例未觀測(cè)首發(fā)證候的患者,共納入1 009例患者進(jìn)行分析。
表1 潛在類別分析模型的擬合統(tǒng)計(jì)量
對(duì)這1 009例缺血性中風(fēng)病住院患者(結(jié)果變量為中醫(yī)證候中的內(nèi)風(fēng)、內(nèi)火、內(nèi)濕、痰、氣虛、血瘀和陰虛7個(gè)分類變量)進(jìn)行探索性潛在類別分析。首先估計(jì)含有1個(gè)潛在類別的模型(基準(zhǔn)模型),接著依次增加潛在類別數(shù)目至7,潛在類別分析模型的擬合統(tǒng)計(jì)量見表1,可以看出,當(dāng)潛在類別數(shù)為4時(shí)BIC的值最小且P<0.05,表明4個(gè)潛在類別的模型是首選模型。
表2 潛在類別概率
表2為缺血性中風(fēng)病住院患者的潛在類別概率,潛在類別概率值分別是0.086 5、0.441 8、0.293 3、0.178 3,總和為1??梢钥闯?,比重排序:類別2>類別3>類別4>類別1。這里的概率值與因子分析中的因子貢獻(xiàn)率類似,潛在類別的概率值越大表示在潛變量中的地位越重要,對(duì)顯變量的影響越大〔6〕。因此認(rèn)為模型中潛在類別2的作用最大,其次是潛在類別3,接著是潛在類別4,最后是潛在類別1。
表3 潛在類別條件概率
與因子分析中的因子載荷類似,條件概率表示各潛變量與顯變量之間的關(guān)系,條件概率值越大說(shuō)明潛變量對(duì)顯變量的影響越大,可以協(xié)助研究者解釋潛變量各類別的內(nèi)容和性質(zhì)。由表3可以看出證候取值=1時(shí),潛在類別1中顯變量?jī)?nèi)濕和血瘀發(fā)生的條件概率最大,分別為100.00%和87.44%,其它顯變量的概率都很小,因此潛在類別1主要影響顯變量?jī)?nèi)濕和血瘀,因此可以把該組定義為“內(nèi)濕+血瘀”組;潛在類別2中顯變量痰和血瘀發(fā)生的條件概率分別為94.78%和83.37%,其次為內(nèi)風(fēng)和內(nèi)火,進(jìn)而可定義為“痰+血瘀”組。在潛在類別3中的顯變量血瘀發(fā)生的條件概率為100.00%,其次為氣虛和陰虛,可定義為“血瘀”組。在潛在類別4中的顯變量的條件概率大多接近0.5,可以定義為“多種證候”組。
基于最大后驗(yàn)概率將缺血性中風(fēng)病患者進(jìn)行分組的結(jié)果如下:
(1)潛在類別1:“內(nèi)濕+血瘀”組(98人)
(2)潛在類別2:“痰+血瘀”組(485人)
(3)潛在類別3:“血瘀”組(266人)
(4)潛在類別4:“多種證候”組(160人)
根據(jù)第0天患者的后驗(yàn)概率將1009例缺血性中風(fēng)病住院患者聚類后,再觀測(cè)各時(shí)點(diǎn)各證候的發(fā)生頻率,繪制線圖。
圖1 “內(nèi)濕+血瘀”組患者各征候發(fā)生率
圖2 “痰+血瘀”組患者各征候發(fā)生率
圖3 “血瘀”組患者各征候發(fā)生率
圖4 “多種征候”組患者各征候發(fā)生率
由圖1~4可以看出,經(jīng)潛在類別分析,將缺血性中風(fēng)病住院患者按首發(fā)證候聚成4類,各類患者各證候的發(fā)生率及隨時(shí)間的變化趨勢(shì)是有所區(qū)別的。與其他組患者相比,“痰+血瘀”組患者內(nèi)風(fēng)下降幅度最大;“多種證候”組患者內(nèi)火發(fā)生率一直居高;“內(nèi)濕+血瘀”組患者內(nèi)濕下降趨勢(shì)明顯;“痰+血瘀”組患者痰呈下降趨勢(shì),其他組別痰變化相對(duì)平穩(wěn);“多種證候”組患者血瘀呈上升趨勢(shì),其他組別緩慢下降;“內(nèi)濕+血瘀”組患者氣虛發(fā)生率整體較低;“多種證候”組和“血瘀”組患者陰虛變化趨勢(shì)相近,其他兩組相近。
基于首發(fā)證候,采用潛在類別分析對(duì)缺血性中風(fēng)病患者進(jìn)行聚類,解決了結(jié)果變量為證候數(shù)據(jù)的受試對(duì)象的聚類問(wèn)題。
證候是疾病某一發(fā)展階段病因、病理、病位、病勢(shì)的綜合表現(xiàn),中風(fēng)病的證候研究作為中風(fēng)病研究中的基礎(chǔ)、核心,始終是中醫(yī)藥領(lǐng)域研究的熱點(diǎn)、難點(diǎn)。證候研究中的關(guān)鍵問(wèn)題是如何客觀準(zhǔn)確地把握中風(fēng)病不同時(shí)點(diǎn)的證候特征,即證候的動(dòng)態(tài)時(shí)空性。中風(fēng)病自起病后,證候隨著病情的變化在動(dòng)態(tài)演變,這種動(dòng)態(tài)演變的過(guò)程有其內(nèi)在的規(guī)律性。
本研究結(jié)果顯示中風(fēng)病發(fā)病時(shí)主要是非單一證候的形式,并且也與認(rèn)為痰濕和血瘀是中風(fēng)病的基本病機(jī)的研究報(bào)道相符合?;鹦匝咨希再|(zhì)猛烈,易挾痰挾瘀上竄為患,是加重中風(fēng)病病情的主要病理因素,“多種證候”組合患者證候演變趨勢(shì)表現(xiàn)為內(nèi)火發(fā)生率一直居高,血瘀也呈上升趨勢(shì),說(shuō)明發(fā)病時(shí)即為多種證候組合形式的患者病情復(fù)雜,易變生他故,預(yù)后較證候組合形式少的患者可能要差,故應(yīng)早期對(duì)此類患者干預(yù),尤重點(diǎn)觀察火熱證的變化情況,辨證施治,以期改善其預(yù)后。
缺血性中風(fēng)病患者根據(jù)首發(fā)證候分為4組,掌握以上各組各證候分布及其發(fā)展規(guī)律,可以更深刻地揭示疾病的病機(jī)本質(zhì),更準(zhǔn)確地指導(dǎo)臨床中醫(yī)藥干預(yù),為我們基于缺血性中風(fēng)病首發(fā)證候來(lái)制定臨床治療方案提供了有力的證據(jù),更具有針對(duì)性,從而提高療效。
1.馬斌,高穎.中風(fēng)病發(fā)病第7天和第14天證候要素演變規(guī)律初步研究.遼寧中醫(yī)雜志,2006,33(12):1561 -1563.
2.王建華,王永炎.出血性中風(fēng)、缺血性中風(fēng)急性期證候演變規(guī)律的研究.中國(guó)中醫(yī)急癥,2001,10(4):215 -217.
3.張巖波主編.潛變量分析.北京:高等教育出版社,2009.
4.Magidson J,Vermunt JK.Latent class factor and cluster models,bi-plots,and related graphical analysis.Sociological Mehtodology,2001,31:223-264.
5.Ranak B,Brian J,Carolyn T,et al.Is there a nonadherent subtype of hypertensive patient?A latent class analysis approach.Patient Preference and Adherence,2010,4:255 -262.
6.郭小玲,裴磊磊,張巖波.潛在類別模型及數(shù)據(jù)模擬分析.?dāng)?shù)理醫(yī)藥學(xué)雜志,2009,22(6):631 - 635.
The Application of Latent Class Analysis for Syndrome Data of Ischemia Stroke Patients
Wang Qi,Hu Liangping,Gao Ying,et al.Consulting Centre of Biomedical Statistics,Academy of Military Medical Sciences(100850),Beijing
ObjectiveTo explore the application of latent class analysis in sample cluster of syndrome data response variables,and syndrome variation regularity of ischemia stroke patients with different first syndrome.MethodsUsing latent class analysis,we gave 1023 patients a classification according to first syndrome,and calculated the syndrome frequency of different days,then drawed line graph.ResultsFour-class model is preferred according to fit statistics and likelihood ratio tests,and the four sub-groups number of patients was 98,485,266,and 160 respectively.The syndrome variation regularity of four sub-groups is different.ConclusionLatent class analysis can resolve the sample classification of syndrome data response variables.The difference in syndrome variation regularity of sub-groups is more helpful to unveil the mechanism essence of ischemia stroke,and guide clinical intervention.
Ischemia stroke;Syndrome;Latent class analysis;Variation regularity
(責(zé)任編輯:丁海龍)