朱菲菲,朱向明,劉冬,劉表虎
(皖南醫(yī)學(xué)院第一附屬醫(yī)院,安徽 蕪湖)
DCM 的發(fā)病率目前仍然領(lǐng)先于其它心肌病,通常情況下,DCM 的發(fā)病早期無(wú)癥狀或者沒有明顯癥狀,青壯年的發(fā)病率較高,預(yù)后較差[1][2]。近些年大量研究證實(shí)如能早期診斷并進(jìn)行臨床治療,將能延緩心肌重構(gòu)和心衰進(jìn)程,改善預(yù)后,降低死亡率。然而目前沒有確定標(biāo)準(zhǔn),國(guó)內(nèi)外目并沒有綜合性和針對(duì)性的診斷和治療方案,所以臨床漏診、誤診率較高,發(fā)展到后期會(huì)引發(fā)心力衰竭,嚴(yán)重時(shí)會(huì)導(dǎo)致猝死[3]。怎樣提高臨床診斷率,早期發(fā)現(xiàn)并給予及時(shí)有效的治療是亟待我們解決的問題。而目前主要是應(yīng)用超聲心動(dòng)圖來評(píng)價(jià)心室結(jié)構(gòu)及功能,并結(jié)合臨床排除缺血性心臟病來進(jìn)行診斷。此研究旨在優(yōu)選出評(píng)價(jià)DCM 患者心臟構(gòu)型的特征性指標(biāo),并挖掘出關(guān)鍵影響因素。
選取2017 年6 月至2020 年5 月來我院心內(nèi)科就診并診斷為DCM 的患者93 例作為研究對(duì)象(男61 例,女32 例),年齡16-75 歲,平均(45.40±13.60)歲,這些研究對(duì)象與中華醫(yī)學(xué)會(huì)在2007 年提出的心肌病診斷與治療建議[4]中的標(biāo)準(zhǔn)是相符的,在研究相關(guān)對(duì)象時(shí),排除冠心病、心肌炎、先天性心臟病、心臟瓣膜病、心臟再同步化治療相關(guān)患者,減少數(shù)據(jù)分析干擾,將這93 例研究對(duì)象作為實(shí)驗(yàn)組。另選同期健康志愿者106 例(男55 例,女51 例),年齡20~77 歲,平均(43.7±14.5)歲,作為對(duì)照組存在。
PHILIPS iE33 及EPIQ7C 彩色多普勒超聲心動(dòng)圖儀(荷蘭飛利浦公司產(chǎn)品),探頭采用S5—1,探頭的頻率為3.5—5MHz,超聲工作站配置Qlab 作為定量分析軟件。數(shù)據(jù)挖掘工具SQLServer2012,主要用于數(shù)據(jù)挖掘模塊,Microsoft Excel 2007 作為用戶數(shù)據(jù)分析工具。
1.3.1 數(shù)據(jù)的獲取
收集受檢者的基本臨床信息:性別、年齡、體重、身高、體表面積、血壓、血糖、血脂、飲酒史、吸煙史、家族遺傳史,是否貧血,有無(wú)病毒性心肌炎史等。按規(guī)范化的取圖標(biāo)準(zhǔn)獲取心臟構(gòu)型超聲數(shù)據(jù):左室舒張末期前后徑(left ventricular enddiastolic dimension,LVEDD)、上下徑、左右徑、左室容積、左室后壁厚度、室間隔厚度、收縮期末左房前后徑、收縮期末左房容積、左室心肌質(zhì)量指數(shù)(left ventricula msss index, LVMI)等等。左室功能超聲數(shù)據(jù):左室射血分?jǐn)?shù)(left ventricula ejection fraction,LVEF)、左 室 短 軸 縮 短 率(left ventricula fraction shortening,F(xiàn)S)。
表1 關(guān)鍵影響因素報(bào)表
1.3.2 建立數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)預(yù)處理:數(shù)據(jù)預(yù)處理主要是對(duì)收集和整理的數(shù)據(jù)加以分組或者分類前做篩選、排序等,數(shù)據(jù)預(yù)處理的方式多種多樣,數(shù)據(jù)歸約、數(shù)據(jù)集成等等。這些可以減少數(shù)據(jù)挖掘所花費(fèi)的時(shí)間。首先對(duì)不完整和有噪聲的數(shù)據(jù)進(jìn)行剔除,對(duì)缺失值和孤立點(diǎn)加以識(shí)別和處理,例如用眾數(shù)和均值進(jìn)行填充等等方式,但是具體采用哪種方式根據(jù)數(shù)據(jù)的具體特征加以使用;數(shù)據(jù)挖掘形式多種多樣[5],在挖掘以前,需要進(jìn)行數(shù)據(jù)轉(zhuǎn)換,主要是采用事務(wù)數(shù)據(jù)庫(kù),替代關(guān)系數(shù)據(jù)庫(kù)。在這一環(huán)節(jié),我們需要做的是進(jìn)行特定路徑加載,加載前的數(shù)據(jù)需要加以處理。加載完以后,需要對(duì)事務(wù)是否是在指定條件內(nèi)發(fā)生加以驗(yàn)證。
1.3.3 建立心臟超聲數(shù)據(jù)模型
運(yùn)用SQL Server 2012 數(shù)據(jù)挖掘模塊對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行挖掘,主要應(yīng)用軟件中的聚類分析算法、預(yù)測(cè)計(jì)算器報(bào)表和分析關(guān)鍵影響因素報(bào)表來全面分析數(shù)據(jù)倉(cāng)庫(kù),從原始數(shù)據(jù)中將DCM 患者各影響因素及心臟超聲參數(shù)間有價(jià)值的、潛在的關(guān)系挖掘出來,并將其隱藏的價(jià)值關(guān)系構(gòu)建成相應(yīng)的超聲數(shù)據(jù)模型。
1.3.3.1 聚類分析算法
聚類分析算法可以發(fā)現(xiàn)大量數(shù)據(jù)間的隱藏信息,這些信息的發(fā)現(xiàn)是自行進(jìn)行的,接著,將具有相同特點(diǎn)的數(shù)據(jù)分為一類[6],既正常人和DCM 患者,再按不同類別的特點(diǎn)自動(dòng)進(jìn)行處理、分析、計(jì)算。
1.3.3.2 預(yù)測(cè)計(jì)算器報(bào)表與分析關(guān)鍵影響因素報(bào)表
都是數(shù)據(jù)挖掘插件新增工具,前者是通過頻繁項(xiàng)集算出各因素的影響值,影響值越大,說明該值在某區(qū)間內(nèi)影響DCM 患者的心臟結(jié)構(gòu)功能發(fā)生變化的程度較大,即成為關(guān)鍵影響因素或特征性指標(biāo)的可能性越大。而后者是在聚類分析法對(duì)原始數(shù)據(jù)進(jìn)行分類的基礎(chǔ)上,然后再對(duì)各影響因素的影響能力進(jìn)行定量評(píng)估。
通過聚類分析算法區(qū)分出正常人群和DCM 人群,區(qū)分出不同人群后,需要獲取影響這些因素的關(guān)鍵原因以及這些關(guān)鍵影響因素的影響值大小,最后得出報(bào)表,見表1(表格中截取值為影響值較大的部分)。
由表1 可見,臨床數(shù)據(jù)中飲酒量大、曾患過病毒性心肌炎、有家族遺傳史、有高血壓病史等,均傾向于“否正常人群”,且相對(duì)影響值較大,成為關(guān)鍵影響因素的概率比較大。心臟超聲數(shù)據(jù)中左室舒張期前后徑、左室舒張期容積、左室心肌質(zhì)量指數(shù)增大時(shí),均傾向于“否正常人群”。
預(yù)測(cè)計(jì)算器報(bào)表是通過頻繁項(xiàng)集算出各因素的影響值(見表2),影響值越大,成為特征性指標(biāo)的可能性越大;同時(shí)會(huì)自動(dòng)生成支持判斷是否有影響的閾值,當(dāng)某受檢者的總影響值超過閾值時(shí),說明相關(guān)受檢者的心臟構(gòu)型功能異常。
由表2 可見,左室舒張期各徑線、左室心肌質(zhì)量指數(shù)、左室舒張期容積相對(duì)影響值均較大,說明這些指標(biāo)在評(píng)價(jià)DCM患者心臟結(jié)構(gòu)改變時(shí)相對(duì)比較敏感,有望成為特征性指標(biāo)。
主要能在大量醫(yī)療數(shù)據(jù)中挖掘出隱藏著的關(guān)聯(lián)信息,有助于疾病的早期診治,Imberman[7]等人從眾多頭部外傷患者的各項(xiàng)數(shù)據(jù)中找到外部患者CT 檢查的適應(yīng)性,主要是利用數(shù)據(jù)挖掘技術(shù)的關(guān)聯(lián)規(guī)則進(jìn)行檢查。GDutau[8]等人對(duì)周期性感冒的相關(guān)性危險(xiǎn)因素進(jìn)行分析研究,在研究時(shí)主要利用了數(shù)據(jù)挖掘的決策樹算法。Prather JC[9]等應(yīng)用數(shù)據(jù)挖掘技術(shù)對(duì)Duke 大學(xué)醫(yī)學(xué)中心的早產(chǎn)孕婦3 個(gè)危險(xiǎn)因素進(jìn)行了分析。
DCM 的病因和發(fā)病機(jī)制尚不明確,但是在已有的研究中發(fā)現(xiàn),DCM 的重要病因之一是病毒性心肌炎[10],主要的致病原因可能是由于持續(xù)的病毒感染直接損害心肌組織,也可能是誘導(dǎo)免疫介導(dǎo)損害心肌。Bowles 等[11]收集了624 例心肌炎患者,進(jìn)行組織切片分析,發(fā)現(xiàn)最常見的病原體是腺病毒,病毒感染后期少部分患者將發(fā)展為DCM。國(guó)內(nèi)陳瑞珍等研究得出15%~25%的病毒性心肌炎患者可發(fā)展為DCM[12]。從本研究中的預(yù)測(cè)計(jì)算器和關(guān)鍵影響因素報(bào)表中均可看出,病毒性心肌炎影響值均相對(duì)較大,說明患過心肌炎的人比未患過的人更傾向于發(fā)展為DCM,這與以往研究是相符的。但并不是患過病毒性心肌炎就一定會(huì)發(fā)展為DCM,這也就提示可能聯(lián)合了其它危險(xiǎn)因素一起對(duì)心肌產(chǎn)生作用,所以對(duì)病毒感染的發(fā)病機(jī)制值得我們進(jìn)一步的深入研究。
表2 DCM 影響因素及心臟超聲指標(biāo)的預(yù)測(cè)計(jì)算器報(bào)表
另外,有高血壓病史、飲酒量大的人群更傾向于DCM 人群,且影響值相對(duì)較大,說明它們與DCM 患者心臟構(gòu)型改變有著一定的相關(guān)性,以上因素是DCM 患者心臟構(gòu)型改變的重要影響因素,當(dāng)然,這些只是我們的初步考慮。但本研究發(fā)現(xiàn)家族遺傳史與DCM 關(guān)聯(lián)不大,這一結(jié)論與以往的研究結(jié)論是相悖的,相悖的原因有許多,但是本文認(rèn)為最可能的因素是由于樣本量較少導(dǎo)致結(jié)論產(chǎn)生誤差,并且我們主要是通過詢問病史來確認(rèn)的,缺乏一定的可靠性,但也有可能是數(shù)據(jù)挖掘在尋找關(guān)鍵影響因素方面更敏感、更有優(yōu)勢(shì)。
預(yù)測(cè)計(jì)算器報(bào)表顯示左室舒張期各徑線、左室容積及心肌質(zhì)量指數(shù)的影響值均較高,說明在評(píng)價(jià)心腔擴(kuò)大程度時(shí),這些指標(biāo)與我們平時(shí)所用的LVEDD 一樣都能作為評(píng)價(jià)DCM患者心臟構(gòu)型變化的特征性指標(biāo)。但是,當(dāng)DCM 患者的心腔存在明顯的擴(kuò)大狀況時(shí),其在各徑線上并不是均勻變化的,所以我們?cè)谌粘ER床工作中常規(guī)在二維或M 型上單純測(cè)量LVEDD,用此來評(píng)判心臟擴(kuò)大的程度是不夠準(zhǔn)確的,有時(shí)反而延誤治療。利用實(shí)時(shí)三維超聲測(cè)量心腔容積是目前相對(duì)最準(zhǔn)確的測(cè)量方法,但就目前中國(guó)醫(yī)療環(huán)境和軟硬件條件差異來看,暫且很難普及到每一位病患的檢查中。在本研究中,我們發(fā)現(xiàn)LVMI 相對(duì)影響值比較大,說明它是評(píng)價(jià)DCM 患者心臟構(gòu)型改變的一個(gè)重要指標(biāo)。LVMI 增加主要是因?yàn)樾募∷[、間質(zhì)增生、左室重構(gòu)引起左室僵硬度的增加。有研究證明LVM 是判斷心功能的敏感指標(biāo)之一,是心臟性猝死的強(qiáng)有力指標(biāo)[13]。另外,左室后壁厚度的相對(duì)影響值很小,不能作為DCM 患者心臟構(gòu)型評(píng)價(jià)的特征性指標(biāo),但其與LVEDD 的比值(室壁相對(duì)厚度)相對(duì)影響值卻較大,說明室壁相對(duì)厚度與心臟構(gòu)型改變有較好的相關(guān)性。這與以往研究結(jié)果是相符的,即DCM 患者在心室腔擴(kuò)大時(shí)伴有不同程度的室壁變薄,但室壁厚度是相對(duì)心腔擴(kuò)大而變薄,其與正常人的室壁厚度并無(wú)明顯差異。因此,在臨床應(yīng)用中,當(dāng)運(yùn)用二維超聲心動(dòng)圖進(jìn)行檢查時(shí),我們可以綜合以上指標(biāo)來更準(zhǔn)確的評(píng)價(jià)DCM 患者的心臟構(gòu)型的改變程度。
綜上,數(shù)據(jù)挖掘技術(shù)能在大量的數(shù)據(jù)中發(fā)現(xiàn)隱含的、不為人知的關(guān)聯(lián)信息,對(duì)于醫(yī)學(xué)上的臨床早期診斷DCM 以及評(píng)估其治療效果具有一定的臨床意義。