范世平 朱飛奇 舒嵐 廖茂成
基于EHR和SPEEDMINER數(shù)據(jù)挖掘的粵北地區(qū)腦卒中高危人群篩查平臺的初步構(gòu)建
范世平 朱飛奇 舒嵐 廖茂成
采用EHR與SPEEDMINER數(shù)據(jù)挖掘技術(shù),結(jié)合臨床實踐,初步建立以粵北人民醫(yī)院為中心,輻射周邊地區(qū)的腦卒中高危人群智能分布性篩查平臺。通過對篩查結(jié)果的統(tǒng)計分析,實現(xiàn)對粵北地區(qū)腦卒中高危人群進行實時監(jiān)控,為各級醫(yī)療服務(wù)機構(gòu)對高危人群進行針對性健康教育等干預(yù)措施提供參考依據(jù)。
電子健康檔案;數(shù)據(jù)挖掘;腦卒中篩查;高危人群
腦卒中是一種急性腦血管病,具有發(fā)病率高、致殘率高和死亡率高的特點。我國居民第三次死因調(diào)查結(jié)果顯示,腦血管病已成為國民第一位的死亡[1]。然而,我國目前腦卒中篩查與防控工作的開展,與現(xiàn)實存在較大的差距,主要表現(xiàn)在以下幾個方面:一是未廣泛開展高血壓與血清同型半胱氨酸篩查;二是未重視頸動脈粥樣硬化斑塊和狹窄的篩查與規(guī)范化治療;三是絕大部分醫(yī)院重腦卒中的治療,但輕預(yù)防;四是社區(qū)、農(nóng)村人群腦卒中高發(fā),但是該人群對腦卒中的篩查和預(yù)防極不關(guān)注;這些問題導(dǎo)致我國腦卒中發(fā)病率急劇增加。
腦卒中篩查與防治工程是我國一項重大的國民健康促進工程,是一項利國利民的德政工程。積極開展腦卒中篩查,可以做到防患于未然。腦卒中高危人群篩查和干預(yù)可提高國民防治知識知曉率、用藥率、控制率,綜合預(yù)防和聯(lián)合干預(yù)高血壓、高血糖、血脂異常、房顫及吸煙、飲酒等不健康生活方式,降低腦卒中發(fā)病率、復(fù)發(fā)率、致殘率和死亡率[2-3],減輕百姓、社會及政府的經(jīng)濟負(fù)擔(dān)。本平臺以居民電子健康檔案和數(shù)據(jù)挖掘為基礎(chǔ),提供粵北地區(qū)腦卒中高危人群的智能分布,實現(xiàn)對腦卒中高危人群的動態(tài)監(jiān)控與干預(yù)。
粵北地區(qū)腦卒中高危人群初篩平臺以粵北區(qū)域醫(yī)療信息網(wǎng)絡(luò)服務(wù)平臺為依托,通過接口獲取區(qū)域平臺數(shù)據(jù),抽取整理后存入數(shù)據(jù)倉庫的數(shù)據(jù)庫。在初篩平臺上制定腦卒中高危人群智能分布的分析模型,通過Speedminer數(shù)據(jù)挖掘工具的報表和圖形功能來讀取結(jié)果,為臨床腦卒中防治與干預(yù)提供指引,進一步發(fā)揮粵北地區(qū)腦卒中篩查與防治基地的巨大作用。粵北地區(qū)腦卒中高危人群篩查平臺的系統(tǒng)架構(gòu)見圖1。
圖1 腦卒中初篩平臺架構(gòu)
1.1 腦卒中篩查數(shù)據(jù)采集 腦卒中風(fēng)險篩查的基本數(shù)據(jù)是整個平臺架構(gòu)的基礎(chǔ),腦卒中風(fēng)險篩查包括:(1)BP≥140/90 mm Hg,或未知;(2)心房顫動(房顫)和心瓣膜?。ń?jīng)區(qū)/縣級以上醫(yī)院明確診斷);(3)吸煙(吸煙的定義為每天吸煙至少1支,連續(xù)1年以上);(4)血脂異常,或未知;(5)糖尿??;(6)很少進行體育活動(根據(jù)2000 年國民體質(zhì)監(jiān)測方案,體育鍛煉的定義是每周體育鍛煉≥3次、每次堅持30分鐘、持續(xù)時間超過1年);(7)明顯超重或肥胖(BMI≥26.0 kg/m2);(8)有卒中家族史。對滿足以上8個條件中任意3個或3個以上危險因素,或者既往有卒中/短暫性腦缺血發(fā)(transient ischemic attack,TIA)病史的患者,則判定為腦卒中高危人群;以上8個條件中低于3個危險因素,但患有慢性?。ǜ哐獕?、糖尿病、房顫或瓣膜性心臟?。┲徽撸x為中危人群;以上8個條件中低于3個危險因素,并且無慢性病者為低危人群[4]。
在區(qū)域醫(yī)療平臺內(nèi),通過每位患者唯一的身份標(biāo)識——個人主索引MPI(Mask Patient Index)獲取居民電子健康檔案(PHR)、電子健康記錄(EHR)和腦卒中篩查基本信息表,調(diào)取包括居民多次就診的HIS(醫(yī)院信息系統(tǒng))、LIS(實驗室信息管理系統(tǒng))、PACS(醫(yī)學(xué)影像存檔通訊系統(tǒng))、RIS(放射信息管理)、EMR(電子病歷)等一系列數(shù)據(jù)與信息,存儲到數(shù)據(jù)倉庫的數(shù)據(jù)庫,為腦卒中危險人群的判斷提供臨床依據(jù)。
1.2 腦卒中篩查數(shù)據(jù)分析評估 數(shù)據(jù)挖掘是一個從數(shù)據(jù)中提取模式的過程,是一個受多個學(xué)科影響的交叉領(lǐng)域,包括數(shù)據(jù)庫系統(tǒng)、統(tǒng)計學(xué)、機器學(xué)習(xí)、可視化和信息科學(xué)等; 數(shù)據(jù)挖掘反復(fù)使用多種數(shù)據(jù)挖掘算法從觀測數(shù)據(jù)中確定模式或合理模型,是一種決策支持過程。利用數(shù)據(jù)挖掘工具從數(shù)據(jù)倉庫中的大量數(shù)據(jù)獲取有效的、新穎的、潛在有用的、最終可理解的一個模式過程[5]。粵北地區(qū)腦卒中高危人群篩查平臺通過Speedminer數(shù)據(jù)挖掘技術(shù)提供腦卒中篩查數(shù)據(jù)的統(tǒng)計、分析與評估[6]。在平臺上建立腦卒中篩查主題,腦卒中危險人群的維度包括危險等級、性別、年齡、地區(qū)分布等,同時定義數(shù)據(jù)鉆取的順序,通過對數(shù)據(jù)庫數(shù)據(jù)的切片、切塊、鉆取和旋轉(zhuǎn)等各種分析、剖析,通過數(shù)據(jù)挖掘工具的報表和圖形功能來讀取結(jié)果,使用戶能從多角度、多側(cè)面地觀察數(shù)據(jù),展示腦卒中初步篩查的各項結(jié)果。腦卒中篩查平臺流程圖見圖2。
圖2 腦卒中初篩平臺業(yè)務(wù)流程
1.3 腦卒中篩查平臺統(tǒng)計分析實例 以下是利用腦卒中高危人群篩查平臺,以粵北地區(qū)各縣市2013年腦卒中篩查人員數(shù)據(jù)為基礎(chǔ),進行抽樣統(tǒng)計分析。圖3為韶關(guān)3市轄區(qū)、4縣、1自治縣、2縣級市腦卒中篩查的低危、中危、高危、TIA、卒中患者分布情況。
圖3 腦卒中危險人群地區(qū)分布
在腦卒中危險人群分布圖的基礎(chǔ)上進一步進行數(shù)據(jù)鉆取。以韶關(guān)市武江區(qū)為例,從年齡、性別等維度對腦卒中危險人群進行數(shù)據(jù)挖掘與分析,如圖4、5所示。通過圖4與圖5的統(tǒng)計分析,可以初步判斷這一地區(qū)腦卒中高發(fā)人群集中在50~70歲之間,以男性居多。
圖4 腦卒中危險人群年齡分布
圖5 腦卒中危險人群性別分布
腦卒中篩查平臺除按照地區(qū)、性別、年齡篩查外,還可按照危險因素進行篩查。仍以韶關(guān)市武江區(qū)為例,通過平臺統(tǒng)計分析出腦卒中高危人群危險因素主要包括腦卒中、TIA、高血壓、高血脂、卒中家族史等。如果把危險因素作為第一層,可進一步挖掘數(shù)據(jù),統(tǒng)計分析各危險因素的年齡比例和性別比例。
我國每年用于治療腦血管病的費用估計約120多億元,再加上各種間接經(jīng)濟損失,每年因本病的總支出近200億元。腦卒中已對國民的生命健康造成嚴(yán)重威脅,并將大幅度增加疾病負(fù)擔(dān)。“2020健康中國”戰(zhàn)略規(guī)劃研究中考慮將“腦中風(fēng)篩查與防控”列入重大專項。
基于EHR和SPEEDMINER數(shù)據(jù)挖掘的粵北地區(qū)腦卒中高危人群篩查平臺以粵北區(qū)域醫(yī)療平臺為基礎(chǔ),利用區(qū)域平臺的個人健康檔案、電子健康記錄及腦卒中篩查基本信息表等獲取人員就診信息,以先進SPEEDMINER數(shù)據(jù)挖掘技術(shù)為工具,提供粵北地區(qū)腦卒中高危人群的智能分布,實現(xiàn)對腦卒中高危人群的動態(tài)監(jiān)控與干預(yù),以指導(dǎo)腦卒中健康教育及區(qū)域防治干預(yù),從源頭上促進國民健康工程的建設(shè)與發(fā)展,對于腦卒中篩查與防治工作具有重要意義。與此同時,以完善的信息系統(tǒng)和WLAN網(wǎng)絡(luò)技術(shù)為依托,將現(xiàn)代信息技術(shù)與醫(yī)學(xué)人文關(guān)懷融為一體,搭建以輻射農(nóng)村縣醫(yī)院為重點的區(qū)域醫(yī)療信息網(wǎng)絡(luò)服務(wù)系統(tǒng)平臺,實現(xiàn)將分散在不同機構(gòu)的健康數(shù)據(jù)整合為一個邏輯完整的信息整體,滿足與其相關(guān)的各種機構(gòu)和人員需要。該平臺的目標(biāo)是使醫(yī)療服務(wù)人員在任何時間、任何地點都能及時獲取必要的信息,以支持高質(zhì)量的醫(yī)療服務(wù);使公共衛(wèi)生工作者能全面掌控人群健康信息,做好疾病預(yù)防、控制和健康促進工作;使居民能掌握和獲取自己完整的健康資料,參與健康管理,享受持續(xù)、跨地區(qū)、跨機構(gòu)的醫(yī)療衛(wèi)生服務(wù)。
當(dāng)然此平臺在統(tǒng)計分析方面不夠完善,分析因素比較單一,需要在以后的應(yīng)用過程中不斷總結(jié)、探索與完善。
[1] 陳竺.全國第三次死因回顧抽樣調(diào)查報告[R].北京:中國協(xié)和醫(yī)科大學(xué)出版社,2008:14-17.
[2] 劉鳳群.腦卒中患者的健康指導(dǎo)與保健[J].中華現(xiàn)代護理學(xué)雜志,2006,3(3):260-261.
[3] 趙亞飛,杜雪平,董建琴.腦卒中社區(qū)防治的現(xiàn)狀及存在的問題[J].中國全科醫(yī)學(xué),2010,13(14):1493-1495.
[4] 張振漢.北京市朝陽區(qū)八里莊地區(qū)40歲以上人群腦卒中危險因素現(xiàn)狀調(diào)查[J].中華腦血管病雜志(電子版),2010,7(6):322-329.
[5] 用戶指南V 1.0中文版[M/OL].[2011-10-20].http://ishare.iask. sina.com.cn/f/8971898.html.
[6] 時松和,施學(xué)忠,楊永利,等.基于數(shù)據(jù)挖掘的艾滋病綜合防治居民健康檔案管理信息系統(tǒng)設(shè)計與實現(xiàn)[J].現(xiàn)代預(yù)防醫(yī)學(xué),2013,40(16): 2953-2957.
Applying the technology of EHR and SPEEDMINER data mining, combining clinical practices, the project preliminary builds a high-risk population stroke screening platform centered on YueBei People’s Hospital covering the surrounding areas.explore the establishment of stroke screening platform of YueBei region based on electronic health records and data mining. The project integrates with magnanimity information resources which aimed at building the platform of YueBei region. By the statistical analysis of screening results, it realizes real-time monitoring of YueBei region high-risk population, which helps to make health guidance and interventions for all medical service institution.
Electronic health records;Data mining;Stroke screening;High-risk groups
10.3969/j.issn.1009-4393.2016.2.104
2012年韶關(guān)市科技計劃(醫(yī)學(xué)類)項目(2012 CX-K 86)
廣東 512026 汕頭大學(xué)醫(yī)學(xué)院附屬粵北人民醫(yī)院辦公室 (范世平 舒嵐 廖茂成) 汕頭大學(xué)醫(yī)學(xué)院附屬粵北人民醫(yī)院神經(jīng)內(nèi)科 (朱飛奇)
范世平 E-mail:82959680@qq.com