桂小柯張麗杰陳禹保 周家蓬▲ 王麗娟劉潔琳溫紹君劉 康
1 北京市計(jì)算中心,北京 100094;2 首都醫(yī)科大學(xué)附屬北京安貞醫(yī)院,北京 100029;3 北京中醫(yī)藥大學(xué)東方學(xué)院,河北 廊坊 065001▲通訊作者:周家蓬 Email:zhoujp@bcc.ac.cn
基金項(xiàng)目:北科院海外人才項(xiàng)目(OTP-2011-011,OTP-2012-011),北自然重大項(xiàng)目(7120001),北京市計(jì)算中心萌芽計(jì)劃項(xiàng)目
論著
高血壓早期預(yù)警和健康管理平臺(tái)的構(gòu)建
桂小柯1張麗杰1陳禹保1周家蓬1▲王麗娟2劉潔琳2溫紹君2劉 康3
1 北京市計(jì)算中心,北京 100094;2 首都醫(yī)科大學(xué)附屬北京安貞醫(yī)院,北京 100029;3 北京中醫(yī)藥大學(xué)東方學(xué)院,河北 廊坊 065001▲通訊作者:周家蓬 Email:zhoujp@bcc.ac.cn
基金項(xiàng)目:北科院海外人才項(xiàng)目(OTP-2011-011,OTP-2012-011),北自然重大項(xiàng)目(7120001),北京市計(jì)算中心萌芽計(jì)劃項(xiàng)目
為了控制和降低高血壓的病死率、致殘率,提高患者知曉率、治療率,減輕高血壓以及其他慢性疾病對(duì)個(gè)人和社會(huì)造成的負(fù)擔(dān),我們開(kāi)發(fā)了高血壓早期預(yù)警和健康管理平臺(tái)。該平臺(tái)基于云計(jì)算和大數(shù)據(jù)挖掘技術(shù),包括數(shù)據(jù)收集與檔案的建立、風(fēng)險(xiǎn)評(píng)估與重點(diǎn)人群分類(lèi)、健康指導(dǎo)、效果評(píng)價(jià)等四個(gè)部分,平臺(tái)界面簡(jiǎn)潔、使用簡(jiǎn)便,可面向普通個(gè)人用戶(hù),也可本地化到社區(qū)使用。
高血壓;健康管理;早期預(yù)警
高血壓是中風(fēng)、心肌梗塞、心衰及外周動(dòng)脈疾病的一個(gè)主要危險(xiǎn)因素。隨著我國(guó)國(guó)民經(jīng)濟(jì)的快速發(fā)展,人民生活水平的日益提高,生活節(jié)奏的加快,工作壓力的增大,肥胖、吸煙、缺少運(yùn)動(dòng)、攝鹽量過(guò)多等危險(xiǎn)因素的增多,高血壓患病率有升高的趨勢(shì),因此提高患者的知曉率、治療率,構(gòu)建高血壓早期預(yù)警系統(tǒng)具有重要的現(xiàn)實(shí)意義。
與高血壓早期預(yù)警類(lèi)似,健康管理是在更大范圍內(nèi)對(duì)一般性人群的健康風(fēng)險(xiǎn)因素進(jìn)行全面管理的過(guò)程,其宗旨是調(diào)動(dòng)個(gè)人及集體的積極性,有效利用有限資源來(lái)達(dá)到最佳的健康效果,充分體現(xiàn)未病先防的健康理念。
收集已有的高血壓的病例對(duì)照數(shù)據(jù),利用數(shù)據(jù)挖掘的方法,構(gòu)建出高血壓早期預(yù)警的模型,然后將此模型應(yīng)用到平臺(tái)新的數(shù)據(jù)上進(jìn)行高血壓早期預(yù)警。健康管理平臺(tái)通過(guò)多種途徑收集數(shù)據(jù),如圖1所示,把不同醫(yī)院體檢單位和終端采集儀器獲得的健康數(shù)據(jù),進(jìn)行統(tǒng)一標(biāo)準(zhǔn)、統(tǒng)一格式,存放到北京市計(jì)算中心的數(shù)據(jù)庫(kù)內(nèi)。為每個(gè)用戶(hù)創(chuàng)建健康檔案,并對(duì)用戶(hù)的歷史數(shù)據(jù)進(jìn)行可視化展示,同時(shí)結(jié)合用戶(hù)的健康指標(biāo)信息和預(yù)警模型,對(duì)用戶(hù)的健康風(fēng)險(xiǎn)作出評(píng)估,并提出改善的指導(dǎo)建議。此平臺(tái)基于web以B/S結(jié)構(gòu)的網(wǎng)絡(luò)形式提供服務(wù)。
圖1 業(yè)務(wù)系統(tǒng)流程
2.1 基于常規(guī)體檢數(shù)據(jù)的模型
參考已有的研究[1],與北京市安貞醫(yī)院合作,獲取1048例常規(guī)體檢數(shù)據(jù),其中病例高血壓773例,正常對(duì)照275例,年齡介于16~86歲之間。數(shù)據(jù)涵蓋了性別,年齡,家族史數(shù)字,血脂異常,吸煙數(shù)字,飲酒數(shù)字,收縮壓,舒張壓,高鹽飲食,BMI,心率,ALT,BUN,CRE,UA,CHO,LDL,HDL等生理生化指標(biāo)信息。采用多元線(xiàn)性回歸的方法,分別以收縮壓和舒張壓作為依變量進(jìn)行回歸分析,多元線(xiàn)性回歸結(jié)果顯示性別、年齡、吸煙、飲酒、BMI、心率、CRE以及UA對(duì)血壓值存在顯著影響(P<0.05)。由于醫(yī)院和體檢中心常采用是否患高血壓來(lái)記錄病人檔案,同時(shí)為了避免健康管理用戶(hù)血壓值測(cè)量不準(zhǔn)確引進(jìn)誤差,因此本研究將血壓值轉(zhuǎn)化為是否患病的離散變量,對(duì)其進(jìn)行l(wèi)ogistic回歸分析[2],構(gòu)建出在不同風(fēng)險(xiǎn)因素下高血壓患病風(fēng)險(xiǎn)的模型。
2.2 基于基因數(shù)據(jù)的模型
根據(jù)各年齡段血壓的正常值[3],基因?qū)ρ獕褐档挠绊懀?],生活習(xí)慣、環(huán)境因素等對(duì)血壓的影響模擬了16847例樣本數(shù)據(jù),樣本數(shù)據(jù)考慮了基因、年齡、性別、體質(zhì)指數(shù)、攝鹽量、攝油量、抽煙、飲酒、孤獨(dú)感、壓力等十個(gè)風(fēng)險(xiǎn)因素,我們對(duì)該數(shù)據(jù)集進(jìn)行風(fēng)險(xiǎn)因素相關(guān)性分析,并使用最小近鄰法(KNN)對(duì)各種風(fēng)險(xiǎn)因素缺失的情況下預(yù)測(cè)準(zhǔn)確性進(jìn)行評(píng)估,發(fā)現(xiàn)基因信息是模型準(zhǔn)確預(yù)測(cè)的關(guān)鍵,見(jiàn)表1。
表1 風(fēng)險(xiǎn)因素和預(yù)測(cè)效果
由表1不難發(fā)現(xiàn),作為內(nèi)在遺傳因素的基因所扮演的角色似乎是無(wú)可替代的,而其他若干外界環(huán)境因素的缺失對(duì)整體預(yù)測(cè)效果影響并不大,這是由于外界因素彼此間的相關(guān)度較高(彼此可以彌補(bǔ)缺失信息)。除了KNN法,另外三種常用的機(jī)器學(xué)習(xí)方法也在本研究中加以運(yùn)用:人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(jī)(SVM)和隨機(jī)森林(Random forest),預(yù)測(cè)效果基本一致。
3.1 數(shù)據(jù)采集和存儲(chǔ)模塊
健康數(shù)據(jù)的采集主要通過(guò)以下三種方式:(1)用戶(hù)在網(wǎng)站個(gè)人中心頁(yè)面上填寫(xiě)健康信息并提交;(2)上傳電子病歷或者體檢報(bào)告;(3)自動(dòng)采集,通過(guò)特定的便攜式終端采集系統(tǒng)自動(dòng)上傳。便攜式終端自動(dòng)采集系統(tǒng)包括電子血壓血糖儀、心電檢測(cè)儀等,用戶(hù)建檔以后,可以通過(guò)刷身份證實(shí)現(xiàn)快捷登錄,能夠?qū)崟r(shí)上傳健康數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行實(shí)時(shí)展示。
存儲(chǔ)方面,使用開(kāi)源的MySQL作為數(shù)據(jù)庫(kù)管理系統(tǒng),一個(gè)表存放一類(lèi)健康數(shù)據(jù),以用戶(hù)為中心建立多表之間的一一對(duì)應(yīng)關(guān)系,確保數(shù)據(jù)的正確性和完整性。對(duì)于不同類(lèi)型的用戶(hù)設(shè)置不同的權(quán)限級(jí)別,防止對(duì)數(shù)據(jù)的非法操作。通過(guò)搭建高可用性的MySQL集群,根據(jù)負(fù)載在不同數(shù)據(jù)庫(kù)節(jié)點(diǎn)間分擔(dān)訪(fǎng)問(wèn)壓力,保證服務(wù)的高可用性。
3.2 健康風(fēng)險(xiǎn)分析模塊
健康風(fēng)險(xiǎn)分析模塊主要針對(duì)不同人群和個(gè)體:(1)根據(jù)年齡、性別以及健康狀態(tài)等特點(diǎn)對(duì)人群進(jìn)行分類(lèi)。我們將人群分為18歲以下、18~30歲、30~40歲、40~50歲等亞組,并根據(jù)對(duì)方多項(xiàng)健康指標(biāo)劃歸為健康組、亞健康組、低危組、高危組等。通過(guò)組內(nèi)及組間健康狀態(tài)及風(fēng)險(xiǎn)因素的綜合比較,篩選出顯著發(fā)病風(fēng)險(xiǎn)因素。(2)由于個(gè)體存在遺傳上的差異,通過(guò)群體水平的數(shù)據(jù)構(gòu)建出的健康模型,應(yīng)用到不同個(gè)體時(shí)會(huì)有偏差,因此平臺(tái)可結(jié)合用戶(hù)累積上傳的數(shù)據(jù)(多個(gè)時(shí)間點(diǎn))構(gòu)建個(gè)體化預(yù)測(cè)模型,這體現(xiàn)了個(gè)體化醫(yī)療的思想。
3.3 健康指導(dǎo)模塊
健康指導(dǎo)模塊主要包括專(zhuān)家建議系統(tǒng)、個(gè)人健康實(shí)時(shí)管理等,具體形式包括手機(jī)短息通知本人或親友,以及通過(guò)網(wǎng)絡(luò)健康知識(shí)庫(kù)等互動(dòng)形式提高用戶(hù)的積極性,使其主動(dòng)了解和關(guān)注自己的健康狀況。(1)通知本人:依據(jù)各種影響健康的因素如氣溫突變等,系統(tǒng)適時(shí)通過(guò)短信或者電郵等方式,提醒客戶(hù)注意健康保健和及時(shí)體檢,以達(dá)到隨時(shí)隨地為客戶(hù)健康服務(wù)的目的;(2)親友提醒:提醒對(duì)象除了用戶(hù)本人以外,還可以綁定到親友家人的手機(jī)或者電郵;(3)健康知識(shí)庫(kù):整合完備的健康信息知識(shí)庫(kù),讓用戶(hù)主動(dòng)去了解健康相關(guān)知識(shí),自主地關(guān)注自己的健康。
3.4 健康管理效果評(píng)價(jià)模塊
本模塊的功能旨在幫助長(zhǎng)期使用本平臺(tái)的客戶(hù)對(duì)個(gè)人的健康管理效果進(jìn)行科學(xué)公正的評(píng)估,并及時(shí)有效地改善原分析模型,以使結(jié)果更加精準(zhǔn)。本模塊核心算法采用一系列機(jī)器學(xué)習(xí)的方法,包括KNN、ANN、SVM、隨機(jī)森林等,旨在實(shí)現(xiàn)真正的個(gè)體化預(yù)測(cè)。
本平臺(tái)發(fā)布系統(tǒng)采用LAMP技術(shù)開(kāi)發(fā)[5]。采用Linux系統(tǒng)環(huán)境,以Apache組件作為網(wǎng)絡(luò)服務(wù)器軟件,使用PHP編寫(xiě)動(dòng)態(tài)網(wǎng)頁(yè),用MySQL作為服務(wù)器端數(shù)據(jù)庫(kù)開(kāi)發(fā)環(huán)境,采用B/S服務(wù)模式,通過(guò)域名(http://he.biocloud.org.cn)為互聯(lián)網(wǎng)為用戶(hù)提供一種直觀(guān)高效,簡(jiǎn)單易用的圖形界面。使用用戶(hù)在任何一個(gè)地方通過(guò)能連接互聯(lián)網(wǎng)的設(shè)備上的瀏覽器,就可以注冊(cè)登錄,進(jìn)行健康管理。
由于利用一系列機(jī)器學(xué)習(xí)的數(shù)學(xué)模型進(jìn)行健康風(fēng)險(xiǎn)評(píng)估需要大量的運(yùn)算,因此本平臺(tái)主要采用分布式計(jì)算框架對(duì)任務(wù)進(jìn)行調(diào)度;同時(shí)也初步采用云計(jì)算技術(shù)中針對(duì)大數(shù)據(jù)、特別是非結(jié)構(gòu)化大數(shù)據(jù)的Hadoop平臺(tái)[6],結(jié)合Rhadoop等方法,將部分計(jì)算任務(wù)和結(jié)果存取任務(wù)分解到多臺(tái)Hadoop計(jì)算節(jié)點(diǎn)上,確保及時(shí)響應(yīng)大數(shù)據(jù)用戶(hù)的查詢(xún)請(qǐng)求。
據(jù)報(bào)道,80%的醫(yī)療支出用在了那些可以預(yù)防的疾病上。因此最根本的任務(wù)是防疾病于未然,將疾病消滅在萌芽狀態(tài),這就是健康風(fēng)險(xiǎn)評(píng)估的內(nèi)容,包括了高血壓等慢性疾病的預(yù)測(cè)。健康管理在西方發(fā)達(dá)國(guó)家已經(jīng)有多年的實(shí)踐[7],我國(guó)起步較晚,但現(xiàn)在也已經(jīng)呈現(xiàn)蓬勃發(fā)展的態(tài)勢(shì),健康管理服務(wù)公司如雨后春筍般涌現(xiàn),但絕大多數(shù)僅停留概念炒作,或者售賣(mài)檢測(cè)設(shè)備的原始階段,并沒(méi)有真正將用戶(hù)健康資源進(jìn)行計(jì)劃、組織、加工利用。
伴隨著我國(guó)老齡化社會(huì)的到來(lái),健康管理和疾病預(yù)警將會(huì)是極其有意義的事業(yè)。因此,我們采用完全免費(fèi)的系統(tǒng)及軟件,構(gòu)建了該高血壓早期預(yù)警及健康管理平臺(tái)的測(cè)試版,供廣大醫(yī)療健康管理工作者及相關(guān)的科研工作者參考。
[1]Echouffo-Tcheugui JB,Batty GD,Kivim?ki M,Kengne AP.Risk models to predict hypertension.A Systematic Review. PloS one.2013;8(7):e67370.
[2]倪延延,盧錦榮,張晉昕.二分類(lèi)反應(yīng)變量多水平模型及其軟件實(shí)現(xiàn).中國(guó)衛(wèi)生信息管理雜志,2013(1):75-80.
[3]Shimada K, Fujita T,Ito S, Naritomi H, Ogihara T,Shimamoto K, Tanaka H,Yoshiike N.The importance of home blood pressure measurement for preventing stroke and cardiovascular disease in hypertensive patients:a subanalysis of the Japan Hypertension Evaluation with Angiotensin II Antagonist Losartan Therapy (J-HEALTH) study. a prospective nationwide observational study.Hypertension Research.2008;31(10):1903-11.
[4]Kim YJ,Go MJ,Hu C,Hong CB,Kim YK.Large-scale genome-wide association studies in East Asians identify new genetic loci influencing metabolic traits.Nature genetics.2011;43(10):990-5.
[5]余立強(qiáng).LAMP架構(gòu)搭建與網(wǎng)站運(yùn)行實(shí)例.網(wǎng)絡(luò)與信息,2011,25(8):50-2.
[6]White T.Hadoop:the definitive guide.O'Reilly.2012.
[7]張士靖,周志超,杜建,等.國(guó)內(nèi)外健康管理研究熱點(diǎn)對(duì)比分析.醫(yī)學(xué)信息學(xué)雜志,2010(4):6-10.
Construction of Hypertension Early Warning and Health Management Platform
GUI Xiaoke1ZHANG Lijie1CHEN Yubao1ZHOU Jiapeng1WANG Lijuan2LIU Jielin2WEN Shaojun2LIU Kang3
1 Beijing Computing Center,Beijing 100094,China;2 Beijing An Zhen Hospital,Beijing 100029,China;3 Beijing University of Chinese Medicine Dongfang College,Langfang Hebei 065001,China
A hypertension early warning and health management platform was built,in order to control the mortality and morbidity of hypertension via improving patients' awareness,and to reduce the economic burden for individuals and the society.The platform is based on cloud computing and big data mining techniques,and is composed of four parts:data collection and archives risk assessment and classification for populations of different health grades health guidance and evaluation of effects of risk factors.
Hypertension,Health management,Early warning
R473.2
B
1674-9316(2014)21-0001-03
10.3969/J.ISSN.1674-9316.2014.21.001