魏 戌,謝雁鳴,田 峰,申 浩,姜俊杰,孫帥玲,章軼立
(1.中國中醫(yī)科學(xué)院望京醫(yī)院,北京 100102;2.中國中醫(yī)科學(xué)院中醫(yī)臨床基礎(chǔ)醫(yī)學(xué)研究所,北京 100700)
【實驗研究】
病證結(jié)合構(gòu)建慢病風(fēng)險預(yù)測模型的思路與方法?
魏 戌1,謝雁鳴2△,田 峰2,申 浩2,姜俊杰2,孫帥玲2,章軼立2
(1.中國中醫(yī)科學(xué)院望京醫(yī)院,北京 100102;2.中國中醫(yī)科學(xué)院中醫(yī)臨床基礎(chǔ)醫(yī)學(xué)研究所,北京 100700)
風(fēng)險預(yù)測模型研究是慢性非傳染性疾病(簡稱慢病)防治的重要手段,但目前的疾病風(fēng)險預(yù)測模型中缺乏中醫(yī)證候?qū)W和癥狀學(xué)等方面內(nèi)容。病證結(jié)合構(gòu)建慢病風(fēng)險預(yù)測模型的研究思路首先是以疾病發(fā)生或疾病終點指標(biāo)作為目標(biāo)結(jié)局變量,其次確定并采集與目標(biāo)結(jié)局相關(guān)的關(guān)鍵信息,然后運用數(shù)理方法篩選中西醫(yī)危險因素構(gòu)建風(fēng)險預(yù)測模型,最后評價風(fēng)險預(yù)測模型的預(yù)測性能。常用的數(shù)學(xué)模型包括Logistic回歸模型、Cox比例風(fēng)險模型、人工神經(jīng)網(wǎng)絡(luò)、決策樹模型、Markov模型、隨機(jī)森林。此外在構(gòu)建風(fēng)險預(yù)測模型時需注意各種模型的適用條件、結(jié)局變量特征和影響因素的數(shù)據(jù)特點。
病證結(jié)合;風(fēng)險預(yù)測模型;危險因素;中醫(yī)證候;數(shù)學(xué)模型
西醫(yī)辨病與中醫(yī)辨證論治相結(jié)合,是目前中醫(yī)藥界和中西醫(yī)結(jié)合界最為普遍應(yīng)用的臨床診療模式[1]?,F(xiàn)代危險因素(如長期吸煙、過量飲酒)、西醫(yī)理化檢查、明確診斷的疾病(如高血壓病、糖尿病)等可歸為西醫(yī)“病”的范疇,中醫(yī)證候、證候要素、癥狀、四診信息等可歸為中醫(yī)“證”的范疇?!吨袊用駹I養(yǎng)與慢性病狀況報告(2015年)》明確提出防治結(jié)合、中西醫(yī)并重的慢病防治體系,廣泛開展健康宣傳教育,積極推進(jìn)中醫(yī)“治未病”健康工程[2]。鑒于此,在中醫(yī)“治未病”理論的指導(dǎo)下,通過恰當(dāng)?shù)娘L(fēng)險預(yù)測模型對疾病尤其是慢病的危險人群進(jìn)行風(fēng)險評估,預(yù)測未來幾年內(nèi)患慢病的危險程度、發(fā)展趨勢及相關(guān)危險因素,是慢病管理的基礎(chǔ)和核心環(huán)節(jié)。開展病證結(jié)合慢病風(fēng)險預(yù)測的模型研究,提供準(zhǔn)確、有針對性的健康指導(dǎo),在患病前期實施適當(dāng)?shù)慕】蹈深A(yù)(未病先防),或者及時控制疾病的發(fā)展演變(既病防變),或者防止疾病的復(fù)發(fā)或產(chǎn)生后遺癥(已變防漸),是慢病防治的重要手段。
在慢病防治過程中,風(fēng)險預(yù)測模型可以有效地為其危險人群進(jìn)行早期監(jiān)測,進(jìn)一步明確各種危險因素對疾病發(fā)生發(fā)展以及預(yù)后所起的作用強(qiáng)度,明確預(yù)防的重點,有利于幫助個體認(rèn)識健康危險因素,強(qiáng)化個人的健康促進(jìn)行為,尤其制訂個體化的健康干預(yù)措施。
國內(nèi)外研究多選擇疾病的影響因素,如年齡、性別、病情嚴(yán)重程度、吸煙、飲酒等進(jìn)行分析,但疾病的發(fā)生發(fā)展常常通過癥狀來傳遞信息,中醫(yī)學(xué)理論體系之一即是辨證論治,辨析癥狀以歸納不同的證候特征,目前在疾病風(fēng)險預(yù)測模型中缺乏中醫(yī)證候?qū)W和癥狀學(xué)等方面的內(nèi)容。本研究團(tuán)隊在3項國家自然科學(xué)基金面上項目的資助下,通過開展1059例缺血性中風(fēng)病與1740例骨質(zhì)疏松癥連續(xù)3年的隨訪研究工作,已經(jīng)證明將西醫(yī)危險因素與中醫(yī)證候特征相結(jié)合,能更加精確地識別危險因素和癥狀暴露后疾病發(fā)生、預(yù)后的危險度,實現(xiàn)早期監(jiān)測、早期預(yù)警,對于提高公眾防治慢病意識具有直接的促進(jìn)作用。健康風(fēng)險評估模型能將影響慢病的危險因素及人群的證候特征進(jìn)行數(shù)理化提取及分析,可作為客觀的評價方法指導(dǎo)臨床實踐。
2.1 以疾病發(fā)生或疾病終點指標(biāo)作為目標(biāo)結(jié)局變量
預(yù)防疾病的發(fā)生與有效控制疾病的進(jìn)展是中醫(yī)“治未病”理念的核心環(huán)節(jié),因此早期預(yù)警的目標(biāo)結(jié)局主要關(guān)注疾病發(fā)生或者疾病轉(zhuǎn)歸的終點結(jié)局指標(biāo)變化,所觀察的結(jié)局必須具有國內(nèi)外公認(rèn)的診斷或判斷標(biāo)準(zhǔn)。骨質(zhì)疏松癥的終點結(jié)局是骨質(zhì)疏松性骨折,中風(fēng)病的終點結(jié)局是死亡、復(fù)發(fā)、殘疾事件。以缺血性中風(fēng)病復(fù)發(fā)為例,復(fù)發(fā)是臨床終點事件之一,是導(dǎo)致患者死亡、再次住院、長期殘疾的主要原因。影像學(xué)檢查是臨床判斷復(fù)發(fā)事件的金標(biāo)準(zhǔn),隨著復(fù)發(fā)次數(shù)的增加,CT的影像學(xué)可以表現(xiàn)為梗死病灶的增加,從初次發(fā)病時的1個變?yōu)閺?fù)發(fā)時的多個;肢體功能評定、癥狀表現(xiàn)可作為復(fù)發(fā)事件的判斷依據(jù),如美國國立衛(wèi)生研究院卒中量表(NIH Stroke Scale,NIHSS)肢體功能評分在原有基礎(chǔ)上增長≥4分或者出現(xiàn)新發(fā)中風(fēng)的典型癥狀也可作為復(fù)發(fā)判斷標(biāo)準(zhǔn)[3-4]。
2.2 確定并采集與目標(biāo)結(jié)局相關(guān)的關(guān)鍵信息
選定目標(biāo)結(jié)局后,需要根據(jù)研究目標(biāo)與實際情況,參考既往研究工作、查閱文獻(xiàn)資料與國內(nèi)外臨床實踐指南、行業(yè)標(biāo)準(zhǔn)選取與目標(biāo)結(jié)局相關(guān)的中西醫(yī)影響因素信息,由臨床專家、方法學(xué)專家、統(tǒng)計學(xué)專家等共同討論后確定,并常以問卷形式采集相關(guān)信息。“社區(qū)40歲~65歲婦女骨質(zhì)疏松危險因素及證候調(diào)查問卷”是在前期具有良好信度、效度的《原發(fā)性骨質(zhì)疏松癥中醫(yī)證候調(diào)查問卷》和520例原發(fā)性骨質(zhì)疏松癥中醫(yī)基本證候研究的基礎(chǔ)上,廣泛梳理文獻(xiàn)、查閱循證實踐指南、參照《中醫(yī)內(nèi)科常見病診療指南·西醫(yī)疾病部分》的中醫(yī)證候辨證內(nèi)容,反復(fù)征求骨質(zhì)疏松癥中西專家的意見,與方法學(xué)、統(tǒng)計學(xué)專家討論后確定信息采集點,包括一般信息、生活習(xí)慣、發(fā)病相關(guān)因素、軀體狀況、臨床體征等5個領(lǐng)域的內(nèi)容共65個條目,為封閉式問卷設(shè)計[5]。
2.3 運用數(shù)理方法篩選中、西醫(yī)危險因素構(gòu)建風(fēng)險預(yù)測模型
基于大規(guī)模人群的臨床流行病學(xué)調(diào)查獲得長期隨訪數(shù)據(jù),發(fā)現(xiàn)疾病發(fā)生或預(yù)后的危險因素是慢病風(fēng)險預(yù)測模型構(gòu)建的關(guān)鍵環(huán)節(jié)。危險因素的識別、分層是制定預(yù)防策略的基礎(chǔ)工作,從而指導(dǎo)早期預(yù)警和監(jiān)測。國內(nèi)學(xué)者針對西醫(yī)危險因素研究較多。米生權(quán)等采用Meta分析方法,利用2002年中國居民營養(yǎng)與健康狀況調(diào)查數(shù)據(jù),篩選出年齡、體質(zhì)量指數(shù)、糖尿病家族史等10個危險因素和教育程度、血清高密度脂蛋白膽固醇含量2個保護(hù)因素,建立了20~70歲中國成人未來10年糖尿病發(fā)病風(fēng)險預(yù)測模型[6]。孫鳳等利用7296例臺灣地區(qū)35~74歲男性健康體檢者縱向數(shù)據(jù)資料,隨訪觀察5年,運用多元逐步Logistic回歸方法從10個危險因素中篩選出年齡、日常工作性質(zhì)、腰圍、體質(zhì)量和血肌酐水平5個指標(biāo),構(gòu)建了骨質(zhì)疏松5年發(fā)病風(fēng)險預(yù)測模型,可直接估計體檢者5年內(nèi)新發(fā)骨質(zhì)疏松風(fēng)險[7]。
應(yīng)用中醫(yī)危險因素構(gòu)建慢病風(fēng)險預(yù)測模型的研究較少。在缺血性中風(fēng)病死亡與復(fù)發(fā)結(jié)局的研究中,中醫(yī)學(xué)者發(fā)現(xiàn)始發(fā)態(tài)證候特征(以風(fēng)證、火證、痰證為主)可能是死亡的影響因素,以風(fēng)證、痰證為主的證候特征可能與復(fù)發(fā)預(yù)后有關(guān)[8],但鑒于研究證據(jù)有限,仍需深入研究。在此研究結(jié)果基礎(chǔ)上,我們基于1059例缺血性中風(fēng)病患者3年的隨訪數(shù)據(jù),以死亡或復(fù)發(fā)發(fā)生時間作為結(jié)局變量,運用隨機(jī)生存森林方法,篩選出痰濕蒙神證、高齡、生活質(zhì)量評分、復(fù)發(fā)、血脂異常等是死亡結(jié)局的預(yù)測因素,痰濕蒙神證、高齡、肢體功能評分、生活質(zhì)量評分、復(fù)發(fā)、血脂異常等是復(fù)發(fā)結(jié)局的預(yù)測因素。
2.4 評價風(fēng)險預(yù)測模型的預(yù)測性能
可利用接收者工作特征曲線下面積(area under the receiver operating characteristic curve,AUC)來評價風(fēng)險預(yù)測模型的預(yù)測性能。首先運用AUC對建模隊列預(yù)測模型的擬合優(yōu)度進(jìn)行檢測,隨后在驗證隊列中評估預(yù)測模型的外部效度。通常AUC數(shù)值介于0.5~0.1之間,較大的AUC數(shù)值代表了模型較好的預(yù)測能力。
3.1 Logistic回歸模型
Logistic回歸模型是用于篩選危險因素、預(yù)測與判斷疾病發(fā)生、預(yù)后的經(jīng)典模型。該模型將研究因素、混雜因素及其交互作用均體現(xiàn)在模型中,能夠在控制混雜因素的作用下,對研究因素與目標(biāo)結(jié)局作出定量描述。其關(guān)注的結(jié)局是二分類變量,如復(fù)發(fā)與未復(fù)發(fā)、死亡與未死亡、骨折與未骨折、疾病發(fā)生與未發(fā)生等。目前,此模型已運用于中風(fēng)病[9]、心肌梗死結(jié)局事件[10]等風(fēng)險預(yù)測中。
3.2 Cox比例風(fēng)險模型
Cox比例風(fēng)險模型是以每個時間點上的風(fēng)險發(fā)生概率作為因變量,常常用于生存結(jié)局的研究,與Logistic回歸模型有所不同。以腫瘤疾病研究為例,回歸模型關(guān)注的是終點事件發(fā)生與否(死亡、未死亡),而Cox模型更關(guān)注腫瘤患者的生存時間,根據(jù)生存時間計算每一時刻的死亡概率,可研究多個因素對風(fēng)險發(fā)生率的影響。本研究團(tuán)隊申浩等將發(fā)生絕經(jīng)后骨質(zhì)疏松癥骨折時間作為結(jié)局變量,Cox單因素方法篩選后,以“骨密度+危險因素+中醫(yī)癥狀”、“骨密度+危險因素”、“危險因素+中醫(yī)癥狀”3種組合形式分別構(gòu)建Cox比例風(fēng)險模型。經(jīng)AUC數(shù)值評價與統(tǒng)計學(xué)檢驗發(fā)現(xiàn),第1種組合形式優(yōu)于第2種(P<0.05),但第1種與第3種組合形式比較差異無統(tǒng)計學(xué)意義(P>0.05),研究提示在危險因素的基礎(chǔ)上加入中醫(yī)癥狀學(xué)內(nèi)容提高了模型的預(yù)測能力。
3.3 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)常應(yīng)用于多因素復(fù)雜致病的慢病病因?qū)W研究,適用于具有共線性或非線性特征的數(shù)據(jù)資料。國內(nèi)學(xué)者研究認(rèn)為,其對于數(shù)據(jù)的擬合情況要優(yōu)于 Logistic回歸模型與 Cox比例風(fēng)險模型[11]。但納入變量過多會影響人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度,甚至出現(xiàn)過度擬合現(xiàn)象。譚英等用該模型和多因素Logistic回歸分別建立缺血性中風(fēng)病患者復(fù)發(fā)的預(yù)測模型,通過AUC比較顯示神經(jīng)網(wǎng)絡(luò)模型預(yù)測性能優(yōu)于回歸模型[12]。郭奕瑞等將人工神經(jīng)網(wǎng)絡(luò)模型運用于2型糖尿病中,結(jié)果同樣顯示該模型較Logistic回歸模型具有更好的預(yù)測性能[13]。
3.4 決策樹模型
決策樹模型具有分類精度高、生成模式簡單、對噪聲數(shù)據(jù)具有較好的健壯性等優(yōu)點,能夠?qū)Ω魑kU因素不同水平發(fā)生危險的可能性作出定性判斷。于長春采用C5.0決策樹算法預(yù)測2型糖尿病患者發(fā)生缺血性中風(fēng)病風(fēng)險,篩選出的危險因素重要程度從大到小依次為頸動脈內(nèi)膜中層厚度、高血壓病史、頸動脈粥樣斑塊、糖化血紅蛋白、年齡,所建立的預(yù)測模型對訓(xùn)練樣本和測試樣本的預(yù)測準(zhǔn)確率分別為88.41%、85.00%,準(zhǔn)確率較高[14]。劉建平等運用決策樹中的分類樹模型預(yù)測深圳市缺血性中風(fēng)病發(fā)病風(fēng)險,研究發(fā)現(xiàn)最為重要的預(yù)測因素為體育鍛煉和高血壓病史,分類樹模型不僅能有效地擬合發(fā)病風(fēng)險的預(yù)測模型,還能有效地篩檢變量間的交互作用效應(yīng)[15]。
3.5 Markov模型
Markov模型可以較好地擬合隨著時間推移人群特征變化對疾病狀態(tài)轉(zhuǎn)移的影響,根據(jù)不同個體的特征估計其疾病狀態(tài)的轉(zhuǎn)移風(fēng)險概率。因其能夠分析各狀態(tài)間轉(zhuǎn)移的影響因素以及影響程度,故Markov模型在動態(tài)評價疾病進(jìn)展等方面具有較大的優(yōu)勢[16-17]。本研究團(tuán)隊田峰等通過研究社區(qū)骨量正常、骨量減少、骨質(zhì)疏松3種轉(zhuǎn)態(tài)人群時發(fā)現(xiàn),身高變矮、絕經(jīng)年限、腰膝酸軟、脫發(fā)、下肢骨痛等危險因素與中醫(yī)癥狀在絕經(jīng)后骨質(zhì)疏松高危人群的骨量狀態(tài)轉(zhuǎn)移過程中具有重要的預(yù)警作用,日常進(jìn)食新鮮蔬菜可在一定程度上降低風(fēng)險,該研究有助于指導(dǎo)社區(qū)絕經(jīng)后骨質(zhì)疏松高危人群早期篩查和預(yù)警,豐富了中醫(yī)“治未病”理論。
表1 常用數(shù)學(xué)模型的適用條件、結(jié)局變量特征、影響因素數(shù)據(jù)特點
3.6 隨機(jī)森林
隨機(jī)森林屬于機(jī)器學(xué)習(xí)方法,能夠有效處理高維數(shù)據(jù),可考慮變量間的交互作用及非線性特點來處理復(fù)雜生物學(xué)分析中的缺失數(shù)據(jù)問題,通常采用變量重要性評分來評價變量對于目標(biāo)結(jié)局發(fā)生的影響。曹文哲等研究2型糖尿病并發(fā)視網(wǎng)膜病變的相關(guān)因素并構(gòu)建風(fēng)險預(yù)測模型,AUC數(shù)值提示隨機(jī)森林模型預(yù)測效果優(yōu)于 Logistic回歸模型[18]。近年來,在隨機(jī)森林模型基礎(chǔ)上發(fā)展為隨機(jī)生存森林模型,適用于右截尾的生存資料。同時,對高維生存資料利用隨機(jī)生存森林法先降維去噪,能夠有效地提高隨機(jī)生存森林的降維能力,從而提高后續(xù)分析的檢驗效能,有助于預(yù)后預(yù)測模型的建立[19]。結(jié)腸癌預(yù)后研究證實,隨機(jī)生存森林模型預(yù)測能力優(yōu)于Cox比例風(fēng)險模型[20]。
雖然現(xiàn)有數(shù)學(xué)模型較多,但在構(gòu)建風(fēng)險預(yù)測模型時,需要根據(jù)不同的結(jié)局變量、數(shù)據(jù)資料特點以及影響因素的數(shù)量選擇合適的數(shù)學(xué)模型,這是模型研究的關(guān)鍵。表1顯示,常用數(shù)學(xué)模型的適用條件、結(jié)局變量特征及影響因素數(shù)據(jù)特點。此外,灰色預(yù)測模型[21]、支持向量機(jī)[22]等方法也可用于慢病的風(fēng)險預(yù)測研究中,為疾病預(yù)防和監(jiān)控提供依據(jù)。
國內(nèi)慢病風(fēng)險預(yù)測的研究尚處于起步階段,在中醫(yī)藥領(lǐng)域,慢病風(fēng)險評估模型的研究應(yīng)結(jié)合中醫(yī)特色開展預(yù)防實踐?,F(xiàn)有的風(fēng)險預(yù)測模型僅根據(jù)橫斷面數(shù)據(jù)作出粗略的估計,缺乏基于西醫(yī)危險因素、中醫(yī)證候要素等疾病風(fēng)險動態(tài)預(yù)測的研究,不能滿足臨床實際應(yīng)用的需求。在未來的研究中,可以重大疾病作為研究對象,開展大樣本、長時間的隨訪研究,以獲得多時點的數(shù)據(jù),基于病證結(jié)合思路建立風(fēng)險評估模型;開展中醫(yī)證候演變與風(fēng)險預(yù)測模型的研究以及風(fēng)險評估模型的評價與改進(jìn)。
[1]陳可冀.病證結(jié)合治療觀與臨床實踐[J].中國中西醫(yī)結(jié)合雜志,2011,31(8):1016-1017.
[2]衛(wèi)生與計劃生育委員會.中國居民營養(yǎng)和慢性病狀況報告(2015年)[EB/OL].http://www.nhfpc.gov.cn/jkj/s5879/ 201506/4505528e65f3460fb88685081ff158a2.[2016-3-15].
[3]魏戌,謝雁鳴,王永炎.缺血性中風(fēng)復(fù)發(fā)的臨床研究概況及中醫(yī)藥防治策略[J].北京中醫(yī)藥大學(xué)學(xué)報,2012,35(12): 805-808.
[4] OIS A,GOMIS M,RODR?GUEZ-CAMPELLO A, etal. Factors associated with a high risk of recurrence in patients with transient ischemic attack or minor stroke[J].Stroke,2008,39 (6):1717-1721.
[5]田峰,謝雁鳴,易丹輝,等.40歲~65歲絕經(jīng)后骨質(zhì)疏松癥危險因素及證候調(diào)查問卷信度和效度分析[J].中國中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2012,18(6):609-611.
[6]米生權(quán).中國成人個體糖尿病發(fā)病風(fēng)險預(yù)測模型的建立及驗證[D].北京:中國疾病預(yù)防控制中心博士學(xué)位論文,2011: 1-152.
[7]孫鳳,郁凱,陶慶梅,等.臺灣35~74歲男性體檢者骨質(zhì)疏松5年發(fā)病風(fēng)險預(yù)測模型[J].中國骨質(zhì)疏松雜志,2012,18 (10):905-911.
[8]曹克剛,於堃,高穎.缺血性中風(fēng)急性期預(yù)后相關(guān)因素的多因素分析[J].天津中醫(yī)藥,2007,24(6):462-464.
[9]VAN SEETERS T,BIESSELS GJ,KAPPELLE LJ,et al.The Prognostic Value of CT Angiography and CT Perfusion in Acute Ischemic Stroke[J].Cerebrovasc Dis,2015,40(5-6):258-269.
[10] SHACHAM Y,LESHEM-RUBINOW E,ZIV-BARAN T,et al. Incidence and mortality of acute kidney injury in acute myocardial infarction patients:a comparison between AKIN and RIFLE criteria[J].Int Urol Nephrol,2014,46(12):2371-2377.
[11]賀佳,張智堅,賀憲民.肝癌術(shù)后無瘤生存期的人工神經(jīng)網(wǎng)絡(luò)預(yù)測[J].數(shù)理統(tǒng)計與管理,2002,21(4):14-16.
[12]譚英,耿德勤,黃水平.用人工神經(jīng)網(wǎng)絡(luò)建立缺血性腦卒中復(fù)發(fā)的預(yù)測模型[J].中國衛(wèi)生統(tǒng)計,2013,30(5):687-689.
[13]郭奕瑞,李玉倩,王高帥,等.人工神經(jīng)網(wǎng)絡(luò)模型在2型糖尿病患病風(fēng)險預(yù)測中的應(yīng)用[J].鄭州大學(xué)學(xué)報:醫(yī)學(xué)版,2014,49(2):180-183.
[14]于長春.決策樹模型在2型糖尿病患者腦梗死風(fēng)險預(yù)測中的應(yīng)用[J].中國衛(wèi)生統(tǒng)計,2011,28(6):683-684.
[15]劉建平,程錦泉,張仁利,等.應(yīng)用分類樹模型構(gòu)建缺血性腦卒中發(fā)病風(fēng)險的預(yù)測模型[J].中國慢性病預(yù)防與控制,2012,20(3):254-258.
[16]高建偉.多狀態(tài)Markov模型在輕度認(rèn)知障礙向阿爾茨海默病轉(zhuǎn)歸研究中的應(yīng)用[D].太原:山西醫(yī)科大學(xué)碩士學(xué)位論文,2011:1-35.
[17]安小妹.多狀態(tài)Markov模型在糖尿病足自然史研究中的應(yīng)用[D].廣州:中山大學(xué)碩士學(xué)位論文,2007:1-45.
[18]曹文哲,應(yīng)俊,陳廣飛,等.基于Logistic回歸和隨機(jī)森林算法的2型糖尿病并發(fā)視網(wǎng)膜病變風(fēng)險預(yù)測及對比研究[J].中國醫(yī)療設(shè)備,2016,31(3):33-38.
[19]陳干霞.隨機(jī)生存森林在高維生存資料中的降維分析[D].南京:南京醫(yī)科大學(xué)碩士學(xué)位論文,2012:1-73.
[20]洪遠(yuǎn)芳.隨機(jī)生存森林在結(jié)直腸癌預(yù)后分析的應(yīng)用[D].廣州:中山大學(xué)碩士學(xué)位論文,2007:1-33.
[21]李論.基于灰色預(yù)測模型的我國心腦血管疾病死亡率預(yù)測[J].現(xiàn)代電子技術(shù),2015,38(11):107-111.
[22]周舒冬,張磊,葉小華,等.支持向量機(jī)技術(shù)在疾病預(yù)后中的應(yīng)用和比較[J].數(shù)理醫(yī)藥學(xué)雜志,2007,20(6):760-762.
Thought and Method of Building Risk Prediction Model Based on Combination of Disease and Syndrome
WEI Xu1,XIE Yan-ming2△,TIAN Feng2,SHEN Hao2,JIANG Jun-jie2,SUN Shuai-ling2,ZHANG Yi-li2
(1.Wangjing Hospital,China Academy of Chinese Medical Sciences,Beijing 100102,China; 2.Institute of Basic Research in Clinical Medicine,China Academy of Chinese Medical Sciences,Beijing 100700,China)
The research on risk prediction model is the important strategy for prevention and treatment of chronic noncommunicable diseases.However,there are lack of related contents about traditional Chinese medicine(TCM)syndrome and symptom in the prediction models.Firstly,the basis of building risk prediction model based on combination of disease and syndrome is to choose whether diseas occur or disease endpoint index as the target outcome.Secondly,the key influencing factors which are relative to the known outcome are identified and collected.Thirdly,mathematical methods are chosen to screen TCM and western medicine risk factors,eventually to construct risk model.Fourthly,the performance of risk prediction model is evaluated.The common mathematical model include logistic regression analysis,Cox proportional hazard model,artificial neural network,decision tree model,Markov model,and random forest.In addition,we should pay attention to the application conditions,characteristic of outcome and influencing factors in the construction of risk prediction model.
Combination of disease and syndrome;Risk prediction model;Risk factors;Traditional Chinese medicine syndrome;Mathematical model
R512.6+2
A
1006-3250(2017)02-0180-04
2016-08-12
國家自然科學(xué)基金資助項目(30873339,81173472,81373885)-基于非齊性Markov model建立病癥結(jié)合的絕經(jīng)后骨質(zhì)疏松證早期風(fēng)險評估模型;國家自然科學(xué)基金面上項目(81173472)-基于GLSISSM模型的缺血性中風(fēng)復(fù)發(fā)高危因素早期預(yù)警新方法研究;國家自然科學(xué)基金面上項目(81373885)-基于兩種模型的絕經(jīng)后骨質(zhì)疏松性骨折早期預(yù)警方法機(jī)制研究;國家中醫(yī)臨床研究基地業(yè)務(wù)建設(shè)第二批科研專項(JDZX2015076)-中醫(yī)綜合干預(yù)方案預(yù)防原發(fā)性骨質(zhì)疏松癥骨折的前瞻性隊列研究;北京市中醫(yī)藥科技發(fā)展資金項目(JJ 2015-57)-補骨生髓配方顆粒治療原發(fā)性骨質(zhì)疏松癥的臨床療效機(jī)理研究
魏 戌(1985-),男,醫(yī)學(xué)博士,從事骨關(guān)節(jié)退行性病變中醫(yī)防治和臨床評價方法學(xué)研究。
△
謝雁鳴,女,研究員,博士研究生導(dǎo)師,從事中醫(yī)藥治療老年病、中醫(yī)臨床評價方法學(xué)研究,Tel:010-64014411-3302,E-mail:datamining5288@163.com。