黃山 易法令
摘要:代謝綜合征及其并發(fā)癥是十分普遍的慢性疾病,我國(guó)患病人數(shù)持續(xù)攀升,對(duì)其相關(guān)的研究已成為中西醫(yī)學(xué)者研究的熱點(diǎn)。代謝綜合征文獻(xiàn)系統(tǒng)數(shù)據(jù)庫(kù)以該領(lǐng)域的大量文獻(xiàn)為基礎(chǔ),通過(guò)對(duì)相關(guān)文獻(xiàn)資料進(jìn)行系統(tǒng)的整理,按照文獻(xiàn)特征進(jìn)行分類(lèi),提取出各類(lèi)文獻(xiàn)中的有效信息,將文獻(xiàn)中非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)換成了結(jié)構(gòu)化的數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)的設(shè)計(jì)為代謝綜合征文獻(xiàn)的綜合應(yīng)用及數(shù)據(jù)挖掘奠定了基礎(chǔ),使相關(guān)的科研和臨床的文獻(xiàn)研究更為便捷。
關(guān)鍵詞:數(shù)據(jù)庫(kù);代謝綜合征;文獻(xiàn)系統(tǒng); 設(shè)計(jì)
中圖分類(lèi)號(hào):G250.74 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)23-0003-04
Abstract: The prevalence of metabolic syndrome and its complications are very common in chronic diseases. The population of illnesses in our country is increasing. The research on it has become a hot spot in the research of Chinese and Western medicine. Metabolic syndrome literature database system to the field of a large number of documents as the basis, through the collation of relevant literature, according to the characteristics of literature classification, extract the effective information of all kinds of literature, literature in non structured data are transformed into the structure of the database. The design of the database has laid a foundation for the comprehensive application and data mining of the metabolic syndrome, which makes it more convenient for the related scientific research and clinical literature research.
Key words: database; metabolic syndrome; literature system; design
代謝綜合征(Metabolic Syndrome,MS),是心血管病的多種代謝危險(xiǎn)因素在個(gè)體內(nèi)集結(jié)的狀態(tài),主要包括胰島素抵抗(IR)、腹型肥胖、糖耐量受損(IGT)、血脂異常以及高血壓[1]。目前,本病在世界范圍內(nèi)呈流行趨勢(shì)[2],在我國(guó)人群的發(fā)病率也呈逐年上升趨勢(shì),2009年開(kāi)展的流行病學(xué)調(diào)查顯示,國(guó)代謝綜合征發(fā)病率大于15%,患者人數(shù)已超過(guò)2億,其中18歲以上人群中患病率為10.5%[3],兒童青少年的患病率達(dá)3.2%[4]。代謝綜合征的防治日益受到關(guān)注,已成為中西醫(yī)學(xué)者研究的熱點(diǎn) 。然而,目前代謝綜合征文獻(xiàn)數(shù)量繁多、內(nèi)容雜亂、質(zhì)量不齊,并且不斷更新,這給代謝綜合征臨床治療和科研研究帶來(lái)諸多不便,因此,有必要對(duì)這些資料進(jìn)行系統(tǒng)的整理。本研究旨在通過(guò)建立現(xiàn)代代謝綜合征文獻(xiàn)數(shù)據(jù)庫(kù),進(jìn)行國(guó)內(nèi)外有關(guān)代謝綜合征文獻(xiàn)的回顧總結(jié),對(duì)這些文獻(xiàn)資料進(jìn)行系統(tǒng)的整理,根據(jù)文獻(xiàn)特征進(jìn)行分類(lèi),提取出各類(lèi)文獻(xiàn)中的有效信息,完成代謝綜合征文獻(xiàn)數(shù)據(jù)的搜錄以及安全儲(chǔ)存,實(shí)現(xiàn)代謝綜合征文獻(xiàn)內(nèi)容的數(shù)據(jù)化轉(zhuǎn)換,為代謝綜合征文獻(xiàn)質(zhì)量評(píng)價(jià)及數(shù)據(jù)挖掘奠定基礎(chǔ),用于發(fā)現(xiàn)代謝綜合征病理、影響因素及和療效的相關(guān)性等規(guī)律,以指導(dǎo)科研和臨床。
1 文獻(xiàn)資料采集
1.1 文獻(xiàn)檢索
中文檢索詞設(shè)置為“代謝綜合征”或“糖代謝”或“脂代謝”等, 時(shí)間年限設(shè)置為2005年-2016年,檢索范圍為中國(guó)知網(wǎng)全文期刊數(shù)據(jù)庫(kù)(CNKI)、 萬(wàn)方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)、維普中文科技期刊數(shù)據(jù)庫(kù)(VIP)、中國(guó)生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)(CBM)。英文檢索中,使用主題詞“Metabolic Syndrome X”進(jìn)行檢索,時(shí)間年限設(shè)置為2005年-2016年,檢索范圍為Pubmed文獻(xiàn)數(shù)據(jù)庫(kù)。結(jié)果:共檢索出代謝綜合征得中文文獻(xiàn)16,512篇,英文文獻(xiàn)22948篇。
1.2 文獻(xiàn)納入排除標(biāo)準(zhǔn)
語(yǔ)言類(lèi)型為漢語(yǔ)類(lèi)文獻(xiàn)或英語(yǔ)類(lèi)文獻(xiàn),已正式發(fā)表的期刊文獻(xiàn)以及博碩士畢業(yè)論文中以描述代謝綜合征治療為主要研究?jī)?nèi)容的所有文獻(xiàn)。
排除標(biāo)準(zhǔn):實(shí)驗(yàn)對(duì)象為動(dòng)物、尸體類(lèi)文獻(xiàn);文摘類(lèi)文獻(xiàn);解疑類(lèi)文獻(xiàn);重復(fù)發(fā)表的文獻(xiàn);報(bào)紙報(bào)道類(lèi)文章;內(nèi)容中有明顯錯(cuò)誤的文獻(xiàn);英語(yǔ)類(lèi)文獻(xiàn)排除來(lái)自中國(guó)境內(nèi)的只收錄摘要的文獻(xiàn)。
1.3 文獻(xiàn)資料分類(lèi)
在建立數(shù)據(jù)庫(kù)之前,務(wù)必要對(duì)收集到的文獻(xiàn)進(jìn)行分類(lèi)。在完成最終納入代謝綜合征文獻(xiàn)的閱讀后,將文獻(xiàn)分為5類(lèi),分類(lèi)及標(biāo)準(zhǔn)如下:
1)臨床治療類(lèi)——以探討代謝綜合征與某種方式治療效果關(guān)系為目的, 受試者為該疾病患者或健康人,治療組為藥物治療組等的試驗(yàn)類(lèi)文獻(xiàn)。其文獻(xiàn)類(lèi)型特征:內(nèi)容上研究通過(guò)藥物治療、物理方法治療,并評(píng)價(jià)治療效果。研究方法上有:服用藥物雙盲對(duì)照、手術(shù)等。藥物包含:阿卡波糖、二甲雙胍等西藥以及其他中藥。評(píng)價(jià)指標(biāo)包含:。關(guān)鍵詞中含有:藥物名稱(chēng)、臨床治療、臨床療效等。
2)機(jī)理試驗(yàn)類(lèi)——以研究代謝綜合征,受試者為健康人或某類(lèi)疾病患者,試驗(yàn)組為控制條件后的樣本等試驗(yàn)類(lèi)文獻(xiàn)。其文獻(xiàn)類(lèi)型特征:研究機(jī)理指標(biāo)的改變。研究方法上有主要以實(shí)驗(yàn)室研究為主。涉及的指標(biāo)多數(shù)為:血生化指標(biāo),探測(cè)不同病理時(shí)期以及合并并發(fā)癥時(shí)的生理指標(biāo)變化。關(guān)鍵詞中包含:生化指標(biāo)、病理變化、異常指標(biāo)等。
3)流行病學(xué)類(lèi)——以研究代謝綜合征疾病分布及其決定因素為內(nèi)容的文獻(xiàn)。其文獻(xiàn)類(lèi)型特征:以調(diào)查疾病的患病率、死亡率、危險(xiǎn)因素等為目的;方法上以問(wèn)卷調(diào)查、體格檢查和實(shí)驗(yàn)室檢查為主;涉及的指標(biāo):患病率、發(fā)病率、死亡率、超重率、血脂異常率、高血壓異常率、糖尿病異常率等;關(guān)鍵詞中含有流行病學(xué)、現(xiàn)況調(diào)查、隊(duì)列研究、病例對(duì)照研究、橫斷面研究、患病率、發(fā)病率、死亡率等。
4)健康管理類(lèi)——以慢性病的三級(jí)預(yù)防、健康管理干預(yù),評(píng)價(jià)干預(yù)效果為主要內(nèi)容的文獻(xiàn)。其文獻(xiàn)類(lèi)型特征:干預(yù)方式包括健康教育、飲食治療、有氧運(yùn)動(dòng)、藥物應(yīng)用指導(dǎo)、定時(shí)檢測(cè)、生活方式和行為等護(hù)理干預(yù),改變生活方式、藥物治療等綜合干預(yù);涉及的生化指標(biāo)有:空腹血糖、血甘油三脂、總膽固醇、體重指數(shù)、收縮壓與舒。張壓等指標(biāo);涉及的評(píng)價(jià)指標(biāo)有:干預(yù)后治療率、知曉率、控制率;關(guān)鍵詞中含有、健康管理、健康跟蹤管理、防治、護(hù)理干預(yù)、生活方式、效果評(píng)價(jià)等。
5)綜合文獻(xiàn)類(lèi)——包括綜述類(lèi)文獻(xiàn)、 回顧性文獻(xiàn)。其文獻(xiàn)類(lèi)型特征:無(wú)法歸類(lèi),但是對(duì)總結(jié),重要性高,在數(shù)據(jù)庫(kù)設(shè)計(jì)中僅以文獻(xiàn)基本信息、文獻(xiàn)分類(lèi)信息及全文的方式存儲(chǔ)。關(guān)鍵詞中含有:展望、進(jìn)展、回顧、綜述等。
2 數(shù)據(jù)庫(kù)設(shè)計(jì)
2.1 具體設(shè)計(jì)
根據(jù)上述指標(biāo)分類(lèi),構(gòu)建總體的評(píng)價(jià)數(shù)據(jù)庫(kù),在數(shù)據(jù)庫(kù)設(shè)計(jì)過(guò)程中,要將不同類(lèi)型文獻(xiàn)對(duì)應(yīng)的研究方法指標(biāo)、研究結(jié)果指標(biāo)分開(kāi),文獻(xiàn)分類(lèi)信息中包括:文獻(xiàn)關(guān)鍵詞判斷、文獻(xiàn)標(biāo)題判斷等基本信息,按照研究結(jié)果指標(biāo)分類(lèi)要求分為三類(lèi):治療結(jié)果指標(biāo)、調(diào)查結(jié)果指標(biāo)、相關(guān)因素指標(biāo);按照研究方法指標(biāo)分類(lèi)要求分為四類(lèi):分組指標(biāo)、實(shí)驗(yàn)室檢查指標(biāo)、體格檢查指標(biāo)、問(wèn)卷調(diào)查指標(biāo)。
圖1為整個(gè)數(shù)據(jù)庫(kù)的E -R圖,在E-R圖中定義了12個(gè)實(shí)體,其中:“文獻(xiàn)基本信息”實(shí)體包括了文獻(xiàn)的中文標(biāo)題、英文標(biāo)題、作者、作者單位、期刊名稱(chēng)、中文關(guān)鍵詞、英文關(guān)鍵詞、分類(lèi)號(hào)、文章編號(hào)、基金項(xiàng)目、中文摘要和英文摘要;“研究對(duì)象”實(shí)體的屬性包括選擇時(shí)間、入選標(biāo)準(zhǔn)、排除標(biāo)準(zhǔn)、診斷標(biāo)準(zhǔn)、地區(qū)名稱(chēng)、分組方法、抽樣方法、總抽取人數(shù)、有效例數(shù)(男)、有效例數(shù)(女)、總平均年齡、平均年齡(男)、平均年齡(女)、最高年齡(男)、最高年齡(女)、最低年齡(男)、最低年齡(女)、應(yīng)答率、平均病程(男)、平均病程(女)。
各個(gè)實(shí)體對(duì)應(yīng)的關(guān)系:“代謝綜合征文獻(xiàn)基本信息”與“文獻(xiàn)分類(lèi)信息”是n:1的關(guān)系?!把芯繉?duì)象”是所有納入文獻(xiàn)共同存在的部分,部分屬性允許為空,與“文獻(xiàn)分類(lèi)信息”是1:1的關(guān)系?!把芯糠椒ā迸c“文獻(xiàn)分類(lèi)信息”是m:n的關(guān)系,即一個(gè)文獻(xiàn)分類(lèi)可能有多個(gè)研究方法,同樣一個(gè)研究方法可能對(duì)應(yīng)多個(gè)文獻(xiàn)分類(lèi),“研究方法”具體對(duì)應(yīng)的4個(gè)指標(biāo)實(shí)體,分別是“實(shí)驗(yàn)室檢查指標(biāo)”、“分組指標(biāo)”、“體格檢查指標(biāo)”、“問(wèn)卷調(diào)查指標(biāo)”,均是1:1關(guān)系。“治療結(jié)果指標(biāo)”、“調(diào)查結(jié)果指標(biāo)”、“相關(guān)因素指標(biāo)”與文獻(xiàn)分類(lèi)信息是1:1的關(guān)系?!把a(bǔ)充指標(biāo)”是針對(duì)個(gè)別文獻(xiàn)出現(xiàn)的新指標(biāo),需要另行補(bǔ)充,與“文獻(xiàn)分類(lèi)信息”是1:1的關(guān)系。
2.2 系統(tǒng)表設(shè)計(jì)
根據(jù)數(shù)據(jù)庫(kù)E-R模型實(shí)體及關(guān)系,建立“代謝綜合征文獻(xiàn)表”記錄所有文獻(xiàn)基本信息,各表字段內(nèi)容如表1所示。建立“研究對(duì)象表”,各字段內(nèi)容如表2所示。其他實(shí)體關(guān)聯(lián)的表涉及不同文獻(xiàn)分類(lèi),需要具體研究才能確定。
“文獻(xiàn)基本信息”和“研究對(duì)象”是上述五類(lèi)文獻(xiàn)都具有共性的地方,所對(duì)應(yīng)的是表1,表2的內(nèi)容。而到了“研究方法”和“研究結(jié)果”的部分,每個(gè)類(lèi)別差異性增加,無(wú)法歸為一個(gè)表,因此需要針對(duì)每個(gè)類(lèi)別總結(jié)其文獻(xiàn)類(lèi)別的內(nèi)在規(guī)律,關(guān)聯(lián)到具有各自特質(zhì)的不同的表,下面以“臨床治療類(lèi)”文獻(xiàn)為例作描述。
經(jīng)過(guò)大量閱讀和回顧“臨床治療類(lèi)”的文獻(xiàn),發(fā)現(xiàn)其“研究方法”的部分通常對(duì)患者進(jìn)行分組,其中一組使用一種的治療方法,另一組按傳統(tǒng)方法治療或使用另一種方法治療,以此為對(duì)照,有時(shí)候會(huì)超過(guò)兩組。治療方法主要有幾類(lèi):中藥治療、西藥治療、中藥聯(lián)合西藥治療、藥物治療伴有手術(shù)治療。其中藥物這部分以副表的形式關(guān)聯(lián)進(jìn)來(lái),其屬性包括:藥物的類(lèi)別(中/西)、藥物的名稱(chēng)、通用名稱(chēng)、主要成分、用法用量、不良反應(yīng)、禁忌、注意事項(xiàng)。分組的屬性還有治療的療程、治療后的護(hù)理方案和飲食方案。如涉及手術(shù),則手術(shù)的名稱(chēng)、手術(shù)方法。在這一步建立臨床治療類(lèi)研究方法分組表,如表3所示,藥物副表如表4所示。
不同類(lèi)別文獻(xiàn)的研究結(jié)果內(nèi)容也不同,比如“流行病學(xué)類(lèi)”的研究結(jié)果屬性包括:地區(qū)、組別、年齡段、調(diào)查人數(shù)、疾病名稱(chēng)、患病人數(shù)、MS粗患病率%、統(tǒng)計(jì)學(xué)P等。經(jīng)過(guò)大量閱讀和總結(jié),“臨床治療類(lèi)”的研究結(jié)果對(duì)應(yīng)研究方法的分組進(jìn)行記錄,通過(guò)一系列指標(biāo)評(píng)價(jià)治療的效果,如表5所示,包含以下屬性:時(shí)間(治療前/后),有效例數(shù)、無(wú)效例數(shù)、FBG(空腹血糖)、2HPG(餐后2小時(shí)血糖)、HbAlC(糖化血紅蛋白)、血脂、體重、膽固醇、TG(甲狀球蛋白)、HDL(高密度脂蛋白)、LDL(低密度脂蛋白)、SBP(收縮壓)、DBP(舒張壓)、BMI(身體質(zhì)量指數(shù))。
3數(shù)據(jù)錄入示例
以錄入蔣永平的《川丹消斑湯聯(lián)合西藥治療代謝綜合征頸動(dòng)脈粥樣硬化療效觀察》[5]文獻(xiàn)為例。
第一步,先錄入文獻(xiàn)基本信息,涉及的數(shù)據(jù)表如表1所示,數(shù)據(jù)項(xiàng)包括文獻(xiàn)的標(biāo)題(川丹消斑湯聯(lián)合西藥治療代謝綜合征頸動(dòng)脈粥樣硬化療效觀察)、作者(蔣永平)、作者單位(甘谷縣人民醫(yī)院)、期刊名稱(chēng)(西部中醫(yī)藥)、關(guān)鍵詞(代謝綜合征;頸動(dòng)脈粥樣硬化;川丹消斑湯;辛伐他?。?、分類(lèi)號(hào)(R589)、文章編號(hào)、基金項(xiàng)目、摘要等信息。
第二步,文獻(xiàn)標(biāo)題、關(guān)鍵詞等信息判斷文獻(xiàn)的分類(lèi),將歸入“臨床治療類(lèi)”、“機(jī)理實(shí)驗(yàn)類(lèi)”、“流行病學(xué)類(lèi)”、“健康管理類(lèi)”和“綜合文獻(xiàn)類(lèi)”中的其中一類(lèi),在這里經(jīng)過(guò)判別歸為“臨床治療類(lèi)”。
第三步,錄入文獻(xiàn)研究對(duì)象,涉及的數(shù)據(jù)表如表2所示。部分內(nèi)容如下表所示:
第四步,錄入“研究方法”,該文獻(xiàn)分類(lèi)對(duì)應(yīng)的數(shù)據(jù)項(xiàng)如表3、表4字段所示。
第五部,錄入“研究結(jié)果”,該文獻(xiàn)分類(lèi)對(duì)應(yīng)的數(shù)據(jù)項(xiàng)如表5字段所示。
平臺(tái)后端系統(tǒng)設(shè)計(jì)中,使用EasyUi作為一個(gè)良好的后端表現(xiàn)層框架,在對(duì)數(shù)據(jù)的增、刪、改、查等操作上具有極大的便利性[8-9],“研究方法”部分的文獻(xiàn)數(shù)據(jù)錄入界面效果如圖2所示。
4 結(jié)論及展望
通過(guò)建立此代謝綜合征文獻(xiàn)數(shù)據(jù)庫(kù),整理巨量的代謝綜合征文獻(xiàn)數(shù)據(jù),并按照分類(lèi)的特征抽取出有效的信息,以結(jié)構(gòu)化的方式存儲(chǔ)起來(lái),使臨床醫(yī)生、科研工作者閱讀文獻(xiàn)的效率得到極大的提高。由于數(shù)據(jù)庫(kù)中的數(shù)據(jù)具有結(jié)構(gòu)化的特點(diǎn),因此,研究者能夠以數(shù)據(jù)庫(kù)內(nèi)各系統(tǒng)表字段為基礎(chǔ),建立代謝綜合征文獻(xiàn)質(zhì)量評(píng)價(jià)報(bào)告以及對(duì)代謝綜合征文獻(xiàn)的大量數(shù)據(jù)進(jìn)行數(shù)據(jù)分析及挖掘,為后續(xù)科研與臨床工作提供文獻(xiàn)支持,實(shí)現(xiàn)代謝綜合征研究的可持續(xù)發(fā)展。
參考文獻(xiàn):
[1]Paul L.Huang. A xomprehensive definition for metabolic syndrome[J].Disease Models&Mechanisms,2009(2):231-237.
[2]CAMERONA J,SHAWJE,ZIMMETPZ.The metabolic syndrome: prevalence in worldwide populations[J]. Endocrinology and metabolism clinics of North America,2004,33(2) : 351-375.
[3]XI B,HE D,HU Y,et al.Prevalence of metabolic syndrome and its influencing factors among the Chinese adults:the China Health and Nutrition Survey in 2009[J].Preventive Medicine, 2013, 57(6) : 867- 871.
[4]于冬梅,趙麗云,樸建華,等.8省市兒童青少年代謝綜合征流行現(xiàn)況及其主要影響因素[J].中國(guó)健康教育,2012,28(6): 431- 433
[5]蔣永平.川丹消斑湯聯(lián)合西藥治療代謝綜合征頸動(dòng)脈粥樣硬化療效觀察[J].西部中醫(yī)藥,2013(5):100-102.
[6]中華糖尿病雜志編輯部.國(guó)際糖尿病聯(lián)盟代謝綜合征全球共識(shí)解讀[J].宋秀霞,譯.紀(jì)立農(nóng),校.中華糖尿病雜志,2005,13(3):178-18.
[7]華揚(yáng).如何提高缺血性腦血管病超聲探測(cè)的準(zhǔn)確性[J].中華醫(yī)學(xué)超聲雜志,2006,3(4):193-195.
[8] XIAO Shuo- bai. Design and Implementation of Web Asynchronous Tree Based on EasyUI[C]. Proceedings of 2011 3rd IEEE International Conference on Information Management and Engineering (ICIME 2011)VOL.06:121-123.
[9]黃培泉.基于.NET與EasyUI的工資查詢(xún)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[ J] .福建電腦, 2013(4):104-106