展俊平,鄭 光,孟慶良,谷慧敏,左瑞庭,呂 誠(chéng),姜 淼△
(1.河南中醫(yī)藥大學(xué)第二附屬醫(yī)院,鄭州 450002; 2. 蘭州大學(xué)數(shù)學(xué)院, 蘭州 730000;3. 中國(guó)中醫(yī)科學(xué)院中醫(yī)臨床基礎(chǔ)醫(yī)學(xué)研究所, 北京 100700)
雷公藤(TriptergiumwilfordiiHook. F)為衛(wèi)矛科一年生藤本植物,作為傳統(tǒng)中藥的使用歷史悠久。最早在《神農(nóng)本草經(jīng)》中就有所記載,主要以根入藥,歸肝腎經(jīng),性苦、辛、涼、大毒,具有祛風(fēng)除濕、活血化瘀、清熱解毒、消腫散結(jié)、殺蟲(chóng)止血等功效。其廣泛分布于中國(guó)南方,為中國(guó)的傳統(tǒng)中藥,具有免疫調(diào)節(jié)、抗炎、抗腫瘤、抗生育、抗菌等藥理作用[1]。雷公藤化學(xué)成分非常復(fù)雜,目前所知其主要成分包括生物堿類(lèi)、二萜類(lèi)、三萜類(lèi)、倍半萜以及糖在內(nèi)的380多種物質(zhì),多種生物堿類(lèi)化合物及其他小分子化合物已從雷公藤植物中分離鑒定出來(lái)[2]。
本文擬用文本數(shù)據(jù)挖掘方式,采用現(xiàn)有的臨床研究及實(shí)驗(yàn)研究文獻(xiàn)資料,運(yùn)用基于敏感關(guān)鍵詞頻數(shù)統(tǒng)計(jì)的數(shù)據(jù)分層算法,對(duì)雷公藤相關(guān)的疾病及其生物作用靶點(diǎn)進(jìn)行初步的總結(jié)分析,以期能進(jìn)一步指導(dǎo)臨床用藥,并為相關(guān)研究提供一定的理論基礎(chǔ)。
文本挖掘是從非結(jié)構(gòu)化、自然語(yǔ)言描述的文本數(shù)據(jù)中,抽取有意義的數(shù)據(jù)應(yīng)用到生物醫(yī)學(xué)領(lǐng)域,文本挖掘可以分為文本數(shù)據(jù)收集、(預(yù))處理、結(jié)構(gòu)化分析、可視化以及評(píng)價(jià)5個(gè)步驟[3]。
文本數(shù)據(jù)的收集來(lái)自中國(guó)生物醫(yī)學(xué)文獻(xiàn)服務(wù)系統(tǒng) (英文全稱(chēng)Chinese BioMedical Literature Database,簡(jiǎn)稱(chēng)CBM)的論文摘要。在主題檢索下分別檢索關(guān)鍵詞“雷公藤”。經(jīng)過(guò)檢索出現(xiàn)主題詞、命中文獻(xiàn)數(shù),合并檢索主題詞分別得到文獻(xiàn)12957篇(檢索日期2017年9月16日)。為獲取文獻(xiàn)的詳細(xì)信息,如流水號(hào)、標(biāo)題、摘要、主題詞等,在顯示格式中選擇“詳細(xì)”和“顯示全部”然后進(jìn)行下載。
從CBM下載的文本數(shù)據(jù),按照下載的先后順序合并到一個(gè)平面文本文件(后綴txt)中,并以ANSI編碼進(jìn)行保存。在此基礎(chǔ)上,利用專(zhuān)有的文本提取工具(軟件著作權(quán),軟著登字第0261882號(hào),登記號(hào)2010SR073409),對(duì)下載的文本數(shù)據(jù)進(jìn)行信息提取,并將格式化的結(jié)果保存到大型關(guān)系型數(shù)據(jù)庫(kù)(microsoft sql server 2008 R2,以下簡(jiǎn)稱(chēng)SQL)中。針對(duì)初步提取出來(lái)的數(shù)據(jù),構(gòu)建算法并對(duì)其中可能的噪音進(jìn)行清洗[4]。
清洗后的數(shù)據(jù)仍然采取數(shù)據(jù)切片分層的形式,針對(duì)挖掘?qū)ο蟮囊痪S和二維頻次數(shù)據(jù)進(jìn)行分析(即相關(guān)挖掘要素在數(shù)據(jù)集中出現(xiàn)文獻(xiàn)總的頻數(shù)以及兩兩之間的頻數(shù)關(guān)系),用Cytoscape 2.8軟件進(jìn)行可視化處理。
本文中形成可視化的二維網(wǎng)絡(luò)圖,筆者采用連線(xiàn)的寬度和圖形大小2種方式同時(shí)進(jìn)行客觀(guān)展示,圖形內(nèi)為獨(dú)立要素名稱(chēng),連線(xiàn)代表要素兩兩之間的關(guān)聯(lián)。圖形的面積越大,代表該要素與其他要素關(guān)聯(lián)的越多,權(quán)重越大,連線(xiàn)越寬[4]代表該要素與雷公藤的關(guān)系越密切,在文獻(xiàn)中出現(xiàn)的頻次越高。同時(shí)結(jié)合專(zhuān)業(yè)知識(shí)進(jìn)行解析,對(duì)于不合理的結(jié)果,即回溯原文獻(xiàn)數(shù)據(jù)集,按算法進(jìn)行噪音清洗[5]。人工閱讀評(píng)價(jià)使得結(jié)果更加客觀(guān),通過(guò)這種優(yōu)化的文本挖掘組合,盡可能客觀(guān)地呈現(xiàn)各方面的的信息。
表1顯示,文本挖掘共提取到281種疾病,選擇頻次較高有代表意義的前10個(gè)列出(括號(hào)內(nèi)為文獻(xiàn)篇數(shù),下同):關(guān)節(jié)炎(1137)、類(lèi)風(fēng)濕(741)、腎小球腎炎(387)、腎病綜合征(321)、糖尿病腎病(287)、紫癜(250)、銀屑病(247)、哮喘(139)、紅斑狼瘡(116)、腫瘤(86)。由于構(gòu)建詞表及挖掘詞的包含關(guān)系,出現(xiàn)以上結(jié)果重復(fù)的現(xiàn)象,說(shuō)明挖掘詞越短,挖掘到的頻次越高,其結(jié)果基本反映了雷公藤治療相關(guān)疾病的一維特征。
圖1顯示,在此基礎(chǔ)上依據(jù)共同出現(xiàn)的原則,構(gòu)建雷公藤對(duì)應(yīng)的疾病二維網(wǎng)絡(luò)。圖中節(jié)點(diǎn)為疾病名稱(chēng),連線(xiàn)代表不同疾病間的聯(lián)系,疾病的連線(xiàn)越多越寬,節(jié)點(diǎn)就越大,其權(quán)重也越大;連線(xiàn)寬度與臨床報(bào)道文獻(xiàn)數(shù)量多少呈指數(shù)線(xiàn)性關(guān)系。
表1 雷公藤疾病一維結(jié)果比較
文本挖掘共提取到1389項(xiàng)疾病組合,圖1為頻次大于2的疾病組合參與構(gòu)建的網(wǎng)絡(luò)圖。由圖可知,類(lèi)風(fēng)濕、關(guān)節(jié)炎圓圈最大,其相應(yīng)的權(quán)重最高,其他疾病次之,且二者之間關(guān)聯(lián)最密切(連線(xiàn)最寬)?;乜磾?shù)據(jù)結(jié)果,“類(lèi)風(fēng)濕”和“關(guān)節(jié)炎”頻數(shù)為691。追溯原文獻(xiàn),可能是因?yàn)樵诙喾N疾病中均會(huì)伴隨關(guān)節(jié)炎的臨床癥狀表現(xiàn)。
圖1 雷公藤相關(guān)疾病二維網(wǎng)絡(luò)圖
文本挖掘共提取到358個(gè)結(jié)果,選擇前10個(gè)列出,T淋巴細(xì)胞(134)、滑膜(121)、血管(74)、基因(71)、細(xì)胞因子類(lèi)(70)、單核細(xì)胞類(lèi)(61)、蛋白質(zhì)類(lèi)(61)、足細(xì)胞(51)、內(nèi)皮(50)、巨噬細(xì)胞(46)。
圖2顯示,文本挖掘共提取到65項(xiàng)免疫靶標(biāo)組合。圖3顯示,血管與內(nèi)皮相關(guān)度最高,其次為滑膜與成纖維細(xì)胞、膜糖蛋白類(lèi)與載體蛋白質(zhì)類(lèi)。
圖3顯示,同樣方法文本挖掘共提取59個(gè)生物分子靶標(biāo)結(jié)果,選擇前10個(gè)列出,文本挖掘共提取到184項(xiàng)生物分子組合,頻次大于8的分子組合參與構(gòu)建的網(wǎng)絡(luò)圖。圖3可知,腫瘤壞死因子α處于核心位置,與白介素1、白介素6、白介素10的相關(guān)度最高。
表2 雷公藤生物靶標(biāo)一維結(jié)果
圖3 雷公藤生物分子二維網(wǎng)絡(luò)圖
作用靶標(biāo)頻次權(quán)重TNF?α1980245RNA1210149IL?2930115IL?6930115IL?1710087轉(zhuǎn)化生長(zhǎng)因子β550068CD4540066IL?10510063CD8410050IL?4410050
圖2 雷公藤生物靶標(biāo)二維網(wǎng)絡(luò)圖
文本挖掘共有20條通路,選擇前10條列出。
圖4顯示,文本挖掘共提取到45項(xiàng)通路組合,頻次大于2的通路組合參與構(gòu)建的網(wǎng)絡(luò)圖。圖4顯示,PI3K/Akt、TLR4/NF-κB相關(guān)度最高。
雷公藤臨床應(yīng)用極為廣泛,盡管其具有較大的副作用,但因其療效顯著,眾多學(xué)者對(duì)其生物學(xué)作用機(jī)制仍進(jìn)行了不斷的深入研究。圖1顯示,雷公藤主要用于關(guān)節(jié)炎、類(lèi)風(fēng)濕、腎病、皮膚病等領(lǐng)域,提示與其抗炎及免疫抑制作用密不可分;圖2顯示,從淺層分析認(rèn)為主要作用于T淋巴細(xì)胞群、滑膜、血管、細(xì)胞因子類(lèi),圖3提示具體包括TNF-α、RNA、白介素類(lèi),而圖4通路則以NF-κB、Akt、Fas/FasL等為主,二維結(jié)果中類(lèi)風(fēng)濕與關(guān)節(jié)炎的關(guān)聯(lián)度最高,內(nèi)皮與血管關(guān)系密切,腫瘤壞死因子與白細(xì)胞介素類(lèi)共同出現(xiàn)頻次較高,PI3K/Akt、TLR4/NF-κB相關(guān)度最高。
表4 雷公藤相關(guān)通路一維結(jié)果
圖4 雷公藤相關(guān)通路二維結(jié)果
T淋巴細(xì)胞是雷公藤作用的主要靶細(xì)胞,能夠有非選擇性、非平衡性的抑制作用,糾正免疫系統(tǒng)紊亂,抑制免疫細(xì)胞增殖及誘導(dǎo)細(xì)胞凋亡等[6]。實(shí)驗(yàn)證實(shí),雷公藤多苷對(duì)早期糖尿病腎病患者具有一定的血管內(nèi)皮修復(fù)效應(yīng),同時(shí)可糾正患者 T 淋巴細(xì)胞亞群失衡現(xiàn)象[7]。而在治療自身免疫性疾病中,雷公藤對(duì)促炎和抗炎性細(xì)胞因子均有一定的調(diào)節(jié)作用。其有效成分雷公藤甲素可以通過(guò)抑制TNF-α信號(hào)傳導(dǎo)通路,進(jìn)而抑制其與IL-6 的協(xié)同作用,達(dá)到抑制炎癥反應(yīng)的目的[8];亦能作用于白細(xì)胞介素-2(IL-2)及其受體的基因轉(zhuǎn)錄水平,抑制兩者的基因表達(dá)和其介導(dǎo)的細(xì)胞免疫反應(yīng)。此外,白細(xì)胞介素-10 (IL -10) 具有誘導(dǎo)致炎細(xì)胞因子凋亡的特性,雷公藤甲素通過(guò)上調(diào) IL-10下調(diào) IL -1、IL-6、IL -8及 TNF-α 等促炎因子,達(dá)到延緩和降低發(fā)病[9]。
NF-κB是一種重要的核轉(zhuǎn)錄因子,存在于大多數(shù)真核細(xì)胞中,可誘導(dǎo)多種細(xì)胞因子、黏附分子和受體分子等基因表達(dá),雷公藤通過(guò)調(diào)控參與炎癥級(jí)聯(lián)效應(yīng)多種酶的基因表達(dá)發(fā)揮免疫抑制作用[10]。研究證實(shí),NF-κB信號(hào)通路在軟骨細(xì)胞的增殖、分化、凋亡中扮演著十分重要的角色[11]。而死亡受體Fas (又稱(chēng)為CD95/Apo-1)介導(dǎo)著細(xì)胞凋亡的外在通道,F(xiàn)asL或抗Fas抗體與Fas結(jié)合后可激活一系列細(xì)胞內(nèi)信號(hào)通路,進(jìn)而誘導(dǎo)細(xì)胞凋亡[12]。有報(bào)道稱(chēng),雷公藤多苷可明顯降低TNBS小鼠結(jié)腸上皮細(xì)胞中Fas表達(dá),增加FasL含量,同時(shí)可明顯降低結(jié)腸上皮細(xì)胞處于G0-G1增殖期數(shù)量,升高S期數(shù)量,說(shuō)明雷公藤多苷可以通過(guò)調(diào)節(jié)Fas/FasL信號(hào)途徑,加速炎細(xì)胞凋亡,完成修復(fù)過(guò)程,進(jìn)而治療或緩解結(jié)腸黏膜炎性損傷[13]。
AKT通路則廣泛存在于細(xì)胞中,是參與細(xì)胞生長(zhǎng)、增殖、分化調(diào)節(jié)的信號(hào)傳導(dǎo)通路,與人類(lèi)惡性腫瘤、慢性炎癥甚至過(guò)敏反應(yīng)中相關(guān)下游主要效應(yīng)靶基因激活相關(guān),造成細(xì)胞凋亡[14]。雷公藤紅素對(duì)肥大細(xì)胞脫顆粒的抑制作用是通過(guò)下調(diào)PI3K / AKT信號(hào)通路上重要的抗凋亡基因Pik3r3、Akt2的表達(dá)以及上調(diào)促凋亡基因 Gsk3b的表達(dá)實(shí)現(xiàn)的[15]。另外,作為雷公藤的重要靶向通路之一的ERK,報(bào)道顯示復(fù)方雷公藤外敷劑能降低關(guān)節(jié)炎大鼠血清及滑膜組織中炎癥因子,抑制滑膜組織ERK通路的活化,從而抑制滑膜組織增殖、減少滑膜中血管新生和血管翳形成[16]。
文本挖掘(Text Mining)技術(shù)是以計(jì)算語(yǔ)言學(xué)及統(tǒng)計(jì)數(shù)理分析為理論基礎(chǔ),借用大數(shù)據(jù)時(shí)代的信息服務(wù)于各學(xué)科的交叉學(xué)科[17]。中醫(yī)藥源遠(yuǎn)流長(zhǎng),有許多行之有效的寶貴經(jīng)驗(yàn)需要更為科學(xué)直觀(guān)的驗(yàn)證,基于循證醫(yī)學(xué)的文本挖掘技術(shù)無(wú)疑是一有利工具,尤其在生物分子機(jī)制方面的深入探討[18],通過(guò)對(duì)信息產(chǎn)生的潛在的關(guān)聯(lián)關(guān)系,讓我們獲取和拓展新的知識(shí)[19]。
參考文獻(xiàn):
[1] WANG H L, JIANG Q, FENG X H, et al. Tripterygium wilfordii, Hook F versus conventional synthetic disease-modifying anti-rheumatic drugs as monotherapy for rheumatoid arthritis: a systematic review and network meta-analysis[J]. Bmc Complementary & Alternative Medicine, 2016, 16(1):215.
[2] WONG K F, YUAN Y, LUK J M. Tripterygium wilfordii bioactive compounds as anticancer and anti-inflammatory agents[J]. Clinical & Experimental Pharmacology & Physiology, 2012, 39(3):311.
[3] 孟慶良, 展俊平, 郭會(huì)卿,等. 基于文本挖掘技術(shù)析甲氨蝶呤與中醫(yī)治療聯(lián)合應(yīng)用的規(guī)律[J]. 中國(guó)中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志, 2014, 20(12):1665-1667.
[4] 沈姍姍, 鄭光, 展俊平,等. 基于數(shù)據(jù)挖掘探討類(lèi)風(fēng)濕關(guān)節(jié)炎證-癥-法-方藥規(guī)律[J]. 風(fēng)濕病與關(guān)節(jié)炎, 2013(10):5-9.
[5] 李仲賢, 鄭光, 展俊平,等. 基于文本挖掘技術(shù)探索強(qiáng)直性脊柱炎“理-法-方-藥”相應(yīng)規(guī)律[J]. 蘭州工業(yè)學(xué)院學(xué)報(bào), 2013, 20(2):23-26.
[6] 何英蒙,姚媛媛,陳一龍,等.雷公藤類(lèi)制劑的研究進(jìn)展[J].中國(guó)藥房,2017,28(4):551-554.
[7] 周瑞琴, 李小巧, 楊艷琴. 雷公藤多苷對(duì)早期糖尿病腎病患者的血管內(nèi)皮功能及T淋巴細(xì)胞亞群的影響[J]. 世界中醫(yī)藥, 2017, 12(8):1840-1843.
[8] 王偉東, 陳如平, 肖魯偉,等. 雷公藤甲素對(duì)類(lèi)風(fēng)濕關(guān)節(jié)炎滑膜新生血管中血管內(nèi)皮生長(zhǎng)因子、白細(xì)胞介素-6抑制機(jī)理的探討[J]. 中醫(yī)正骨, 2012, 24(2):3-5.
[9] 曹學(xué)梅. 雷公藤多苷對(duì)類(lèi)風(fēng)濕關(guān)節(jié)炎患者血清細(xì)胞因子水平的影響[J]. 中國(guó)藥業(yè), 2013, 22(7):21-23.
[10] 張敏, 王守安, 劉黎星,等. 雷公藤多苷干預(yù)TLR-NF-κB通路發(fā)揮免疫抑制作用[J]. 中草藥, 2014, 45(9):1288-1292.
[11] 周莊, 張柳. NF-κB信號(hào)通路在骨性關(guān)節(jié)炎發(fā)生發(fā)展中作用機(jī)制的研究[J]. 中國(guó)骨質(zhì)疏松雜志, 2012, 18(1):78-82.
[12] YAMADA A, ARAKAKI R, SAITO M, et al. Dual Role of Fas/FasL-Mediated Signal in Peripheral Immune Tolerance[J]. Frontiers in Immunology, 2017, 8(4):403.
[13] 黃小英, 劉端勇, 程紹民,等. 雷公藤多苷對(duì)結(jié)腸炎小鼠結(jié)腸上皮細(xì)胞周期及Fas/Fas L表達(dá)的影響[J]. 時(shí)珍國(guó)醫(yī)國(guó)藥, 2012, 23(11):2785-2786.
[14] 王曉南, 吳青, 楊旭,等. 雷公藤紅素對(duì)白血病細(xì)胞Akt信號(hào)通路的影響及在細(xì)胞凋亡中的作用[J]. 中國(guó)中西醫(yī)結(jié)合雜志, 2011, 31(2):228-232.
[15] 姚賜玉, 王滔, 蔣云林,等. 雷公藤紅素對(duì)致敏肥大細(xì)胞的抑制作用及其中PI3K/AKT/GSK3-β信號(hào)通路的影響[J]. 福建醫(yī)藥雜志, 2017, 39(1):61-64.
[16] 趙越, 唐曉頗, 姜泉,等. 復(fù)方雷公藤外敷對(duì)Ⅱ型膠原誘導(dǎo)型關(guān)節(jié)炎大鼠滑膜組織細(xì)胞因子及ERK通路的影響[J]. 中醫(yī)雜志, 2017, 58(7):582-586.
[17] LI Z, et al.Applying Discrete Derivative Algorithm in Two Dimensions in Mining Acupuncture and Moxibustion Rules on Bell’s Palsy, in Eighth International Conference on Fuzzy Systems and Knowledge Discovery (FSKD),2011: 1570-1574.
[18] ANANIADOU S, THOMPSON P, NAWAZ R, et al. Event-based text mining for biology and functional genomics[J]. Briefings in Functional Genomics, 2015, 14(3):213-230.
[19] O'MARAEVES A, THOMAS J, MCNAUGHT J, et al. Using text mining for study identification in systematic reviews: a systematic review of current approaches[J]. Systematic Reviews, 2015, 4(1):5.