李自青,閆玉清*,邢雁霞,解瑯明,韓飛宇,張年萍,5*
(1.山西大同大學(xué)醫(yī)學(xué)院,山西大同037009;2.山西大同大學(xué)呼吸病與職業(yè)病研究所,山西大同037009;3.哈爾濱師范大學(xué)生命科學(xué)與技術(shù)學(xué)院,黑龍江哈爾濱150025;4.山西威奇達(dá)光明制藥有限公司,山西大同037000;5.山西大同大學(xué)中西醫(yī)結(jié)合心血管病研究所,山西大同037009)
先天性心臟傳導(dǎo)阻滯(Congenital Heart Block,CHB)是一種完全性房室傳導(dǎo)阻滯的心臟病,一般在妊娠的18~24 周之間發(fā)生,主要表現(xiàn)是胎心緩慢,阻斷部位多位于房室結(jié)處,并伴有系統(tǒng)性紅斑狼瘡或干燥綜合征的發(fā)生。目前主要治療方法是兒童期手術(shù),手術(shù)越早治療效果就越好,手術(shù)中有超過2/3 的患兒需要置入永久性心臟起搏器。此類手術(shù)不但費(fèi)用高,而且術(shù)后還要面臨并發(fā)癥、后遺癥、起搏器損壞等隱患,極大地影響患兒的生活質(zhì)量。藥物治療可以避免這些麻煩,但目前缺乏特異性治療藥物,輔助性治療藥物多為化學(xué)合成藥,藥效慢且效果不明顯,而且藥物的毒副作用大。因此對(duì)先天性心臟傳導(dǎo)阻滯相關(guān)蛋白藥物靶點(diǎn)的研究對(duì)特異性藥物的研發(fā)具有重要意義。
胎兒先天性心臟傳導(dǎo)阻滯的發(fā)生與母體抗Ro/SSA 和抗La/ SSB 抗體陽性相關(guān)。研究發(fā)現(xiàn),母體相關(guān)性抗SSAGRo52 抗體可通過胎盤轉(zhuǎn)運(yùn)進(jìn)入胎兒體內(nèi),與胎兒心臟細(xì)胞的交叉反應(yīng)分子特異性結(jié)合,引起心臟鈣離子通道異常和心肌細(xì)胞凋亡,從而引發(fā)一系列炎癥反應(yīng),使胎兒心臟鈣化和纖維化,造成Ⅱ度或者Ⅲ度房室傳導(dǎo)阻滯,而La 抗體可能依賴于Ro52 抗體發(fā)揮作用[1]。CHB 是一種進(jìn)展性疾病,Ⅰ度傳導(dǎo)阻滯是CHB 的發(fā)病早期,Ⅱ度傳導(dǎo)阻滯在藥物干預(yù)下可能可逆,而完全性傳導(dǎo)阻滯是不可逆的。糖皮質(zhì)激素在早期可能阻止疾病的進(jìn)展,但療效并不確切[2]。確定特定疾病的靶標(biāo)分子是現(xiàn)代新藥研發(fā)的基礎(chǔ),藥物在體內(nèi)的作用位點(diǎn)包括蛋白質(zhì)和核酸等,其中絕大多數(shù)是蛋白質(zhì)。目前,有關(guān)先天性心臟傳導(dǎo)阻滯的藥物作用靶點(diǎn)蛋白研究還不夠透徹。
本研究在構(gòu)建CHB 相關(guān)蛋白陽性集合和候選陰性集合的基礎(chǔ)上,運(yùn)用語義相似性計(jì)算兩個(gè)集合的功能相似性,預(yù)測(cè)出20 個(gè)潛在的藥物靶點(diǎn),并利用多個(gè)數(shù)據(jù)庫對(duì)預(yù)測(cè)的蛋白及編碼基因進(jìn)行富集分析,挖掘潛在的CHB 藥物靶點(diǎn)的功能、通路、MicroRNA、SNP,為特異性藥物的研發(fā)奠定基礎(chǔ)。
本研究時(shí)間為201609—201812月。
以“Congenital Heart Block”“association study”“genetic association”為檢索詞在 NCBI 中 PubMed 數(shù)據(jù)庫查找相關(guān)文獻(xiàn)571 篇(圖1),論文入選標(biāo)準(zhǔn)見文獻(xiàn)[3],通過全文閱讀得到與CHB 直接相關(guān)的基因21個(gè),構(gòu)建CHB陽性集合。
圖1 文獻(xiàn)檢索流程
在 DrugBank 數(shù)據(jù)庫中以“atrioventricular block”“heart block”“cardiac conduction”或“congenial heart block”多個(gè)檢索詞進(jìn)行檢索,獲取與CHB疾病相關(guān)的藥物及其作用靶點(diǎn),刪除信息項(xiàng)和重復(fù)數(shù)據(jù),得到601 種藥物和685 個(gè)相關(guān)蛋白。通過疾病間臨床遺傳表型的相似性對(duì)預(yù)處理過的數(shù)據(jù)進(jìn)行優(yōu)化和篩選,以CHB 與心律失常、心臟衰竭存在的關(guān)聯(lián)信息和疾病間信息作為篩選標(biāo)準(zhǔn),篩選出156 個(gè)CHB 相關(guān)基因構(gòu)建CHB 候選陰性集合。
通過在線網(wǎng)絡(luò)平臺(tái)GOEAST 富集分析GO 數(shù)據(jù)庫中的生物學(xué)過程分支,將基因集轉(zhuǎn)換為GO 節(jié)點(diǎn)集。通過比較兩個(gè)GO 節(jié)點(diǎn)集的相似性可以得出兩個(gè)基因集合的語義相似性,GO 節(jié)點(diǎn)集相似性算法參照Lin[4]算法,得分越高,兩個(gè)集合間功能就越相似。
在全基因組中隨機(jī)選取與所研究的基因集合容量一樣大的基因集合2 個(gè),選取100 次,計(jì)算其相似性得分,將CHB陽性基因集合和陰性基因集合的相似性得分與隨機(jī)得分進(jìn)行permutation test 檢驗(yàn),當(dāng)P<0.05時(shí),差異顯著。
Endeavour[5]是對(duì)候選基因進(jìn)行優(yōu)先排序的網(wǎng)絡(luò)資源。使用一組已知參與生物學(xué)過程的基因,即CHB 陽性基因集,選擇研究對(duì)象物種,包括小家鼠、褐家鼠、秀麗隱桿線蟲、人類,提交已知基因,選擇數(shù)據(jù)庫,包括本體和注釋、蛋白質(zhì)-蛋白質(zhì)相互作用、順式調(diào)控信息、基因表達(dá)數(shù)據(jù)集、序列信息和文本挖掘數(shù)據(jù)庫,作為CHB候選基因優(yōu)化的參照標(biāo)準(zhǔn),最后提交候選基因。根據(jù)已知基因的特征對(duì)候選基因進(jìn)行排序,將幾個(gè)排名合并到候選基因的全局排名中,從而獲得候選基因的優(yōu)化排序結(jié)果。
GeneCodis[6]是對(duì)基因進(jìn)行功能注釋的網(wǎng)絡(luò)平臺(tái),整合了多個(gè)數(shù)據(jù)庫包括GO、KEGG和SwissProt,可實(shí)現(xiàn)對(duì)候選基因的GO、通路、SNP、microRNA等富集分析,并通過統(tǒng)計(jì)的顯著性進(jìn)行排序。使用方法與Endeavour類似。
通過語義相似性計(jì)算得出CHB 陽性基因集與候選陰性基因集的相似性得分是0.596,而兩個(gè)隨機(jī)基因集合的平均得分是0.144,P值為0,差異倍數(shù)(fold-change,F(xiàn)C)為4.15,相似性得分顯著高于隨機(jī)水平,差異極顯著。表明CHB陽性集與候選陰性集的功能具有相關(guān)性。
運(yùn)用Endeavour 網(wǎng)絡(luò)平臺(tái)從已知基因間的相似性出發(fā)優(yōu)化候選基因,在排序結(jié)果中抽取前20 個(gè)基因作為可能的CHB 藥物靶點(diǎn)進(jìn)行下一步富集分析(表1)。
表1 候選基因集中排序前20的基因及編碼蛋白
通過GO 數(shù)據(jù)庫對(duì)這20 個(gè)藥物靶點(diǎn)的編碼基因進(jìn)行注釋,從分子功能、參與的生物學(xué)過程及細(xì)胞中的定位三方面進(jìn)行富集分析(見圖2 ~4)。結(jié)果表明,20 個(gè)基因的功能更多的與離子轉(zhuǎn)運(yùn)通道有關(guān),參與的過程主要集中于生理過程,蛋白主要定位于細(xì)胞和膜上。同時(shí),以整個(gè)候選陰性集中所有蛋白的GO 功能分類為背景,這些功能活性也都排在前列。由此可見20 個(gè)基因具有代表性,有可能是潛在的與CHB 直接相關(guān)的藥物靶點(diǎn)。
圖2 20個(gè)基因所對(duì)應(yīng)蛋白的GO主要功能分類
圖3 20個(gè)基因所對(duì)應(yīng)蛋白的GO主要過程分類
圖4 20個(gè)基因所對(duì)應(yīng)蛋白的GO主要定位分類
運(yùn)用GeneCodis進(jìn)行通路富集分析(圖5),所富集的通路信息來源于KEGG。結(jié)果表明,候選的陰性基因集中有18 個(gè)基因富集在鈣信號(hào)傳導(dǎo)通路(KEGG 04020),16 個(gè)基因富集在MAPK 信號(hào)通路(KEGG 04010),15個(gè)基因富集在肥厚性心肌病信號(hào)通路(KEGG 05410),14個(gè)基因富集在致心律失常性右心室心肌病信號(hào)通路(KEGG 05412)和擴(kuò)張性心肌病信號(hào)通路(KEGG 05411)。這些結(jié)果進(jìn)一步表明CHB與心律失常、心臟衰竭等心肌病存在關(guān)聯(lián)。
圖5 每條通路注釋的基因數(shù)
運(yùn)用GeneCards 數(shù)據(jù)庫[7]對(duì)所預(yù)測(cè)的20 個(gè)候選基因進(jìn)行SNP信息檢索,共檢索到4 538個(gè)SNP,其中富集次數(shù)大于100次的SNP有11對(duì)(見圖6),C/T富集次數(shù)最多為773次,其次是G/A為623次,A/G為569次。
microRNA 富集分析發(fā)現(xiàn),20 個(gè)候選基因主要富集于hsa-miR-770-5p、hsa-miR-519e、hsa-miR-660 和hsa-miR-587 上。隨后對(duì)整個(gè)候選陰性集中的基因進(jìn)行microRNA 富集,文章列舉富集基因數(shù)大于13 個(gè)的microRNA,其中有15 個(gè)基因富集在hsa-miR-770-5p 上,為下一步microRNA 的研究提供了方向。
圖6 20個(gè)候選基因所富集的SNP
藥物作用靶點(diǎn)的研究為新藥研發(fā)和疾病治療提供非常重要的依據(jù),但目前針對(duì)CHB藥物作用靶點(diǎn)的研究還不系統(tǒng)深入,治療CHB也缺乏特異性藥物。雖然已有的研究發(fā)現(xiàn)SSA/Ro(52-kDa)、SSA/Ro(60-kDa)、α1-腎上腺素受體、β2-腎上腺素受體以及La/SSB 這些母體自身抗體與CHB 密切相關(guān)[8],但僅從已知數(shù)據(jù)中研究CHB 藥物作用靶點(diǎn),顯然具有很大的局限性。
本研究通過CHB 與心律失常和心臟衰竭存在的疾病關(guān)聯(lián)出發(fā),從Drugbank數(shù)據(jù)庫中檢索并初步注釋優(yōu)化篩選出156 個(gè)CHB 相關(guān)基因作為CHB 的候選陰性集合。通過語義相似性計(jì)算證明CHB 陰性基因集合與CHB 陽性基因集合之間功能高度相似,進(jìn)一步運(yùn)用Endeavour 對(duì)候選基因進(jìn)行優(yōu)化排序和GO富集分析,發(fā)現(xiàn)其中有20個(gè)基因編碼蛋白是CHB潛在的藥物作用靶點(diǎn)蛋白,功能主要與離子通道轉(zhuǎn)運(yùn)有關(guān),參與的生物學(xué)過程主要是生理過程,蛋白更多定位于細(xì)胞膜中。通路富集分析也發(fā)現(xiàn)CHB候選基因更多參與鈣離子信號(hào)傳導(dǎo)通路,與功能富集分析的結(jié)果一致,而鈣信號(hào)傳導(dǎo)通路也是目前研究較多并且認(rèn)為與CHB相關(guān)的信號(hào)通絡(luò)[9]。SNP(single nucleotide polymorphism) 是單個(gè)核苷酸的改變引起的DNA 序列多態(tài)性,已有的研究發(fā)現(xiàn)SNP和microRNA 的表達(dá)與心血管疾病的發(fā)病有關(guān)[10-11]。本研究對(duì)候選基因進(jìn)行的SNP 及microRNA 富集分析,將為今后研究SNP 及microRNA 與先天性心臟傳導(dǎo)阻滯的關(guān)系提供參考。
本研究運(yùn)用生物信息學(xué)方法研究CHB 相關(guān)的藥物作用靶點(diǎn)及其相關(guān)通路,從生物大數(shù)據(jù)出發(fā),考慮到疾病之間的關(guān)聯(lián)和相互影響,為下一步的特異性藥物的研發(fā)提供新的研究方向。本研究運(yùn)用的語義相似性和富集分析的研究方法為其他疾病相關(guān)蛋白的研究提供參考。但本實(shí)驗(yàn)對(duì)研究結(jié)果沒有進(jìn)行驗(yàn)證,缺乏實(shí)驗(yàn)數(shù)據(jù)支持,還需要進(jìn)一步研究。