(湖北省天門市第一人民醫(yī)院1 新生兒科,2 麻醉科,天門市 431700,電子郵箱:sunting0203@163.com)
川崎病又稱為皮膚黏膜淋巴結(jié)綜合征,是一種全身性、免疫性的血管炎性反應(yīng)疾病,主要見于5歲以下兒童。該病主要累及中小動脈,尤以冠狀動脈損害最為嚴(yán)重。隨著發(fā)病率的增高,川崎病成為兒童后天獲得性心臟病的首要原因,同時也是成年后發(fā)生缺血性心臟病的潛在危險因素[1]。盡管發(fā)現(xiàn)川崎病已近50年,但其發(fā)病機(jī)制仍不明確,而部分觀點(diǎn)認(rèn)為其可能與感染及異常的免疫激活有關(guān)[2]。因此,有必要進(jìn)一步探索川崎病可能的發(fā)病機(jī)制,從而為臨床早期診斷及治療提供依據(jù)。
DNA甲基化是主要的表觀遺傳修飾方式之一,是調(diào)節(jié)基因功能的重要途徑。一般來說,DNA高甲基化與基因沉默相關(guān),低甲基化則與基因活化有關(guān)。DNA甲基化與生長、發(fā)育以及腫瘤等疾病的形成密切相關(guān),例如抑癌基因的高甲基化已被證實(shí)在癌癥的發(fā)生發(fā)展中扮演重要角色[3]。然而,目前僅有少數(shù)研究關(guān)注川崎病相關(guān)甲基化致病基因,且均集中在個別基因[4-5],整個基因組的甲基化水平及其功能尚未明確。近年來,基因微陣列芯片技術(shù)的發(fā)展為分析基因組甲基化水平提供了可能。本研究通過挖掘基因表達(dá)綜合數(shù)據(jù)庫(Gene Expression Omnibus,GEO)中DNA甲基化的芯片數(shù)據(jù),并聯(lián)合基因表達(dá)芯片數(shù)據(jù)進(jìn)行分析,探討川崎病相關(guān)甲基化基因及其在發(fā)病機(jī)制中的作用。
1.1 數(shù)據(jù)收集 登錄GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo),下載川崎病DNA甲基化數(shù)據(jù)集GSE84624和基因表達(dá)數(shù)據(jù)集GSE68004。GSE84624共包含24例川崎病患兒和24例健康兒童的外周血單核細(xì)胞樣本,采用Illumina Human Methylation450 BeadChip芯片進(jìn)行檢測,平臺號為GPL13534。GSE68004共收集76例完全型川崎病患兒和37例健康兒童的外周全血樣本,采用Illumina Human HT-12 V4.0 Expression BeadChip芯片進(jìn)行檢測,平臺號為GPL10558。
1.2 數(shù)據(jù)預(yù)處理 提取數(shù)據(jù)集GSE84624的甲基化β值矩陣和信號矩陣,β值反映單個基因位點(diǎn)的甲基化程度,即β=甲基化信號/(甲基化信號+非甲基化信號+100)。采用R軟件的IMA包對β值矩陣進(jìn)行過濾,具體如下:(1)過濾含缺失值的探針;(2)過濾在75%以上樣本中探測P值均大于0.05的探針;(3)過濾單核苷酸多態(tài)性相關(guān)探針;(4)過濾XY染色體上的探針;(5)若某一樣本75%以上探針的探測P值均大于1×10-5,則過濾掉該樣本。最終的β值矩陣包含樣本48例,甲基化探針368 067個。此外,提取數(shù)據(jù)集GSE68004的基因表達(dá)矩陣,過濾在5%以上樣本中表達(dá)量均為負(fù)值的探針后進(jìn)行l(wèi)og2轉(zhuǎn)換,最終得到探針16 195個。根據(jù)GPL10558注釋文件對探針進(jìn)行注釋,多個探針對應(yīng)1個基因則取均值作為該基因的表達(dá)量。
1.3 差異基因篩選 采用R軟件的Limma包篩選差異甲基化位點(diǎn)和差異表達(dá)基因(differentially expressed gene,DEG)。差異甲基化位點(diǎn)的閾值條件為|△β|>0.2及P<0.05,根據(jù)GPL13534注釋文件將差異甲基化位點(diǎn)匹配到相應(yīng)的基因,即差異甲基化基因(differentially methylated gene,DMG)。DEG的閾值條件為|log2 FC|>1及P<0.05,其中FC表示基因的差異表達(dá)倍數(shù)。DMG中高甲基化和低甲基化者再分別與DEG中低表達(dá)和高表達(dá)者取交集,得到最終的甲基化差異表達(dá)基因(methylated-differentially expressed gene,mDEG)。
1.4 基因富集分析 利用生物信息注釋數(shù)據(jù)庫DAVID(https://david.ncifcrf.gov/)對mDEG進(jìn)行基因本體論(Gene Ontology,GO)注釋,重點(diǎn)分析其相關(guān)的生物學(xué)過程。該數(shù)據(jù)庫收錄了大量基因及蛋白的生物功能注釋信息,能篩選出具有富集顯著性的生物學(xué)注釋[6]。同樣采用DAVID數(shù)據(jù)庫分析mDEG所富集的京都基因和基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)信號通路。以P<0.05表示富集具有顯著性。
1.5 蛋白質(zhì)-蛋白質(zhì)互作網(wǎng)絡(luò)的構(gòu)建 采用STRING在線工具(https://string-db.org/)構(gòu)建mDEG的蛋白質(zhì)-蛋白質(zhì)互作(protein-protein interaction,PPI)網(wǎng)絡(luò),以互作評分≥0.4作為閾值條件。采用CytoScape 3.6.0軟件對網(wǎng)絡(luò)進(jìn)行可視化并計算各個節(jié)點(diǎn)所對應(yīng)的連接度,選取連接度相對較高(≥15)的基因作為核心基因。同時,使用MCODE插件篩選網(wǎng)絡(luò)中具有連接顯著性的子模塊,篩選條件為:連接度閾值=2、節(jié)點(diǎn)得分閾值=0.2、K核=2、最大深度=100,并要求模塊得分≥5分。再對子模塊中的mDEG進(jìn)行KEGG通路分析。
2.1 川崎病相關(guān)DMG分析 在DNA甲基化數(shù)據(jù)集GSE84624中,共有2 402個位點(diǎn)存在差異甲基化,而其中97.5%(2 343/2 402)的位點(diǎn)在川崎病患兒中表現(xiàn)為低甲基化(見圖1)。通過平臺注釋文件進(jìn)行匹配分析后發(fā)現(xiàn),這些位點(diǎn)共對應(yīng)1 393個DMG,包括高甲基化者35個,低甲基化者1 358個。
圖1 川崎病相關(guān)甲基化差異位點(diǎn)的β值熱圖(前100個差異位點(diǎn))
2.2 川崎病相關(guān)DEG分析 在基因表達(dá)數(shù)據(jù)集GSE68004中,通過Limma包分析共得到1 362個DEG,其中高表達(dá)者943個,低表達(dá)者419個(見圖2)。將DEG與DMG取交集,發(fā)現(xiàn)4個基因表現(xiàn)為高甲基化低表達(dá),而187個基因表現(xiàn)為低甲基化高表達(dá)。因此,共得到191個mDEG。
圖2 川崎病相關(guān)差異表達(dá)基因
2.3 功能富集分析 通過DAVID在線工具進(jìn)行GO功能富集分析,發(fā)現(xiàn)上述mDEG主要涉及炎癥反應(yīng)、凝血作用、固有免疫應(yīng)答、脂多糖刺激反應(yīng)等生物學(xué)過程,見表1。KEGG通路分析表明,這些mDEG主要富集的通路包括血小板活化、破骨細(xì)胞分化、趨化因子信號途徑等,見表2。
2.4 PPI網(wǎng)絡(luò)分析 將上述mDEG導(dǎo)入STRING數(shù)據(jù)庫構(gòu)建PPI網(wǎng)絡(luò),該網(wǎng)絡(luò)呈無尺度分布形式(R2=0.81),共包含95個mDEG和170對相互作用關(guān)系(見圖3)。其中,MAPK14和PHLPP1為網(wǎng)絡(luò)中的核心基因,其連接度分別為18和15。利用MCODE插件篩選出一個具有連接顯著性的子模塊,該模塊由ADCY3、CXCR2、ADCY4、GNAI3和CCR7構(gòu)成。這5個mDEG全部富集在趨化因子信號通路上。
表1 mDEG的GO功能富集分析(前10)
注:SLC為溶質(zhì)轉(zhuǎn)運(yùn)蛋白家族;TNFAIP6為人腫瘤壞死因子誘導(dǎo)基因6蛋白;HDAC4為組蛋白去乙酰化酶4;MAF為肌肉腱膜纖維肉瘤癌基因同源物;NFE2為核因子紅細(xì)胞2;IRAK3為白細(xì)胞介素-1受體相關(guān)激酶3;CCR7為趨化因子受體7;PI3為磷脂?;?-激酶;SERPINB為絲氨酸蛋白激酶抑制物B;MAPK14為絲裂原活化蛋白激酶14;PLD1為磷脂酶D1;ARAP1為血管緊張素Ⅱ1型受體相關(guān)蛋白1;HIP1為人舞蹈病蛋白相互作用蛋白1;LCN2為脂質(zhì)運(yùn)載蛋白2;TLR6為Toll樣受體6;AIM2為黑色素瘤缺乏因子2;CEBPE為CCAAT/增強(qiáng)子結(jié)合蛋白。
表2 mDEG的通路富集分析
注:ADCY為腺苷酸環(huán)化酶;HHEX為造血表達(dá)同源異型盒;LIMK2為 LIM結(jié)構(gòu)域蛋白激酶2;GNAI3為鳥嘌呤核苷酸結(jié)合蛋白G3;PFKFB3為6-磷酸果糖激酶-2/果糖雙磷酸酶-2同工酶3;HK2為己糖激酶2;MKNK為MAP激酶相互作用絲/蘇氨酸激酶1。
圖3 川崎病mDEG的蛋白互作網(wǎng)絡(luò)圖
注:綠色為高甲基化低表達(dá)基因,紅色為低甲基化高表達(dá)基因,邊框加粗為網(wǎng)絡(luò)核心基因。
流行病學(xué)研究表明,川崎病的發(fā)病具有遺傳易感性,并受外界感染、致敏原和季節(jié)變化等環(huán)境因素影響[7]。而DNA甲基化是溝通環(huán)境因素與遺傳因素的橋梁,因此其可能在川崎病的發(fā)病過程中發(fā)揮重要作用。本研究首次通過整合生物信息學(xué)的方法分析DNA甲基化芯片和基因表達(dá)芯片數(shù)據(jù),發(fā)現(xiàn)川崎病相關(guān)的甲基化基因多呈低甲基化狀態(tài)。
免疫失調(diào)及其導(dǎo)致的多系統(tǒng)炎癥性損傷是川崎病的主要特點(diǎn)。在川崎病的急性期和亞急性期,異常活化的T淋巴細(xì)胞和單核細(xì)胞釋放腫瘤壞死因子α等炎癥介質(zhì),造成血管內(nèi)皮損傷[8]。同時,CD4+/CD8+T淋巴細(xì)胞比例倒置,自然殺傷細(xì)胞數(shù)量減少,使其對B淋巴細(xì)胞的抑制作用減弱,導(dǎo)致B細(xì)胞功能亢進(jìn)[9]。而在本研究中,在免疫學(xué)致病機(jī)制方面DNA甲基化主要參與調(diào)控川崎病的固有免疫反應(yīng)。近期觀點(diǎn)認(rèn)為,固有免疫相關(guān)的病原體相關(guān)分子模式(包括脂多糖、肽聚糖等)可引起血管炎,并且該作用獨(dú)立于獲得性免疫[10]。DNA甲基化是調(diào)節(jié)固有免疫及其相關(guān)炎癥反應(yīng)的重要因素[11]。Huang等[12]的研究更表明,固有免疫所識別的Toll樣受體在川崎病中呈低甲基化和高表達(dá)狀態(tài)。本研究提示川崎病相關(guān)的甲基化基因也涉及脂多糖刺激反應(yīng)性、趨化作用及Fcγ受體介導(dǎo)的吞噬作用等生物學(xué)功能,而這些功能均與固有免疫應(yīng)答有關(guān)。此外,血小板活化和血液高凝狀態(tài)是川崎病的重要特征,而這可能與炎癥導(dǎo)致的血管內(nèi)皮損害有關(guān)。通過GO和KEGG富集分析,我們發(fā)現(xiàn)DNA甲基化也參與調(diào)節(jié)凝血作用和血小板的活化。這些結(jié)果表明DNA甲基化也可能與川崎病患兒的冠狀動脈損害有關(guān)。
在PPI網(wǎng)絡(luò)中,MAPK14和PHLPP1是處于核心調(diào)控地位的甲基化修飾基因。MAPK14基因(又稱作p38)編碼一種絲裂素原活化蛋白激酶,位于6號染色體p21.31位置,含有22個外顯子。MAPK14由多種環(huán)境應(yīng)激因素和促炎癥因子激活,參與細(xì)胞的增殖、分化和轉(zhuǎn)錄調(diào)控等過程[13]。MAPK14也在自身免疫性血管炎中扮演重要角色,如抗中性粒細(xì)胞胞漿抗體相關(guān)性血管炎[14]。而梁順姬等[15]認(rèn)為,抗內(nèi)皮細(xì)胞受體抗體可通過p38-MAPK信號途徑誘導(dǎo)細(xì)胞內(nèi)吸附分子表達(dá),從而參與川崎病的發(fā)病過程。本研究GO富集分析結(jié)果提示MAPK14主要參與調(diào)節(jié)趨化作用,而PPI顯著性模塊分析表明趨化因子信號途徑在整個網(wǎng)絡(luò)中處于重要地位。PHLPP1基因編碼一種絲氨酸/蘇氨酸磷酸酶,位于18號染色體的q21.33位置,含有19個外顯子。PHLPP1通過去磷酸化導(dǎo)致Akt失活從而促進(jìn)細(xì)胞凋亡,因此被視作一種抑癌基因[16]。在川崎病患者的內(nèi)皮細(xì)胞中,去磷酸化的Akt比例增加[17],可通過抑制Akt-eNOS信號通路加重血管內(nèi)皮細(xì)胞損害。因此,低甲基化的MAPK14和PHLPP1導(dǎo)致其相應(yīng)的基因表達(dá)上調(diào),而二者通過以上可能的機(jī)制參與川崎病的發(fā)生發(fā)展。
綜上所述,川崎病相關(guān)的甲基化基因大多呈低甲基化狀態(tài),主要參與炎癥反應(yīng)、固有免疫反應(yīng)、凝血作用和趨化因子信號途徑,其中MAPK14和PHLPP1是重要的甲基化修飾基因,這或可為川崎病的表觀遺傳研究提供新的思路。