劉音 趙彬 謝裕賽 楊濤
1北京市海淀醫(yī)院腎內(nèi)科 100080;2中國醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院病理教研室,沈陽 110122
IgA腎病(immunoglobulin A nephropathy,IgAN)是全亞洲乃至全世界最常見的腎小球疾病[1]。在我國,IgAN占原發(fā)性腎小球腎炎病例的58.2%[2]。有15%~40%的IgAN患者在確診后20年內(nèi)逐漸發(fā)展為終末期腎病(end-stage renal disease,ESRD)。因此,IgAN已成為目前重要的醫(yī)療健康問題。IgAN的病理過程包括IgA免疫復(fù)合物的沉積,腎小球系膜細(xì)胞增殖,細(xì)胞外基質(zhì)成分的積累以及腎組織炎性細(xì)胞的浸潤[3]。盡管已經(jīng)對IgAN的病理過程進(jìn)行了數(shù)十年的研究,但其參與的分子機(jī)制仍不清楚,并且尚無有效的IgAN早期診斷和治療方法。
生物信息學(xué)分析是一種強(qiáng)大的研究方法,可用于預(yù)測分子機(jī)制和基因之間的關(guān)聯(lián)。該方法已廣泛被用于預(yù)測與腫瘤相關(guān)的新基因和新途徑,例如肝癌[4]、非小細(xì)胞肺癌[5]等。生物信息學(xué)分析可以加深我們對腎臟疾病分子機(jī)制的認(rèn)識[6],最近有研究通過生物信息學(xué)分析了巨噬細(xì)胞的基因表達(dá)譜,發(fā)現(xiàn)狼瘡性腎炎患者巨噬細(xì)胞中CCL2和CD38的參與誘導(dǎo)[7]。迄今為止,在IgAN上僅進(jìn)行有限的生物信息學(xué)分析。在本研究中,我們對基因表達(dá)綜合數(shù)據(jù)庫(Gene Expression Omnibus,GEO)公共數(shù)據(jù)庫中3組IgAN患者及正常對照者腎小球組織的芯片檢測結(jié)果進(jìn)行一系列生物信息學(xué)分析,篩選出IgAN患者和正常對照者之間差異表達(dá)基因(differentially expressed gene,DEGs),并對共有的DEG進(jìn)行了富集分析并構(gòu)建了蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interactions,PPI)網(wǎng)絡(luò)。本研究發(fā)現(xiàn)IgAN潛在的分子標(biāo)志物,希望為IgAN的診斷和治療提出新的線索。
使用“IgAN”作為搜索詞,從GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo/)下載了IgA腎病的3個(gè)腎小球數(shù)據(jù)集GSE104948[8]、GSE93798[9]和GSE37460[10]。GSE104948基于GPL24120平臺芯片,包括30個(gè)樣品(27個(gè)IgA腎病患者和3個(gè)健康對照的腎小球組織基因表達(dá)信息)。GSE93798基于GPL22945平臺芯片,包括42個(gè)樣本(20個(gè)IgA腎病患者和22個(gè)健康對照的腎小球組織基因表達(dá)信息)。GSE37460基于GPL14663芯片,包括36個(gè)樣品(27個(gè)IgA腎病患者和9個(gè)健康對照的腎小球組織基因表達(dá)信息)。下載完整系列矩陣文件及其平臺探針注釋信息文件,進(jìn)行下一步的生物信息學(xué)分析。
采用R語言中l(wèi)imma R包校正數(shù)據(jù)并分析出IgA腎病患者和健康對照者之間的DEGs[11]。DEGs的篩選條件為|logFC|> 1和校正后P值<0.05。使用在線Venn軟件(http://www.molbiotools.com/)篩選出共同DEGs。
使用DAVID(http://david.abcc.ncifcrf.gov/)數(shù)據(jù)庫進(jìn)行共同DEGs的功能和途徑富集分析[12]。分別在上調(diào)和下調(diào)的共同DEGs中在DAVID數(shù)據(jù)庫進(jìn)行基因本體論(gene ontology,GO)京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析。P<0.1和基因計(jì)數(shù)>2作為篩選GO分析和KEGG通路分析方面具有顯著富集的閾值。
使用STRING(http://string-db.org/)數(shù)據(jù)庫構(gòu)建DEG的PPI網(wǎng)絡(luò)[13],綜合得分>0.4作為統(tǒng)計(jì)學(xué)上節(jié)點(diǎn)蛋白間存在顯著相互作用的閾值。運(yùn)用Cytoscape(http://cytoscape.org/)軟件用于進(jìn)一步分析交互式網(wǎng)絡(luò)及可視化[14],其中CytoHubba是一種從復(fù)雜的交互組中篩選樞紐基因的插件[15]。通過Cytoscape 軟件中CytoHubba插件的“Degree”算法發(fā)現(xiàn)顯著性節(jié)點(diǎn)蛋白,并以Degree≥5為閾值從共同DEGs中篩選樞紐基因(hub genes)。
在將3個(gè)數(shù)據(jù)集的原始數(shù)據(jù)及平臺探針注釋信息文件運(yùn)用limma R包進(jìn)行數(shù)據(jù)校正和差異化分析。分別從GSE104948、GSE93798和GSE37460數(shù)據(jù)集的IgA腎病和健康對照的腎小球組織表達(dá)基因之間差異分析出199、347和181個(gè)基因。通過在線Venn圖軟件篩選出16個(gè)上調(diào)的共同DEGs和14個(gè)下調(diào)的共同DEGs。(圖1)
圖1 3個(gè)IgA腎病數(shù)據(jù)集GSE104948、GSE93798和GSE37460中的共同差異表達(dá)基因 A.上調(diào)組;B.下調(diào)組
將共同DEGs進(jìn)行GO分析基因注釋,分為3類,包括生物過程(BP),細(xì)胞成分(CC)和分子功能(MF)(圖2)。生物過程分析表明,上調(diào)DEGs主要與細(xì)胞外基質(zhì)組織、細(xì)胞黏附、先天免疫反應(yīng)和細(xì)胞增殖的正向調(diào)控有關(guān);下調(diào)的DEGs主要參與細(xì)胞氧化解毒、氧化還原反應(yīng)、血小板脫粒和葡萄糖穩(wěn)態(tài)。在細(xì)胞成分分析中,DEGs上調(diào)主要分布細(xì)胞外基質(zhì)、膠原蛋白三聚體和細(xì)胞外區(qū)域;下調(diào)的DEG主要分布外泌體及內(nèi)質(zhì)網(wǎng)。此外分子功能分析提示,DEGs的上調(diào)主要參與蛋白結(jié)合,膠原蛋白的結(jié)合和整合素的結(jié)合;下調(diào)的DEG主要參與脂肪酸結(jié)合、磷脂結(jié)合和抗氧化活性。
圖2 共同差異表達(dá)基因的GO分析 A.上調(diào)組;B.下調(diào)組
接下來,我們對共同DEGs進(jìn)行KEGG通路富集分析(圖3)。上調(diào)的DEGs在5條通路中顯著富集:如LPAR6、COL6A3、COL1A2、FN1參與PI3K-Akt信號傳導(dǎo)通路;COL6A3、COL1A2、FN1參與ECM-受體互作通路及黏著斑形成;LPAR6、MECOM、FN1參與癌癥形成等。下調(diào)DEGs在6條通路中顯著富集:如G6PC、CYP27B1、PAH、HPD、PCK1基因參與代謝通路;FABP1、SLC27A2、PCK1基因參與PPAR信號傳導(dǎo)通路;G6PC、SLC27A2、PCK1參與胰島素抵抗通路等。
圖3 共同差異表達(dá)基因的KEGG通路富集分析 A.上調(diào)組;B.下調(diào)組
構(gòu)建共同DEGs的PPI網(wǎng)絡(luò)包含23個(gè)蛋白節(jié)點(diǎn)和37條蛋白互作關(guān)系(圖4)。此外,通過Cytoscape 中CytoHubba插件的Degree算法,以Degree≥5為篩選標(biāo)準(zhǔn)將共同DEGs中FN1、COL1A2、ALB和FABP1確定為樞紐基因。
注:紅色代表上調(diào)基因,藍(lán)色代表下調(diào)基因圖4 共同差異表達(dá)基因的蛋白互作網(wǎng)絡(luò)
IgAN占原發(fā)性腎小球疾病的20%~47%,主要特征是血尿、蛋白尿、高血壓和腎功能不全[3],其發(fā)病率每年都在增加,在10年內(nèi)有30%~40%的患者發(fā)展為終末期腎病。盡管IgAN的最常見臨床表現(xiàn)是血尿,但不同病例之間存在相當(dāng)大的異質(zhì)性,這使得早期診斷陷入困境。
在本研究中,我們通過分析GEO數(shù)據(jù)庫的3個(gè)IgA腎病數(shù)據(jù)集,篩選出IgAN中的DEGs,并確定潛在的生物靶標(biāo)。GO分析和KEGG通路分析顯示,上調(diào)DEGs在細(xì)胞外基質(zhì)組織細(xì)胞黏附、細(xì)胞增殖、PI3K-Akt信號傳導(dǎo)通路和ECM-受體相互作用途徑及黏著斑形成顯著富集。細(xì)胞增殖是IgAN發(fā)病機(jī)制中的重要因素。有研究發(fā)現(xiàn),循環(huán)半乳糖缺陷型IgA形成沉積在腎小球系膜的免疫復(fù)合物,最終導(dǎo)致IgAN局部增殖[16]。
從PPI網(wǎng)絡(luò)中鑒定出4個(gè)樞紐基因,該結(jié)果與之前的腎臟疾病研究一致,包括FN1[17]、COL1A2[18]、ALB[19]、FABP1[20]。我們的生物信息學(xué)分析表明纖連蛋白(FN1)在IgAN腎小球中過表達(dá)。纖連蛋白是細(xì)胞外基質(zhì)的必需成分。在病理情況下,纖連蛋白可以充當(dāng)細(xì)胞外基質(zhì)蛋白在體細(xì)胞周圍沉積的誘發(fā)因素,導(dǎo)致組織的硬化或纖維化[17]。在腫瘤發(fā)生、發(fā)展中,F(xiàn)N1通過PI3K/AKT信號通路促進(jìn)膠質(zhì)瘤細(xì)胞增殖[21]。此外,動物實(shí)驗(yàn)也表明纖連蛋白與腎臟疾病的進(jìn)展有關(guān)[22]。在腎小球腎炎患者的血漿和尿液中纖連蛋白水平升高[23]。之前的研究還表明,IgAN患者含有大量循環(huán)復(fù)合物,其中含有Ag抗體和纖連蛋白[24],是原發(fā)性IgAN的首要免疫復(fù)合物機(jī)制。因此,F(xiàn)N1基因的表達(dá)也可能影響IgAN的進(jìn)展,通過調(diào)節(jié)FN1表達(dá)可以有效地預(yù)防IgA腎病。膠原蛋白Ⅰ型α2鏈(COL1A2),富集在細(xì)胞外基質(zhì)及參與黏著斑通路。有研究發(fā)現(xiàn),膠原結(jié)合黏附因子通過結(jié)合膠原蛋白Ⅰ型加速IgAN進(jìn)展[18]。
白蛋白(albumin,Alb)和脂肪酸結(jié)合蛋白1(fatty acid binding protein 1,F(xiàn)ABP1)在PPI網(wǎng)絡(luò)中具有顯著的相關(guān)性。Alb和FABP1均顯著下調(diào)且富集于氧化還原過程及抗氧化活性?,F(xiàn)已證實(shí),氧化應(yīng)激和炎癥反應(yīng)在IgA腎病疾病進(jìn)展中發(fā)揮重要作用[24]。ALB編碼的白蛋白主要存在于尿蛋白中。臨床上發(fā)現(xiàn)該檢測結(jié)果是由于腎小球疾病患者的腎小管上皮細(xì)胞在病理上產(chǎn)生大量尿蛋白而引起的[25]。實(shí)驗(yàn)證據(jù)表明,尿蛋白(包括白蛋白)參與了腎小管間質(zhì)纖維化過程[26]。此外,有研究報(bào)道在IgAN的早期階段,F(xiàn)ABP1能通過抑制氧化應(yīng)激和炎癥介質(zhì)的產(chǎn)生而減少腎小球損傷。
盡管生物信息技術(shù)是篩選鑒定疾病的候選基因的強(qiáng)大方法,但這項(xiàng)研究仍然存在局限性。從GEO數(shù)據(jù)庫下載的數(shù)據(jù)集數(shù)量和樣本量較小。此外,由于尚無患者的臨床資料,不能對年齡、性別、腎功能等因素加以控制。盡管有這些局限性,我們的發(fā)現(xiàn)仍然對IgAN的分子機(jī)制具有重要的意義。因此,接下來需要進(jìn)一步的臨床研究來驗(yàn)證我們的研究結(jié)果。
綜上所述,本研究應(yīng)用生物信息學(xué)綜合分析方法研究參與IgAN的樞紐基因和發(fā)病機(jī)制。FN1、COL1A2、ALB和FABP基因可能在IgAN的發(fā)展中起重要作用,并可能作為診斷和治療IgAN的潛在候選分子靶標(biāo)。
利益沖突所有作者均聲明不存在利益沖突