安 敏,楊曉玲,馬 亮,付少杰,馬福哲*
(1.唐山職業(yè)技術(shù)學(xué)院附屬醫(yī)院 腎內(nèi)科,河北 唐山063000;2.唐山職業(yè)技術(shù)學(xué)院附屬醫(yī)院 內(nèi)分泌科,河北 唐山063000;3.吉林大學(xué)第一醫(yī)院 腎病內(nèi)科,吉林 長春130012)
隨著人們生活方式以及飲食習慣的改變,糖尿病的發(fā)病率逐年增高,而糖尿病腎病(diabetic kidney disease,DKD)作為糖尿病的主要微血管并發(fā)癥,也已成為終末期腎臟病(end-stage renal disease,ESRD)的首要原因[1]。ESRD患者需要進行腎移植或長期的腎臟替代治療,生活質(zhì)量嚴重下降[2]。DKD早期癥狀隱匿,臨床上易被忽視,疾病被發(fā)現(xiàn)時常已進展至中晚期,這是導(dǎo)致DKD患者預(yù)后不佳的原因之一。目前對DKD的治療尚缺乏特異性的手段,主要是通過積極控制血壓、血糖以及改善生活方式等對癥治療,且疾病一旦進展至中晚期則不可逆轉(zhuǎn)[3]。因此早期診斷和及時干預(yù)對延緩DKD患者的腎功能衰竭以及ESRD的發(fā)生具有重要意義。
加權(quán)基因共表達網(wǎng)絡(luò)分析(weighted correlation network analysis,WGCNA) 是一種將基因數(shù)據(jù)轉(zhuǎn)換為共表達模塊,從而探索基因與給定特征之間相關(guān)性的生物信息學(xué)方法[4]。近年來WGCNA分析已被廣泛應(yīng)用于對各種疾病生物標志物的鑒定,并展現(xiàn)出良好的潛力[4-5],但在DKD新型標志物鑒定方面的研究尚十分缺乏。因此本研究旨在通過對基因綜合表達(gene expression omnibus,GEO)數(shù)據(jù)庫進行挖掘,鑒定出DKD的差異表達基因(differentially expressed genes,DEGs),構(gòu)建加權(quán)基因共表達網(wǎng)絡(luò),篩選出DKD的診斷標志物,并探究標志物與免疫細胞浸潤之間的關(guān)系,以期為DKD的臨床診療以及藥物研發(fā)提供新的線索。
從GEO數(shù)據(jù)庫[6](http://www.ncbi.nlm.nih.gov/geo/)獲取包含有DKD患者以及健康對照的腎小球微陣列數(shù)據(jù)集(GSE30528,GSE96804,GSE99339)作為訓(xùn)練集,其中共有DKD患者64例和健康對照44例。獲取共包含有DKD患者33例和健康對照67例的數(shù)據(jù)集(GSE47185,GSE30122)作為驗證集。使用R語言SVA包對各數(shù)據(jù)集進行批次校正后合并。使用R語言中的“l(fā)imma”包對訓(xùn)練集中DKD患者以及健康對照腎小球中各基因mRNA的表達水平進行差異分析,以|log2差異倍數(shù)|>1以及矯正后的P值<0.05為篩選標準,從而鑒定出DEGs。
使用R語言中的“WGCNA”包構(gòu)建WGCNA網(wǎng)絡(luò)。首先對訓(xùn)練集的基因表達數(shù)據(jù)進行聚類分析,根據(jù)基因間的無標度拓撲擬合指數(shù)(R2)以及平均連接度,確定軟閾值β為3,使各基因調(diào)控關(guān)系符合無尺度分布。通過構(gòu)建共表達網(wǎng)絡(luò)繪制模塊聚類樹狀圖,并將所有基因分為10個模塊,使用Pearson法分析基因間的相關(guān)性,獲得關(guān)系矩陣,選擇相關(guān)性最高的模塊作為關(guān)鍵基因模塊。
將WGCNA分析獲得的關(guān)鍵模塊基因與DEGs取交集,篩選出重疊基因作為關(guān)鍵DEGs,它們可能與DKD的發(fā)生發(fā)展高度相關(guān)。使用R語言 “clusterProfiler”包對關(guān)鍵DEGs分別進行基因本體論功能(Gene Ontology,GO)及基因組百科全書通路(Kyoto Encylopaedia of Genes and Genomes,KEGG)富集分析,矯正后的P值<0.05被認為具有統(tǒng)計意義。
將關(guān)鍵DEGs導(dǎo)入STRING數(shù)據(jù)庫進行蛋白互作(protein-protein interaction,PPI)分析,并構(gòu)建PPI網(wǎng)絡(luò)。將PPI信息導(dǎo)入Cytoscape3.9.1內(nèi),計算網(wǎng)絡(luò)的拓撲學(xué)參數(shù),并利用cytoHubba插件進一步篩選出核心基因。
利用訓(xùn)練集中DKD和對照組樣本的微陣列數(shù)據(jù),根據(jù)每個核心基因的表達量分別繪制受試者操作特征(Receiver Operating Characteristic,ROC)曲線。為便于臨床應(yīng)用,將核心基因表達量納入多因素Logistic回歸分析,構(gòu)建診斷模型,并繪制模型的校準曲線以及決策曲線。將訓(xùn)練集中ROC曲線下的面積(Area Under Curve,AUC)大于0.9的基因篩選出來作為DKD診斷潛在的生物標志物,并使用驗證集數(shù)據(jù)再次繪制ROC曲線對其診斷效能進行再次驗證。ROC曲線、校準曲線以及決策曲線分別是由R語言中的“pROC”,“rms”以及“rmda”包繪制。
為了進一步探究與生物標志物可能的相關(guān)機制,將DKD樣本根據(jù)標志物基因表達量中位值劃分為高低表達兩組,進行基因集富集分析(Gene Set Enrichment Analysis,GSEA)。從分子特征數(shù)據(jù)庫MSigDB中下載“c2.cp.kegg.symbols.gmt”的基因集,利用 GSEA算法來進行分析,矯正后的P值<0.05被認為富集出的結(jié)果具有統(tǒng)計學(xué)意義。
采用CIBERSORT算法對DKD以及對照組腎組織中22種免疫細胞浸潤的特征進行分析。使用R語言中的“ggplot2”包對免疫細胞浸潤矩陣的主成分分析進行聚類,使用 R語言中的“vioplot”繪制小提琴圖,將DKD患者和對照組樣本腎組織間免疫細胞浸潤的差異可視化。R語言中的Spearman等級相關(guān)分析被用來進一步分析生物標志物的表達與免疫細胞浸潤間的關(guān)系,并使用R語言中的“ggstatsplot”和“ggplot2”包將生物標志物的表達與免疫細胞浸潤間的關(guān)系可視化。
從訓(xùn)練集的64例DKD患者腎小球組織以及44例健康對照腎小球組織中共篩選出87個DEGs,其中在DKD腎小球中上調(diào)表達的DEGs有39個,下調(diào)表達的有48個,見圖1。
圖1 DKD患者腎小球組織中的DEGs的鑒定
使用R語言中的“WGCNA”包對訓(xùn)練集的基因表達數(shù)據(jù)進行聚類分析,選擇3作為軟閾值β,以符合無尺度網(wǎng)絡(luò)分布,見圖2A。利用構(gòu)建共表達網(wǎng)絡(luò)繪制模塊聚類樹狀圖,表達數(shù)據(jù)相似的基因被聚類在一起形成一個分支,見圖2B。使用Pearson法分析基因模塊與臨床特性的相關(guān)性,繪制模塊-臨床特性關(guān)聯(lián)圖,結(jié)果發(fā)現(xiàn)粉橙色基因模塊相關(guān)系數(shù)最大為0.67,且P值最小為2E-15,見圖2C。提示該模塊聚類的基因與DKD的發(fā)生發(fā)展最為密切,因此挑選粉橙色基因模塊為關(guān)鍵基因模塊。
圖2 WGCNA聚類分析
將WGCNA分析獲得的關(guān)鍵模塊基因與DEGs取交集,篩選出14個重疊基因作為關(guān)鍵DEGs,可能與DKD的發(fā)生發(fā)展高度相關(guān),見圖3A。關(guān)鍵DEGs的GO富集分析結(jié)果提示,關(guān)鍵DEGs主要富集于白細胞趨化、趨化因子結(jié)合等條目,見圖3B;KEGG富集分析結(jié)果提示,主要富集于白細胞介素17 信號通路、腫瘤壞死因子信號通路等通路,見圖3C。
圖3 關(guān)鍵DEGs的篩選及GO、KEGG富集分析
將關(guān)鍵DEGs導(dǎo)入STRING數(shù)據(jù)庫,進行PPI分析,構(gòu)建出1個含有14個節(jié)點,48條邊的PPI網(wǎng)絡(luò),見圖4A。將網(wǎng)絡(luò)信息導(dǎo)入Cytoscape3.9.1內(nèi),計算拓撲學(xué)參數(shù),并借助cytoHubba插件使用“MCC”法對網(wǎng)絡(luò)進一步篩選,獲得10個打分最高基因,見圖4B,將打分最高的5個基因篩選為核心基因,它們是PTGS2,FOS,FOSB,EGR1,DUSP1。
圖4 構(gòu)建關(guān)鍵差異表達基因的PPI網(wǎng)絡(luò)
通過對訓(xùn)練集繪制ROC曲線對核心基因進行分析,結(jié)果發(fā)現(xiàn)5個核心基因的AUC均大于0.8,而DUSP1和FOSB的AUC大于0.9,提示在區(qū)分DKD以及正常樣本方面均表現(xiàn)出良好的診斷能力,見圖5A。隨后,將5個核心基因表達量納入多因素Logistic線性回歸構(gòu)建診斷模型,并繪制模型的決策曲線以及校準曲線,分別見圖5B和圖5C。對校準曲線進行Hosmer-Lemeshow擬合優(yōu)度檢驗,結(jié)果表明理想曲線與校準曲線的差異不具有統(tǒng)計學(xué)意義(χ2=5.371,P=0.719),提示模型具有較高的校準度,其預(yù)測概率與實際接近。由列線圖可知DUSP1以及FOSB的基因表達水平對是否發(fā)生DKD的影響最大,因此將DUSP1和FOSB篩選為DKD的潛在生物標志物,并在驗證集中對它們的表達情況進行進一步驗證,并分別繪制它們的ROC曲線,見圖6。在驗證集中DUSP1和FOSB的AUC也均大于0.75,進一步驗證了作為DKD診斷標志物的診斷潛力。
圖5 核心基因在訓(xùn)練集中的ROC曲線及診斷列線圖
圖6 診斷標志物在驗證集中的差異表達情況及ROC曲線
為了進一步探究與新鑒定出的生物標志物可能相關(guān)的機制,根據(jù)標志物基因表達量的中位值,將DKD樣本劃分為高表達和低表達組,并進行GSEA富集分析。結(jié)果發(fā)現(xiàn)隨著DUSP1表達的增加,β丙氨酸代謝、脂肪酸代謝、色氨酸代謝等通路被抑制,見圖7A。而隨著FOSB表達的增加,色氨酸代謝、脂肪酸代謝、丁酸代謝等通路被抑制,見圖7B。
圖7 兩個診斷標志物的GSEA富集分析
免疫浸潤結(jié)果發(fā)現(xiàn),相較正常對照組,M2巨噬細胞、γδT細胞、記憶B細胞、靜止的樹突狀細胞等在DKD腎小球組織中浸潤顯著增加,而輔助性T細胞、中性粒細胞以及活化的肥大細胞在DKD腎小球組織中浸潤顯著減少,見圖8A。進一步對DUSP1以及FOSB兩個標志物的表達與腎組織中免疫細胞浸潤的關(guān)系進行相關(guān)性分析,結(jié)果發(fā)現(xiàn)DUSP1的表達與漿細胞、γδT細胞以及活化的CD4陽性的記憶T細胞的浸潤呈負相關(guān),見圖8B;FOSB的表達與M1巨噬細胞浸潤呈負相關(guān),見圖8C。
圖8 免疫浸潤分析及診斷標志物與免疫細胞浸潤相關(guān)性分析
研究顯示,我國糖尿病患者已高達1.14億,且糖尿病導(dǎo)致的腎臟損害已超過慢性腎小球腎炎成為我國慢性腎臟病的首要病因[7]。目前DKD的早期診斷主要依賴于對尿蛋白的檢測,但DKD的早期階段的尿蛋白可以是陰性的[8]。因此發(fā)掘新的具有良好診斷效能的標志物,有助于DKD的早期診斷并改善患者的預(yù)后。本研究利用WGCNA分析確定了DUSP1和FOSB為DKD的潛在診斷標志物,并聯(lián)合GSEA以及免疫浸潤分析,進一步了解與它們表達相關(guān)的可能機制。結(jié)果發(fā)現(xiàn)DUSP1和FOSB對DKD具有良好的診斷效能,并且可能成為治療DKD的潛在靶點,為DKD的診斷及治療提供了新思路。
DUSP1是一種組蛋白磷酸酶,可以特異性地調(diào)節(jié)絲裂原活化蛋白激酶(Mitogen-Activated Protein Kinase,MAPK)的活性,從而發(fā)揮多種生物學(xué)功能[9]。本研究發(fā)現(xiàn)DUSP1在DKD腎小球組織中是低表達的。有研究報道lncRNA NR_038323可以通過靶向DUSP1抑制p38MAPK信號通路,在HK-2近端小管細胞系中發(fā)揮抗纖維化作用[10]。同時,DUSP1過表達可通過調(diào)節(jié)線粒體自噬減輕腎小管損傷,阻斷線粒體裂變因子相關(guān)的線粒體過度裂變[11]。此外,在T細胞中抑制DUSP1的表達可能有利于多發(fā)性硬化自身免疫性疾病的治療[12]。提示DUSP1有潛力成為包括DKD在內(nèi)一些疾病的治療靶點。
FOSB是FOS家族的一員,屬于原癌基因的一種,其與Jun蛋白家族組成異源二聚體轉(zhuǎn)錄因子復(fù)合物AP-1,在腫瘤的進展中發(fā)揮著重要作用[13]。FOSB的表達增加可以抑制細胞的凋亡并促進細胞的增殖[14]。既往有研究表明,FOSB可作為IgA腎病的診斷標志物[15]。也有研究表明,MicroRNA-27a-3p可以靶向FOSB從而調(diào)節(jié)IgA腎病的炎癥以及纖維化水平[16],但其在DKD中的相關(guān)研究尚少見。
近年來,越來越多的研究發(fā)現(xiàn)免疫紊亂在DKD的發(fā)病中發(fā)揮重要作用[17]。本研究也發(fā)現(xiàn),在DKD腎小球中存在免疫細胞的異常浸潤,且 DUSP1的表達與漿細胞、γδT細胞以及活化的CD4陽性的記憶T細胞的浸潤呈負相關(guān),FOSB的表達與M1巨噬細胞的浸潤呈負相關(guān)。提示DUSP1和FOSB可能參與對腎臟免疫細胞浸潤的調(diào)控,從而對DKD的發(fā)生及發(fā)展產(chǎn)生影響。但是,這一推斷需進行更多的實驗來進行驗證。
綜上所述,本研究發(fā)現(xiàn)DUSP1和FOSB對DKD具有良好的診斷效能,并且與DKD腎小球免疫細胞的浸潤相關(guān),有望成為DKD的新型診斷標志物以及治療靶點。但本研究為生物信息學(xué)研究,具有一定局限性,需要更進一步的臨床驗證。