劉潔 * 陳樹嘉 李嘉Δ
(1.天津醫(yī)科大學(xué)研究生院,天津 300203;2.天津市第二人民醫(yī)院肝病科,天津 300192)
非酒精性脂肪性肝?。∟on-alcoholic fatty liver disease,NAFLD)已成為第一大慢性疾病及肝功異常的首要原因[1]。非酒精性單純性脂肪肝(Non-alcoholic fatty liver,NAFL)及非酒精性脂肪性肝炎(Non-alcoholic steatohepatitis, NASH)是NAFLD的不同進(jìn)展階段,NASH是發(fā)生纖維化和肝硬化重要的中間階段,是導(dǎo)致NAFLD進(jìn)展的關(guān)鍵步驟,與肝硬化、肝癌發(fā)生密切相關(guān)[2];盡早診斷NASH并進(jìn)行干預(yù),可有效改善NAFLD患者的預(yù)后[3]。目前認(rèn)為NAFLD的發(fā)生是遺傳、環(huán)境共同作用的結(jié)果,NAFLD的發(fā)病機(jī)制尚不完全清楚[4],目前認(rèn)為NAFL進(jìn)展為NASH的機(jī)制為多種因素共同導(dǎo)致[5],其臨床表現(xiàn)隱匿,早期診斷受多種因素干擾,因此檢測(cè)NAFL及NASH的差異基因,尋找分子診斷標(biāo)記物具有重要意義。本研究基于美國(guó)國(guó)家生物技術(shù)信息中心的基因表達(dá)數(shù)據(jù)庫(kù)(Gene expression omnibus database,GEO)中的NAFLD基因芯片GSE33814進(jìn)行生物信息學(xué)分析,以期獲取NAFLD相關(guān)的關(guān)鍵基因,為后續(xù)尋找分子標(biāo)記物提供理論基礎(chǔ)。
從 GEO(http://www.ncbi.nlm.nih.gov/geo/)中檢索NAFLD相關(guān)的數(shù)據(jù)集,組織來(lái)源為“人肝臟組織”。最終選定基因表達(dá)譜芯片GSE33814數(shù)據(jù)集(GPL6884)。該數(shù)據(jù)集包含44例樣本,正常對(duì)照組13例,NAFL組19例,NASH組12例。
1.2.1 DEGs篩選
采用 GEO2R 在線分析程序(http://www.ncbi.nlm.nih.gov/geo/geo2r/)從 GSE33814數(shù)據(jù)集中分別篩選出 NAFL組與健康對(duì)照組(Healthy controls,HC)及NASH組與HC組的DEGs。差異基因篩選標(biāo)準(zhǔn):校正后P值(adjustP-value)<0.05,|logFC|> 0.5。
1.2.2 GO功能富集和KEGG通路富集分析
通過(guò)R語(yǔ)言(3.6.3版本,使用ggplots包)對(duì)差異表達(dá)基因在GO中注釋其參與的生物學(xué)過(guò)程,包括生物過(guò)程(Biological process,BP)、細(xì)胞組成(Cellular component,CC)及分子功能(Molecular function,MF),并進(jìn)行KEGG通路富集分析同時(shí)繪制氣泡圖。
1.2.3 蛋白互作網(wǎng)絡(luò)(Protein-Protein Interaction,PPI)構(gòu)建及關(guān)鍵基因篩選
使用STRING 11.5數(shù)據(jù)庫(kù) (http://cn.stringdb.org)對(duì)DEGs對(duì)應(yīng)蛋白質(zhì)進(jìn)行相互作用關(guān)系分析,閾值條件設(shè)置為綜合評(píng)分大于 0.4,采用Cytohubba插件的最大集團(tuán)中心性(Matthews correlation coefficient,MCC)算法,依照基因在PPI網(wǎng)絡(luò)的重要性篩選評(píng)分前10位作為關(guān)鍵基因。
1.2.4 靶基因-miRNA網(wǎng)絡(luò)和靶基因-轉(zhuǎn)錄因子(Transcription factors,TF)網(wǎng)絡(luò)的構(gòu)建
miRNA及TF在特定的疾病狀態(tài)時(shí),在轉(zhuǎn)錄后階段通過(guò)與靶基因相互作用控制基因的表達(dá)。我們應(yīng)用 NetworkAnaly在線數(shù)據(jù)庫(kù)(https://www.networkanalyst.ca/NetworkAnalyst/home.xhtml)、miRTarBase工具及ENCODE工具整合靶基因-miRNA網(wǎng)絡(luò)和靶基因-TF網(wǎng)絡(luò)。
由GSE33814數(shù)據(jù)集得到NAFL患者相對(duì)于HC的DEGs共219個(gè),其中上調(diào)基因147個(gè),下調(diào)基因72個(gè),火山圖見圖1A。NASH相對(duì)于HC的DEGs共1992個(gè),包括988個(gè)上調(diào)基因和1004個(gè)下調(diào)基因,火山圖見圖1B。將兩組DEGs分別取交集,得到DEGs共193個(gè),上調(diào)基因133個(gè),下調(diào)基因60個(gè),制作韋恩圖如圖2所示。
圖1 GSE33814數(shù)據(jù)集中差異基因的表達(dá)
圖2 GSE33814數(shù)據(jù)集中上調(diào)基因及下調(diào)基因韋恩圖
利用R語(yǔ)言對(duì)DEGs相關(guān)的MF、BP、CC進(jìn)行分析,結(jié)果顯示:DEGs主要參與中性粒細(xì)胞活化與免疫反應(yīng)、脂肪酸的代謝分解、小分子物質(zhì)代謝、氨基酸分解代謝等生物過(guò)程;DEGs主要存在于線粒體基質(zhì)、細(xì)胞基質(zhì)結(jié)等;在MF方面,DEGs主要與輔酶結(jié)合、氧化還原酶活性及NADP結(jié)合等。KEGG通路富集結(jié)果顯示,DEGs主要參與檸檬酸循環(huán)(TCA循環(huán))、丙酸鹽循環(huán)、色氨酸代謝及cGMP-PKG等信號(hào)通路。GO和KEGG富集分析顯著性排名前10的條目見圖3。
圖3 差異基因的功能和通路富集分析
將 193個(gè) DEGs帶入 STRING數(shù)據(jù)庫(kù)進(jìn)行PPI網(wǎng)絡(luò)分析,閾值條件設(shè)置為綜合評(píng)分大于0.4,剔除 PPI 網(wǎng)絡(luò)中具有不同表達(dá)傾向和孤立節(jié)點(diǎn)的 DEGs后,共包含147個(gè)節(jié)點(diǎn)和277條邊,平均節(jié)點(diǎn)度為3.77(圖4A)。將PPI結(jié)果進(jìn)一步導(dǎo)入Cytoscape軟件,并利用CytoHubba插件在PPI網(wǎng)絡(luò)中篩選出一個(gè)重要的功能模塊,擇取排列前10的關(guān)鍵基因,分別是:ACO2、MAPK1、DLD、MAP2K1、SND1、FGA、LMNA、MAP2K2、ALDH18A1、PMPCB。這些基因即為PPI網(wǎng)絡(luò)中的關(guān)鍵基因(圖4B)。
圖4 DEGs網(wǎng)絡(luò)中的PPI網(wǎng)絡(luò)圖及功能模塊中的關(guān)鍵基因
miRNA的前三個(gè)靶向 DEGs是由 183個(gè)miRNA調(diào)控的MAKP1,由52個(gè)miRNA調(diào)控的MAP2K2和由30個(gè)miRNA調(diào)控的SND1??刂谱畲髷?shù)量的DEGs(3個(gè)基因)的miRNA是hasmir-16-5p(圖5A)。TF的前三個(gè)目標(biāo) DEG 是LMNA,由75個(gè)TF調(diào)控,ACO2由36個(gè)TF調(diào)制,DLD由29個(gè)調(diào)控(圖5B)。
圖5 靶基因-miRNA網(wǎng)絡(luò)和靶基因-TF網(wǎng)絡(luò)
非酒精性脂肪肝與肥胖、2型糖尿病、心腦血管疾病等密切相關(guān),其發(fā)生發(fā)展嚴(yán)重威脅著人們的生命健康,據(jù)報(bào)道,約9%~20%的NASH患者于發(fā)病 15年內(nèi)進(jìn)展為肝硬化甚至肝癌[6]。因此,獲取NAFLD相關(guān)的關(guān)鍵基因,可以為后續(xù)分子標(biāo)記物尋找提供理論基礎(chǔ)。
本研究結(jié)果顯示,從 GEO數(shù)據(jù)庫(kù)中的GSE33814數(shù)據(jù)集篩選到與 NAFLD疾病進(jìn)展有關(guān)的193個(gè)DEGs,對(duì)其GO富集分析顯示其功能主要富集于中性粒細(xì)胞活化及免疫反應(yīng)等生物過(guò)程。炎癥反應(yīng)在整個(gè)NAFLD的發(fā)生發(fā)展過(guò)程中產(chǎn)生著重要的影響,大部分肝臟細(xì)胞均參與免疫及炎癥反應(yīng),炎癥反應(yīng)常繼發(fā)于肝臟對(duì)外源性和內(nèi)源性損傷的免疫反應(yīng),即NASH發(fā)生、發(fā)展的“二次打擊”學(xué)說(shuō)[7]。激活的中性粒細(xì)胞釋放炎性細(xì)胞因子可導(dǎo)致肝細(xì)胞的氧化損傷;而且中性粒細(xì)胞相對(duì)于淋巴細(xì)胞的比例增加可以進(jìn)一步加重NASH[8]。肝臟還富含各種免疫細(xì)胞,包括固有免疫細(xì)胞和適應(yīng)性免疫細(xì)胞,在肝損傷時(shí)迅速聚集到肝臟。固有免疫細(xì)胞在NASH的發(fā)病機(jī)制中發(fā)揮重要作用。在急性或慢性肝病時(shí),Kupffer細(xì)胞被病原體相關(guān)分子模式和損傷相關(guān)分子模式激活,釋放促炎細(xì)胞因子,從而導(dǎo)致免疫狀態(tài)的紊亂。免疫細(xì)胞比例失衡可進(jìn)一步促進(jìn)NASH的發(fā)生[9]。此結(jié)果與既往文獻(xiàn)結(jié)論一致。通路富集結(jié)果表明 DEGs主要集中在檸檬酸循環(huán)(TCA循環(huán))、丙酸鹽循環(huán)、色氨酸代謝及cGMP-PKG等信號(hào)通路等信號(hào)通路。TCA循環(huán)是脂肪氧化的場(chǎng)所,也是糖異生的代謝前體,該循環(huán)功能的誘導(dǎo)與肝臟氧化應(yīng)激和炎癥的發(fā)生密切相關(guān)。cGMP/PKG信號(hào)通路是細(xì)胞內(nèi)重要的信號(hào)轉(zhuǎn)導(dǎo)通路之一,以往報(bào)道多關(guān)注 cGMP-PKG信號(hào)轉(zhuǎn)導(dǎo)通路在缺血再灌注損傷中發(fā)揮著重要的作用,近來(lái)有研究發(fā)現(xiàn),PKG-1基因的過(guò)表達(dá)可以通過(guò)抑制脂肪合成相關(guān)基因的表達(dá),減少肝臟的脂肪積累,抑制炎癥反應(yīng),并降低肝細(xì)胞纖維化程度,這預(yù)示著cGMP/PKG信號(hào)通路可調(diào)節(jié)NAFLD的發(fā)生發(fā)展。此外,本研究富集多條氨基酸代謝通路,提示氨基酸的代謝在脂肪肝發(fā)生發(fā)展中起重要作用。最近,朱健等在Molecular Cell上發(fā)表文章提示必需氨基酸攝入不足是造成營(yíng)養(yǎng)不良人群患上脂肪肝病的“罪魁禍?zhǔn)住盵10]。當(dāng)必需氨基酸匱乏時(shí),肝細(xì)胞中的E3泛素連接酶Ubr1失活,不能催化脂滴保護(hù)蛋白Plin2的多聚泛素化降解。Plin2蛋白水平的升高則會(huì)抑制肝臟脂肪的分解,從而造成脂肪肝病。上述研究為氨基酸代謝在脂肪肝發(fā)生發(fā)展方向開辟了新的思路。
在PPI網(wǎng)絡(luò)中進(jìn)一步篩選出更有研究?jī)r(jià)值的關(guān)鍵基因,分別為ACO2、MAPK1、DLD、MAP2K1、SND1、FGA、LMNA、MAP2K2、ALDH18A1和PMPCB。ACO是脂肪酸分解代謝中的關(guān)鍵酶,存在于線粒體中,催化脂酰 CoA生成乙酰CoA并進(jìn)入三羧酸循環(huán)繼續(xù)被氧化,對(duì)脂肪的β氧化非常重要[11]。MAPK是真核細(xì)胞內(nèi)廣泛存在的一類絲氨酸/蘇氨酸蛋白激酶,能夠被包括 ROS在內(nèi)的多種因素激活,參與細(xì)胞增殖、凋亡、炎癥反應(yīng)等多種生理、病理活動(dòng);其磷酸化水平的降低可預(yù)測(cè)脂肪肝的發(fā)生[12]。MAP2K1/2基因編碼MEK1/2蛋白激酶,屬于雙重特異性蛋白集美家族成員,參與細(xì)胞增殖、分化、基因轉(zhuǎn)錄調(diào)控和發(fā)育過(guò)程,其表達(dá)的蛋白水平及磷酸化水平在TRIB1的調(diào)控下影響肝臟脂肪生成和糖生成[13]。DLD屬于嘧啶核苷酸-二硫氧化還原酶家族,參與丙酮酸的氧化脫酸反應(yīng),參與機(jī)體能量代謝,既往報(bào)道DLD修飾后可促進(jìn)胃癌的發(fā)生發(fā)展,但尚無(wú)脂肪肝相關(guān)報(bào)道,故此基因可為脂肪肝的疾病進(jìn)展研究提供新的靶點(diǎn)[14]。SND1可以在轉(zhuǎn)錄水平激活脂肪形成相關(guān)基因的表達(dá),并且調(diào)控脂肪細(xì)胞的分化[15];FGA的表達(dá)可作為妊娠期糖尿病的的早期診斷因子[16],但目前尚未發(fā)現(xiàn)在脂肪肝患者中的特異性表達(dá)。ALDHs 家族成員ALDH18A1參與了多種腫瘤表觀遺傳學(xué)調(diào)控的中間產(chǎn)物的生成,對(duì)脂肪肝發(fā)生發(fā)展的調(diào)控機(jī)制仍需進(jìn)一步研究[17]。LMN基因突變可導(dǎo)致脂肪細(xì)胞的更新障礙,其對(duì)于靶向器官的印象仍需進(jìn)一步研究。PMPCB參與脂肪肝的發(fā)生發(fā)展,有報(bào)道稱其與肝細(xì)胞癌患者對(duì)索拉菲尼產(chǎn)生耐藥的主要基因[18],故對(duì)于合并脂肪肝的肝細(xì)胞癌患者或脂肪肝所致肝細(xì)胞癌患者需警惕。
總體而言,本研究利用生物信息方法預(yù)測(cè)NAFLD發(fā)生發(fā)展過(guò)程中的重要靶點(diǎn)基因,以上靶點(diǎn)基因在脂肪炎癥、免疫、疾病進(jìn)展等起著至關(guān)重要的作用,但仍需分子生物學(xué)實(shí)驗(yàn)驗(yàn)證,為NAFLD的早期篩查、診斷及治療等提供新的研究方向及可靠依據(jù)。