趙車冬,張 鍵,趙 娜,陶 丹,陳 葳
(1.西安交通大學(xué)第一附屬醫(yī)院 檢驗科,陜西 西安 710061;2.西安交通大學(xué)第一附屬醫(yī)院 皮膚科,陜西 西安 710061)
子宮內(nèi)膜癌是女性生殖系統(tǒng)最常見的惡性腫瘤之一。晚期子宮內(nèi)膜癌的預(yù)后較差,III期和IV期患者的5年生存率分別為47%~69%和15%~17%[1]。因此亟需尋找新的子宮內(nèi)膜癌早期診斷標(biāo)志物和治療靶點。將公共平臺的芯片數(shù)據(jù)加以整合,能夠高效的篩選出新的腫瘤相關(guān)基因[2]。本研究選擇基因表達數(shù)據(jù)庫(Gene Expression Omnibus,GEO)中的兩個數(shù)據(jù)集進行整合分析,篩選子宮內(nèi)膜癌相關(guān)基因,并對其相關(guān)通路進行預(yù)測,為深入研究子宮內(nèi)膜癌的分子機制、尋找新的診斷標(biāo)志物和治療靶點奠定基礎(chǔ)。
1.1 微陣列數(shù)據(jù)來源 微陣列數(shù)據(jù)集GSE17025和GSE39099均來自GPL570平臺([HG-U133_Plus_2] Affymetrix Human Genome U133 Plus 2.0 Array),分別包括91例子宮內(nèi)膜癌和12例正常子宮內(nèi)膜組織、20例子宮內(nèi)膜癌和10例正常子宮內(nèi)膜組織(見表1)。
表1 GSE17025和GSE39099樣本信息
1.2 差異表達基因(Differentially expressed genes,DEGs)篩選 利用在線分析工具GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/)分別對兩個數(shù)據(jù)集進行分析,篩選在子宮內(nèi)膜癌中差異表達的基因,篩選條件為|logFC| ≥ 1和P< 0.05。利用在線軟件Bioinformatics & Evolutionary Genomics構(gòu)建韋恩圖(http://bioinformatics.psb.ugent.be/ webto ols/Venn/),兩個數(shù)據(jù)集的交集被認(rèn)為是共同DEGs,logFC>0為表達上調(diào)的基因,logFC<0為表達下調(diào)的基因。
1.3 基因本體(Gene Ontology,GO)和信號通路富集分析 分別對表達上調(diào)和下調(diào)的DEGs進行GO分析和信號通路富集分析。利用DAVID(The database for annotation,visualization and integrated discovery)v6.8(https://david.ncifcrf.gov/)[3-4]對差異基因進行功能注釋,包括生物過程、細胞組分和分子功能的GO分析以及KEGG信號通路富集分析,定義為P<0.05。
1.4 蛋白-蛋白相互作用(Protein-protein interaction,PPI)網(wǎng)絡(luò)分析和核心網(wǎng)絡(luò)分析 PPI網(wǎng)絡(luò)分析利用STRING(v 11.0)在線工具(https://string-db.org/)[5]對差異表達編碼蛋白進行分析(參數(shù)Minimum required interaction score設(shè)置為中等(≥0.4))。將該網(wǎng)絡(luò)導(dǎo)入Cytoscape進行可視化,并進一步利用MCODE app對該網(wǎng)絡(luò)進行模塊化分析,參數(shù)設(shè)置為degree cutoff = 2,max.Depth = 100,k-core = 3,node score cutoff = 0.2。
1.5 核心基因的生存分析 利用Kaplan Meier-plotter(http://kmplot.com/analysis/)[6]對核心基因在子宮內(nèi)膜癌中表達與生存相關(guān)性進行分析。選擇Kaplan Meier-plotter中的子宮內(nèi)膜癌數(shù)據(jù)集,該數(shù)據(jù)集包含542例子宮內(nèi)膜癌患者的RNA測序數(shù)據(jù)和生存數(shù)據(jù)。P<0.05表示生存差異具有統(tǒng)計學(xué)意義。
1.6 核心基因的表達分析 GEPIA(Gene expression profiling interactive analysis)[7]是一個分析來自TCGA和GTEx的RNA測序數(shù)據(jù)的交互式網(wǎng)頁工具,利用GEPIA分析核心基因在子宮內(nèi)膜癌和正常組織中的表達差異,選擇子宮內(nèi)膜癌數(shù)據(jù)集,參數(shù)設(shè)置為|Log2FC| Cutoff ≥ 1,P<0.05。
2.1 子宮內(nèi)膜癌差異表達基因篩選 差異表達基因篩選結(jié)果如圖1A、B所示,對于數(shù)據(jù)集GSE17025,有2462個差異基因,其中1010個基因表達上調(diào),1452個基因表達下調(diào);對于數(shù)據(jù)集GSE39099,有1488個差異基因,其中801個基因表達上調(diào),687個基因表達下調(diào)。分別對表達上調(diào)的基因和表達下調(diào)的基因取交集,兩個數(shù)據(jù)集中共同上調(diào)的基因有101個,共同下調(diào)的基因有128個(見圖1,表2)。
A:GSE17025差異表達基因火山圖;B:GSE39099差異表達基因火山圖;C:LogFC>0代表表達上調(diào)的基因;D:LogFC<0代表表達下調(diào)的基因。圖1 子宮內(nèi)膜癌數(shù)據(jù)集差異表達基因篩選
表2 數(shù)據(jù)集GSE17025和GSE39099的差異表達基因(DEGs)
2.2 共同DEGs的GO和KEGG信號通路富集分析 利用DAVID在線軟件對229個共同差異表達基因進行GO和KEGG信號通路富集分析。結(jié)果顯示,上調(diào)的DEGs主要位于胞核,富集于細胞增殖、蛋白質(zhì)結(jié)合、細胞周期等信號通路,下調(diào)的DEGs主要位于胞外區(qū)域,富集于藥物反應(yīng)、金屬離子結(jié)合、cAMP信號通路(見圖2,表3)。
A:差異表達上調(diào)基因的富集分析;B:差異表達下調(diào)基因的富集分析。圖2 共同DEGs的GO分析
表3 共同DEGs的GO和KEGG信號通路富集分析
2.3 PPI網(wǎng)絡(luò)分析 共同DEGs的PPI網(wǎng)絡(luò)納入了142個node(基因)和498條edge(相互作用),其中表達上調(diào)的基因有74個,表達下調(diào)的基因有68個(見圖3A)。使用Cytoscape 3.7.1里的MCODE模塊對PPI網(wǎng)絡(luò)進一步分析,結(jié)果顯示在142個結(jié)點中,構(gòu)成了兩個核心模塊。核心模塊1有26個核心結(jié)點,即包括26個核心基因和304條相互作用關(guān)系(MCODE score = 24.32),且26個核心基因均為表達上調(diào)的基因(見圖3B)。核心模塊2有6個核心節(jié)點,即包括6個核心基因和12條相互作用關(guān)系(MCODE score = 4.8),其中有3個核心基因在子宮內(nèi)膜癌中表達上調(diào),3個核心基因在子宮內(nèi)膜癌中表達下調(diào)(見圖3C)。根據(jù)MCODE算法構(gòu)建的基因模塊中,擴展出基因模塊的種子節(jié)點位置基因,即為關(guān)鍵基因,模塊1中關(guān)鍵基因為含DEP 結(jié)構(gòu)域的蛋白質(zhì)1(DEP domain containing 1,DEPDC1),模塊2中的關(guān)鍵基因為趨化因子C-X-C基序配體8(C-X-C motif chemokine ligand 8,CXCL8)。
A:共同DEGs的PPI網(wǎng)絡(luò);B:核心模塊1;C:核心模塊2;紅色代表表達上調(diào)的基因,藍色代表表達下調(diào)的基因。圖3 DEGs 的PPI網(wǎng)絡(luò)分析
2.4 關(guān)鍵基因的表達與子宮內(nèi)膜癌患者的預(yù)后分析 利用Kaplan Meier-plotter對兩個核心模塊的關(guān)鍵基因在子宮內(nèi)膜癌中的表達與患者生存的相關(guān)性進行分析。如圖4所示,關(guān)鍵基因DEPDC1和CXCL8的表達與患者的不良預(yù)后相關(guān)(P<0.05)。
A:DEPDC1的表達與患者預(yù)后的生存曲線;B:CXCL8的表達與患者預(yù)后的生存曲線。圖4 核心模塊的關(guān)鍵基因表達與子宮內(nèi)膜癌患者的預(yù)后分析
2.5 關(guān)鍵基因在子宮內(nèi)膜癌中的表達分析 GEPIA數(shù)據(jù)庫中子宮內(nèi)膜癌數(shù)據(jù)集包括174例腫瘤組(T)和91例正常對照組(N)。通過子宮內(nèi)膜癌組織與正常子宮內(nèi)膜組織比較,關(guān)鍵基因DEPDC1和CXCL8在腫瘤組織中的表達高于正常對照組,差異具有統(tǒng)計學(xué)意義(P<0.05,見圖5)。
A:DEPDC1的表達差異;B:CXCL8的表達差異;紅色為腫瘤組(T),灰色為正常對照組(N);*:P<0.05。圖5 核心模塊的關(guān)鍵基因在子宮內(nèi)膜癌和正常對照中的表達分析
盡管治療手段不斷進步,晚期子宮內(nèi)膜癌的預(yù)后仍然較差。在全球,2018年預(yù)計有38萬新發(fā)病例,8.9萬人死于子宮內(nèi)膜癌[8]。多個研究發(fā)現(xiàn),子宮內(nèi)膜癌中多種分子參與了腫瘤的進展,如編碼基因PIK3CA、K-RAS、TP53等[9],以及microRNA[10]和長非編碼RNA[11]等。但是目前尚無子宮內(nèi)膜癌特異的診斷標(biāo)志物[12],因此尋找新的子宮內(nèi)膜癌標(biāo)志物,對于早期診斷和新的藥物開發(fā)都具有十分重要的意義。
本研究利用生物信息學(xué)分析方法,將GEO數(shù)據(jù)庫中的兩個子宮內(nèi)膜癌相關(guān)數(shù)據(jù)集GSE17025和GSE39099進行整合,共納入111例子宮內(nèi)膜癌組織和22例正常組織,篩選出229個差異表達基因,其中表達上調(diào)的基因有101個,表達下調(diào)的基因有128個。通過對差異表達基因的GO和KEGG分析,上調(diào)的DEGs主要位于胞核,富集于細胞增殖、蛋白質(zhì)結(jié)合、細胞周期等信號通路,下調(diào)的DEGs主要位于胞外區(qū)域,富集于藥物反應(yīng)、金屬離子結(jié)合、cAMP信號通路。進一步利用PPI網(wǎng)絡(luò)分析和MCODE分析手段,將這些差異表達基因構(gòu)建了兩個核心模塊,其中的種子基因即兩個模塊的關(guān)鍵基因,分別是DEPDC1基因和CXCL8基因。利用TCGA數(shù)據(jù)庫的數(shù)據(jù),發(fā)現(xiàn)DEPDC1基因和CXCL8基因在子宮內(nèi)膜癌組織中的表達升高,并且與患者的不良預(yù)后有關(guān)。結(jié)果提示,DEPDC1基因和CXCL8基因可能是子宮內(nèi)膜癌中發(fā)揮重要調(diào)控作用的關(guān)鍵基因靶點。
DEPDC1基因最初發(fā)現(xiàn)在膀胱癌中高表達,利用siRNA敲低DEPDC1基因表達,可以抑制膀胱癌細胞的生長[13]。之后的多項研究發(fā)現(xiàn)DEPDC1基因參與多種腫瘤的發(fā)生發(fā)展。Zhao等研究發(fā)現(xiàn)在乳腺癌中,DEPDC1基因能夠促進乳腺癌細胞的惡性表型,并且能預(yù)測乳腺癌患者的不良預(yù)后[14]。另有一項研究發(fā)現(xiàn)DEPDC1基因在肝癌組織中表達升高,并且高表達的DEPDC1基因與肝癌的進展和不良預(yù)后相關(guān)[15]。另有學(xué)者發(fā)現(xiàn),在子宮內(nèi)膜癌中,DEPDC1基因可能作為原鈣粘蛋白10的下游分子參與子宮內(nèi)膜癌的發(fā)生發(fā)展[16]。但是DEPDC1基因在子宮內(nèi)膜癌中的功能及作用機制仍不明確。
CXCL8基因編碼的蛋白也稱為白細胞介素8(Interleukin 8,IL-8),主要由單核細胞、T淋巴細胞、中性粒細胞、自然殺傷細胞、成纖維細胞以及上皮細胞分泌。它主要通過兩個特異性的趨化因子受體CXCR1和CXCR2介導(dǎo)炎癥反應(yīng)。近年來的研究也表明,CXCL8與腫瘤發(fā)生發(fā)展也有密切關(guān)系。腫瘤細胞分泌的CXCL8與腫瘤微環(huán)境中的CXCR1/2之間的相互作用對腫瘤的進展和轉(zhuǎn)移至關(guān)重要[17]。有研究發(fā)現(xiàn),相對于健康者,胰腺癌患者的血清CXCL8水平明顯升高,并與淋巴結(jié)轉(zhuǎn)移相關(guān)。通過比較其診斷特異性和敏感性,血清CXCL8作為胰腺癌的診斷標(biāo)志物甚至優(yōu)于常規(guī)診斷標(biāo)志物如CA19-9和CEA[18]。但是CXCL8在子宮內(nèi)膜癌中的研究尚不多見。有研究發(fā)現(xiàn)在子宮內(nèi)膜癌中,由腫瘤相關(guān)的巨噬細胞驅(qū)動的CXCL8通過HOXB13來誘導(dǎo)雌激素受體α的抑制,從而促進腫瘤細胞的侵襲和轉(zhuǎn)移[19]。CXCL8是否能作為子宮內(nèi)膜癌的分子診斷標(biāo)志物或治療靶點仍需進一步研究。
綜上所述,本研究利用公共數(shù)據(jù)平臺的子宮內(nèi)膜癌多組芯片數(shù)據(jù),從基因?qū)用娣治鲎訉m內(nèi)膜癌相關(guān)分子和信號通路,篩選出兩個關(guān)鍵基因DEPDC1和CXCL8,可能在子宮內(nèi)膜癌中發(fā)揮著重要作用。盡管兩個分子在子宮內(nèi)膜癌的功能和機制仍需要進一步實驗驗證,但我們的研究結(jié)果為子宮內(nèi)膜癌新的生物標(biāo)志物和治療靶點篩選提供一定研究思路。