阿說阿牛 孫 麗 曲木金作 伍秋紅 (涼山州婦幼保健計劃生育服務(wù)中心婦產(chǎn)科,涼山 615000)
子宮內(nèi)膜癌(endometrial carcinoma,EC)是常見的婦科惡性腫瘤之一[1]。由于人口老齡化和肥胖率上升,全球范圍內(nèi)EC的發(fā)病率和死亡率呈上升趨勢[2]。目前,EC的早期診斷通?;诨颊吲R床表現(xiàn),如絕經(jīng)后出血或某些腫瘤標(biāo)志物的血清水平異常,而約15%的EC發(fā)生于無陰道出血的女性[3]。有研究報道了不同的血清學(xué)標(biāo)志物在EC診斷中的作用,如癌胚抗原、碳水化合物抗原-125和碳水化合物抗原19-9,但其僅在20%~30%的EC患者中表達(dá)上調(diào)[3,4]。由于診斷不及時,EC患者往往失去了最佳治療時機,導(dǎo)致腫瘤轉(zhuǎn)移及術(shù)后復(fù)發(fā)的風(fēng)險較高,預(yù)后較差[5,6]。因此,迫切需要尋找更可靠和前瞻性更強的診斷生物標(biāo)志物以提高EC患者的生存率。越來越多的證據(jù)表明,腫瘤免疫細(xì)胞浸潤與癌癥的發(fā)生發(fā)展密切相關(guān)[7-9]。腫瘤中免疫細(xì)胞浸潤的類型和比例與臨床結(jié)果密切相關(guān),其不僅對患者的生存具有預(yù)測價值,還可影響腫瘤治療效果,因此有望成為藥物靶標(biāo)及臨床生物標(biāo)志物[10,11]。腫瘤相關(guān)中性粒細(xì)胞是免疫細(xì)胞的主要類型,可消除病原體并防止宿主受到微生物感染,且與乳腺癌和胃癌的預(yù)后相關(guān)[12-14]。此外,腫瘤相關(guān)巨噬細(xì)胞參與EC的侵襲性進(jìn)展,可作為EC的潛在治療靶標(biāo)[15,16]。本研究從GEO和TCGA數(shù)據(jù)庫下載EC的表達(dá)譜數(shù)據(jù)集,利用R軟件鑒定差異表達(dá)基因(differentially expressed genes,DEGs),并對DEGs進(jìn)行功能和通路富集分析[17,18]。構(gòu)建蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò)并選擇關(guān)鍵(hub)基因,通過繪制ROC曲線對hub基因進(jìn)行診斷價值分析,進(jìn)而篩選出EC的診斷生物標(biāo)志物。CIBERSORT是基于線性支持向量回歸原理對免疫細(xì)胞亞型的表達(dá)矩陣進(jìn)行去卷積的工具,可利用RNA-Seq的數(shù)據(jù)預(yù)估免疫細(xì)胞浸潤情況[19]。本研究利用CIBERSORT對EC患者進(jìn)行免疫細(xì)胞浸潤分析,初步探究免疫細(xì)胞浸潤在EC中的作用,以期為EC提供診斷生物標(biāo)志物,并初步評估EC中免疫細(xì)胞浸潤情況,為進(jìn)一步研究EC的分子機制提供新思路。
1.1材料 通過GEO和TCGA數(shù)據(jù)庫下載EC的表達(dá)譜數(shù)據(jù)。GSE115810數(shù)據(jù)集基于GPL96([HG-U133A] affymetrix human genome U133A Array)平臺,包括3例子宮內(nèi)膜樣本和24例EC樣本;GSE17025數(shù)據(jù)集基于GPL570([HG-U133_Plus_2] affymetrix human genome U133 plus 2.0 Array)平臺,包括12例子宮內(nèi)膜樣本和91例EC樣本;來源于TCGA數(shù)據(jù)庫的數(shù)據(jù)集包括13例子宮內(nèi)膜樣本和174例EC樣本[20]。
1.2方法
1.2.1數(shù)據(jù)預(yù)處理及DEGs鑒定 采用R軟件的affy包讀取GSE115810和GSE17025 2個數(shù)據(jù)集的原始數(shù)據(jù),采用RMA算法進(jìn)行背景校正、數(shù)據(jù)歸一化處理[21]。在Bioconductor軟件應(yīng)用GPL96和GPL570平臺所對應(yīng)的基因注釋文件對探針矩陣進(jìn)行注釋[22]。使用sva包去除批間差,并轉(zhuǎn)化為探針表達(dá)矩陣,使用分位數(shù)-分位數(shù)(Q-Q)圖可視化去除批間差效果,樣本間校正效果則用二維PCA聚類圖進(jìn)行展示[23]。TCGA數(shù)據(jù)經(jīng)校正后轉(zhuǎn)化為CIBERSORT能夠處理的表達(dá)矩陣。使用R語言limma包進(jìn)行差異表達(dá)分析并輸出DEGs[24]。DEGs滿足adj.Pvalue<0.05及|log2FC|>1。通過Funrich軟件對GEO和TCGA數(shù)據(jù)集的DEGs進(jìn)行求交集,并使用ggplot2包繪制DEGs的火山圖,直觀展示DEGs的差異表達(dá)情況[25,26]。
1.2.2GO和KEGG通路富集分析 GO涵蓋細(xì)胞組分、分子功能和生物過程3個生物學(xué)過程[27]。KEGG是從分子水平了解生物系統(tǒng)高層次功能的數(shù)據(jù)庫[28]。為進(jìn)一步分析DEGs的功能,使用R軟件的clusterProfile包對DEGs進(jìn)行GO和KEGG通路富集分析,以P<0.05為差異具有統(tǒng)計學(xué)意義[29]。
1.2.3GSEA分析 選擇c2.cp.kegg.v6.0.symbols.gmt作為參考基因集進(jìn)行CTSEA分析。截止標(biāo)準(zhǔn)設(shè)置為FDR<0.25且P<0.05,分析結(jié)果使用R軟件進(jìn)行可視化。
1.2.4PPI網(wǎng)絡(luò)構(gòu)建及hub基因選擇 采用STRING數(shù)據(jù)庫構(gòu)建PPI網(wǎng)絡(luò),采用Cytoscape軟件將PPI網(wǎng)絡(luò)可視化[30,31]。利用cytoHubba插件選擇最大相關(guān)標(biāo)準(zhǔn)中的前10個基因作為hub基因[32]。
1.2.5診斷生物標(biāo)志物的篩選 ROC分析是把靈敏度和特異度結(jié)合起來綜合評價診斷準(zhǔn)確度或判別效果的一種方法。采用R語言的pROC包繪制ROC曲線評估10個hub基因的診斷價值,進(jìn)而篩選出EC的診斷生物標(biāo)志物[33]。
1.2.6免疫細(xì)胞浸潤程度評估 利用corrplot包繪制相關(guān)性熱圖以可視化22種免疫細(xì)胞浸潤的相關(guān)性[34];ggplot2包繪制小提琴圖用于可視化22種免疫細(xì)胞浸潤差異。
2.1數(shù)據(jù)預(yù)處理及DEGs鑒定 GSE115810和GSE17025數(shù)據(jù)集基因表達(dá)矩陣數(shù)據(jù)去除批間差后的效果表明兩組樣本的批間差已經(jīng)去除(圖1)。合并后的矩陣標(biāo)準(zhǔn)化處理前后效果以二維PCA聚類圖呈現(xiàn)(圖2A、B),標(biāo)準(zhǔn)化處理后兩組樣本聚類更為明顯,表明樣本來源可靠。數(shù)據(jù)預(yù)處理后,利用R軟件從GSE115810和GSE17025數(shù)據(jù)集中提取675個DEGs,從來源于TCGA的數(shù)據(jù)集中獲得7 185個DEGs,重疊部分共有448個DEGs(圖2C)。DEGs的火山圖表明DEGs在EC中明顯差異表達(dá)(圖2D)。
2.2功能和通路富集分析 GO分析結(jié)果表明,DEGs的生物學(xué)過程變化顯著富集于染色體分離、核分裂和紡錘體組織,細(xì)胞成分變化主要在著絲粒、細(xì)胞間橋和細(xì)胞外基質(zhì),分子功能變化主要富集于趨化因子活性和絲氨酸肽酶活性(圖3A)。KEGG通路富集分析結(jié)果顯示, 富集的通路主要與病毒蛋白與細(xì)胞因子和細(xì)胞因子受體的相互作用通路、趨化因子信號通路、TGF-β信號通路及細(xì)胞周期信號通路密切相關(guān)(圖3B)。
GSEA分析結(jié)果顯示,富集的通路除包括病毒蛋白與細(xì)胞因子和細(xì)胞因子受體的相互作用通路、趨化因子信號通路、 TGF-β信號通路和細(xì)胞周期信號通路外,還涉及HIF-1信號通路、IL-17信號通路及Wnt信號通路等(圖4A)。其中CDC27、 E2F1和BUB1是細(xì)胞周期信號通路的重要參與者,VEGFA、AKT1和PIK3R2在HIF-1信號通路轉(zhuǎn)導(dǎo)過程中具有重要作用(圖4B)。
圖1 GSE115810和GSE17025數(shù)據(jù)集去除批間差的密度圖及Q-Q圖Fig.1 Density and Q-Q map of difference between batches of GSE115810 and GSE17025 removed datasets
圖2 二維PCA聚類圖、韋恩圖及火山圖Fig.2 2D-PCA cluster map,venn diagram and volcano plotNote:A,B.2D-PCA cluster map of GEO database samples before and after correction;Red represents normal endometrial sample group,blue represents EC sample group; abscissa and ordinate represent clustering dimension reduction surface;C.GEO and TCGA datasets DEGs intersection venn diagram,blue represents two data sets of GEO;yellow represents data sets of TCGA; D.Volcano plot of DEGs; red represents up-regulated genes;green represents down-regulated genes; abscissa represents fold change;ordinate represents P-value.
圖3 GO及KEGG通路富集分析Fig.3 GO and KEGG pathway enrichment analysisNote:A.GO biological function enrichment analysis;redder represents smaller P-value,bluer represents larger P-value; abscissa represents number of genes,ordinate represents BP,CC,and MF;B.KEGG pathway enrichment analysis;color of dots represents fold change,size of dots represents number of genes,and connecting lines of different colors represent enriched pathways.
圖4 GSEA通路富集分析Fig.4 GSEA pathway enrichment analysisNote:A.Pathway ridge map for GSEA enrichment analysis,color represents P-value,mountain shape represents distribution; B.Enrichment results of cell cycle and HIF-1 signaling pathway.
圖5 PPI網(wǎng)絡(luò)和hub基因Fig.5 PPI network and hub geneNote:A.PPI network analysis graph,node size represents clustering coefficient,larger node size represents larger clustering coefficient,greater proportion of genes in network represents greater node color representation,greater degree represents more connections node will have,greater blue representation,middle yellow,smallest orange; thicker connection represents higher score;thicker line represents more interaction between two proteins;B.Schematic diagram of hub gene,red indicates a high enrichment score,connection lines represent interactions between genes.
圖6 10個hub基因的診斷價值分析Fig.6 Analysis of diagnostic value of 10 hub genesNote:A.ROC curves for AURKA,NCAPG,CDC20,CENPF and CCNB1;B.ROC curves for TPX2,CDCA8,DLGAP5,UBE2C and KIF23;Abscissa represents specificity and ordinate represents sensitivity.
2.3PPI網(wǎng)絡(luò)構(gòu)建及hub基因選擇 STRING構(gòu)建的PPI網(wǎng)絡(luò)如圖5A所示,利用cytoHubba插件選擇的10個hub基因分別為 CCNB1、DLGAP5、CDC20、CENPF、KIF23、NCAPG、AURKA、CDCA8、UBE2C和TPX2(圖5B)。
圖7 免疫細(xì)胞浸潤的相關(guān)性熱圖和小提琴圖Fig.7 Correlation heat map and violin map of immune cell infiltrationNote:A.Correlation heat map of 22 kinds of immune cell infiltration; blue indicates positive correlation,red indicates negative correlation,darker color represents stronger correlation; both abscissa and ordinate represent 22 types of immune cells;B.A violin map of 22 immune cell infiltration ratios; red for EC sample group,blue for normal endometrial sample group,red marks indicate a difference in infiltration between two sets of samples; horizontal axis represents immune cells,vertical axis represents percentage of immune cell infiltration.
2.4診斷生物標(biāo)志物的篩選 ROC分析結(jié)果顯示,AURKA(AUC=0.804)、NCAPG(AUC=0.854)、CDC20(AUC=0.826)、CENPF(AUC=0.806)和 UBE2C(AUC=0.817)具有較高診斷價值(圖6)。
2.5免疫細(xì)胞浸潤結(jié)果 22種免疫細(xì)胞的相關(guān)性熱圖顯示,M1型巨噬細(xì)胞與M2型巨噬細(xì)胞呈顯著正相關(guān),活化的肥大細(xì)胞與中性粒細(xì)胞呈顯著正相關(guān);M1型巨噬細(xì)胞與靜止期NK細(xì)胞和活化的肥大細(xì)胞呈負(fù)相關(guān),活化的肥大細(xì)胞與活化的NK細(xì)胞呈負(fù)相關(guān),濾泡輔助性T細(xì)胞與靜息期CD4+記憶性T細(xì)胞和調(diào)節(jié)性T細(xì)胞呈顯著負(fù)相關(guān)(圖7A)。22種免疫細(xì)胞浸潤差異的小提琴圖顯示,與正常子宮內(nèi)膜樣本相比,靜息期CD4+記憶性T細(xì)胞浸潤較多,而CD8+T細(xì)胞浸潤較少(圖7B)。
EC是常見的婦科惡性腫瘤,發(fā)病率和死亡率較高[1]。EC的高死亡率在很大程度上歸因于診斷不及時,因此尋找特異性早期診斷生物標(biāo)志物對EC患者的預(yù)后改善至關(guān)重要。多個研究表明EC患者部分失調(diào)的基因可作為其診斷的生物標(biāo)志物[35-37]。因此,本研究利用生物信息學(xué)工具對EC的mRNA表達(dá)譜進(jìn)行分析,篩選出EC的診斷生物標(biāo)志物。另外,越來越多的證據(jù)表明,多種免疫細(xì)胞與EC的發(fā)生和進(jìn)展密切相關(guān)[16,38]。本研究采用CIBERSORT對EC進(jìn)行免疫細(xì)胞浸潤分析,初步探討免疫細(xì)胞浸潤在EC中的作用。
本研究從GEO和TCGA數(shù)據(jù)庫下載EC的表達(dá)譜數(shù)據(jù)集,采用生物信息學(xué)方法共鑒定出448個DEGs。GO功能富集分析顯示,DEGs主要涉及染色體分離、核分裂等生物學(xué)過程,介導(dǎo)趨化因子活性、絲氨酸肽酶活性等分子功能,DEGs基因產(chǎn)物主要富集于著絲粒、細(xì)胞間橋和細(xì)胞外基質(zhì)。富集的通路主要與“Wnt信號通路”“TGF-β信號通路”“細(xì)胞周期信號通路”及“HIF-1信號通路”相關(guān)。Zhou等[39]研究表明SOX17通過Wnt信號通路抑制EC轉(zhuǎn)移。多個研究表明,TGF-β信號通路在EC中被激活[40,41]。細(xì)胞周期信號通路激活可促進(jìn)EC進(jìn)展[42,43]。HIF-1信號通路是細(xì)胞在低氧環(huán)境中存活的關(guān)鍵通路,Seeber等[44]研究提示HIF-1信號通路與EC的臨床預(yù)后不良有關(guān),可作為EC的治療靶點。以上研究結(jié)果與本研究結(jié)果相符,提示本研究結(jié)果準(zhǔn)確性較高。
此外,本研究發(fā)現(xiàn)E2F1、CDC27和BUB1是細(xì)胞周期各通路中的重要參與者,VEGFA、AKT1和PIK3R2在HIF-1信號轉(zhuǎn)導(dǎo)過程中起重要作用。E2F1是E2F轉(zhuǎn)錄因子家族成員,可調(diào)控細(xì)胞周期進(jìn)程[45]。Song等[46]發(fā)現(xiàn)E2F1主要參與細(xì)胞周期調(diào)控,并可能促進(jìn)EC的發(fā)生發(fā)展。后期促進(jìn)的復(fù)合物/環(huán)體(APC/C)是有絲分裂期間蛋白質(zhì)降解的主要調(diào)節(jié)劑,CDC27是APC/C的核心亞基,通過結(jié)合CDH1和CDC20激活A(yù)PC/C,進(jìn)而識別并降解目標(biāo)底物[47]。Qiu等[48]研究表明CDC27通過調(diào)節(jié)p21表達(dá)控制G1/S期轉(zhuǎn)變,在結(jié)直腸癌的增殖中起關(guān)鍵作用,且可作為結(jié)直腸癌患者的獨立預(yù)后因素。BUB1是一種絲氨酸/蘇氨酸激酶蛋白,在有絲分裂過程中起關(guān)鍵作用[49]。研究認(rèn)為BUB1可作為胃癌的獨立預(yù)后標(biāo)志物[50]。E2F1、CDC27和BUB1均參與細(xì)胞周期的調(diào)控過程,而細(xì)胞周期通路又與EC密切相關(guān),因此E2F1、CDC27和BUB1可能通過調(diào)控細(xì)胞周期參與EC發(fā)生發(fā)展。HIF-1可調(diào)節(jié)VEGFA表達(dá),而VEGFA表達(dá)下調(diào)可抑制EC患者血管生成[51,52]。研究已經(jīng)證實AKT1、PIK3R2突變在EC的發(fā)生發(fā)展中具有重要作用[53,54]。本研究表明AKT1、PIK3R2是HIF-1通路的重要參與者,因此推測AKT1、PIK3R2可能通過調(diào)控HIF-1信號通路參與EC進(jìn)展。
本研究構(gòu)建了DEGs的PPI網(wǎng)絡(luò),并確定CCNB1、DLGAP5、CDC20、CENPF、KIF23、NCAPG、AURKA、CDCA8、UBE2C和TPX2為hub基因,其中AURKA、UBE2C和CDC20已被證明與EC密切相關(guān),AURKA過表達(dá)與EC的分級和組織學(xué)類型密切相關(guān),可作為EC的治療靶標(biāo)和臨床生物標(biāo)志物,雌激素促進(jìn)UBE2C介導(dǎo)的腫瘤上皮間質(zhì)轉(zhuǎn)化參與EC的進(jìn)展[55,56]。Huo等[57]研究證實CDC20可作為EC的診斷生物學(xué)標(biāo)記物。以上結(jié)果與本研究結(jié)果一致。CCNB1、DLGAP5、CENPF、KIF23、NCAPG、CDCA8和TPX2與多種腫瘤的發(fā)生及進(jìn)展密切相關(guān),但與EC的關(guān)系尚未明確,值得深入研究[58-64]。
本研究對hub基因進(jìn)行診斷價值評估發(fā)現(xiàn)5個基因(AURKA、NCAPG、CDC20、CENPF及UBE2C)具有較高的診斷價值,其中AURKA、UBE2C及CDC20已被證實與EC密切相關(guān),可能成為EC的診斷生物學(xué)標(biāo)志物[55-57]。研究表明,NCAPG在肝細(xì)胞癌中表達(dá)上調(diào),可作為肝細(xì)胞癌潛在的臨床生物學(xué)標(biāo)志物及治療靶標(biāo)[65]。CENPF被公認(rèn)為肝細(xì)胞癌的早期診斷生物學(xué)標(biāo)志物[66]。由此推測NCAPG和CENPF可能參與EC的發(fā)生及進(jìn)展,有望成為EC的潛在新型診斷生物學(xué)標(biāo)志物。
通過對EC中的免疫細(xì)胞進(jìn)行相關(guān)性分析可知,活化的肥大細(xì)胞與中性粒細(xì)胞、M1型巨噬細(xì)胞及活化的NK細(xì)胞密切相關(guān),提示其可能存在相互作用。Hughes等[67]發(fā)現(xiàn)肥大細(xì)胞可以介導(dǎo)早期中性粒細(xì)胞募集,表現(xiàn)出抗炎特性。另有研究表明,肥大細(xì)胞對白色念珠菌感染有反應(yīng)且可調(diào)節(jié)感染期間巨噬細(xì)胞的吞噬作用[68]。登革熱感染期間肥大細(xì)胞的免疫監(jiān)視可促進(jìn)NK細(xì)胞募集及病毒清除[69]。上述研究結(jié)果與本研究結(jié)果相符,但仍需進(jìn)一步實驗驗證。
本研究通過免疫細(xì)胞浸潤分析發(fā)現(xiàn)CD4+記憶性T細(xì)胞浸潤增多和CD8+T細(xì)胞浸潤減少可能與EC的發(fā)生發(fā)展有關(guān)。CD4+記憶性T細(xì)胞是治愈腫瘤的關(guān)鍵工具,其再次介導(dǎo)免疫應(yīng)答可迅速產(chǎn)生大量CD4+T細(xì)胞,CD4+T細(xì)胞可直接殺死癌細(xì)胞,也可通過刺激和募集CD8+T細(xì)胞或其他免疫細(xì)胞間接殺傷癌細(xì)胞[70-72]。CD4+記憶性T細(xì)胞在機體免疫應(yīng)答中由一部分初始T細(xì)胞分化而來,本研究發(fā)現(xiàn)EC中CD4+記憶性T細(xì)胞浸潤增多,與上述觀點一致。Ribatti等[73]研究發(fā)現(xiàn)EC中CD8+T細(xì)胞數(shù)量隨著腫瘤進(jìn)展而增加。然而,本研究分析結(jié)果顯示EC中的CD8+T細(xì)胞數(shù)量減少,一方面可能由于CIBERSORT分析是基于有限的基因數(shù)據(jù),這些數(shù)據(jù)可能會偏離細(xì)胞的異型性相互作用、疾病誘導(dǎo)失調(diào)或表型可塑性,另一方面其研究的EC樣本僅有45例,檢驗效能偏低。因此,需要更大樣本驗證CD8+T細(xì)胞在EC中的浸潤情況。
總之,本研究通過對EC的表達(dá)譜數(shù)據(jù)進(jìn)行生物信息學(xué)分析,共獲得448個DEGs和10個hub基因。進(jìn)一步對hub基因進(jìn)行ROC分析得到5個診斷生物學(xué)標(biāo)志物(AURKA、NCAPG、CDC20、CENPF和UBE2C)。此外,免疫細(xì)胞浸潤分析發(fā)現(xiàn)CD4+記憶性T細(xì)胞和CD8+T細(xì)胞可能參與EC的發(fā)生發(fā)展,為EC的新型診斷生物學(xué)標(biāo)志物開發(fā)及進(jìn)一步研究其分子機制提供了理論依據(jù)。作為未來的研究方向,課題組會在分子、細(xì)胞及組織水平上驗證本研究結(jié)果的準(zhǔn)確性,并進(jìn)一步探討5個診斷標(biāo)志物與CD4+記憶性T細(xì)胞和CD8+T細(xì)胞的調(diào)控關(guān)系。