崔忠澤,何 雙,路麗禎,吳淑華
(濱州醫(yī)學(xué)院附屬醫(yī)院病理科,山東 濱州 256600)
結(jié)腸癌(colon cancer)在全球男性和女性惡性腫瘤發(fā)病率中分別排名第3(13.5%)和第2(9.5%)位,是嚴(yán)重危害人類健康的惡性腫瘤[1]。大量研究已經(jīng)明確了與結(jié)腸癌預(yù)后和患者治療反應(yīng)相關(guān)的基因突變;此外,一些靶向治療也被開發(fā)出來[2-4]。然而,結(jié)腸癌進(jìn)展的確切分子機(jī)制尚不清楚,這限制了晚期疾病的治療。因此,進(jìn)一步了解結(jié)腸癌發(fā)生發(fā)展過程中的基因表達(dá),將有助于提高診斷和治療水平。目前,微陣列技術(shù)已被廣泛用于探索癌癥基因表達(dá)的變化[5,6]。高質(zhì)量的芯片和高通量測(cè)序有助于發(fā)現(xiàn)結(jié)腸癌發(fā)生發(fā)展過程中的基因表達(dá)變化[7-9],甚至篩選出用于結(jié)腸癌診斷、治療和預(yù)后的生物標(biāo)志物?;驁D譜可以從公共數(shù)據(jù)庫中獲得,如基因表達(dá)綜合數(shù)據(jù)庫(GEO)和癌癥基因組圖譜(TCGA),綜合生物信息學(xué)方法的使用可以克服不同芯片平臺(tái)和小樣本量的限制。免疫療法作為一種新興的治療某些癌癥的方法已經(jīng)獲得顯著的療效[10-13]。腫瘤微環(huán)境中腫瘤細(xì)胞可以直接侵入周圍組織或通過血液和淋巴管轉(zhuǎn)移,并可以通過釋放細(xì)胞因子引起宿主的免疫反應(yīng),直接或間接地抑制或促進(jìn)腫瘤細(xì)胞的發(fā)展[14]。因此,了解腫瘤免疫微環(huán)境,尋找免疫標(biāo)記物,是提高腫瘤免疫治療效果的關(guān)鍵。基于此,本研究主要篩選了TCGA 數(shù)據(jù)集和4 個(gè)GEO數(shù)據(jù)集中結(jié)腸癌的共表達(dá)差異基因,并從中得到預(yù)后相關(guān)基因,分析目標(biāo)基因在組織中的表達(dá)情況和功能。
1.1 數(shù)據(jù)收集 從GEO 數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)[15]中獲取4 個(gè)基因芯片(GSE41657、GSE74602、GSE106582、GSE110224)。GSE41657 包含12 個(gè)結(jié)腸癌樣本和25 個(gè)正常結(jié)腸組織樣本。GSE74602 包含30 個(gè)結(jié)腸癌樣本和30 個(gè)正常結(jié)腸組織樣本。GSE106582 包含117 個(gè)結(jié)腸癌樣本和77個(gè)正常結(jié)腸組織樣本。GSE110224 包含17 個(gè)結(jié)腸癌樣本和17 個(gè)正常結(jié)腸組織樣本。從TCGA 數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)[16]下載結(jié)腸癌表達(dá)矩陣,包括398 個(gè)結(jié)腸癌樣本和39 個(gè)正常結(jié)腸組織樣本。
1.2 差異基因獲取 用R 語言檢測(cè)結(jié)腸癌與正常組織之間的差異基因。調(diào)整后P<0.05 和|log2FC|≥2.0認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。然后,利用在線維恩圖分析網(wǎng)站(http://bioinformatics.psb.ugent.be/webtools/Venn/)從個(gè)以上5 個(gè)數(shù)據(jù)庫中獲得共同差異基因。
1.3 差異基因的KEGG 和GO 富集分析 為分析差異基因的功能,使用R 語言對(duì)差異基因進(jìn)行KEGG與GO 富集分析。KEGG 是一個(gè)數(shù)據(jù)庫資源,用于大規(guī)模的分子數(shù)據(jù)收集,以了解生物系統(tǒng)和功能[17]。GO 是分析基因的生物學(xué)過程(BP)、分子功能(MF)和細(xì)胞成分(CC)的生物信息學(xué)工具[18]。P<0.05 認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。
1.4 免疫相關(guān)預(yù)后差異基因篩選 將差異基因?qū)隚EPIA 數(shù)據(jù)庫(http://gepia.cancer-pku.cn/)[19],篩選預(yù)后相關(guān)基因。將得到的預(yù)后相關(guān)基因?qū)隩IMER 數(shù)據(jù)庫(https://cistrome.shinyapps.io/timer/)分析其與免疫細(xì)胞之間的關(guān)系,篩選免疫相關(guān)性高的基因,定義為免疫相關(guān)基因。P<0.05 認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。
1.5 預(yù)后相關(guān)樞紐基因篩選 利用互作基因檢索工具(STRING v11.5;http://string-db.org)的在線數(shù)據(jù)庫構(gòu)建差異基因的蛋白互作網(wǎng)絡(luò)。Cytoscape(v3.8.2)是一個(gè)用于可視化蛋白互作網(wǎng)絡(luò)的開放生物信息學(xué)工具。Cytoscape 的插件MCODE 是一個(gè)應(yīng)用程序,它可以對(duì)給定的網(wǎng)絡(luò)進(jìn)行聚類,以找到緊密連接的區(qū)域。用Cytoscape 繪制蛋白互作網(wǎng)絡(luò),用MCODE 確定蛋白互作網(wǎng)絡(luò)中的重要模塊,將最重要模塊中的基因認(rèn)定為樞紐基因,然后,將樞紐基因中的預(yù)后相關(guān)基因篩選出來。
1.6 分析目標(biāo)基因 將預(yù)后相關(guān)樞紐基因和免疫相關(guān)基因作為目標(biāo)基因進(jìn)一步分析?;赥CGA 數(shù)據(jù)庫基因表達(dá)數(shù)據(jù),對(duì)目標(biāo)基因表達(dá)量進(jìn)行可視化。利用HPA 數(shù)據(jù)庫(http://www.proteinatlas.org)[20]觀察目標(biāo)基因在結(jié)腸癌及正常結(jié)腸組織的表達(dá)情況?;贕SEA 數(shù)據(jù)庫(https://www.gsea-msigdb.org/gsea/index.jsp)[21]中c5.bp.V7.1,symbols,gmt 數(shù)據(jù)集,用R軟件對(duì)其進(jìn)行單基因GO 富集分析,推測(cè)其在結(jié)腸癌中可能發(fā)揮的作用,P<0.05 認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。
2.1 結(jié)腸癌中差異基因的鑒定 在GSE41657 中,共鑒定出4712 個(gè)差異基因,其中2502 個(gè)上調(diào)基因和2210 個(gè)下調(diào)基因。在GSE74602 中,共鑒定出2878個(gè)差異基因,其中1543 個(gè)上調(diào)基因和1335 個(gè)下調(diào)基因。在GSE106582 中,共鑒定出504 個(gè)差異基因,其中176 個(gè)上調(diào)基因和328 個(gè)下調(diào)基因。在GSE110224 中,共鑒定出519 個(gè)差異基因,其中223個(gè)上調(diào)基因和296 個(gè)下調(diào)基因。在TCGA 中,共鑒定出3572 個(gè)差異基因,其中1343 個(gè)上調(diào)基因和2229個(gè)下調(diào)基因。使用維恩圖網(wǎng)站分析5 個(gè)基因芯片的差異基因,共鑒定出102 個(gè)差異基因,其中24 個(gè)上調(diào)基因和78 個(gè)下調(diào)基因,見圖1A~圖1C。
2.2 富集分析 對(duì)102 個(gè)差異基因進(jìn)行GO 和KEGG通路富集分析。在BP 類中,差異基因主要富集于“激素代謝”“核分裂的正調(diào)控”“白細(xì)胞趨化性”和“離子跨膜運(yùn)輸”等。在CC 類中,“細(xì)胞頂部”和“頂端質(zhì)膜”占主導(dǎo)地位。在MF 類別中,“受體配體活性”和“激素活性”是主要的。KEGG 分析顯示,差異基因主要參與“藥物代謝”“致病性大腸桿菌感染”和“視黃醇代謝”等,見圖1D、圖1E。
圖1 VENN 圖和富集柱形圖
2.3 免疫相關(guān)預(yù)后差異基因篩選 使用GEPIA 數(shù)據(jù)庫對(duì)102 個(gè)差異基因進(jìn)行預(yù)后分析,共得到15 個(gè)預(yù)后相關(guān)基因(NR3C2、ETFDH、AQP8、CLDN23、SLC17A4、TIMP1、BGN、TESC、LRRC19、BEST2、NAT2、SULT1B1、SCG2、SELENBP1、IL1B),見圖2。在TIMER 數(shù)據(jù)庫分析這些基因與6 種免疫細(xì)胞(B細(xì)胞、CD4+T 細(xì)胞、CD8+T 細(xì)胞、巨噬細(xì)胞、中性粒細(xì)胞、樹突狀細(xì)胞)的相關(guān)性,結(jié)果顯示,有6 個(gè)基因(NR3C2、ETFDH、TIMP1、BGN、SCG2、IL1B)在結(jié)腸癌中與腫瘤免疫微環(huán)境密切相關(guān),其中3 個(gè)基因(ETFDH、NR3C2、SCG2)在結(jié)腸癌腫瘤微環(huán)境中的作用鮮見報(bào)道,見圖3。
圖2 預(yù)后相關(guān)基因在結(jié)腸癌中的Kaplan-Meier 生存分析
圖3 免疫相關(guān)基因與免疫細(xì)胞的相關(guān)性分析
2.4 預(yù)后相關(guān)樞紐基因篩選 在STRING 網(wǎng)站構(gòu)建差異基因的PPI 網(wǎng)絡(luò)后,運(yùn)用Cytoscape 的MCODE篩選顯著模塊,見圖4A。將最顯著模塊中的16 個(gè)基因(MEP1A、SCGN、SLC17A4、SI、MYO1A、TSPAN7、SLC26A2、STMN2、UGT2A3、CHGB、ADH1C、VSNL1、MS4A12、WNT2、ADAMDEC1、CEACAM7)定義為樞紐基因,見圖4B。其中僅有SLC17A4 為預(yù)后相關(guān)基因,但SLC17A4 在結(jié)腸癌中鮮見報(bào)道。
圖4 蛋白互作網(wǎng)絡(luò)分析圖
2.5 目標(biāo)基因分析 將3 個(gè)免疫相關(guān)預(yù)后基因(ETFDH、NR3C2、SCG2)和預(yù)后相關(guān)樞紐基因(SLC17A4)作為目標(biāo)基因進(jìn)一步分析。通過對(duì)其表達(dá)量的可視化,結(jié)果發(fā)現(xiàn),與正常組織相比,其在腫瘤組織中均呈低表達(dá),見圖5A;通過其他4 個(gè)GEO數(shù)據(jù)集的驗(yàn)證,均符合這一結(jié)論。通過HPA 數(shù)據(jù)庫下載的免疫組化圖發(fā)現(xiàn),ETFDH 主要表達(dá)于細(xì)胞質(zhì),NR3C2 在細(xì)胞核和細(xì)胞質(zhì)中大量表達(dá),SCG2 在細(xì)胞質(zhì)中有少量表達(dá),SLC17A4 主要表達(dá)于細(xì)胞膜,見圖5B、圖5C。通過GEEA 單基因富集分析發(fā)現(xiàn),ETFDH 主要富集到“RNA 沉默”等功能,NR3C2 主要富集到“腫瘤壞死因子分泌”“血管內(nèi)皮細(xì)胞增殖”等功能,SCG2 主要富集到“細(xì)胞周期相變的正調(diào)控”“RNA 聚合酶結(jié)合”等功能,SLC17A4 主要富集到“細(xì)胞周期G1S 期轉(zhuǎn)變的負(fù)調(diào)控”等功能,見圖6。
圖5 目標(biāo)基因的表達(dá)和免疫組化
圖6 目標(biāo)基因的GO 功能富集分析
結(jié)腸癌是最常見的惡性腫瘤之一。近年來,生物標(biāo)記物已被廣泛用于癌癥的診斷、治療和預(yù)后評(píng)估中,其對(duì)揭示癌癥的發(fā)生發(fā)展具有重要的意義[22,23]。盡管已有結(jié)腸癌病因?qū)W相關(guān)研究,但其發(fā)生發(fā)展的確切機(jī)制仍未完全明確,因此尋找可靠有效的生物標(biāo)記物對(duì)結(jié)腸癌的診斷、治療和預(yù)后具有重要意義。結(jié)腸癌的治療策略包括化療、手術(shù)、放療和靶向治療,而免疫療法作為一種新的治療方法已用于部分結(jié)腸癌治療中[24,25],這讓尋找新的可靠免疫靶點(diǎn)變得尤為重要。本研究通過生物信息學(xué)分析,篩選結(jié)腸癌預(yù)后相關(guān)樞紐基因和免疫相關(guān)生物標(biāo)記物,旨在為進(jìn)一步揭示結(jié)腸癌發(fā)生發(fā)展機(jī)制和鑒定新的免疫治療潛在靶點(diǎn)提供理論依據(jù)。
本研究為了克服不同芯片平臺(tái)和小樣本量的限制,獲得具有更高可信度的差異基因,下載了多個(gè)數(shù)據(jù)集(TCGA、GSE41657、GSE74602、GSE106582、GSE110224),分別進(jìn)行差異分析,獲得102 個(gè)共同的差異基因。對(duì)這些基因進(jìn)行了通路和功能的富集,結(jié)果顯示這些基因富集到了許多癌癥相關(guān)的通路與功能——“激素代謝”“核分裂的正調(diào)控”“白細(xì)胞趨化性”“藥物代謝”“致病性大腸桿菌感染”和“視黃醇代謝”等。研究顯示,甲狀腺激素能夠促進(jìn)結(jié)腸癌干細(xì)胞分化[26],糖皮質(zhì)激素-GR-CDK1 信號(hào)傳導(dǎo)誘導(dǎo)結(jié)腸癌細(xì)胞的增殖和侵襲[27]。而免疫細(xì)胞與結(jié)腸癌的診斷、臨床治療敏感性和預(yù)后相關(guān)[28-30]。大量研究表明[31,32],藥物代謝與結(jié)腸癌治療預(yù)后密切相關(guān)。另外,現(xiàn)在已有研究證明致病性大腸桿菌可促進(jìn)結(jié)腸癌的發(fā)生[33,34]。
為了尋找差異基因中可作為結(jié)腸癌預(yù)后靶點(diǎn)的生物標(biāo)記物,通過GEPIA 數(shù)據(jù)庫從102 個(gè)差異基因中篩選出了15 個(gè)在結(jié)腸癌5 年生存曲線具有統(tǒng)計(jì)學(xué)意義的基因——NR3C2、ETFDH、AQP8、CLDN23、SLC17A4、TIMP1、BGN、TESC、LRRC19、BEST2、NAT2、SULT1B1、SCG2、SELENBP1、IL1B,這些預(yù)后相關(guān)基因具有成為結(jié)腸癌生物標(biāo)記物的潛力。
為了得到預(yù)后相關(guān)基因中與腫瘤免疫相關(guān)的基因,通過TIMER 數(shù)據(jù)庫,對(duì)其與不同的免疫細(xì)胞進(jìn)行相關(guān)性分析,最終得到6 個(gè)免疫相關(guān)基因NR3C2、ETFDH、TIMP1、BGN、SCG2、IL1B,其中TIMP1、BGN、IL1B 已被用于結(jié)腸癌腫瘤微環(huán)境或免疫相關(guān)研究[35-38]。但NR3C2、ETFDH、SCG2 在結(jié)腸癌免疫微環(huán)境中的作用鮮見報(bào)道。分析這3 個(gè)基因與6 種免疫細(xì)胞的關(guān)系,發(fā)現(xiàn)NR3C2 與這6 種免疫細(xì)胞均成正相關(guān),并且與B 細(xì)胞、CD8+T 細(xì)胞關(guān)系更為密切,ETFDH 與除巨噬細(xì)胞外其他5 種免疫細(xì)胞呈相關(guān)性,其與B 細(xì)胞、樹突狀細(xì)胞關(guān)系更為密切,SCG2 與B 細(xì)胞不具有相關(guān)性,與其他免疫細(xì)胞呈正相關(guān),并且與CD4+T 細(xì)胞、巨噬細(xì)胞、中性粒細(xì)胞、樹突狀細(xì)胞均密切相關(guān)。
既往研究發(fā)現(xiàn),腫瘤浸潤(rùn)的CD20+B 淋巴細(xì)胞在結(jié)直腸癌中具有良好的預(yù)后價(jià)值[39]。研究表明[40],大量的CD4+T 細(xì)胞浸潤(rùn)到腫瘤中與不良的臨床預(yù)后相關(guān),而CD8+T 細(xì)胞作為腫瘤殺傷細(xì)胞,其缺失往往能促進(jìn)腫瘤的發(fā)展[41,42]。也有研究表明中性粒細(xì)胞與淋巴細(xì)胞的比值是結(jié)直腸癌患者的明確預(yù)測(cè)指標(biāo),腫瘤相關(guān)中性粒細(xì)胞能夠促進(jìn)腫瘤的發(fā)展[43]。腫瘤相關(guān)巨噬細(xì)胞(TAM)是指被募集到腫瘤微環(huán)境中的巨噬細(xì)胞,已有研究表明腫瘤相關(guān)巨噬細(xì)胞在腫瘤發(fā)生發(fā)展中發(fā)揮著重要作用[44-46]。本研究發(fā)現(xiàn),預(yù)后相關(guān)基因NR3C2、ETFDH、SCG2 與這些免疫細(xì)胞密切相關(guān),可能通過調(diào)控腫瘤免疫,在結(jié)腸癌發(fā)生發(fā)展過程中發(fā)揮重要的作用。
此外,本研究通過STRING 網(wǎng)站構(gòu)建了102 個(gè)差異基因的蛋白質(zhì)相互作用網(wǎng)絡(luò),并用Cytoscape 軟件尋找其中最關(guān)鍵的功能模塊,最關(guān)鍵模塊中包括16 個(gè)(MEP1A、SCGN、SLC17A4、SI、MYO1A、TSPAN7、SLC26A2、STMN2、UGT2A3、CHGB、ADH1C、VSNL1、MS4A12、WNT2、ADAMDEC1、CEACAM7)樞紐基因,這些基因在102 個(gè)差異基因中發(fā)揮著最關(guān)鍵的功能。在這16 個(gè)樞紐基因中,SLC17A4 與預(yù)后相關(guān),并在此之前尚未在結(jié)腸癌中報(bào)道過。
為了明確預(yù)后相關(guān)樞紐基因(SLC17A4)和免疫相關(guān)基因(NR3C2、ETFDH、SCG2)在結(jié)腸癌中的表達(dá)量、表達(dá)位置和可能發(fā)揮的作用,本研究基于TCGA 數(shù)據(jù)對(duì)這4 個(gè)基因表達(dá)量進(jìn)行可視化分析,結(jié)果發(fā)現(xiàn)其在癌組織中的表達(dá)量均低于正常組織。基于HPA 數(shù)據(jù)庫的免疫組化發(fā)現(xiàn),ETFDH 主要表達(dá)于細(xì)胞質(zhì),NR3C2 在細(xì)胞核和細(xì)胞質(zhì)中大量表達(dá),SCG2 在細(xì)胞質(zhì)中有少量表達(dá),SLC17A4 主要表達(dá)于細(xì)胞膜?;贕EEA 單基因富集分析發(fā)現(xiàn),這些基因富集到許多與癌癥的發(fā)生與進(jìn)展均密切相關(guān)的功能,如ETFDH 主要富集到“RNA 沉默”等功能,NR3C2 主要富集到“腫瘤壞死因子分泌”“血管內(nèi)皮細(xì)胞增殖”等功能,SCG2 主要富集到“細(xì)胞周期相變的正調(diào)控”“RNA 聚合酶結(jié)合”等功能,SLC17A4 主要富集到“細(xì)胞周期G1S 期轉(zhuǎn)變的負(fù)調(diào)控”等功能。
綜上所述,本研究共篩選出有望作為結(jié)腸癌預(yù)后靶點(diǎn)的15 個(gè)基因,通過對(duì)15 個(gè)基因進(jìn)一步分析,篩選出4 個(gè)結(jié)腸癌預(yù)后相關(guān)樞紐基因和免疫相關(guān)基因,這些基因具有重要的節(jié)點(diǎn)作用,可能與腫瘤免疫密切相關(guān),在腫瘤免疫微環(huán)境中起著重要的作用。然而,本研究尚未進(jìn)行分子機(jī)制的實(shí)驗(yàn)研究,這些基因在結(jié)腸癌中具體的功能機(jī)制尚不清楚,下一步將從該方向入手,進(jìn)一步明確其在結(jié)腸癌中的作用。