周銳 余運(yùn)霖 焦鑫 余梟 高文哲 張先林
1三峽大學(xué)附屬仁和醫(yī)院普外科,宜昌 443001;2中南大學(xué)湘雅三醫(yī)院肝膽胰外科,長(zhǎng)沙 410000
【提要】 通過TCGA數(shù)據(jù)庫(kù)中CCL2基因表達(dá)譜,對(duì)其差異表達(dá)基因(DEGs)做相關(guān)性分析,然后與臨床生存信息結(jié)合,經(jīng)過建模驗(yàn)證后獲得預(yù)后相關(guān)DEGs,進(jìn)而探討DEGs部分基因的作用及對(duì)胰腺癌患者生存的影響。結(jié)果表明,CCL2相關(guān)性基因 在胰腺癌中扮演重要角色,其低表達(dá)與胰腺癌患者的預(yù)后成正相關(guān)。
趨化因子是一類由細(xì)胞分泌的小細(xì)胞因子或信號(hào)蛋白,具有誘導(dǎo)附近反應(yīng)細(xì)胞定向趨化的能力[1],是主導(dǎo)細(xì)胞遷徙的關(guān)鍵調(diào)節(jié)劑,對(duì)惡性腫瘤的發(fā)展有極大影響。CCL2是趨化因子CC亞家族中的重要成員,為促進(jìn)單核細(xì)胞及巨噬細(xì)胞遷徙的關(guān)鍵因子之一,已經(jīng)證實(shí),CCL2在多種腫瘤發(fā)展進(jìn)程中發(fā)揮作用[2-5],通過抑制細(xì)胞凋亡、壞死和自噬等過程提高癌細(xì)胞的存活能力[6-8],并在腫瘤微環(huán)境中與其受體相互作用,調(diào)節(jié)單核細(xì)胞的趨化性從而導(dǎo)致腫瘤的發(fā)展。然而,CCL2在胰腺癌中的作用機(jī)制尚不明確。本研究通過生物信息學(xué)分析CCL2及其相關(guān)差異表達(dá)基因,探討它們?cè)谝认侔┙M織中的表達(dá)及其與患者預(yù)后的相關(guān)性。
1.?dāng)?shù)據(jù)集的選擇:從腫瘤基因組圖譜(The Cancer Genome Atlas,TCGA,)數(shù)據(jù)庫(kù)下載178例胰腺癌患者的基因表達(dá)譜,從TCGA數(shù)據(jù)庫(kù)的連接網(wǎng)站UCSC XENA下載178例胰腺癌患者對(duì)應(yīng)的完整臨床數(shù)據(jù)。
2.基因表達(dá)差異分析及相關(guān)性分析:根據(jù)CCL2基因表達(dá)量中位數(shù),將178例患者分為高、低表達(dá)兩組,以logFC=1且P<0.05為標(biāo)準(zhǔn),采用R/Bioconductor軟件的limma包對(duì)比篩選差異表達(dá)基因(differentially expressed genes,DEGs)。采用R軟件的corplot包對(duì)TCGA樣本與CCL2基因進(jìn)行相關(guān)性分析,得到各個(gè)基因的相關(guān)系數(shù),以相關(guān)系數(shù)的絕對(duì)值0.15為界限,選取相關(guān)基因與DEGs的交集,得到相關(guān)DEGs。根據(jù)178例患者的中位生存時(shí)間和生存狀態(tài),采用R軟件的ezcox包進(jìn)行批量COX回歸分析,以P<0.05為差異有統(tǒng)計(jì)學(xué)意義,篩選與預(yù)后相關(guān)的DEGs。
3.預(yù)后相關(guān)DEGs功能富集分析:使用R/Bioconductor軟件的clusterprofiler包對(duì)預(yù)后相關(guān)DEGs進(jìn)行功能富集分析,包括基因本體(gene ontology,GO)分析和京都基因與基因組百科全書(Kyoto Encyclopedia of Gene and Genomes,KEGG)通路富集分析,其中GO包括細(xì)胞成分、分子功能和生物學(xué)過程3個(gè)部分。
4.風(fēng)險(xiǎn)預(yù)測(cè)模型的建立與評(píng)估:采用R軟件的glmnet包,用Lasso方法篩選變量,建立Cox回歸模型,并計(jì)算基因的相關(guān)回歸系數(shù),獲得預(yù)后相關(guān)DEGs模型。然后二次建模,根據(jù)回歸系數(shù)加權(quán)建立胰腺癌預(yù)后風(fēng)險(xiǎn)評(píng)估公式,繪制生存曲線和受試者工作特征曲線(receiver operating characteristic, ROC),計(jì)算曲線下面積(area under the curve, AUC),并將預(yù)測(cè)模型可視化為列線圖。
5.統(tǒng)計(jì)學(xué)處理:采用R軟件(3.6.0版本)進(jìn)行統(tǒng)計(jì)學(xué)分析。應(yīng)用Wilcoxon秩和檢驗(yàn)分析CCL2關(guān)鍵相關(guān)基因在胰腺癌組織中的差異表達(dá),計(jì)量資料采用t檢驗(yàn),計(jì)數(shù)資料采用χ2檢驗(yàn)?;蜷g的相關(guān)性采用Spearman相關(guān)分析,0.1≤|r|≤1.0時(shí)定義為存在相關(guān);生存曲線采用Kaplan-Meier法和Log-rank檢驗(yàn)。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
1.CCL2相關(guān)差異表達(dá)基因及功能和通路富集分析:通過差異分析及相關(guān)性分析,得到上調(diào)基因60個(gè),下調(diào)基因304個(gè),相關(guān)DEGs 223個(gè)(圖1A)。結(jié)合患者中位生存時(shí)間和生存狀態(tài),進(jìn)行多基因的COX回歸分析,得到與患者預(yù)后相關(guān)的DEGs 20個(gè)。GO功能富集分析和KEGG通路富集分析發(fā)現(xiàn),20個(gè)DEGs主要富集對(duì)IL-1、TNF的應(yīng)答和G蛋白偶聯(lián)受體結(jié)合位點(diǎn)上以及干細(xì)胞黏附分子、趨化因子信號(hào)通路上(圖1B、1C)。
圖1 胰腺癌CCL2相關(guān)差異表達(dá)基因的火山圖(1A)及胰腺癌CCL2相關(guān)差異表達(dá)基因功能富集圖(1B)和通路富集圖(1C)
2.預(yù)后相關(guān)DEGs風(fēng)險(xiǎn)模型及驗(yàn)證:Lasso Cox回歸分析篩選得到12個(gè)基因,分別為VTCN1、RXRG、HSD11B1、RELN、LCN6、MUC15、C1S、CLDN10、TRARG1、CCL18、SLC7A10、ZNF831,其中VTCN1、HSD11B1、C1S為高風(fēng)險(xiǎn)基因;Kaplan-Meier單變量分析結(jié)果顯示,高風(fēng)險(xiǎn)基因與患者生存期短有關(guān)。根據(jù)回歸系數(shù)得到患者的風(fēng)險(xiǎn)評(píng)分,并將患者分為高、低風(fēng)險(xiǎn)組,Kaplan-Meier法進(jìn)行生存分析結(jié)果顯示,兩組患者生存期差異有統(tǒng)計(jì)學(xué)意義(P<0.05),高風(fēng)險(xiǎn)組患者生存期明顯縮短(圖2A)。預(yù)測(cè)模型的ROC曲線見圖2A,AUC值為0.716,表明該模型可預(yù)測(cè)胰腺癌患者的預(yù)后(圖2B)。將預(yù)測(cè)模型可視化為生存預(yù)測(cè)列線圖(圖2C)。
圖2 胰腺癌高、低風(fēng)險(xiǎn)組患者的生存曲線(2A)及生存預(yù)測(cè)的ROC曲線(2B)和列線圖(2C)
討論胰腺癌惡性程度高,預(yù)后差,了解其腫瘤免疫微環(huán)境,對(duì)疾病的干預(yù)和預(yù)后的判斷具有重要意義。有證據(jù)表明,高CCL2水平與更具侵襲性的惡性腫瘤、更高的轉(zhuǎn)移概率和更廣泛的癌癥預(yù)后相關(guān)[9]。CCL2在聚集腫瘤相關(guān)巨噬細(xì)胞中發(fā)揮作用,促使胰腺癌細(xì)胞重新改變其代謝途徑耐以生存,并使得胰腺癌細(xì)胞能夠在缺氧的條件下增殖[10-12]。本研究通過GO功能和KEGG通路富集分析發(fā)現(xiàn),CCL2相關(guān)因子除了作用于常規(guī)趨化因子通路外,還聚集干細(xì)胞黏附、IL-1的免疫反應(yīng)和G蛋白受體的結(jié)合,可能與腫瘤的浸潤(rùn)、遠(yuǎn)處轉(zhuǎn)移、逃離細(xì)胞免疫監(jiān)視等方面有關(guān)。根據(jù)CCL2相關(guān)性因子及Lasso Cox回歸分析篩選的12個(gè)建?;蛑校琙NF831被報(bào)道富集于CD4+T細(xì)胞浸潤(rùn)[13],進(jìn)而可能參與調(diào)控胰腺癌CD4+T細(xì)胞的基因表達(dá);SLC7A10屬于溶質(zhì)載體家族,其過表達(dá)降低了ROS生成并增加了線粒體呼吸的能力,促使脂肪細(xì)胞肥大,促進(jìn)肥胖和胰島素抵抗,進(jìn)而引起血糖的變化,使得胰腺癌的風(fēng)險(xiǎn)增加[14];而同樣,作為趨化因子家族的CCL18也能促使腫瘤的轉(zhuǎn)移[15];RXRG高表達(dá)會(huì)引起血脂的異常風(fēng)險(xiǎn)增加,而血脂和血糖的變化與胰腺癌有著密切關(guān)系[16]。CCL2由于能夠激活絲裂原活化蛋白激酶(MAPK)信號(hào)通路,阻礙T細(xì)胞增殖,伴隨著持續(xù)的免疫抑制,通過促進(jìn)髓源性抑制細(xì)胞(M-MDSCs)的免疫抑制能力,從而促使腫瘤生長(zhǎng)和增殖[17]。血漿CCL2水平的升高是大腸癌復(fù)發(fā)的預(yù)測(cè)生物標(biāo)志物[18]。趨化因子CCL2的表觀遺傳沉默抑制巨噬細(xì)胞浸潤(rùn)以促進(jìn)腫瘤的發(fā)展[19]。本研究結(jié)果顯示,相比低風(fēng)險(xiǎn)組患者,高風(fēng)險(xiǎn)患者生存期明顯縮短(P<0.05);ROC曲線示該模型可以預(yù)測(cè)胰腺癌患者的預(yù)后。該模型基于各類基因的總體表達(dá)量,更符合當(dāng)今的系統(tǒng)治療理念。
同時(shí),本研究也存在一些缺陷。首先,本研究是通過生物信息學(xué)構(gòu)建的預(yù)后預(yù)測(cè)模型,無外部的實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證,臨床實(shí)際應(yīng)用價(jià)值有限。其次,由于TCGA的樣本數(shù)量局限性,不能完整地闡述CCL2作用機(jī)制引起相關(guān)基因的差異性表達(dá)。最后,需要更多的病例數(shù)量獨(dú)立隊(duì)列研究來驗(yàn)證。
利益沖突所有作者聲明無利益沖突