盧偉,付濤
武漢大學人民醫(yī)院胃腸外Ⅱ科,湖北 武漢 430060
胃癌是常見的消化系統(tǒng)惡性腫瘤之一,據(jù)統(tǒng)計,2018年全球范圍內(nèi)新發(fā)病例超過100萬,同時有超過80萬病例死亡[1]。由于胃癌早期癥狀不典型、篩查體系不完善,在中國約70%的胃癌病人在確診時已經(jīng)處于進展期[2]。腫瘤微環(huán)境(tumor microenvironment,TME),包含惡性細胞、腫瘤相關(guān)成纖維細胞、基質(zhì)細胞和免疫細胞等,與腫瘤發(fā)生發(fā)展、病人預后以及新的治療方案相關(guān)[3]。
目前越來越多的證據(jù)表明表觀遺傳學的改變包括DNA甲基化,基因組印跡以及其他改變,這些改變可能會導致包括胃癌在內(nèi)的惡性腫瘤進展[4]。本文旨在探討DNA甲基化對TME的潛在影響,同時建立基于DNA甲基化預后相關(guān)差異位點的胃癌分子亞型以及Cox風險預測模型,為胃癌的診療提供一定理論依據(jù)[5]。
癌癥基因組圖譜(TCGA)數(shù)據(jù)庫中胃腺癌(stomach adenocarcinoma,STAD)病人RNA轉(zhuǎn)錄組數(shù)據(jù)可從基因組數(shù)據(jù)共享(Genomic Data Commons,GDC,https://portal.gdc.cancer.gov/)中下載。所有TCGA-STAD DNA甲基化數(shù)據(jù)均直接從加利福尼亞大學圣克魯斯分校(UCSC,http://xena.ucsc.edu/public/)下載,其中包括Methylation 27k TCGA-STAD數(shù)據(jù)集和Methylation 450k TCGA-STAD數(shù)據(jù)集,并不受倫理審核。
下載的TCGA-STAD臨床數(shù)據(jù)集包括病人的生存時間、生存狀態(tài)、性別、T分期、N分期、M分期、病理分期等,通過樣本ID合并病人生存時間、生存狀態(tài)及DNA甲基化位點(排除一些標記為“未知”的數(shù)據(jù))。對Methylation 450k TCGA-STAD數(shù)據(jù)集使用“survival” R包進行了Cox回歸分析,得到單因素和多因素獨立預后甲基化位點。
運行一致性聚類對TCGA-STAD數(shù)據(jù)和多個獨立預后的甲基化位點進行分析,然后將TCGA中胃癌樣本分為不同的DNA甲基化亞型(使用“ConsensusClusterPlus”R包無監(jiān)督運行1 000次)。同時可以獲得不同的胃癌DNA甲基化亞型病人的預后。通過TCGA-STAD病人樣本ID將分型后的DNA甲基化亞型中的胃癌病人與其臨床特征結(jié)合,探索不同DNA甲基化亞型與臨床特征的關(guān)系。
選擇DNA甲基化水平差異最大的2個亞型,將亞型對應(yīng)的TCGA-STAD樣本上傳至CIBERSORT(https://cibersort.stanford.edu/)來推斷2個亞型的免疫細胞組成(循環(huán)計算1 000次),由此可以推算DNA甲基化對TME的影響。
選擇預后最好同時包含差異位點最多的亞型,取該亞型DNA甲基化差異位點及多因素獨立預后DNA甲基化位點的交集位點,計算風險評分(Risk Score),計算公式如下:
其中“1”到“n”為所有DNA甲基化差異位點。將450k甲基化芯片中病人標記為“訓練組”(“training group”),將27k甲基化芯片中病人標記為“對照組”(“test group”)。對訓練組及對照組中的病人進行風險評分,高于訓練組風險評分中位值的病人為高風險組病人,低于訓練組風險評分中位值的病人為低風險組病人。
首先本研究采用了R studio軟件(R 3.6.1 version,https://www.r-project.org/)及Perl進行數(shù)據(jù)分析及作圖。通過TCGA RNA轉(zhuǎn)錄組數(shù)據(jù)對P值進行校正得到偽發(fā)現(xiàn)率(FDR),篩選臨界值為FDR<0.05和logFC絕對值>2.000。通過訓練組病人的受試者工作特征(ROC)曲線判斷該模型是否有效[6-8]。
通過TCGA樣本ID將Methylation 450k TCGA-STAD數(shù)據(jù)集與樣本對應(yīng)的生存時間及生存狀態(tài)合并,使用Cox回歸分析,得到148個單因素獨立預后相關(guān)DNA甲基化位點(P<0.05)和137個多因素獨立預后相關(guān)DNA甲基化位點(P<0.05)。根據(jù)樣本生存時間、生存狀態(tài)和多因素獨立預后相關(guān)DNA甲基化位點將TCGA-STAD分為7個DNA甲基化亞型,同時可以獲得DNA甲基化亞型的Kaplan-Meier曲線(P=0.003,圖1A、B)。
合并TCGA-STAD臨床數(shù)據(jù)和DNA甲基化亞型,分析不同甲基化亞型與病理分期、分級(grade)、性別、年齡、TNM分期的關(guān)系[9]。結(jié)合圖1B及圖2A可認為DNA甲基化水平最高的亞型3病人較DNA甲基化水平最低的亞型7病人預后更好(P<0.05)。由圖2 B~H可知亞型7中≤65歲、G2、M1期、N2期和Ⅳ期病人數(shù)量多于亞型3中病人數(shù)量。
CIBERSORT結(jié)果提示生存差異最大的亞型3及亞型7的免疫細胞組成中幼稚B細胞(B cells naive)、記憶B細胞(B cells memory)及激活的T細胞CD4+記憶細胞(T cells CD4 memory activated)存在明顯差異(P<0.05,圖3)。
圖1 確定DNA甲基化亞型 A.按DNA甲基化水平差異將TCGA-STAD劃分為7個DNA甲基化亞型;B.不同DNA甲基化亞型的生存率差異(P<0.05)
圖2 不同臨床特征中不同DNA甲基化亞型病人所占比例 A.DNA甲基化與臨床特征關(guān)系的熱圖;B.不同DNA甲基化亞型病人年齡占比;C.不同DNA甲基化亞型病人性別占比;D.不同DNA甲基化亞型病人病理分級占比;E.不同DNA甲基化亞型病人病理分期占比;F.不同DNA甲基化亞型病人T分期占比;G.不同DNA甲基化亞型病人N分期占比;H.不同DNA甲基化亞型病人M分期占比
圖3 亞型3病人和亞型7病人免疫細胞浸潤差異
通過DNA甲基化分型與預后結(jié)果可見亞型3預后最好,取該亞型DNA甲基化差異位點及多因素獨立預后DNA甲基化位點的交集位點計算風險評分,在本文中風險評分=(-1.242×cg12645220表達量)+(-1.432×cg20727114表達量)+(-1.744×cg26535072表達量),見表1。
表1 DNA甲基化差異位點表達與該位點系數(shù)
基于風險評分建立Cox風險預測模型,將TCGA-STAD病人分為高風險組病人和低風險組病人(臨床信息見表2)。ROC曲線下面積(AUC)為0.677,可以認為基于風險評分構(gòu)建的DNA甲基化Cox風險預測模型能夠有效預測胃癌病人預后(圖4)。訓練組病人及對照組病人的Kaplan-Meier曲線均證明高風險組病人較低風險組病人預后更差(P<0.05),見圖5A、B。
圖4 DNA甲基化風險預測模型繪制的受試者工作特征(ROC)曲線
表2 TCGA-STAD病人臨床信息(例)
圖5 訓練組和對照組不同風險組病人的預后 A.在訓練組中,高風險組病人較低風險組病人預后更差(P<0.05);B.在對照組中,高風險組病人較低風險組病人預后更差(P<0.05)
在以往的研究中,為了預測胃癌病人的預后,通常將胃癌分為4種分子亞型:EB病毒相關(guān)型胃癌,微衛(wèi)星不穩(wěn)定型胃癌,染色體不穩(wěn)定型胃癌以及基因組穩(wěn)定型胃癌[10]。本研究基于DNA甲基化水平差異將TCGA胃癌病人分為7個DNA甲基化亞型。
由于腫瘤生物學行為和免疫反應(yīng)的異質(zhì)性和復雜性,應(yīng)用單一的生物標志物來全面說明和預測腫瘤預后和其對治療的反應(yīng)是不可靠的。因此,基于多生物標志物的預測模型可能是一種更有效、更準確的工具。本研究依據(jù)DNA甲基化預后相關(guān)差異位點cg12645220、cg20727114、cg26535072建立了Cox風險預測模型。cg12645220、cg20727114、cg26535072表達的基因分別是PAK7、APBA1、CPT1C。p21活化激酶7(PAK7)屬于PAK族蛋白,參與調(diào)節(jié)細胞增殖、凋亡、侵襲/遷移和化學抗性,其過度表達或激活可能導致癌癥[11-12]。APBA1與 Munc18-1結(jié)合,在突觸小泡的胞吐作用中發(fā)揮推定功能,突觸小泡的胞吐作用是突觸小泡胞吐機制的重要組成部分[13]。CPT1C具有該基因的重要旁系同源物是CPT1A在脂質(zhì)代謝過程中類似的作用,能夠影響CD8+T記憶細胞的生長[14]。CPTI激活脂肪酸氧化,通過產(chǎn)生ATP和NADPH促進癌癥生長,這是癌癥代謝的重要組成部分[15]。所以,CPT1C可能成為癌癥的新治療靶點[16]。
遺傳基因的表觀學改變,尤其是DNA甲基化,已被確定為腫瘤免疫細胞浸潤改變的重要因素[17-18]。本研究證明了DNA甲基化水平高的病人預后好,DNA甲基化水平不同的病人間存在包括幼稚B細胞、記憶B細胞及激活的T細胞CD4+記憶細胞等免疫細胞比例的差異?,F(xiàn)在針對胃癌免疫治療,如程序性死亡蛋白-1(PD-1)等,都是針對T細胞的治療方法[19-20]。B 細胞被認為是體液免疫的主要效應(yīng)細胞,可以通過分泌免疫球蛋白、促進T細胞反應(yīng)和直接殺死癌細胞來抑制腫瘤進展[21]。盡管免疫檢查點抑制劑的引入使T細胞相關(guān)免疫反應(yīng)成為治療靶點,但并非所有病人都能從這些治療中受益[22-24]。細胞毒性免疫依賴于特殊效應(yīng)T細胞,即細胞毒性T細胞,它們具有特定的溶細胞機制,使它們能夠誘導目標死亡,確定靶細胞后,細胞毒性T細胞形成裂解免疫突觸,通過將微管組織中心對接在突觸膜上,制備致死酶溶解裂解顆粒[25-26]。美國食品藥品監(jiān)督管理局批準了幾種檢查點抑制劑藥物,如抗PD-1派姆單抗等,但并未廣泛應(yīng)用于臨床胃癌病人[27-28]。針對DNA甲基化位點的免疫治療可能會成為未來胃癌治療方法之一[29-31]。
本研究也具有一定的局限性:首先對TCGA數(shù)據(jù)庫進行了條件篩選,結(jié)果可能出現(xiàn)選擇偏倚。其次,TCGA數(shù)據(jù)庫中病例為美國公民,因為中美飲食條件、早期篩查體系的不同,所以結(jié)果對亞太人群的預測效果可能并不理想。并且由于TCGA數(shù)據(jù)庫中樣本量的限制,同樣會對研究結(jié)果造成影響,在后期仍需要大量獨立樣本進行驗證。
利益沖突所有作者均聲明不存在利益沖突