陳俊逸,陳 晶,張 蒙,梁朝朝,陳先國
腎透明細(xì)胞癌(clear cell renal cell carcinoma,ccRCC)是泌尿系統(tǒng)最常見的惡性腫瘤之一,其發(fā)病率占腎細(xì)胞癌(renal cell carcinoma,RCC)發(fā)病率的70%~80%。手術(shù)是局限性RCC的主要治療方式,而晚期和轉(zhuǎn)移性RCC主要依賴于免疫治療、靶向藥物和化療。該疾病的病死率仍呈逐年上升趨勢。因此,鑒定出新型的生物標(biāo)志物可用于ccRCC患者的復(fù)發(fā)或死亡風(fēng)險預(yù)測,對于患者的術(shù)后治療意義重大。
自噬是一種重要的生物學(xué)現(xiàn)象,在自噬相關(guān)基因(autophagy-related genes,ARG)的調(diào)控下,細(xì)胞可通過分解大分子物質(zhì)提供氨基酸及合成新蛋白的其他必需因子。已有大量研究支持自噬與ccRCC的發(fā)生和進(jìn)展密切相關(guān)。然而,關(guān)于ARGs是否可用于ccRCC患者術(shù)后預(yù)后評估尚未明確。
1.1 數(shù)據(jù)資料
從TCGA中下載ccRCC患者的ARGs表達(dá)譜數(shù)據(jù)及臨床數(shù)據(jù),包括537例ccRCC腫瘤和96例非腫瘤組織的RNA測序數(shù)據(jù),其中包括489例有配對臨床資料的ccRCC樣本。提取的臨床數(shù)據(jù)信息包括總生存期(overall survival,OS)、年齡、性別、腫瘤分級、T分期、病理分級。所有數(shù)據(jù)下載于2020年4月12日。1.2 方法
應(yīng)用R統(tǒng)計軟件中的“EdgeR”軟件包對下載的數(shù)據(jù)進(jìn)行提取分析,篩選出ccRCC和非腫瘤組織間的差異表達(dá)自噬相關(guān)基因(differentially expressed autophagy-related genes,DEARGs)(篩選條件為log FoldChange≥2或≤-2,F(xiàn)DRP
<0.05)。然后,對DEARGs采用單因素Cox回歸分析,依據(jù)P
<0.05篩選出與患者OS相關(guān)的DEARGs。接下來,將篩選出的與預(yù)后相關(guān)的DEARGs納入多因素Cox回歸分析中并建立預(yù)后風(fēng)險評分RS(risk score,RS)模型,計算每位患者的RS,依據(jù)評分中位值將患者分為高、低風(fēng)險組,利用卡普蘭一梅爾估計量(Kaplan-Meier,K-M)法對比組間預(yù)后的差異,并計算受試者工作特征(receiver operating characteristic,ROC)曲線評價模型的有效性,并計算曲線下面積(area under curve,AUC)。最后通過多因素Cox回歸分析探討該RS是否獨立于各項臨床病理參數(shù)(年齡、性別、腫瘤分級、T分期、病理分級),作為ccRCC患者獨立預(yù)后因子。2.1 篩選
DEARGs從TCGA數(shù)據(jù)庫中獲取了537例ccRCC腫瘤和96例非腫瘤組織的RNA測序數(shù)據(jù),提取了215個ARGs的表達(dá)譜。利用“EdgeR”軟件對比了癌和非癌組織,以logFoldChange≥2或≤-2和FDR
P
<0.05為截斷標(biāo)準(zhǔn),共篩選出了36個上調(diào)和9個下調(diào)的ARGs。圖1A散點圖顯示了9個下調(diào)基因(FAM215A
、DIRAS3
、PRKCQ
、GABARAPL1
、ERBB2
、BAG1
、HIF1A
、TP63
和MTOR
)和36個上調(diào)基因(CX3CL1
、ATG12
、BID
、IL24
、RACK1
、FAS
、BAX
、CASP4
、VMP1
、CCR2
、P4HB
、GAPDH
、ERO1A
、GRID1
、EGFR
、MYC
、BNIP3
、SERPINA1
、SPHK1
、RAB24
、RGS19
、CASP1
、NLRC4
、NRG3
、APOL1
、EIF4EBP1
、HSPB8
、ATG16L2
、BIRC5
、CXCR4
、ATG9B
、TP73
、NKX23
、VEGFA
、IFNG
和CDKN2A
)。圖1B熱圖顯示DEARGs表達(dá)水平的層次聚類。圖1 ccRCC組織與正常組織之間DEARGs
2.2 基于DEARGs的預(yù)后模型的建立
將有配對臨床資料的489例ccRCC樣本(表1),通過隨機(jī)抽樣的方法按照7 ∶3的拆分為訓(xùn)練組(n=344)與驗證組(n
=145),訓(xùn)練組用于建模,驗證組用于外部驗證預(yù)后模型的效能。通過對這45個DEARGs的單因素Cox回歸分析后,得到了21個與OS有關(guān)的DEARGs(圖2),納入多因素Cox回歸分析,篩選出8個DEARGs用于模型的構(gòu)建(BID
、EIF4EBP1
、ATG16L2
、CX3CL1
、IFNG
、PRKCQ
、EIF4EBP
、VMP1
)。其中,ATG16L2
,RAB24
,EIF4EBP1
,IFNG
和BID
為高風(fēng)險基因,而VMP1
,PRKCQ
和CX3CL1
為保護(hù)基因。各基因的風(fēng)險系數(shù)(coefficient,COEF)及風(fēng)險比(hazard ratio,HR)見表2。COEF×風(fēng)險基因表達(dá)值為RS的因變量,得到OS RS=(0.718×BID
表達(dá)值)+(0.281×EIF4EBP1
表達(dá)值)+(0.326×ATG16L2
的表達(dá)值)+(-0.220×CX3CL1
表達(dá)值)+(0.280×IFNG
表達(dá)值)+(-0.299×PRKCQ
表達(dá)值)+(0.281×EIF4EBP1
表達(dá)值)+(-0.233×VMP1
表達(dá)值)。2.3 預(yù)測模型的有效性和穩(wěn)定性評估
訓(xùn)練組中位RS為0.95,將評分<0.95的172例患者納入低風(fēng)險組,評分≥0.95的172例患者納入高風(fēng)險組。訓(xùn)練組中ccRCC患者的RS評分、生存分布和ARGs表達(dá)見圖3,本研究發(fā)現(xiàn)隨著RS值的升高,患者生存時間呈縮短趨勢,且死亡患者人數(shù)明顯增加(圖中紅點顯示)。熱圖中高RS患者顯示VMP1
、ATG16L2
、RAB24
、BID
和EIF4EBP1
上調(diào),而IFNG
、CX3CL1
和PRKCQ
降低,低風(fēng)險患者顯示IFNG
、CX3CL1
和PRKCQ
上調(diào),VMP1
、ATG16L2
、RAB24
、BID
和EIF4EBP1
上調(diào)。進(jìn)一步K-M法結(jié)果顯示,高風(fēng)險組患者的預(yù)后比低風(fēng)險組差(圖4A,P
<0.05),且ROC曲線提示該模型具有較高的預(yù)測價值(圖4B,AUC=0.783,95%CI
=0.723~0.897)。為驗證預(yù)后預(yù)測模型的靈敏度與穩(wěn)定性,對驗證組進(jìn)行了分析。依據(jù)RS評分,將驗證組145例ccRCC患者分為高風(fēng)險(n
=72)和低風(fēng)險(n
=73)組,K-M法揭示低風(fēng)險組患者與高風(fēng)險組相比OS延長(P
<0.05)(圖5)。ROC曲線提示該模型在驗證隊列中仍持有較高的預(yù)測價值(AUC=0.754,95%CI
=0.706~0.873),特異度為84.1%。綜上所述,這些結(jié)果提示DEARGs預(yù)測模型能夠有效的預(yù)測ccRCC患者的預(yù)后。表1 TCGA數(shù)據(jù)庫中489例ccRCC患者的臨床特征
表2 DEARGs多因素Cox回歸分析
圖2 單因素Cox回歸中21個與總體生存有關(guān)的ARGs森林圖
圖3 RS分布圖與DEARGs熱圖及生存時間散點圖
圖4 訓(xùn)練組DEAGs模型預(yù)測效果評估
2.4 自噬相關(guān)預(yù)后模型與患者生存期獨立相關(guān)
研究進(jìn)一步利用多因素分析評估了訓(xùn)練組RS與臨床病理參數(shù)(年齡、性別、腫瘤分期、T分期、病理分級之間的關(guān)系。如表3所示,單因素Cox回歸分析表明ccRCC患者的年齡、性別、腫瘤分期、病理分級、RS與OS相關(guān)(P
<0.05)。多因素Cox回歸分析揭示RS與總體生存相關(guān),可作為患者OS評估的獨立預(yù)測因子(P
<0.05)。此外,病理分級也與患者OS相關(guān)(P
<0.05),可作為預(yù)后評估獨立因子。這些結(jié)果表明,基于DEARGs的OS預(yù)后預(yù)測模型可有效區(qū)分高危和低危死亡風(fēng)險的ccRCC患者,且可作為預(yù)后評估的獨立預(yù)測因子。圖5 驗證組DEAGs模型預(yù)測效果評估
表3 單因素和多因素Cox回歸分析影響患者總體生存期的因素
BID
表達(dá)值)+(0.281×EIF
4EBP1
表達(dá)值)+(0.326×ATG16L2
的表達(dá)值)+(-0.220×CX3CL1
表達(dá)值)+(0.280×IFNG
表達(dá)值)+(-0.299×PRKCQ
表達(dá)值)+(0.281×EIF
4EBP1
表達(dá)值)+(-0.233×VMP1
表達(dá)值)。K-M法、log-rank法和ROC分析在訓(xùn)練組和驗證組中揭示了預(yù)測模型的特異性和穩(wěn)定性。同時,多因素分析揭示該模型為ccRCC患者OS的獨立預(yù)測因素,進(jìn)一步佐證了ARGs與ccRCC的關(guān)聯(lián)。模型共納入8個差異表達(dá)的ARGs。BID
位于染色體22q11.21上,編碼與凋亡相關(guān)的蛋白,研究顯示其可在甲狀腺癌組織中高表達(dá),并與患者預(yù)后緊密相關(guān)。ATG16L2
位于11號染色體上,尚無文獻(xiàn)報道該基因在腫瘤發(fā)生或進(jìn)展中的作用。而在當(dāng)前研究中,顯示ATG16L2
表達(dá)上調(diào)并與ccRCC患者的OS降低有關(guān)。EIF4EBP1
在肝細(xì)胞癌和乳腺癌組織中表達(dá)水平升高且與患者預(yù)后不佳有關(guān)。PRKCQ
在腫瘤中的作用機(jī)制尚未完全闡明,研究表明,PRKCQ
在包括胃腸道間質(zhì)瘤在內(nèi)的實體腫瘤中均表達(dá)上調(diào)。RAB24目前在功能方面研究較少,Chen et al發(fā)現(xiàn)其在肝細(xì)胞癌中上調(diào),過表達(dá)該基因可促進(jìn)肝癌細(xì)胞進(jìn)展和上皮-間質(zhì)轉(zhuǎn)化過程。CX3CL1
基因位于16號染色體,研究表明CX3CL1
與CCR1
,CCL5
受體協(xié)同誘導(dǎo)結(jié)直腸癌的肝轉(zhuǎn)移。VMP1
在肝細(xì)胞癌中,抑制增殖和轉(zhuǎn)移,而在胰腺細(xì)胞系中,對VMP1
的抑制會降低細(xì)胞凋亡。IFNG
在腫瘤方面研究較少,Garcia-tunon et al發(fā)現(xiàn)IFNG在乳腺纖維囊性病變、原位和浸潤性腫瘤中的表達(dá)量上調(diào),提出IFNG可作為乳腺癌的一種前瞻性治療方式。綜上所述,本研究通過Cox回歸分析組建了由8個DEARGs構(gòu)成的ccRCC患者預(yù)后預(yù)測模型。研究證明了該模型具有較高的特異性與靈敏度,其可補(bǔ)充臨床病理參數(shù)用于術(shù)后患者的預(yù)后評估和治療指導(dǎo),推進(jìn)了ccRCC患者的個體化醫(yī)療進(jìn)展。