李晨晨 肖芝松(通訊作者)
(大理大學 云南 大理 671000)
細胞自噬是指在內(nèi)源性自噬相關(guān)基因(autophagy related gene,Atg)的嚴格調(diào)控下的細胞自我代謝過程也是人體防止正常細胞損傷的機制,若自噬機制異常就會引起細胞損傷。有研究發(fā)現(xiàn),在腫瘤早期,自噬能夠保護腫瘤細胞躲避自體免疫應答,促進腫瘤細胞存活;而過度的自噬又會促進腫瘤細胞凋亡,進而發(fā)揮抗腫瘤機制[1]。
膀胱癌是泌尿系統(tǒng)中最常見的惡性腫瘤之一,全球范圍內(nèi)每年新增的膀胱癌患者超過33 萬例,死亡病例多于3 萬例[2]。在我國泌尿生殖系腫瘤中,膀胱癌也是發(fā)病率和病死率最高的泌尿生殖系統(tǒng)腫瘤,而且中國膀胱癌的發(fā)病率也在呈逐年增長的趨勢[3]。若能進一步明確膀胱癌的獨立預后因子,對患者的診斷、治療方式和改善患者生活質(zhì)量、總體生存率都會起到至關(guān)重要的作用。
下載癌癥基因組圖譜(The CancerGenome Atlas,TCGA)數(shù)據(jù)庫數(shù)據(jù)庫中人膀胱癌的RNA-Seq 數(shù)據(jù)和412 例膀胱癌患者臨床信息。RNA-Seq 數(shù)據(jù)中包括19 例正常膀胱樣本和414 例膀胱癌樣本的測序數(shù)據(jù)。通過R 軟件對所下載數(shù)據(jù)進行整理。通過HADB(http://www.autophagy.lu/)獲得人自噬相關(guān)mRNAs數(shù)據(jù)。
整理TCGA 數(shù)據(jù)庫膀胱癌RNAs 表達情況并從其中提取人自噬相關(guān)基因的表達數(shù)據(jù),通過R 軟件對膀胱癌正常樣本和癌癥樣本進行分析(用limma 包對自噬基因表達數(shù)據(jù)進行歸一化處理并采用wilcox.t 檢驗進行差異表達)。采用錯誤發(fā)現(xiàn)率(FDR)對自噬mRNAs 的As 的差異表達的顯著性進行校正(標準設定為:①P及FDR <0.05;②∣logFCfilter (FC)∣>1)。共篩選出38 個顯著差異表達自噬基因。
通過排除2 例生存信息不完整和4 例RNA 測序數(shù)據(jù)缺失的膀胱癌患者資料,將406 例患者的對應的自噬基因測序數(shù)據(jù)和生存數(shù)據(jù)進行合并。利用R 語言survival 程序包進行單因素cox分析,并把得到的與膀胱癌預后顯著相關(guān)的自噬基因(P<0.05)納入多因素cox 分析來進一步驗證這些基因?qū)Π螂装┗颊哳A后的價值。經(jīng)過上述分析,建立評估膀胱癌患者預后風險模型 風險值(R iskScore)=expmRNA1×βmRNA1+expmRNA2×βmRNA2+ …… +expmRNAn×βmRNAn(exp:為表達水平;β 為多因素cox 回歸分析的回歸系數(shù))。
通過構(gòu)建的膀胱癌患者預后cox 模型來計算406 個膀胱癌患者的風險值。以中位值將患者分為高、低風險兩組并進行Kaplan-Meier 生存曲線繪制。使用R 軟件survival、survminer包來繪制ROC 曲線來判斷預后模型預測患者五年生存率的準確概率。
通過R 軟件整理TCGA 數(shù)據(jù)庫中433 個樣本(正常樣本19 例、腫瘤樣本414 例)的基因測序數(shù)據(jù)并提取其中232 個自噬基因(通過HADB(http://www.autophagy.lu/)獲得)的表達數(shù)據(jù),通過R 軟件利用wilcox.t 檢驗進行差異表達分析,發(fā)現(xiàn)232 個基因中有38 個自噬基因顯著差異表達。
為了初步篩選與膀胱癌預后相關(guān)的自噬基因,首先通過R軟件的“survival 程序包”對差異表達的38 個自噬mRNAs 進行單因素Cox 回歸分析,P<0.05 認為差異有統(tǒng)計學意義,結(jié)果一共發(fā)現(xiàn)有7 個自噬基因與患者預后顯著相關(guān)(P<0.05),通過R 軟件繪制差異有統(tǒng)計學意義的森林圖(圖1)進行展示。接下來通過多因素cox 分析進行進一步篩選,發(fā)現(xiàn)5 個自噬基因APOL1、ITGA3、P4HB、MYC、DIRAS3 具有預測患者預后的功能,預后風險模型為:風險值=(APOL1×-0.14398468)+(ITGA3×-0.10405556)+(P4HB×0.68837742)+(MYC×0.20125767)+(DIRAS3×0.32094798)。其中APOL1 和ITGA3 自噬基因的多因素cox 回歸系數(shù)均小于0,提示這2 個自噬基因高表達患者的預后較低表達的患者較好。P4HB、MYC、DIRAS3 自噬 基因的多因素cox 回歸系數(shù)均大于0,提示這3 個自噬基因低表達患者的預后會優(yōu)于高表達的患者。
圖表 1
為了評估預后模型的預測能力,首先對高風險組和低風險組進行K-M 生存分析,通過風險預后模型來計算406 例患者的風險值并以中位值將患者分為高、低風險兩組。K-M 生存曲線(圖2)顯示高風險組(五年生存率約為32.2%)和低風險組(五年生存率55.5%)患者生存率之間存在顯著差異(P<0.001)。ROC 曲線(圖3)下面積為0.757,確認了模型預測膀胱癌患者預后的準確性。
圖表 3
膀胱癌是泌尿系統(tǒng)常見的惡性腫瘤之一。目前膀胱癌的診斷金標準為:膀胱鏡下膀胱黏膜活檢和尿脫落細胞學檢查,由于這些方法被各自的局限性所限制,所以尋找一種早期無創(chuàng)性的診斷方式就極為重要。
自噬在腫瘤發(fā)生的初始階段主要起抑制腫瘤發(fā)生的作用,在晚期則主要促進腫瘤的發(fā)展[4]。本文對膀胱癌中異常表達的自噬基因進行探索,篩選出與患者總體生存預后顯著相關(guān)的核心自噬基因,從基因表達層面預測膀胱癌患者預后風險。我們篩選出38 個自噬相關(guān)mRNAs 并對這些自噬mRNAs進行單因素cox 回歸分析,篩選出與膀胱癌患者預后顯著相關(guān)的自噬7 個mRNAs 之后,對這7 個基因進行多因素cox回歸分析,最終選出5 個膀胱癌的獨立預后因子:APOL1、ITGA3、P4HB、MYC、DIRAS3?;谶@5 個自噬mRNAs 來構(gòu)建預后模型。預后風險模型為:風險值=(APOL1×-0.14398468)+(ITGA3×-0.10405556)+(P4HB×0.68837742)+(MYC×0.20125767)+(DIRA S3×0.32094798)。其 中APOL1 和ITGA3 的多因素cox 回歸系數(shù)均小于0,提示這2個自噬基因高表達患者的預后優(yōu)于低表達的患者,P4H B、MYC、DIRAS3 的多因素cox 回歸系數(shù)均大于0,提示這3 個自噬基因低表達患者的預后優(yōu)于高表達的患者。利用模型對406 例膀胱癌患者進行風險值的評分并根據(jù)風險值中位值將患者劃分為高風險組和低風險組,Kaplan-Meier 生存分析證明高風險組膀胱癌患者的總體生存率顯著低于低風險組患者(P<0.001)。ROC 曲線驗證了模型判斷膀胱癌患者風險值的可靠性。通過預測膀胱癌患者的預后風險值,可以為膀胱癌患者進行個性化治療提供參考,從而降低患者病死率,改善患者預后。
本研究的不足之處在于所有數(shù)據(jù)均來TCGA 數(shù)據(jù)庫提供的膀胱癌mR NAs 測序數(shù)據(jù),無法完全代表其蛋白水平表達的情況。后續(xù)可以通過選取臨床樣本來驗證這個5 個自噬基因在預測患者預后風險方面的價值。
綜上,本研究通過對膀胱癌患者的基因表達譜及其臨床信息進行綜合分析,發(fā)現(xiàn)了5 個最有可能具有預測患者生存預后功能的獨立因素并構(gòu)建預后風險預測模型,對膀胱癌患者的診斷和治療和改善預后提供了參考依據(jù)。